Betrouwbaarheid.

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Samantha Bouwmeester Testtheorie Responsie College Samantha Bouwmeester.
Kwetsbaarheid bij ouderen frailty
De omvang van een steekproef bepalen
Een Gen voor Homoseksualiteit?
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Fasen van onderzoek Onderzoeksplan bureauwerk Dataverzameling
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Betrouwbaarheid en Validiteit
Kwaliteit van meetinstrumenten
Inhoud bijeenkomst 1 Doel- en vraagstelling Conceptueel model
De ontwikkeling en validering van een cognitieve-vaardighedentest voor volwassen anderstaligen Evelien Buyse, Karine Verschueren en Walter Magez Nederlands.
Xxxxxxxxxxxxxxx 4/4/2017 Inleiding onderzoeksleer Helleke Hendriks docent werktuigbouwkunde voormalig productonderzoeker bij Consumentenbond xxxxxxxxxxxxx.
Gegevensverwerving en verwerking
Meten van onderzoeksvariabelen
Continue kansverdelingen
Een fundamentele inleiding in de inductieve statistiek
Evaluatie Van Interactieve Software Systemen
Evaluatie van Interactieve Software Systemen
Vormen van studie (ontwerp)
Aanvullende vragen Collegesheets M&S3
HAV is meten ook weten Hoe betrouwbaar is een meting?
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Interpretatie van statistiek bij toetsen en toetsvragen
Variabelen in onderzoek
Bourdon Bourdon test verwijst algemeen naar verzameling aan tests die gemeenschappelijk hebben dat de testpersoon zo snel en zo selectief mogelijk moet.
Bijkomende Variabelen (Extraneous Variables)
Varianties bij replicatie (herhaald testen)
Onderzoeksmethoden en -Technieken
Validiteit.
Partiële r² Predictie van y gebaseerd op z alleen
Test- retest methode -- voorbeeld r = 0, Test Hertest r = 0, Test Hertest r = 1,00.
Controle van bijkomende variabelen
Psychologische Test.
Nauwkeurigheid bij Practica
Operationaliseren Definiëren Operationaliseren
Kwantitatieve & kwalitatieve data analyse
Impliciete en expliciete druggerelateerde cognities in een Ecological Momentary Assessment setting Reshmi Marhe 1 Ingmar Franken 1 Andrew Waters 2 1 Erasmus.
Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day.
De Invloed van Populaire leeftijdgenoten op de Bereidheid van Adolescenten om Alcohol te Drinken: Een Experimentele Chat Room Studie Hanneke Teunissen,
Theresialyceum. OriëntatieTheorievormingOntwerpplanExperimentVerwerkingRapportagePresentatie Onderzoekscyclus Experiment.
De domeinen & Niveau bij ABB.
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Hoorcollege 1: efficiëntie en complexiteitsontwikkeling.
TirPrs06: Wachttijdtheorie & simulatietechniek
Methoden & Technieken van Onderzoek
Begin- situatie Werk- vormen Leer- processen Leer- middelen Leerstof Evaluatie Leerdoelen.
Beleggen en financiële markten Hoofdstuk 2 Risico en rendement
De Rekenscan van Rekenblokken
Expertiseteam ToetsenbankThemadag Digitale Toetsing 1 december 2011 Alex van Essen.
Testen met een klein aantal testmonsters Rob Ross.
“Statistiek, is dat moeilijk?”
Validiteit van EVC-procedures
Onderzoek In Onderwijs – groep bèta
Grafische vergelijking meetmethoden
Het doel en de grondbeginselen van statistiek in klinische onderzoeken
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
Waarom meten we niet hetzelfde bij herhaling van de meting?
24 Deskundigen & deskundigheid
Resultaten enquête controlekaarten
De omvang van een steekproef bepalen
Toetsen van verschillen tussen twee of meer groepen
Hoe gaat de normering? Introductie voor examensecretarissen
Titel van wetenschappelijk project
Indoor Comfort Index Validatie van het meetinstrument
Resultaten enquête controlekaarten
Transcript van de presentatie:

Betrouwbaarheid

Onderdelen van meetwaarde Testscore = Beoogde variabel begrip + Systematische meetfouten + Toevallige meetfouten Onbetrouwbaarheid Invaliditeit Betrouwbaarheid = overeenstemming tussen opeenvolgende metingen Validiteit = overeenstemming tussen variabel begrip en variabele

“Herhaalbaarheid” is hypothetisch BETROUWBAARHEID “In welke mate resulteert een test bij herhaalde afname (onder gelijkblijvende condities) steeds in dezelfde testscore?” Herhaalde afname Geheugen ( automatisch zelfde score) Leereffekten vaardigheden versterken ( betere score) fouten versterken ( zwakkere score) “Herhaalbaarheid” is hypothetisch Gelijkblijvende condities Omgeving (plaats, tijdstip, temperatuur, licht, …) Procedure (testitems, instructie, verwerking, …) Relevante factoren in de persoon (psychisch en fysisch)

Fluctuatie van scores onder gelijkblijvende condities OORZAKEN “black-out” “helder moment” lawaai concentratieverlies slaperigheid opdringerige gedachte hoestbui ... BRON VAN FOUTEN Toevallige factoren verbonden aan 1 testsessie Wat is het? Effekt op de testscore? Kenmerken van de persoon Doel van de test

Herhaalde metingen = ONAFHANKELIJKE REPLICATIES Testtheorie Verhouding tussen systematische eigenschappen van persoon en testsituatie onvoorspelbare invloeden Herhaalde metingen = ONAFHANKELIJKE REPLICATIES Uitgangspunt = “hypothetische” herhaalde meting Veronderstellingen Afnames zijn onderling onafhankelijk (er is geen geheugen-effekt of leereffekt) Variatie komt uitsluitend door onvoorspelbare invloeden

Klassieke testtheorie TESTSCORE omvat 2 delen Systematisch of constant deel (TRUE score) Niet-systematisch of toevallig deel (ERROR) Fout = Toevallige scorecomponent van persoon i bij onafhankelijke replicatie j Betrouwbare Score (True) = Systematische scorecomponent (= cte bij onafhankelije replicaties) Behaalde score van persoon i bij onafhankelijke replicatie j

Betrouwbare score en Meetfout gemiddelde representatieve testprestatie Meetfout q = aantal replicaties (zeer groot)

Standaardmeetfout van persoon i Aangezien geldt Voor persoon i geldt dat de spreiding van de meetfouten gelijk is aan de spreiding van de geobserveerde scores Veronderstelling: Standaardmeetfout is identiek voor alle personen Niet realistisch: vb. Multiple choice, mensen met lage Ti raden meer (hogere S(Ei)) dan mensen met hoge Ti (lagere S(Ei)).

Fysische versus Psychologische metingen Grotere meetfout Psychologische metingen (ook reactietijden!) S(Ei) T1 T2 Kleinere meetfout Fysische metingen T1 T2

Replicatie vervangen door 1 meting in een populatie Eigenschappen Hypothese 1 bewijs (zie boek p. 103) Hypothese 2 Y is willekeurige variabele waarvan E geen deel is immers: X=T+E zodat: r(E,X)>0 GEVOLG: r(E,T)=0

Betrouwbaarheid bepalen Herhaalde meting zelfde test (test-retest) parallelle test (parallel-vorm) Eenmalige meting 2 helften (split-half) items onderling (interne consistentie) Verband met meetfout