Item analyse Item-Moeilijkheidsindex Item-Betrouwbaarheidsindex

Slides:



Advertisements
Verwante presentaties
Schoolsecretariaten (n=555)
Advertisements

Screening van toetsen: Psychometrische analyse
Samantha Bouwmeester Testtheorie Responsie College Samantha Bouwmeester.
Math Candel Universiteit Maastricht. •Achtergrond: –Diagnose probleem –Meetinstrumenten –Conceptueel model •Presentaties van eigen analyses •Voorbeeld.
De omvang van een steekproef bepalen
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
College 3 Meten.
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
1 9 formulieren bereikten ons nog na de opmaak van deze PowerPoint, respons bedroeg dus 159 Jan Geurts,
Record Linkage: Simulatie Resultaten Adelaide Ariel Biolink NL 28 maart 2014.
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Les 2 De antwoorden na een opening van 1 in een kleur
1 Neemt de kennis van onze studenten toe? Een analyse van de kennisgroei op basis van VGT scores Marieke van Onna & Samantha Bouwmeester.
Statistiek HC1MBR Statistiek.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Aanpassing Selectie beleid. Waarom aanpassingen in het huidige selectie beleid?
Betrouwbaarheid en Validiteit
Tevredenheidsonderzoek 2007
Kwaliteit van meetinstrumenten
Connector C Certificatie
Het construeren van valide MC-vragen
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Over examenpunten, cesuur, normconstantie, etc. Gert Storms
De ontwikkeling en validering van een cognitieve-vaardighedentest voor volwassen anderstaligen Evelien Buyse, Karine Verschueren en Walter Magez Nederlands.
Meten van onderzoeksvariabelen
Hoofdstuk 9 Verbanden, correlatie en regressie
Latente semantische analyse (LSA) en erkenning van EVC’s: wat kunnen we ermee? Jan van Bruggen Ellen Rusman Bas Giesbers Oktober 2005.
De theorie van Brønsted
Tevredenheidsonderzoek 2009 Sinte-Maartenschool, Meise.
Projectie en stelling van thales
Hoofdstuk 11 Homothetie.
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
indicator op basis van niveau-indicaties
Hoofdstuk 4 Vlakke figuren.
Oefeningen Hoofdstuk V.
H4 Differentiëren.
Een methode om nieuwe ideeën te genereren
Klik hier als u voor de eerste keer op de website komt.
Interpretatie van statistiek bij toetsen en toetsvragen
Survey onderzoek Veldstudie waarin via een interviewmethode een stand van zaken wordt opgemaakt voor een representatieve steekproef enquêtes opiniepeilingen.
Hoofdstuk 5 Vijfkaart hoog, eerste verkenning 1e9 NdF-h1 NdF-h5 1 1.
Varianties bij replicatie (herhaald testen)
Betrouwbaarheid.
Validiteit.
Test- retest methode -- voorbeeld r = 0, Test Hertest r = 0, Test Hertest r = 1,00.
Psychologische Test.
Een moderne fabel….
Hoofdstuk X Het correlatievraagstuk & SPSS toepassing
Samenvatting teambuilding
Kwantitatieve & kwalitatieve data analyse
Baarde en de goede Hoofdstuk 11: Data-analyse
“Ja, maar dat is gewoon mijn mening!”
Union Membership, the Psychological Contract (PC), and Organisational Commitment (OC) in Three Contrasting IR Contexts Claes, R., & Schalk, R. (manuscript.
Hoofdstuk 5 Vijfkaart hoog, eerste verkenning 1e9 NdF-h1 NdF-h5 1 1.
Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day.
Projectie en stelling van thales
Begin- situatie Werk- vormen Leer- processen Leer- middelen Leerstof Evaluatie Leerdoelen.
1 Relatie Intelligentie Quotiënt en de Motorische Vaardigheid Marco Borhem Fleur van Dam Sanne Hein Opdrachtgever Docent Begeleider Opdrachtgever Docent.
Expertiseteam Toetsenbank 1. Doel van vragen stellen 2. Welke soorten vragen zijn er 3. Veel voorkomende fouten 4. Zelf een vraag maken 5. Zelf een vraag.
AOS docentonderzoek bijeenkomst 9 Analyseren. Analyseren van data verzamelde data analyse resultaten conclusies Doel: ordenen van data om antwoord op.
Toerisme Vlaanderen Vlaanderen Vakantieland 2011 Redemptieonderzoek 15 februari 2012 M.A.S. – Market Analysis & Synthesis Brusselsesteenweg 46 a – B 3000.
Expertiseteam ToetsenbankThemadag Digitale Toetsing 1 december 2011 Alex van Essen.
Print & Scan Wat kan ik leren uit print & scan analyses over mijn meerkeuzeexamen? Lisa De Jonghe O 2 : dienst Onderwijs Ondersteuning.
Psychiatrische intensieve behandeling voor autisme of Het PIBA-model Embregts P. en Nieuwenhuijzen M. (2008) Boek: Begeleiding van kinderen en jongeren.
KRITISCH DENKEN 26 Besluitvorming © Kritisch Denken.
Het voorspellen van agressie tijdens de behandeling van forensisch psychiatrische patiënten a.d.h.v. DE hcr-20.
De omvang van een steekproef bepalen
Hoe gaat de normering? Introductie voor examensecretarissen
Indoor Comfort Index Validatie van het meetinstrument
1ste bachelor psychologie
Transcript van de presentatie:

Item analyse Item-Moeilijkheidsindex Item-Betrouwbaarheidsindex Item-Validiteitsindex Karakteristieke curve Discriminatieindex

Item-Moeilijkheidsindex pi pi = proportie deelnemers uit referentiegroep die item correct hebben Of "waar" "ja" … Representatieve steekpoef van doelpopulatie Vuistregel: voor een optimaal item geldt: pi » 0.5, en zeker 0.3 £ pi £ 0.7 Referentiegroep deelnemers aan ingangsexamen eliteuniversiteit impliceert moeilijker items die in "gewone" populatie een te hoge pi hebben

Item-Moeilijkheidsindex bij meerkeuze-items Meerkeuze-item met 2 alternatieven geeft een kans op en "juiste gok" van 0.5 Þ optimale moeilijkheidsindex (pi optimaal) is 0.75 (midden tussen .5 en 1.0) Algemeen: Voorbeeld: 4 alternatieven: pi optimaal = .63 Kans op "juiste gok"

Item-Betrouwbaarheidsindex Correlatie tussen item en test Samenhang van item met (de rest van) de test » riT = gewone correlatie tussen item en de schaal) Indien binair item: punt-biseriële correlatiecoëfficiënt: Standaarddeviatie van itemscores Spreiding van itemscores is sterk verbonden met moeilijkheidsgraad en bepaalt het nut van een item: Beste items hebben zo hoog mogelijke riT en si: Item-Betrouwbaarheidsindex

Validiteitsindex Correlatie tussen item en criterium Samenhang van item met criterium » riC = correlatie tussen item en criterium Beste items hebben hoge riT en si: Item-Betrouwbaarheidsindex:

Items met beste criterium-validiteit selecteren 0.5 0.5 Beste items:

Item Karakteristieke curve (ICC) 1 P(correct) Ideaal om sterke kandidaten te selecteren Niveau van vaardigheid Goed item : ICC stijgt, vorm » ogief ICC is specifiek voor onderzochte groep Onderliggende theorie = IRT (Item-Response theorie en Latente trekken theorie)

Item-Discriminatieindex Visuele inspectie van ICC is niet nauwkeurig, behoefte aan statistische grootheden, oa. riT Item-Discriminatieindex Vergelijkt itemscores van (bvb. 27%) deelnemers met hoogste totale scores (U of UPPER) met die van (27%) deelnemers met laagste totale scores (L of LOWER) U = Aantal hoogscorers L = Aantal laagscorers (L=U) Uc = Hoogscorers met item correct Lc = Laagscorers met item correct

Item-Discriminatieindex - voorbeelden U = L = 100 Item Uc Lc d INTERPRETATIE 1 49 23 .26 Zeer goed item, moeilijk 2 79 19 .60 Excellent item, zelden bereikt 3 52 0.00 Slecht item: herzien 4 100 1.00 Ideaal, onbereikbaar 5 20 80 -.60 Zeer slecht item, verwijderen 6 -1.00 Theoretisch slechtst mogelijk

Item-analyse van meerkeuze-items b c* (1) d e Hoogscorers 5 6 80 4 Laagscorers 15 14 40 16 Gewenst patroon, afleiders ongeveer even populair, correct duidelijk meer hoogscorers Item 2 a b * c d e Hoogscorers 5 75 10 Laagscorers 21 34 20 25 Alternatief d werd ooit gekozen en moet dus vervangen worden door een aantrekkelijker Item 3 a b c d * e Hoogscorers 43 6 5 37 9 Laagscorers 20 19 22 10 25 Alternatief a is slecht omdat het al te vaak werd gekozen (1) het correcte alternatief wordt telkens aangeduid met *