De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

22-5-2012 Samantha Bouwmeester Responsie College Testtheorie.

Verwante presentaties


Presentatie over: "22-5-2012 Samantha Bouwmeester Responsie College Testtheorie."— Transcript van de presentatie:

1 Samantha Bouwmeester Responsie College Testtheorie

2 2  Lambda2 : Onderschatting van de betrouwaarheid (net als cronbach’s alfa) maar iets hoger dan alfa.  -Bij de IRF's is mij nog niet helemaal duidelijk hoe ik en of ik uberhaupt de verschillende parameters kan aflezen of bereken vanuit de grafiek. Hoe groter delta, des te moeilijker het item, des te hogere theta je nodig hebt om het item correct te maken. Hoe groter alfa, des te steiler de IRF, des te beter het item discrimineert.

3 3 -Op collegesheet 17 van college 2 vraag ik mij af hoe ik de formule van de betrouwbare score moet invullen, en dan met name ''q''. deze verwarring komt ook terug in de formules die gegeven zijn op collegesheet 18 van college 2. Wanneer gebruik je nu precies ICCrandon-absolute en wanneer ICC fixed- consistency? Absolute: als je eist dat de scores van de beoordelaars exact overeenkomen. Consistency: als je eist dat de scores van de beoordelaars alleen een constante mogen verschillen Random: je wilt het resultaat generaliseren naar de populatie beoordelaar Fixed: je wilt het resultaat alleen gebruiken voor het betreffende onderzoek. - Het laatste deel van HS 6 gaat over de generaliseerbaarheid van metingen. Hier hebben ze het ook over universumscore etc, moeten we dit ook weten? Zo ja, zou u dit misschien uit kunnen leggen?

4  In HS 2 gaat het laatste stukje over averechtse diagnostiek, ook hierbij valt bij mij het kwartje nog niet helemaal, zelfs niet ad hand van het voorbeeld wat in het boek staat.  Is het mogelijk dat je morgen het verschil uitlegt tussen Factor Analyse en de PCA?  Daarnaast blijven de verschillende soorten validiteiten voor mij onduidelijk.  Tot slot begrijp ik niet goed wat ze met het universum bedoelen. 4

5  Ik had een vraag over de Fleiss kappa. We hebben niet veel aandacht hieraan besteed en de formule in het blokboek is best lastig om te onthouden. Moeten we dit kunnen voor de bloktoets? En ik heb diezelfde vraag ook over het zelf berekenen van de item-rest correlatie.  Verder begrijp ik nog niet zo goed wanneer je de attenuatiecorrectie moet toepassen en wat die precies meet.  Waarom wordt de Spearman Brown formule ook gebruikt bij de splitsingsmethode? Ik snap hoe die wordt gebruikt bij verlenging/verkorting van tests, maar hoe zit dat bij de splitsingsmethode? Is de verlengingsfactor dan altijd 2, omdat het om twee helften gaat die even groot zijn? En is rxx geen onderdeel van rkk, omdat rxx al 'bestond' en rkk de nieuwe betrouwbaarheid is? Of is rxx de betrouwbaarheid van de eerste helft en rkk van de tweede helft? 5

6 6 * Waarom is Cronbach's alfa nou precies de ondergrens van de betrouwbaarheid? En waarom is er bij een kleine steekproef een grotere kans op overschatting van de betrouwbaarheid? Even voor de duidelijkheid: een overschatting van de betrouwbaarheid houdt in dat het hoger en beter uitvalt/lijkt, dan het in werkelijkheid is toch? * Van de redenen waarom de predictieve validiteit laag kan zijn worden genoemd dat de betekenis van het criterium verschilt, afwijking van lineariteit/homoscedasticiteit en dat een enkele predictor wordt gebruikt voor het voorspellen van een meerdimensionaal criterium.. Heeft u misschien een voorbeeld bij deze redenen, want ik kan ze wel in m'n hoofd stampen maar ik begrijp niet helemaal wat ze betekenen.

7 Evaluatie van een test: Multi-trait Multi-method matrix b mm bm b dd dd dd Imp. Verl. Agr.Oordeel Onderwijzer Imp.Verl.Agr Oordeel Onderwijzer b mm bm b d d d d d d dd dd dd c c c c c c mm m b b b Imp. Verl. Agr. Observatie Imp.Verl. Agr. Observatie Imp. Verl. Agr.Vragenlijst Imp.Ver.Agr. Vragenlijst c c c c = convergente validiteit b = betrouwbaarheid d = discriminante validiteit m = methode variantie 7

8 Nota Bene! Alfa ≤ rxx’ Alfa is een ondergrens van de betrouwbaarheid. Dit betekent dat de werkelijke betrouwbaarheid in de populatie hoger is. Maaaaaar: steekproef alfa kan weer een overschatting zijn van de betrouwbaarheid. Grote steekproef (n=veel)  s2 rxx’  s1  s3  s1  s2  s3 Dus: bij een kleine steekproef heb je grotere kans dat alfa een OVERSCHATTING is van de betrouwbaarheid! Kleinere steekproef (n=beetje minder)

9 Item rest correlatie (corrected item total correlation) De correlatie tussen een item en de restscore van een test. Reststcore is de totaalscore van alle items minus de score van het item in kwestie. Stappen: 1.Bereken de standaarddeviatie van het item. 2.Bereken de standaarddeviatie van de Restscore 3.Bereken de covariantie tussen het item en de restscore 4.Vul alle gegevens in, in de formule van de correlatie. of 9

10 Validiteit en betrouwbaarheid X TxTx ExEx Omdat E nergens mee correleert is de maximale correlatie die X kan hebben met een andere variabele (zeg Y) gelijk aan de correlatie tussen X en T. 10

11 Attenuatiecorrectie X E E Y EyEy TxTx TYTY ExEx 11

12 Regressie naar het midden − − − T T T T T T T bloktoets ≥5.5 <5.5 Zak-slaag grens + Deze studenten moeten toets herkansen. • Zelfs als de herkansers zich niet meer voorbereiden op de toets, is de kans groot dat er tenminste eentje slaagt… • Die had namelijk “pech” de eerste keer… • Moeten we nu concluderen dat de herkansers beter zijn geworden? Nee, dat niet!! 12

13 Regressie naar het midden komt vaak voor…  Mensen die uitgekozen zijn op basis van screeningslijst depressiviteit blijken gemiddelde na therapie minder depressief  Uit evaluatie van een sociaal project voor kinderen met uit laag sociaal milieu blijken kinderen het gemiddeld het beter te doen na training! Regressie naar het gemiddelde is het verschijnsel dat extreme scores op een variabele in een bepaalde steekproef bij een herhaalde meting voor dezelfde variabele minder extreme scores heeft die dichter bij het gemiddelde van de populatie liggen. 13

14 Als de methode variantie laag is, en de discriminante validiteit hoog is, wat zegt dit dan? Dit betekent dat de methodes weinig overlap hebben en dat de (verschillende) constructen goed van elkaar te onderscheiden zijn. Dit is wat je wilt. Als methode variantie hoog is, dan hoeven de constructen toch niet per se te overlappen? Nee, dat hoeft idd. niet. Een hoge methode variantie kan betekenen: A. dat je methodes overlappen; B. dat je constructen overlappen; C. Beide overlappen. Je kunt aan de discriminante validiteit beoordelen in hoeverre A. B. of c. aan de orde zijn. 14

15 •Passen het Raschmodel, het 2-paramater logistisch model, en het 3- parameter logistisch model op deze items? •Past het mokken model op bovenstaande 4 items? •Item 2 wordt uit de test verwijderd. Voor Sanne (θ = S) geldt dat de kans dat zij item 1 goed beantwoordt kleiner is dan de kans dat zij item 3 goed beantwoordt: P[(X 1 = 1)|θ = S] < P[(X 3 = 1)|θ = S]. Geldt dit ook voor Matthew, die een hele hoge θ heeft? Waarom wel, niet? M 15

16 • Gegeven is een set items waarop het DMM past. Stel Kelly heeft een lagere trekwaarde dan Milou (θ K < θ M ). •Voor Kelly geldt P[(X5 = 1)|θ k ] < P[(X4 = 1)|θ k ]. Vul in: de kans dat Milou item 5 goed beantwoordt is [kleiner dan ( )] de kans dat Kelly het item goed beantwoordt. De kans dat Milou item 5 goed beantwoordt is (kleiner dan ( ) dan de kans dat Milou item 4 goed beantwoordt. Item 5 Item 4 KM 16

17 1 A..50 B..69 C..83 D item 1Totaalscore Een test bestaat uit 20 items. De totaal score is de som van correcte antwoorden op de 20 items. In onderstaande tabel zie je de scores op item 1 en op de totaalscore. Bereken de item rest correlatie tussen item 1 en de restscore.

18 2 18 Beschouw onderstaande stellingen over transformaties Stelling 1: Wanneer men ruwe scores omzet in stanines via Z- scores dan voert men een niet-lineaire transformatie uit. Stelling 2: Wanneer men ruwe scores omzet in stanines via Z- scores dan vormt deze stanine verdeling een normale verdeling. A.Stelling 1 is juist, Stelling 2 is onjuist B.Stelling 1 is onjuist, Stelling 2 is juist C.Beide stellingen zijn juist D.Beide stellingen zijn onjuist

19 3 19 De meetwaarden (θ) van twee personen kunnen vergeleken worden terwijl de meetwaarde (θ) van de ene persoon bepaald werd met Test A en de meetwaarde (θ) van de andere persoon bepaald werd met Test B. Hoe noemen we dit fenomeen? A. lokale onafhankelijkheid. B. marginale afhankelijkheid. C. monotonie. D. populatie onafhankelijkheid.

20 4 20 Een test bestaat uit vijf items. De vijf items passen in het Rasch model. De delta’s (δ) van de items zijn 1.5, 2, 2.5, 3 en 3.5. Hoe ziet de testinformatiefunctie er uit wanneer we uitgaan van meetwaarden die lopen van θ=-4 tot θ =4? A.De testinformatiefunctie is een rechte lijn. Voor alle waarden van θ=-4 tot θ =4 geeft de test evenveel informatie. B.De testinformatie heeft de top bij θ = C.De testinformatie is symmetrisch en heeft de top bij θ = 0. D.De testinformatie heeft de top bij θ = 2.5.

21 5 21 Door het normaliseren van testscores: A.ontstaat een ongeveer normaal verdeelde scoreverdeling B.kunnen normgroepen worden bepaald C.kunnen testscores worden vergeleken met een absolute norm D.ontstaan scores die een lineaire transformatie zijn van de ruwe scores.

22 6 22 De base rate (toevalskans) van een erfelijke aandoening is 4%. De selectieratio op basis van een test is 8%, en de succesratio is 25%. Wat is dan de validiteit van de test met het criterium? Tip: neem n=100. A.-.12 B..12 C..32 D..84

23 1 A..50 B..69 C..83 D item 1TotaalscoreRestscore Een test bestaat uit 20 items. De totaal score is de som van correcte antwoorden op de 20 items. In onderstaande tabel zie je de scores op item 1 en op de totaalscore. Bereken de item rest correlatie tussen item 1 en de restscore.

24 2 24 Beschouw onderstaande stellingen over transformaties Stelling 1: Wanneer men ruwe scores omzet in stanines via Z- scores dan voert men een niet-lineaire transformatie uit. Stelling 2: Wanneer men ruwe scores omzet in stanines via Z- scores dan vormt deze stanine verdeling een normale verdeling. A.Stelling 1 is juist, Stelling 2 is onjuist B.Stelling 1 is onjuist, Stelling 2 is juist C.Beide stellingen zijn juist D.Beide stellingen zijn onjuist

25 3 25 De meetwaarden (θ) van twee personen kunnen vergeleken worden terwijl de meetwaarde (θ) van de ene persoon bepaald werd met Test A en de meetwaarde (θ) van de andere persoon bepaald werd met Test B. Hoe noemen we dit fenomeen? A. lokale onafhankelijkheid. B. marginale afhankelijkheid. C. monotonie. D. populatie onafhankelijkheid.

26 4 26 Een test bestaat uit vijf items. De vijf items passen in het Rasch model. De delta’s (δ) van de items zijn 1.5, 2, 2.5, 3 en 3.5. Hoe ziet de testinformatiefunctie er uit wanneer we uitgaan van meetwaarden die lopen van θ=-4 tot θ =4? A.De testinformatiefunctie is een rechte lijn. Voor alle waarden van θ=-4 tot θ =4 geeft de test evenveel informatie. B.De testinformatie heeft de top bij θ = C.De testinformatie is symmetrisch en heeft de top bij θ = 0. D.De testinformatie heeft de top bij θ = 2.5.

27 5 27 Door het normaliseren van testscores: A.ontstaat een ongeveer normaal verdeelde scoreverdeling B.kunnen normgroepen worden bepaald C.kunnen testscores worden vergeleken met een absolute norm D.ontstaan scores die een lineaire transformatie zijn van de ruwe scores.

28 6 28 De base rate (toevalskans) van een erfelijke aandoening is 4%. De selectieratio op basis van een test is 8%, en de succesratio is 25%. Wat is dan de validiteit van de test met het criterium? Tip: neem n=100. A.-.12 B..12 C..32 D tot


Download ppt "22-5-2012 Samantha Bouwmeester Responsie College Testtheorie."

Verwante presentaties


Ads door Google