Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day
Kennismaken Theoretische basis begrippen toetsontwikkeling Pauze Praktische oefeningen Mr.dr.E. Marshall & M. Day
Korte geschiedenis (Amerika/Nederland): essay vragen- gesloten vragen Objectiviteit/eerlijkheid/rechtvaardigheid Scoorbaarheid: alternatieven Gebieden van toetsen (cognitief, psychomotorisch) Mr.dr.E. Marshall & M. Day
Een vaardigheid waarbij verschillende regels en procedures zijn ontwikkeld Toetsmatrijs als afdekking van de stof (hoe maak je een matrijs) Grondvraag wat willen we precies weten? Proefmetingen Onderzoek na meting Beslissingen Onderzoek na beslissingen Mr.dr.E. Marshall & M. Day
Betrouwbaarheid Validiteit Gelijkwaardigheid Aanvaardbaarheid Transparantie Mr.dr.E. Marshall & M. Day
Sprake hiervan wanneer eenzelfde resultaat bij herhaalde afname onder dezelfde omstandigheden Factoren bij betrouwbaarheid De kwaliteit van de toets zelf De omstandigheden waaronder de toets wordt afgenomen De wijze waarop de resultaten worden beoordeeld Mr.dr.E. Marshall & M. Day
Criterium-georiënteerde of predictieve validiteit: Gevolgtrekkingen c.q. voorspellingen mbt situaties buiten de test Inhoudsvaliditeit: Gevolgtrekkingen van uit de schatting van de verrichtingen van een individu in het universum van situaties dat de testvragen geacht wordt te representeren Begripsvaliditeit: Gevolgtrekkingen mbt een trek die het toetsgedrag zou moeten verklaren Mr.dr.E. Marshall & M. Day
Gelijkwaardige opdrachten bij het toetsen van meerdere groepen op verschillende tijdstippen Gelijkwaardige omstandigheden : dezelfde hulpmiddelen en boeken Gelijkwaardige beoordeling, vooral bij meedere beoordelaars Mr.dr.E. Marshall & M. Day
Vraagzuiverheid, afwezigheid van bias Eerlijkheid en rechtvaardigheid tav bepaalde groeperingen of belanghebbenden Mr.dr.E. Marshall & M. Day
Vooraf duidelijkheid over : - hoe er getoetst wordt - beoordeling - slagingsnormen Pretesten draagt bij aan transparantie Mr.dr.E. Marshall & M. Day
Psychometrie: Wetenschap die zich bezighoudt met de technieken van het meten van psychologische fenomenen zoals kennis, vaardighedn, attituden, eigenschappen en persoonskenmerken. Drie Betrouwbaarheidstheorieën : - Klassieke testtheorie - Generalisserbaarheidstheorie - Item response theorie Mr.dr.E. Marshall & M. Day
Totale score als vertrekpunt Gaat uit van parallelle metingen, split-half methode Belangrijke parameters: correlaties en standaardafwijkingen Eén foutenbron toegestaan nl. de meetfout waarmee de score samenhangt Mr.dr.E. Marshall & M. Day
p-waarde a-waarden rit – en rat – waarden rir – en rar – waarden standaardafwijking Mr.dr.E. Marshall & M. Day
Index-waarde voor het goede antwoord; Het percentage leerlingen dat het item goed gemaakt heeft; Berekening: aantal personen dat het item goed heeft delen door aantal personen dat het item heeft gemaakt; Ligt tussen 0 en 1; Lage p-waarde, moeilijk item. Hoge p-waarde, gemakkelijk item Mr.dr.E. Marshall & M. Day
Optimale p-waarde bij items met 2-5 alternatieven Aantal optimale p-waarde optimale p- waarde alternatieven (p= /m) (Lord) Mr.dr.E. Marshall & M. Day
Index-waarden voor de afleiders Bedoeld om effect van de afleider te bepalen Hoge a-waarde : afleider aantrekkelijk Wordt bepaald door het aantal lln. dat de afleider gekozen heeft te delen door het aantal lln dat het item gemaakt heeft Mr.dr.E. Marshall & M. Day
Item-totaal correlatie tussen itemscore en toetsscore, hoe goed past het item in de toets Het verband van de itemscore met de totale toetsscore, waarin de itemscore ook is opgenomen. Rit is een discriminatie-index: discrimineert tussen de goede en minder goede leerlingen Hoge rit: veel lln met een hoge score hebben het item goed en veel lln met een lage toetsscore hebben het item fout beantwoord Hoge rit draagt bij aan de betrouwbaarheid van de toets Mr.dr.E. Marshall & M. Day
r it – waardeitembeoordeling 0.40 en hogerzeer goed 0.30 – 0.39goed 0.20 – 0.29twijfelachtig 0.19 en lagerslecht Mr.dr.E. Marshall & M. Day
Betrouwbaarheid volgens KR 20 Standaardmeetfout Standaarddeviatie Cesuur Mr.dr.E. Marshall & M. Day
Kent 2 varianties: de waargenomen score en de ware score: De waargenomen score is de score die behaald is door de leerling. De waargenomen score wordt opgesplitst in een component ware score en een component meetfout De ware score is de verwachte score die de leerling zou verkrijgen indien deze zonder meetfouten zou worden bepaald Wordt geschat mbv betrouwbaarheidsmaat, de KR 20 Mr.dr.E. Marshall & M. Day
1. Zelf items construeren 2. Beoordelen van items Mr.dr.E. Marshall & M. Day