Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day.

Slides:



Advertisements
Verwante presentaties
1 Europese Vereniging for het Toetsen en Beoordelen van Taalvaardigheid
Advertisements

De relatie tussen visie doelstellingen toetsing leertrajecten Een “innige band” !
Screening van toetsen: Psychometrische analyse
Samantha Bouwmeester Testtheorie Responsie College Samantha Bouwmeester.
Aan de hand van de volgende dia’s laten wij u zien hoe een computerprogramma, geheel automatisch, uit een opgavenbank een toets samenstelt die zo goed.
Ed van den Berg VU en HvA 21 november 2013
College 3 Meten.
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Betrouwbaarheid en Validiteit
Kwaliteit van meetinstrumenten
Studiedag ‘Diversifiëren van evaluatiemethoden’ 5 juni 2008
De ontwikkeling en validering van een cognitieve-vaardighedentest voor volwassen anderstaligen Evelien Buyse, Karine Verschueren en Walter Magez Nederlands.
De Ontwikkeling van de persoonsgerichte ondersteuningsuitkomsten schaal (POS) Elise Bonte 1BaOA1.
Statistiek Verzamelen Voorstellen Beschrijven Interpreteren
Meervoudige lineaire regressie
5 Werving en selectie.
Voorspellende analyse
Kwaliteit door een zelf regulerend proces, ondersteunend en motiverend
Ervaringen en ontwikkelingen Utrecht 15 februari 2011.
Nibi-conferentie 2012 Het Centraal Examen Biologie
Validiteit, betrouwbaarheid en casemixcorrectie
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
Aan de slag met competenties beoordelen
4VMBO Het examen. PTA Klas 3 SE110%10% SE210%10% Klas 4SE320%25% SE420%25% SE520%30% SE620% totaal100%100% (Gemidd SE-cijfer + CE-cijfer) /2 = eindcijfer.
Competentiegericht ontwerpen & ontwikkelen
Hoofdstuk 4 – Gegevens analyseren
Interpretatie van statistiek bij toetsen en toetsvragen
ANW - inductie & deductie
Varianties bij replicatie (herhaald testen)
Item analyse Item-Moeilijkheidsindex Item-Betrouwbaarheidsindex
Betrouwbaarheid.
Validiteit.
Test- retest methode -- voorbeeld r = 0, Test Hertest r = 0, Test Hertest r = 1,00.
Psychologische Test.
Skillstoetsing Van vele korte praktijktoetsen naar een aantal langduriger assesments.
Operationaliseren Definiëren Operationaliseren
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Gerald Riedstra STOEIEN TUSSEN VADER EN KIND Onderzoek naar de psychometrische kwaliteiten van de Nederlandse versie van Rough and Tumble Play-Quality.
BEOORDELING VOLGENS HET ERK
Door: Gerard Rozing (CvTE)
Week 2 : Ontwikkelingspsychologie, Liesbeth van Beemen:
Methoden & Technieken van Onderzoek
Rotterdam, 00 januari 2007 Onderzoek I Bijeenkomst 3 kwartaal 2.
WELKOM WERKBEGELEIDERS EN PRAKTIJKBEGELEIDERS WERKVELDOVERLEG MZ 28 OKTOBER 2014.
Kijken naar Kinderen Week 5
Opvoeding en ontwikkeling van het jonge kind
Lectoraat Eigentijds Beoordelen in het Onderwijs (EBO) Jos Castelijns, Marja Wijnen, Mark Wouters & Willem Heldens Interactum 8 april 2011.
Begin- situatie Werk- vormen Leer- processen Leer- middelen Leerstof Evaluatie Leerdoelen.
Evaluatieonderzoek VVTO Engels Kees de Bot Sieneke Goorhuis BCN/RUG.
Meten is weten? Do’s en don’ts van mondeling examineren Lisa De Jonghe Dienst Onderwijs Geneeskunde.
Expertiseteam Toetsenbank Digitaal toetsen Alex van Essen Prinsentuin College 15 november 2011.
Toetsing: het hart van onderwijs! 16 april 2013 Karen Heij.
De Rekenscan van Rekenblokken
Expertiseteam ToetsenbankThemadag Digitale Toetsing 1 december 2011 Alex van Essen.
Praktisch werk effectiever maken Tekst: Henny Kramers-Pals.
Toetsing en toetsontwikkeling
Spel Politiek Nederland
Oefening met atlas en kaarten
Informatie voor de scholingsgroepen Hogeschool Inholland
Het online opzetten, afnemen, beoordelen en verwerken van toetsen
Toelichting bij ''Backward designing'' uit de kennisbank
COLLEGE12005.
Evalueren om te leren vs. evalueren van het leren
werkveldoverleg mz 28 oktober 2014
iL 19: De evolutie van toetsing bij biologie
Voorspellende analyse
Team charter Instrument.
Groeien als team - het teamcharter als hulpmiddel
Transcript van de presentatie:

Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day

 Kennismaken  Theoretische basis begrippen toetsontwikkeling  Pauze  Praktische oefeningen Mr.dr.E. Marshall & M. Day

 Korte geschiedenis (Amerika/Nederland): essay vragen- gesloten vragen  Objectiviteit/eerlijkheid/rechtvaardigheid  Scoorbaarheid: alternatieven  Gebieden van toetsen (cognitief, psychomotorisch) Mr.dr.E. Marshall & M. Day

Een vaardigheid waarbij verschillende regels en procedures zijn ontwikkeld Toetsmatrijs als afdekking van de stof (hoe maak je een matrijs) Grondvraag wat willen we precies weten? Proefmetingen Onderzoek na meting Beslissingen Onderzoek na beslissingen Mr.dr.E. Marshall & M. Day

 Betrouwbaarheid  Validiteit  Gelijkwaardigheid  Aanvaardbaarheid  Transparantie Mr.dr.E. Marshall & M. Day

Sprake hiervan wanneer eenzelfde resultaat bij herhaalde afname onder dezelfde omstandigheden Factoren bij betrouwbaarheid  De kwaliteit van de toets zelf  De omstandigheden waaronder de toets wordt afgenomen  De wijze waarop de resultaten worden beoordeeld Mr.dr.E. Marshall & M. Day

Criterium-georiënteerde of predictieve validiteit: Gevolgtrekkingen c.q. voorspellingen mbt situaties buiten de test Inhoudsvaliditeit: Gevolgtrekkingen van uit de schatting van de verrichtingen van een individu in het universum van situaties dat de testvragen geacht wordt te representeren Begripsvaliditeit: Gevolgtrekkingen mbt een trek die het toetsgedrag zou moeten verklaren Mr.dr.E. Marshall & M. Day

 Gelijkwaardige opdrachten bij het toetsen van meerdere groepen op verschillende tijdstippen  Gelijkwaardige omstandigheden : dezelfde hulpmiddelen en boeken  Gelijkwaardige beoordeling, vooral bij meedere beoordelaars Mr.dr.E. Marshall & M. Day

 Vraagzuiverheid, afwezigheid van bias  Eerlijkheid en rechtvaardigheid tav bepaalde groeperingen of belanghebbenden Mr.dr.E. Marshall & M. Day

Vooraf duidelijkheid over : - hoe er getoetst wordt - beoordeling - slagingsnormen Pretesten draagt bij aan transparantie Mr.dr.E. Marshall & M. Day

Psychometrie: Wetenschap die zich bezighoudt met de technieken van het meten van psychologische fenomenen zoals kennis, vaardighedn, attituden, eigenschappen en persoonskenmerken. Drie Betrouwbaarheidstheorieën : - Klassieke testtheorie - Generalisserbaarheidstheorie - Item response theorie Mr.dr.E. Marshall & M. Day

 Totale score als vertrekpunt  Gaat uit van parallelle metingen, split-half methode  Belangrijke parameters: correlaties en standaardafwijkingen  Eén foutenbron toegestaan nl. de meetfout waarmee de score samenhangt Mr.dr.E. Marshall & M. Day

 p-waarde  a-waarden  rit – en rat – waarden  rir – en rar – waarden  standaardafwijking Mr.dr.E. Marshall & M. Day

 Index-waarde voor het goede antwoord;  Het percentage leerlingen dat het item goed gemaakt heeft;  Berekening: aantal personen dat het item goed heeft delen door aantal personen dat het item heeft gemaakt;  Ligt tussen 0 en 1;  Lage p-waarde, moeilijk item. Hoge p-waarde, gemakkelijk item Mr.dr.E. Marshall & M. Day

 Optimale p-waarde bij items met 2-5 alternatieven  Aantal optimale p-waarde optimale p- waarde  alternatieven (p= /m) (Lord)     Mr.dr.E. Marshall & M. Day

 Index-waarden voor de afleiders  Bedoeld om effect van de afleider te bepalen  Hoge a-waarde : afleider aantrekkelijk  Wordt bepaald door het aantal lln. dat de afleider gekozen heeft te delen door het aantal lln dat het item gemaakt heeft Mr.dr.E. Marshall & M. Day

 Item-totaal correlatie tussen itemscore en toetsscore, hoe goed past het item in de toets Het verband van de itemscore met de totale toetsscore, waarin de itemscore ook is opgenomen.  Rit is een discriminatie-index: discrimineert tussen de goede en minder goede leerlingen  Hoge rit: veel lln met een hoge score hebben het item goed en veel lln met een lage toetsscore hebben het item fout beantwoord  Hoge rit draagt bij aan de betrouwbaarheid van de toets Mr.dr.E. Marshall & M. Day

r it – waardeitembeoordeling 0.40 en hogerzeer goed 0.30 – 0.39goed 0.20 – 0.29twijfelachtig 0.19 en lagerslecht Mr.dr.E. Marshall & M. Day

 Betrouwbaarheid volgens KR 20  Standaardmeetfout  Standaarddeviatie  Cesuur Mr.dr.E. Marshall & M. Day

Kent 2 varianties: de waargenomen score en de ware score:  De waargenomen score is de score die behaald is door de leerling. De waargenomen score wordt opgesplitst in een component ware score en een component meetfout  De ware score is de verwachte score die de leerling zou verkrijgen indien deze zonder meetfouten zou worden bepaald  Wordt geschat mbv betrouwbaarheidsmaat, de KR 20 Mr.dr.E. Marshall & M. Day

 1. Zelf items construeren  2. Beoordelen van items Mr.dr.E. Marshall & M. Day