Enkele beschouwingen vanuit ‘Educational measurement’

Slides:



Advertisements
Verwante presentaties
Break-out: practical questions
Advertisements

Uitwisseling Instaptoetsen: Enkele methodologische beschouwingen
CO2, 1 april CO2, April 1 CO2 uitstoot door; CO2 emissions;
Deltion College Engels C1 Spreken [Edu/003] thema “Oprah at Deltion” can-do : kan duidelijke, gedetailleerde beschrijving geven van complexe onderwerpen,
Een alternatief voorstel Naar aanleiding van bestudering van de IAASB voorstellen denkt de NBA na over een alternatief. Dit alternatief zal 26 september.
Deltion College Engels C1 Gesprekken voeren [Edu/002]/ subvaardigheid lezen thema: Order, order…. can-do : kan een bijeenkomst voorzitten © Anne Beeker.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
Niels Chavannes MD PhD Associate Professor
Internet vriendschap Internet friendship
1 Co-Design at Chess-iT Guus Bosman. 2 Afstuderen bij Chess Net.Footworks tot augustus 2003 Afstuderen augustus 2003 tot maart 2004 Chess full-time vanaf.
Teams on the frontline Geert Stroobant De Heide - Balans
HRQoL assessment in Children with Asthma
Ronde (Sport & Spel) Quiz Night !
Copyright © 2008 Tele Atlas. All rights reserved. Zet uw Business Data op de kaart: Locaties in eTOM ®
Virgielcollege Mede mogelijk gemaakt door uw Eerstejaarsch Commissie.
Voorziening levensonderhoud Religieuze Instituten Paul Op Heij ‘s-Hertogenbosch, 25 september 2013 The future depends on what you do today.
Accessible Instructional Materials. § Discussion: Timely access to appropriate and accessible instructional materials is an inherent component.
Nieuwe wegen in ontwerpen met CAD
High quality internet for higher Education and Research 1 TF-LCPM: Exchanging new ideas New ideas within SURFnet Sharing with other NRENs
zaterdag 19 juli 2014 Saturday, 19 July 2014 I see what you don’t see I come from another galaxy My earthal life was not the intention I was meant.
Beyond Big Grid – Amsterdam 26 september 2012 Enquette 77 ingevulde enquettes, waarvan 60 met gebruikservaring = Mainly Computer Science.
Celebrating love Sexual education at school in The Netherlands.
EIE/06/075/SI From January 2007 to March 2009 Nationale Workshop Energiebesparing Introductie van E-BAG.
Nooit meer onnodig groen? Luuk Misdom, IT&T
SCENARIO BASED PRODUCT DESIGN
Woensdag 23 juli 2014 volgende vorige algemeen ziekenhuis Sint-Jozef Malle Dementia pathway: a condition specific approach Patrick De Wit, MD Thierry Laporta,
A South-African Building Renaissance Onderzoeksbespreking november 2004.
ontwik idee - keling dag 3 goals today Develop “criteria” to help you evaluate & select your ideas Some tools from Tassouls book to help you do this.
Probleem P 1 is reduceerbaar tot P 2 als  afbeelding  :P 1  P 2 zo dat: I yes-instantie van P 1   (I) yes-instantie van P 2 als ook:  polytime-algoritme,
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
1 Welkom. Gezondheid bij SABIC Innovative Plastics We dachten dat we het goed deden, maar… Henri Hendrickx Manager SABIC-IP Arbodienst / Medical Lead.
Geometrie en topologie Rob Kromwijk, 26 juli 2012.
De digitale coach Het verbeteren van een plan van aanpak Steven Nijhuis, coördinator projecten FNT Deze presentatie staat op:
De digitale coach Het verbeteren van een plan van aanpak Steven Nijhuis, coördinator projecten FNT Deze presentatie staat op:
A South-African Building Renaissance Onderzoeksbespreking november 2004.
2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.
1 Van Harvard naar MIPS. 2 3 Van Harvard naar MIPS Microprocessor without Interlocked Pipeline Stages Verschillen met de Harvard machine: - 32 Registers.
PLAYBOY Kalender 2006 Dit is wat mannen boeit!.
Tussentoets Digitale Techniek. 1 november 2001, 11:00 tot 13:00 uur. Opmerkingen: 1. Als u een gemiddeld huiswerkcijfer hebt gehaald van zes (6) of hoger,
From computer power and human reason. Joseph Weizenbaum.
F REE R IDING IN P ROJECTS Recognize it today, Deal with it tomorrow, Prevent it in the next project Toine Andernach Focus Centre of Expertise on Education,
Motivation One secret for success in organizations is motivated and enthusiastic employees The challenge is to keep employee motivation consistent with.
Deltion College Engels B1 Gesprek voeren [Edu/001]
Deltion College Engels C1 Schrijven [Edu/002] thema: CV and letter of application can-do : kan complexe zakelijke teksten schrijven © Anne Beeker Alle.
Deltion College Engels C1 Luisteren [Edu/001] thema: It’s on tv can-do : kan zonder al te veel inspanning tv-programma’s begrijpen.
Deltion College Engels B1 En Spreken/Presentaties [Edu/007] Thema: Soap(s) can-do : kan met enig detail verslag doen van ervaringen, in dit geval, rapporteren.
Deltion College Engels C1 Spreken/Presentaties [Edu/006] thema ‘I hope to convince you of… ‘ can-do : kan een standpunt uiteenzetten voor een publiek van.
Deltion College Engels B1 Schrijven [Edu/004]/ subvaardigheid lezen thema: reporting a theft can-do : kan formulieren waarin meer informatie gevraagd wordt,
Future (toekomst) Je krijgt 2 verschillende vormen van Future.
ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij
All right 1thv unit 7 gr 2.1 en 2.2.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.
Rational Unified Process RUP Jef Bergsma. Iterations –Inception –Elaboration –Construction –Transition De kernbegrippen (Phases)
Ted Nelson (1937- ) A file structure for the Complex, the changing, and the Interdeterminate.
Combining pattern-based and machine learning methods to detect definitions for eLearning purposes Eline Westerhout & Paola Monachesi.
Benjamin Boerebach, Esther Helmich NVMO workshop 12 juni 2014.
De financiële functie: Integrale bedrijfsanalyse©
Logistics: a driver for innovation Low costs High value Flexibility now and later Superior technology Timwood - T > No transport - I > No Inventory - M.
International Primary Curriculum
Usability metrics Gebruiksvriendelijkheid ISO Effectiveness Efficiency Satisfaction Learnability Flexibility En nu? Inleiding Hoe gaan we de gebruiksvriendelijkheid.
Training Artists for Innovation (TAFI) TAFI is een Europees project waarin we een Europees raamwerk ontwikkelen voor wat kunstenaars moeten kunnen om.
Sharing best practices By Exar - Reinbouwgroep 28 november 2014 Peter Reinders.
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
ZijActief Koningslust
1 Jeroen de Vries Topologie. 2  Historische basis  Belangrijkste concepten  Topologie in de praktijk Inhoud:
Om het maar niet te vergeten… Om het maar niet te vergeten… We will not forget We will not forget
Transcript van de presentatie:

Enkele beschouwingen vanuit ‘Educational measurement’ Workshop 'Het bepalen van de cesuur en het geven van cijfers‘ Faculteit Psychologie en Pedagogische Wetenschappen 14 maart 2012 Enkele beschouwingen vanuit ‘Educational measurement’ Rianne Janssen Kwantitatieve psychologie en individuele verschillen Onderwijseffectiviteit & -Evaluatie

Standard setting Vooraf Grading High-stakes mastery Equating Grade inflation High-stakes Item-centered methods mastery Criterion-referenced measurement State view Angoff Borderline method Cesuurbepaling Standard setting Analytical procedures Normconstantie Certification Domain score Grading Equating licensure Holistic scoring person-centered methods Continuum view of mastery

Overzicht Onderzoek naar cesuurbepaling Basiskader Enkele aanbevelingen?

Onderzoek naar cesuurbepaling Wie? Wat? Besluit?

Wie? “High-stakes pupil testing” “Licensure and certification” Bv. National Board of Medical Examiners (inter)nationale peilingen Bv. behalen eindtermen? Bv. ESLC: taalbeheersing in verschillende talen

Wat? Ontwikkeling en vergelijking van verschillende methodes van cesuurbepaling Empirisch en conceptueel Formeel en niet-formeel Experimenteel en praktijkgericht

Besluit? Voor 1980: optimisme daarna: pessimisme 1970: mandated pupil proficiency testing (deels als antwoord op ‘grade inflation’) daarna: pessimisme Glass (1978): “setting performance standards on tests and exercises by known methods is a waste of time or worse” (reden: leidt tot arbitraire beslissingen) Shepard (1979): “avoid setting standards whenever possible’ (reden: cognitief te complex voor beoordelaars) Jaeger (1989): “Different procedures lead to different results”

Besluit? Momenteel: realisme? Cizek (2001): ‘You can’t live with it. You can’t live without it.’ Kane (1994): “There is no gold standard. There is not even a silver standard.” Onderscheid: ‘performance standard’ (conceptueel criterium) en ‘cut score’ (operationeel criterium) “coherence of standard-setting process” Referentiewerken Cizek, G. J. (Ed.). Setting performance standards: Concepts, methods, and perspectives. Mahwah, NJ: Lawrence Erlbaum. Cizet, G.J. & Bunch, M.B. (2007). Standard setting: A guide to establishing and evaluating performance standards on tests. Thousand Oaks, CA: Sage.

Onderzoek naar cesuurbepaling Veel procedures Veel kritiek Attitude: ‘er toch het beste van maken’

Overzicht Onderzoek naar cesuurbepaling Basiskader Enkele aanbevelingen?

basiskader Drie basisprincipes de idee van meetschaal Verschillende methodes

Meskauskas (1976): mastery state view all or none qualitative distinction applicability specific domains (e.g., sums till 10) or very general domains (e.g. pilot, doctor) continuum view different degrees cut score needed generally applied in educational measurement

The continuum view of mastery nonmastery ability cutoff Opmerking: kritek Glass (1978) onvermijdelijk voor mensen rond de cesuur

Criteriumgericht Criteriumgericht (“criterion-referenced”) en niet normgericht (“norm-referenced”): Wel: Behalen studenten doelstellingen? Niet: Hoeveel studenten slagen in andere opo’s? Vertaling van criterium in minimumscore

Aanpak domeinscore volstaat niet Universum van vragen steekproef Proportie juiste antwoorden als schatting van domeinscore Probleem: verschillen tussen toetsopgaven!

Drie basisprincipes Categorisatie van continue (latente) variabele O.b.v. vertaling criterium in minimumscroe Rekening houdend met verschillen tussen items

basiskader Drie basisprincipes de idee van meetschaal Verschillende methodes

MEETSCHAAL LEERLINGEN OPGAVEN vaardigheid moeilijkheidsgraad beheersing in termen van kansen

TOETSNORM Behalen eindterm Behalen eindterm nog niet Deze opgaven moeten de leerlingen nog niet beheersen Behalen eindterm Behalen eindterm nog niet Deze opgaven moeten de leerlingen beheersen

basiskader Drie basisprincipes de idee van meetschaal Verschillende methodes

category or state view Borderline (Livingston & Zieky, 1982) standard setting examinee-centered contrasting-groups (idem) continuum view Angoff (1971) Nedelsky (1954) item-centered Ebel (1972) Bookmark (Mitzel et al., 2001) Cito (van der Schoot, 1994) …

examinee-centered methods a. borderline method cutoff ability

examinee-centered methods b. contrasting-groups method masters nonmasters cutoff

category or state view Borderline (Livingston & Zieky, 1982) standard setting examinee-centered contrasting-groups (idem) continuum view Angoff (1971) Nedelsky (1954) item-centered Ebel (1972) Bookmark (Mitzel et al., 2001) Cito (van der Schoot, 1994) …

item-centered methods Angoff method Procedure Estimate P(success|MCS) Cut score = sum of probabilities high probability of success .50 low probability of success items ability Minimally competent student Opmerking: kritiek Shepard (1979) Cognitief complexe taak!

probabilistic method for multiple-choice questions item-centered methods Nedelsky method: probabilistic method for multiple-choice questions high probability of success MCS low probability of success difficulty ability 1. How many distractors can a MCS eliminate? 2. Determine the probability of success by guessing on the remaining response alternatives. 3. Cut score = sum of probabilities

item-centered methods IRT-based methods Bookmark method do not have to be mastered have to be mastered difficulty cutoff

Cito method (p50 and p80 points on scale) item-centered methods IRT-based methods Cito method (p50 and p80 points on scale) cutoff

Different procedures, lead to different results… Van Nijlen, D., & Janssen, R. (2008). Modeling judgments in the Angoff and contrasting-groups method of standard setting. Journal of Educational Measurement, 45, 45-63

Gemeenschappelijke kenmerken Groep beoordelaars Verschillende rondes Individuele oordelen Discussie in kleine groepjes Impact scores Overbrenging cesuur op verschillende toetsen via gemeenschappelijke meetschaal

Verschillende methodes Persoons- of itemgericht IRT-gebaseerd of niet Inschatting prestatie ‘grensgeval’ Verschillende beoordelaars

Overzicht Onderzoek naar cesuurbepaling Basiskader Enkele aanbevelingen?

Aanbevelingen? The union of the mathematician with the poet, fervor with measure, passion with correctness, this surely is the ideal. William James

Aanbevelingen? Procedure van verantwoording Formulering doelstellingen (‘performance standards’) Expliciete toetsmatrijs Kwaliteitsvolle items en scoring Ideaal: meetschaal Bepaling cesuur

Aanbevelingen? Verantwoordelijkheid Individuele docent Docententeam! Cf. formulering ‘performance standard’ Cf. cesuurbepaling o.b.v. panel van experten

Aanbevelingen? Voor verbetering vatbaar…

IRT oplossing voor equivaleren de gemeenschappelijke opgaven bieden de mogelijkheid om een gemeenschappelijke meetschaal te construeren

Toetsmatrijs Definitieve versie later op het jaar Verwerkingsniveau 40% kennisvragen 60% inzicht- en toepassingsvragen Een oppervlakkige verwerking van de leerstof is niet voldoende!

Anecdote Vraag: Geef de gaswet van Boyle. Antwoord: P.V = constant Score ‘middelbaar’: 9.5/10 ‘universiteit’: 0/10 Immers: P.V = constant bij constante temperatuur