Een systemische aanpak van toetsing

Slides:

Advertisements

Verwante presentaties

Hoe beleef je toetsen? HANovatie Themadag 6 november 2009 Saskia Weijzen.

Advertisements

Praktijkonderzoek in zorg en welzijn: over afstand nemen en groeien

Ontwikkeltraject Eigentijds Beoordelen in het Onderwijs (EBO)

1 Europese Vereniging for het Toetsen en Beoordelen van Taalvaardigheid

Doel van de miniconferentie: Weten waar je op je opleiding over in gesprek kunt gaan mbt het toetsen van taal in totaal. Voettekst.

Onderzoek naar competentiegericht beoordelen in het groene onderwijs

Digitale toetsen op afstand Bregatha de Gooijer

4C/ID Gebruikersdag, 17 april 2012, Utrecht

Roundtable 8 Teach as you preach: training in toepassen van het 4C-ID model volgens het model Symposium 4C-ID IV, 14 april 2011, Utrecht Studiecentrum.

Beter presteren door Leuker Leren Meer Leertijd of Betere Leertijd? Joseph Kessels 30 oktober 2013 Rotterdam.

Toetsing van verpleegkundigen: eenvoudige theorie en complexe praktijk

Toetsing van medische competentie

Aansluiting van het Hoger Onderwijs bij MedischOnderwijs.nl 2 november 2007 Aansluiting van het Hoger Onderwijs bij MedischOnderwijs.nl P.M.Bloemendaal.

Formatief - summatief evalueren

Modern opleiden in de laboratorium-geneeskunde:

Jan van Tartwijk De impact van toetsen in het onderwijs en hoe daar gebruik van te maken Jan van Tartwijk

‘HOW CAN I INTRODUCE NEW WAYS OF ASSESSMENT THAT CAN CONTRIBUTE TO GETTING PUPILS MORE INVOLVED IN THEIR OWN LEARNING?’ ‘Een onderzoek naar beoordelen.

'Evidence': recepten voor de onderwijsprofessional?

Ontwerpprojecten In de praktijk

Hoe competentiegericht is uw opleiding?

| Ontwikkelingen aangaande het onderwijs binnen de RUG Rectorenseminar 2013 Elmer Sterken.

Challenge the future Delft University of Technology TBM Onderwijsdag 2012 Succesvol betrekken afstudeerders bij onderzoek: LR Erwin Mooij, Space.

1 Cecile Crobach October MSc Thesis: Onderwijs en Onderzoek Combineren van onderzoek en praktijk Onderwijsdag TBM 2012.

Workshop Rienk van Marle en Joris Verwijmeren Themadag Onderzoek 18 november 2010, Amsterdam Themadag Onderzoek 2010 Van Marle&Verwijmeren.

Tussentijds Toetsen als Leerstrategie Dirkx, K.J. H., Kester, L., Kirschner, P.A.

Onderzoek naar aspecten van EVC Congres Levenlang leren op een HOger plan! EVC in perspectief Desirée Joosten-ten Brinke, CELSTEC, Open Universiteit Nederland.

Studietaak De studietaak staat centraal

Militaire beroep Divers voor wat betreft de functies

Toetsen en toetsbeleid

VELON Opleiden in de school 9 november 2007

Leergemeenschappen in de klas: een reflexieve start (workshop)

‘De opbrengst gemeten’ Toetsing in het Mechelen Curriculum

De 3 Dimensies van Collaborative Learning: het PEERS project op University College Maastricht Oscar van den Wijngaard, Community of Practice HU 8 april.

Begeleiden van Praktijkonderzoek

Cop Ontwerpprojecten / Verbinden van Onderwijs en Onderzoek Vergelijking met RBL, 8 april 2010.

De fysiotherapeutische behandeling bij patiënten met een CVA, opgenomen in de Nederlandse ziekenhuizen; Een beschrijvende studie van de huidige zorg.

Clinical audit Ervaringen in Engeland

Hoe kunnen we een lerende eigenaar maken van zijn eigen ontwikkeling?

Van Docentprofessionalisering naar Scholarship of Teaching: - op weg naar een volwaardige plaats van onderwijs / opleiding in de organisatie en - naar.

Gender en wiskunde Anja Jansen 2007.

zelfsturend portfolio-onderwijs:

Competentiegericht ontwerpen & ontwikkelen

Toetsen & Toetsen 16 november Toetsen & Beoordelen Na deze ochtend 1- Weet je wat een effectieve en gefundeerde toetsconstructie is 2- Weet je.

Professionalisering Medewerkers

Duurzaam beoordelen betrokken bij beoordelen. Referaat i. h. k. v

PvB volgens KOC-model Wendy Bosma en Senta Mooijman Afdeling Examinering & kwalificering Projectleiding en ontwikkeling.

4C/ID Versie 2 Jeroen J.G. van Merriënboer

Richtlijnen voor de casustoets

Papier of Elektronisch 2 portfolio implementaties bij Geneeskunde Maarten van Wesel & Anouk Prop.

Dr. Desirée Joosten-ten Brinke

Beroepsopdracht 4 In het cluster Talen.

Dublindescriptoren: Bologna Bologna-niveaus 1. bachelor, 2. master, 3. doctor Niveaubepaling door de resultaten (outcomes) van opleidingen, niet door inputs.

Hedendaags toetsen in het hoger onderwijs. Waar gaat het nu over?

Formatief evalueren in grote groepen Desirée Joosten-ten Brinke Open Universiteit & Fontys lerarenopleiding Tilburg Zet svp uw GSM aan. Ga naar: b.socrative.com.

21 st century skills en het onderwijs in de kennismaatschappij Joke Voogt De Onderwijsdagen Utrecht, 9 november 2010.

Curriculum van de huisartsopleiding UMCG september 2006.

‘ Weg met de student ‘ Weg met de student Rene F.W. Diekstra.

Toetsing: het hart van onderwijs! 16 april 2013 Karen Heij.

PhD guidance AN INSIGHT INTO THE GUIDANCE PROVIDED TO PHD CANDIDATES by the UM Staff Career Counselling Services and the Staff Development Centre (SDC)

+ Gevalideerd beoordelen van een gepersonaliseerd portfolio Marieke van der Schaaf Department of Education, Utrecht University

1 Toetsontwikkeling en kwaliteit AOC-raad presentatie Silvester Draaijer (Onderwijscentrum VU)

Portfolio voor eerstejaars geneeskunde studenten

Gewoon Speciaal ICT, 5 oktober 2016 Odeth Bloemberg, schoolpsycholoog

Zelfmanagement of toch positieve gezondheid? Een dissident geluid

Begeleiden van Praktijkonderzoek

TU/e SkillsLab Introductie SkillsLab & competentieontwikkeling

Vakdidactiek EP 2 bijeenkomst 2

TOOLKIT professionaliseren vanuit de formatieve toetscyclus

Doorstroomminor OS/HRS/MCD/EBO

The Future Teacher 3.0.

Transcript van de presentatie:

Een systemische aanpak van toetsing NVMO Hoofdlezing Maastricht, 15-16 november 2012 Cees van der Vleuten Universiteit Maastricht

Overzicht Van praktijk naar onderzoek Van onderzoek naar theorie Van theorie naar praktijk Conclusies 30 jarige reis: Confrontatie tussen onderwijs/toetspraktijk en wetenschappelijk onderzoek Voor mij komen daar consistenties en inzichten uit, een verhaal, een theorie zo u wilt

Toetsvormen MCQ, MEQ, OEQ, SIMP, Write-ins, Key Feature, PMP, SCT, Patiënt examen, OSCE, OSPE, DOCEE, SP-based test, Video assessment, MSF, Mini-CEX, DOPS, assessment center, self-assessment, peer assessment, incognito SPs………….

De beklimming...... Does Does Shows how Shows how Knows how Knows how Performance assessment in vivo: KKB, 360۫…, Peer, Video, Incognito Pat, Video……. Does Shows how Performance assessment in vitro: OSCE, SP-based test….. Shows how Knows how (Klinisch) Contextuele toetsen: MCQ, open vragen, mondeling….. Knows how Knows Feitgerichte toetsen: MCQ, open vragen, mondeling….. Knows

Karakteristieken van instrumenten Validiteit Betrouwbaarheid Onderwijs- invloed Kosten Acceptabiliteit Onderwijs- invloed Betrouwbaarheid Validiteit

Validiteit: wat beoordelen we? Curricula zijn veranderd van input sturing naar output sturing Van disciplines naar leerdoelen, eindtermen, en nu competenties Van docentsturing naar zelfsturing

Competentie-frameworks CanMeds (Canada) Medical expert Communicator Collaborator Manager Health advocate Scholar Professional ACGME (US) Medical knowledge Patient care Practice-based learning & improvement Interpersonal and communication skills Professionalism Systems-based practice GMC (UK) Good clinical care Relationships with patients and families Working with colleagues Managing the workplace Social responsibility and accountability Professionalism Benadruk het belang van domain independent skills Benoem EPAs

Validiteit: wat beoordelen we? Does Ongestandaardiseerde Toetsing (opkomend) Does Shows how Shows how Gestandaardiseerde Toetsing (ver uitontwikkeld) Knows how Knows how Knows Knows

Inzichten over validiteit We hebben een veelheid aan toetsmethoden nodig om de hele competentiepiramide te dekken Nodig zijn gestandaardiseerde èn ongestandaardiseerde toetsmethodieken Kwaliteitscontrole van instrumenten is essentieel voor gestandaardiseerde beoordeling De gebruikers (de mensen) zijn essentieel bij ongestandaardiseerde beoordeling. Beiden zijn nodig. De een kan niet zonder de ander. Voor de top is observatie nodig en expertiseoordelen. Wat dan met subjectivieit?

Betrouwbaarheid: hoe precies beoordelen we? Korte casus gerichte Essay2 0.68 0.73 0.84 0.82 KKB6 0.73 0.84 0.92 0.96 Praktijk Video Obser- vatie7 0.62 0.76 0.93 In- cognito SPs8 0.61 0.76 0.82 0.86 Toets- Tijd in Hours 1 2 4 8 MCQ1 0.62 0.76 0.93 Simu- laties1 0.36 0.53 0.69 0.82 Mon- de- ling3 0.50 0.69 0.82 0.90 Patient examen4 0.60 0.75 0.86 0.90 OSCE5 0.54 0.69 0.82 0.90 1Norcini et al., 1985 2Stalenhoef-Halling et al., 1990 3Swanson, 1987 4Wass et al., 2001 5Van der Vleuten, 1988 6Norcini et al., 1999 7Ram et al., 1999 8Gorter, 2002

Inzichten over betrouwbaarheid Acceptabele betrouwbaarheid wordt slechts bereikt bij een grote steekproef aan toetselementen en beoordelaars Geen enkele methode is inherent beter dan een andere (ook de nieuwere niet!) Objectiviteit is NIET gelijk aan betrouwbaarheid Vele onafhankelijke subjectieve oordelen maken een objectief oordeel. Dus random error kan dmv steekproeftrekking worden bestreden. Belangrijk inzicht voor niet gestandaardiseerde technologie

Onderwijsinvloeden: Hoe stuurt toetsing het leren? Sturing is complex (zie Cilliers, 2011, 2012) Veel negatieve invloeden Povere leerstijlen Cijferproblematiek (zesjes cultuur, genade-zes, jagen op punten) Hoge werkplekbeoordelingen Veel reductionisme in toetsing Weinig feedback (cijfer is slechte vorm van feedback) Toetsconcept niet aansluitend op onderwijsconcept Aggregatie van informatie over niet betekenisvolle eenheden Weinig longitudinale opvolging Veel vinken, weinig vonken (OSCE, werkplekbeoordelingen). Toetsconcept gericht op beheersingsleren en herkansing, niet op ontwikkeling, remediering, en opvolging Vinken en vonken: noem stationsexamen, en rituele beoordelingen op werkplek. Hoe het reductionsime te bestrijden?

Inzichten over onderwijsgevolgen Geen enkele toets of beoordeling zonder betekenisvolle feedback Narratieve feedback heeft meer impact dan scores op complexe vaardigheden Feedback alleen is niet genoeg voor gebruik Meer longitudinale beoordeling is wenselijk. Eindigen dat dit een aantal lessen geleerd zijn uit de praktijk die onderzoeksmatig zijn onderbouwd. Dit was een reis van praktijk naar onderzoek. Maar nu maken we een stap verder.

Overzicht Van onderzoek naar theorie Van praktijk naar onderzoek Van theorie naar praktijk Conclusies

De beperkingen van de enkelvoudige toetsbenadering Geen enkele toets kan alles Elke toets heeft beperkingen Elke toets houdt een fors compromis in

Toetsprogramma’s Implicaties Validiteit: een veelheid aan toetsen nodig Betrouwbaarheid: veel (gecombineerde) informatie nodig Onderwijsgevolgen: toetsing moeten (longitudinaal) betekenisvol voor het leren zijn Implicaties van onderzoek uit betrouwbaarheid, onderwijsgevolgen Toetsprogramma’s

Toetsprogramma’s Curriculum programma is goede metafoor; in een toetsprogramma zijn: Onderdelen gepland, gearrangeerd, gecoördineerd Systematisch geëvalueerd en bijgesteld Maar hoe doe je dat dan? (de literatuur biedt bitter weinig houvast!) Implicaties van onderzoek uit betrouwbaarheid, onderwijsgevolgen

Toetsprogramma’s Zie Dijkstra et al 2012: 73 generieke richtlijnen voor toetsprogramma’s Nog te doen: Verdere validering Een handzaam (zelfevaluatie) instrument Generiek geformuleerd

Bouwstenen Toetsprogramma’s 1 Elke toets of beoordeling is één datapunt (Δ) Elk datapunt is geoptimaliseerd voor leren Informatierijk (kwantitatief, kwalitatief) Betekenisvol Gevarieerd in vorm Summatief versus formatief vervangen we door een continuüm van wat er op het spel staat (stakes) N datapunten zijn gerelateerd aan aard van beslissing

Voortgangsbeslissingen: Continuüm van wat er op spel staat, relatie met datapunten en hun functie Er staat niets op spel alles op spel Eén datapunt: Gericht op informatie, feedback Tussentijdse Voortgangsbeslissingen: Meer datapunten nodig Gericht op diagnose, bijsturing en voorspelling Finale Beslissingen: Veel datapunten nodig Gericht op een (niet verassende) zware beslissing

Toetsinformatie als pixels

Klassieke benadering van aggregatie Methode 1 voor beoordeling van vaardigheid A Σ Methode 2 voor beoordeling van vaardigheid B Σ Methode 3 voor beoordeling van vaardigheid C Σ Methode 4 voor beoordeling van vaardigheid D Σ

Betekenisvolle benadering van aggregatie Competentie A Competentie B Competentie C Competentie D Methode 1 Methode 2 Methode 3 Methode 4 Σ Σ Σ Σ

Uitgewerkt in een theoretisch model waarin alle onderdelen consistent verwerkt zijn. Niet mee vermoeien. Model is generiek: zowel voor theoretisch onderwijs (schoolbanken) als in de praktijk (bv vervolgopleidingen)

Overzicht Van theorie naar praktijk Van praktijk naar onderzoek Van onderzoek naar theorie Van theorie naar praktijk Conclusies Laten we nu terug gaan van theorie naar praktijk

Terug van theorie naar praktijk Bestaande toetspraktijken: Master Diergeneeskunde Utrecht AKO, graduate entry geneeskunde Maastricht Jaar 6 geneeskunde Maastricht (later hele Master) Huisartsopleiding Nederland Sommige specialistenopleidingen zijn hard op weg Cleveland Learner Clinic, Cleveland, Ohio

Cleveland Clinic Lerner College of Medicine (Dannefer et al., 2007) 5 jarige opleiding arts/klinisch onderzoeker Overkoepelende competententiestructuur Beschreven standaarden per fase van de studie Alle toetsing formatief en infomatief Wekelijkse casustoetsing met open vragen, geen grades maar feedback Veel docent en peer evaluaties in narratieve vorm Werkplekbeoordelingen OSCEs

Competentie framework Research Medical Knowledge in the Basic and Clinical Sciences Communication Professionalism Personal Development Clinical Skills Clinical Reasoning Health Care Systems Reflective Practice

Voorbeeld van standaarden Competency Year 1 Year 2 Year 5 Research Demonstrate knowledge base for basic and clinical research, skills set to conceptualize and conduct research Demonstrates ability to critically review basic science research Actively participates in the performance of laboratory procedures relevant to their basic science research Demonstrates ability to critically review clinical research papers Applies principles and skills in medical biostatistics and clinical epdidemiology to analysis of data Analyzes and effecitively critiques a broad range of research papers Demonstrates the ability to generate research a hypothesis and formulate questions to test it Designs and performs studies to test a hypothesis Niet alles, er zijn meer criteria beschreven

Cleveland Clinic Lerner College of Medicine (Dannefer et al., 2007) Alle infomatie in een centraal webgebaseerd systeem Mentor systeem met longitudinale opvolging, gesprekken op basis van zelfanalyses Voortgangsbeslissingen door onafhankelijke commissie met zware procedures voor besluitvorming Zeggen waar Maastricht afwijkt; vgt

establish trustworthiness Criteria Potentiele Toepassingen in Toetsing Strategy to establish trustworthiness Criteria Potentiele Toepassingen in Toetsing Credibility Prolonged engagement Trainen van beoordelaars Triangulation Toenemende inschakeling van experts op basis van mate van zekerheid over het oordeel Peer examination Benchmarken beoordelaars Member checking Incorporeer een zelf-oordeel van de lerende Structural coherence Controle op inconsistenties in besluitvorming Transferability Time sampling Gebruik van veel datapunten Thick description Gemotiveerde besluitvorming Dependability Stepwise replication Grootte van de commissie bestaande uit gerespecteerde leden Confirmability Audit Creëer beroepsmogelijkheid Vertel over onze portfoliobeoordeling

Cleveland Clinic Lerner College of Medicine (Dannefer et al., 2007) Alle infomatie in een centraal webgebaseerd systeem Mentor systeem met longitudinale opvolging, gesprekken op basis van zelfanalyses Voortgangsbeslissingen door onafhankelijke commissie met zware procedures voor besluitvorming Zeggen waar Maastricht afwijkt; vgt

Cleveland Clinic Lerner College of Medicine Opbrengsten: Studenten passen zich probleemloos aan na de “test-cultuur” waaraan ze gewend zijn Hoog presterende studenten (USMLE) Studenten zijn de ambassadeurs geworden van het systeem en waarderen: De rijkheid van het systeem Het aandacht bieden aan brede vaardigheden De zelf-controle De begeleiding

Overzicht Conclusies Van praktijk naar onderzoek Van onderzoek naar theorie Van theorie naar praktijk Conclusies 30 jarige reis: Confrontatie tussen onderwijs/toetspraktijk en wetenschappelijk onderzoek Voor mij komen daar consistenties en inzichten uit, een verhaal, een theorie zo u wilt

Conclusies 1 We moeten af van het exclusief denken in individuele toetsmethoden Een systemische, programmatische aanpak is daarvoor noodzakelijk, longitudinaal gericht Elke toetsmethode kan hierin functioneel zijn (oud en nieuw; gestandaardiseerd en ongestandaardiseerd) Professionele oordeelsvorming is onontbeerlijk (vergelijkbaar aan de klinische praktijk) Subjectiviteit wordt gepareerd met sampling en met procedurele maatregelen (en niet met standaardisering of objectivering) Minder psyschometrich, meer onderwijskundig

Conclusies 2 Het toetsprogramma optimaliseert: De leerfunctie (door informatierijkheid) De beslisfunctie (door combinatie van informatie) Nu nog van praktijk naar onderzoek

Dank voor uw aandacht! www.fdg.unimaas.nl/educ/cees/nvmo Deze Powerpoint: www.fdg.unimaas.nl/educ/cees/nvmo Dank voor uw aandacht!