Thema 10 Evaluatie.

Slides:



Advertisements
Verwante presentaties
Startbijeenkomst Leren Leren in een professionele oefencultuur
Advertisements

Thema 10 Evaluatie.
Rekenproblemen en Dyscalculie
Gekoesterde kwetsbaarheid als professionele deugd
Anders evalueren Evalueren met portfolio ’ s Annemie Borremans, april 2005.
Vervolgbijeenkomst 2 Procesfasering bij Leren Leren.
Kennis maken met Opbrengstgericht werken
Kwaliteit van het onderwijs: voorbij de slogans
SAMEN AAN ZET Opbrengstgericht werken voor docenten.
De school wil meer dan de inspectie vraagt ?! Ronde tafel bijeenkomst Vrijdag, 9 april 2010.
samenhang Resultaten Processen Persoon Wat het oplevert Wat je doet:
SAMEN AAN ZET Workshop voor leidinggevenden én docenten.
Hoofdstuk 3 – Gegevens verzamelen
Toetsen en leerlijnen in nieuwe scheikunde
Werkbijeenkomst Leerdoelen & Toetsing Bijeenkomst in het kader van de accreditatie / zelfevaluatie IO en IDE 23 mei 2013.
Diocesane Pedagogische Begeleidingsdienst - Brugge.
Militaire beroep Divers voor wat betreft de functies
Workshop Teamleiders OGW en sturen op OGW.
Workshop MT Opbrengstgericht werken Visie – Opbrengsten – Actie.
Portfolio
moderniseren van het curriculum.
Duurzaam beoordelen betrokken bij beoordelen. Referaat i. h. k. v
GEBRUIKERSDAG DELPHI OPBRENGST-GERICHT WERKEN met PARNASSYS
Workshop “Beoordelen”
2014 EVALUATIES N+1.
Startbijeenkomst ptaak jaar 2
Inhoud workshop Wat is de bedoeling van het V2- assessment?
Krachtige leeromgevingen
Krachtige leeromgevingen
Workshop evalueren Dcp
Onze doelen en visie in beeld
Thema 1 Inleiding op Onderwijskunde Aanpak van de cursus
Beroepsopdracht 4 In het cluster Talen.
Inhoud bijeenkomst 2 Oriёntatie op je praktijkonderzoek:
Presentatie titel Rotterdam, 00 januari 2007 Onderzoek 7 MadeleineMeurs
Het betrekken van studenten bij de toetscyclus
Week 2 : Ontwikkelingspsychologie, Liesbeth van Beemen:
Sociologie en Diversiteit werkcollege 1
De oplossing De aannemelijke oplossing van het dilemma, wat ga je testen?
Opgroeien in de stad les 3
Communicatie 2 – kw 2 Les 1.
Krachtige leeromgevingen Oefensessie 2: Evalueren
Rotterdam, 00 januari 2007 Kijken naar kinderen Bijeenkomst 3 kwartaal 3.
Bijeenkomst September 2015
Lectoraat Eigentijds Beoordelen in het Onderwijs (EBO) Jos Castelijns, Marja Wijnen, Mark Wouters & Willem Heldens Interactum 8 april 2011.
Evaluatie Cursus.
ECENT conferentie, Utrecht 12 mei 2011 Hoe lio’s voor te bereiden op omgaan met excellente leerlingen? Ton van der Valk, curriculumcoördinator JCU.
Bijeenkomst 3.  Welkom en vragen  Terugblik thema  Doelen  Verwerken van het huiswerk  Leerdoelen formuleren  Taxonomie van Bloom  Huiswerk.
De drie niveaus van onderwijs
Opbrengstindicatoren in het toezicht mbo
WELKOM Tweede jaars OGP6 Onderzoek Bijeenkomst
De (groei)indicatoren 8.2 en 2.1 en wat vraagt de Inspectie van het Onderwijs.
Vertaling van: John Hattie – Visible Learning for Teachers
Bijeenkomst 1.2 Ellen van den Boomen
Overgang van lagereschoolkind naar adolescent
Groepswerk Eén werk! = Eén cijfer?.
Een vergadering organiseren
Gepersonaliseerd leren
PowerPoint Taal Bijeenkomst 6: Evalueren op leerlingniveau
Vergadering Personeelsdienst
Ontwerpen van een leerlijn voor zelfstandig leren en werken
Toelichting bij ''Backward designing'' uit de kennisbank
Toetsing Vakdidactiek 2.
Ontwerpen van een leerlijn voor zelfstandig leren en werken
PowerPoint Taal Bijeenkomst 6: Evalueren op leerlingniveau
Evalueren om te leren vs. evalueren van het leren
Vakdidactiek EP 2 bijeenkomst 2
Vertaling van: John Hattie – Visible Learning for Teachers
Methodisch handelen Week 6 les 5. Methodisch handelen Week 6 les 5.
Cijferloos lesgeven bij talen
Transcript van de presentatie:

Thema 10 Evaluatie

In dit thema gaan we grondiger in op het onderwerp “evaluatie” In dit thema gaan we grondiger in op het onderwerp “evaluatie”. Dit is een zeer omvattend en ook een zeer complex thema. Daarom behandelen we in deze sessie maar een eerste onderdeel.

Evaluatie: begripsomschrijving Een begripsomschrijving voor “evaluatie” is een lastig zaak omdat het de nadruk legt op één aspect van “toetsing”, namelijk het waarderen, het toekennen van een waardering. Zoals je zal zien, helpt het ook niet om het begrip te vervangen door een andere veel gebruikte termen, zoals bv. assessment. Opnieuw wordt dan slechts één aspect van het toetsproces benadrukt.

Evaluatie: begripsomschrijving Lees even deze omschrijving van evaluatie: “Evaluatie is het totale proces van het verzamelen, analyseren en interpreteren van informatie over elk mogelijk aspect van een instructie-activiteit, met als doel een uitspraak te doen over de effectiviteit, de efficiëntie en/of een andere impact” (Thorpe, 1988). Je merkt meteen dat evaluatie een omvattend proces is dat betrekking kan hebben op alle elementen van het onderwijskundig referentiekader.

Evaluatie: begripsomschrijving In de literatuur wordt een eerste belangrijk onderscheid gemaakt tussen evalueren enerzijds en assessment anderzijds. Assessment of “meten” verwijst naar het proces van verzamelen en analyseren van gegevens (Burke, 1999 en Feden & Vogel, 2004) Evalueren gaat, zoals we net zagen, verder en gebruikt die verzamelde informatie om een uitspraak te doen over de effectiviteit, de efficiëntie en/of een andere impact.

Evaluatie: begripsomschrijving In de literatuur maakt men nog een verder onderscheid tussen: Meten/testen: informatie verzamelen Evalueren/waarderen: wat is de informatie waard? Scoren/grading: afhankelijk van de « waarde » een score toekennen Het is essentieel tussen deze drie activiteiten een onderscheid te maken. Je kan dus meten zonder dat je ook evalueert of scoort. Maar je kan niet scoren zonder eerst te meten en te evalueren.

Kwaliteitseisen bij evaluatie Vooraleer recente ontwikkelingen rond evaluatie te bespreken, behandelen we een belangrijk thema rond de kwaliteitseisen bij evaluatie. Daarbij staan vier begrippen centraal: Validiteit Betrouwbaarheid Authenticiteit Recentheid validiteit betrouwbaarheid authenticiteit recentheid

Validiteit Validiteit verwijst naar de mate waarin de inhoud van gemeten, gewaardeerd en gescoord wordt wel overeenkomt met het evaluatiedoel. Typische vragen en problemen met validiteit: Enkel meetkunde testen om een uitspraak te doen over wiskundekennis van lagere school Enkel vragen stellen over één hoofdstuk uit de cursus op een examen Enkel kennisvragen over scheikunde stellen wanneer ook de laboproeven werden uitgevoerd.

Betrouwbaarheid Betrouwbaarheid verwijst naar de mate waarin de meting stabiel is. Typische vragen hierbij zijn: Herhaal ik morgen de test, krijg ik dan een vergelijkbaar resultaat? Is er geen te groot verschil in het al dan niet kunnen oplossen van de verschillende vragen in de toets (interne samenhang)? Indien iemand anders meet, zal hij/zij eenzelfde resultaat vaststellen?

Authenticiteit Authenticiteit verwijst naar de mate waarin de verzamelde info een relevante, adequate, authentieke afbeelding is van wat in de werkelijkheid voor komt. Voorbeelden van vragen hierbij: Is het voldoende om het geven van injecties door verpleegkundigen te evalueren met poppen? Is het adequaat om een vliegbrevet af te leveren op basis van prestaties tijdens vliegsimulaties? Is het voldoende om het “kunnen les geven” te testen aan de hand van les aan een kleine groep leerlingen?

Recentheid Recentheid stelt de vraag naar de “datum” van de meting waarop de scores bij de evaluatie: Zijn credits die 5 jaar geleden verworven zijn, nog bruikbaar om vandaag vrijstellingen aan te vragen? Kunnen we een jonge huismoeder die opnieuw aan de slag wil, aanwerven op basis van een diploma dat 10 jaar geleden is behaald? Zijn de Basic Life Support Skills die zes maanden geleden bereikt werden, vandaag nog relevant bij een actieve ambulancier?

Ontwikkelingen rond evaluatie Recente ontwikkelingen rond evaluatie kunnen we clusteren langs een aantal dimensies: Op welk aggregatieniveau wordt de evaluatie uitgevoerd? Wat zijn de functies van evaluatie? Wie voert de evaluatie uit? Wanneer wordt de evaluatie opgezet? Welke technieken worden gebruikt bij de evaluatie? We bespreken enkele voorbeelden per dimensie.

Dimensie 1: aggregatieniveaus Ten eerste zien we dat evaluatie betrekking kan hebben op de drie verschillende aggregatieniveaus in het referentiekader: Microniveau Mesoniveau Macroniveau We bekijken voor elk aggregatieniveau een voorbeeld van recente ontwikkelingen.

Dimensie: aggregatieniveau Op elk aggregatieniveaus keren dezelfde elementen terug. Evaluatie kan op elk aggregatieniveau betrekking hebben op elk element in het referentiekader: Instructieverantwoordelijke Lerende Leeractiviteiten Organisatie Context Instructieactiviteiten (doelen, leerstof, media, werkvormen, evaluatie)

Microniveau Voorbeeld 1: evaluatie van de mate waarin de doelen bereikt zijn; Voorbeeld 2: evaluatie van didactische werkvormen.

Microniveau: evaluatie doelen Bij de evaluatie meten we gedrag van leren, waarderen we dit gedrag en kennen we er een score aan. De vraag is waarop we onze waardering baseren? Op een vooropgesteld criterium? Criterion referenced assessment Op een norm, bijv. het groepsgemiddelde? Norm referenced assessment Op de eerdere prestaties van de lerende zelf? Ipsative assessment of self-referenced assessment

Microniveau: evaluatie doelen Voorbeeld: hoe snel lopen 15 jarige 100 meter? Criterion referenced assessment Elke loopprestatie wordt vergeleken met een criterium; bv. minder dan 15 seconden Norm referenced assessment Elke loopprestatie wordt vergeleken met het gemiddelde van bv. de klasgroep (je zal maar in een snelle groep zitten). Ipsative assessment of self-referenced assessment Elke loopprestatie wordt vergeleken met een eerdere prestatie van elke individuele lerende; nadruk op individuele leerlijn.

Microniveau: waarde instructieactiviteiten Hattie (2009) bespreekt in z’n meta-analyses instructieactiviteiten. Zijn meta-analyses kijken na of een aanpak een verschil maakt; met andere woorden een differentieel effect heeft . Heeft een aanpak zin? Zo zie je in het voorbeeld dat de gemiddelde “effect size” van huiswerk als instructiestrategie maar d = .29 is. Ver beneden de vooropgestelde d = .40 grens.

Mesoniveau: evaluatie op schoolniveau Recente ontwikkelingen op schoolniveau kijken na of een “school” als geheel een value-added heeft, een toegevoegde waarde op leerprestaties. Maar kan je zomaar instellingen met elkaar vergelijken? Leidt dit niet simpelweg tot “ranking” zoals je kan zien in dit krantenartikel?

Mesoniveau: evaluatie op schoolniveau Je kan instellingen niet zomaar vergelijken. Calder (1994) schuift voor dit doel het CIPO model naar voren waarbij alles in balans wordt gebracht: Contextevaluatie: de ligging van de school, de beschikbare middelen, de regelgeving Inputevaluatie: wat de school inzet als aanpakken en middelen, programma, beleid, aantal en aard personeel Procesevaluatie: de manier waarop het programma is geïmplementeerd, strategieën, evaluatie-aanpak, mediagebruik, professionalisering leerkrachten, enz . Output evaluatie: de effecten zoals bereiken van de eindtermen, doorstroom naar andere school, rendement, enz.

Mesoniveau: evaluatie op schoolniveau Scholen vergelijken met het CIPO model kan dus betekenen: Dat een school met veel migranten relatief beter presteert dan een school met kinderen uit de hogere sociale klasse. Dat een school goed kan presteren voor bepaalde eindteren en minder goed voor andere. Dat een school opmerkingen kan krijgen over haar beleid. Dat men rekening houdt met de slechts ligging van een school (bv. een onveilige buurt). Dat men ook kijkt naar wat leerlingen later presteren in een vervolgopleiding (bv. succes aan de universteit). … Scholen worden met het CIPO model geëvalueerd tijdens een doorlichting door de inspectie.

Mesoniveau: evaluatie op schoolniveau De verslagen van de doorlichting zijn openbaar

Macroniveau: schooleffectiviteit Lees volgende omschrijving: “Het doel van schooleffectiviteitsonderzoek is het beschrijven en verklaren van verschillen tussen scholen op basis van specifieke criteria. Schooleffectiviteitsonderzoek exploreert deze verschillen in de mate dat leereffecten worden bereikt in relatie tot verschillen in de instructieverantwoordelijken of verschillen in de kenmerken van lerenden, klassen of scholen.” Je merkt dat men net zoals bij het CIPO model verklaringen zoekt voor verschillen, maar nu op het systeemniveau van alle scholen.

Macroniveau: schooleffectiviteit Deze ontwikkeling bij evaluatie start vanuit zeer kritische rapporten over de value-added van scholen: Het Coleman rapport (1966, chapter 1): “Scholen hebben maar weinig effect op leerprestaties dat losstaat van de familieachtergrond en sociale context.” Het Plowden rapport (1967, p.35): “Verschillen tussen de ouders verklaren sterker de variatie in leerprestaties dan de verschillen tussen scholen …. Factoren in de ouders verklaren tot 58% van de variantie in leerprestaties.” Scholen willen – in tegenstelling tot wat deze studies beweren - bewijzen dat ze wel een bijdrage leveren aan leerprestaties.

Macroniveau: schooleffectiviteit Een centrale kritiek op het Coleman en Plowden rapport is dat ze het complexe samenspel negeren dat bestaande verschillen helpt verklaren; zie het CIPO model. In plaats van zomaar testen af te nemen en resultaten te vergelijken, kijken we naast de “product effecten” ook naar processen en variabelen die hiermee samenhangen. Dit worden de performance indicatoren genoemd.

Macroniveau: performance indicatoren Performance indicatoren zijn: "statistische gegevens, verhoudingsgetallen, kosten en alle andere informatie die de opbrengst meet en verheldert van een instelling in relatie tot de vooropgestelde doelen.“ Je merkt dat de nadruk bij performance indicatoren ligt op het in het beschrijven en verklaren van verschillen. Een van de gekendste performance indicatoren studies is de driejaarlijkse PISA: Programme for International Student Assessment. Daarbij worden de prestaties van landen vergeleken. In PISA 2006 waren dat 54 landen.

Macroniveau: performance indicatoren Resultaten van PISA in 2006 tonen bv. de hoge prestaties van Vlaanderen voor wetenschappen, wiskunde, en lezen

PISA resultaten worden niet alleen beschreven. Ze worden ook verklaard PISA resultaten worden niet alleen beschreven. Ze worden ook verklaard. In deze grafiek zie je bijv. hoe resultaten op de PISA testen samenhangen met de socio-economische status (SES) van de leerlingen. Hoe hoger die status hoe beter de resultaten. SES is bepaalde door o.a. Het opleidingsniveau van de ouders, hun inkomen, hun bezit van cultuurgoederen (boeken).

Dimensie 2: functies van evaluatie Waarom wordt er geëvalueerd? Er zijn verschillende mogelijke redenen: Formatieve evaluatie Om te zien waar men staat en bij te sturen Summatieve evaluatie Om vast te stellen wat men uiteindelijk beheerst. Predictiefunctie Om latere prestaties te voorspellen (bv. succes hoger onderwijs) Selectiefunctie Om te zien of men geschikt is voor een job, taak

Dimensie 2: functies van evaluatie In het buitenland veel aandacht voor selectiefunctie; zie de aandacht voor ingangsexamens. In dit voorbeeld zie je een gelukkige kandidaat (en moeder) die geslaagd is voor de ingangstest in een Chinese universiteit.

Dimensie 2: functies van evaluatie Vroeger was er een grote nadruk op de summatieve evaluatie. Nu is er een grote nadruk op de formatieve evaluatie. Waarom? Leert men wel uit de evaluatieve feedback; ook consequential validity genoemd? Moet de instructieverantwoordelijke de begeleiding, de aanpak, het materiaal, … niet bijsturen? Heeft men al een voorlopig niveau bereikt?

Dimensie 3: Wie voert de evaluatie uit? Klassiek voert de instructieverantwoordelijke de evaluatie uit. Nieuwe ontwikkelingen: De lerende voert de evaluatie uit: zelftoetsing Lerenden voeren samen de evaluatie uit: peer toetsing Een externe verantwoordelijke voert de evaluatie uit (bv. een andere leerkracht). Een extern bedrijf voert de evaluatie uit: assessment centers …

Dimensie 3: Wie voert de evaluatie uit? Nieuwe ontwikkeling: zelftoetsing Zelftoetsing wordt gezien als voorbeeld van toetsen om te leren (Assessment-as-learning) : vooral formatieve functie Twee hoofdstappen: Eerst training krijgen in het ontwikkelen en expliciet maken van toetscriteria: ontwikkelen meetinstrument en discussie over de waarde van wat men vaststelt. Dan pas de meetinstrumenten gebruiken en komen tot een eigen oordeel. Scoren komt hierbij nauwelijks om de hoek kijken. Zeer bruikbare techniek: rubrics (zie verder)

Dimensie 3: Wie voert de evaluatie uit? Assessment centres: extern bedrijf dat evaluatie uitvoert; meestal in functie van selectiefunctie “Gestandaardiseerde evaluatieprocedure van complex gedrag -veelheid van inputgegevens. Het gedrag beoordeeld, in gesimuleerde situaties. Verschillende beoordelaars beoordelingen samen tot globale uitspraak.” Verschillende beoordelaars zorgen ervoor dat men vanuit alle kanten bekeken wordt: 360° evaluatie Vooral gebruikt voor selectiefunctie bv. Bij het zoeken van kandidaten voor een job

Dimensie 4: Wanneer evalueren? Er is een verschuiving in het moment waarop men evalueert: naar « voor » en « tijdens » het leerproces; gegeven formatieve functie van toetsing Voor voorkennistoetsing Tijdens Voortgangstoetsing Portfoliotoetsing Na Eindtoetsing

Dimensie 5: Welke evaluatietechniek? Naast klassieke toetsen met meerkeuzevragen, open vragen, invulvragen, … worden nieuwe technieken gebruikt. Bijvoorbeeld: Rubrics: aandacht voor criteria en indicatoren Portfolio’s: dossier met brieven, informatie, illustraties, producten, … als informatiebasis voor de evaluatie …

Dimensie 5: Rubrics Rubrics: Definieer heldere criteria: concreet aandachtspunt waarop het meten, waarderen en scoren zicht richt Bepaald per criterium een aantal indicatoren: indicatoren geven het niveau aan waarop een criterium wordt bereikt

Performance indicatoren Dimensie 5: Rubrics Performance indicatoren Voorbeeld-rubric: “Kleuren mengen” In vervolgstappen leerproces kan men criteria en performance indicatorenniveaus vermeerderen. 1 2 3 4 Hoeveelheid gebruikte verf Denkt niet na over hoeveelheden - Gebruikt minimale hoeveelheden bij samenstellende kleuren Beginkleur Begint met donkere kleuren te mengen Start men bleekste kleurmengsel Volgorde bijmengen … Criteria

Dimensie 5: Rubrics Voorbeeld-rubric: “Het schrijven van een historisch fictieverhaal

Dimensie 5: Portfolio’s Lees de volgende omschrijving: Een portfolio is een dossier dat men samenstelt met brieven, informatie, illustraties, producten, … als informatiebasis voor de evaluatie.

Dimensie 5: Portfolio’s Soorten portfolio’s: Een documentenportfolio of productportfolio: documentatie die activiteiten in een opleiding, stage, praktijkervaring, … helpt beschrijven (meten). Naast deze informatie wordt reflectie toegevoegd (waarderen). Typisch gebruik bij opleiding verpleegkundigen, leerkrachten, … . Een procesportfolio: een logboek. Documentatie van voortgang leerproces aangevuld met reflecties die leiden tot actieplannen. Typisch gebruik bij artsen, verpleegkundigen, leerkrachten, … . Een showcase portfolio: “the best of …”. Bundeling van het beste werk van een lerenden in functie van het besluitvormingsproces over de prestaties van de lerenden. Typisch gebruik in beeldende kunsten, muzikanten, architecten, … .

Dimensie 5: Portfolio’s Voorbeeld procesportfolio

Einde van dit instructiepakket Pak nu de eindtoets aan Einde van dit instructiepakket Pak nu de eindtoets aan. Ga opnieuw naar je Minerva werkplek