College 3 Meten.

Slides:



Advertisements
Verwante presentaties
Tevredenheid met behandelaar en behandeling.
Advertisements

‘SMS’ Studeren met Succes deel 1
Screening van toetsen: Psychometrische analyse
Samantha Bouwmeester Testtheorie Responsie College Samantha Bouwmeester.
Enkele Determinanten van Peer Review Presentatie werkstuk Geert Wissink Universiteit van Amsterdam, 13 januari 2003.
Onderzoek naar de effecten van het Thuisadministratie programma
Hoofdstuk14 Gegevens verzamelen in het veld, non- responsefouten en screening van vragenlijsten.
Fasen van onderzoek Onderzoeksplan bureauwerk Dataverzameling
Jongeren met visuele beperking: persoonlijk netwerk en welbevinden
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Betrouwbaarheid en Validiteit
Hoofdstuk 3 – Gegevens verzamelen
Kwaliteit van meetinstrumenten
Onderwerp Vraagstelling Theorie Methodiek verslaglegging
2 3 Natuurkunde ≥ 6 Wiskunde ≥
Connector C Certificatie
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Studiedag ‘Diversifiëren van evaluatiemethoden’ 5 juni 2008
De ontwikkeling en validering van een cognitieve-vaardighedentest voor volwassen anderstaligen Evelien Buyse, Karine Verschueren en Walter Magez Nederlands.
Gegevensverwerving en verwerking
Meten van onderzoeksvariabelen
Oefeningen F-toetsen ANOVA.
Evaluatie Van Interactieve Software Systemen
Evaluatie van Interactieve Software Systemen
5 Werving en selectie.
Hoofdstuk 9 Verbanden, correlatie en regressie
Meten bij marktonderzoek
Meten bij marktonderzoek
Hoofdstuk 9 Primaire kwantitatieve gegevens verzamelen met behulp van gestructureerde waarneming, gestructureerd interviewen en het gebruik van vragenlijsten.
Toetsen als Leerinterventie. Samenvatten in het Testing Effect Paradigma. Kim J. H. Dirkx, Liesbeth Kester, Paul A. Kirschner CELSTEC, Open Universiteit.
De Fundamenten van Individueel Gedrag
Afdeling Revalidatiegeneeskunde
Enquête.
Collegeweek 3 Observeren
Hoofdstuk 4 – Gegevens analyseren
Interpretatie van statistiek bij toetsen en toetsvragen
Varianties bij replicatie (herhaald testen)
Item analyse Item-Moeilijkheidsindex Item-Betrouwbaarheidsindex
Validiteit.
Test- retest methode -- voorbeeld r = 0, Test Hertest r = 0, Test Hertest r = 1,00.
Psychologische Test.
Kirti Zeijlmans MSc Rijksuniversiteit Groningen Voor meer informatie:
1 Amsterdam, april 2005 Drs. Frits Spangenberg Rotary Extern imago.
Centrummaten en Boxplot
Professioneel persoonlijkheidsprofiel
Hoofdstuk X Het correlatievraagstuk & SPSS toepassing
Doel onderzoek : ALGEMEEN : De kwaliteit van leven in de verschillende zorggroepen. Is er een verband tussen : veranderingen in fysieke, psychische en.
Operationaliseren Definiëren Operationaliseren
1 Week /03/ is gestart in mineur De voorspellingen van alle groten der aarden dat de beurzen zouden stijgen is omgekeerd uitgedraaid.
Het leren in BS 2 gebaseerd op de leertheorie: het behaviorisme
Vragenlijst groepje 3 Wiki.
Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day.
Gerald Riedstra STOEIEN TUSSEN VADER EN KIND Onderzoek naar de psychometrische kwaliteiten van de Nederlandse versie van Rough and Tumble Play-Quality.
Kijken naar Kinderen Week 4
Methoden & Technieken van Onderzoek
Methoden & Technieken van Onderzoek
Module Waarnemen, observeren en rapporteren Les 2
onderzoeksvraag Soorten onderzoeksvragen Exploratieve onderzoeksvraag
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Rotterdam, 00 januari 2007 Onderzoek I Bijeenkomst 3 kwartaal 2.
Rotterdam, 00 januari 2007 Onderzoek I Bijeenkomst 2 kwartaal 2.
Methoden & Technieken van Onderzoek
Plancyclus, les 4  Actualiteit  Vragen naar aanleiding van vorige les  Vragen over hoofdstuk 4 en 5  Observeren met een plan; het verschil tussen observeren.
Leraareffectiviteit – wat weten we (niet)? Daniel Muijs, University of Southampton.
Begin- situatie Werk- vormen Leer- processen Leer- middelen Leerstof Evaluatie Leerdoelen.
Welke veranderprocessen spelen nu binnen de LVNL of komen eraan?
Het forum.
Methodiek Observeren.
Leskwaliteit: wat is het en hoe meet en verbeter je het
Belevingsthermometer: wat kun je er (niet) mee
Transcript van de presentatie:

College 3 Meten

Meten Methode van meten Kwaliteit van de meting Interview Observatie Vragenlijst Test Observatie Kwaliteit van de meting Validiteit Inhouds - Criterium - Construct - Betrouwbaarheid Test-hertest - Interne consistentie - Inter-beoordelaars -

Vragenlijsten Rare factoren die de antwoorden beïnvloeden

Methode van vragen Vraag: “Voel je je wel eens eenzaam?” Interview: 80% ja Vragenlijst: 43% ja

Volgorde van vragen Vraag A: Geef een rapportcijfer voor de colleges Vraag B: Geef een rapportcijfer voor de syllabus Helft van de studenten versie AB Helft van de studenten versie BA

Richting van de vraag Positief: “Dit boek is goed gestructureerd” Negatief: “Dit boek is niet goed gestructureerd” Op een 7-puntsschaal (1 = zeer oneens, …, 7 = zeer eens) Positieve versie, gespiegeld: m = 2.55 Negatieve versie: m = 4.09

Antwoord-categorieën Vraag: Was u tevreden met de blokvorm? Versie A Versie B Ja 52,6% 26,5% Nee 26,3% 73,5% Geen mening 21,1%

Antwoordtendenties Neiging om een bepaal antwoord te geven, ongeacht de inhoud van de vraag. Item Alternatieven % I ja onzeker nee 60 16 24 II 1 2 3 4 11 27 48 14

Item Alternatieven % III zeer tevreden tevreden Ontevreden zeer ontevreden 24 45 16 15 IV eerste tweede derde 41 36 23

“Probeer zo snel en nauwkeurig mogelijk te antwoorden” Instructie “Probeer zo snel en nauwkeurig mogelijk te antwoorden”

Conclusie We weten niet hoe mensen vragen beantwoorden. Rare factoren die meespelen: Methode Volgorde Richting Antwoordalternatieven Antwoordtendenties Instructie

Observatie Problemen: Wat moet je observeren? Hoe moet je observeren? Hoe moet je beschrijven? Hoe moet je interpreteren?

Voorbeeld: Ekman & Friesen, 1978 Een mens kan ± 5000 verschillende gelaatsexpressies maken. Video, slow-motion Nummers Betekenis opmaken uit de context.

A B C D E F

Emotie Foto nr. Walging = Boosheid = Vreugde = Angst = Bedroefdheid = Verbazing = Foto nr. C E F A D B

Observatoren Methode Responsies Gedrags-eenheden Combinaties natuurlijk - toegewezen getraind - ongetraind menselijk - automatisch passief - participerend verborgen - waarneembaar een – meerdere Methode direct – retrospectief Time sampling - event sampling Responsies frequentie - duur - intensiteit ratings - exacte categorieën dichotoom - polytoom – open neutrale categorie - geen neutrale unipolair – bipolair Gedrags-eenheden stimulus & response - response only structureel - functioneel - causaal moleculair - molair geobserveerd – geïnfereerd exploratief - gededuceerd eenvoudig - complex natuurlijk - reductionistisch positief – negatief Combinaties representatief - niet representatief veel – weinig items één - meer dimensies

CRITERIUM VALIDITEIT Hoe goed kan de test de scores op een gekozen criterium variabele voorspellen? Belangrijkste ondervorm: Predictieve validiteit, het criterium ligt in de toekomst. De criterium-variabele moet al goed gemeten zijn

Voorbeeld criterium validiteit Diagnosis Predicted Total Schizophrenia Depression 11 4 15 12 16 74,2% correct voorspeld

Test = SPQ Criterium = diagnose (schizofreen / depressief) correct "voorspeld" = 74.2% (zonder kennis kun je al 50% correct voorspellen) Is de SPQ hierom een goede of een slechte test? Zijn de diagnoses zelf wel valide?

INHOUDS VALIDITEIT Zijn de items een evenwichtige afspiegeling van het soort items dat de test zou mogen bevatten? Om de inhouds validiteit te bepalen hoeft de test niet te worden afgenomen bij proefpersonen. Je hoeft alleen te weten hoe hij geconstrueerd is. Leunstoel validiteit. Vergelijk: Het kopen van een auto omdat hij er op de tekentafel zo goed uit ziet.

Voorbeeld inhoudsvaliditeit Test = statistiek tentamen standaard- vs. inzichts-vragen kennis- vs. redeneer-vragen reken- vs. visualiseer-vragen theorie- vs. praktijk-vragen makkelijke vs. moeilijke vragen

CONSTRUCT VALIDITEIT In hoeverre begrijp je door welke variabelen de testscores worden beïnvloed op welke variabelen de testscores invloed hebben?

APA: Daar moet je een theorie (nomologisch netwerk) voor hebben APA: Daar moet je een theorie (nomologisch netwerk) voor hebben. De theorie moet zijn getoetst. Nomologisch netwerk: Geeft aan welke wetmatige relaties de diverse constructen met elkaar hebben. De meeste constructen (begrippen) die men wil meten zijn theoretische constructen (niet-waarneembaar). Zo'n construct kun je definiëren door middel van een nomologisch netwerk.

Voorbeeld construct validiteit

Voorbeeld construct validiteit Bij construct validiteit wordt de betekenis van het construct niet afgeleid uit de naam van de test, maar uit de vele verbanden met andere variabelen. Hoe meer verbanden je kent, hoe beter je begrijpt wat er gemeten wordt.

Criterium validiteit één correlatie moet zo hoog mogelijk zijn geen theorie nodig gericht op voorspellen hoge betrouwbaarheid nodig keuze van het criterium is moeilijk Construct validiteit meerdere verbanden moeten sterk of juist zwak zijn gebaseerd op theorie gericht op begrijpen geen hoge betrouwbaarheid nodig formuleren van de theorie is moeilijk