Notatie voor tekenen van modellen

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Startbijeenkomst Leren Leren in een professionele oefencultuur
Basisboek Interviewen 3e druk 2012
Onderzoek naar competentiegericht beoordelen in het groene onderwijs
Samen bouwen aan zelfvertrouwen
Keuzekompas voor meisjes en bèta/techniek Zelfbeeld, omgeving en kennis van bèta/technische opleidingen VHTO Cristien van Dijk Landelijk expertisebureau.
1 Neemt de kennis van onze studenten toe? Een analyse van de kennisgroei op basis van VGT scores Marieke van Onna & Samantha Bouwmeester.
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Help! Statistiek! Doorlopende serie laagdrempelige lezingen,
SAMEN AAN ZET Opbrengstgericht werken voor docenten.
SAMEN AAN ZET Workshop voor leidinggevenden én docenten.
Hoofdstuk 3 – Gegevens verzamelen
Hok Kwan Kan Primary supervisor: dr. Katrien Antonio
Studie en opleiding Vrije tijd Groei en gezondheid Relaties
Beschrijvende en inferentiële statistiek
Toetsen en leerlijnen in nieuwe scheikunde
Jan Talmon Medische Informatica Universiteit Maastricht
Maarten Vansteenkiste Universiteit Gent
Het belang van een evidence based benadering in het onderwijs
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking
Chapter 9. Understanding Multivariate Techniques
Meervoudige lineaire regressie
Inferentie voor regressie
Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.
Acceptatie en Commitment Therapie Ouderen
Hoofdstuk 9 Verbanden, correlatie en regressie
Voorspellende analyse
Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.
variabelen vaststellen
Populatiegemiddelden: recap
Statistiek voor Historici
The relevance of recall and precision in user evaluation Louise T. Su Journal of the American Society of Information Science 1994.
Onderzoek gefinancierd door de Vlaamse Regering in het kader van het programma ‘Steunpunten voor Beleidsrelevant Onderzoek’
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
Welkom op onze thema-avond
Academische vaardigheden - C1.5
Natuurwetenschappelijk verslag
Toetsen & Toetsen 16 november Toetsen & Beoordelen Na deze ochtend 1- Weet je wat een effectieve en gefundeerde toetsconstructie is 2- Weet je.
Partiële r² Predictie van y gebaseerd op z alleen
Workshop Werken met een P.O.P. vrijdag 26 september 2014
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Kwantitatieve & kwalitatieve data analyse
Visie & Strategie.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Baarde en de goede Hoofdstuk 11: Data-analyse
Cursus Regressie-analyse Rijkswaterstaat, 13 februari
Kijkje in the Classroom Een andere kijk op (hoger) onderwijs: Het huiswerk samen maken in de klas en het bestuderen van de theorie met ICT buiten de les.
Is dit onderzoek belangrijk? Is dit onderzoek onbelangrijk?
PSO. Praktisch school onderzoek.
Paramaribo, september 2015 Ten behoeve van leerkrachten van de EBGS Mr.dr.E. Marshall & M. Day.
Loopbaan oriëntatie en begeleiding
Onderzoeksvaardigheden 3
De oplossing De aannemelijke oplossing van het dilemma, wat ga je testen?
Slc kwartaal 3. programma Hoe is het gegaan Verwachtingen Tips and tricks Opdrachten slc.
Latent class growth analysis als succesvolle methode om subgroepen te identificeren binnen een gewichtsreductie interventie. Bastiaan C. de Vos¹, MD,
Plancyclus, les 4  Actualiteit  Vragen naar aanleiding van vorige les  Vragen over hoofdstuk 4 en 5  Observeren met een plan; het verschil tussen observeren.
Leraareffectiviteit – wat weten we (niet)? Daniel Muijs, University of Southampton.
Profilering Design MBO. “Ik ben op aarde om een omgeving vol liefde te creëren, met passie te leven en mijn meest opwindende dromen waar te maken”
Didactiek rondom practicumverslagen: Inhouden, werkvormen en materialen voor de lerarenopleidingen Gerald van Dijk, Hogeschool Utrecht W. Kuiper, H. Eijkelhof,
Naar een leerlijn ‘onderzoekende houding’ ECENT conferentie, 5 juni 2009 Ton van der Valk, Universiteit Utrecht FIsme; Junior College Utrecht.
Evaluatieonderzoek VVTO Engels Kees de Bot Sieneke Goorhuis BCN/RUG.
Marktonderzoek © 2011 | Noordhoff Uitgevers bv College 2 Hoofdstuk 3 Hoofdstuk 4.
Hebben fysieke activiteit en gewichtsverlies een effect op meniscus extrusie? J Runhaar, JH Waarsing, SMA Bierma-Zeinstra Erasmus MC Afdeling Huisartsgeneeskunde.
Illustratie mogelijke redenen lage ICC’s in multilevel modellen bij de CQI Peter Moorer ARGO Rijksuniversiteit Groningen BV © ARGO – april 2009.
Welk schoolklimaat bevordert gelijke onderwijskansen
Gemeenschaps- en systeemecologie (Ba3) Werkcollege Diversiteitsindices
METHODESCHOLEN IN HET VLAAMSE BASISONDERWIJS Sessie 4
Toetsen van verschillen tussen twee of meer groepen
Voorspellende analyse
Transcript van de presentatie:

Start To R Structurele Vergelijkings Modellen Liesje Coertjens Sven De Maeyer Starten met Research Club Multi-level

Notatie voor tekenen van modellen Een manifeste variabele Een latente variabele Een causale relatie Meetfouten bij latente variabelen Meetfouten bij manifeste variabelen Correlatie tussen variabelen

Teken de onderzoeksvragen Heeft klasgrootte een effect op leerlingprestaties via zijn invloed op taakgerichte interacties? Heeft moedertaal (‘Nederlands’, ‘Andere dan Nederlands’) een invloed op schoolse taalvaardigheid (score op taaltoets) en aldus op wiskundige prestaties (score op een centrale wiskundetoets)? Hebben intrinsieke motivatie en SES een invloed op tevredenheid over de opleiding via hun effect op ‘bewuste keuze voor opleiding’ (schaalscore)

Regressie versus padanalyse Regressie Padanalyse Rechtstreekse effecten rechtstreekse & onrechtstreekse intermediaire of tussenliggende var afhankelijke, endogene, onafhankelijke & error exogene & error X-en onafhankelijk samenhang

Herbekijk de schema’s vd onderzoeksvragen Benoem de variabelen (endogene & exogene) Voeg errors toe Voeg samenhang toe waar nodig en logisch Zet een * bij elke schatting die je van R verwacht

Hoe padmodellen testen? Hiervoor doen we beroep op SEM = Structural Equation Modeling Of “Structurele vergelijkingen” = analysetechniek die toelaat om verschillende soorten theoretische modellen te toetsen

Padmodel in R Via pakket Lavaan -> installeren & actief maken Model1<-‘y~x1+x3 x3~x4+x5' Fit_Model1<-sem(Model1,data=Data) summary(Fit_Model1,fit.measures=TRUE,standardized=TRUE) OPM doet R moeilijk bij ‘t laden van lavaan, installeer nieuwste R-versie

Padanalyse in R Wat wordt er geschat in lavaan? Ses Motivatie Tevreden 3 regressiegewichten; errorvariantie in afh. variabele. => 4 te schatten parameters Ses Motivatie Tevreden Kiezen

Padanalyse in R Wat wordt er geschat in lavaan? 3 regressiegewichten; errorvariantie in afh. variabele. Exogene variabelen worden niet gemodelleerd Ses Motivatie Tevreden Kiezen Dit is in tegenstelling tot wat “traditioneel” wel in SEM gedaan wordt.

Padanalyse in R Hoe wel traditioneel? Ses Motivatie Tevreden Kiezen 3 regressiegewichten; Errorvariantie 3 varianties in onafhankelijke variabelen 3 covarianties tussen onafhankelijke variabelen =>10 te schatten parameters Ses Motivatie Tevreden Kiezen

Padanalyse in R Hoe wel traditioneel? Ses Motivatie Tevreden Kiezen 3 regressiegewichten; Errorvariantie 3 varianties in onafhankelijke variabelen 3 covarianties tussen onafhankelijke variabelen =>10 te schatten parameters Ses Motivatie Tevreden Kiezen - We opteren voor laatste optie, wegens meer flexibel om hyptoheses te toetsen.

Syntax van lavaan Soorten parameters: regressiegewichten correlaties tussen onafhankelijke variabelen variantie van onafhankelijke of afhankelijke variabele

Syntax lavaan Ses Motivatie Tevreden Kiezen Model1<-'Tevreden ~ Kiezen+Ses+Motivatie Ses~~Motivatie Ses~~Kiezen Motivatie~~Kiezen’ Model1<-sem(Model1,data=Tevredenopleiding,fixed.x=FALSE)

Syntax lavaan Ses Motivatie Tevreden Kiezen Keuze voor optie 2 in lavaan: 10 parameters schatten Model1<-'Tevreden ~ Kiezen+Ses+Motivatie Ses~~Motivatie Ses~~Kiezen Motivatie~~Kiezen’ Model1<-sem(Model1,data=Tevredenopleiding,fixed.x=FALSE)

Syntax lavaan: parameters “fixeren” op nul! Ses Motivatie Tevreden Kiezen Model1<-'Tevreden ~ Kiezen+Ses+Motivatie Ses~~Motivatie Ses~~0*Kiezen Motivatie~~Kiezen’ Model1<-sem(Model1,data=Tevredenopleiding,fixed.x=FALSE)

Voorbeeld Hebben intrinsieke motivatie en SES een invloed op tevredenheid over de opleiding via hun effect op ‘bewuste keuze voor opleiding’ Tevredenopleiding.Rdata Model1<-'Tevreden~Kiezen Kiezen~Ses+Motivatie' Fit_Model1<-sem(Model1,data=Tevredenopleiding,fixed.x=FALSE) summary(Fit_Model1,fit.measures=TRUE,standardized=TRUE)

Number of observations 500 Estimator ML Minimum Function Chi-square 3 Number of observations 500 Estimator ML Minimum Function Chi-square 3.267 Degrees of freedom 2 P-value 0.195 Parameter estimates: Information Expected Standard Errors Standard Estimate Std.err Z-value P(>|z|) Regressions: Tevreden ~ Kiezen 0.346 0.033 10.580 0.000 Kiezen ~ Ses 0.363 0.039 9.331 0.000 Motivatie 0.545 0.042 12.994 0.000 Covariances: Ses ~~ Motivatie -0.294 0.479 -0.613 0.540 Variances: Tevreden 6.997 0.442 Kiezen 8.726 0.552 Ses 11.549 0.730 Motivatie 9.920 0.627

Padmodel visueel voorstellen Via pakket qgraph -> installeren & actief maken qgraph.lavaan(Fit_Model1, layout="circle", vsize.man=5, vsize.lat=10, filetype="", include=3, curve=-0.4, edge.label.cex=0.6) Wil je geen parameterschattingen? Include=1

Voorbeeld Je leest een nieuw artikel waarin wordt beweerd dat Motivatie en Ses niet horen samen te hangen. Neem deze nieuwe informatie mee in het model. Wat is jouw mening op basis van de data? Model2<-'Tevreden~Kiezen Kiezen~Ses+Motivatie Ses~~0*Motivatie’

Estimator ML Minimum Function Chi-square 3 Estimator ML Minimum Function Chi-square 3.644 Degrees of freedom 3 P-value 0.303 Parameter estimates: Information Expected Standard Errors Standard Estimate Std.err Z-value P(>|z|) Regressions: Tevreden ~ Kiezen 0.346 0.033 10.627 0.000 Kiezen ~ Ses 0.363 0.039 9.335 0.000 Motivatie 0.545 0.042 12.999 0.000 Covariances: Ses ~~ Motivatie 0.000 Variances: Tevreden 6.997 0.442 Kiezen 8.726 0.552 Ses 11.549 0.730 Motivatie 9.920 0.627

 WallonieC4.RData We zijn geïnteresseerd in het voorspellen van vertrouwen in politieke instellingen (VertrouwenZ) door Klasklimaat (KlasklimZ) en Kennis over politieke instellingen (KennisZ). Vanuit de literatuur weten we dat Kennis wordt bepaald door SesZ, cultureel kapitaal (CultkapZ) en geslacht. Heeft kennis meer invloed op vertrouwen in politieke instellingen dan Klasklimaat? Stel het padmodel voor met de juiste schattingen bij elke pijl.

Hoe goed is het model? Hoe goed is het model an sich? Hoe goed is het model in vergelijking met een ander model? Genest (of voortbouwende) modellen (~ 1 blokje erbij) Niet-voortbouwende modellen

 Stel 3 kenmerken gemeten bij 5 respondenten + een theorie die zegt dat kenmerk C een functie is van kenmerken A en B: C=A+0,5*B. Hoe zou jij deze theorie intuïtief testen?

Werkwijze SEM Vastgestelde waarden worden vergeleken met verwachte waarden volgens het theoretische model (cfr. kruistabellen) NIET individuele scores zoals bij regressie: voorspelde score tov. geobserveerde score WEL de variantie-covariantiematrix tussen variabelen voorspelde matrix (S) tov. geobserveerde matrix (S)

V1 V3 V4 V2

Var(v1) S= Cov(v2,v1) var(v2) S= Cov(v3,v1) cov(v3,v2) var(v3) Cov(v4,v1) cov(v4,v2) cov(v4,v3) var(v4)   S= Cov(v2,v1) var(v2) Cov(v3,v1) cov(v3,v2) var(v3) S=

V1 V3 V4 V2

Var(v1) S= Cov(v2,v1) var(v2) S= Cov(v3,v1) cov(v3,v2) var(v3) Cov(v4,v1) cov(v4,v2) cov(v4,v3) var(v4)   S= Cov(v2,v1) var(v2) Cov(v3,v1) cov(v3,v2) var(v3) S=

SEM Elk element van de covariantiematrix S kan worden uitgedrukt als een functie van de parameters uit het model  een theoretisch model veronderstelt een zekere structuur in de covariantiematrix S  op basis van het model kunnen we deze covariantiematrix schatten = geschatte S = S

Hoe wordt SEM geschat? Stapsgewijs (iteratief) proces: Willekeurige startwaarden voor de verschillende parameters; S wordt berekend S wordt vergeleken met S Parameterschattingen worden aangepast zodanig dat verschil tussen S en S verkleint Dit wordt herhaald tot het verschil tussen S en S niet meer kleiner is te krijgen  Verschil tussen S en S wordt uitgedrukt door een fit functie

Hoe weten we of S sterk afwijkt van S? = vraag of het model bij de data past goodness-of-fit indices (indicatieve cijfers die aangeven in hoeverre het model goed bij de data past)

Voorbeeld Hebben intrinsieke motivatie en SES een invloed op tevredenheid over de opleiding via hun effect op ‘bewuste keuze voor opleiding’ Tevredenopleiding.Rdata Model1<-'Tevreden~Kiezen Kiezen~Ses+Motivatie' Fit_Model1<-sem(Model1,data=Tevredenopleiding,fixed.x=FALSE) summary(Fit_Model1,fit.measures=TRUE,standardized=TRUE)

Hoe weten we of S sterk afwijkt van S? = vraag of het model bij de data past goodness-of-fit indices (indicatieve cijfers die aangeven in hoeverre het model goed bij de data past)

Chi-kwadraat toets Elk SEM model heeft een bepaalde Chi-kwadraat waarde en een aantal vrijheidsgraden Hoe werkt de toets? Voor elke combinatie van Chi² met vrijheidsgraden bestaat er een p-waarde (kans) Deze kans kan in SEM als volgt geïnterpreteerd worden: de kans dat je zo’n Chi² waarde tegenkomt indien je model perfect fit met de data => indien p te laag : ? => indien p hoog : ?

Beschrijvende fit indices Chi² is afhankelijk van steekproefgrootte -> statistici hebben andere beschrijvende fit indices ontwikkeld: CFI (comparative fit index)>0,95 LOGICA: analoog aan R² in regressie, ze kunnen waarde aannemen tussen 0 en 1 en hoe dichter tegen 1 hoe beter het model de verschillen verklaard Vuistregel: goed model CFI>0,95 Zouden we dit niet verhogen naar ,95? OPM GFI en AGFI weggelaten want staan niet in R-output

Alternatieve fit index: RMSEA RMSEA <= 0,05 wijst op een goed model!! RMSEA tussen 0,05 en 0,08: aanvaardbaar

Voorbeeld Number of observations 500 Estimator ML Minimum Function Chi-square 3.267 Degrees of freedom 2 P-value 0.195 Chi-square test baseline model: Minimum Function Chi-square 306.652 Degrees of freedom 5 P-value 0.000 Full model versus baseline model: Comparative Fit Index (CFI) 0.996 Tucker-Lewis Index (TLI) 0.989

Voorbeeld Loglikelihood and Information Criteria: Loglikelihood user model (H0) -5050.897 Loglikelihood unrestricted model (H1) -5049.263 Number of free parameters 5 Akaike (AIC) 10111.793 Bayesian (BIC) 10132.866 Sample-size adjusted Bayesian (BIC) 10116.996 Root Mean Square Error of Approximation: RMSEA 0.036 90 Percent Confidence Interval 0.000 0.103 P-value RMSEA <= 0.05 0.536 Standardized Root Mean Square Residual: SRMR 0.021

 WallonieC4.RData We zijn geïnteresseerd in het voorspellen van vertrouwen in politieke instellingen (VertrouwZ) door Klasklimaat (KlasklimZ) en Kennis over politieke instellingen (KennisZ). Vanuit de literatuur weten we dat Kennis wordt bepaald door SesZ, cultureel kapitaal (CultkapZ). Hoe goed is het model? Lavaan (0.4-10) converged normally after 13 iterations Used Total Number of observations 1825 2076 Estimator ML Minimum Function Chi-square 97.202 Degrees of freedom 4 P-value 0.000 Chi-square test baseline model: Minimum Function Chi-square 656.550 Degrees of freedom 9 Full model versus baseline model: Comparative Fit Index (CFI) 0.856 Tucker-Lewis Index (TLI) 0.676 Loglikelihood and Information Criteria: Loglikelihood user model (H0) -13434.057 Loglikelihood unrestricted model (H1) -13385.456 Number of free parameters 7 Akaike (AIC) 26882.114 Bayesian (BIC) 26920.680 Sample-size adjusted Bayesian (BIC) 26898.441 Root Mean Square Error of Approximation: RMSEA 0.113 90 Percent Confidence Interval 0.094 0.133 P-value RMSEA <= 0.05 0.000 Standardized Root Mean Square Residual: SRMR 0.045

Hoe goed is het model? Hoe goed is het model an sich? Hoe goed is het model in vergelijking met een ander model? Opmerking: enkel an sich goede modellen vergelijken! Genest (of voortbouwende) modellen (1 blokje erbij) Niet-voortbouwende modellen

Geneste modellen Model 1 Model 2 V1 V3 V4 V2 V1 V3 V4 V2

Fit index om geneste modellen te vergelijken Verschil in Chi² én verschil in df tesamen nagaan op de chi²-verdeling anova(Fit_Model1,Fit_Model2,test="Chi") Beter indien p>.05 Akaike’s Information Criteria (AIC) =>Hoe lager de AIC hoe beter het model de verschillen in de gegevens beschrijft => model met laagste AIC is het interessantste Precies geen verschillen in df!

Niet-geneste modellen V1 V3 V4 V2 V1 V3 V4 V5

Fit index om niet-geneste modellen te vergelijken Akaike’s Information Criteria (AIC) =>Hoe lager de AIC hoe beter het model de verschillen in de gegevens beschrijft => model met laagste AIC is het interessantste Precies geen verschillen in df!

Voorbeeld Heeft Ses ook een directe invloed op tevredenheid over de opleiding, naast zijn indirect effect via ‘bewuste keuze voor opleiding’ Tevredenopleiding.Rdata Model2<-'Tevreden~Kiezen+Ses Kiezen~Ses+Motivatie' Fit_Model2<-sem(Model2,data=Tevredenopleiding,fixed.x=FALSE) summary(Fit_Model2,fit.measures=TRUE,standardized=TRUE)

Voorbeeld anova(Fit_Model1,Fit_Model2,test="Chi") Chi Square Difference Test Df AIC BIC Chisq Chisq diff Df diff Pr(>Chisq) Fit_Model2 1 10111 10136 0.1115 Fit_Model1 2 10112 10133 3.2673 3.1558 1 0.07566 . --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

 WallonieC4 We zijn geïnteresseerd in het voorspellen van vertrouwen in politieke instellingen (VertrouwZ) door Klasklimaat (KlasklimZ) en Kennis over politieke instellingen (KennisZ). Vanuit de literatuur weten we dat Kennis wordt bepaald door SesZ, cultureel kapitaal (CultkapZ). + Mogelijk zijn KlasklimZ en KennisZ onderling ook gecorreleerd. Neem dat mee op en vergelijk dit nieuwe model met het vorige Lavaan (0.4-10) converged normally after 13 iterations Used Total Number of observations 1825 2076 Estimator ML Minimum Function Chi-square 97.202 Degrees of freedom 4 P-value 0.000 Chi-square test baseline model: Minimum Function Chi-square 656.550 Degrees of freedom 9 Full model versus baseline model: Comparative Fit Index (CFI) 0.856 Tucker-Lewis Index (TLI) 0.676 Loglikelihood and Information Criteria: Loglikelihood user model (H0) -13434.057 Loglikelihood unrestricted model (H1) -13385.456 Number of free parameters 7 Akaike (AIC) 26882.114 Bayesian (BIC) 26920.680 Sample-size adjusted Bayesian (BIC) 26898.441 Root Mean Square Error of Approximation: RMSEA 0.113 90 Percent Confidence Interval 0.094 0.133 P-value RMSEA <= 0.05 0.000 Standardized Root Mean Square Residual: SRMR 0.045

CFA

Meervoudige metingen omdat ik er graag mee bezig ben. Ik geef les in een anderstalige context … omdat ik er graag mee bezig ben. omdat anderen dit van mij verwachten. omdat ik het erg boeiend vind. opdat anderen me vaardig zouden vinden. omdat ik nieuwe zaken wil leren. omdat anderen (collega’s/school/directie) mij daartoe verplichten. omdat het me erg interesseert. omdat ik me schuldig voel als ik het niet doe. omdat ik het leuk vind om met anderstalige leerlingen te werken. omdat ik wil dat anderen me een goede leerkracht vinden. omdat ik me beschaamd voel als ik het niet doe. omdat ik ervoor kies om met anderstalige leerlingen te werken. omdat dit voor mij persoonlijk een belangrijke doelstelling is. omdat ik dit zelf erg waardevol vind om te doen. ik weet niet waarom, ik zie niet welk verschil dit uitmaakt.

Zelfdeterminatie Theorie Intrinsiek: 1 + 3 + 7 + 9 Identificatie: 5 + 12 + 13 + 14 Introjectie: 4 + 8 + 10 + 11 Externe: 2 + 6 Amotivatie: 15

Manifeste en latente variabelen Intrinsieke motivatie = niet direct waarneembaar en vertaalbaar in een betrouwbaar cijfer = LATENTE VARIABELE Wel kunnen we beroep doen op ‘indicatoren’ van intrinsieke motivatie (hier motiverende aspecten) die wel rechtstreeks meetbaar zijn = MANIFESTE VARIABELEN

Theoriegedreven vs. datagedreven We deden beroep op je persoonlijke theorie over ‘motivatie’ = theoriegedreven wijze om latente variabelen te onderscheiden PCA en EFA daarentegen zijn datagedreven: op basis van aanwezige samenhang in de data ga je op zoek naar onderliggende componenten (latente variabelen)

3 verschillende statistische modellen DATA = STAT.MODEL (+ RESIDUEEL) Principale componenten analyse (PCA)  frequent gehanteerd Exploratieve factoranalyse (EFA)  minder frequent gehanteerd Confirmatieve factoranalyse (CFA)  wordt meer en meer gehanteerd

Het PCA-model: Kenmerkend: Elke manifeste variabele een lading op elke component Geen relatie tussen de componenten Geen meetfouten (zie later) Aantal componenten even groot als aantal variabelen v1 v2 v3 v4 v5 v6 v7 v8 C1 C2

Het EFA model wijkt hiervan af: Kenmerkend: Elke manifeste variabele een lading op elke factor Geen relatie tussen de componenten WEL meetfouten Aantal factoren < aantal variabelen v1 v2 v3 v4 v5 v6 v7 v8 F1 F2

 Mot5 omdat ik nieuwe zaken wil leren Hoe zou jij de volgende theoretische indeling in een figuur vertalen? intrinsieke motivatie: Mot1 omdat ik er graag mee bezig ben. Mot3 omdat ik het erg boeiend vind. Mot7 omdat het me erg interesseert. Mot9 omdat ik het leuk vind om met anderstalige leerlingen te werken. identificatie: Mot5 omdat ik nieuwe zaken wil leren Mot12 omdat ik ervoor kies om met anderstalige leerlingen te werken. Mot13 omdat dit voor mij persoonlijk een belangrijke doelstelling is. Mot14 omdat ik dit zelf erg waardevol vind om te doen.

CFA model: Kenmerkend: NIET elke manifeste variabele een lading op elke factor WEL relatie tussen de componenten WEL meetfouten

CFA model: De asterixen verwijzen naar de te schatten parameters * De asterixen verwijzen naar de te schatten parameters Parameters = die delen van het model die nog ongekend zijn voor de onderzoeker Hier: - meetfouten, - factorladingen, - correlaties tussen factoren, - variantie van factoren, …

Wanneer CFA toepassen? Om constructvaliditeit na te gaan: Meet een instrument wel degelijk wat het behoort te meten volgens de theorie?  Noodzaak tot theorie om CFA toe te passen Theorie kan in minimale wijze ook een persoonlijke veronderstelling van de onderzoeker zijn, op basis van de inhoud van de vragen CFA ook gebruikt om alternatieve modellen te vergelijken of zelfs om modellen te genereren

Structurele vergelijkingen v1 = l1 F1 + E1 v2 = l2 F1 + E2 v3 = l3 F1 + E1 v4 = l4 F1 + E4 v5 = l5 F2 + E5 v6 = l6 F2 + E6 v7 = l7 F2 + E7 v8 = l8 F2 + E8 v1 v2 v3 v4 v5 v6 v7 v8 F1 F2 * E1 * E2 * E3 * E4 * E5 * E6 * E7 * E8 *

x1 x2 x3 x4 x5 x6 x7 x8 F1 F2 * E1 * E2 * E3 * E4 * E5 * E6 * E7 * E8 *

x1 x2 x3 x4 x5 x6 x7 x8 F1 F2 * E1 * E2 * E3 * E4 * E5 * E6 * E7 * E8 *

CFA in R (lavaan) Syntax om model op te bouwen: Latente =~ Manifeste1 + Manifeste2 … zo definieer je de verschillende latente variabelen Manifeste1 ~~ Manifeste2 zo definieer je mogelijke errorcovarianties Schatten van het model: > Fit1<-cfa(Model1,data=data)

Voorbeeld > Model1<-'Intr=~Mot1+Mot3+Mot7+Mot9 + Iden=~Mot5+Mot12+Mot13+Mot14' > Fit1<-cfa(Model1,data=Taalonderwijs) De covariantie tussen de latente variabelen wordt via het cfa( ) commando altijd mee opgenomen om te schatten

> summary(Fit1,fit. measures=TRUE,standardized=TRUE) Lavaan (0 > summary(Fit1,fit.measures=TRUE,standardized=TRUE) Lavaan (0.4-9) converged normally after 30 iterations Used Total Number of observations 93 108 Estimator ML Minimum Function Chi-square 64.958 Degrees of freedom 19 P-value 0.000 Chi-square test baseline model: Minimum Function Chi-square 487.893 Degrees of freedom 28 Full model versus baseline model: Comparative Fit Index (CFI) 0.900 Tucker-Lewis Index (TLI) 0.853 Loglikelihood and Information Criteria: Loglikelihood user model (H0) -800.837 Loglikelihood unrestricted model (H1) -768.358 Number of free parameters 17 Akaike (AIC) 1635.675 Bayesian (BIC) 1678.729 Sample-size adjusted Bayesian (BIC) 1625.064 Root Mean Square Error of Approximation: RMSEA 0.161 90 Percent Confidence Interval 0.119 0.205 P-value RMSEA <= 0.05 0.000 Standardized Root Mean Square Residual: SRMR 0.069

Number of free parameters 17 Akaike (AIC) 1635.675 Bayesian (BIC) 1678.729 Sample-size adjusted Bayesian (BIC) 1625.064 Root Mean Square Error of Approximation: RMSEA 0.161 90 Percent Confidence Interval 0.119 0.205 P-value RMSEA <= 0.05 0.000 Standardized Root Mean Square Residual: SRMR 0.069

Parameter estimates: Information Expected Standard Errors Standard Estimate Std.err Z-value P(>|z|) Std.lv Std.all Latent variables: Intr =~ Mot1 1.000 0.672 0.786 Mot3 1.072 0.126 8.542 0.000 0.721 0.817 Mot7 1.080 0.125 8.665 0.000 0.726 0.826 Mot9 1.052 0.133 7.922 0.000 0.707 0.769 Iden =~ Mot5 1.000 0.624 0.733 Mot12 1.288 0.208 6.192 0.000 0.803 0.660 Mot13 1.160 0.188 6.174 0.000 0.724 0.659 Mot14 1.261 0.154 8.207 0.000 0.787 0.871 Covariances: Intr ~~ Iden 0.399 0.081 4.942 0.000 0.952 0.952

> qgraph. lavaan(Fit1,layout="tree", vsize. man=10, vsize > qgraph.lavaan(Fit1,layout="tree", vsize.man=10, vsize.lat=10, include=4, curve=0,titles=FALSE) Geeft gestandaardiseerde parameterschattingen

 - Schat een model met 1 latente variabele + maak grafiek Tv variabelen (dataset Taalonderwijs.Rdata) Tv27 Ik benut de dagelijkse routines en rituelen om gesprekjes aan te knopen Tv51 Ik creëer vanuit een concrete, functionele context kansen voor de kinderen om te experimenteren, om al doende te leren. Tv72 Ik stel vragen wanneer ik een onduidelijke boodschap van een kleuter niet begrijp. Tv81 Ik zorg ervoor dat het einddoel van mijn activiteiten motiverend en relevant is voor de kinderen. Tv111 Ik lok met mijn activiteiten en materialen vragen uit bij de kleuters. Tv126 Ik laat de kleuters voelen dat ik me persoonlijk bij hen betrokken voel. Tv135 Ik werk met motiverende en interessante activiteiten. Tv138 Ik geef extra instructie en ondersteuning aan kinderen die minder taalvaardig zijn.

Wat indien slechte model fit? Modification indices: Geeft per parameter die NIET geschat is, aan in welke mate de Chi2 zou dalen mocht die parameter toch geschat worden In R: > modindices(Model1_fit)

Voorbeeld > modindices(Fit1) lhs op rhs mi epc sepc.lv sepc.all 1 Intrinsiek =~ Mot1 NA NA NA NA 2 Intrinsiek =~ Mot3 0.000 0.000 0.000 0.000 3 Intrinsiek =~ Mot7 0.000 0.000 0.000 0.000 4 Intrinsiek =~ Mot9 0.000 0.000 0.000 0.000 5 Intrinsiek =~ Mot5 9.043 2.440 1.640 1.928 6 Intrinsiek =~ Mot12 0.334 -0.656 -0.441 -0.362 7 Intrinsiek =~ Mot13 1.619 -1.306 -0.878 -0.799 8 Intrinsiek =~ Mot14 1.808 -1.414 -0.950 -1.052 9 Identificatie =~ Mot1 0.730 0.648 0.404 0.473 10 Identificatie =~ Mot3 2.676 -1.286 -0.802 -0.909 11 Identificatie =~ Mot7 0.197 -0.349 -0.217 -0.247 12 Identificatie =~ Mot9 1.789 1.096 0.684 0.743 13 Identificatie =~ Mot5 NA NA NA NA 14 Identificatie =~ Mot12 0.000 0.000 0.000 0.000 15 Identificatie =~ Mot13 0.000 0.000 0.000 0.000

15 Identificatie =~ Mot13 0.000 0.000 0.000 0.000 16 Identificatie =~ Mot14 0.000 0.000 0.000 0.000 17 Mot1 ~~ Mot1 0.000 0.000 0.000 0.000 18 Mot1 ~~ Mot3 1.314 -0.042 -0.042 -0.056 19 Mot1 ~~ Mot7 0.471 0.025 0.025 0.033 20 Mot1 ~~ Mot9 0.300 -0.022 -0.022 -0.028 21 Mot1 ~~ Mot5 0.778 -0.033 -0.033 -0.045 22 Mot1 ~~ Mot12 0.565 0.043 0.043 0.041 23 Mot1 ~~ Mot13 1.034 0.053 0.053 0.056 24 Mot1 ~~ Mot14 0.162 0.014 0.014 0.018 25 Mot3 ~~ Mot3 0.000 0.000 0.000 0.000 26 Mot3 ~~ Mot7 3.090 0.065 0.065 0.084 27 Mot3 ~~ Mot9 1.371 0.047 0.047 0.058 28 Mot3 ~~ Mot5 6.531 0.095 0.095 0.126 29 Mot3 ~~ Mot12 0.936 -0.055 -0.055 -0.051 30 Mot3 ~~ Mot13 0.977 -0.051 -0.051 -0.052 31 Mot3 ~~ Mot14 4.883 -0.075 -0.075 -0.094 32 Mot7 ~~ Mot7 0.000 0.000 0.000 0.000 33 Mot7 ~~ Mot9 4.446 -0.084 -0.084 -0.103 34 Mot7 ~~ Mot5 7.421 0.099 0.099 0.133 35 Mot7 ~~ Mot12 5.909 -0.135 -0.135 -0.126 36 Mot7 ~~ Mot13 3.235 -0.091 -0.091 -0.094

37 Mot7 ~~ Mot14 0.040 0.007 0.007 0.008 38 Mot9 ~~ Mot9 0.000 0.000 0.000 0.000 39 Mot9 ~~ Mot5 2.794 -0.069 -0.069 -0.088 40 Mot9 ~~ Mot12 5.840 0.152 0.152 0.136 41 Mot9 ~~ Mot13 0.303 0.031 0.031 0.031 42 Mot9 ~~ Mot14 0.547 0.027 0.027 0.033 43 Mot5 ~~ Mot5 0.000 0.000 0.000 0.000 44 Mot5 ~~ Mot12 5.139 -0.142 -0.142 -0.137 45 Mot5 ~~ Mot13 12.963 -0.204 -0.204 -0.218 46 Mot5 ~~ Mot14 1.018 0.043 0.043 0.056 47 Mot12 ~~ Mot12 0.000 0.000 0.000 0.000 48 Mot12 ~~ Mot13 22.044 0.406 0.406 0.304 49 Mot12 ~~ Mot14 0.467 -0.041 -0.041 -0.037 50 Mot13 ~~ Mot13 0.000 0.000 0.000 0.000 51 Mot13 ~~ Mot14 1.066 0.056 0.056 0.056 52 Mot14 ~~ Mot14 0.000 0.000 0.000 0.000 53 Intrinsiek ~~ Intrinsiek 0.000 0.000 0.000 0.000 54 Intrinsiek ~~ Identificatie 0.000 0.000 0.000 0.000 55 Identificatie ~~ Identificatie 0.000 0.000 0.000 0.000

Conclusie: het opnemen van een errorcovariantie tusen mot12 en mot13 zou leiden tot een beter model! Mot12 omdat ik ervoor kies om met anderstalige leerlingen te werken. Mot13 omdat dit voor mij persoonlijk een belangrijke doelstelling is.

Voorbeeld > Model2<-'Intr=~Mot1+Mot3+Mot7+Mot9 + Iden=~Mot5+Mot12+Mot13+Mot14 + Mot12~~Mot13' > Fit2<-cfa(Model2,data=Taalonderwijs)

Conclusie: Model2 past significant beter bij de data > anova(Fit1,Fit2) Chi Square Difference Test Df AIC BIC Chisq Chisq diff Df diff Pr(>Chisq) Fit2 18 1614.5 1660.1 41.824 Fit1 19 1635.7 1678.7 64.958 23.134 1 1.511e-06 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Conclusie: Model2 past significant beter bij de data

 - Hoe kan een model met 1 latente variabele verbeterd worden Tv variabelen (dataset Taalonderwijs.Rdata) Tv27 Ik benut de dagelijkse routines en rituelen om gesprekjes aan te knopen Tv51 Ik creëer vanuit een concrete, functionele context kansen voor de kinderen om te experimenteren, om al doende te leren. Tv72 Ik stel vragen wanneer ik een onduidelijke boodschap van een kleuter niet begrijp. Tv81 Ik zorg ervoor dat het einddoel van mijn activiteiten motiverend en relevant is voor de kinderen. Tv111 Ik lok met mijn activiteiten en materialen vragen uit bij de kleuters. Tv126 Ik laat de kleuters voelen dat ik me persoonlijk bij hen betrokken voel. Tv135 Ik werk met motiverende en interessante activiteiten. Tv138 Ik geef extra instructie en ondersteuning aan kinderen die minder taalvaardig zijn.

Samengevat CFA om model-fit te schatten: past model bij de data? => fit indices: Chi², GFI, AGFI, NNFI, CFI, RMSEA CFA om modellen te vergelijken: AIC En hoe het model interpreteren? => interpreteren van parameterschattingen

STAPPENPLAN CFA Stel de verschillende theoretische modellen of het ene theoretische model vast Vertaal dit in een visualisatie Ga de fit na van de modellen (vergelijk ze, kies het beste (theoretisch en cijfermatig)) Beschrijf de fit van het beste model Beschrijf de inhoud van het beste model (parameterschattingen), wat zegt het

Andere SEM modellen: Padmodellen: allemaal manifeste variabelen Assumptie laten varen: latente variabelen modelleren = structurele regressiemodellen dus Latent Variable Analysis Of latente variabelen, maar nu ook de items onderliggend meenemen?

Andere SEM-modellen Structureel regressiemodel Schools welbevinden x1 x2 x3 zelfbeeld y1 y2 y3 Schools welbevinden

Andere SEM-modellen Structureel regressiemodel x1 x2 x3 Latente X y1 Latente Y Structureel model Meetmodel

Andere SEM-modellen Structureel padmodel Schools welbevinden zelfbeeld x1 x2 x3 zelfbeeld y1 y2 y3 Schools welbevinden prestaties

 Toets het volgende model en verbeter het eventueel: Identificatie Constructief Mot5 Mot12 Mot13 Mot14 Tv81 Tv111 Tv126 Tv135 Tv138