De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

1 Kwantitatieve & kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en Vervoer 1 maart 2007 Meetmodellen: Componenten en factoranalyse Dr.

Verwante presentaties


Presentatie over: "1 Kwantitatieve & kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en Vervoer 1 maart 2007 Meetmodellen: Componenten en factoranalyse Dr."— Transcript van de presentatie:

1 1 Kwantitatieve & kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en Vervoer 1 maart 2007 Meetmodellen: Componenten en factoranalyse Dr. M. Coenders

2 2 Componenten/factoranalyse Multidimensionele schaaltechniek Uitgangspunt: correlaties tussen manifeste variabelen Op zoek naar achterliggende gemeenschappelijke aspecten: –Latente variabelen –Dimensies, ofwel componenten of factoren Doel: 1.Inzicht in structuur van data 2.Schaalconstructie Datareductie: set variabelen samenvatten door –een beperkt aantal dimensies (en een goede interpretatie vinden voor deze latente eigenschappen), –met weinig informatieverlies

3 3 2-dimensionele latente structuur Indicatoren, Manifeste variabelen Latente eigenschap Dimensie 1 Item 1 Item 2 Item 3 Item 4 Item 5 Dimensie 2 Item 6 Item 8 Item 7

4 4 Principe van componenten / factoranalyse X oorspronkelijke datamatrix Component- of factormatrix Component- of factorscore matrix  C A In matrixalgebra: X = C x A T

5 5 Extractie van componenten of factoren Component / factor = lineaire combinatie van de oorspronkelijke variabelen, bijv. Componenten / factoren zodanig getrokken dat: 1)1 e component / factor extraheert zoveel mogelijk variantie van de oorspronkelijke variabelen (bevat zoveel mogelijk informatie van de oorspr. variabelen). 2 e component / factor verklaart zoveel mogelijk van de overgebleven variantie, enzovoort. Vandaar de term Principale Componenten Analyse of Principale Factor Analyse. 2)Componenten / Factoren staan (in beginfase) loodrecht op elkaar. (orthogonaliteit)

6 6 Geometrisch voorbeeld X3X3 X1X1 X2X2 Tacq (1991) p. 255 C3C3 C2C2 C1C1 X oorspronkelijke variabelen C componenten

7 7 Algebraïsch Componenten analyse Z = (gestandaardiseerde) oorspronkelijke variabele C = component a = componentlading

8 8 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

9 9 Items ter operationalisering van etnocentrisme (Socon 2000)

10 10 Stap 1: Correlatiematrix Niet-homogene correlatiematrix: duidt op 2 dimensies

11 11 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

12 12 Componenten- en factoranalyse ComponentenanalyseFactoranalyse z1z1 z2z2 z3z3 z4z4 z5z5 C1C1 C2C2 a 52 a 11 z1z1 z2z2 z3z3 z4z4 z5z5 F1F1 F2F2 a 52 a 11 U1U1 U2U2 U3U3 U4U4 U5U5 z = gestandaardiseerde variabele C = component a = component- of factorlading F = gemeenschappelijke (common) factor U = unieke factor

13 13 Stap 2: Componenten- of factoranalyse? Assumpties voor U: -U’s onderling ongecorreleerd -U en F ongecorreleerd Principale Componenten Analyse de gehele variantie van alle items kan volledig verklaard worden door de andere variabelen in het model Principale Factor Analyse de variantie van elk item kan niet volledig verklaard worden door de andere variabelen in het model; elk item heeft een uniek deel

14 14 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

15 15 Stap 3: PCA of PFA geschikte techniek? Bartlett’s test of sphericity –Nulhypothese: alle correlaties zijn 0 –PCA/PFA geschikt indien H 0 verworpen kan worden, ofwel een significante waarde voor χ² KMO test –Vergelijkt de correlaties uit de correlatiematrix met de partiële correlaties –PCA/PFA geschikt indien waarde > 0.50 Anti-image correlatiematrix –Diagonaal: KMO-waarde per variabele: eis > 0.50 –Buiten-diagonaal: (negatieve) partiële correlaties: eis: zeer klein 1.Niet-homogene correlatiematrix 2.Check of multicollineariteit een probleem kan vormen 3.Check of de samenhang tussen variabelen hoog genoeg is: (correlatiematrix, Bartlett’s test, KMO test, Anti-image correlatiematrix)

16 16 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

17 17 Stap 4: Initiële oplossing (in PCA) Aantal getrokken componenten = aantal variabelen Bij componenten analyse: 100% van de variantie van de oorspronkelijke variabelen verklaard. Componentmatrix :

18 18 Componentmatrix Communaliteit (proportie verklaarde variantie van item) Indien componenten ongecorreleerd: Correlatie r tussen component en item Totale verklaarde variantie Eigenwaarde (verklaarde variantie per component) Eigenvalue =

19 19 Initiële oplossing (in PCA): eigenvalues en communaliteiten Eigenwaarde 1e component = Deze component extraheert / 9 (x 100%) = 37.6% van de variantie van de 9 items

20 20 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

21 21 Stap 5: exploratief of confirmatief? Exploratief: op zoek naar latente structuur. Het aantal dimensies wordt bepaald door de empirisch aanwezige structuur. Confirmatief: toetsen van veronderstelde latente structuur. Het aantal dimensies wordt door onderzoeker opgelegd –In SPSS: 3 dimensies: /criteria = factors (3) –Voor confirmatieve componenten- of factoranalyse met uitgebreide mogelijkheden, zoals vastleggen welke items bij welke latente variabele behoren: Structurele Modellen (‘Structural Equation Modelling’), bijv. met LISREL computerprogramma.

22 22 Stap 5: Aantal componenten of factoren Confirmatief: toetsen van theoretische veronderstelling van aantal (en inhoud van) factoren Exploratief: –Minimum aantal factoren = 1 (unidimensioneel) –Maximum aantal factoren = aantal items (PCA) of aantal items min 1 (PFA) –Afweging tussen: Eenvoudige structuur (parsimonious model, zuinig): beperkt aantal factoren Weinig informatieverlies t.a.v. de oorspronkelijke variabelen

23 23 Aantal factoren: criteria Eigenwaarde > 1 (Kaisers criterium): Een factor moet op z’n minst net zo veel informatie bevatten als één oorspronkelijke variabele /criteria mineigen(n) (default n=1) Knikcriterium en scree-criterium (scree plot) Factoren gerangordend naar eigenwaarde. Let op breuklijn tussen belangrijke en minder belangrijke factoren /plot eigen Totale verklaarde variantie voldoende hoog Interpreteerbaarheid van de factoren !!! En controleer of de communaliteit van elk item hoog (≥.20) genoeg is

24 24 Knikcriterium en scree-criterium Knik Scree

25 25 Oplossing met 2 getrokken componenten componentmatrix

26 26 Oplossing met 2 getrokken componenten Interpretatie van componenten? Lastig, zowel 1 e als 2 e component correleert sterk met 4 dezelfde items.

27 27 Rotatie ‘probleem’: geen unieke oplossing C 1’ C 2’ Coördinaten V0649: Op C 1, C 2(.734, -.246) Communaliteit (proportie verklaarde variantie) =.60 C 1 C 2 V0649 Coördinaten V0649 na roteren: Op C 1’, C2’ (.758,.158) Ook nu geldt: communaliteit =.60

28 28 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

29 29 Stap 6: Roteren Doel: verhogen interpreteerbaarheid van factoren Roteren in de richting van een eenvoudige structuur (simple structure) Twee vormen van rotatie –Orthogonaal: onafhankelijke factoren (loodrecht op elkaar) Methoden: varimax, quartimax, equamax –Oblique roteren: factoren kunnen met elkaar samenhangen (scheve rotatie) Methoden: direct oblimin, promax Kies voor oblique indien –Theoretisch aannemelijk –Empirisch: indien correlatie tussen factoren niet verwaarloosbaar klein is

30 30 Initiële eigenwaarden Eigenwaarden na extractie van 2 factoren Eigenwaarden na extractie van 2 factoren, orthogonaal geroteerd Orthogonale rotatie

31 31 Orthogonale componentoplossing componentmatrix

32 32 Bij oblique rotatie: totale verklaarde variantie ≠ som eigenwaarden Oblique rotatie

33 33 Oblique rotatie: gecorreleerde componenten C1C1 C2C2 X1X1 a 11 a 12 r 11 r 12 a = componentlading r = correlatie item en component

34 34 Componentladingen en correlaties Bij orthogonale (ongecorreleerde) componenten: –componentlading = correlatie item en component –De componentmatrix bevat deze componentladingen (of correlaties) Bij gecorreleerde componenten (oblique rotatie) –componentlading ≠ correlatie item en component –De component patroonmatrix bevat de componentladingen –De component structuurmatrix bevat de correlaties

35 35 Oblique componentoplossing Patroonmatrix

36 36 Oblique componentoplossing Structuurmatrix: correlatie tussen item en component Correlaties tussen componenten α = Hoek tussen C1 en C2 r = cosinus(α) r =.316, α =.71 0 α C1 C2

37 37 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

38 38 Stap 7: Interpreteren van componenten Na rotatie Kijk naar de matrix met ladingen: –Orthogonale rotatie: componentmatrix –Oblique rotatie: component patroon matrix Bepaal voor elke component welke variabelen hoog laden en geef op basis van deze variabelen een label aan de component

39 39 Output factoranalyse Vergelijk de output op de volgende 3 pagina’s met de eerder vermelde output van componentenanalyse

40 40 Factoranalyse: h² en eigenwaarden

41 41 Factoranalyse: ongeroteerde oplossing Factormatrix bevat de r²’s. Sommeren per kolom: ∑r² = eigenwaarde Omdat factoren ongecorreleerd zijn: Sommeren per rij ∑ r² = h², bijv. (.683)² + (-.199)² =.506 ∑r² rij =.506 ∑r² kolom = = 3.926

42 42 Factoranalyse: oblique rotatie ∑r² kolom = = ≠ ∑r² rij = (.71)² + (.33)² =.61 ≠.506 (h²)

43 43 Stappen in componenten- of factoranalyse 1.Uitgangspunt is de correlatiematrix van m items 2.Kies een methode (bijv. PCA of PFA) 3.Ga na of factoranalyse een geschikte techniek is 4.Initiële oplossing: extractie van m factoren 5.Extractie van gewenst aantal factoren 6.Rotatie van factoren 7.Benoem de factoren 8.Bereken voor elke respondent een score op elke factor

44 44 Stap 8: Berekenen van factorscores (of componentscores) F jk = factorscore van respondent k op factor j Z ik = gestandaardiseerde score van respondent k op variabele i W ji = factorscore coëfficiënt voor variabele i en factor j − In Componentenanalyse worden exacte componentscores berekend. − In Factoranalyse worden factorscores geschat Factor/componentscore = lineaire gewogen combinatie van de (gestandaardiseerde) oorspronkelijke variabelen

45 45 Berekenen van factorscores Factorscore1 =.220 x V0649 Z x V0650 Z x V0651 Z x V0654 Z x V0655 Z x V0657 Z x V0658 Z x V0663 Z x V0665 Z - Component en factorscores zijn relatieve scores - Bij Factoranalyse worden factorscores geschat:

46 46 Factorscore en Likertsomscore Factorscore = lineaire gewogen combinatie van de (gestand.) oorspronkelijke variabelen

47 47 Verschillen Factorscore en Likertsomscore Likertsomscore = lineair ongewogen combinatie van de oorspronkelijke variabelen. Bijvoorbeeld, –SS1 = somscore van de 5 items die bij de 1 e factor horen –SS2 = somscore van de 4 items die bij de 2 e factor horen Likertsomscore soms gebruikt als benadering van factorscore –Voordeel: Likertsomscores zijn absolute scores, Factorscores zijn relatieve scores –Vaak hoge correlaties tussen factorscore en likertsomscore. correlatie (F1, SS1) =.995; correlatie (F2, SS2) =.905 Werkwijze indien je Likertsomscores als schaalscores wilt gebruiken: –Eerst met pca/pfa aantonen welke dimensies er zijn –Dan per dimensie somscore van de belangrijke variabelen op die dimensie


Download ppt "1 Kwantitatieve & kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en Vervoer 1 maart 2007 Meetmodellen: Componenten en factoranalyse Dr."

Verwante presentaties


Ads door Google