Kwantitatieve & kwalitatieve data analyse

Slides:



Advertisements
Verwante presentaties
> Met websitestatistieken naar een betere website Rick Koopman.
Advertisements

‘SMS’ Studeren met Succes deel 1
Paulus' eerste brief aan Korinthe (20) 23 januari 2013 Bodegraven.
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
WAAROM? Onderzoek naar het meest geschikte traject voor de verlenging tot in Sint-Niklaas van het bestaande fietspad naast de Stekense Vaart en de Molenbeek.
BRIDGE Vervolgcursus Vervolg op starterscursus Bridgeclub Schiedam ‘59 info: Maandagavond: 19: – of
1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
 Deel 1: Introductie / presentatie  DVD  Presentatie enquête  Ervaringen gemeente  Pauze  Deel 2 Discussie in kleinere groepen  Discussies in lokalen.
STAPPENPLAN GRAMMATICUS.
Ronde (Sport & Spel) Quiz Night !
Keuzeondersteunend model voor inbouwpakketten bij herbestemmingsprojecten Eindcolloquium Wiebrand Bunt.
Een Concert van het Nederlands Philharmonisch Orkest LES 4 1.
Een optimale benutting van vierkante meters Breda, 6 juni 2007.
Start.
Kb.1 Ik leer op een goede manier optellen en aftrekken
Werkcollege differentiële psychologie
© GfK 2012 | Title of presentation | DD. Month
Ontwerpregels voor kruispunten
Nooit meer onnodig groen? Luuk Misdom, IT&T
Passie - Verrijzenis Arcabas
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Herleiden (= Haakjes uitwerken)
Elke 7 seconden een nieuw getal
Regelmaat in getallen … … …
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Regelmaat in getallen (1).
1 introductie 3'46” …………… normaal hart hond 1'41” ……..
Chapter 9. Understanding Multivariate Techniques
Oefeningen F-toetsen ANOVA.
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Hoofdstuk 1, 2 en 3 Toegepaste Mechanica deel 1
Latente semantische analyse (LSA) en erkenning van EVC’s: wat kunnen we ermee? Jan van Bruggen Ellen Rusman Bas Giesbers Oktober 2005.
13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.
Van de eerste graad in één onbekende
Werken aan Intergenerationele Samenwerking en Expertise.
Geometrie en topologie Rob Kromwijk, 26 juli 2012.
Seminarie 1: Pythagoreïsche drietallen
Afrika: Topo nakijken en leren.
Elektriciteit 1 Les 4 Visualisatie van elektrische velden
2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.
Construeren van een Tennishal Vergeet-mij-nietjes. Week 13
ribwis1 Toegepaste wiskunde Lesweek 2
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
ribWBK11t Toegepaste wiskunde Lesweek 02
Module ribCO2 4z Draagconstructie in Staal, Hout en Beton Week 07
Samantha Bouwmeester Testtheorie College Samantha Bouwmeester.
De Dagen van de Kaaien 19, 20 & 21 maart De Kaaien op tafel - inhoud 1.Methodiek tafelgesprekken 2.Aantal tafelgesprekken en aantal deelnemers.
ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij
Hartelijk welkom bij de Nederlandse Bridge Academie Hoofdstuk 7 De 2 ♦ /2 ♥ /2 ♠ en de 2 ♣ -opening 1Contract 2, hst 7.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.
Fractale en Wavelet Beeldcompressie
Fractale en Wavelet Beeldcompressie
De financiële functie: Integrale bedrijfsanalyse©
Toets 1 Examen Reinder Reen.
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
Kwantitatieve & kwalitatieve data analyse
13 november 2014 Bodegraven 1. 2 de vorige keer: 1Kor.15:29-34 indien er geen doden opgewekt worden...  vs 29: waarom dopen?  vs.30-32: waarom doodsgevaren.
1 Week /03/ is gestart in mineur De voorspellingen van alle groten der aarden dat de beurzen zouden stijgen is omgekeerd uitgedraaid.
2020 Boer of mineralenmanager? 1. Evenwicht? Bodem & vakmanschap Info DMS % %
ZijActief Koningslust
1 DE ADVIEZEN VAN BEURSMAKELAAR BERNARD BUSSCHAERT Week
Transcript van de presentatie:

Kwantitatieve & kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en Vervoer 1 maart 2007 Meetmodellen: Componenten en factoranalyse Dr. M. Coenders

Componenten/factoranalyse Multidimensionele schaaltechniek Uitgangspunt: correlaties tussen manifeste variabelen Op zoek naar achterliggende gemeenschappelijke aspecten: Latente variabelen Dimensies, ofwel componenten of factoren Doel: Inzicht in structuur van data Schaalconstructie Datareductie: set variabelen samenvatten door een beperkt aantal dimensies (en een goede interpretatie vinden voor deze latente eigenschappen), met weinig informatieverlies

2-dimensionele latente structuur Indicatoren, Manifeste variabelen Latente eigenschap Item 1 Dimensie 1 Item 2 Item 3 Item 4 Item 5 Dimensie 2 Item 6 Item 7 Item 8

Principe van componenten / factoranalyse X oorspronkelijke datamatrix  Component- of factormatrix Component- of factorscore matrix In matrixalgebra: X = C x AT

Extractie van componenten of factoren Component / factor = lineaire combinatie van de oorspronkelijke variabelen, bijv. Componenten / factoren zodanig getrokken dat: 1e component / factor extraheert zoveel mogelijk variantie van de oorspronkelijke variabelen (bevat zoveel mogelijk informatie van de oorspr. variabelen). 2e component / factor verklaart zoveel mogelijk van de overgebleven variantie, enzovoort. Vandaar de term Principale Componenten Analyse of Principale Factor Analyse. Componenten / Factoren staan (in beginfase) loodrecht op elkaar. (orthogonaliteit)

Geometrisch voorbeeld X3 X1 X2 C1 X oorspronkelijke variabelen C componenten C2 C3 Tacq (1991) p. 255

Algebraïsch Componenten analyse Z = (gestandaardiseerde) oorspronkelijke variabele C = component a = componentlading

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Items ter operationalisering van etnocentrisme (Socon 2000)

Stap 1: Correlatiematrix Niet-homogene correlatiematrix: duidt op 2 dimensies

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Componenten- en factoranalyse Componentenanalyse Factoranalyse z1 z2 z3 z4 z5 C1 C2 a52 a11 z1 z2 z3 z4 z5 F1 F2 a52 a11 U1 U2 U3 U4 U5 z = gestandaardiseerde variabele C = component a = component- of factorlading F = gemeenschappelijke (common) factor U = unieke factor

Stap 2: Componenten- of factoranalyse? Principale Componenten Analyse de gehele variantie van alle items kan volledig verklaard worden door de andere variabelen in het model Principale Factor Analyse de variantie van elk item kan niet volledig verklaard worden door de andere variabelen in het model; elk item heeft een uniek deel Assumpties voor U: U’s onderling ongecorreleerd U en F ongecorreleerd

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Stap 3: PCA of PFA geschikte techniek? Niet-homogene correlatiematrix Check of multicollineariteit een probleem kan vormen Check of de samenhang tussen variabelen hoog genoeg is: (correlatiematrix, Bartlett’s test, KMO test, Anti-image correlatiematrix) Bartlett’s test of sphericity Nulhypothese: alle correlaties zijn 0 PCA/PFA geschikt indien H0 verworpen kan worden, ofwel een significante waarde voor χ² KMO test Vergelijkt de correlaties uit de correlatiematrix met de partiële correlaties PCA/PFA geschikt indien waarde > 0.50 Anti-image correlatiematrix Diagonaal: KMO-waarde per variabele: eis > 0.50 Buiten-diagonaal: (negatieve) partiële correlaties: eis: zeer klein

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Stap 4: Initiële oplossing (in PCA) Aantal getrokken componenten = aantal variabelen Bij componenten analyse: 100% van de variantie van de oorspronkelijke variabelen verklaard. Componentmatrix :

Componentmatrix Communaliteit (proportie verklaarde variantie van item) Indien componenten ongecorreleerd: Correlatie r tussen component en item Totale verklaarde variantie Eigenwaarde (verklaarde variantie per component) Eigenvalue =

Initiële oplossing (in PCA): eigenvalues en communaliteiten Eigenwaarde 1e component = 3.382. Deze component extraheert 3.382 / 9 (x 100%) = 37.6% van de variantie van de 9 items

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Stap 5: exploratief of confirmatief? Exploratief: op zoek naar latente structuur. Het aantal dimensies wordt bepaald door de empirisch aanwezige structuur. Confirmatief: toetsen van veronderstelde latente structuur. Het aantal dimensies wordt door onderzoeker opgelegd In SPSS: 3 dimensies: /criteria = factors (3) Voor confirmatieve componenten- of factoranalyse met uitgebreide mogelijkheden, zoals vastleggen welke items bij welke latente variabele behoren: Structurele Modellen (‘Structural Equation Modelling’), bijv. met LISREL computerprogramma.

Stap 5: Aantal componenten of factoren Confirmatief: toetsen van theoretische veronderstelling van aantal (en inhoud van) factoren Exploratief: Minimum aantal factoren = 1 (unidimensioneel) Maximum aantal factoren = aantal items (PCA) of aantal items min 1 (PFA) Afweging tussen: Eenvoudige structuur (parsimonious model, zuinig): beperkt aantal factoren Weinig informatieverlies t.a.v. de oorspronkelijke variabelen

Aantal factoren: criteria Eigenwaarde > 1 (Kaisers criterium): Een factor moet op z’n minst net zo veel informatie bevatten als één oorspronkelijke variabele /criteria mineigen(n) (default n=1) Knikcriterium en scree-criterium (scree plot) Factoren gerangordend naar eigenwaarde. Let op breuklijn tussen belangrijke en minder belangrijke factoren /plot eigen Totale verklaarde variantie voldoende hoog Interpreteerbaarheid van de factoren !!! En controleer of de communaliteit van elk item hoog (≥ .20) genoeg is

Knikcriterium en scree-criterium

Oplossing met 2 getrokken componenten componentmatrix

Oplossing met 2 getrokken componenten Interpretatie van componenten? Lastig, zowel 1e als 2e component correleert sterk met 4 dezelfde items.

Rotatie ‘probleem’: geen unieke oplossing C 1 C 2 C 1’ C 2’ Coördinaten V0649: Op C 1, C 2 (.734, -.246) Communaliteit (proportie verklaarde variantie) = .60 Coördinaten V0649 na roteren: Op C 1’, C2’ (.758, .158) Ook nu geldt: communaliteit =.60 V0649

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Stap 6: Roteren Doel: verhogen interpreteerbaarheid van factoren Roteren in de richting van een eenvoudige structuur (simple structure) Twee vormen van rotatie Orthogonaal: onafhankelijke factoren (loodrecht op elkaar) Methoden: varimax, quartimax, equamax Oblique roteren: factoren kunnen met elkaar samenhangen (scheve rotatie) Methoden: direct oblimin, promax Kies voor oblique indien Theoretisch aannemelijk Empirisch: indien correlatie tussen factoren niet verwaarloosbaar klein is

Orthogonale rotatie Initiële eigenwaarden Eigenwaarden na extractie van 2 factoren Eigenwaarden na extractie van 2 factoren, orthogonaal geroteerd

Orthogonale componentoplossing componentmatrix

Oblique rotatie Bij oblique rotatie: totale verklaarde variantie ≠ som eigenwaarden

Oblique rotatie: gecorreleerde componenten a = componentlading r = correlatie item en component r12 X1 a12 C1 a11 r11

Componentladingen en correlaties Bij orthogonale (ongecorreleerde) componenten: componentlading = correlatie item en component De componentmatrix bevat deze componentladingen (of correlaties) Bij gecorreleerde componenten (oblique rotatie) componentlading ≠ correlatie item en component De component patroonmatrix bevat de componentladingen De component structuurmatrix bevat de correlaties

Oblique componentoplossing Patroonmatrix

Oblique componentoplossing Structuurmatrix: correlatie tussen item en component C2 α = Hoek tussen C1 en C2 r = cosinus(α) r = .316, α = .710 α C1 Correlaties tussen componenten

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Stap 7: Interpreteren van componenten Na rotatie Kijk naar de matrix met ladingen: Orthogonale rotatie: componentmatrix Oblique rotatie: component patroon matrix Bepaal voor elke component welke variabelen hoog laden en geef op basis van deze variabelen een label aan de component

Output factoranalyse Vergelijk de output op de volgende 3 pagina’s met de eerder vermelde output van componentenanalyse

Factoranalyse: h² en eigenwaarden

Factoranalyse: ongeroteerde oplossing ∑r²rij =.506 ∑r²kolom = 2.871 + 1.055 = 3.926 Factormatrix bevat de r²’s. Sommeren per kolom: ∑r² = eigenwaarde Omdat factoren ongecorreleerd zijn: Sommeren per rij ∑ r² = h², bijv. (.683)² + (-.199)² = .506

Factoranalyse: oblique rotatie ∑r²rij= (.71)² + (.33)² = .61 ≠ .506 (h²) ∑r²kolom = 2.688 + 1.924 = 4.612 ≠ 3.926

Stappen in componenten- of factoranalyse Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor

Stap 8: Berekenen van factorscores (of componentscores) Factor/componentscore = lineaire gewogen combinatie van de (gestandaardiseerde) oorspronkelijke variabelen Fjk = factorscore van respondent k op factor j Zik = gestandaardiseerde score van respondent k op variabele i Wji = factorscore coëfficiënt voor variabele i en factor j − In Componentenanalyse worden exacte componentscores berekend. − In Factoranalyse worden factorscores geschat

Berekenen van factorscores Factorscore1 = .220 x V0649Z + .223 x V0650Z + .339 x V0651Z + .173 x V0654Z + .197 x V0655Z + .024 x V0657Z + .017 x V0658Z + .038 x V0663Z + -.005 x V0665Z - Component en factorscores zijn relatieve scores - Bij Factoranalyse worden factorscores geschat:

Factorscore en Likertsomscore Factorscore = lineaire gewogen combinatie van de (gestand.) oorspronkelijke variabelen

Verschillen Factorscore en Likertsomscore Likertsomscore = lineair ongewogen combinatie van de oorspronkelijke variabelen. Bijvoorbeeld, SS1 = somscore van de 5 items die bij de 1e factor horen SS2 = somscore van de 4 items die bij de 2e factor horen Likertsomscore soms gebruikt als benadering van factorscore Voordeel: Likertsomscores zijn absolute scores, Factorscores zijn relatieve scores Vaak hoge correlaties tussen factorscore en likertsomscore. correlatie (F1, SS1) = .995; correlatie (F2, SS2) = .905 Werkwijze indien je Likertsomscores als schaalscores wilt gebruiken: Eerst met pca/pfa aantonen welke dimensies er zijn Dan per dimensie somscore van de belangrijke variabelen op die dimensie