Hoofdstuk 9 Verbanden, correlatie en regressie Onderzoek doen Hoofdstuk 9 Verbanden, correlatie en regressie
Het verband tussen variabelen Inhoudelijk: hoe kun je de samenhang tussen variabelen theoretisch verklaren? Kracht: hoe sterk is het verband tussen die variabelen? Causaliteit: is er sprake van een oorzakelijk verband (asymmetrie)? Richting (alleen bij ordinaal en hoger meetniveau): is het verband positief of negatief?
De analyse van de samenhang Methoden en technieken van de analyse van de samenhang van verschillende variabelen Kruistabellen Rangordecorrelatie Correlatie (niet-causaal) Regressie (causaal verband)
Kruistabellen Voor het analyseren van de samenhang tussen twee (of meer) variabelen op nominaal niveau wordt gebruik gemaakt van kruistabellen. In een kruistabel worden de frequenties van twee variabelen tegen elkaar afgezet. De meest elementaire associatiemaat is het chi-kwadraat. In MS Excel kan de kans dat het verband op toeval gebaseerd wordt uitgerekend worden door de functie CHIDEST CHIDIST (32,0 ; 1) = 1,50428E-08 => Kans op toeval = +/- 0
Rangorde-correlatie De Spearman rangcorrelatie-coëfficiënt (RS) is een indicator voor de mate waarin twee rangschikkingen van dezelfde waarnemingen naar verschillende variabelen aan elkaar gelijk zijn. Deze functie is niet standaard in MS Excel beschikbaar, maar wel in SPSS (zie hoofdstuk 10)
Correlatie (niet-causaal) Het gaat bij correlatie om statistisch verklaren: de onderzoeker moet op inhoudelijke gronden bepalen of de statistische verklaring ook werkelijk iets betekent Correlatie betekent dus NIET plausibel Het bekijken van het spreidingsdiagram, waarin de twee te correleren variabelen tegen elkaar worden uitgezet, levert een indruk van de sterkte en de richting van het verband
Regressie (causaal verband) Hoe sterker het verband tussen twee variabelen van minimaal intervalniveau, des te meer zal de puntenwolk naar een rechte lijn tenderen. Met behulp van regressie-analyse wordt de vorm van deze lijn berekend. De berekening van de correlatiecoëfficiënt is gebaseerd op dit principe: de (gekwadrateerde) verschillen van ieder punt tot de regressielijn moet zo klein mogelijk zijn. Men noemt deze berekeningswijze dan ook de methode van de kleinste kwadraten (least squares)
Kracht en richting van het verband De vorm van de puntenwolk geeft aan in hoeverre een verband aanwezig is: wanneer een toename in de ene variabele systematisch gepaard gaat met een toename in de andere, zal er sprake zijn van een positief verband. Als de beweging van de variabelen juist tegengesteld is, zal er sprake zijn van een negatief verband. Afhankelijk van het verband wordt gesproken van positieve en negatieve correlatie. Indien de puntenwolk samen valt met de lijn is er sprake van volkomen regressie.
Voorbeeldplaatje In het voorbeeld wordt het verband tussen gewicht en leeftijd getoetst. Er is een verschil t.o.v. het gemiddelde en er is een afwijking van een persoon in kwestie.