variabelen vaststellen Hoofdstuk 18 Verbanden tussen variabelen vaststellen en interpreteren
Analyse van verbanden Analyse van verbanden: bij de analyse van verbanden stel je vast of er een stabiel verband bestaat tussen twee variabelen Voorbeelden: Welk verband bestaat er tussen de lengte van de verkooptraining en klanttevredenheid? Welk verband bestaat er tussen demografische variabelen en herhaalaankopen van merk A?
Soorten verbanden tussen twee variabelen Verband: een consistente en systematische koppeling tussen de niveaus of benamingen van twee variabelen. De term ‘niveaus’ impliceert dat de schaal een metrische is, namelijk interval of ratio. De term ‘benaming’ impliceert dat de schaal niet metrisch is, maar nominaal of ordinaal.
Soorten verbanden tussen twee variabelen Niet-monotoon: bij een niet-monotoon verband wordt de aanwezigheid (of afwezigheid) van de ene variabele systematisch gerelateerd aan de aanwezigheid (of afwezigheid) van een andere variabele. McDonald’s weet bijvoorbeeld uit ervaring dat ochtendklanten meestal koffie kopen terwijl middagklanten meestal frisdrank kopen. Dat verband is op geen enkele manier exclusief: er is geen garantie dat een ochtendklant altijd koffie bestelt of dat een middagklant altijd frisdrank koopt.
McDonald’s-voorbeeld van een niet-monotoon verband voor het soort drinken dat klanten bestellen bij het ontbijt en de lunch
Soorten verbanden tussen twee variabelen Monotoon: een monotoon verband is een verband waarbij de onderzoeker slechts de algemene richting van de samenhang tussen de twee variabelen kan aanduiden Stijgend Dalend Voorbeeld: De eigenaar van een schoenwinkel weet dat oudere kinderen doorgaans grotere schoenen nodig hebben dan jongere kinderen, maar er is geen manier om de leeftijd van kinderen te koppelen aan de juiste schoenmaat. Er bestaat geen universele regel voor de snelheid waarmee de voet van een kind groeit, noch voor de uiteindelijke schoenmaat die het kind krijgt. Er bestaat echter een monotoon stijgend verband tussen de leeftijd van het kind en zijn schoenmaat.
Soorten verbanden tussen twee variabelen Lineair: een rechtlijnige samenhang tussen twee variabelen. Hier levert kennis van de omvang van de ene variabele automatisch kennis op over de omvang van de andere variabele.
Soorten verbanden tussen twee variabelen Curvilineaire verbanden: die verbanden waarbij de ene variabele samenhangt met de andere variabele, maar het verband eerder de vorm van een kromme heeft dan van een rechte lijn. Een voorbeeld van een curvilineair verband dat je moet kennen is de kromme voor de levenscyclus van een product die het verkooppatroon beschrijft van een nieuw product dat langzaam groeit tijdens de introductie, vervolgens in de groeifase snel in opwaartse richting spurt en ten slotte een plateau bereikt of aanzienlijk langzamer groeit als de markt verzadigd raakt.
Verbanden tussen variabelen karakteriseren Aanwezigheid: verwijst naar de vraag of er een systematisch verband bestaat tussen twee variabelen. Richting: een monotoon verband kan stijgen of dalen. Sterkte van het verband: afhankelijk van het soort verband dat wordt onderzocht kan de sterkte van de samenhang tussen twee variabelen worden voorgesteld als sterk, gematigd, zwak of niet-bestaand. Let op, volgorde is van belang: 1. Aanwezigheid 2. Richting en 3. Sterkte
Kruistabellen Kruistabellen: een tabel waarin de data worden vergeleken door middel van een indeling in rijen en kolommen. Frequentietabel: vier getallen in elke cel Frequentie Ruw percentage Tabel met kolompercentages Tabel met rijpercentages In SPSS: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS
SPSS kan kruistabellen genereren: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS
SPSS kan kruistabellen genereren: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS
Kruistabellen Bij een chi-kwadraatanalyse (χ2-analyse) bestudeer je de frequenties van twee nominale variabelen in een kruistabel om te bepalen of er tussen de variabelen een niet-monotoon verband bestaat. In deze situatie, twee variabelen met een nominale schaal, testen we voor een niet-monotone verband. Voorbeeld: we willen onderzoeken of er er een verband bestaat tussen studeren en studieresultaten en beiden zijn op een nominale schaal gemeten…
Kruistabellen Een handig grafisch instrument dat een niet-monotoon verband illustreert is een staafdiagram.
Kruistabellen We kunnen het verband zien, maar hoe weten we of dit een systematisch verband is? Met andere woorden, is dit statistisch significant? Krijgen we dezelfde resultaten bij het herhalen van de analyse? We gebruiken de Chi-kwadraatanalyse om vast te stellen of er niet-monotone verbanden bestaan. In SPSS: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS en in het crosstabs-venster: klik op STATISTICS en selecteer CHI- SQUARE
Chi-kwadraatanalyse Chi-kwadraatanalyse: bij een chi-kwadraatanalyse (χ2-analyse) bestudeer je de frequenties van twee nominale variabelen in een kruistabel om te bepalen of er tussen de variabelen een niet-monotoon verband bestaat. Waargenomen frequenties: de feitelijke tellingen in de kruistabel. Verwachte frequenties: theoretische frequenties die worden afgeleid van deze hypothese van geen verband tussen de twee variabelen.
Chi-kwadraatanalyse De berekende χ2-waarde:
Chi-kwadraatanalyse De vorm van de chi-kwadraatverdeling wordt bepaald door het aantal vrijheidsgraden. Een tabel met chi-kwadraatwaarden bevat kritieke punten om de breuk te bepalen tussen het acceptatie- en het verwerpingsgebied bij verschillende significantieniveaus.
Chi-kwadraatanalyse Hoe je een chi-kwadraatuitkomst interpreteert Uit de chi-kwadraatanalyse komt de kans naar voren dat de onderzoeker bewijs vindt voor de nulhypothese als hij het onderzoek zeer vele keren zou herhalen met onafhankelijke steekproeven. Als bijvoorbeeld uit de chi-kwadraatanalyse een kans van 0,02 blijkt voor de nulhypothese, concludeert de onderzoeker dat hij in slechts 2 procent van de gevallen bewijs vindt voor de nulhypothese. Dit betekent dat er een significant verband bestaat.
Chi-kwadraatanalyse Hoe interpreteer je een chi-kwadraatuitkomst? De chi-kwadraattoets is een van onze ‘vlaggen’ die aangeeft of het wel of niet de moeite waard is om alle rij- en kolompercentages nader te onderzoeken… SPSS zal de percentages van de rijen en kolommen voor je berekenen.
Wanneer kun je een kruistabel en een Chi-kwadraatanalyse gebruiken? Als je wil weten of er een verband bestaat tussen twee variabelen… Als de schaal interval of ratio is... Let op: Je kan kruistabellen en de Chi-kwadraatanalyse uitvoeren als tenminste één variabele gemeten is op een interval- of ratio-schaal. Maar die variable mag maar een beperkte hoeveelheid niveau’s hebben. Maximaal zeven. Anders kunnen de resultaten niet correct geïnterpreteerd worden.
Hoe kunnen we het verband tussen twee variabelen van interval- en/of rationiveau meten? In dit geval proberen we de aanwezigheid, richting en de sterke van een monotone verband te bepalen. We worden hierbij geholpen door de product-momentcorrelatiecoëfficiënt van Pearson In SPSS: ANALYZE, CORRELATE, BIVARIATE
Correlatiecoëfficiënten en covariatie Covariatie grafisch weergeven met een spreidingsdiagram
De product-momentcorrelatiecoëfficiënt van Pearson Aanwezigheid. Bepaal of er een significant verband bestaat. De p-waarde van de coëfficiënt moet eerst onderzocht worden. Als die niet significant is (>0,05), dan bestaat er geen verband. Als p ≤ 0,05, dan is er wel een significant verband. We kijken dan naar… Richting van het verband. Kijk naar de coëfficiënt. Is het positief (+) of negatief (-)? Sterkte van het verband. Dit getal ligt altijd tussen de -1,0 en + 1,0. Correlatiecoëfficiënten die dichter bij +1,00 of -1,00 liggen, geven een sterker verband aan. Er zijn vuistregels voor de omvang van de correlatiecoëfficiënt
Vuistregels voor de omvang van de correlatiecoëfficiënt De correlatiecoëfficiënt is een indexgetal dat altijd tussen de -1,0 en + 1,0 ligt en de sterkte en de richting van het verband tussen twee variabelen aangeeft. Het teken voor de coëfficiënt geeft de richting van het verband aan.
De product-momentcorrelatiecoëfficiënt van Pearson De product-momentcorrelatiecoëfficiënt van Pearson: hiermee meet je het lineaire verband tussen twee variabelen van interval- en/of rationiveau, zoals de variabelen die worden afgebeeld in een spreidingsdiagram
De product-momentcorrelatiecoëfficiënt van Pearson Speciale overwegingen bij procedures voor lineaire correlaties: Bij de correlatiecoëfficiënt wordt er alleen naar het verband tussen twee variabelen gekeken. Er wordt niet gekeken naar interacties met andere variabelen. Er wordt bij de correlatiecoëfficiënt expliciet niet uitgegaan van een oorzaak-engevolgverband De product-momentcorrelatiecoëfficiënt van Pearson drukt slechts lineaire verbanden uit
Als er geen verband bestaat, dan zal de p-waarde voor de correlatie groter dan 0,05 zijn
Als er wel een verband bestaat, dan zal de p-waarde voor de correlatie kleiner dan 0,05 zijn Voorbeelden: Er is een significant negatief verband tussen de afstand tot de klant en de omzet Er is een significant positief verband tussen de lengte van de verkooptraining en omzet
Afsluitende opmerkingen over de analyse van verbanden Onderzoekers zullen altijd de nul-hypothese testen dat er geen verband of geen correlatie bestaat. Als de nul-hypothese wordt verworpen, dan kan de onderzoeker de belangrijke economische bevindingen met de manager delen.