Inferentie voor kruistabellen Hoofdstuk 9 Inferentie voor kruistabellen
9.1. Inferentie voor kruistabellen A. De kruistabel Kruistabellen voor relatie tussen 2 kwalitatieve variabelen Gebaseerd op aantallen in cellen Meest eenvoudig 2 rijen – 2 kolommen = 2 X 2 tabel kan ook voor meer dan 2 categorieën Is er een verband tussen rij en kolom ???
VOORBEELD : 4 X 2 tabel Vrouw Man HC - HM 14 31 HC - LM 7 18 LC - HM 21 5 LC - LM 25 13 C : competitiegeest M : prestatiedrang
Elke combinatie van waarden voor deze twee variabelen in een cel Kruistabel met r rijen en c kolommen bevat r x c cellen
B. Relaties in kruistabellen Aantallen omrekenen in percentages Rijpercentage Kolompercentage Totaal percentage Tonen de percentages dat er een relaties is tussen de 2 variabelen ?
ROOKSTAT * GESLACHT Crosstabulation GESLACHT Total 1,00 2,00 ROOKSTAT ROKER Count 121 178 299 % within ROOKSTAT 40,5% 59,5% 100,0% % within GESLACHT 25,3% 35,5% 30,5% % of Total 12,3% 18,2% 30,5% EX-ROKER Count 50 31 81 % within ROOKSTAT 61,7% 38,3% 100,0% % within GESLACHT 10,4% 6,2% 8,3% % of Total 5,1% 3,2% 8,3% NIET-ROKER Count 308 292 600 % within ROOKSTAT 51,3% 48,7% 100,0% % within GESLACHT 64,3% 58,3% 61,2% % of Total 31,4% 29,8% 61,2% TOTAAL Count 479 501 980 % within ROOKSTAT 48,9% 51,1% 100,0% % within GESLACHT 100,0% 100,0% 100,0% % of Total 48,9% 51,1% 100,0%
C. De hypothese : geen samenhang Nulhypothese : er is geen samenhang tussen de twee kwalitatieve variabelen Ha er bestaat wel een relatie Ha is niet eenzijdig of tweezijdig, omwille van verschillende categorieën zijn er verschillende soorten samenhang mogelijk
D. Verwachte celaantallen Nulhypothese toetsen door de waargenomen celaantallen te vergelijken met de verwachte celaantallen Verwachte celaantal = rijtotaal x kolomtotaal n
E. De chi-kwadraattoets H0 : er is geen samenhang in de kruistabel Ha : er is een samenhang Ha toetsen door vergelijking waargenomen celaantallen (OBSERVED) verwachte celaantallen (EXPECTED)
2 = (waargenomen – verwachte)2 verwachte Afstand wordt gemeten tussen waargenomen en verwachte aantallen Door kwadraat : Alles positief Grotere verschillen worden groter Grotere 2 = sterker bewijs tegen H0
De 2 verdeling : Wordt beschreven door aantal vrijheidsgraden 2 (df) = 2 verdeling met (r-1) (c-1) vrijheidsgraden Enkel positieve waarden + rechtsscheef Tabel G : bovenste kritieke waarden Voor 2 x 2 tabellen minstens 5 per cel
2 verdeling met 2 vrijheidsgraden
2 verdeling met 4 vrijheidsgraden
Voorbeeld sportmotivatie : computeroutput : 2 = 24.898 4 x 2 tabel dus vrijheidsgraden : 3 x 1 = 3 Tabel G : p < 0.0005 zie ook computeroutput kijken naar percentages voor richting van het verband
Percentages voorbeeld (expected - observed) vrouw man HC - HM 22.5% – 10.45% 22.5% - 23.13% HC - LM 12.5% – 5.22% 12.5% – 13.43% LC - HM 13% – 15.67% 13% – 3.73% LC - LM 19% – 18.66% 19% – 9.70%