Download de presentatie
GepubliceerdAlfred Smets Laatst gewijzigd meer dan 10 jaar geleden
1
Statistiek II Hoofdstuk 5: Toetsen voor twee populaties
Vanhoomissen & Valkeneers, hoofdstuk 5
2
Previously on Statistiek II
In wetenschappelijk onderzoek vertrekken we vanuit een onderzoeksvraag waaruit wordt afgeleid wat de populatie is en wat de onderzoekseenheden zijn. Om die vraag te beantwoorden verzamelen we data in de vorm van steekproeven omdat de hele populatie vaak moeilijk te onderzoeken is. Die steekproeven worden volgens bepaalde regels getrokken. Om via de verzamelde data de onderzoeksvraag te beantwoorden hebben we kansberekeningen nodig: kansen stellen ons in staat om te beslissen of een observatie heel uitzonderlijk is of eerder heel gewoon. Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen van mogelijke waarden en bijhorende kansen van een variabele. In de psychologie wordt de normale verdeling vaak gebruikt, aangezien veel kenmerken van mensen als normaal verdeeld in de populatie worden beschouwd. Omdat voor elk kenmerk een normale verdeling met een ander gemiddelde en standaarddeviatie geldt, is het onmogelijk om voor elke verdeling de exacte kansen te kennen. Daarom herleiden we die normale verdeling naar een standaardnormale verdeling door z-scores te berekenen. Daarna kunnen we de kansen van de z-scores aflezen uit een tabel. Bij hypothesetoetsing gebruiken we de steekproevenverdeling van het gemiddelde als kansverdeling. Ook hier zetten we waarden (gemiddelden!) om naar z-scores. We kunnen dan beslissen of ons geobserveerde gemiddelde uitzonderlijk is of niet. Als het uitzonderlijk is – volgens de verdeling die bij H0 hoort – dan verwerpen we H0. Hoofdstuk 5: Toetsen voor 2 populaties
3
Samenvatting Hoofdstuk 5: Toetsen voor 2 populaties
We zijn nooit helemaal zeker van de juistheid van onze conclusie na hypothesetoetsing: fouten zijn mogelijk, en belangrijk is dat we weten hoe groot de kans is op een fout. Bij hypothesetoetsing kan je overschrijdingskansen gebruiken, maar net zo goed kan je de kritieke waarden berekenen die bij de overschrijdingskansen horen. Hypotheses kunnen éénzijdig of tweezijdig getoetst worden. Eénzijdig toetsen geeft meer kans op significante resultaten, maar mag enkel toegepast worden als er een duidelijk verantwoorde richting in de hypothese zit. Naargelang de toetsingssituatie gebruiken we een verschillende toets om onze hypotheses te toetsen. Deze toetsen zijn ruwweg in te delen in twee groepen. Voor een parametrische toets moet de situatie aan meer voorwaarden voldoen, maar daar staat tegenover dat deze toetsen makkelijker een effect detecteren. Nonparametrische toetsen zijn minder afhankelijk van voorwaarden, maar ook minder krachtig. Hoofdstuk 5: Toetsen voor 2 populaties
4
1 onafh. nominaal 2 afh. 1 onafh. > 2 afh. interval/ ordinaal
type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit onafh. independent t-test / z-test Rank-sum nominaal 2 afh. dependent t-test Signed-ranks 1 onafh. one way ANOVA Kruskal-Wallis > 2 afh. repeated measures ANOVA Friedman’s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation onafh. n-way ANOVA nominaal afh. repeated measures ANOVA gemengd mixed design ANOVA > 1 interval multiple regression gemengd multiple regression 1 onafh. chi-square goodness of fit nominaal 1 nominaal/ ordinaal ≥ 2 onafh. Pearson chi-square
5
Vandaag Toetsen voor twee populaties
T-toets voor 2 gemiddelden, Wilcoxon Rank sum toets
6
Steekproeven 2 populaties vergelijken 2 steekproeven trekken Afhankelijke of onafhankelijke steekproeven? -> wordt niet bepaald door de populatie, maar wel door de manier van steekproeftrekken! 1. Afhankelijk met herhaalde metingen Uit de populatie wordt een steekproef getrokken waarvan een test wordt afgenomen. Op een ander moment nemen we opnieuw deze test af van exact dezelfde individuen Test voor slaperigheid afnemen van 30 studenten bij het begin van het hoorcollege Statistiek. Na 1 uur dezelfde test afnemen bij dezelfde studenten -> is er een effect van het hoorcollege op de slaperigheid? Hoofdstuk 5: Toetsen voor 2 populaties
7
Steekproeven 2. Afhankelijk met gematchte steekproeven Uit de populatie wordt een steekproef getrokken waarvan een test wordt afgenomen. Op een ander moment nemen we opnieuw deze test af van gelijkaardige, maar niet identieke individuen. Test voor slaperigheid afnemen van 30 studenten bij het begin van het hoorcollege Statistiek. Na 1 uur dezelfde test afnemen bij gelijkaardige studenten: Begin v/d les Na 1u Case1 Jan: man, 20j, sporter Peter: man 20j, sporter Case2 Mieke: vrouw, 21j, passief Sara: vrouw, 21j, passief Case3 Hanne: vrouw, 19j, extreme sporten Lotte: vrouw, 19j, extreme sporten Hoofdstuk 5: Toetsen voor 2 populaties
8
Steekproeven 3. Onafhankelijke steekproeven Voor het trekken van een tweede steekproef wordt op geen enkele manier rekening gehouden met de eerste steekproef. De grootte kan zelfs verschillen. Test voor slaperigheid afnemen van 30 willekeurige studenten bij het begin van het hoorcollege Statistiek. Na 1 uur dezelfde test afnemen bij 40 studenten die opnieuw willekeurig worden geselecteerd. Extra controle: randomisatie bij matching: elk lid van een gematcht paar random toewijzen aan een conditie/tijdstip bij onafhankelijke steekproeven: aselect getrokken cases worden randomgewijs toegekend aan een conditie/tijdstip Hoofdstuk 5: Toetsen voor 2 populaties
9
z-toets voor verschil tussen 2 gemiddelden
1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Besteden jongens evenveel tijd aan hun huiswerk als meisjes in de lagere school? Belangrijk: onafhankelijke steekproeven Hoofdstuk 5: Toetsen voor 2 populaties
10
z-toets voor verschil tussen 2 gemiddelden
2. Voorwaarden σ1 en σ2 zijn bekend en populaties zijn normaal verdeeld (ook bij kleine n) σ1 en σ2 zijn niet bekend en/of populaties zijn niet normaal verdeeld, maar n1 ≥ 100 en n2 ≥ 100 Want: als σ’s niet bekend zijn maar n1 ≥ 100 en n2 ≥ 100 dan mag je s gebruiken als populaties niet normaal verdeeld zijn maar n1 ≥ 100 en n2 ≥ dan mag je aannemen dat de afhankelijke variabele ook normaal verdeeld is Hoofdstuk 5: Toetsen voor 2 populaties
11
z-toets voor verschil tussen 2 gemiddelden
3. Hypothesen Linkseenzijdig H0: µ1 ≥ µ2 of H0: µ1 - µ2 ≥ 0 H1: µ1 < µ2 H1: µ1 - µ2 < 0 Rechtseenzijdig H0: µ1 ≤ µ2 H0: µ1 - µ2 ≤ 0 H1: µ1 > µ2 H1: µ1 - µ2 > 0 Tweezijdig H0: µ1 = µ2 H0: µ1 - µ2 = 0 H1: µ1 ≠ µ2 H0: µ1 - µ2 ≠ 0 Hoofdstuk 5: Toetsen voor 2 populaties
12
z-toets voor verschil tussen 2 gemiddelden
4. Toetsingsgrootheid Omdat de steekproeven elk afkomstig zijn uit normale verdelingen met bekende σ’s, kan men aantonen dat de steekproevenverdeling van x1 –x2 normaal verdeeld is met gemiddelde met standaardafwijking -> Z score van verschil tussen twee gemiddelden mag je vervangen door s indien σ niet gekend is en n > 100 Hoofdstuk 5: Toetsen voor 2 populaties
13
z-toets voor verschil tussen 2 gemiddelden
toetsingsgrootheid Z score van verschil tussen twee gemiddelden Kansverdeling: Standaardnormale verdeling Hoofdstuk 5: Toetsen voor 2 populaties
14
t-toets voor verschil tussen 2 gemiddelden
1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Vb. Besteden jongens evenveel tijd aan hun huiswerk dan meisjes in de lagere school? Belangrijk: onafhankelijke steekproeven 2. Voorwaarden σ1 en σ2 zijn niet bekend en populaties zijn normaal verdeeld en n1 < en n2 < 100 populaties zijn niet normaal verdeeld, 30 < n1 < 100 en 30 < n2 < 100 Hoofdstuk 5: Toetsen voor 2 populaties
15
t-toets voor verschil tussen 2 gemiddelden
3. Hypothesen Linkseenzijdig H0: µ1 ≥ µ2 of H0: µ1 - µ2 ≥ 0 H1: µ1 < µ2 H1: µ1 - µ2 < 0 Rechtseenzijdig H0: µ1 ≤ µ2 H0: µ1 - µ2 ≤ 0 H1: µ1 > µ2 H1: µ1 - µ2 > 0 Tweezijdig H0: µ1 = µ2 H0: µ1 - µ2 = 0 H1: µ1 ≠ µ2 H0: µ1 - µ2 ≠ 0 Hoofdstuk 5: Toetsen voor 2 populaties
16
t-toets voor verschil tussen 2 gemiddelden
2 varianten om de toetsingsgrootheid te berekenen: Variant 1: varianties in twee populaties zijn gelijk Variant 2: varianties in twee populaties zijn niet gelijk >> F-toets voor gelijke varianties (later meer uitgebreid) Hoofdstuk 5: Toetsen voor 2 populaties
17
t-toets voor verschil tussen 2 gemiddelden
Variant 1: varianties in twee populaties zijn gelijk σ²1 = σ²2 Populatievarianties zijn onbekend en worden geschat op basis van de twee steekproefvarianties s²1 en s²2; namelijk een schatting op basis van een gewogen gemiddelde van s²1 en s²2 -> ‘gepoolde’ variantie s²p Hoofdstuk 5: Toetsen voor 2 populaties
18
t-toets voor verschil tussen 2 gemiddelden
De standaardafwijking van de steekproevenverdeling van het verschil tussen twee gemiddelden is gebaseerd op de gepoolde variantie s²p -> t-score voor het verschil in gemiddelden van twee steekproeven uit populaties met gelijke varianties -> Kansverdeling: Student t-verdeling met df = n1+n2-2 meestal 0 Hoofdstuk 5: Toetsen voor 2 populaties
19
t-toets voor verschil tussen 2 gemiddelden
Variant 2: varianties in twee populaties zijn niet gelijk We gebruiken geen gepoolde variantie (sp) maar de standaardafwijkingen in elke steekproef (s1 en s2) Kansverdeling: Student t-verdeling met vrijheidsgraden (schatting): Hoofdstuk 5: Toetsen voor 2 populaties
20
t-toets voor verschil tussen 2 gemiddelden
5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pl (tx1-x2) ≤ α? >> linkseenzijdig Pr (tx1-x2) ≤ α? >> rechtseenzijdig Pd (tx1-x2) ≤ α? >> tweezijdig b. kritieke waarden : H0 verwerpen indien: vb. voor α = .05 en df = 17. (Andere α of df -> andere kritieke waarden!!) tx1-x2 ≤ >> linkseenzijdig tx1-x2 ≥ 1.74 >> rechtseenzijdig tx1-x2 ≤ of ≥ 2.11 >> tweezijdig Hoofdstuk 5: Toetsen voor 2 populaties
21
t-toets voor verschil tussen 2 gemiddelden
Vrouwelijke TP-docenten beweren meer Facebookvrienden te hebben dan hun mannelijke collega’s. Aantal vrienden van 23 docenten worden geregistreerd en vergeleken. Aantal vrienden is normaal verdeeld in de populatie. Resultaten: heren: n1 = 11 X1= en s1 = dames: n2 = 12 X2 = en s2 = Hoe zien H0 en H1 eruit? H0: µ1 = µ2 H1: µ1 µ2 -> tweezijdig toetsen 2. Welke toetsingsgrootheid? Sigma’s zijn onbekend, populaties normaal verdeeld, n1 en n2 < 100 -> t-toets Hoofdstuk 5: Toetsen voor 2 populaties
22
t-toets voor verschil tussen 2 gemiddelden
3. t-score van verschil berekenen 3.1 zijn varianties in populaties gelijk? Ja (zie verder F-toets) gepoolde variantie berekenen: 3.2 t-score bij gelijke varianties berekenen Hoofdstuk 5: Toetsen voor 2 populaties
23
t-toets voor verschil tussen 2 gemiddelden
4. Significantie? kritieke t-waarde opzoeken in tabel -> df = = 21 en alpha = 0.05 en 2-zijdig -> t-score vergelijken met kritieke t-score > dus H0 niet verwerpen Besluit? Hoofdstuk 5: Toetsen voor 2 populaties
24
F-toets voor 2 varianties
1. Toetsingssituatie Verschillen twee populatievarianties of niet? (als ‘hulptoets’ bij t-toets, of op zichzelf) 2. Voorwaarden Populaties waaruit steekproeven komen zijn normaal verdeeld Indien n > 100 is het minder erg als populaties niet normaal verdeeld zijn In SPSS: Levene’s test for equality of variances (ook F-toets) 3. Hypothesen Linkseenzijdig H0: σ²1 ≥ σ² of H0: σ²1 - σ²2 ≥ 0 H1: σ²1 < σ²2 H1: σ²1 - σ²2 < 0 Rechtseenzijdig H0: σ²1 ≤ σ²2 H0: σ²1 – σ²2 ≤ 0 H1: σ²1 > σ²2 H1: σ²1 - σ²2 > 0 Tweezijdig H0: σ²1 = σ²2 H0: σ²1 – σ²2 = 0 H1: σ²1 ≠ σ²2 H0: σ²1 – σ²2 ≠ 0 Hoofdstuk 5: Toetsen voor 2 populaties
25
F-toets voor 2 varianties
4. Toetsingsgrootheid met df1 = n1-1 en df2 = n2-1 opgelet: in teller altijd de grootste s² en in noemer altijd de kleinste s² F-toets: hoeveel maal is de grootste variantie groter dan de kleinste variantie? Indien H0 waar is zal F in de buurt van 1 liggen. Hoe groter F wordt, hoe aannemelijker dat de populatievarianties van elkaar verschillen. Kansverdeling: F-verdeling die bepaald wordt door df1 en df2 Hoofdstuk 5: Toetsen voor 2 populaties
26
F-toets voor 2 varianties
F-verdeling die bepaald wordt door df1 en df2 vb: F = 10/9 = 1.11 met df1 = 6 en df2 = 12 Opgelet: niet symmetrisch! -> we kunnen eigenlijk alleen rechtseenzijdig toetsen! P r (F = 1.11) = 0.41 F=1.11 Hoofdstuk 5: Toetsen voor 2 populaties
27
F-toets voor 2 varianties
5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pr (F) ≤ α? >> rechts/links eenzijdig Pd (F) = 2*Pr (F) ≤ α? >> tweezijdig b. kritieke waarden : H0 verwerpen indien: vb. voor α = .05 en df1 = 6 en df2 = 12. (Andere α of df -> andere kritieke waarden!!) F ≥ 3 >> rechts/links eenzijdig F ≥ 3.7 >> tweezijdig Hoofdstuk 5: Toetsen voor 2 populaties
28
F-toets voor 2 varianties
F-toets wordt in SPSS vaak mee gerapporteerd bij andere toetsen (Levene’s test bij t-test, ANOVA) Hoofdstuk 5: Toetsen voor 2 populaties
29
t-toets voor verschil tussen 2 gemiddelden in SPSS
Demo SPSS – independent samples t-test Muziekvoorkeuren Waarom luisteren we liever naar onze favoriete muziek dan naar andere muziek? Dopamineproductie vergelijken bij luisteren naar favoriete vs niet-favoriete muziek. Hoofdstuk 5: Toetsen voor 2 populaties
30
t-toets voor verschil tussen 2 gemiddelden
6. Effectgrootte 7. Rapporteren Om na te gaan of er bij het luisteren naar favoriete muziek meer dopamine aanwezig is in de hersenen dan bij het luisteren naar niet- favoriete muziek, werd een independent samples t-test uitgevoerd. Gemiddeld werd er meer dopamine gemeten in de conditie met favoriete muziek (M = 16.03, SD = 2.66) dan in de conditie met niet- favoriete muziek (M = 13.96, SD = 2.94). Dit effect was significant op niveau α = .05, t(58) = 2.86, p = .006, r = .12. Hoofdstuk 5: Toetsen voor 2 populaties
31
Wilcoxon Rank-Sum / Mann-Whitney toets
Verschil tussen 2 medianen ipv tussen 2 gemiddelden omdat variabele ook op ordinaal niveau kan gemeten worden 1. Toetsingssituatie Verschillen de scores in populatie 1 over het algemeen van de scores in populatie 2 waaruit de steekproeven afkomstig zijn? Vb. Verschillen mannen en vrouwen in opleidingsniveau ( = ordinale variabele)? = nonparametrische variant van onafhankelijke t-toets 2. Voorwaarden onafhankelijke steekproeven minstens ordinaal meetniveau scores hoeven niet normaal verdeeld te zijn Hoofdstuk 5: Toetsen voor 2 populaties
32
Wilcoxon Rank-Sum / Mann-Whitney toets
3. Hypotheses tweezijdig H0: θ1 = θ2 H1: θ1 ≠ θ2 rechtseenzijdig H0: θ1 ≤ θ2 H1: θ1 > θ2 linkseenzijdig H0: θ1 ≥ θ2 H1: θ1 < θ2 Hoofdstuk 5: Toetsen voor 2 populaties
33
Wilcoxon Rank-Sum / Mann-Whitney toets
4. Toetsingsgrootheid U bij Mann-Whitney W bij Wilcoxon SPSS: Analyze > nonparametric > 2 independent samples 5. Beslissingsregel Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ? ja: verwerp H0 nee: verwerp H0 niet Ter herinnering: SPSS geeft 2-zijdige overschrijdingskans -> als je éénzijdige overschrijdingskans nodig hebt (omdat je links- of rechtszijdig wil toetsen): overschrijdingskans uit SPSS delen door 2 en kijken of dat getal ≤ α (bv. 0.05) Hoofdstuk 5: Toetsen voor 2 populaties
34
Wilcoxon Rank-Sum / Mann-Whitney toets
4. Toetsingsgrootheid U bij Mann-Whitney W bij Wilcoxon SPSS: Analyze > nonparametric > 2 independent samples 5. Beslissingsregel Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ? ja: verwerp H0 nee: verwerp H0 niet Ter herinnering: SPSS geeft 2-zijdige overschrijdingskans -> als je éénzijdige overschrijdingskans nodig hebt (omdat je links- of rechtszijdig wil toetsen): overschrijdingskans uit SPSS delen door 2 en kijken of dat getal ≤ α (bv. 0.05) Hoofdstuk 5: Toetsen voor 2 populaties
35
Wilcoxon Rank-Sum / Mann-Whitney toets
2 groepen vergelijken op basis van ordinale schaal Berekening van W: a. Scores ordenen en rangen toekennen: b. Rangensom per groep berekenen: groep 1: = 41.5 groep 2: = 36.5 c. Toetsingsgrootheid = kleinste rangensom: Ws = 36.5 Score Groep Initiële rang Defintieve rang 3 1 5 2 6 3.5 4 8 10 14 7 15 9 18 11 21 12 Hoofdstuk 5: Toetsen voor 2 populaties
36
Wilcoxon Rank-Sum / Mann-Whitney toets
d. Ws omzetten naar z-score: wiskundige verwachting: standaarddeviatie: z-formule: overschrijdingskans: Hoofdstuk 5: Toetsen voor 2 populaties
37
Wilcoxon Rank-Sum / Mann-Whitney toets
Demo SPSS – Mann-Whitney / Wilcoxon Rank-Sum Voorkeur voor muziek meten aan de hand van ordinale schaal: Ik studeer nog liever drie dagen onophoudelijk inductieve statistiek dan hieraan deel te nemen Een documentaire over het paargedrag van de bidsprinkhaan lijkt me opwindender dan dit experiment Deelname aan dit experiment maakt me eigenlijk warm noch koud Het evenaart geen verjaardagsfeest, maar komt toch al in de buurt Ik heb me sinds mijn kindertijd niet meer zo gelukkig gevoeld Hoofdstuk 5: Toetsen voor 2 populaties
38
Wilcoxon Rank-Sum / Mann-Whitney toets
6. Effectgrootte 7. Rapportering Om na te gaan of het subjectief welbevinden van mensen groter is bij het luisteren naar favoriete muziek in tegenstelling tot niet-favoriete muziek werd een Mann-Whitney toets uitgevoerd. De score voor subjectief welbevinden was hoger in de conditie met favoriete muziek (Mdn = 4) dan in de conditie met niet-favoriete muziek (Mdn = 3). Dit verschil was significant op α = .05-niveau, Ws = 167.5, z = , p = .006, r = .51. Hoofdstuk 5: Toetsen voor 2 populaties
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.