De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Hoofdstuk 5: Toetsen voor twee populaties Vanhoomissen & Valkeneers, hoofdstuk 5 STATISTIEK II.

Verwante presentaties


Presentatie over: "Hoofdstuk 5: Toetsen voor twee populaties Vanhoomissen & Valkeneers, hoofdstuk 5 STATISTIEK II."— Transcript van de presentatie:

1 Hoofdstuk 5: Toetsen voor twee populaties Vanhoomissen & Valkeneers, hoofdstuk 5 STATISTIEK II

2 In wetenschappelijk onderzoek vertrekken we vanuit een onderzoeksvraag waaruit wordt afgeleid wat de populatie is en wat de onderzoekseenheden zijn. Om die vraag te beantwoorden verzamelen we data in de vorm van steekproeven omdat de hele populatie vaak moeilijk te onderzoeken is. Die steekproeven worden volgens bepaalde regels getrokken. Om via de verzamelde data de onderzoeksvraag te beantwoorden hebben we kansberekeningen nodig: kansen stellen ons in staat om te beslissen of een observatie heel uitzonderlijk is of eerder heel gewoon. Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen van mogelijke waarden en bijhorende kansen van een variabele. In de psychologie wordt de normale verdeling vaak gebruikt, aangezien veel kenmerken van mensen als normaal verdeeld in de populatie worden beschouwd. Omdat voor elk kenmerk een normale verdeling met een ander gemiddelde en standaarddeviatie geldt, is het onmogelijk om voor elke verdeling de exacte kansen te kennen. Daarom herleiden we die normale verdeling naar een standaardnormale verdeling door z-scores te berekenen. Daarna kunnen we de kansen van de z-scores aflezen uit een tabel. Bij hypothesetoetsing gebruiken we de steekproevenverdeling van het gemiddelde als kansverdeling. Ook hier zetten we waarden (gemiddelden!) om naar z-scores. We kunnen dan beslissen of ons geobserveerde gemiddelde uitzonderlijk is of niet. Als het uitzonderlijk is – volgens de verdeling die bij H0 hoort – dan verwerpen we H0. PREVIOUSLY ON STATISTIEK II 2 Hoofdstuk 5: Toetsen voor 2 populaties

3 We zijn nooit helemaal zeker van de juistheid van onze conclusie na hypothesetoetsing: fouten zijn mogelijk, en belangrijk is dat we weten hoe groot de kans is op een fout. Bij hypothesetoetsing kan je overschrijdingskansen gebruiken, maar net zo goed kan je de kritieke waarden berekenen die bij de overschrijdingskansen horen. Hypotheses kunnen éénzijdig of tweezijdig getoetst worden. Eénzijdig toetsen geeft meer kans op significante resultaten, maar mag enkel toegepast worden als er een duidelijk verantwoorde richting in de hypothese zit. Naargelang de toetsingssituatie gebruiken we een verschillende toets om onze hypotheses te toetsen. Deze toetsen zijn ruwweg in te delen in twee groepen. Voor een parametrische toets moet de situatie aan meer voorwaarden voldoen, maar daar staat tegenover dat deze toetsen makkelijker een effect detecteren. Nonparametrische toetsen zijn minder afhankelijk van voorwaarden, maar ook minder krachtig. SAMENVATTING 3 Hoofdstuk 5: Toetsen voor 2 populaties

4 interval/ ordinaal nominaal 1 > 1 1 one sample t-test / z-test 1 2 > 2 interval/ ordinaal onafh. afh. independent t-test / z-test dependent t-test one way ANOVA repeated measures ANOVA Pearson correlation nominaal interval gemengd afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA multiple regression Pearson chi-square multiple regression nominaal/ ordinaal onafh. type AV?aantal OV?type OV? hoeveel populaties? categorieën afhankelijk? parametrischnon-parametrisch Rank-sum Signed-ranks Kruskal-Wallis Friedman’s ANOVA Spearman correlation niet in dit boek chi-square goodness of fit 1 ≥ 2 chi-square goodness of fit onafh.

5 Toetsen voor twee populaties T-toets voor 2 gemiddelden, Wilcoxon Rank sum toets VANDAAG

6 2 populaties vergelijken  2 steekproeven trekken Afhankelijke of onafhankelijke steekproeven? -> wordt niet bepaald door de populatie, maar wel door de manier van steekproeftrekken! 1.Afhankelijk met herhaalde metingen Uit de populatie wordt een steekproef getrokken waarvan een test wordt afgenomen. Op een ander moment nemen we opnieuw deze test af van exact dezelfde individuen Test voor slaperigheid afnemen van 30 studenten bij het begin van het hoorcollege Statistiek. Na 1 uur dezelfde test afnemen bij dezelfde studenten -> is er een effect van het hoorcollege op de slaperigheid? STEEKPROEVEN 6 Hoofdstuk 5: Toetsen voor 2 populaties

7 2.Afhankelijk met gematchte steekproeven Uit de populatie wordt een steekproef getrokken waarvan een test wordt afgenomen. Op een ander moment nemen we opnieuw deze test af van gelijkaardige, maar niet identieke individuen. Test voor slaperigheid afnemen van 30 studenten bij het begin van het hoorcollege Statistiek. Na 1 uur dezelfde test afnemen bij gelijkaardige studenten: STEEKPROEVEN 7 Begin v/d lesNa 1u Case1Jan: man, 20j, sporter Peter: man 20j, sporter Case2Mieke: vrouw, 21j, passief Sara: vrouw, 21j, passief Case3Hanne: vrouw, 19j, extreme sporten Lotte: vrouw, 19j, extreme sporten Hoofdstuk 5: Toetsen voor 2 populaties

8 3.Onafhankelijke steekproeven Voor het trekken van een tweede steekproef wordt op geen enkele manier rekening gehouden met de eerste steekproef. De grootte kan zelfs verschillen. Test voor slaperigheid afnemen van 30 willekeurige studenten bij het begin van het hoorcollege Statistiek. Na 1 uur dezelfde test afnemen bij 40 studenten die opnieuw willekeurig worden geselecteerd. Extra controle: randomisatie bij matching: elk lid van een gematcht paar random toewijzen aan een conditie/tijdstip bij onafhankelijke steekproeven: aselect getrokken cases worden randomgewijs toegekend aan een conditie/tijdstip STEEKPROEVEN 8 Hoofdstuk 5: Toetsen voor 2 populaties

9 1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Besteden jongens evenveel tijd aan hun huiswerk als meisjes in de lagere school? Belangrijk: onafhankelijke steekproeven Z-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 9 Hoofdstuk 5: Toetsen voor 2 populaties

10 2. Voorwaarden σ1 en σ2 zijn bekend en populaties zijn normaal verdeeld (ook bij kleine n) σ1 en σ2 zijn niet bekend en/of populaties zijn niet normaal verdeeld, maar n1 ≥ 100 en n2 ≥ 100 Want: als σ’s niet bekend zijn maar n1 ≥ 100 en n2 ≥ 100 dan mag je s gebruiken als populaties niet normaal verdeeld zijn maar n1 ≥ 100 en n2 ≥ 100 dan mag je aannemen dat de afhankelijke variabele ook normaal verdeeld is Z-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 10 Hoofdstuk 5: Toetsen voor 2 populaties

11 3. Hypothesen LinkseenzijdigH0: µ1 ≥ µ2 of H0: µ1 - µ2 ≥ 0 H1: µ1 < µ2 H1: µ1 - µ2 < 0 RechtseenzijdigH0: µ1 ≤ µ2 H0: µ1 - µ2 ≤ 0 H1: µ1 > µ2 H1: µ1 - µ2 > 0 TweezijdigH0: µ1 = µ2H0: µ1 - µ2 = 0 H1: µ1 ≠ µ2H0: µ1 - µ2 ≠ 0 Z-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 11 Hoofdstuk 5: Toetsen voor 2 populaties

12 4. Toetsingsgrootheid Omdat de steekproeven elk afkomstig zijn uit normale verdelingen met bekende σ’s, kan men aantonen dat de steekproevenverdeling van x1 –x2 normaal verdeeld is met gemiddelde met standaardafwijking -> Z score van verschil tussen twee gemiddelden mag je vervangen door s indien σ niet gekend is en n > 100 Z-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 12 Hoofdstuk 5: Toetsen voor 2 populaties

13 toetsingsgrootheid  Z score van verschil tussen twee gemiddelden Kansverdeling: Standaardnormale verdeling Z-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 13 Hoofdstuk 5: Toetsen voor 2 populaties

14 1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Vb. Besteden jongens evenveel tijd aan hun huiswerk dan meisjes in de lagere school? Belangrijk: onafhankelijke steekproeven 2. Voorwaarden σ1 en σ2 zijn niet bekend en populaties zijn normaal verdeeld en n1 < 100 en n2 < 100 populaties zijn niet normaal verdeeld, 30 < n1 < 100 en 30 < n2 < 100 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 14 Hoofdstuk 5: Toetsen voor 2 populaties

15 3. Hypothesen LinkseenzijdigH0: µ1 ≥ µ2 of H0: µ1 - µ2 ≥ 0 H1: µ1 < µ2 H1: µ1 - µ2 < 0 RechtseenzijdigH0: µ1 ≤ µ2 H0: µ1 - µ2 ≤ 0 H1: µ1 > µ2 H1: µ1 - µ2 > 0 TweezijdigH0: µ1 = µ2H0: µ1 - µ2 = 0 H1: µ1 ≠ µ2H0: µ1 - µ2 ≠ 0 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 15 Hoofdstuk 5: Toetsen voor 2 populaties

16 2 varianten om de toetsingsgrootheid te berekenen: Variant 1: varianties in twee populaties zijn gelijk Variant 2: varianties in twee populaties zijn niet gelijk >> F-toets voor gelijke varianties (later meer uitgebreid) T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 16 Hoofdstuk 5: Toetsen voor 2 populaties

17 Variant 1: varianties in twee populaties zijn gelijk σ²1 = σ²2 Populatievarianties zijn onbekend en worden geschat op basis van de twee steekproefvarianties s²1 en s²2; namelijk een schatting op basis van een gewogen gemiddelde van s²1 en s²2 -> ‘gepoolde’ variantie s²p T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 17 Hoofdstuk 5: Toetsen voor 2 populaties

18 De standaardafwijking van de steekproevenverdeling van het verschil tussen twee gemiddelden is gebaseerd op de gepoolde variantie s²p -> t-score voor het verschil in gemiddelden van twee steekproeven uit populaties met gelijke varianties -> Kansverdeling: Student t-verdeling met df = n1+n2-2 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 18 Hoofdstuk 5: Toetsen voor 2 populaties meestal 0

19 Variant 2: varianties in twee populaties zijn niet gelijk We gebruiken geen gepoolde variantie (sp) maar de standaardafwijkingen in elke steekproef (s1 en s2) Kansverdeling: Student t-verdeling met vrijheidsgraden (schatting): T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 19 Hoofdstuk 5: Toetsen voor 2 populaties

20 5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pl (t x1-x2 ) ≤ α? >> linkseenzijdig Pr (t x1-x2 ) ≤ α?>> rechtseenzijdig Pd (t x1-x2 ) ≤ α? >> tweezijdig b. kritieke waarden : H0 verwerpen indien: vb. voor α =.05 en df = 17. (Andere α of df -> andere kritieke waarden!!) t x1-x2 ≤ >> linkseenzijdig t x1-x2 ≥ 1.74 >> rechtseenzijdig t x1-x2 ≤ of ≥ 2.11 >> tweezijdig T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 20 Hoofdstuk 5: Toetsen voor 2 populaties

21 Vrouwelijke TP-docenten beweren meer Facebookvrienden te hebben dan hun mannelijke collega’s. Aantal vrienden van 23 docenten worden geregistreerd en vergeleken. Aantal vrienden is normaal verdeeld in de populatie. Resultaten: heren: n1 = 11 X1= en s1 = dames: n2 = 12 X2 = en s2 = Hoe zien H0 en H1 eruit? H0: µ1 = µ2 H1: µ1  µ2 -> tweezijdig toetsen 2. Welke toetsingsgrootheid? Sigma’s zijn onbekend, populaties normaal verdeeld, n1 en n2 < 100 -> t-toets T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 21 Hoofdstuk 5: Toetsen voor 2 populaties

22 3. t-score van verschil berekenen 3.1 zijn varianties in populaties gelijk?  Ja (zie verder F-toets)  gepoolde variantie berekenen: 3.2 t-score bij gelijke varianties berekenen T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 22 Hoofdstuk 5: Toetsen voor 2 populaties

23 4. Significantie? kritieke t-waarde opzoeken in tabel -> df = = 21 en alpha = 0.05 en 2-zijdig -> t-score vergelijken met kritieke t-score > dus H0 niet verwerpen Besluit? T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 23 Hoofdstuk 5: Toetsen voor 2 populaties

24 1. Toetsingssituatie Verschillen twee populatievarianties of niet? (als ‘hulptoets’ bij t-toets, of op zichzelf) 2. Voorwaarden Populaties waaruit steekproeven komen zijn normaal verdeeld Indien n > 100 is het minder erg als populaties niet normaal verdeeld zijn In SPSS: Levene’s test for equality of variances (ook F-toets) 3. Hypothesen LinkseenzijdigH0: σ²1 ≥ σ²2 of H0: σ²1 - σ²2 ≥ 0 H1: σ²1 < σ²2 H1: σ²1 - σ²2 < 0 RechtseenzijdigH0: σ²1 ≤ σ²2 H0: σ²1 – σ²2 ≤ 0 H1: σ²1 > σ²2 H1: σ²1 - σ²2 > 0 TweezijdigH0: σ²1 = σ²2H0: σ²1 – σ²2 = 0 H1: σ²1 ≠ σ²2H0: σ²1 – σ²2 ≠ 0 F-TOETS VOOR 2 VARIANTIES 24 Hoofdstuk 5: Toetsen voor 2 populaties

25 4. Toetsingsgrootheid met df1 = n1-1 en df2 = n2-1 opgelet: in teller altijd de grootste s² en in noemer altijd de kleinste s² F-toets: hoeveel maal is de grootste variantie groter dan de kleinste variantie? Indien H0 waar is zal F in de buurt van 1 liggen. Hoe groter F wordt, hoe aannemelijker dat de populatievarianties van elkaar verschillen. Kansverdeling: F-verdeling die bepaald wordt door df1 en df2 F-TOETS VOOR 2 VARIANTIES 25 Hoofdstuk 5: Toetsen voor 2 populaties

26 F-verdeling die bepaald wordt door df1 en df2 vb: F = 10/9 = 1.11 met df1 = 6 en df2 = 12 Opgelet: niet symmetrisch! -> we kunnen eigenlijk alleen rechtseenzijdig toetsen! F-TOETS VOOR 2 VARIANTIES 26 Hoofdstuk 5: Toetsen voor 2 populaties P r (F = 1.11) = 0.41 F=1.11

27 5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pr (F) ≤ α?>> rechts/links eenzijdig Pd (F) = 2*Pr (F) ≤ α? >> tweezijdig b. kritieke waarden : H0 verwerpen indien: vb. voor α =.05 en df1 = 6 en df2 = 12. (Andere α of df -> andere kritieke waarden!!) F ≥ 3 >> rechts/links eenzijdig F ≥ 3.7 >> tweezijdig F-TOETS VOOR 2 VARIANTIES 27 Hoofdstuk 5: Toetsen voor 2 populaties

28 F-toets wordt in SPSS vaak mee gerapporteerd bij andere toetsen (Levene’s test bij t-test, ANOVA) F-TOETS VOOR 2 VARIANTIES 28 Hoofdstuk 5: Toetsen voor 2 populaties

29 Demo SPSS – independent samples t-test Muziekvoorkeuren Waarom luisteren we liever naar onze favoriete muziek dan naar andere muziek? Dopamineproductie vergelijken bij luisteren naar favoriete vs niet-favoriete muziek. T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN IN SPSS 29 Hoofdstuk 5: Toetsen voor 2 populaties

30 6. Effectgrootte 7. Rapporteren Om na te gaan of er bij het luisteren naar favoriete muziek meer dopamine aanwezig is in de hersenen dan bij het luisteren naar niet- favoriete muziek, werd een independent samples t-test uitgevoerd. Gemiddeld werd er meer dopamine gemeten in de conditie met favoriete muziek (M = 16.03, SD = 2.66) dan in de conditie met niet- favoriete muziek (M = 13.96, SD = 2.94). Dit effect was significant op niveau α =.05, t(58) = 2.86, p =.006, r =.12. T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 30 Hoofdstuk 5: Toetsen voor 2 populaties

31 Verschil tussen 2 medianen ipv tussen 2 gemiddelden omdat variabele ook op ordinaal niveau kan gemeten worden 1. Toetsingssituatie Verschillen de scores in populatie 1 over het algemeen van de scores in populatie 2 waaruit de steekproeven afkomstig zijn? Vb. Verschillen mannen en vrouwen in opleidingsniveau ( = ordinale variabele)? = nonparametrische variant van onafhankelijke t-toets 2. Voorwaarden onafhankelijke steekproeven minstens ordinaal meetniveau scores hoeven niet normaal verdeeld te zijn WILCOXON RANK-SUM / MANN- WHITNEY TOETS 31 Hoofdstuk 5: Toetsen voor 2 populaties

32 3. Hypotheses WILCOXON RANK-SUM / MANN- WHITNEY TOETS 32 tweezijdigH 0 : θ 1 = θ 2 H1: θ 1 ≠ θ 2 rechtseenzijdigH 0 : θ 1 ≤ θ 2 H1: θ 1 > θ 2 linkseenzijdigH 0 : θ 1 ≥ θ 2 H1: θ 1 < θ 2 Hoofdstuk 5: Toetsen voor 2 populaties

33 4. Toetsingsgrootheid U bij Mann-Whitney W bij Wilcoxon SPSS: Analyze > nonparametric > 2 independent samples 5. Beslissingsregel Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ? ja: verwerp H 0 nee: verwerp H 0 niet Ter herinnering: SPSS geeft 2-zijdige overschrijdingskans -> als je éénzijdige overschrijdingskans nodig hebt (omdat je links- of rechtszijdig wil toetsen): overschrijdingskans uit SPSS delen door 2 en kijken of dat getal ≤ α (bv. 0.05) WILCOXON RANK-SUM / MANN- WHITNEY TOETS 33 Hoofdstuk 5: Toetsen voor 2 populaties

34 4. Toetsingsgrootheid U bij Mann-Whitney W bij Wilcoxon SPSS: Analyze > nonparametric > 2 independent samples 5. Beslissingsregel Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ? ja: verwerp H 0 nee: verwerp H 0 niet Ter herinnering: SPSS geeft 2-zijdige overschrijdingskans -> als je éénzijdige overschrijdingskans nodig hebt (omdat je links- of rechtszijdig wil toetsen): overschrijdingskans uit SPSS delen door 2 en kijken of dat getal ≤ α (bv. 0.05) WILCOXON RANK-SUM / MANN- WHITNEY TOETS 34 Hoofdstuk 5: Toetsen voor 2 populaties

35 2 groepen vergelijken op basis van ordinale schaal Berekening van W: a. Scores ordenen en rangen toekennen: b. Rangensom per groep berekenen: groep 1: = 41.5 groep 2: = 36.5 c. Toetsingsgrootheid = kleinste rangensom: W s = 36.5 WILCOXON RANK-SUM / MANN- WHITNEY TOETS 35 ScoreGroep Initiële rang Defintieve rang Hoofdstuk 5: Toetsen voor 2 populaties

36 d. W s omzetten naar z-score: wiskundige verwachting: standaarddeviatie: z-formule: overschrijdingskans: WILCOXON RANK-SUM / MANN- WHITNEY TOETS 36 Hoofdstuk 5: Toetsen voor 2 populaties

37 Demo SPSS – Mann-Whitney / Wilcoxon Rank-Sum Voorkeur voor muziek meten aan de hand van ordinale schaal: WILCOXON RANK-SUM / MANN- WHITNEY TOETS 37 Ik studeer nog liever drie dagen onophoudelijk inductieve statistiek dan hieraan deel te nemen Een documentaire over het paargedrag van de bidsprinkhaan lijkt me opwindender dan dit experiment Deelname aan dit experiment maakt me eigenlijk warm noch koud Het evenaart geen verjaardagsfeest, maar komt toch al in de buurt Ik heb me sinds mijn kindertijd niet meer zo gelukkig gevoeld Hoofdstuk 5: Toetsen voor 2 populaties

38 6. Effectgrootte 7. Rapportering Om na te gaan of het subjectief welbevinden van mensen groter is bij het luisteren naar favoriete muziek in tegenstelling tot niet-favoriete muziek werd een Mann-Whitney toets uitgevoerd. De score voor subjectief welbevinden was hoger in de conditie met favoriete muziek (Mdn = 4) dan in de conditie met niet-favoriete muziek (Mdn = 3). Dit verschil was significant op α =.05-niveau, W s = 167.5, z = , p =.006, r =.51. WILCOXON RANK-SUM / MANN- WHITNEY TOETS 38 Hoofdstuk 5: Toetsen voor 2 populaties


Download ppt "Hoofdstuk 5: Toetsen voor twee populaties Vanhoomissen & Valkeneers, hoofdstuk 5 STATISTIEK II."

Verwante presentaties


Ads door Google