Statistiek II Hoofdstuk 4: Toetsen voor één populatie

Slides:

Advertisements

Verwante presentaties

De gemiddelde leerling

Advertisements

Toetsen voor 2 populaties – afhankelijke steekproeven Hoofdstuk 6

Statistische uitspraken over onbekende populatiegemiddelden

Bij een herhaald experiment, met telkens dezelfde kans op succes gebruiken we de binomiale kansverdeling Een binomiale kansverdeling wordt gekenmerkt door.

HC2MFE Meten van verschillen

Onderscheidingsvermogen van hypothesetoetsen toegepast op de z-toets

Toetsen van verschillen tussen twee of meer groepen

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW Guido Valkeneers.

Inleiding tot inferentie

BRIDGE Vervolgcursus Vervolg op starterscursus Bridgeclub Schiedam ‘59 info: Maandagavond: 19: – of

Ronde (Sport & Spel) Quiz Night !

Natuurlijke Werkloosheid en de Phillipscurve

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

prNBN D addendum 1 Deel 2: PLT

Het vergelijken van twee populatiegemiddelden: Student’s t-toets

Beschrijvende en inferentiële statistiek

Kb.1 Ik leer op een goede manier optellen en aftrekken

Leiden University. The university to discover. ICLON, Interfacultair Centrum voor Lerarenopleiding, Onderwijsontwikkeling en Nascholing Denkgereedschap.

Beschrijvende en inferentiële statistiek

Beschrijvende en inferentiële statistiek

P-waarde versus betrouwbaarheidsinterval

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.

Statistiek II Hoofdstuk 5: Toetsen voor twee populaties

Statistiek 2 Hoofdstuk 2: Kansverdelingen en kansberekening

Hoofdstuk 7: Variantieanalyse hoofdstuk 7

Statistiek II Hoofdstuk 3: Betrouwbaarheidsintervallen en hypothesetoetsing Vanhoomissen & Valkeneers, hoofdstuk 3.

toetsen voor het verband tussen variabelen met gelijk meetniveau

Hoofdstuk 8: Variantieanalyse met herhaalde metingen hoofdstuk 8

vwo A Samenvatting Hoofdstuk 15

vwo C Samenvatting Hoofdstuk 14

Hypothese toetsen We hebben de volgende situatie.

Gegevensverwerving en verwerking

Non-parametrische technieken

Meervoudige lineaire regressie

Inferentie voor regressie

Oefeningen F-toetsen ANOVA.

P-waarde Wat is een p-waarde? De kans dat de toetsings-grootheid een extremere uitkomst (overeenkomstig met de alternatieve hypothese) geeft dan de waar-genomen.

Afhankelijkheidstabellen

Schatter voor covariantie

Eenzijdige Betrouwbaarheidsgrens

Een fundamentele inleiding in de inductieve statistiek

Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.

H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

variabelen vaststellen

Populatiegemiddelden: recap

13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.

Statistiek voor Historici

Methodologie & Statistiek I Toetsen van twee gemiddelden 6.1.

Methodologie & Statistiek I Toetsen van proporties 7.1.

Methodologie & Statistiek I Principes van statistisch toetsen 5.1.

2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.

ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B

havo/vwo D Samenvatting Hoofdstuk 4

Statistiekbegrippen en hoe je ze berekent!!

ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij

Hoofdstuk 5 Vijfkaart hoog, eerste verkenning 1e9 NdF-h1 NdF-h5 1 1.

17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.

De financiële functie: Integrale bedrijfsanalyse©

Centrummaten en Boxplot

Hoorcollege 3 Samenhang tussen variabelen

1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.

Baarde en de goede Hoofdstuk 11: Data-analyse

Het doel en de grondbeginselen van statistiek in klinische onderzoeken

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

Toetsen van verschillen tussen twee of meer groepen

Transcript van de presentatie:

Statistiek II Hoofdstuk 4: Toetsen voor één populatie Vanhoomissen & Valkeneers, hoofdstuk 4

Previously on Statistiek II In wetenschappelijk onderzoek vertrekken we vanuit een onderzoeksvraag waaruit wordt afgeleid wat de populatie is en wat de onderzoekseenheden zijn. Om die vraag te beantwoorden verzamelen we data in de vorm van steekproeven omdat de hele populatie vaak moeilijk te onderzoeken is. Die steekproeven worden volgens bepaalde regels getrokken. Om via de verzamelde data de onderzoeksvraag te beantwoorden hebben we kansberekeningen nodig: kansen stellen ons in staat om te beslissen of een observatie heel uitzonderlijk is of eerder heel gewoon. Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen van mogelijke waarden en bijhorende kansen van een variabele. In de psychologie wordt de normale verdeling vaak gebruikt, aangezien veel kenmerken van mensen als normaal verdeeld in de populatie worden beschouwd. Omdat voor elk kenmerk een normale verdeling met een ander gemiddelde en standaarddeviatie geldt, is het onmogelijk om voor elke verdeling de exacte kansen te kennen. Daarom herleiden we die normale verdeling naar een standaardnormale verdeling door z-scores te berekenen. Daarna kunnen we de kansen van de z-scores aflezen uit een tabel. Bij hypothesetoetsing gebruiken we de steekproevenverdeling van het gemiddelde als kansverdeling. Ook hier zetten we waarden (gemiddelden!) om naar z-scores. We kunnen dan beslissen of ons geobserveerde gemiddelde uitzonderlijk is of niet. Als het uitzonderlijk is – volgens de verdeling die bij H0 hoort – dan verwerpen we H0. Hoofdstuk 4: Toetsen voor 1 populatie

Previously on Statistiek II We zijn nooit helemaal zeker van de juistheid van onze conclusie na hypothesetoetsing: fouten zijn mogelijk, en belangrijk is dat we weten hoe groot de kans is op een fout. Bij hypothesetoetsing kan je overschrijdingskansen gebruiken, maar net zo goed kan je de kritieke waarden berekenen die bij de overschrijdingskansen horen. Hypotheses kunnen éénzijdig of tweezijdig getoetst worden. Eénzijdig toetsen geeft meer kans op significante resultaten, maar mag enkel toegepast worden als er een duidelijk verantwoorde richting in de hypothese zit. Hoofdstuk 4: Toetsen voor 1 populatie

Toetsen voor één populatie Z-toets, T-toets, X²-toets Vandaag Toetsen voor één populatie Z-toets, T-toets, X²-toets

Stramien toetsen 1. Toetsingssituatie Bij welk soort onderzoeksvragen gebruik je deze toets? 2. Voorwaarden Wanneer mag je deze toets wel/niet gebruiken? 3. Hypothesen Hoe zien H0 en H1 eruit wanneer je deze toets gebruikt? 4. Toetsingsgrootheid Welke grootheid bereken je en wat is de kansverdeling van die grootheid? 5. Beslissingsregels Wanneer verwerp je H0: via overschrijdingskansen of kritieke waarden? 6. Effectgrootte Hoe belangrijk is het gevonden effect? 7. Rapporteren Hoe vermeld je op een juiste manier de resultaten? Hoofdstuk 4: Toetsen voor 1 populatie

Z-toets voor het gemiddelde 1. Toetsingssituatie Heeft het gemiddelde van de populatie waaruit de steekproef afkomstig is een bepaalde waarde of niet? Vb. Is de gemiddelde IQ score van de populatie van mensen die een training gevolgd hebben meer dan 100? 2. Voorwaarden σ is bekend en populatie is normaal verdeeld (ook bij kleine N) σ is niet bekend en/of populatie is niet normaal verdeeld, maar N ≥ 100 Uitleg: als σ niet bekend is maar N ≥ 100 dan mag je s gebruiken als populatie niet normaal verdeeld is maar N ≥ 100 dan mag je aannemen dat steekproevenverdeling normaal verdeeld is Hoofdstuk 4: Toetsen voor 1 populatie

Z-toets voor het gemiddelde Hoofdstuk 4: Toetsen voor 1 populatie

Z-toets voor het gemiddelde 3. Hypothesen Linkseenzijdig H0: µ ≥ µ0 H1: µ < µ0 Rechtseenzijdig H0: µ ≤ µ0 H1: µ > µ0 Tweezijdig H0: µ = µ0 H1: µ ≠ µ0 µ0 = veronderstelde waarde voor populatiegemiddelde µ Hoofdstuk 4: Toetsen voor 1 populatie

Z-toets voor het gemiddelde 4. Toetsingsgrootheid te vervangen door s indien σ niet gekend is en N ≥ 100 Kansverdeling: Standaardnormale verdeling Hoofdstuk 4: Toetsen voor 1 populatie

Z-toets voor het gemiddelde 5. Beslissingsregels 2 mogelijkheden: overschrijdingskansen kritieke waarden a. H0 verwerpen indien: Pl (z x) ≤ α? >> linkseenzijdig Pr (z x) ≤ α? >> rechtseenzijdig Pd (z x) = 2*Pl (z x) ≤ α? (als X < μ) >> tweezijdig 2*Pr (z x) ≤ α? (als X > μ) Hoofdstuk 4: Toetsen voor 1 populatie

Z-toets voor het gemiddelde b. H0 verwerpen indien: z x ≤ -1.64 >> linkseenzijdig z x ≥ 1.64 >> rechtseenzijdig z x ≤ -1.96 (als X < μ) >> tweezijdig ≥ 1.96 (als X > μ) Telkens bij α = .05 ! Bij een andere α veranderen ook de kritieke waarden!! Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde 1. Toetsingssituatie Heeft het gemiddelde van de populatie waaruit de steekproef afkomstig is een bepaalde waarde of niet? 2. Voorwaarden σ is niet bekend en populatie is normaal verdeeld en N < 100 N > 30 en populatie is niet normaal verdeeld Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde 3. Hypothesen Linkseenzijdig H0: µ ≥ µ0 H1: µ < µ0 Rechtseenzijdig H0: µ ≤ µ0 H1: µ > µ0 Tweezijdig H0: µ = µ0 H1: µ ≠ µ0 µ0 = veronderstelde waarde voor populatiegemiddelde µ Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde 4. Toetsingsgrootheid cfr. Z-toets maar s ipv σ Kansverdeling: Student t-verdeling Vrijheidsgraden: df = N-1 Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Student t-verdeling Lijkt sterk op de normale verdeling - Symmetrisch - Gemiddelde = 0 - Bij oneindig grote steekproef identiek Verschillen: - Iets platter, dikkere staarten - Bepaald door grootte steekproef -> Meerdere t-verdelingen: parameter df William Gosset, zichtbaar tevreden met het ontdekken van de t-verdeling Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Wat zijn vrijheidsgraden? vrijheidsgraden = df = degrees of freedom = het aantal observaties waarvan de waarden arbitrair kunnen worden bepaald In deze t-toets: df = N-1 Vb. gemiddelde van 5 getallen is 10 -> hoeveel getallen mag ik dan vrij kiezen? Als ik 4 getallen arbitrair kies (bv. 5,11,3,8) dan ligt het 5e getal namelijk vast (nl. 23) opdat er een gemiddelde van 10 zou zijn Dus we hebben 5-1 of 4 vrijheidsgraden Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Vrijheidsgraden in de t-toets: Bij een t-toets gebruiken we s als schatter voor σ s = een afwijkingsscore: We weten dat het gemiddelde van afwijkingsscores altijd 0 is. Dus: als we met n (vb. 5) afwijkingsscores werken en het gemiddelde ligt vast nl. 0, dan kunnen we N-1 (vb. 4) afwijkingsscores vrij kiezen. Als de steekproefgrootte N is, dan is de t-verdeling voor het gemiddelde gebaseerd op N-1 vrijheidsgraden Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde 5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pl (t x) ≤ α? >> linkseenzijdig Pr (t x) ≤ α? >> rechtseenzijdig Pd (t x) = 2*Pl (t x) ≤ α? (als X < μ) >> tweezijdig 2*Pr (t x) ≤ α? (als X > μ) Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Rechtseenzijdig toetsen H0: µ ≤ 100 x = 102.93 sx = 12.36 n = 29 H1: µ > 100 t x = 102.93 – 100 √29 = 1.28 12.36 df = 28 P r = 0.11 t x = 1.28 -> is P r (t x) ≤ α? ja: verwerp H0 neen: verwerp H0 niet Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Probleem met overschrijdingskansen: Er zijn net zoveel t-verdelingen als er vrijheidsgraden zijn. Dan zouden er oneindig veel tabellen met overschrijdingskansen beschikbaar moeten zijn. -> toetsen met kritieke waarden Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde b. Toetsen met kritieke waarden -> t waarde opzoeken die hoort bij significantieniveau α -> Tabel kritieke waarden van de t-verdeling in bijlage 1 Rechtseenzijdig toetsen bij α = 0.05 en df = 28 -> rechter kritieke waarde = 1.701 df = 28 P r = 0.05 t = 1.701 -> t x ≥ 1.701 ? ja: verwerp H0 neen: verwerp H0 niet Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Onderzoekshypothese: vaders van grote gezinnen vinden van zichzelf dat ze geen gemiddelde intelligentie hebben. In de populatie is schatting van IQ normaal verdeeld met µ = 100. De onderzoeker laat 29 vaders in grote gezinnen hun IQ schatten. Resultaat in deze steekproef: X = 102.93 en s = 12.36 1. Hoe zien H0 en H1 eruit? H0: µ = 100 H1: µ ≠ 100 2. Welke toetsingsgrootheid? σ is onbekend, populatie is normaal verdeeld, N < 100 -> t-toets Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde 3. t score berekenen 4. Kritieke t waarde opzoeken in tabel -> df = 29-1 = 28 en α = 0.05 en 2-zijdig -> 2.048 Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde 5. t score vergelijken met kritieke t score 1.28 < 2.048 dus H0 niet verwerpen -2.048 2.048 Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Opmerking: SPSS gaat ervan uit dat σ niet gekend is en voert steeds een t-toets uit (dus ook in situaties waar een Z-toets toegelaten is) Maar: de overschrijdingskansen bij een t-toets zijn groter dan bij een z-toets (zie ook dikkere staarten in t-verdeling in vergelijking met z-verdeling) Gevolg: H0 zal minder snel verworpen worden bij een t-toets in vergelijking met een z-toets: 1-β (P om H0 terecht te verwerpen - onderscheidingsvermogen) neemt af We krijgen dus minder snel een significant resultaat bij een t- toets in vergelijking met een z-toets. Daarom eventueel manuele Z-toets gebruiken als aan de voorwaarden is voldaan. Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde Demo SPSS: metalfans en haarlengte Hebben metalfans langere haren dan de gemiddelde volwassene? Hoofdstuk 4: Toetsen voor 1 populatie

t-toets voor het gemiddelde 6. Effectgrootte 7. Rapporteren Om na te gaan of metalfans langere haren hebben dan de algemene bevolking werd een one sample t-test uitgevoerd. Gemiddeld hadden de metalfans uit de steekproef langere haren (M = 9.83, SD = 2.62) dan de referentiewaarde 8.9 uit de populatie, t(59) = 2.739, p = .008, r = .34. Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties Wat als niet voldaan is aan voorwaarden voor parametrisch toetsen bij bestuderen van 1 populatie? variabele niet normaal verdeeld in populatie? steekproef < 30 ? geen intervalvariabele?  χ²-toets voor frequenties Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties 1. Toetsingssituatie Stemmen de geobserveerde frequenties in de steekproef overeen met de verwachte frequenties op basis van normen of eerder onderzoek? Vb. Stemmen de frequenties leerlingen die lezen op niveau AVI-2, AVI-3, AVI-4 en AVI-5 in het tweede leerjaar van een bepaalde school overeen met de frequenties van deze leesniveaus in de algemene bevolking? 2. Voorwaarden de categorieën waarvan de frequenties bestudeerd worden moeten elkaar uitsluiten. 20% of minder van de categorieën heeft een verwachte frequentie kleiner dan 5; geen enkele categorie heeft een verwachte frequentie van minder dan 1; ordinale variabelen worden beschouwd als nominale variabelen. Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties 3. Hypothesen Enkel tweezijdig! H0: π1 = π2 = … = πk H1: niet H0 Of H0: π1 = πA ; π2 = πB ; … ; πk = πK Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties 4. Toetsingsgrootheid met df = k – 1 fo = geobserveerde frequenties fe = verwachte frequenties k = aantal categorieën Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties 5. Beslissingsregels overschrijdingskansen maar χ²-verdeling afhankelijk van df, dus teveel mogelijkheden om te tabelleren, daarom: kritieke waarden Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties 6. Effectgrootte (phi) (interpreteerbaar zoals r) 7. Rapporteren Verwachte en geobserveerde proportie, X², df, p-waarde. Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties Klas 2e leerjaar: 9 van 26 leerlingen lezen op niveau AVI-5. Ongewoon veel? Meer dan verwacht? Verwachte frequentie = 23% of 6/26 Geobserveerde frequentie = 35% of 9/26 Verschil groot genoeg om van significantie te spreken? Hypotheses: H0: πminder dan AVI-5 = 20 ; πAVI-5 of meer = 6 en H1: niet H0 Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties Hypotheses: H0: πminder dan AVI-5 = 20 ; πAVI-5 of meer = 6 en H1: niet H0 Toetsingsgrootheid: Beslissen: Is 1.95 groter dan kritieke waarde?  tabel kritieke X²-waarden kritieke waarde bij α = .05 en df = 1 is gelijk aan 3.84. Aangezien 1.95 < 3.84 wordt H0 niet verworpen. Hoofdstuk 4: Toetsen voor 1 populatie

χ²-toets voor frequenties Demo SPSS: voorkeur vrijetijdsactiviteit bij senioren. Een gemoedelijke Duitse gemeente wil in het kader van de budgettering voor recreatie weten of de senioren in de gemeente een uitgesproken voorkeur hebben voor een bepaalde vrijetijdsactiviteit. Een steekproef van senioren wordt gevraagd een keuze te maken tussen wandelen, fietsen of rotsklimmen. Hoofdstuk 4: Toetsen voor 1 populatie

1 onafh. nominaal 2 afh. 1 onafh. > 2 afh. interval/ ordinaal type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit onafh. independent t-test / z-test Rank-sum nominaal 2 afh. dependent t-test Signed-ranks 1 onafh. one way ANOVA Kruskal-Wallis > 2 afh. repeated measures ANOVA Friedman’s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation onafh. n-way ANOVA nominaal afh. repeated measures ANOVA gemengd mixed design ANOVA > 1 interval multiple regression gemengd multiple regression 1 onafh. chi-square goodness of fit nominaal 1 nominaal/ ordinaal ≥ 2 onafh. Pearson chi-square