Populatiegemiddelden: recap
Statistische uitspraken over onbekende populatiepercentages Uitspraken over één populatiepercentage Het vergelijken van twee populatiepercentages Het vergelijken van meer dan twee populatiepercentages
Statistische uitspraken over onbekende populatiepercentages Uitspraken over één populatiepercentage Uitgangspunt veronderstel: prevalentie in ‘populatie’= B aselecte steekproef: omvang n aantal zieken: X schatting prevalentie : p= X/n Vraag: wat zegt p over B ? B ligt vast p hangt van toeval af
Statistische uitspraken over onbekende populatiepercentages Uitspraken over één populatiepercentage Aantal X: binomiale verdeling met parameters n en B Kansverdeling p: Als n groot genoeg, dan kan de binomiale verdeling benaderd worden door de normale verdeling, met dezelfde verwachting en variantie. als n.B > 5 en n(1- B) > 5 gemiddelde :p = B en standaardeviatie Pr ( X ' x ) n B 1 &
Statistische uitspraken over onbekende populatiepercentages Uitspraken over één populatiepercentage Schatting, precisie: p bij normale verdeling: uitkomst ligt met 95% kans tussen :p +/- 1.96F praktisch: Toetsting: Z = gestandaardiseerde verschil als Z >= 1.96 dan nul hypothese te verwerpen op basis van 95% betrouwbaarheidsniveau
Statistische uitspraken over onbekende populatiepercentages Uitspraken over één populatiepercentage Voorbeeld: Veronderstel dat een ziekte de laatste jaren bij 20% van de mensen voorkomt (geen toevalsvariatie meer) Het laatste jaar wordt in een aselecte steekproef van 100 personen bij 25 personen de ziekte vastgesteld. Is dit toeval ? B0 = 20% p = 25% n = 100 Bereken Z : Wat is de probabiliteit dat Z gelijk is of groter dan deze waarde ?
Statistische uitspraken over onbekende populatiepercentages Uitspraken over één populatiepercentage Betrouwbaarheidsinterval: Hierbij is de geschatte standaarddeviatie van kansverdeling van p of de standaardfout op het geobserveerde percentage (schatter voor het populatiepercentage B)
Statistische uitspraken over onbekende populatiepercentages Uitspraken over één populatiepercentage Opmerkingen: normale benadering i.p.v. binomiaal cave n =< 20 exacte betrouwbaarheidsintervallen op basis van tabellen voor binomiaal verdeling Eenzijdig vs. tweezijdig toetsen
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages Voorbeeld: BA BB
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages Voorbeeld: werk uit: vergelijking van twee behandelingen : A: 125 personen, aantal successen 100 B: 125 personen, aantal successen 70 Alternatief: (1-alfa) betrouwbaarheidsinterval op het verschil (pA - pB) - Z£.se (pA - pB) < (BA - BB) < (pA - pB) + Z£.se (pA - pB)
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Verwachting? succes falen Totaal ‘behandeld’ 3 7 10 ‘placebo’ 1 9 4 16 20
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Afwijking? succes falen Totaal ‘behandeld’ 2 8 10 ‘placebo’ 4 16 20
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Totale afwijking? succes falen Totaal ‘behandeld’ 3 - 2 = 1 7 - 8 = -1 10 ‘placebo’ 1 - 2 = -1 9 - 8 = 1 4 16 20
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Verwachting? succes falen Totaal ‘behandeld’ 43 57 100 ‘placebo’ 21 79 64 136 200
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Afwijking? succes falen Totaal ‘behandeld’ 32 68 100 ‘placebo’ 64 136 200
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Totale afwijking? succes falen Totaal ‘behandeld’ 43 – 32 57 – 68 100 ‘placebo’ 21 – 32 79 – 68 64 136 200
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 ? succes falen Totaal ‘behandeld’ 11 -11 100 ‘placebo’ 64 136 200
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Welke belangrijkst ? succes falen Totaal ‘behandeld’ (11)² (-11)² 100 ‘placebo’ 64 136 200
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Som = G, heeft zgn. Chi-kwadraat verdeling (1 vrijheidsgraad) hieruit p-waarde… succes falen Totaal ‘behandeld’ (11)²/43 (-11)²/57 100 ‘placebo’ (-11)²/21 (11)²/79 64 136 200
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Dobbelsteen vs muntstuk: experiment 1: N = 20 Som = 11.12, 1 df, p-waarde = 0.0009… succes falen Totaal ‘behandeld’ (11)²/43 (-11)²/57 100 ‘placebo’ (-11)²/21 (11)²/79 64 136 200
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages: chi-kwadraat Voorbeeld: Id., op basis van constructie 2X2-tabel geen verband: waargenomen celfrequenties (O) gelijk aan de verwachte celfrequenties (E) E = (rijtotaal x kolomtotaal) / n
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages Voorbeeld: tabel van verwachte aantallen E maat voor aan te geven hoezeer de waargenomen aantallen O afwijken van de verwachte aantallen E : nb. opnieuw een vorm van ‘gestandaardiseerd verschil’
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van twee populatiepercentages Chi-kwadraat: historisch belang uit te breiden naar tabellen met meer rijen en kolommen continuïteitscorrectie mogelijk (Yates) Exacte p-waarde: Fisher’s exacte test (op basis van hypergeometrische verdeling)
Statistische uitspraken over onbekende populatiepercentages Het vergelijken van meer dan twee populatiepercentages kansverdeling van chi-kwadraat hangt af van het aantal rijen (r) en het aantal kolommen (k), en wel van (r-1).(k-1) wat men het aantal vrijheidsgraden noemt. Aantal vrijheidsgraden is het aantal cellen waarvoor men het aantal vrij kan kiezen bij vaste randtotalen, hier dus 2.
Statistische uitspraken over onbekende populatiepercentages Voorbeelden
Statistische uitspraken over onbekende populatiepercentages Voorbeelden
Statistische uitspraken over onbekende populatiepercentages Betrouwbaarheid en onderscheidingsvermogen betrouwbaarheid: ontbreken van fouten van de eerste soort (alfa) onderscheidingsvermogen: ontbreken van fouten van de tweede soort (beta) STEEKPROEFGROOTTE ??