De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

1 Herhaling: hoe kan een eenzijdige grens gevonden worden m.b.v. Statistisch Compendium? Gevraagd: rechtseenzijdige 95% betrouwbaarheidsgrens. Antwoord:

Verwante presentaties


Presentatie over: "1 Herhaling: hoe kan een eenzijdige grens gevonden worden m.b.v. Statistisch Compendium? Gevraagd: rechtseenzijdige 95% betrouwbaarheidsgrens. Antwoord:"— Transcript van de presentatie:

1 1 Herhaling: hoe kan een eenzijdige grens gevonden worden m.b.v. Statistisch Compendium? Gevraagd: rechtseenzijdige 95% betrouwbaarheidsgrens. Antwoord:  = Pas formule toe, gebruik rechter- grens, maar met  i.p.v.  /2, dus deze is Eenzijdige Betrouwbaarheidsgrens Het tweezijdig 100*(1-  ) % b.i. voor  2 is nu (zie compendium):

2 2 Een betrouwbaarheidsinterval wordt smaller naarmate de steekproefomvang (sample size) groter wordt. Stel we willen dat de breedte van het (95%) b.i. maximaal 2B is. De vraag: hoe groot moet de steekproef zijn om dit te garanderen? Als voorbeeld hoe je dit probleem aanpakt kijken we naar een b.i. voor  in één steekproef wanneer de variantie onbekend is: De breedte van dit interval is Helaas, S weten we van tevoren niet. Maar, we kunnen wel eerst een kleine ‘pilotstudy’ doen: we nemen n = 10 en schatten S, de steekproefstandaard- deviatie. Nu vereisen we We zijn er bijna: we pluggen de geschatte waarde S en vervolgens verhogen we systematisch n totdat aan de ongelijkheid wordt voldaan. Steekproefomvang

3 3 Grafisch Steekproefomvang µ n=500 is dus voldoende in dit geval

4 4 De nulhypothese: H 0. De nulhypothese geeft over het algemeen de situatie weer: geen effect, de waarde van de parameter is zoals we die verwachten, er is geen verschil. Voorbeelden: 1. Laat  1 de gemiddelde bloeddrukverlaging (van de populatie) zijn over een bepaalde tijd na toedienen van een medicijn en  2 de gemiddelde bloeddrukverlaging (van de populatie) zijn over een bepaalde tijd na toedienen van een ander medicijn. Dan, H 0 :  1 =  Casino (zie week 5): Casino belazert de boel niet, kans op nul is 1/37. Dan, H 0 : p = 1/37. Altenatieve hypothese: H 1. Dat wat je wilt aantonen: er is een effect, er is een verschil. Als je niet geïnteresseerd bent in de richting van het effect dan zal je altijd tweezijdig toetsen. H 1 is dan simpelweg de ontkenning van H 0. Hypothese opstellen

5 5 H 1 : Dat wat je wilt aantonen: er is een effect, er is een verschil. Als je niet geïnteresseerd bent in de richting van het effect dan zal je altijd tweezijdig toetsen. H 1 is dan simpelweg de ontkenning van H 0. (ongelijkheid) Ongelijkheid kan betekenen > of <. Soms is men echter alleen geïnteresseerd in een van de twee mogelijke richtingen. Dan is H 1 eenzijdig en in de richting van de interesse. Voorbeelden 1.Laat  1 de gemiddelde bloeddrukverlaging (van de populatie) zijn over een bepaalde tijd na toedienen van een medicijn en  2 de gemiddelde bloeddruk-verlaging (van de populatie) zijn over een bepaalde tijd na toedienen van een ander medicijn. Dan, H 0 :  1 =  2 en H 1 :  1   2. Echter als het 2e medicijn een placebo is, dan zal men alleen willen weten of 1 beter werkt: H 1 :  1 >  2. 2.Casino: men wil weten of het casino de boel belazert. Dat is alleen het geval als p > 1/37, dus H 1 : p > 1/37. Hypothese opstellen, vervolg

6 6 Uiteindelijk zullen we de nulhypothese verwerpen (reject) of niet. Wat kunnen we concluderen bij verwerpen? Dat met (1 -  )*100% zekerheid we kunnen stellen dat de alternatieve hypothese H 1 waar is. ‘Er is een effect’ Dit is een sterke uitspraak. Wat kunnen we zeggen als H 0 niet verworpen wordt? We kunnen stellen dat er niet genoeg bewijs in de data is om H 0 te verwerpen ten faveure van H 1. Let wel: hiermee weten we niet zeker of H 0 waar is. Het kan ook zijn dat we niet genoeg data hebben om H 1 te onder- steunen. Dit is een zwakke uitspraak. Het aantonen van ‘geen effect’ (H 0 ) is dus veel moeilijker dan het aantonen van een effect. Hypothese (niet) verwerpen

7 7 Doorloop stappen van het toetsen (testing). 1.Wat is de interesseparameter ( ,  2, p )? Wat zijn de veronderstellingen (normale verdeling ja/nee?) 2. Opstellen hypothesen. Eenzijdig of tweezijdig? 3.Welke situatie: bekende variantie. onbekende variantie: gelijk veronderstellen of niet? 4.Hoe gaan we toetsen? a) M.b.v. de computer: p-waarden b) Opstellen betrouwbaarheidsinterval c) Bereken toetsingsgrootheid, vergelijk met tabel 5.Nulhypothese verwerpen als a) p-waarde kleiner of gelijk aan  b) waarde van parameter onder nulhypothese valt buiten (1 -  )*100% betrouwbaarheidsinterval c) Toetsingsgrootheid in kritieke gebied valt. Toetsen, stapsgewijs

8 8 t-verdeling

9 9 Voorbeeld: Dit zijn de gemeten (gemiddelde) januaritemperaturen in West Europa de afgelopen 20 jaar. Data: 3.9, 2.3, 4.0, 4.5, 1.5, 2.2, 1.7, 3.6, 6.1, 1.2, 5.3, 3.3, -0.6, 5.2, 0.2, 0.9, 2.6, 2.2, 3.4, 2.8 Veronderstel  is onbekend Toetsen van hypothesen, voorbeeld

10 10 1.Interesseparameter: , normaliteit is gecontroleerd 2. Hypothese: H 0 :  = 2 H 1 :  > 2 3.Situatie: Variantie onbekend, één streekproef. 4.Toetsingsgrootheid: onder H 0 : T ~ t 19 Waargenomen: Waargenomen toetsingsgrootheid: 5.Beslissing: Verwerp H 0 als t “onwaarschijnlijk groot” als dus als t > Dit is het kritieke gebied of verwerpingsgebied (rejection area). Dus conclusie: verwerp H 0 t-toets

11 11 De t-toets 1.Bepaal situatie. Interesseparameter:  Normale verdeling redelijk (plots: week 4). 2.Toetsingsprobleem H 0 :  =  0 a. H 1 :    0 b. H 1 :  >  0 c. H 1 :  <  0 3.Hier: steekproef met µ en  2 onbekend: t-toets (als variantie bekend is: Z- toets) 4.We gaan een toetsingsgrootheid (test statistic) gebruiken. onder H 0 : T ~ t n-1 5.Beslissingscriterium Verwerp H 0 bij significantie niveau  als a. of als b. c. Toetsen m.b.v. toetsingsgrootheid

12 12 Belangrijkste vraag: welke toets heb ik nodig in welke situatie? Ga het volgende na: Wordt er gevraagd om een eenzijdige toets of een tweezijdige toets? Eenzijdig: links of rechts, gebruik  i.p.v.  /2 in formules. Hebben we te maken met gepaarde waarnemingen (dus steeds twee waarnemingen op hetzelfde object/individu) of niet? Zijn de varianties bekend en gegeven? Gebruik dan de z -waarden (percentagepunten) Zijn de varianties onbekend, gebruik dan de t – waarden met het juiste aantal vrijheidsgraden. Worden de variantie gelijk verondersteld of niet? Samenvatting toetsen voor µ

13 13 Wat is een p-waarde? De kans dat de toetsings- grootheid een extremere uitkomst (overeenkomstig met de alternatieve hypothese) geeft dan de waar- genomen waarde wanneer de nulhypothese zou gelden Tweezijdig: Eenzijdig: als H 1 :  > 0 dan P(T > t), als H 1 :  < 0 dan P(T < t). Ook wel als definitie: het kleinste significantieniveau (  ) dat nog leidt tot verwerping. p-waarde

14 14 Laat  de interesseparameter zijn. De volgende uitspraken zijn equivalent: H 0 :  =  0 wordt verworpen ten gunste van H 1 :    0 omdat: H 0 :  =  0 wordt verworpen ten gunste van H 1 :  >  0 omdat: Toetsen, betrouwbaarheidsintervallen en p-waarden: equivalentie p-waarde van de tweezijdige toets kleiner is dan .  0 buiten het tweezijdig 1-  b.i. van  ligt. de toetsingsgrootheid in het kritieke gebied voor significantieniveau  valt. p-waarde van de eenzijdige toets kleiner is dan .  0 groter is dan het rechtseenzijdige 1-  betrouwbaarheidsgrens voor  de toetsingsgrootheid groter is dan de eenzijdige kritieke grens voor significantieniveau .

15 15 Van een bepaald casino vermoedt de kansspel- commissie dat ze de boel belazeren. Hun roulettetafel zou niet zuiver zijn en de kans op ‘0’ zou groter zijn dan 1/37, waardoor klanten meer kans hebben hun inzet te verliezen. Daarom wordt de tafel 2000 keer getest, waarvan 90 keer een ‘0’ valt. We willen nu weten of de ware ‘succeskans’(=kans op ‘0’) te groot is. Week 5 behandelt de manier om dit te doen mbv betrouwbaar- heidsintervallen. Nu doen we ook een toets. 1. Interesseparameter: p. Veronderstelling: normale benadering voor binomiaal mag gebruikt worden. 2.Opstellen hypothesen: H 0 : p = 1/37, H 1 : p > 1/37 Eenzijdig dus! 3.Situatie: toets op fractie, variantie: p’(1-p’)/n met p’ schatter voor ‘succeskans’ p: x/n = 90/2000, waarbij x het aantal ‘0’ en in n experimenten is. Toetsen, fracties voorbeeld

16 16 4. Hoe gaan we toetsen? Ter illustratie methoden a) en c): a)M.b.v. de computer: p-waarden c) Bereken toetsingsgrootheid, vergelijk met tabel z = Kritieke grens bij  = 0.01: z 0.01 = Nulhypothese verwerpen als a) p-waarde kleiner of gelijk aan 0.01 p-waarde < , dus verwerpen. c) Toetsingsgrootheid in kritieke gebied valt. z = 3.88 > 2.33, dus verwerpen. Toetsen, fracties voorbeeld, vervolg

17 17 Toetsen in de praktijk gebeurt vrijwel altijd met de computer. Installatie Statgraphics: Public Folders Open data set: Heart.sf (deze staat in de Statgraphics directory (onder ‘Program Files’) onder de subdirectory ‘data’) Verwijder controle data, kies ‘compare’ -> ‘two samples’ -> ‘two-sample comparison’ -> vul in ‘time = 4’ bij select -> klik gele button (‘tabular options’) in uitvoer -> vink aan ‘comparisons of means’ Zelfde stappenplan. 1.Interesseparameter: .=  ax23 -  bwwg Normale verdeling wordt verondersteld 2.H 0 :  = 0 (beide middelen zijn even effectief) H 1 :   0 (er is verschil) 3.Variantie onbekend, maar gelijk verondersteld. 4.Toets m.b.v. p-waarden en evt. betrouwbaarheid- sinterval voor . 5.Tweezijdige toets: p-waarde = , dus verwerpen voor elke   % betrouw- baarheidsinterval: [ , ] Hier ligt ‘0’ niet in, dus verwerpen. Toetsen m.b.v. computer


Download ppt "1 Herhaling: hoe kan een eenzijdige grens gevonden worden m.b.v. Statistisch Compendium? Gevraagd: rechtseenzijdige 95% betrouwbaarheidsgrens. Antwoord:"

Verwante presentaties


Ads door Google