De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Inleiding tot inferentie

Verwante presentaties


Presentatie over: "Inleiding tot inferentie"— Transcript van de presentatie:

1 Inleiding tot inferentie
Hoofdstuk 6 Inleiding tot inferentie

2 Statistische inferentie :
= op basis van steekproef uitspraken over populatie + mate van vertrouwen die men aan die conclusies mag hechten Bij gebruik van statistische inferentie :  data komen van een aselecte steekproef of van een gerandomiseerd experiment

3 6.1. Schatten met betrouwbaarheid
Steekproefgemiddelde x is een schatter van de populatieverwachting µ als de waarde = 36 : hoe betrouwbaar is deze schatting ? Grotere steekproeven steeds betere schatting steeds naast gemiddelde een indicatie van de variabiliteit nodig

4 A. Statistische betrouwbaarheid
regel : kans dat gemiddelde binnen een afstand van 2 standaardafwijkingen van de verwachte score van de populatie (µ) ligt is 95% µ binnen een afstand van 2 standaard-afwijkingen van x in 95% van alle steekproeven zal het interval x - 2keer stand.afw. tot x + 2keer stand.afw. de werkelijke µ bevatten

5 Op die manier wordt het vertrouwen uitgedrukt in de resultaten van een enkelvoudige steekproef
Voorbeeld : gemiddelde van steekproef is 461 en standaardafwijking is 4,5 met 95% betrouwbaarheid ligt de onbekende verwachte score van de populatie tussen = 452 = 470 slechts 5% van de steekproeven liggen hierbuiten

6 We weten echter niet of onze steekproef tot die 95% of tot die 5% zal behoren
DUS : “populatiegemiddelde ligt met 95% betrouwbaarheid tussen x en y” wil eigenlijk zeggen “we hebben x en y gevonden volgens een methode die in 95% van de gevallen correcte resultaten geeft”

7 B. Betrouwbaarheidsintervallen
Interval van getallen tussen x en y is het betrouwbaarheidsinterval voor µ Betrouwbaarheidsinterval = schatting  foutmarge foutmarge toont iets van de accuraatheid die we onze schatting toekennen, gebaseerd op de variabiliteit van de schatting

8 Elk betrouwbaarheidsinterval :
betrouwbaarheidsniveau = 95% niveau : laat zien hoeveel vertrouwen we hebben dat we met de methode µ zullen bevatten Elk betrouwbaarheidsinterval : interval (uit de data) betrouwbaarheidsniveau (kiezen, meestal > 90%) Betrouwbaarheidsniveau 95% is C=0.95 Onbekende parameter wordt  (Griekse letter theta) genoemd

9 Een betrouwbaarheidsinterval van niveau C voor een parameter ,
is een interval berekend uit de steekproefdata, volgens een methode die kans C heeft om een interval op te leveren dat de werkelijke waarde van  bevat.

10 C. Betrouwbaarheidsinterval voor een populatieverwachting
Constructie van een betrouwbaarheids-interval van niveau C voor de populatieverwachting µ Populatie : N (µ,  ) dan heeft de steekproefverdeling van het steekproefgemiddelde x een verdeling : steekpoef : N (µ, / n)

11 Om voor elk betrouwbaarheidsinterval van niveau C te weten hoeveel keer we de standaardafwijking moeten nemen kunnen we Tabel D gebruiken C p z* 50% 90% 95% 99%

12 Oppervlakte = C Oppervlakte = 1-C = p 2 Oppervlakte = 1-C 2 - z* z*

13 p is de oppervlakte van de rechterstaart dus gelijk aan :
aangezien er ook nog een linkerstaart is die even groot is bij betrouwbaarheidsinterval de oppervlakte tussen -z* en +z* is gelijk aan C het getal z* met rechts daarvan de kans p, wordt de bovenste p-kritieke waarde genoemd (waarbij p = (1-C)/2)

14 De onbekende populatieverwachting µ ligt tussen
x - z* ( _)  n en x + z* ( _) = betrouwbaarheidsinterval van niveau C Naarmate n groter is zal de foutmarge kleiner zijn en dus het interval korter

15 D. Het gedrag van betrouwbaarheidsintervallen
Betrouwbaarheidsniveau kiest de gebruiker Best : grote betrouwbaarheid en kleine foutmarge Grote betrouwbaarheid = bijna altijd correcte antwoorden Kleine foutmarge = parameter is heel nauwkeurig gelokaliseerd

16 Voor dezelfde data : Maar voor andere data :
grotere betrouwbaarheid impliceert bereidheid om grotere foutmarge te aanvaarden want : voor grotere betrouwbaarheid : grotere waarde voor z* Maar voor andere data : bij stijging van n zal de foutmarge dalen door wortel in de formule, moeten we n met 4 vermenigvuldigen om de foutmarge door 2 te laten delen (=halveren)

17 E. Het bepalen van de steekproefomvang
op voorhand proberen om : grote betrouwbaarheid en kleine foutmarge te krijgen foutmarge = z* ( /  n) nu zoeken naar welke grootte van steekproef ik moet hebben bij een gewenste foutmarge m n = [ (z* ) / m ]2

18 Voorbeeld : formule : n = [ (z* ) / m ]2 betrouwbaarheid 95% en resultaten tot op 0.005 nauwkeurig n = [(1.96)(0.0068) / 0.005] 2 = 7.1 ofwel 8 metingen nodig

19 F. Enkele waarschuwingen
data uit randomisatie en enkelvoudig aselecte steekproef geldt niet voor getrapte of gestratificeerde steekproeven geldt niet voor lukraak verzamelde data aangezien x niet resistent is, spelen uitschieters een belangrijke rol verdeling moet normaal zijn zeker bij steekproeven kleiner dan 15

20 De standaardafwijking van de populatie  moet gekend zijn, wat irrealistisch is, als n voldoende groot is kan s, de standaardafwijking van de steekproef gebruikt worden De gebruikte foutmarge geldt enkel voor aselecte steekproeven, drop-out, nonrespons, enz… zorgen voor extra fouten 95% interval wil zeggen : volgens een methode die voor 95% correcte resultaten geeft

21 6.2. Significantietoetsen
Doel : beoordelen van data ten gunste van de een of andere bewering omtrent de populatie Voorbeeld : Kan het dat iemand die niet getraind is toch 6m25 ver springt ? Kans dat iemand dat zonder training kan is 0.001 Dus : het is heel waarschijnlijk dat die persoon wel getraind was Maar : het zou kunnen dat die persoon niet getraind is, maar die kans is zo klein dat het niet waarschijnlijk is

22 A. De redenering bij significantietoesten
Significantietoets = procedure om data te vergelijken met hypothese Hypothese = bewering over parameters in een populatie Uitkomst van een significantietoets : uitgedrukt in termven van een kans die aangeeft hoe goed data en hypothese met elkaar overeenkomen

23 B. Formuleren van hypothesen
Vraag : is een effect aanwezig ? Hypothese : het effect is niet aanwezig = de NULHYPOTHESE (geen effect, geen verschil, …) Significantietoets om de sterkte van het bewijs tegen de nulhypothese vast te stellen

24 Formuleren van hypothesen Nulhypothese is H0
voorbeeld : H0 : A = B of H0 : µ = 23 of H0 :  (rho) = 0 (corr = 0) Alternatieve hypothese is Ha waarvan wij verwachten dat ze juist is voorbeeld : Ha : A > B of Ha : µ < 23 of Ha :  (rho)  0 (wel een verband)

25 Hypothesen verwijzen altijd naar één of andere populatie : dus in populatieparameters
Eenzijdig alternatief : als de richting is aangegeven Tweezijdig alternatief : als er op voorhand geen duidelijke richting is Als H0 waar is, heeft de schatter waarden dicht tegen H0 Waarden die verder van H0 zijn verwijderd vormen een bewijs tegen H0 en voor Ha

26 C. Overschrijdingskansen
Hoe verder de waargenomen uitkomst van H0, dus hoe onwaarschijnlijker dat H0 waar is, hoe sterker de indicatie voor Ha. Significantietoets meet de kans op het krijgen van een uitkomst die even extreem is of nog extremer dan de waargenomen uitkomst = de overschrijdingskans (p) van de toets

27 Hoe kleiner de overschrijdingskans p, hoe sterker het bewijs tegen H0
Overschrijdingskans (p) niet zelf kunnen berekenen, wel computeroutput

28 D. Statistische significantie
Soms op voorhand vaststellen hoeveel bewijs we zullen eisen = de beslissende waarde van de overschrijdingskans = het significantieniveau () alpha Kiezen we  =0.05 dan eisen we dat in niet meer dan 5% van de gevallen H0 toch waar kan zijn

29 Als de overschrijdingskans kleiner dan of gelijk is aan  , zeggen we dat de data statistisch significant zijn op niveau . De resultaten waren significant (p < 0.01) Indien p = 0.03, dan zijn de resultaten significant op niveau  = 0.05, maar niet op niveau  = 0.01.

30 Stappen bij een significantietoets :
Formuleer H0 en Ha Specificeer het significantieniveau  Doe de statistische berekeningen bv. bereken de correlatie, t-waarde, F-waarde, … Bepaal de bijhorende p-waarde, de overschrijdingskans. Is de p-waarde kleiner of gelijk aan , dan is het toetsresultaat significant op niveau 

31 E. Toetsen voor een populatieverwachting
z-toets voor een populatieverwachting H0 : µ = µ0 (µ0 is een bepaalde waarde) Ha : µ < µ0 eenzijdig : P (Z  z) Ha : µ > µ0 eenzijdig : P (Z  z) Ha : µ  µ0 tweezijdig : 2 P (Z  |z| ) omzetten in z-waarde z = ( x - µ0 )  /  n en kijken in tabel A

32 F. Tweezijdige significantie-toetsen en betrouwbaarheidsintervallen
Bij tweezijdig toetsten de p-waarde die in de tabel gevonden wordt vermenigvuldigen met 2 Computer geeft standaard tweezijdige toets Tabel geeft standaard de eenzijdige toets p-waarde (eenzijdig) maal 2 is tweezijdig p-waarde (tweezijdig) gedeeld door 2 is eenzijdig

33 G. Overschrijdingskansen versus vast niveau 
De overschrijdingskans p is het kleinste niveau  waarbij de data significant zijn. Deze p-waarde wordt door de computer gegeven of opzoeken in Tabel Bij vast niveau  enkel beslissen : onder of boven : gemakkelijker maar je hebt minder informatie

34 6.3. Gebruik en misbruik van toetsen
Uitvoeren van een significantietoets is zeer eenvoudig, zeker met computer Toetsen moeten wel verstandig gebruikt worden Onderzoekers doen soms te gemakkelijk toetsen zonder eerst stil te staan bij wat ze doen

35 A. Kiezen van een significantieniveau
Ha is meestal de onderzoekshypothese die bij een lage overschrijdingskans wordt bevestigd Als H0 een jarenlang aanvaarde waarheid is (plausibiliteit), of als verwerping vergaande consequenties heeft (consequenties), zal  klein moeten zijn

36 Meest gangbaar 10%, 5%, en 1% Afhankelijk van inhoud van onderzoek deze  kiezen Meestal wordt 5% gebruikt, dit is eigenlijk een artificiële grens, er is geen breuk tussen wel en niet significant, enkel een bewijs die in sterkte toeneemt Dus niet zomaar altijd 5% nemen en dit als een definitief BEWIJS zien, steeds als een kans

37 B. Wat statistische significantie niet betekent
“Statistische significantie is niet hetzelfde als praktische significantie” want bij grote steekproeven vinden we vlug significantie Bv. correlatie van 0.09 kan bij een steekproef van 1000 pp. een p =0.03 geven Gewoonlijk is het verstandig ook grafisch te kijken Geef beter ook een betrouwbaarheidsinterval, geeft meer info dan enkel significantie

38 C. Negeer het ontbreken van significantie niet
Het NIET significant zijn kan even belangrijke informatie geven, maar wordt zelden gepubliceerd Door deze niet te rapporteren gaan andere onderzoekers opnieuw op zoek, zonder effect. Kan ook niet significant zijn omdat het onderscheidingsvermogen van de toets te zwak was (zie later)

39 D. Statistische inferentie is niet voor alle data geldig
Enkel op correct verzamelde gegevens betekenen significantietoetsen iets Experimenten Aselecte steekproef Dikwijls dit niet voorhanden : telkens op voorhand goed nagaan hoe data verkregen zijn (zie hoofdstuk 3)

40 E. Ga niet zoeken naar significantie
Op voorhand hypothese stellen en dan toetsen, niet op zoek gaan naar alle mogelijke significanties : op 100 toetsen automatisch 5% significant door toeval Computer is hier probleem : op enkele minuten honderden toetsen uitvoeren : steeds blijven nadenken Beter : eerst exploratief en op ANDERE data deze hypothese toetsen

41 6.4. Onderscheidingsvermogen en inferentie bij beslissingsproblemen
Onderscheidingsvermogen van een toets of de power van de toets : is de toets sterk genoeg om de nulhypothese te kunnen verwerpen Sterke link tussen onderscheidings-vermogen en aantal subjecten : hoe meer subjecten, hoe groter het onderscheidingsvermogen

42 80% onderscheidingsvermogen is standaard aan het worden, of power van
Als het onderscheidingsvermogen te klein is zal de nulhypothese niet kunnen worden verworpen, zelfs indien de werkelijke waarde ver weg ligt van de nulhypothese Berekenigen van onderscheidingsvermogen of power enkel met computer

43 Fouten van type 1 en type 2 H0 is waar Ha is waar Verwerp H0
Fout van het Type 1 Correcte beslissing Verwerp Ha Correcte beslissing Fout van het Type 2

44 Het significantieniveau  is de kans op een fout van het type 1, of  is kans dat de toets de nulhypothese zal verwerpen terwijl die in feite juist is Het onderscheidingsvermogen van een significantietoets is 1 - de kans op een fout van de tweede soort : de toets is niet gevoelig genoeg om de nulhypothese te kunnen verwerpen


Download ppt "Inleiding tot inferentie"

Verwante presentaties


Ads door Google