De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Statistiek 2 Hoofdstuk 2: Kansverdelingen en kansberekening

Verwante presentaties


Presentatie over: "Statistiek 2 Hoofdstuk 2: Kansverdelingen en kansberekening"— Transcript van de presentatie:

1 Statistiek 2 Hoofdstuk 2: Kansverdelingen en kansberekening
Vanhoomissen & Valkeneers, hoofdstuk 2

2 Previously on Statistiek 2
Onderzoek begint met een onderzoeksvraag. Daaruit wordt afgeleid wat de populatie is (verzameling waarover we een uitspraak willen doen) en wat de onderzoekseenheden zijn (de elementen van die verzameling). Bedoeling van statistiek is om op basis van verzamelde data een onderbouwde beslissing te nemen over verband/verschil. We gebruiken hiervoor steekproeven omdat de hele populatie onderzoeken te omslachtig is. Daarom zijn we nooit 100% zeker over onze beslissing. Dat is niet erg, zo lang we maar de mate van onzekerheid kennen. Om die mate van onzekerheid te bepalen, hebben we kansberekeningen nodig. We willen vooral te weten komen hoe (on)waarschijnlijk het is om de verzamelde data te observeren. Op basis daarvan kunnen we beslissen of een verband/verschil significant is. Statistiek is geen wetenschap op zich. Statistische conclusies zijn pas waardevol als ook aan de randvoorwaarden voldaan is en statistiek niet misbruikt wordt. Hoofdstuk 2: Kansverdelingen en kansberekening

3 Vandaag Kansverdelingen en kansberekening
Om antwoorden te geven op vragen als “Als ik straks op straat een willekeurige jongeling aan de haak sla, hoe groot is dan de kans dat hij groter is dan 1m75 maar kleiner dan 1m95?”

4 Kansen Kans = waarschijnlijkheid om een bepaalde gebeurtenis te observeren, uitgedrukt met een getal tussen 0 en 1 Hoe waarschijnlijk is het om een “3” te gooien met 1 worp van een dobbelsteen? -> P(3) = 1/6 (of ) of nog: Hoe waarschijnlijk is het om bij aselecte trekking van “een docent statistiek” de gebeurtenis “niet saai” te observeren? -> P(“niet saai”) = ??? Hoofdstuk 2: Kansverdelingen en kansberekening

5 Waarom kansen? Waarom kansen nodig in statistiek?
Belangrijk doel in statistiek: op basis van steekproefgegevens conclusies trekken over populatie Soorten vragen: Interval-estimatie Hypothesetoetsing Hoofdstuk 2: Kansverdelingen en kansberekening

6 Waarom kansen? Interval-estimatie
Vraag: Wat is het gemiddelde IQ van alle kinderen in het 1e jaar secundair onderwijs die 1 of meerdere jaren blijven zitten zijn in het basisonderwijs? Antwoord op basis van gegevens uit steekproef: “Het gemiddelde IQ van alle kinderen in het 1e jaar SO die 1 of meerdere jaren blijven zitten zijn in het BaO ligt tussen X1 en X2 met 95% zekerheid.” Betekenis: Indien je steeds deze bewering aanhoudt, dan weet je dat je in 5% van de gevallen fout zal zijn OF de kans op een fout is > zegt iets over nauwkeurigheid van de schatting van de populatieparameter op basis van de steekproefgegevens Nodig: Steekproefstatistieken (gemiddelde, standaardafwijking, grootte steekproef) + Kansverdeling Hoofdstuk 2: Kansverdelingen en kansberekening

7 Waarom kansen? Hypothesetoetsing
Hypothese: Het IQ van leerlingen in het 1e jaar SO die 1 of meerdere jaren in het BaO zijn blijven zitten (populatie 1) is gelijk aan het IQ van leerlingen 1e jaar SO die niet zijn blijven zitten (populatie 2). Antwoord op basis van gegevens uit steekproef: “We verwerpen deze hypothese” of “We kunnen deze hypothese niet verwerpen”. Nodig: Steekproefstatistieken (gemiddelde, standaardafwijking, grootte steekproef) + Kansverdeling Waarom kansverdeling nodig? Stel dat we vinden dat IQ in steekproef 1 = 105 en IQ in steekproef 2 = Hoe groot is de kans om dit verschil te vinden als er in werkelijkheid geen verschil is tussen de twee populatiegemiddelden? -> grote kans: hypothese niet verwerpen -> kleine kans: hypothese verwerpen Hoofdstuk 2: Kansverdelingen en kansberekening

8 Kansen Relevante begrippen Uitkomst = 1 enkelvoudig resultaat
“een 3” bij het gooien met een dobbelsteen “Chad Smith” bij het trekken van een bandlid van RHCP Uitkomstenruimte = verzameling van alle mogelijke enkelvoudige uitkomsten bij dobbelsteen {1,2,3,4,5,6} bij trekking bandlid {Chad Smith, Anthony Kiedis, Flea, Josh Klinghoffer} Hoofdstuk 2: Kansverdelingen en kansberekening

9 Kansverdeling Kansverdeling = combinatie van uitkomstenruimte met respectievelijke kansen - overzicht van mogelijke waarden van een variabele en bijhorende kansen bij dobbelsteen: uitkomst kans 1 1/6 2 3 4 5 6 Hoofdstuk 2: Kansverdelingen en kansberekening

10 Kansverdeling variabele = aantal ogen bij werpen van 2 dobbelstenen
Hoofdstuk 2: Kansverdelingen en kansberekening

11 Kansverdeling frequentieverdeling bij geobserveerde waarden
Kansverdeling is analoog aan de frequentieverdeling (zie Statistiek 1) verschil: frequentieverdeling bij geobserveerde waarden kansverdeling bij theoretische waarden gemiddelde en standaardafwijking bij kansverdeling niet echt mogelijk wegens geen observaties, maar wél op basis van kansberekening Hoofdstuk 2: Kansverdelingen en kansberekening

12 Kansverdeling gemiddelde van de kansverdeling : verwachte waarde bv bij het gooien van 1 dobbelsteen: Hoofdstuk 2: Kansverdelingen en kansberekening

13 Kansverdeling Variantie van een kansverdeling: bv bij het gooien van 1 dobbelsteen: Hoofdstuk 2: Kansverdelingen en kansberekening

14 De steekproevenverdeling
Een bijzondere kansverdeling: de steekproevenverdeling van het gemiddelde Stel: We trekken uit een populatie een oneindig aantal steekproeven. Elke steekproef wordt gekenmerkt door een aantal steekproefstatistieken zoals het gemiddelde. We krijgen dus een oneindig aantal steekproefgemiddelden waarvan we een verdeling kunnen opstellen. Steekproevenverdeling van gemiddelde = alle mogelijke waarden van steekproefgemiddelden samen met de kansen op die steekproefgemiddelden Daarna kunnen we dus de kans bepalen op het vinden van een bepaald steekproefgemiddelde. Hoofdstuk 2: Kansverdelingen en kansberekening

15 populatie steekproef steekproeven- verdeling
Hoofdstuk 2: Kansverdelingen en kansberekening

16 De steekproevenverdeling
We trekken een steekproef van n = 2 uit de populatie van getallen 2, 4, 6 Waarden steekproef Gemiddelde van steekproef Kans 2 1/9 4 3 6 5 X P(X) 2 1/9 3 2/9 4 3/9 5 6 Hoofdstuk 2: Kansverdelingen en kansberekening

17 De steekproevenverdeling
Verwachte waarde van steekproevenverdeling = populatiegemiddelde  ( )/3 = 4 (1/9 x 2) + (2/9 x 3) + (3/9 x 4) + (2/9 x 5) + (1/9 x 6) = 4 -> gemiddelde van de steekproef is een ‘zuivere schatter’ van het gemiddelde van de populatie Schatter: we schatten met behulp van het steekproefgemiddelde het populatiegemiddelde Zuiver: er zullen geen systematische afwijkingen zijn wanneer men kijkt naar het gemiddelde van alle mogelijke steekproeven om de populatiegrootheid te schatten Hoofdstuk 2: Kansverdelingen en kansberekening

18 De steekproevenverdeling
Standaardafwijking van steekproevenverdeling = standaardfout van gemiddelde standaardafwijking van populatie steekproefgrootte standaardafwijking van het gemiddelde Standard Error of standaardfout van het gemiddelde standaardafwijking van de steekproef indien niet gekend Hoofdstuk 2: Kansverdelingen en kansberekening

19 De steekproevenverdeling
Hoe groter de steekproef, hoe kleiner de standaardfout Gemiddelde lengte van alle 20-jarige mannen = 180cm met een standaardafwijking van 10cm. Bij een steekproef van n = 300 Bij een steekproef van n = 700 Hoofdstuk 2: Kansverdelingen en kansberekening

20 De steekproevenverdeling
Vorm van de steekproevenverdeling gemiddelde en standaarddeviatie van deze verdeling zijn bekend dus: als de verdeling normaal verdeeld is, kennen we het volledige verloop maar: is de verdeling normaal verdeeld? Centrale Limiet Theorema (A. De Moivre, 17E) Hoofdstuk 2: Kansverdelingen en kansberekening

21 De steekproevenverdeling
Hoe groter de steekproef, hoe meer de normale verdeling benaderd wordt: (vb: gooien van 1 dobbelsteen) Hoofdstuk 2: Kansverdelingen en kansberekening

22 De steekproevenverdeling
Vorm van de steekproevenverdeling Als de populatie waaruit men steekproeven trekt normaal verdeeld is, dan is de steekproevenverdeling van het gemiddelde ook normaal verdeeld met een verwachte waarde μ en een standaardafwijking Als de populatie waaruit men een steekproeven trekt niet normaal verdeeld is, maar de steekproeven zijn groot genoeg (N > 30), dan zal de steekproevenverdeling bij benadering normaal verdeeld zijn met een verwachte waarde μ en een standaardafwijking (wat als N < 30? zie later) Als σ niet gekend is, mag men σ vervangen door de standaardafwijking van de steekproef als N > 100. Hoofdstuk 2: Kansverdelingen en kansberekening

23 De steekproevenverdeling
Wat is er nu zo cool aan de steekproevenverdeling van het gemiddelde? Aangezien: we het gemiddelde van deze verdeling kennen (µ) we de standaardafwijking van de verdeling kennen ( of indien σ niet gekend is en N>100 : ) we weten dat ze normaal verdeeld is (als populatie normaal verdeeld is of als N > 30) kunnen we z-scores berekenen en kansen uit de standaardnormaalverdeling halen! Hoofdstuk 2: Kansverdelingen en kansberekening

24 normale verdeling Waarom is die vorm zo belangrijk?
kennis over de verdeling van kansen van een bepaalde variabele maakt intervalestimatie en hypothesetoetsing mogelijk. kansvariabelen die passen in theoretische verdeling (model) bieden meer mogelijkheden voor verwerking. veelgebruikt model: normale verdeling (= vaak voorkomende verdeling van kansen in gedragswetenschappen) Hoofdstuk 2: Kansverdelingen en kansberekening

25 normale verdeling normale verdelingen verschillen enkel in gemiddelde en standaarddeviatie. De curve is altijd klokvormig en symmetrisch. kans om een waarde te observeren tussen 2 grenzen is gelijk aan de oppervlakte onder de curve totale oppervlakte onder de curve is dus 1 Hoofdstuk 2: Kansverdelingen en kansberekening

26 normale verdeling Formule: f (X) = hoogte in curve π = 3.14 e = 2.72
μ = mu = verwachte waarde, gemiddelde van de normale verdeling -> bepaalt de plaats van het midden van de verdeling σ = sigma = standaardafwijking van de verdeling, spreiding van scores -> bepaalt hoe breed of smal de verdeling is (kleine sigma geeft smalle en hoge curve; grote sigma geeft brede en lage curve) Dus: μ en σ bepalen de normaalverdeling er zijn vele soorten normaalverdelingen (naargelang μ en σ ) Hoofdstuk 2: Kansverdelingen en kansberekening

27 normale verdeling Verschillende μ , gelijke σ Gelijke μ , verschillende σ Hoofdstuk 2: Kansverdelingen en kansberekening

28 normale verdeling Totale oppervlakte onder curve = 1
Hoofdstuk 2: Kansverdelingen en kansberekening

29 normale verdeling Kans op een waarde in bepaald gebied = oppervlakte onder curve Hoofdstuk 2: Kansverdelingen en kansberekening

30 normale verdeling μ -3σ μ -2σ μ -σ μ μ +σ μ +2σ μ +3σ
.3413 .3413 .0228 .0228 .1359 .1359 μ -3σ μ -2σ μ -σ μ μ +σ μ +2σ μ +3σ Hoofdstuk 2: Kansverdelingen en kansberekening

31 normale verdeling μ -3σ μ -2σ μ -σ μ μ +σ μ +2σ μ +3σ
.3413 .3413 .0228 .0228 .1359 .1359 μ -3σ μ -2σ μ -σ μ μ +σ μ +2σ μ +3σ IQ is normaal verdeeld met μ = 100 en σ = 15 ongeveer 68% heeft IQ tussen 85 en 115 ongeveer 95% heeft IQ tussen 70 en 130 ongeveer 2.3% heeft een IQ lager dan 70; ongeveer 2.3% heeft een IQ hoger dan 130 Hoofdstuk 2: Kansverdelingen en kansberekening

32 Standaardnormale verdeling
Eén bepaald type normale verdeling Namelijk met μ = 0 en σ = 1 Hoofdstuk 2: Kansverdelingen en kansberekening

33 Standaardnormale verdeling
Waarom die speciale verdeling? bij normaal verdeelde gegevens -> kans afleiden uit oppervlakte onder de curve oppervlakte berekenen = heel omslachtig -> beter aflezen uit tabel onmogelijk om van elke normale verdeling een tabel op te stellen (oneindige verzameling) => slechts 1 tabel opstellen en elke normale verdeling transformeren naar de verdeling waarvoor de tabel is gemaakt, nl. de standaardnormale verdeling Hoofdstuk 2: Kansverdelingen en kansberekening

34 Standaardnormale verdeling
Hoe gaat dat in zijn werk? Transformatie van normale verdeling: vorm blijft behouden, maar µ en σ worden resp. 0 en 1. Transformatie = “standaardiseren” = Z-waarden berekenen: De verdeling is dan standaardnormaal en de kansen kunnen afgelezen worden uit de tabel voor de standaardnormale verdeling. Hoofdstuk 2: Kansverdelingen en kansberekening

35 Standaardnormale verdeling
IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ groter of gelijk aan 112? Stap 1: dus: Hoofdstuk 2: Kansverdelingen en kansberekening

36 Standaardnormale verdeling
Stap2: kans van waarde 0.8 opzoeken in tabel Z = 0.80 P(z < 0.80) = P(z ≥ 0.80) = 1 – Pr(0.80) = Hoofdstuk 2: Kansverdelingen en kansberekening

37 Standaardnormale verdeling
Andere soorten oefeningen ivm kansberekening: analoog aan berekening van percentages in statistiek 1 (hoofdstuk 6). Voor herhaling: zie slides achteraan. Hoofdstuk 2: Kansverdelingen en kansberekening

38 De steekproevenverdeling
We kunnen nu dus raadsels als deze oplossen: We hebben een normaal verdeelde populatie met μ = 100 en σ = Uit deze populatie trekken we een steekproef van n = 40. Het gemiddelde van de steekpoef is 102 en de standaardafwijking is Hoe groot is de kans op een steekproefgemiddelde van 102 of hoger? Wat is gevraagd? P(X ≥ 102) Is de steekproevenverdeling normaal verdeeld? Ja, want de populatie is normaal verdeeld Hoofdstuk 2: Kansverdelingen en kansberekening

39 De steekproevenverdeling
Dus: Stap1: z-score berekenen Stap 2: kans van z-score bepalen via standaardnormale verdeling Hoofdstuk 2: Kansverdelingen en kansberekening

40 De steekproevenverdeling
Z = 0.84 P(z ≥ 0.84) = 1 - P(z ≤ 0.84) = = Hoofdstuk 2: Kansverdelingen en kansberekening

41 De steekproevenverdeling
Dus: P(z ≥ 0.84) = Conclusie: De kans op een gemiddelde van 102 of groter is 0.20 We kunnen dus de kans berekenen op het voorkomen van een bepaald gemiddelde van een steekproef. M.a.w.: we kunnen nagaan of ons steekproefgemiddelde uitzonderlijk is of juist heel acceptabel. En dat is net wat we nodig hebben om hypotheses te toetsen!! Hoofdstuk 2: Kansverdelingen en kansberekening

42 Samengevat Kansen zijn van groot belang in onderzoek omdat ze ons in staat stellen om te beslissen of een observatie heel uitzonderlijk is of eerder heel gewoon. Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen van mogelijke waarden en bijhorende kansen van een variabele. In de psychologie wordt de normale verdeling vaak gebruikt, aangezien veel kenmerken van mensen als normaal verdeeld in de populatie worden beschouwd. Omdat voor elk kenmerk een normale verdeling met een ander gemiddelde en standaarddeviatie geldt, is het onmogelijk om voor elke verdeling de exacte kansen te kennen. Daarom herleiden we die normale verdeling naar een standaardnormale verdeling door z- scores te berekenen. Daarna kunnen we de kansen van de z-scores aflezen uit een tabel. Een specifieke kansverdeling is de steekproevenverdeling van het gemiddelde, waarmee we kunnen uitrekenen hoe groot de kans is om een bepaald gemiddelde te observeren. Hoofdstuk 2: Kansverdelingen en kansberekening

43 Herhalingsoefeningen: kansen berekenen in de normale verdeling.
(zelfstudie – zie statistiek 1)

44 Standaardnormale verdeling
IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ groter of gelijk aan 112? Stap 1: dus: scenario 1 Hoofdstuk 2: Kansverdelingen en kansberekening

45 Standaardnormale verdeling
Stap2: kans van waarde 0.8 opzoeken in tabel Z = 0.80 P(z < 0.80) = P(z ≥ 0.80) = 1 – Pr(0.80) = Hoofdstuk 2: Kansverdelingen en kansberekening

46 Standaardnormale verdeling
IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ groter of gelijk aan 87? Stap 1: Stap 2: P(z ≥ )=? scenario 2 -0.867 ? Hoofdstuk 2: Kansverdelingen en kansberekening

47 Standaardnormale verdeling
Stap2: kans van waarde opzoeken in tabel Probleem: tabel bevat enkel kansen voor positieve z-waarden! Hoofdstuk 2: Kansverdelingen en kansberekening

48 Standaardnormale verdeling
Gelukkig is de standaardnormale verdeling symmetrisch! Dus: P ( z ≤ ) = P ( z ≥ 0.867) En ook: P (z ≥ ) = P ( z ≤ 0.867) P (z ≤ ) P (z ≥ 0.867) Hoofdstuk 2: Kansverdelingen en kansberekening

49 Standaardnormale verdeling
En uit de tabel lezen we af: P ( z ≤ 0.867) = = P (z ≥ ) Hoofdstuk 2: Kansverdelingen en kansberekening

50 Standaardnormale verdeling
IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ kleiner of gelijk aan 114? Stap 1: Stap 2: P(z ≤ 0.93)=? Lees rechtstreeks af uit de tabel: P(z ≥ 0.93) = scenario 3 Hoofdstuk 2: Kansverdelingen en kansberekening

51 Standaardnormale verdeling
IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ kleiner of gelijk aan 87? Stap 1: Stap 2: P(z ≤ )=? Niet af te lezen uit tabel! Maar we weten dat: P(z ≤ ) = P(z ≥ 0.867) Dus: P(z ≤ 0.867) = En P(z ≥ 0.867) = = scenario 4 Hoofdstuk 2: Kansverdelingen en kansberekening

52 Standaardnormale verdeling
Meer varianten op hetzelfde thema! IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ kleiner of gelijk aan 87 OF groter of gelijk aan 113? Stap 1: OF Hoofdstuk 2: Kansverdelingen en kansberekening

53 Standaardnormale verdeling
Stap 2: P(z ≥ 0.867) OF P(z ≤ )= P(z ≥ 0.867) + P(z ≤ ) P(z ≥ 0.867) + P(z ≤ ) = = => kans op IQ kleiner dan of gelijk aan 87 OF groter dan of gelijk aan 113 is 0.384 Hoofdstuk 2: Kansverdelingen en kansberekening

54 Standaardnormale verdeling
Meer varianten op hetzelfde thema! IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ tussen 87 en 113? Stap 1: ? Hoofdstuk 2: Kansverdelingen en kansberekening

55 Standaardnormale verdeling
Stap 2: P( ≤ z ≤ 0.867) = P(z ≤ 0.867) - P(z ≤ ) P(z ≤ 0.867) = en P(z ≤ ) = 1 - P(z ≤ 0.867) = Dus: P(z ≤ 0.867) - P(z ≤ ) = – = => kans op IQ tussen 87 en 113 is 0.616 Hoofdstuk 2: Kansverdelingen en kansberekening

56 Standaardnormale verdeling
Algemene werkwijze bij gelijkaardige oefeningen: Bereken de z-scores Noteer in P(z ≥ x)-vorm wat je zoekt Haal uit de tabel wat rechtstreeks kan afgelezen worden Gebruik optelling of aftrekking om kansen af te leiden die niet in de tabel staan => makkelijker als je even de tekening maakt! Hoofdstuk 2: Kansverdelingen en kansberekening

57 Standaardnormale verdeling
Verdere toepassing van dezelfde techniek: Een normaal verdeelde test heeft een gemiddelde van 100 en een standaardafwijking van 15. Welke score moet men hebben om bij de 5% best scorende mensen te behoren? Wat is gevraagd? Een score x waarvoor P (z ≥ x) = 0.05 Dus: omgekeerde richting: een score zoeken op basis van een kans ipv een kans op basis van een score 0.05 ? Hoofdstuk 2: Kansverdelingen en kansberekening

58 Standaardnormale verdeling
In de tabel zien we dat de Z-score die een P van 0.95 heeft gelijk is aan 1.65 Dus: we zoeken een score x waarvan de Z score gelijk is aan 1.65 Remember: x – 100 = x = (1.65 x 15) x = ~ 125 Antwoord: men moet een score van 125 hebben om bij de 5% best scorende mensen te horen 0.05 ? Hoofdstuk 2: Kansverdelingen en kansberekening

59 Standaardnormale verdeling
Een variabele is normaal verdeeld met een gemiddelde van 70 en een standaardafwijking van 12. Hoeveel % van de mensen scoort hoger dan 58? Wat is gevraagd? P (x ≥ 58) = ? Stap 1: score van 58 omzetten in Z score 58 – 70 = Stap 2: P (z ≥ -1) = ? [scenario 2] => of 84% Hoofdstuk 2: Kansverdelingen en kansberekening


Download ppt "Statistiek 2 Hoofdstuk 2: Kansverdelingen en kansberekening"

Verwante presentaties


Ads door Google