De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Hoofdstuk 2: Kansverdelingen en kansberekening Vanhoomissen & Valkeneers, hoofdstuk 2 STATISTIEK 2.

Verwante presentaties


Presentatie over: "Hoofdstuk 2: Kansverdelingen en kansberekening Vanhoomissen & Valkeneers, hoofdstuk 2 STATISTIEK 2."— Transcript van de presentatie:

1 Hoofdstuk 2: Kansverdelingen en kansberekening Vanhoomissen & Valkeneers, hoofdstuk 2 STATISTIEK 2

2 Onderzoek begint met een onderzoeksvraag. Daaruit wordt afgeleid wat de populatie is (verzameling waarover we een uitspraak willen doen) en wat de onderzoekseenheden zijn (de elementen van die verzameling). Bedoeling van statistiek is om op basis van verzamelde data een onderbouwde beslissing te nemen over verband/verschil. We gebruiken hiervoor steekproeven omdat de hele populatie onderzoeken te omslachtig is. Daarom zijn we nooit 100% zeker over onze beslissing. Dat is niet erg, zo lang we maar de mate van onzekerheid kennen. Om die mate van onzekerheid te bepalen, hebben we kansberekeningen nodig. We willen vooral te weten komen hoe (on)waarschijnlijk het is om de verzamelde data te observeren. Op basis daarvan kunnen we beslissen of een verband/verschil significant is. Statistiek is geen wetenschap op zich. Statistische conclusies zijn pas waardevol als ook aan de randvoorwaarden voldaan is en statistiek niet misbruikt wordt. PREVIOUSLY ON STATISTIEK 2 2 Hoofdstuk 2: Kansverdelingen en kansberekening

3 Kansverdelingen en kansberekening Om antwoorden te geven op vragen als “Als ik straks op straat een willekeurige jongeling aan de haak sla, hoe groot is dan de kans dat hij groter is dan 1m75 maar kleiner dan 1m95?” VANDAAG

4 Kans = waarschijnlijkheid om een bepaalde gebeurtenis te observeren, uitgedrukt met een getal tussen 0 en 1 Hoe waarschijnlijk is het om een “3” te gooien met 1 worp van een dobbelsteen? -> P(3) = 1/6 (of ) of nog: Hoe waarschijnlijk is het om bij aselecte trekking van “een docent statistiek” de gebeurtenis “niet saai” te observeren? -> P(“niet saai”) = ??? KANSEN 4 Hoofdstuk 2: Kansverdelingen en kansberekening

5 Waarom kansen nodig in statistiek? Belangrijk doel in statistiek: op basis van steekproefgegevens conclusies trekken over populatie Soorten vragen: 1.Interval-estimatie 2.Hypothesetoetsing WAAROM KANSEN? 5 Hoofdstuk 2: Kansverdelingen en kansberekening

6 1. Interval-estimatie Vraag: Wat is het gemiddelde IQ van alle kinderen in het 1e jaar secundair onderwijs die 1 of meerdere jaren blijven zitten zijn in het basisonderwijs? Antwoord op basis van gegevens uit steekproef: “Het gemiddelde IQ van alle kinderen in het 1e jaar SO die 1 of meerdere jaren blijven zitten zijn in het BaO ligt tussen X1 en X2 met 95% zekerheid.” Betekenis: Indien je steeds deze bewering aanhoudt, dan weet je dat je in 5% van de gevallen fout zal zijn OF de kans op een fout is > zegt iets over nauwkeurigheid van de schatting van de populatieparameter op basis van de steekproefgegevens Nodig: Steekproefstatistieken (gemiddelde, standaardafwijking, grootte steekproef) + Kansverdeling WAAROM KANSEN? 6 Hoofdstuk 2: Kansverdelingen en kansberekening

7 2. Hypothesetoetsing Hypothese: Het IQ van leerlingen in het 1e jaar SO die 1 of meerdere jaren in het BaO zijn blijven zitten (populatie 1) is gelijk aan het IQ van leerlingen 1e jaar SO die niet zijn blijven zitten (populatie 2). Antwoord op basis van gegevens uit steekproef: “We verwerpen deze hypothese” of “We kunnen deze hypothese niet verwerpen”. Nodig: Steekproefstatistieken (gemiddelde, standaardafwijking, grootte steekproef) + Kansverdeling Waarom kansverdeling nodig? Stel dat we vinden dat IQ in steekproef 1 = 105 en IQ in steekproef 2 = 115. Hoe groot is de kans om dit verschil te vinden als er in werkelijkheid geen verschil is tussen de twee populatiegemiddelden? -> grote kans: hypothese niet verwerpen -> kleine kans: hypothese verwerpen WAAROM KANSEN? 7 Hoofdstuk 2: Kansverdelingen en kansberekening

8 Relevante begrippen Uitkomst = 1 enkelvoudig resultaat − “een 3” bij het gooien met een dobbelsteen − “Chad Smith” bij het trekken van een bandlid van RHCP Uitkomstenruimte = verzameling van alle mogelijke enkelvoudige uitkomsten − bij dobbelsteen {1,2,3,4,5,6} − bij trekking bandlid {Chad Smith, Anthony Kiedis, Flea, Josh Klinghoffer} KANSEN 8 Hoofdstuk 2: Kansverdelingen en kansberekening

9 Kansverdeling = combinatie van uitkomstenruimte met respectievelijke kansen - overzicht van mogelijke waarden van een variabele en bijhorende kansen − bij dobbelsteen: KANSVERDELING 9 uitkomstkans 11/ Hoofdstuk 2: Kansverdelingen en kansberekening

10 variabele = aantal ogen bij werpen van 2 dobbelstenen KANSVERDELING 10 Hoofdstuk 2: Kansverdelingen en kansberekening

11 Kansverdeling is analoog aan de frequentieverdeling (zie Statistiek 1) verschil: frequentieverdeling bij geobserveerde waarden kansverdeling bij theoretische waarden gemiddelde en standaardafwijking bij kansverdeling niet echt mogelijk wegens geen observaties, maar wél op basis van kansberekening KANSVERDELING 11 Hoofdstuk 2: Kansverdelingen en kansberekening

12 gemiddelde van de kansverdeling : verwachte waarde bv bij het gooien van 1 dobbelsteen: KANSVERDELING 12 Hoofdstuk 2: Kansverdelingen en kansberekening

13 Variantie van een kansverdeling: bv bij het gooien van 1 dobbelsteen: KANSVERDELING 13 Hoofdstuk 2: Kansverdelingen en kansberekening

14 Een bijzondere kansverdeling: de steekproevenverdeling van het gemiddelde Stel: We trekken uit een populatie een oneindig aantal steekproeven. Elke steekproef wordt gekenmerkt door een aantal steekproefstatistieken zoals het gemiddelde. We krijgen dus een oneindig aantal steekproefgemiddelden waarvan we een verdeling kunnen opstellen. Steekproevenverdeling van gemiddelde = alle mogelijke waarden van steekproefgemiddelden samen met de kansen op die steekproefgemiddelden Daarna kunnen we dus de kans bepalen op het vinden van een bepaald steekproefgemiddelde. DE STEEKPROEVENVERDELING 14 Hoofdstuk 2: Kansverdelingen en kansberekening

15 15 populatie steekproef steekproeven- verdeling Hoofdstuk 2: Kansverdelingen en kansberekening

16 We trekken een steekproef van n = 2 uit de populatie van getallen 2, 4, 6 DE STEEKPROEVENVERDELING 16 Waarden steekproef Gemiddelde van steekproef Kans 221/ /9 XP(X) 21/9 32/9 43/9 52/9 61/9 Hoofdstuk 2: Kansverdelingen en kansberekening

17 Verwachte waarde van steekproevenverdeling = populatiegemiddelde  ( )/3 = 4 (1/9 x 2) + (2/9 x 3) + (3/9 x 4) + (2/9 x 5) + (1/9 x 6) = 4 -> gemiddelde van de steekproef is een ‘zuivere schatter’ van het gemiddelde van de populatie Schatter: we schatten met behulp van het steekproefgemiddelde het populatiegemiddelde Zuiver: er zullen geen systematische afwijkingen zijn wanneer men kijkt naar het gemiddelde van alle mogelijke steekproeven om de populatiegrootheid te schatten DE STEEKPROEVENVERDELING 17 Hoofdstuk 2: Kansverdelingen en kansberekening

18 Standaardafwijking van steekproevenverdeling = standaardfout van gemiddelde standaardafwijking van populatie steekproefgrootte standaardafwijking van het gemiddelde Standard Error of standaardfout van het gemiddelde standaardafwijking van de steekproef DE STEEKPROEVENVERDELING 18 Hoofdstuk 2: Kansverdelingen en kansberekening indien niet gekend

19 Hoe groter de steekproef, hoe kleiner de standaardfout Gemiddelde lengte van alle 20-jarige mannen = 180cm met een standaardafwijking van 10cm. Bij een steekproef van n = 300 Bij een steekproef van n = 700 DE STEEKPROEVENVERDELING 19 Hoofdstuk 2: Kansverdelingen en kansberekening

20 Vorm van de steekproevenverdeling gemiddelde en standaarddeviatie van deze verdeling zijn bekend dus: als de verdeling normaal verdeeld is, kennen we het volledige verloop maar: is de verdeling normaal verdeeld? Centrale Limiet Theorema (A. De Moivre, 17E) DE STEEKPROEVENVERDELING 20 Hoofdstuk 2: Kansverdelingen en kansberekening

21 Hoe groter de steekproef, hoe meer de normale verdeling benaderd wordt: (vb: gooien van 1 dobbelsteen) DE STEEKPROEVENVERDELING 21 Hoofdstuk 2: Kansverdelingen en kansberekening

22 Vorm van de steekproevenverdeling Als de populatie waaruit men steekproeven trekt normaal verdeeld is, dan is de steekproevenverdeling van het gemiddelde ook normaal verdeeld met een verwachte waarde μ en een standaardafwijking. Als de populatie waaruit men een steekproeven trekt niet normaal verdeeld is, maar de steekproeven zijn groot genoeg (N > 30), dan zal de steekproevenverdeling bij benadering normaal verdeeld zijn met een verwachte waarde μ en een standaardafwijking. (wat als N < 30? zie later) Als σ niet gekend is, mag men σ vervangen door de standaardafwijking van de steekproef als N > 100. DE STEEKPROEVENVERDELING 22 Hoofdstuk 2: Kansverdelingen en kansberekening

23 Wat is er nu zo cool aan de steekproevenverdeling van het gemiddelde? Aangezien: − we het gemiddelde van deze verdeling kennen (µ) − we de standaardafwijking van de verdeling kennen ( of indien σ niet gekend is en N>100 : ) − we weten dat ze normaal verdeeld is (als populatie normaal verdeeld is of als N > 30) kunnen we z-scores berekenen en kansen uit de standaardnormaalverdeling halen! DE STEEKPROEVENVERDELING 23 Hoofdstuk 2: Kansverdelingen en kansberekening

24 Waarom is die vorm zo belangrijk? kennis over de verdeling van kansen van een bepaalde variabele maakt intervalestimatie en hypothesetoetsing mogelijk. kansvariabelen die passen in theoretische verdeling (model) bieden meer mogelijkheden voor verwerking. veelgebruikt model: normale verdeling (= vaak voorkomende verdeling van kansen in gedragswetenschappen) NORMALE VERDELING 24 Hoofdstuk 2: Kansverdelingen en kansberekening

25 normale verdelingen verschillen enkel in gemiddelde en standaarddeviatie. De curve is altijd klokvormig en symmetrisch. kans om een waarde te observeren tussen 2 grenzen is gelijk aan de oppervlakte onder de curve totale oppervlakte onder de curve is dus 1 NORMALE VERDELING 25 Hoofdstuk 2: Kansverdelingen en kansberekening

26 Formule: f (X) = hoogte in curve π = 3.14 e = 2.72 μ = mu = verwachte waarde, gemiddelde van de normale verdeling -> bepaalt de plaats van het midden van de verdeling σ = sigma = standaardafwijking van de verdeling, spreiding van scores -> bepaalt hoe breed of smal de verdeling is (kleine sigma geeft smalle en hoge curve; grote sigma geeft brede en lage curve) Dus: μ en σ bepalen de normaalverdeling er zijn vele soorten normaalverdelingen (naargelang μ en σ ) NORMALE VERDELING 26 Hoofdstuk 2: Kansverdelingen en kansberekening

27 Verschillende μ, gelijke σ Gelijke μ, verschillende σ NORMALE VERDELING 27 Hoofdstuk 2: Kansverdelingen en kansberekening

28 Totale oppervlakte onder curve = 1 NORMALE VERDELING 28 Hoofdstuk 2: Kansverdelingen en kansberekening

29 Kans op een waarde in bepaald gebied = oppervlakte onder curve NORMALE VERDELING 29 Hoofdstuk 2: Kansverdelingen en kansberekening

30 NORMALE VERDELING 30 μ -3 σ μ -2σ μ -σ μ μ +σ μ +2σ μ +3σ Hoofdstuk 2: Kansverdelingen en kansberekening

31 NORMALE VERDELING 31 μ -3 σ μ -2σ μ -σ μ μ +σ μ +2σ μ +3σ IQ is normaal verdeeld met μ = 100 en σ = 15 ongeveer 68% heeft IQ tussen 85 en 115 ongeveer 95% heeft IQ tussen 70 en 130 ongeveer 2.3% heeft een IQ lager dan 70; ongeveer 2.3% heeft een IQ hoger dan 130 Hoofdstuk 2: Kansverdelingen en kansberekening

32 Standaardnormale verdeling − Eén bepaald type normale verdeling − Namelijk met μ = 0 en σ = 1 STANDAARDNORMALE VERDELING 32 Hoofdstuk 2: Kansverdelingen en kansberekening

33 Waarom die speciale verdeling? − bij normaal verdeelde gegevens -> kans afleiden uit oppervlakte onder de curve − oppervlakte berekenen = heel omslachtig -> beter aflezen uit tabel − onmogelijk om van elke normale verdeling een tabel op te stellen (oneindige verzameling) => slechts 1 tabel opstellen en elke normale verdeling transformeren naar de verdeling waarvoor de tabel is gemaakt, nl. de standaardnormale verdeling STANDAARDNORMALE VERDELING 33 Hoofdstuk 2: Kansverdelingen en kansberekening

34 Hoe gaat dat in zijn werk? Transformatie van normale verdeling: vorm blijft behouden, maar µ en σ worden resp. 0 en 1. Transformatie = “standaardiseren” = Z-waarden berekenen: De verdeling is dan standaardnormaal en de kansen kunnen afgelezen worden uit de tabel voor de standaardnormale verdeling. STANDAARDNORMALE VERDELING 34 Hoofdstuk 2: Kansverdelingen en kansberekening

35 IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ groter of gelijk aan 112? Stap 1: dus: STANDAARDNORMALE VERDELING 35 Hoofdstuk 2: Kansverdelingen en kansberekening

36 Stap2: kans van waarde 0.8 opzoeken in tabel STANDAARDNORMALE VERDELING 36 Z = 0.80 P(z < 0.80) = P(z ≥ 0.80) = 1 – Pr(0.80) = Hoofdstuk 2: Kansverdelingen en kansberekening

37 Andere soorten oefeningen ivm kansberekening: analoog aan berekening van percentages in statistiek 1 (hoofdstuk 6). Voor herhaling: zie slides achteraan. STANDAARDNORMALE VERDELING 37 Hoofdstuk 2: Kansverdelingen en kansberekening

38 We kunnen nu dus raadsels als deze oplossen: − We hebben een normaal verdeelde populatie met μ = 100 en σ = 15. Uit deze populatie trekken we een steekproef van n = 40. Het gemiddelde van de steekpoef is 102 en de standaardafwijking is 14. Hoe groot is de kans op een steekproefgemiddelde van 102 of hoger? − Wat is gevraagd? P(X ≥ 102) − Is de steekproevenverdeling normaal verdeeld? Ja, want de populatie is normaal verdeeld DE STEEKPROEVENVERDELING 38 Hoofdstuk 2: Kansverdelingen en kansberekening

39 Dus: Stap1: z-score berekenen Stap 2: kans van z-score bepalen via standaardnormale verdeling DE STEEKPROEVENVERDELING 39 Hoofdstuk 2: Kansverdelingen en kansberekening

40 DE STEEKPROEVENVERDELING 40 Z = 0.84 P(z ≥ 0.84) = 1 - P(z ≤ 0.84) = = Hoofdstuk 2: Kansverdelingen en kansberekening

41 Dus: P(z ≥ 0.84) = Conclusie: De kans op een gemiddelde van 102 of groter is 0.20 We kunnen dus de kans berekenen op het voorkomen van een bepaald gemiddelde van een steekproef. M.a.w.: we kunnen nagaan of ons steekproefgemiddelde uitzonderlijk is of juist heel acceptabel. En dat is net wat we nodig hebben om hypotheses te toetsen!! DE STEEKPROEVENVERDELING 41 Hoofdstuk 2: Kansverdelingen en kansberekening

42 Kansen zijn van groot belang in onderzoek omdat ze ons in staat stellen om te beslissen of een observatie heel uitzonderlijk is of eerder heel gewoon. Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen van mogelijke waarden en bijhorende kansen van een variabele. In de psychologie wordt de normale verdeling vaak gebruikt, aangezien veel kenmerken van mensen als normaal verdeeld in de populatie worden beschouwd. Omdat voor elk kenmerk een normale verdeling met een ander gemiddelde en standaarddeviatie geldt, is het onmogelijk om voor elke verdeling de exacte kansen te kennen. Daarom herleiden we die normale verdeling naar een standaardnormale verdeling door z- scores te berekenen. Daarna kunnen we de kansen van de z-scores aflezen uit een tabel. Een specifieke kansverdeling is de steekproevenverdeling van het gemiddelde, waarmee we kunnen uitrekenen hoe groot de kans is om een bepaald gemiddelde te observeren. SAMENGEVAT 42 Hoofdstuk 2: Kansverdelingen en kansberekening

43 Herhalingsoefeningen: kansen berekenen in de normale verdeling. (zelfstudie – zie statistiek 1)

44 IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ groter of gelijk aan 112? Stap 1: dus: STANDAARDNORMALE VERDELING 44 Hoofdstuk 2: Kansverdelingen en kansberekening scenario 1

45 Stap2: kans van waarde 0.8 opzoeken in tabel STANDAARDNORMALE VERDELING 45 Z = 0.80 P(z < 0.80) = P(z ≥ 0.80) = 1 – Pr(0.80) = Hoofdstuk 2: Kansverdelingen en kansberekening

46 IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ groter of gelijk aan 87? Stap 1: Stap 2: P(z ≥ )=? STANDAARDNORMALE VERDELING ? scenario 2 Hoofdstuk 2: Kansverdelingen en kansberekening

47 Stap2: kans van waarde opzoeken in tabel Probleem: tabel bevat enkel kansen voor positieve z-waarden! STANDAARDNORMALE VERDELING 47 Hoofdstuk 2: Kansverdelingen en kansberekening

48 Gelukkig is de standaardnormale verdeling symmetrisch! Dus: P ( z ≤ ) = P ( z ≥ 0.867) En ook: P (z ≥ ) = P ( z ≤ 0.867) STANDAARDNORMALE VERDELING 48 P (z ≤ ) P (z ≥ 0.867) Hoofdstuk 2: Kansverdelingen en kansberekening

49 En uit de tabel lezen we af: P ( z ≤ 0.867) = = P (z ≥ ) STANDAARDNORMALE VERDELING 49 Hoofdstuk 2: Kansverdelingen en kansberekening

50 IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ kleiner of gelijk aan 114? Stap 1: Stap 2: P(z ≤ 0.93)=? Lees rechtstreeks af uit de tabel: P(z ≥ 0.93) = STANDAARDNORMALE VERDELING 50 scenario 3 Hoofdstuk 2: Kansverdelingen en kansberekening

51 IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ kleiner of gelijk aan 87? Stap 1: Stap 2: P(z ≤ )=? Niet af te lezen uit tabel! Maar we weten dat: P(z ≤ ) = P(z ≥ 0.867) Dus: P(z ≤ 0.867) = En P(z ≥ 0.867) = = STANDAARDNORMALE VERDELING 51 scenario 4 Hoofdstuk 2: Kansverdelingen en kansberekening

52 Meer varianten op hetzelfde thema! IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ kleiner of gelijk aan 87 OF groter of gelijk aan 113? Stap 1: STANDAARDNORMALE VERDELING 52 OF Hoofdstuk 2: Kansverdelingen en kansberekening

53 Stap 2: P(z ≥ 0.867) OF P(z ≤ )= P(z ≥ 0.867) + P(z ≤ ) P(z ≥ 0.867) + P(z ≤ ) = = => kans op IQ kleiner dan of gelijk aan 87 OF groter dan of gelijk aan 113 is STANDAARDNORMALE VERDELING 53 Hoofdstuk 2: Kansverdelingen en kansberekening

54 Meer varianten op hetzelfde thema! IQ is normaal verdeeld met μ = 100 en σ = 15. Wat is kans op een IQ tussen 87 en 113? Stap 1: STANDAARDNORMALE VERDELING 54 ? Hoofdstuk 2: Kansverdelingen en kansberekening

55 Stap 2: P( ≤ z ≤ 0.867) = P(z ≤ 0.867) - P(z ≤ ) P(z ≤ 0.867) = en P(z ≤ ) = 1 - P(z ≤ 0.867) = Dus: P(z ≤ 0.867) - P(z ≤ ) = – = => kans op IQ tussen 87 en 113 is STANDAARDNORMALE VERDELING 55 Hoofdstuk 2: Kansverdelingen en kansberekening

56 Algemene werkwijze bij gelijkaardige oefeningen: Bereken de z-scores Noteer in P(z ≥ x)-vorm wat je zoekt Haal uit de tabel wat rechtstreeks kan afgelezen worden Gebruik optelling of aftrekking om kansen af te leiden die niet in de tabel staan => makkelijker als je even de tekening maakt! STANDAARDNORMALE VERDELING 56 Hoofdstuk 2: Kansverdelingen en kansberekening

57 Verdere toepassing van dezelfde techniek: Een normaal verdeelde test heeft een gemiddelde van 100 en een standaardafwijking van 15. Welke score moet men hebben om bij de 5% best scorende mensen te behoren? Wat is gevraagd? Een score x waarvoor P (z ≥ x) = 0.05 Dus: omgekeerde richting: een score zoeken op basis van een kans ipv een kans op basis van een score STANDAARDNORMALE VERDELING ? Hoofdstuk 2: Kansverdelingen en kansberekening

58 In de tabel zien we dat de Z-score die een P van 0.95 heeft gelijk is aan 1.65 Dus: we zoeken een score x waarvan de Z score gelijk is aan 1.65 Remember: x – 100= x= (1.65 x 15) x= ~ 125 Antwoord: men moet een score van 125 hebben om bij de 5% best scorende mensen te horen STANDAARDNORMALE VERDELING ? Hoofdstuk 2: Kansverdelingen en kansberekening

59 Een variabele is normaal verdeeld met een gemiddelde van 70 en een standaardafwijking van 12. Hoeveel % van de mensen scoort hoger dan 58? Wat is gevraagd? P (x ≥ 58) = ? Stap 1: score van 58 omzetten in Z score 58 – 70 = Stap 2: P (z ≥ -1) = ? [scenario 2] => of 84% STANDAARDNORMALE VERDELING 59 Hoofdstuk 2: Kansverdelingen en kansberekening


Download ppt "Hoofdstuk 2: Kansverdelingen en kansberekening Vanhoomissen & Valkeneers, hoofdstuk 2 STATISTIEK 2."

Verwante presentaties


Ads door Google