Continue kansverdelingen

Slides:

Advertisements

Verwante presentaties

Statistische uitspraken over onbekende populatiegemiddelden

Advertisements

Bij een herhaald experiment, met telkens dezelfde kans op succes gebruiken we de binomiale kansverdeling Een binomiale kansverdeling wordt gekenmerkt door.

Overzicht Sessie 1 Inleiding

toepassingen van integralen

De omvang van een steekproef bepalen

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

vwo B Samenvatting Hoofdstuk 3

Stijgen en dalen constante stijging toenemende stijging

vwo A/C Samenvatting Hoofdstuk 6

Een manier om problemen aan te pakken

Statistiek HC1MBR Statistiek.

Het vergelijken van twee populatiegemiddelden: Student’s t-toets

Help! Statistiek! Doorlopende serie laagdrempelige lezingen,

1 Hashtabellen Datastructuren. 2 Dit onderwerp Direct-access-tabellen Hashtabellen –Oplossen van botsingen met “ketens” (chaining) –Analyse –Oplossen.

Correlatietoetsen Toetsen op afhankelijkheid tussen variabelen waarvan minimaal een van de twee niet ordinaal is: afhankelijkheidstabellen. Vb. afhankelijkheid.

Hogere Wiskunde Complexe getallen college week 6

BiO-M Wiskundig Modelleren

havo A Samenvatting Hoofdstuk 11

havo A Samenvatting Hoofdstuk 8

Oppervlakten berekenen

Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere

P-waarde versus betrouwbaarheidsinterval

toetsen voor het verband tussen variabelen met gelijk meetniveau

Oppervlakten berekenen een mogelijke ontstaansgeschiedenis voor integralen... 6de jaar – 3 & 4u wiskunde Pedro Tytgat: Aanpassing Ronny Vrijsen.

Overzicht van de leerstof

vwo A Samenvatting Hoofdstuk11

vwo A Samenvatting Hoofdstuk 13

vwo A Samenvatting Hoofdstuk 15

vwo C Samenvatting Hoofdstuk 14

Gegevensverwerving en verwerking

Meervoudige lineaire regressie

P-waarde Wat is een p-waarde? De kans dat de toetsings-grootheid een extremere uitkomst (overeenkomstig met de alternatieve hypothese) geeft dan de waar-genomen.

Afhankelijkheidstabellen

Schatter voor covariantie

Metingen met spreiding

Eenzijdige Betrouwbaarheidsgrens

Discrete stochasten Onderwerpen Stochasten (random variables)

Exponentiële Verdeling

Deze les wordt verzorgd door de Kansrekening en statistiekgroep Faculteit W&I TU/e.

Een fundamentele inleiding in de inductieve statistiek

Voorspellende analyse

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

Hoofdstuk 1 Basisvaardigheden.

Populatiegemiddelden: recap

Hogere wiskunde Limieten college week 4

ribwis1 Toegepaste wiskunde Lesweek 3

ribwis1 Toegepaste wiskunde – Exponentiele functies Lesweek 5

Statistiek voor Dataverwerking

havo/vwo D Samenvatting Hoofdstuk 4

Tweedegraadsfuncties

Statistiekbegrippen en hoe je ze berekent!!

1 van 8 Bernoulli-stochasten & Binomiale stochasten © CI 2003.

De steekproefuitkomsten generaliseren naar de populatie

Partiële r² Predictie van y gebaseerd op z alleen

Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)

Baarde en de goede Hoofdstuk 11: Data-analyse

Statistiek Deel 3. Inductieve statistiek

Hoorcollege 2 Enkele statistische verdelingen ED: Het experiment atoom Labels De empirische distributie.

TirPrs06: Wachttijdtheorie & simulatietechniek

Hoorcollege 3 Enterprise Dynamics: Enkele verdelingen (visueel)

Kansverdelingen Kansverdelingen Inleiding In deze presentatie gaan we kijken naar hoe kansen zijn verdeeld. We gaan in op verschillende.

Testen met een klein aantal testmonsters Rob Ross.

Wat zegt een steekproef?

Standaard normaalverdeling

Betrouwbaarheidsinterval

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

De omvang van een steekproef bepalen

Voorspellende analyse

Kwantitatieve kenmerken

Transcript van de presentatie:

Continue kansverdelingen Continue kansverdelingen geven de verdelingen weer van continue stochasten. Een stochast X is continu als de uitkomsten-verzameling U niet aftelbaar is (meestal een interval). Voorbeelden Gewicht, lengte, etc. van personen Levensduur van een hartklep Meetfouten Voor continue stochasten geldt altijd: P(X = x) = 0. Positieve kansen bestaan slechts op een interval: P(a < X < b). Bij continue stochasten vervult de dichtheidsfunctie (probability density function, pdf ) f de rol die de kansmassafunctie bij discrete stochasten heeft.

Continue Kansverdelingen Definitie Een functie f heet een kansdichtheid als De bijbehorende kansverdeling is bepaald door:

Cumulatieve verdelingsfunktie De cumulatieve verdelingsfunctie (cumulative distribution function, cdf ) is nu: De kansdichtheid is de afgeleide van de verdelings-functie We kunnen nu kansen berekenen door de kansdichtheidsfuntie te integreren of waardes van de verdelingsfunctie in de eindpunten van elkaar af te trekken: Vaak wordt f(x) alleen gegeven voor het domein waarop deze niet nul is. Uiteraard hoef je dan alleen te integreren binnen dat domein. Demo 1. Genereer 1000 lege observatie in SPSS met een variabele Xgem 2. Simuleer 1000 worpen met dobbelsteen d.mv. Transform|Compute en vul Xgem met waarde RND(UNIFORM(0.5, 6.5)) 3 Nogmaals Transform|Compute en vul Xgem met ( RND(UNIFORM(0.5, 6.5))+….+RND(UNIFORM(0.5, 6.5)) )/10 4. Laat met Analyse | Explore de verdeling van Xgem zien

Verwachting Karakteristieken van continue verdelingen De verwachting (expectation of mean) van een stochast X met pdf f(x) is Je weegt dus elke mogelijke uitkomst x met de bijbehorende waarde van de kansdichtheidsfunctie f(x). Je kan ook de verwachting bereken van een functie van X, bijv. h(X) = X2. Dit gaat op dezelfde manier: elke mogelijke uitkomst van h(X) wordt gewogen met f(x): De variantie (variance) van X is een maat voor spreiding: De standaarddeviatie X is gelijk aan de wortel van de variantie en heeft dezelfde eenheid als de verwachting.

Kansdichtheid als model Een kansdichtheid is vaak een model dat gebaseerd wordt op een steekproef uit een populatie. Begrippen als verwachting en variantie zijn zeer nuttig om dit model te vinden. De verwachting corresponderend met de kansdichtheid die die eerste steekproef modelleert zal ca. 0 moeten zijn. Zo ook voor de tweede. Verder: kansdichtheid één kleinere standaarddeviatie dan de twee.

Eigenschappen a en b: willekeurige niet-stochastische getallen. X en Y: stochasten. E(aX + b) = aE(X) + b Var(aX + b) = Var(aX) = a2Var(X). E(X + Y) = E(X) + E(Y), ook als X en Y afhankelijk zijn. Var(aX + bY) = a2Var(X) + b2Var(Y) als X en Y onderling onafhankelijk zijn. Let op: Var(X – Y) = Var(X) + (-1)2Var(Y) = Var(X) + Var(Y). Variantie en standaarddeviatie moeten altijd groter of gelijk aan nul zijn.

Continue Uniforme Verdeling U[a,b], uniforme verdeling op interval [a,b]. Dit betekent dat f(x) = 0 buiten dit interval en de kansdichtheidsfunctie is constant binnen dat interval: Toepassingen: Ontstaan van een bloedstolsel in een bloedvat. Passeren van de doellijn door een bal, wanneer deze blind geschoten wordt. Demo 1. Genereer 1000 lege observatie in SPSS met een variabele Xgem 2. Simuleer 1000 worpen met dobbelsteen d.mv. Transform|Compute en vul Xgem met waarde RND(UNIFORM(0.5, 6.5)) 3 Nogmaals Transform|Compute en vul Xgem met ( RND(UNIFORM(0.5, 6.5))+….+RND(UNIFORM(0.5, 6.5)) )/10 4. Laat met Analyse | Explore de verdeling van Xgem zien

Normale Verdeling De Normale of Gaussische kansdichtheid is: De parameters van de normale verdeling,  en 2, zijn tevens de verwachtingswaarde en variantie. Notatie: X is normaal verdeeld, E(X) =  en Var(X) = 2, dan schrijven we X ~ N(,2).

Standaard Normaal Eigenschap Als X normaal is verdeeld dan is Y=aX+b ook normaal verdeeld m.a.w. Zij en Dan: Gevolg als dan (standaardnormaal verdeeld) De som van normaal verdeelde onafhankelijke stochasten is ook normaal verdeeld, en bovendien

Z-scores Definitie Zij X een aselecte trekking uit een normale verdeling en x de realisatie van X. De Z-score van X, ook wel gestandaardiseerde waarde genoemd, en de realisatie ervan zijn: De Z-score van X is de afstand van X tot µ in eenheden  . Deze Z-scores zijn uitermate handig voor het berekenen van kansen voor normaal verdeelde stochasten. Waarom? Gevraagd: P(X  x). We weten nu dat dit gelijk is aan:

Z-scores (vervolg) Helaas is deze integraal alleen maar numeriek te berekenen. We kunnen echter het volgende gebruiken: waarbij Z standaard normaal verdeeld is. Tabel 9.1 van het Statistisch Compendium geeft nu voor alle waardes van z (tot op twee decimalen) de gevraagde kans.

Voorbeeld We beschouwen een risicopopulatie waarin alle mensen een bloeddruk hebben van ongeveer 160. Van een bloeddrukverlagend middel is bekend dat het de bloeddruk gemiddeld verlaagt van 160 naar 150 eenheden. Op die verlaging zit echter een spreiding: de variantie is gelijk aan 100. Wat is de kans dat bij een willekeurig persoon uit de risicopopulatie het middel de bloeddruk daadwerkelijk verlaagt? We gaan uit van een normale verdeling. Noem het verschil ‘na – voor’: W. Zie ook: Applet Z-scores

Centrale Limiet Stelling Waarom is de normale verdeling zo belangrijk? Zij X1, X2, X3,…….., Xn een aselecte steekproef uit een willekeurige kansverdeling met verwachting µ en variantie 2. Dan geldt onder zeer zwakke voorwaarden dat voor n naar oneindig de kansverdeling van het gemiddelde een normale verdeling is. M.a.w. voor “grote” n is het gemiddelde bij benadering normaal verdeeld: In een meetexperiment betekent dat dat wanneer men veel metingen doet waarbij een stochastische meetfout optreedt, men meestal redelijkerwijs mag veronder-stellen dat het gemiddelde van de metingen normaal verdeeld is. Zie ook: illustratie CLS Demo 1. JAVA – applet. CLT

Normaal als benadering voor binomiaal en Poisson Eén van de gevolgen van de CLS is dat we Binomiale kansen kunnen benaderen met een normale kans wanneer de parameter n voldoende groot is. De vuistregels is dat wanneer n*p > 5 en n*(1-p) > 5, we mogen gebruiken X ~ Bin(n,p) dan geldt dat bij benadering een standaard normaal verdeelde stochast is. Evenzo geldt voor een Poisson verdeelde stochast Y wanneer  > 5, dat Dus, stel n = 100 and p = 0.25 en X ~ Bin(n,p) . Dan Demo 1. JAVA – applet. CLT

Eigenschappen lin comb In het algemeen geldt: Als X1, X2,…….Xn onderling onafhankelijke stochasten zijn geldt: Opmerking: Als de stochasten niet onafhankelijk zijn geldt de optelregel voor de varianties NIET. Bovendien hebben we:

Eigenschappen lin. comb. (vervolg) Voor normaal verdeelde stochasten geldt: Als X1, X2,…….Xn onderling onafhankelijke stochasten zijn en dan Belangrijk gevolg: Als X1, X2,…….Xn onderling onafhankelijke normaal verdeelde stochasten zijn met dezelfde variantie en dezelfde verwachtingswaarde dan geldt voor het gemiddelde van die stochasten:

Voorbeeld We hebben 25 mensen een potentieel bloeddruk-verlagend middel gegeven. We willen weten of het effect heeft. De variantie van de bloeddrukmeting (niet van de bloeddruk zelf) binnen een persoon in de populatie is bekend en gelijk aan 50. We meten de bloeddruk voor en na toediening van het middel. De gemiddelde bloeddruk verlaagt van 160 naar 150. Wat is de kans dat dit gebeurt puur door statistische fluctuaties? We gaan uit van normale verdelingen. Noem de bloeddruk voor toediening bij patient i: Xi en na toediening Yi. Het verschil is Zi. Het gemiddelde verschil geven we weer met Als er sprake is van puur willekeurige fluctuaties dan mogen we aannemen dat de verwachtingswaarde van gelijk is aan 0. De variantie is: Let op: Tabellen achterin het boek zijn complementair aan de tabellen uit het compendium. Voorbeeld De bedieningstijd in minuten X aan een loket is normaal verdeeld met =5 en =1.5.

Voorbeeld (vervolg) Onder de aanname dat de bloeddruk niet verandert geldt dus De kans dat we precies een gemiddeld verschil van 160 – 150 = 10 waarnemen is nul, want volgt een continue verdeling. We kunnen echter wel uitrekenen Als dit erg klein is, dan achten we het erg onwaarschijnlijk dat we te maken hebben met een statistische fluctuatie en we spreken van een significant verschil. Let op: Tabellen achterin het boek zijn complementair aan de tabellen uit het compendium. Voorbeeld De bedieningstijd in minuten X aan een loket is normaal verdeeld met =5 en =1.5.

Exponentiële Verdeling Belangrijke en unieke eigenschap: geheugenloosheid. D.w.z. P(X > t | X > s) = P(X > t-s). M.a.w: het feit dat X groter is dan s geeft geen enkele informatie over de restlevensduur. De exponentiële verdeling geeft de verdeling van de ‘tussentijden’ in een Poisson proces aan. Deze verdeling wordt tevens gebruikt om levensduren van niet aan slijtage onderhavige zaken te modelleren.