Discrete stochasten Onderwerpen Stochasten (random variables) Kansdichtheidfunctie (probability density function) Cumulatieve verdelingsfunctie (cumulative distribution function) Verwachting en variantie (mean/expected value en variance) Discreet uniforme verdeling Binomiale verdeling Poisson verdeling
Discrete stochasten Stochasten (random variables) Functie X die aan elk element van de uit-komstenruimte van een random experiment een reëel getal toevoegt. Uitkomst van dit experiment wordt realisatie (realisation) of observatie (observation) genoemd en weergegeven met x. Functies van stochasten zijn zelf ook weer stochasten. Voorbeeld: je dient een bloeddrukverlagend medicijn toe aan tien mensen. Voordat je de verlagingen meet zijn dit stochasten: X1, .., X10. De gemiddelde verlaging is dus ook een stochast. Na de metingen kennen we dan
Discrete stochasten Discrete stochasten: X neemt eindig (of aftelbaar) veel waarden aan. X: aantal klanten voor een loket op tijdstip t. X: aantal hartslagen per minuut De kans op een uitkomst x geven we weer met de kansdichtheidfunctie (probability density function, pdf ) f(x): f(x) = P(X = x). Een kansdichtheidfunctie moet voldoen aan: 0 f(xi) 1, voor alle xi in de uitkomst-ruimte U. de totale kans moet 1 zijn.
Discrete stochasten Cumulatieve verdelingsfunctie (cumulative distribution function, cdf ): F(x) F(x) = P(X x) Dus F(2) betekent: de kans dat de stochast X kleiner of gelijk is aan 2. Als x1, …, xi opeenvolgende mogelijke observaties van X zijn, waarbij x1 de kleinst mogelijke is, dan F(xi) = P(X xi) = P(X = x1) +…+ P(X = xi) = ji f(xj) De kansfunktie is te berekenen uit de cdf : f(xi) = P(X xi) - P(X xi-1) = F(xi) - F(xi-1) Eigenschappen F: - 0 F(x) 1 - F loopt altijd van 0 tot 1 - als x y dan F(x) F(y)
Discrete stochasten Voorbeeld. Noem X: het cijfer dat een nieuw levens-middel krijgt van een willekeurig lid van een smaakpanel. De verdelingsfucntie is bekend: Wat zijn de mogelijke waarden die X kan aannemen? 1,2 en 3 Wat is f(3)? Wat is f(1.5)? f(3) = P(X=3) = F(3) - F(2) = 1-1/2 = 1/2. f(1.5) = P(X=1.5) = 0. Wat is P(X 1)? P(X 1) = F(1) = 1/6.
Verwachting E(X) of als μ De verwachting (expected value / mean) van een sto-chastische variabele X wordt genoteerd als: E(X) of als μ Voor een diskrete stochast geldt Dit is het gewogen gemiddelde van de uitkomsten, met als weegfactor de kans op de uitkomst. De verwachting hoeft geen waarde te zijn die X aan kan nemen!!! Bv. Loterij met 100 loten, 1 lot kost 10 euro. Er is 1 prijs ter waarde van 500 euro. De mogelijke uitkomsten van de stochast X die de opbrengst/kosten representeren zijn: geen prijs: X = -10 wel prijs: X = 490 De verwachte ‘opbrengst’ is dus 490*0.01 –10*0.99 = -5 euro.
Variantie De variantie (variance) van een stochastische variabele X is een maat voor de spreiding (dispersion) om het gemiddelde. Hoe groter de variantie, hoe meer gespreid de waarnemingen liggen. Definitie: Var(X) = σ2 = E(X - μ)2 = E(X2) - [E(X)]2 Voor een discrete random variable X komt dit neer op: In de praktijk wordt voor de spreiding vooral gebruik gemaakt van de standaarddeviatie (standard deviation) σ = [Var(X)]1/2. De standaarddeviatie heeft dezelfde eenheid als de verwachting en is daarom beter te interpreteren. Voorbeeld: een bepaald bot breekt gemiddeld bij een druk van 1000 N. Men weet de kansverdeling van de botsterkte en berekent een variantie van 10.000 N2, dus een spreiding van 100 N.
Bernouilli Verdeling Een stochast X is Bernouilli verdeeld als deze precies twee mogelijke uitkomsten heeft met kans p resp 1- p. Vaak wordt p de succes kans genoemd. Voorbeelden: Gooien met zuivere munt; kruiskans p = 0.5. Succes van een operatie. Behalen van tentamen, p = ?. Vaak wordt één toestand met ‘0’ gecodeerd en de ander met ‘1’. Als de kans op ‘1’ p is, dan hebben we E(X)= 0*(1- p) + 1*p = p en Var(X) = (02)*(1-p) + (12)*p – [E(x)]2 = p – p2 = p(1-p).
Binomiale verdeling De binomiale verdeling ontstaat door een aantal onafhankelijke Bernouilli experimenten achter elkaar uit te voeren. Vb. Een arts voert op één dag drie operaties uit die elk slagen met kans 0.9. Wat is de kans op twee succes-volle operaties die dag? Oplossing: Er zijn drie mogelijkheden voor precies twee successen (en dus één falen): 1 en 2, 1 en 3, 2 en 3. Voor elke mogelijkheid geldt dat de kans daarop 0.92 * 0.1 = 0.081 is, want de afzonderlijke experimenten zijn onafhankelijk dus we mogen kansen vermenig-vuldigen. Dus is gevraagde kans 3*0.081 = 0.243. De stochast X is binomiaal verdeeld met parameters n en p als deze het aantal successen telt in n onafhanke-lijke experimenten elk met succeskans p. Er geldt voor k = 0,1,2,3,…….,n:
Eigenschappen Verwachting en variantie: E(X) = np Var(X) = npq =np(1- p) Als X binomiaal verdeeld is met n1 en p en Y is binomiaal verdeeld met n2 en p, X en Y onderling onafhankelijk, dan geldt: Hoe ziet de binomiale verdeling er uit? Binomiaal: theoretisch plus simulatie X +Y telt het aan successen in n = n1+n2 experimenten elk met succeskans p, dus X+Y is binomiaal verdeeld met parameters n = n1+n2 en p.
Poisson proces Een Poisson proces is een telproces (counting process) Het telt een aantal per eenheid. Die eenheid kan van alles zijn: tijdsinterval, volume, gewicht, etc. Een Poisson proces voldoet aan de volgende drie voorwaarden: Als de eenheid klein genoeg is kan er niet meer dan één telling optreden in die eenheid Het verwachte aantal tellingen is proportioneel met de grootte van de eenheid. De tellingen in elke deeleenheid zijn onafhankelijk. Het is een belangrijk model voor veel verschijnselen: Aantal ongelukken op een kruispunt per week Aantal klanten dat per kwartier aankomt bij een loket Aantal personen per dag in Nederland dat een hartaanval krijgt. De Poissonverdeling is de kansverdeling van de stochast X: aantal tellingen per tijdseenheid.
Poisson verdeling De Poissonverdeling kan gezien worden als de limiet van de Binomiale verdeling met heel grote n en heel kleine p, np constant, dus lim n en p 0. Kansdichtheidfunctie: Er geldt: E(X) = en ook Var(X) = . De parameter wordt intensiteit (intensity of rate) parameter genoemd. Belangrijk: reken altijd terug naar de juiste eenheid. Voorbeeld: iemand kopieert 2 cd’s. Per cd worden er gemiddeld 5 bits foutief overgeschreven. Wat is de kans op minder dan 6 foute bits in totaal? Nu geldt: = 2*5 = 10. Dus
Poisson proces Voor een Poisson proces waarbij de tijdsduur niet vaststaat, wordt vaak uitgedrukt per tijdseenheid. D.w.z. als = 10 voor tijdsduur 1, dan geldt dat de intensiteit voor willekeurige tijdsduur t gelijk is aan ’ = t = 10t. Dus dan geldt als X het aantal tellingen is in een tijdsinterval ter lengte t :
Uniform en Compendium Een discreet uniforme verdeling op de getallen a, a+1, …, b veronderstelt een even grote kans op al deze getallen: f(i) = i/(b – a +1). Er geldt E(X) = (b - a)/2, V(X) = (b – a + 1)2/12. Gebruik formules op blz. 8 t/m 11. Tabellen 9.12 t/m 10.18 zijn zeer handig voor het berekenen van binomiale en Poisson kansen. Voorbeeld: we hebben een binomiale stochast waarvoor n = 13 en p = 0.7. Bereken de kans P( 2 X <10). In de tabel staan alleen kansen voor p 0.5. Echter we weten dat voor de successen X de gebeurtenis {2 X <10} alleen geldt als voor het aantal falers Y geldt {3 < Y 11}, omdat X + Y = 13. Daarom: P(2 X < 10) = P(3 < Y 11 ) = P(Y 11) – P(Y 3) = 1 – 0.4206 = 0.5794
Combineren week 1 en 2 Vaak is het nodig de rekenregels voor kansen te combineren met de kansverdelingen. Voorbeeld Er zijn twee soorten metalen die een bepaalde stof kunnen verontreinigen. Men weet dat die metalen in een verhouding 1 : 3 voorkomen en men weet ook dat er van metaal 1 gemiddeld drie van zulke verontreinigingen in 100 kg van de stof zitten en van metaal 2 zijn dat er gemiddeld vijf. Nu hebben we 150 kg van die stof, en we meten 6 verontreinigingen. Deze zijn van hetzelfde metaal, maar we kunnen niet meten welk. Wat is de kans dat de verontreiniging van metaal 1 gemaakt zijn? M1 : metaal 1, M2: metaal 2, X: aantal verontreinigingen. Gebruik Bayes’ formule: P(M1|X=6) = P(X=6 | M1)*P(M1) / P(X=6), P(X=6) = P(X=6 | M1)*P(M1) + P(X=6 | M2)*P(M2). P(X=6|M1) is een Poissonkans met = 3*1.5 = 4.5, dus P(X=6|M1) = e-4.5 * 4.56 / 6! = 0.128 en evenzo P(X=6|M2) = e-7.5 * 7.56 / 6! = 0.136 . Tenslotte P(M1) = ¼ en P(M2) = ¾. Invullen geeft: P(M1|X=6) = 0.128*0.25 / (0.128*0.25 + 0.136*0.75) = 0.238.