Operations Research Hoorcollege week 4 Deel 1 o.a. Poisson-verdeling en Negatief-exponentiële verdeling R.B.J. Pijlgroms Instituut Informatica en Elektrotechniek Hogeschool van Amsterdam
Discrete kansverdelingen discrete uniforme verdeling (N-aselector) Bernoulli-verdeling binomiale verdeling meetkundige of geometrische verdeling logaritmische verdeling (Benford-verdeling) Poisson-verdeling
Verdelingen en typische voorbeelden N-aselector (zuivere munt, dobbelsteen) Bernoulli-experiment of alternatief (Bernoulli-trial): 2 uitkomsten; 2 kansen. binomiale verdeling: geeft de kans op k successen in een rij van n Bernoulli-trials. Er geldt: 0 < k < n geometrische verdeling of meetkunige verdeling: geeft de kans op succes na pas n Bernoulli-trials, (n=1,2,3,...)
Samenvatting van het voorafgaande N-aselector Bernoulli-experiment binomiale verdeling … … meetkundige of geometrische verdeling
discrete uniforme verdeling (N-aselector) Stochast X; uitkomstenverzameling:{1, 2, 3, ..., N} P(X=x) = 1/N; E(X) = m =(N+1)/2; s2 = (N2 - 1)/12 Bernoulli-verdeling Stochast I; uitkomstenverzameling: {0, 1} P(I=0) = q = 1- p; P(I=1) = p; E(I)= m= p; s2 = pq binomiale verdeling: Bin(n, p) Stochast B; uitkomstenverz.: k = {0, 1, 2, ..., n} P(B=k)= (n boven k)pkqn-k; E(B) = m= n p; s2 = n pq meetkundige of geometrische verd.: Geom(p) Stochast N; uitkomstenverz.: n = {1, 2, 3, ...} P(N=n)= pqn-1; E(N) = m= 1/p; s2 = q/p2
Het verjaardagprobleem Hoe groot is de kans pm dat in een gezelschap van m personen, er tenminste twee op dezelfde dag jarig zijn? Complementaire kans Hoe groot is de kans dat er geen van de m op dezelfde jarig zijn, of: hoe groot is de kans dat ze alle m op verschillende dagen jarig zijn? 1- pm Samen zijn deze kansen gelijk aan één!
De Poisson-verdeling
Poisson-verdeling Genoemd naar één van de pioniers op het gebied van de theorie van de kansrekening Siméon Dénis Poisson (1781-1840) Definitie: Beschouw U={0, 1, 2, 3, ... oneindig }; laat m een vast getal >0 zijn. De onderstaande waarden voor p(n) zijn de kansen van de Poissonverdeling met parameter m
Poisson-verdeling p(0) = e-m = exp(-m) p(1) = e-m (m/1!) = exp(-m).m1/1!= m.exp(-m) p(2) = exp(-m). m2 /2! p(3) = exp(-m). m3 /3! p(4) = exp(-m). m4 /4! ...
Poisson-verdeling Wat is de betekenis van de parameter m in verband met de grootheid die Poisson(m)-verdeeld is, in samenhang dus met de stochast of kansvariabele ? We bekijken eerst wat voorbeelden van Poisson-verdeelde kansvariabelen.
Poisson-verdeling (vervolg) Voorbeelden het aantal moleculen van de soort X in een bepaald volumedeel van met X verontreinigde vloeistof. het aantal vaste deeltjes in een vast gekozen volumedeel van de atmosfeer. het aantal registraties in een Geiger-Muller-teller (radio activiteit) gedurende een vast gekozen tijdsinterval. het aantal windhozen in Nederland dat vergezeld gaat met aanzienlijke schade per tijdvak van bijvoorbeeld 20 jaar.
Poisson-verdeling (vervolg) Voorbeelden (vervolg) het aantal zetfouten per pagina van een boek. het aantal klanten per tijdseenheid aan een loket. het aantal weeffouten per oppervlakte-eenheid van een rol textiel. het aantal schepen dat per uur de Rotterdamse haven binnenvaart. het aantal passerende auto's per minuut op een bepaald punt van een autosnelweg. het aantal universeelmeters dat per maand defect raakt op een bepaald practicum.
Poisson-verdeling (vervolg) Globaal: De Poisson-verdeling is een model voor het optreden van ‘zeldzame’ verschijnselen. Toelichting op het begrip ‘zelden’. Als het bijvoorbeeld gaat om verschijnselen in de tijd, dan wordt met ‘zelden’ bedoeld: de tijdsduur van het verschijnsel is klein t.o.v. de tijdsduur tussen twee opeenvolgende verschijnselen.
Poisson-verdeling (vervolg) Toelichting op het begrip ‘zelden’. Als het bijvoorbeeld gaat om exemplaren in een volume, dan wordt met ‘zelden’ bedoeld: dat het exemplaar zelf een klein volume inneemt ten opzichte van het gemiddelde volume dat aan elk exemplaar ter beschikking staat. Het aantal exemplaren behoeft beslist niet klein te zijn.
Poisson-verdeling (vervolg) De parameter is gelijk aan het gemiddelde aantal exemplaren per eenheid van volume of tijd. Gemiddeld over een zeer groot volume of gemiddeld over een zeer lange tijdsperiode.
Klassiek voorbeeld (Bortkiewicz, 1898) Uit 200 jaarverslagen van 10 Pruisische cavaleriekorpsen over een periode van 20 jaar volgen de onderstaande aantallen ongelukken per jaar met dodelijke afloop tengevolge van de trap van een paard. k aantal rel.freq. theorie #trappen 0 109 0.545 0.544 0 1 65 0.325 0.331 65 2 22 0.110 0.101 44 3 3 0.015 0.021 9 4 1 + 0.005 + 0.003 + 4 + 200 1 1 122 gemiddeld aantal trappen per jaar = 122/200 = 0.61
Klassiek voorbeeld (Bortkiewicz, 1898) p(k) l=0.61 k=0, 1, 2, 3, 4,... p(k)=exp(-0.61).(0.61)k k! k
Het verjaardagsprobleem P(1 of meer) = 1 - P(0) P(1 of meer) = 1 - Bin((1/2)*m*(m-1);1/365) P(1 of meer) = 1 - Poisson(0; (1/2)*m*(m-1)) Bin(n; p) Poisson(m)
Binomiaal vergeleken met Poissonbenadering De benadering werkt als n groot is en p klein. n*p = m De kansen op k successen zijn praktisch gelijk.
De logarithische-verdeling of wet van Benford
De logaritmische verdeling of de wet van Benford De wet van Benford: In veel getallenverzamelingen (die random zijn ontstaan) bezitten de eerste cijfers van de getallen een aflopende verdeling die begint met ongeveer 30% voor het cijfer 1, ca. 18% voor het cijfer 2, en zo verder tot ongeveer 5% voor het cijfer 9. Frank Benford (1883 - 1948)
twee vragen dringen zich op Hoe groot zijn die kansen voor het optreden van de eerste cijfers 1, 2, 3, 4, 5, 6, 7, 8 en 9 dan wel precies? NB: Het gaat om het eerste cijfer (van links naar rechts gaande) dat ongelijk is aan nul; d.w.z. het meest significante cijfer. Wat is een getallenverzameling die ‘random’ is ontstaan ?
de antwoorden verzameling van fundamentele natuurconstanten getallen in kranteartikelen oppervlakten van meren en rivieren lengten van telefoongesprekken helderheidsverdelingen van sterren tegoeden op bankrekeningen grootten in bytes van printbestanden de logaritmische verdeling
De logaritmische verdeling In het tientallige stelsel is de uitkomstenverzameling: {1,2,3,4,5,6,7,8,9} Kansen zijn: Opgave: Toon zelf aan dat de som van deze negen kansen gelijk is aan 1.
Paginagrote advertentie van ah in de dagbladen van 12 juli 1989 Geteld cijfer 1 42.2 % cijfer 2 16.5 % cijfer 3 9.1 % cijfer 4 5.5 % cijfer 5 7.3 % cijfer 6 8.3 % cijfer 7 3.7 % cijfer 8 3.7 % cijfer 9 3.7 % Theoretisch verwacht cijfer 1 30.0 % cijfer 2 17.6 % cijfer 3 12.5 % cijfer 4 9.7 % cijfer 5 7.9 % cijfer 6 6.7 % cijfer 7 5.8 % cijfer 8 5.1 % cijfer 9 4.58% Kunnen we de verschillen verklaren ??
De meetkundige of geometrische kansverdeling
De logaritmische verdeling vergeleken met de meetkundige of geometrische verdeling
De meetkundige of geometrische verdeling p qp qqp qqqp qqqqp … + 1 … af
De negatief-exponentiële kansverdeling
De negatief-exponentiële verdeling f(x) f(x)=l e -lx l =1 f(x) = l e –lx = l exp(-lx) l = 0.5 1/l 1/l =2 l 0.5
De negatief-exponentiële verdeling De stochast Y met U = {y | y>0} heet (negatief-) exponentieel verdeeld als:
De negatief-exponentiële verdeling Voorbeelden De tussentijden bij radioactieve desintegratie De levensduur van sommige artikelen (gloeilampen) Tijdstippen tussen twee opeenvolgende telefoongesprekken of bezoeken aan een loket (giromaat,...)
De negatief-exponentiële verdeling rij van Bernoulli-experimenten geometrische verdeling binomiale verdeling t rij van neg.-exp. verd. intervallen Poisson-verdeling aantal per tijdseenheid
De negatief-exponentiële verdeling Hieronder staat het resultaat van het tellen van ‘het aantal begintijdstippen per 5 seconden’ van een rij van 1000 Exp(l=0,5 sec)-verdeelde aaneengesloten tijdsintervallen. experimenteel gevonden fracties theoretische kansen, berekend met de Poisson(2.5)-verdeling 5 seconden 2 sec aantal per 5 sec
Twee kanten van één medaille Poissonverdeling (aantallen aankomsten per vaste tijdseenheid) Negatief-exponetiële verdeling (verdeling van tussenaankomsttijden)