Statistiek voor BMT Informatie Vakinformatie via: http://www.win.tue.nl/~markvdw Studiewijzer Slides Extra opgaven Tentamens Uitwerkingen
Statistiek voor BMT Studiemateriaal Applied Statistics and Probability for Engineers. Montgomery & Runger 3rd ed., Wiley Statistisch Compendium, diktaat. Nr. 2218 Statgraphics voor regulier onderwijs, dikt. Nr. 2556 Lesvormen Colleges: Dinsdag 3e + 4e uur (Aud. 5) Instructies: Donderdag 7e (start: 15.30u) en 8e uur (MA-Hal) Met: Gebruik Statgraphics Extra Onderwerpen, mn beschrijvende statistiek
Statistiek voor BMT Oefening &Tentaminering Voorbeelden nawerken Veel opgaven maken Tentamenopgaven oefenen Tentaminering: schriftelijk Slagingspercentage: ~ 50%
Statistiek voor BMT Statistiek Wat kun je ermee??? Beslissingsondersteunend middel bij het trekken van conclusies uit (kwantitatieve) gegevens, rekening houdend met onzekerheid ‘Meten is weten’, maar ook ‘meten geeft ruis’ M.b.v. statistiek kunnen we beslissen of een waargenomen fenomeen vrijwel zeker niet te wijten is aan ruis of dat het wel door ruis veroorzaakt zou kunnen worden.
Statistiek voor BMT Voorbeeld Er zijn twee methoden om de dikte van een bloedvat te meten aan de hand van een scan: handmatig en automatisch. We passen de twee methoden toe op 15 bloedvaten en krijgen de volgende data: Is 5.79 significant verschillend van 5.08?
Statistiek voor BMT Onderdelen van de statistiek De basis: Kansrekening “Wat je in de krant tegenkomt”: Beschrijvende statistiek Kentallen (gemiddelde e.d.) Grafieken (histogrammen) Kwantificeren: Verklarende statistiek Uit een steekproef conclusies trekken over een groter geheel
Kansrekening Centrale begrippen Kans (probability) Stochast (random variable) Uitkomstenverzameling (sample space) Gebeurtenis (event) Doorsnede (intersection) Vereniging (union) Voorwaardelijke kans (conditional probability) (On)afhankelijkeheid ((in)dependence) Exclusief / elkaar uitsluitend (mutually exclusive) Totale kans regel (total probability rule)
Inleiding kansrekening Kansexperiment Een herhaalbaar experiment waarbij verschillende uitkomsten mogelijk zijn. De verzameling mogelijke uitkomsten van zo’n experiment heet de uitkomstenruimte (sample space) De uitkomstruimte kan eindig of oneindig zijn en discreet (‘aftelbaar’) of continu. Voorbeelden Eindig discreet: Werpen met een dobbelsteen U={1,2,3,4,5,6} Slagen van een operatie U={Ja,Nee} Oneindig discreet: Het aantal worpen met een dobbelsteen totdat je de eerste keer zes gooit U={1,2,3,….} Eindig continu: Landen van een dartpijl op het dartbord U=. Het gewicht van een baby bij geboorte U=[0,?) Oneindig continu: Levensduur van een lamp U=[0,) Let op! In de praktijk wordt vaak een oneindige uitkomstenruimte gebruikt als model, omdat het niet mogelijk is een zinnig minimum of maximum aan te geven.
Inleiding kansrekening Gebeurtenis (Event) Een gebeurtenis is een deelverzameling van de uitkomstenruimte U Dus bijvoorbeeld: Werpen met een dobbelsteen. Gebeurtenis: uitkomst oneven wordt weergegeven met de deelverzameling {1,3,5} Lengte van een baby bij geboorte. Gebeurtenis: langer dan 50 cm wordt weergegeven met [50, max), of [50, ).
Inleiding kansrekening Doorsnede (intersection) en vereniging (union) A: aderverkalking B: hartinfarct AB (‘A door B’): zowel aderverkalking als hartinfarct treedt op AB: (‘A en/of B’): aderverkalking of hartinfarct of allebei treedt op Elkaar uitsluitende of ook wel disjuncte gebeurtenissen (mutually exclusive): AB is leeg. Voorbeeld: werpen met twee dobbelstenen, uitkomst is de som. A: alle 4-vouden, B: alle 5-vouden. Venn-diagram Grafische weergave van verzamelingen Bijvoorbeeld, twee gebeurtenissen sluiten elkaar uit:
Inleiding kansrekening Een kansmaat (probability measure) P kwantificeert de waarschijnlijkheid van een een gebeurtenis. Zo’n kansmaat voldoet altijd aan de volgende drie axioma’s: De totale kans is 1, P(U) =1 Voor elke mogelijke gebeurtenis E geldt: 0 P(E) 1. Als A en B elkaar uitsluiten dan P(A B) = P(A) + P(B). Hieruit volgen: De lege verzameling krijgt kans 0: P() = 0 Voor het complement A’ van gebeurtenis A geldt: P(A’) = 1 – P(A).
Inleiding kansrekening De somregel: P(A B) = P(A) + P(B) – P(AB) a Voorbeeld. We hebben een groep van 100 mensen, 50 zijn er te dik, 25 roken en 17 zijn er te dik en roken. We selecteren aselect 1 persoon. Wat is de kans dat deze tot een risicogroep behoort, d.w.z. te dik is en/of rookt? A: te dik, B: roken. Dan P(A B) = 0.5 + 0.25 - 0.17 = 0.58. Vaak is de volgende regel handig: P(A B) = 1 – P(A’ B’).
Inleiding kansrekening Voorwaardelijke kans (conditonal probability) Stel A: eerste behandeling van een ziekte is succesvol en B: tweede behandeling van dezelfde ziekte is succesvol. Een patiënt komt voor de tweede keer voor een behandeling. De eerste keer is de behandeling goed aangeslagen. Wat is de kans dat de behandeling weer goed aanslaat? Dit is niet P(B), want dan zouden we de informatie die we hebben over de eerste behandeling niet beschouwen. Wel: P(B|A) = P(A B) / P(A) “kans op B gegeven A”. Dus ook: P(A B) = P(B|A) P(A)
Inleiding kansrekening Onafhankelijkheid (independence) Twee gebeurtenissen A en B zijn onafhankelijk als en alleen als: P(A B) = P(A)P(B) Hieruit volgen: P(A|B) = P(A) en P(B|A) = P(B) en ook voor onafhankelijke gebeurtenissen Al, …, Ak: P(Al A2 … Ak) = P(Al)P(A2)…P(Ak). Onafhankelijkheid maakt veel berekeningen eenvou-diger. Het is een veelvoorkomende aanname in kansmodellen en statistische modellen wanneer ge-beurtenissen elkaar redelijkerwijs niet beïnvloeden. Voorbeeld. A: persoon 1 heeft de griep en B: persoon 2 heeft de griep. Als A en B ver genoeg van elkaar wonen dan kunnen we redelijkerwijs onafhankelijk-heid aannemen en dus: P(AB) = P(A)P(B) = (P(A))2.
Inleiding kansrekening Totale kans regel (total probability rule) Als Al, …, Ak elkaar uitsluiten en Al A2 … Ak=U (dus alles) dan geldt: P(B) = P(B Al) + … + P(B Ak) = P(B|Al)P(Al) + … + P(B|Ak)P(Ak) Voorbeeld. Men moet beslissen of het verstandig is een patiënt een bypass te geven. Dit doet men op basis van de 5-jaars overlevingskans. Men weet dat zonder bypass deze kans 0.4 is en met is de kans 0.7. Helaas bestaat de kans dat de patiënt overlijdt tijdens de operatie: deze is 0.1. Wat zou je doen? A: overlijden bij operatie B: langer dan 5 jaar Dan geldt wanneer men de bypass plaatst: P(B) = P(B|A)P(A) + P(B|A’)P(A’) = 0*0.1 + 0.7*0.9 = 0.63 > 0.4, dus op basis van dit criterium zou je de bypass plaatsen. Bekijk ook het spel: Kies de Deur www.stat.sc.edu/~west/javahtml/LetsMakeaDeal.html
Inleiding kansrekening Bayes’ stelling (Bayes’ rule) Vaak wordt de Bayes’ stelling in combinatie met de totale kans regel gebruikt. Toepassing van de stelling kan tot verrassende resultaten leiden: Een wielrenner wordt positief bevonden bij de een dopingtest. Zo’n test is niet perfect. De kans op ‘detectie’ terwijl de renner ook echt gebruikt heeft is 0.99. De kans op ‘misdetectie’ (renner heeft niet gebruikt) is 0.04. Men denkt dat zo’n 5% van de renners gebruikt. Men wil nu de kans bepalen dat hij ook daadwerkelijk heeft gebruikt. A: doping gebruikt B: positief bevonden Gevraagd P(A|B) ? Gebruik Bayes’ stelling, bereken eerste P(B|A)P(A) = 0.99*0.05 = 0.0495. Gebruik totale kans regel voor P(B) = P(B|A)P(A) + P(B|A’)P(A’) = 0.0495 + 0.04*0.95 = 0.0875. Daarom P(A|B) = 0.0495/0.0875 = 0.57 <<< 1 !!! Contra-expertise noodzakelijk!
Inleiding kansrekening samenvatting Hoe pak je een kansprobleem aan? Benoem alle gebeurtenissen die van belang zijn met hoofdletters: A, B, … Vertaal de gevraagde kans: P(A), P(A|B), P(A B), P(A B). Schrijf op wat je weet: welke kansen zijn gegeven? Pas de verschillende rekenregels toe. Bijv. Bayes’ stelling: als P(B|A) gevraagd wordt en P(A|B) gegeven is Totale kansregel: als P(B) gevraagd word en P(B|A) en P(A) gegeven zijn. Somregel: als P(A B) gevraagd wordt en P(A), P(B) en P(A B) gegeven. Of alleen P(A) en P(B) en A en B sluiten elkaar uit dan P (A B) = 0, danwel A en B zijn onafhankelijk, dan P (A B) = P(A)P(B). Vaak handig: P(A) = 1 - P(A’) dus ook: P(Al A2 … Ak) = 1 - P((Al A2 … Ak)’) = 1-P(Al’A2’ …Ak’) = 1- P(Al’)*..*P(Ak’), als A1 tot en met Ak onderling onafhankelijk zijn.