Bayes Voor psychologen
Pierre Simon Laplace Recap Bayes’ Rule
Als een test.99 van de patienten detecteert die aan ziekte Z lijden (dit is erg hoog voor een medische test!)…, en mijn testresultaat blijkt positief… …hoe waarschijnlijk is het dan dat ik Z heb?
Vraag1 1: hoe prevalent is Z? Stel: 1 patient op de 1000 Vraag 2: Hoe veel false alarms?. Stel: 2 op de 100 gezonde mensen die worden getest. (Heel goede test! Veel beter dan PSA- niveau voor prostaatkanker en mammogram voor borstkanker!!!) Kans is.047
Lijkt.047 erg laag? Probeer een ruwe benadering: Test een groep van 1000 mensen Daarbij kun je redelijkerwijze 1 zieke verwachten die hoogstwaarschijnlijk een positieve uitslag krijgt Van de bijna 1000 gezonden zullen er ongeveer 20 ten onrechte een positieve uitslag krijgen. Van de 21 positieven is er dus ongeveer 1 ziek, dat is dus een kans van ongeveer.048
Preciezer: … ….- 99 ziek op = 2097 positieven: % 1% 2%
Zo’n redenering helpt voor intuitief begrip, maar is niet werkelijk valide: ook bij een steekproef van weet je niet zeker dat er precies 100 mensen ziek zijn! Vooral kansen en voorwaardelijke kansen De kans op A: p(A) De kans op A gegeven B:p(A|B) Eerst een voorbeeld, dan een definitie. Voor een formele behandeling van dit soort vragen moet men meer weten.
De kans op A gegeven B:p(A|B) een voorbeeld, p(even) = 5/10 =1/2
De kans op A gegeven B:p(A|B) een voorbeeld, p(even) = 5/10 = 1/2 p(deel3) = 3/10
De kans op A gegeven B:p(A|B) een voorbeeld, p(even) = 5/10 = 1/2 p(deel3) = 3/10 p(even) = 5/10 = 1/2 p(deel3) = 3/10 p( even ^ deel3 ) = 1/10
De kans op A gegeven B:p(A|B) een voorbeeld, p(even) = 1/5 = ½ p(deel3) = 3/10 p(even ^ deel3) = 1/10 Kans op even gegeven deel3: p(even|deel3) = 1/3 p(even^deel3) 1/10 = = p(deel3) 3/10
De kans op A gegeven B:p(A|B) een voorbeeld, p(even) = 1/5 = ½ p(deel3) = 3/10 p(even ^ deel3) = 1/10 p(even|deel3) = 1/3 = p(even^deel3) 1/ = p(deel3) 3/10 p(deel3|even) = p(even^deel3) 1/ = = --- p(even) 5/10 5 Kans op deel3 gegeven even:
Een regel die verband legt tussen p(A|B) en p(B|A)is heel belangrijk voor psychologen! Onderzoeker weet(?) p(gedrag|proces) Maar wil weten p(proces|gedrag) Diagnost weet p(testuitslag|stoornis) Maar wil weten p(stoornis|testuitslag) Statisticus weet p(steekproef|populatie) Maar wil weten p(populatie|steekproef) Waarnemer “weet” p(stimuli|wereld) Maar “concludeert” p(wereld|stimuli)
p(A^B) p(A|B) = p(B) p(A^B) en p(B|A) = p(A) p(B|A)p(A) = p(A^B) p(B|A)p(A) p(A|B)= p(B) [basisvorm] p(B|A)p(A) p(A|B)= p(B|A)p(A) + p(B|¬A)p(¬A) [standaardvorm] p(B) = p(B^A) + p(B^¬A) =p(B|A)p(A)+p(B|¬A)p(¬A)
p(B|A)p(A) p(A|B)= p(B) [basisvorm] p(B|A)p(A) p(A|B)= p(B|A)p(A) + p(B|¬A)p(¬A) [standaardvorm] Odds i.p.v. waarschijnlijkheid: Ω(A) = p(A)/p(¬A) p(B| A) p( A) p( A|B)= p(B) p(A|B) p(B|A) p(A) = p(¬A|B) p(B|¬A) p(¬A) posterior odds = likelihood ratio prior odds
De odds vorm is heel aardig om te laten zien wat er gebeurt als je nieuwe informatie krijgt: p(A|B) p(B|A) p(A) = p(¬A|B) p(B|¬A) p(¬A) Je oorspronkelijke geloof in A (prior odds) De diagnostische “kwaliteit” van nieuwe informatie B (likelihood ratio) Je nieuwe geloof in A, nu je B weet (posterior odds)
p(B|A)p(A) p(A|B)= [basis] p(B) p(B|A)p(A) p(A|B)= p(B|A)p(A) + p(B|¬A)p(¬A) p(A|B) p(B|A) p(A) = [‘odds’] p(¬A|B) p(B|¬A) p(¬A) j p(B|A j ) j p(B|A i )p(A i ) p(A i |B) = [gegeneraliseerde j p(B|A j )p(A j ) standaardvorm] Niet vergeten:
p(Pos|Z)p(Z) p(Z|Pos)= p(Pos|Z)p(Z) + p(Pos|¬Z)p(¬Z) = = = Opnieuw het ziektevoorbeeld: 99% van zieken positief [p(Pos|Z)] 2% van gezonden positief [p(Pos|¬Z)] 0.1% zieken [p(Z)]
In de odds vorm: p(A|B) p(B|A) p(A) = p(¬A|B) p(B|¬A) p(¬A) (lage) prior odds (hoge) diagnostische waarde (49.5) (hoge) diagnostische waarde (49.5).0495 (nog steeds lage) posterior odds
Problemen: Wat is kans? (verschillende antwoorden: - (limiet van) relatieve frequentie - maat voor sterkte van geloof - mate waarin hypothese wordt ondersteund door evidentie) Kun je zeggen dat een unieke gebeurtenis of de toestand op dit moment (de kans dat ik nu Z heb) een kans p heeft?
Graf van Bayes