Deze les wordt verzorgd door de Kansrekening en statistiekgroep Faculteit W&I TU/e
/k 2 Statistiek komt in de praktijk vaker voor dan je denkt. Kan je een paar voorbeelden noemen? We gaan kijken naar een toepassing in de sportwereld: De dopingtest
/k 3 De dopingtest: heeft hij echt gebruikt of niet?
/k 4 (artikel wordt uitgedeeld) Opdracht: Markeer de drie belangrijkste punten waar mogelijk statistiek/kansrekening een rol kan hebben gespeeld.
/k 5 Praktische vragen: Positieve dopingtest: wat is de kans is dat F.L. ook echt gebruikt heeft? Hoe kunnen we het beste eigenschappen van het testapparaat aanpassen zodat we een betere test krijgen? Gaan we kiezen voor deze (dure) oplossing? Wat is het nut van de contra-expertise?
/k 6 We hebben het volgende nodig: Stel D de gebeurtenis: wielrenner heeft doping gebruikt en TP de gebeurtenis: positieve test. P(D) is onvoorwaardelijke kans: de kans dat een wielrenner waarover verder geen info beschikbaar is doping heeft gebruikt. P(D|TP) is de voorwaardelijke kans: kans dat de wielrenner doping heeft gebruikt gegeven dat hij positief is getest. Hierin zijn we geïnteresseerd.
/k 7 Stel dat we weten dat zo’n 5% van de wielrenners werkelijk doping gebruikt, dan geldt: P(D)=0.05 Dit nemen we als uitgangspunt.
/k 8 Eigenschappen apparatuur Vraag: hoe omschrijf je de sensitiviteit P(TP|D)? Antwoord: De kans dat de test positief is terwijl er daadwerkelijk doping is gebruikt. Wens je deze kans (=eigenschap) zo groot mogelijk of zo klein mogelijk?
/k 9 Eigenschappen apparatuur Vraag: hoe omschrijf je de specificiteit P(TP’|D’)? Antwoord: De kans dat de test negatief is terwijl er geen doping is gebruikt. Wens je deze kans (=eigenschap) zo groot mogelijk of zo klein mogelijk?
/k 10 Wat we weten: Door ‘historie van metingen’ kennen we de sensitiviteit en de specificiteit van de apparatuur. Sensitiviteit: P(TP|D)=0.99 Specificiteit:P(TP’|D’)=0.96 En verder P(D)=0.05
/k 11 Wat we willen weten in ons dopingvoorbeeld: P(D|TP) Breng deze kans zelf nog eens onder woorden. Probeer deze kans in een plaatje (Venndiagram)te tekenen, waarbij je de doorsnede van twee gebeurtenissen D TP gebruikt. Er geldt: P(D TP) is de kans dat de renner doping heeft gebruikt én positief wordt getest.
/k 12 Kan je uit je plaatje de volgende belangrijke rekenregel aflezen?
/k 13 Om onze gegevens in te kunnen vullen moeten we deze regel 'omzetten'. Dit kan met een regel van de beroemde… Thomas Bayes
/k 14
/k 15 Regel van Bayes* Voorwaardelijke kans uit de voorwaardelijke 'andersom' kans en de onvoorwaardelijke kansen *Wordt alleen afgeleid tijdens een dubbeluur.
/k 16 Regel van Bayes bij dopingtest:
/k 17 Regel van Bayes in een plaatje In geval van bijgaande barchart geldt: Sensitiviteit: P(TP|D)=0.80 Specificiteit:P(TP’|D’)=0.975 P(D)=0.125 Waar vind je deze kansen (verhoudingen) terug in het plaatje?
/k 18 Sensitiviteit: P(TP|D)=0.80 Specificiteit:P(TP’|D’)=0.975 P(D)=0.125
/k 19 Terug naar ons probleem: de dopingtest (heeft hij echt gebruikt of niet?
/k 20 Invullen van de formule geeft: Deze uitkomst is een stuk kleiner dan 1 !!
/k 21 Voor onze oorspronkelijke gegevens geldt zelfs dat de berekende kans 0.57 is (ga na). Wat betekent dit in de praktijk? Kan je het 'oplossen' door sensitiviteit of specificiteit te verhogen?
/k 22
/k 23 Verbeteren van apparaat is duur. Kan je een andere oplossing bedenken? Een andere oplossing is: contra-expertise (zie krantenartikel)
/k 24 Effect van contra-expertise: tweede test T 2 P(D onafhankelijke testen T 1 én T 2 positief )=
/k 25 Contra-expertise voor ons voorbeeld:
/k 26 Conclusie: Door een extra test (contra-expertise) verlaag je aanzienlijk de kans om de persoon in kwestie ten onrechte te beschuldigen van gebruik van doping.
/k 27 Tenslotte… Lesbrief* behandelt nog: Afleiding van de regel van Bayes m.b.v. voorbeelden Extra uitdieping(formules) van de contra-expertise opgaven HIV test * wordt alleen behandeld/uitgedeeld bij een dubbeluur
/k 28 Geheugensteuntje: D: er wordt doping gebruikt TP: test is positief D’: er wordt geen doping gebruikt TP’: test is negatief Sensitiviteit P(TP D): kans dat de test positief is terwijl er daadwerkelijk doping is gebruikt Specificiteit P(TP’ D’): kans dat de test negatief is terwijl er geen doping is gebruikt