Signaaldetectietheorie

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Overzicht Sessie 1 Inleiding
havo B Samenvatting Hoofdstuk 6
vwo B Samenvatting Hoofdstuk 3
Stijgen en dalen constante stijging toenemende stijging
Een manier om problemen aan te pakken
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Is cosmology a solved problem?. Bepaling van Ω DM met behulp van rotatie krommen.
Inleiding: De bepaalde integraal
vwo A/C Samenvatting Hoofdstuk 2
vwo D Samenvatting Hoofdstuk 9
Overzicht presentatie
Internationale hogeschool Breda Wiskunde bij het ontwerpen en evalueren van verkeerslichtenregelingen Wachten voor een verkeerslicht duurt altijd te lang…..
Inleiding en simpel model
TCPII Beslissen normatief.
Voortgezette signaaldetectietheorie
Inleiding Adaptieve Systemen
Differentiëren en integreren
Overzicht van de leerstof
vwo A/C Samenvatting Hoofdstuk 7
vwo A Samenvatting Hoofdstuk 15
vwo B Samenvatting Hoofdstuk 7
vwo A Samenvatting Hoofdstuk 12
vwo C Samenvatting Hoofdstuk 14
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Assenstelsels en het plotten van Functies in LOGO
Het proefverslag Van de calorimetrie-proef (proef 4) moet een proefverslag worden gemaakt. De studenten die proef 4 hebben gedaan in de week van 29 sept 
Metingen met spreiding
Discrete stochasten Onderwerpen Stochasten (random variables)
Continue kansverdelingen
Beslisbomen Robert de Hoog College Beslissingsondersteuning 26 september 2002.
T U Delft Parallel and Distributed Systems group PGS Fundamentele Informatica in345 Deel 2 College 5 Cees Witteveen.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Meten bij marktonderzoek
Voorspellende analyse
Hoofdstuk 1 Basisvaardigheden.
Populatiegemiddelden: recap
Hoe en waarom brengt de burger zijn snoeihout snel naar de biomassa verbrander? Van consument tot biomassaleverancier.
havo A Samenvatting Hoofdstuk 3
havo/vwo D Samenvatting Hoofdstuk 4
The relevance of recall and precision in user evaluation Louise T. Su Journal of the American Society of Information Science 1994.
Les 2 groep 8 leerdoel: Je kunt werken met een verhoudingstabel.
Vormstabiele lenzen Vormstabiele lenzen (harde lenzen)
H4 Differentiëren.
H2 Lineaire Verbanden.
Natuurwetenschappelijk verslag
Afleidingen Signaaldetectietheorie
Bayes Voor psychologen. Pierre Simon Laplace Recap Bayes’ Rule.
Klas 2 m en herhaling voor klas 3 m
HISPARCWOUDSCHOTEN 2006NAHSA Tellen van Random gebeurtenissen Hoe nauwkeurig is een meting?
havo B Samenvatting Hoofdstuk 1
Vergelijkingen oplossen
Verbanden JTC’07.
TM RM Zo ziet een stukje EEG van 2 seconden eruit. Veel ruis dus. Het trial marker kanaal geeft twee pulsen (TM), dat is een pijl naar rechts op het scherm.
Baarde en de goede Hoofdstuk 11: Data-analyse
Gereedschapskist vlakke meetkunde
Hoge Energie Fysica Introductie in de experimentele hoge energie fysica Stan Bentvelsen NIKHEF Kruislaan SJ Amsterdam Kamer H250 – tel
PSO. Praktisch school onderzoek.
Samenvatting.
Gecijferdheid 2 (Meten 1 – ME144X) week 3
Gecijferdheid 2 (Meten 1 – ME144X) week 5
Significante cijfers © Johan Driesse © 2013 – Johan Driesse.
eenheden variabele productiefactor (arbeid) productie in aantallen
Wiskunde A of wiskunde B?.
De grafiek van een lineair verband is ALTIJD een rechte lijn.
3 vmbo-KGT Samenvatting Hoofdstuk 10
Interactieve powerpoint
Transcript van de presentatie:

Signaaldetectietheorie Voortzetting: modellen en maten

De ROC-(response operating characteristic) curve verbindt punten in een Hit/FA- plot, afkomstig van verschillende criteria bij dezelfde gevoeligheid ROC-curve karakteriseert signaal/detector onafhankelijke van criterium belangrijk: gevoeligheid en criterium theoretisch onafhankelijk

ROC-curve hits Zelfde gevoeligheid (voor dit signaal), verschillende criteria false alarms

Grotere gevoeligheid: ROC-curve verder van diagonaal (Perfectie zou zijn: allemaal hits en geen false alarms) hits false alarms

Suggereeert maat voor gevoeligheid (onafhankelijk van criterium:) –gegeven een empirisch bepaalde ROC curve): Oppervlakte onder ROC-Curve: A

Geen onderscheid tussen signaal en ruis: A = .50

Perfect onderscheid tussen signaal en ruis: A  1.

Hier: A = .75

Hoe interpreteer je A? Oppervlaktestelling/ Area theorem: A is equivalent met proportie correcte antwoorden in 2AFC-experiment: Gegeven: 1 ruisstimulus 1 signaal (+ruis) stimulus, Welke is wat? Lijkt zinnig! Belangrijk maar lastig.

fn fs ∞ PH = ∫ fs(x)dx λ = H(λ) ∞ PFA = ∫ fn(x)dx λ = FA(λ) x PH PFA Recap: In het algemeen: fn fs ∞ PH = ∫ fs(x)dx λ = H(λ) ∞ PFA = ∫ fn(x)dx λ = FA(λ) x 0 λ PH λ = FA-1(PFA) ROC-curve: PH = H(λ) = H[FA-1(PFA)] Specifiek model hangt af van fn and fs PFA

fs fn ∞ PH = ∫ fs(x)dx λ = H(λ) ∞ PFA = ∫ fn(x)dx λ = FA(λ) x Herinterpretatie voor 2A FC experiment: fs fn ∞ PH = ∫ fs(x)dx λ ∞ PFA = ∫ fn(x)dx λ = H(λ) = FA(λ) x 0 λ De twee alternatieven corresponderen met twee punten op de x-as. Stel dat λ de ruisstimulus is: PC = p(xs>xn), indien xn = λ, p(xs>xn) = H(λ) Alle H(λ) voor elke λ sommeren Wegen voor dichtheid van λ [= fn(λ)]: ∞ PC = ∫ H(λ)fn(λ)dλ -∞

fn fs ∞ PH = ∫ fs(x)dx λ = H(λ) ∞ PFA = ∫ fn(x)dx λ = FA(λ) x PH Oppervlakte onder Roc-curve: fn fs ∞ PH = ∫ fs(x)dx λ = H(λ) ∞ PFA = ∫ fn(x)dx λ = FA(λ) x 0 λ PH ROC-curve: PH [= H(λ)] as functie van PFA [= FA(λ)] 1 A = ∫ H(λ)dFA(λ) 0 ∞ PC = ∫ H(λ)fn(λ)dλ -∞ PFA

∫ 1 A = ∫ H(λ)dFA(λ) 0 (-fn(λ)dλ) fn(x)dx = 1 - fn(x)dx dFA(λ) d(λ) afleiding (optioneel): 1 A = ∫ H(λ)dFA(λ) 0 (-fn(λ)dλ) fn(x)dx = 1 - fn(x)dx ∞ λ ∫ -∞ dFA(λ) d(λ) ------- = -fn(λ) Nog twee kleine klusjes: integratielimieten en minteken dFA(λ) = -fn(λ)dλ ∞ PC = ∫ H(λ)fn(λ)dλ -∞

∫  ∫ ∫  ∫ 1 A = ∫ H(λ)dFA(λ) 0 (-fn(λ)dλ) ∞ PC = ∫ H(λ)fn(λ)dλ -∞ afleiding (optioneel): 1 A = ∫ H(λ)dFA(λ) 0 (-fn(λ)dλ) Limieten: als FA(λ)=PFA= 0 dan λ = ∞ als FA(λ)=PFA= 1 dan λ = -∞ ∫  ∫ 1 -∞ ∞ Omkeren: -fn  fn ∞ ∫  ∫ -∞ ∞ PC = ∫ H(λ)fn(λ)dλ -∞

PH PFA Maten voor criterium Elk punt van ROC-curve geeft criterum/bias bij die gevoeligheid PH Richtingscoefficiënt raaklijn op dat punt als maat voor bias/criterium S = .49 PFA ROC-curve: PH as functie van PFA dPH Richtingscoefficiënt ----- dPFA

fn fs ∞ PH = ∫ fs(x)dx λ ∞ PFA = ∫ fn(x)dx λ x = β = S 0 λ Maten voor criterium ∞ PH = ∫ fs(x)dx λ ∞ PFA = ∫ fn(x)dx λ dPH dPH dPFA ----- = ----- • ------.dx dPFA dx dPH dPFA fs = - ----- fn = - ------- dx dx (kettingregel) dPH dPH/dx ----- = ------------ dPFA dPFA/dx - fs fs = ----- = ----- - fn fn = β = S

fn fs x PH PFA Herhaling: Gevoeligheid/ Onderscheidingsvermogen: 0 λ Herhaling: Gevoeligheid/ Onderscheidingsvermogen: 1. Afstand tussen verdelingen 2. Oppervlakte onder ROC-curve (A) f h PFA PH Criterium/Bias: 1. f/h = β 2. richtingscoeficiënt S Maar hoe ga je in de praktijk te werk?

Maar hoe ga je in de praktijk te werk? Hard werken Een aantal van de ROC-curve verkrijgen door meerdere criteria te induceren (pay-off, signaalfrequentie) op grond van vele trials (zowel signalen als alleen ruis) voor elk criterium proporties Hits en False alarms bepalen Dat zijn heel veel trials! Daarna grafisch A bepalen

Maar hoe ga je in de praktijk te werk? Zeker geen 0 1 2 3 4 5 Zeker wel signaal een signaal Variant: numerieke schaal: impliceert meer criteria – maar ook veel trials nodig

(1-h) f 1 - ¼ ----- + -- (1-f) h f Maar hoe ga je in de praktijk te werk? Ruwe benadering Oppervlaktemaat voor één punt: A' hits False Alarms Gemiddelde van die twee oppervlakten: A' = h (1-h) f 1 - ¼ ----- + -- (1-f) h f

FALSE ALARM RATE HIT RATE B''= -.4 B''= -.07 B''= .07 B''=.4 B''= 0 als H = 1, F≠0, F≠1, dan B'' = -1 F Vergelijkbare maat voor criterium/bias: Grier’s B'' H als H = -F + 1 dan B'' = 0 Als F = 0, H≠ 0, H≠1 dan B'' = 1 H(1 - H) – F(1 – F) B'' = sign(H - F)------------------------ H(1 - H) + F(1 – F)

Maar hoe ga je in de praktijk te werk? Assumpties invoeren Zelfs als je diverse punten hebt kunnen bepalen liggen ze vaak niet op een nette curve Dan moet je een curve fitten en maak je toch (impliciet) assumpties over de vorm van de kansverdelingen Bovendien kun je je werk besparen: meer assumpties  minder metingen

Normale verdelingen zijn populair (maar er zijn ook andere modellen!) Simpelste model: ruis- en signaalverdeling normaal, gelijke varianties Eén punt (PH, PFA paar) is genoeg

∫ 1 φ(x)= e-x2/2 √2π x Φ(x) = -∞ φdx Gaussiaanse modellen: preliminair Standaard normale curve M=0, sd = 1 1 φ(x)= e-x2/2 √2π x Φ(x) = -∞ φdx ∫ Transformaties: Φ(z)  P Φ-1(P) of Z(P)  z zie tabellen en standaard software

PH PFA λ zH zFA - Roc-curve PH = f(PFA) Z-transformatie ROC-curve P  z zH = f(zFA) zFA Goede manier om meer punten te plotten

zH d' zFA d' 0 λ Equal variance model: z-plot ROC 45° PFA = 1- Φ(λ), = Φ(-λ), zFA = -λ PH = 1 – Φ(-(d' - λ)) = Φ(d' – λ), zH = d' – λ zH = zFA + d' d' = zH - zFA 0 λ zH d' d' 45° zFA

Diverse waarden voor d' en bijbehorende ROC-curves

f h Criterium/bias: β = h/f = φ(zH)/φ(zF) Om symmetrie te verkrijgen wordt vaak een logransformatie toegepast: log β = log h – log f S

f h λ c c = -(d'/2 – λ) zH – zFA 2zFA c = - ---------- + ----- 2 2 β = h/f = φ(zH)/φ(zF) f h λ c Alternatief: c (ook wel λcenter), de afstand (in sd) tussen het midden (waar h=f) en het criterium c = -(d'/2 – λ) zH – zFA 2zFA c = - ---------- + ----- 2 2 zFA = -λ d' = zH - zFA zH + zFA c = - ---------- 2

β c Isobiascurves voor β en c

Ongelijke varianties: bijvoorbeeld σs = 2σn ROC- curves zijn assymmetrisch

PH PFA zH zFA PFA = Φ(-λ), zFA = -λ θ μs – λ μs – λ PH = Φ zH = σs σs Unequal variance model σn=1, σs PFA zH zH= ---- + --- zFA μs σs σs PFA = Φ(-λ), zFA = -λ μs/σs θ -μs zFA μs – λ μs – λ PH = Φ zH = σs σs tg(θ) = 1/σs

zH zFA Measures: e a de = Oe√2 da = Oa√2 O Δm μs √1 + σs2 Δm maakt geen verschil tussen grote en kleine σs Measures: Afstand tot oorsprong naar analogie met d' : zH ZH= -ZFA e a μs √1 + σs2 de = Oe√2 da = Oa√2 zFA O Δm (Pythagoras en gelijkvormige driehoeken)

n s PH PFA Gaussiaans 2AFC: Oppervlakte onder Gaussiaanse ROC-curve: Az Oppervlaktestelling!!! PFA Gaussiaans 2AFC: n s PC = p(xs>xn) = p(xs-xn>0)

PC = p(xs>xn) = p(xs- xn>0) -μs =1 - Φ √1 + σs2 -μs = Az volgens oppervlaktestelling!

μs = Φ √1 + σs2 μs/σs = Φ √1/σs2 + 1 PH PFA Oppervlakte onder Gaussiaanse ROC-curve: Az μs = Φ √1 + σs2 (al aangetoond) PFA μs/σs = Φ √1/σs2 + 1 tg Az = Φ(da/√2) Gelijke varianties : Az = Ad' = Φ(d'/√2)

Overzicht signaaldetectiematen Alg. Ruw Gaussiaans veel pt één pt σn ≠ σs σn = σs A A' Az da de Ad' d' S B'' β c Gevoeligheid Criterium/bias Hiermee kan men de prestaties en de criteria van mensen, apparaten en systemen weergeven.

PFA = η PH = α +η(1-α) 1-α η Yes onzeker 1-η No 1 η Yes H FA Voor de volledigheid: Finite State models High threshold: 1 Yes signaal α detect 1-α η Yes onzeker 1-η No 1 η Yes ruis onzeker 1-η No H m FA cr PFA = η PH = α +η(1-α)

PFA = η PH = α +η(1-α) hits False Alarms α α η Theoretische ROC curve Detect: Yes onzeker: η Yes 1-η No α “high threshold” (gebrekkige) vertaling naar signaal en ruismodel: α η Vgl correctie voor raden bij MC-vragen

hits β False Alarms 1-β Analoog: een low threshold model : Signaal leidt altijd tot onzekere toestand ruis leidt met P = β tot nondetect toestand (altijd NO) and anders tot onzekere toestand. β Nondetect: No Uncertain: η Yes 1-η No 1-β hits False Alarms

hits False Alarms En een gecombineerd drie-toestanden model N O D

hoeveel kost het missen van een wapen/explosief op een vliegveld? Hoeveel kost een false alarm? Hoeveel kost de vertraging die elke screening oplevert?

CMiss VHit VCR CFA Wat zijn die prestaties waard? Pay-off matrix “no” “yes” NB. C is hier een positief getal: “een false alarm kost je 5 euro” S(+N) N CMiss VHit VCR CFA EV = p(Hit)•VHi t- p(Miss)•CMiss+ p(CR)•VCR - p(FA)•CFA = p(s)•{PH• VHit – (1-PH)•CMiss} + p(n)•{(1-PFA)•VCR - PFA•CFA} Vergelijk met niks doen: EV = p(n)•VCR – p(s)CMiss NB.: Meestal is waarnemen niet gratis!

Een optimale beslissing in onzekerheid: Zet het criterium op een waarde van x (xc) waarvoor de verwachte waarde/utiliteit van “Yes” gelijk is aan de verwachte waarde/utiliteit van “No” xc x EV(Yes|xc) = EV(No|xc)

“Kosten”: CFA positief! EV(Yes|xc) = EV(No|xc) VHit• p(Hit) – CFA• p(FA) = VCR•p(CR) - CMiss•p(Miss) VHit• p(signal|xc) – CFA• p(noise|xc) = VCR•p(noise|xc) - CMiss•p(signal|xc) p(signal|xc) VCR + CFA ---------------- = --------------- p(noise|xc) VHit + CMiss Maar hoe weten we die?

p(signal|xc) VCR + CFA ---------------- = --------------- p(noise|xc) VHit + CMiss We willen deze p(x|noise) We weten (in principe) deze: p(x|signal) gevraagd: een manier om van p(A|B) op p(B|A) te komen Regel van Bayes !

p(A|B). p(B|A) p(A) --------- =. ---------- • ------- p(A|B) p(B|A) p(A) --------- = ---------- • ------- p(A|¬B) p(B|¬A) p(¬A) (odds form) Toegepast op signaaldetectie: p(xc|signal) p(signal) p(xc|noise) p(noise) • p(signal|xc) --------------- p(noise|xc) =

p(signal|xc) VCR + CFA ---------------- = --------------- p(noise|xc) VHit + CMiss Bayes p(xc|signal) p(signal) VCR + CFA -------------- • --------- --- = --------------- p(xc|noise) p(noise) VHit + CMiss p(xc|signal) p(noise) VCR+CFA ---------------- = ----------- • ----------- p(xc|noise) p(signal) VHit+CMiss β prior odds payoff matrix

p(xc|signal) p(noise) VCR+CFA ---------------- = ------------ • ----------- p(xc|noise) p(signal) VHit+CMiss Dus een ideale observator, op de hoogte van de prior odds en de pay-off matrix, kan een optimaal criterium berekenen. Mensen zijn niet zo handig met rekenen maar passen zich rededelijk aan aan pay-off matrix and prior odds