Voortgezette signaaldetectietheorie

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Overzicht Sessie 1 Inleiding
havo B Samenvatting Hoofdstuk 6
vwo B Samenvatting Hoofdstuk 3
Stijgen en dalen constante stijging toenemende stijging
Een manier om problemen aan te pakken
Het vergelijken van twee populatiegemiddelden: Student’s t-toets
Tabellen Metingen schrijf je meestal op in een tabel
Is cosmology a solved problem?. Bepaling van Ω DM met behulp van rotatie krommen.
Kenmerken Veel aanbieders Vrije toe- en uitreding Homogene goederen
Het prijs- of marktmechanisme I
P-waarde versus betrouwbaarheidsinterval
vwo A/C Samenvatting Hoofdstuk 2
vwo D Samenvatting Hoofdstuk 9
Inleiding en simpel model
TCPII Beslissen normatief.
Differentiëren en integreren
vwo A/C Samenvatting Hoofdstuk 7
vwo A Samenvatting Hoofdstuk 15
vwo B Samenvatting Hoofdstuk 7
vwo A Samenvatting Hoofdstuk 12
vwo C Samenvatting Hoofdstuk 14
Multiplechoise toets voor havo 4 H2 & H3 Na een poosje komt er een tijdbalk in beeld. Als deze bij het paarse vakje aangekomen is heb je nog maar 1 a.
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Inferentie voor regressie
Het proefverslag Van de calorimetrie-proef (proef 4) moet een proefverslag worden gemaakt. De studenten die proef 4 hebben gedaan in de week van 29 sept 
Metingen met spreiding
Discrete stochasten Onderwerpen Stochasten (random variables)
Continue kansverdelingen
T U Delft Parallel and Distributed Systems group PGS Fundamentele Informatica in345 Deel 2 College 5 Cees Witteveen.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Voorspellende analyse
havo A Samenvatting Hoofdstuk 3
Vwo C Samenvatting Hoofdstuk 15. Formules en de GR Met de GR kun je bijzonderheden van formules te weten komen. Eerst plot je de grafiek. Gebruik eventueel.
havo/vwo D Samenvatting Hoofdstuk 4
Een Theoretische en Empirische Analyse van Benaderingen in Symbolische Probleem Oplosmethoden.
Vereisten voor een screeningsprogramma
3.4 Rekenen met energie 4T Nask1 H3 Energie.
H4 Differentiëren.
H2 Lineaire Verbanden.
Afleidingen Signaaldetectietheorie
Bayes Voor psychologen. Pierre Simon Laplace Recap Bayes’ Rule.
Signaaldetectietheorie
HISPARCWOUDSCHOTEN 2006NAHSA Tellen van Random gebeurtenissen Hoe nauwkeurig is een meting?
havo B Samenvatting Hoofdstuk 1
Vergelijkingen oplossen
Verbanden JTC’07.
TM RM Zo ziet een stukje EEG van 2 seconden eruit. Veel ruis dus. Het trial marker kanaal geeft twee pulsen (TM), dat is een pijl naar rechts op het scherm.
Wiskunde A of wiskunde B?.
Een verrassende ontmoeting met constanten
Baarde en de goede Hoofdstuk 11: Data-analyse
Gereedschapskist vlakke meetkunde
Werken met de TI-84 Lianne Dirven: “Leer je net als auto rijden alleen maar door het (veel) te doen!”
PSO. Praktisch school onderzoek.
Samenvatting.
Gecijferdheid 2 (Meten 1 – ME144X) week 3
Gecijferdheid 2 (Meten 1 – ME144X) week 5
Plancyclus, les 4  Actualiteit  Vragen naar aanleiding van vorige les  Vragen over hoofdstuk 4 en 5  Observeren met een plan; het verschil tussen observeren.
Tot nu toe. Geschiedenis Uitzonderingen, verschil in incidenties.
Gert Treurniet Christelijk Gymnasium Sorghvliet Docent wiskunde
Wiskunde G3 Samenvatting H2: Parabolen
Significante cijfers © Johan Driesse © 2013 – Johan Driesse.
eenheden variabele productiefactor (arbeid) productie in aantallen
Wiskunde A of wiskunde B?.
Rekenen Les 5: rekenen met grafieken, diagrammen en tabellen
De grafiek van een lineair verband is ALTIJD een rechte lijn.
3 vmbo-KGT Samenvatting Hoofdstuk 10
Voorspellende analyse
Regelmaat en formules Regelmaat en formules Regelmaat en formules
Interactieve powerpoint
Transcript van de presentatie:

Voortgezette signaaldetectietheorie TCPII Voortgezette signaaldetectietheorie

Twee soorten maten voor gevoeligheid (onafhankelijk van criterium:) –gegeven een empirisch bepaalde ROC curve): Afstand tussen signaal- en ruisverdeling vgl d' 2. Oppervlakte onder ROC-Curve: A

Hoe interpreteer je A? Oppervlaktestelling/ Area theorem: A is equivalent met proportie correcte antwoorden in 2AFC-experiment: Gegeven: 1 ruisstimulus 1 signaal (+ruis) stimulus, Welke is wat? Lijkt zinnig! Belangrijk maar lastig. Afleiding op Studion

h f Maten voor criterium: 1. Plaats op x-as 2. Likelihood ratio p(xc|S)/p(xc|N) = h/f (vgl β) 3. Plaats in ROC-plot (l.o. vs r.b.) 4. Helling raaklijn aan ROC

h f Elk punt van ROC-curve geeft criterum/bias bij die gevoeligheid PH Richtingscoefficiënt raaklijn op dat punt als maat voor bias/criterium S ROC-curve: PH als functie van PFA S = dPH/dPFA PFA h f = p(xc|S)/p(xc|N) = h/f Afleiding op Studion

Maar hoe ga je in de praktijk te werk? Hard werken Een aantal punten van de ROC-curve verkrijgen door meerdere criteria te induceren (pay-off, signaalfrequentie) op grond van vele trials (zowel signalen als alleen ruis) voor elk criterium proporties Hits en False alarms bepalen Dat zijn heel veel trials! Daarna grafisch A bepalen

Zeker geen 0 1 2 3 4 5 Zeker wel signaal een signaal Variant: numerieke schaal: impliceert meer criteria – maar ook veel trials nodig

h f (1-h) f 1 - ¼ ∙ ------- + --- (1-f) h Ruwe benadering Oppervlaktemaat voor één punt: A' hits False Alarms Gemiddelde van die twee oppervlakten: A' = h (1-h) f 1 - ¼ ∙ ------- + --- (1-f) h f

FALSE ALARM RATE HIT RATE B''= -.4 B''= -.07 B''= .07 B''=.4 B''= 0 als H = 1, F≠0, F≠1, dan B'' = -1 F H Vergelijkbare maat voor criterium/bias: Grier’s B'' als H = 1 - F dan B'' = 0 Als F = 0, H≠ 0, H≠1 dan B'' = 1 H(1 - H) – F(1 – F) B'' = sign(H - F)------------------------ H(1 - H) + F(1 – F)

Assumpties invoeren Zelfs als je diverse punten hebt kunnen bepalen liggen ze vaak niet op een nette curve Dan moet je een curve fitten en maak je toch (impliciet) assumpties over de vorm van de kansverdelingen Bovendien kun je je werk besparen: meer assumpties  minder metingen

Normale verdelingen zijn populair (maar er zijn ook andere modellen!) Simpelste model: ruis- en signaalverdeling normaal, gelijke varianties Eén punt (PH, PFA paar) is genoeg

Voorbeeld: in een experiment met ruistrials en signaaltrials kreeg men deze resultaten: Hit rate: .933, False Alarm rate .309 (.067 misses and .691 correct rejections) Normale verdelingen: via corresponderende z-scores kunnen we het hele model invullen:

f h h β = ---- = .37 f afstand: d´ = 2 maat voor “gevoeligheid” z.933 = - 1.5 f z.309 = .5 h .933 h β = ---- = .37 f .309

Diverse waarden voor d' en bijbehorende ROC-curves

∫ 1 φ(z)= e-z2/2 √2π z Φ(z) = -∞ φdx z Gaussiaanse modellen: preliminair Standaard normale curve M=0, sd = 1 1 φ(z)= e-z2/2 √2π z z Φ(z) = -∞ φdx ∫ Transformaties: Φ(z)  P Φ-1(P) of Z(P)  z zie tabellen en standaard software

- λ Roc-curve PH = f(PFA) PH PFA zH Z-transformatie ROC-curve P  z zH = f(zFA) zFA Goede manier om meer punten te plotten

d' d' 0 λ 45° Equal variance model: PFA = 1- Φ(λ), = Φ(-λ), zFA = -λ PH = 1 – Φ(-(d' - λ)) = Φ(d' – λ), zH = d' – λ zH = zFA + d' d' = zH –zFA z-plot ROC 45° 0 λ zH d' d' 45° zFA

f h √(2π) √(2π) √(2π) Criterium/bias: β = h/f = φ(zH)/φ(zF) 1 -z2/2 φ(z) = ------ e (standaard-normaal) √(2π) 1 -zH2/2 φ(zH) = ------ e √(2π) zFA2 – zH2 ------------ 2 (Delen): --------------------------- = e 1 -zFA2/2 φ(zFA) = ------ e √(2π) Om symmetrie te verkrijgen wordt vaak een logtransformatie toegepast: log β = log h – log f = ½(z2FA – z2H )

f h λ c Alternatief: c (ook wel λcenter), de afstand (in sd) tussen het midden (waar h=f) en het criterium c = -(d'/2 – λ) zH – zFA 2zFA c = - ---------- + ----- 2 2 zFA = -λ d' = zH - zFA zH + zFA c = - ---------- 2

β c Isobiascurves voor β en c

Ongelijke varianties:

θ PH Unequal variance model σn=1, σs PFA zH zH= zFA μs σs σs ---- + --- μs/σs θ PFA = Φ(-λ), zFA = -λ -μs zFA μs – λ μs – λ PH = Φ , zH = σs σs tg(θ) = 1/σs

μs √1 + σs2 e a Δm maakt geen verschil tussen grote en kleine σs Maten: Afstand tot oorsprong naar analogie met d' : zH ZH= -ZFA de = Oe√2 da = Oa√2 e a μs √1 + σs2 O zFA Δm (Pythagoras en gelijkvormige driehoeken)

μs = Φ √1 + σs2 Az PH Oppervlakte onder Gaussiaanse ROC-curve: Az Afleidbaar met behulp van oppervlaktestelling!!! PFA Az = Pc in Gaussiaans 2AFC μs = Φ √1 + σs2 Az Afleiding op Studion

μs = Φ √1 + σs2 μs/σs = Φ √1/σs2 + 1 PH PFA tg Oppervlakte onder Gaussiaanse ROC-curve: Az μs = Φ √1 + σs2 PFA (al aangetoond) μs/σs = Φ √1/σs2 + 1 tg Az = Φ(da/√2) Gelijke varianties : Az = Ad' = Φ(d'/√2)

Voor de volledigheid: Er zijn diverse andere modellen -b.v. andere verdelingen -je weet zeker van wel -je weet zeker van niet -je weet het niet zeker

Finite State modelen H m FA cr High threshold: 1 Yes α signal detect 1-α η Yes uncertain 1-η No 1 η Yes noise uncertain 1-η No PFA = η PH = α +η(1-α)

α η α PFA = η PH = α +η(1-α) hits False Alarms Theoretische ROC curve uncertain: η Yes 1-η No Detect: Yes α η α “high threshold”

η Sc = G - ---- F (1-η) Vgl correctie voor raden bij MC-vragen: Bij elke MC-vraag is een signaal aanwezig: het juiste alternatief. PH = α +η(1-α) PM = (1-η)(1-α) PM PH =α + η ------- (1-η) PM (1-α) = ------- (1-η) η α = PH - ------- PM (1-η) η Sc = G - ---- F (1-η)

β 1-β Analoog: low threshold model : Signaal leidt altijd tot onzekere toestand noise leidt met P = β to nondetect toestand (altijd NO) en anders tot onzekere toestand. 1-β Nondetect: No Uncertain: η Yes 1-η No hits False Alarms β

N O D Een gecombineerd drie-toestanden model hits False Alarms Bij rechte ROC in PHPFA ruimte

A A' Az da de Ad' d' S B'' S LRc β c Overzicht signaaldetectiematen Alg. Ruw Gaussiaans veel pt één pt σn ≠ σs σn = σs A A' Az da de Ad' d' S B'' S LRc β c Gevoeligheid Criterium/bias Hiermee kan men de prestaties en de criteria van mensen, apparaten en systemen weergeven. Maar wat zijn die prestaties waard?

hoeveel kost het missen van een wapen/explosief op een vliegveld? Hoeveel kost een false alarm? Hoeveel kost de vertraging die elke screening oplevert?

=? Wat zijn die prestaties waard? Pay-off matrix “no” “yes” NB. C is hier een positief getal: “een false alarm kost je 5 euro” S(+N) N CMiss VHit VCR CFA =? EV = p(Hit)•VHit- p(Miss)•CMiss + p(CR)•VCR - p(FA)•CFA = p(s)•{PH• VHit – (1-PH)•CMiss} + p(n)•{(1-PFA)•VCR - PFA•CFA} Vergelijk met niks doen: EV = p(n)•VCR – p(s)CMiss NB.: Meestal is waarnemen niet gratis!

xc x Een optimale beslissing in onzekerheid: Zet het criterium op een waarde van x (xc) waarvoor de verwachte waarde/utiliteit van “Yes” gelijk is aan de verwachte waarde/utiliteit van “No” EV(Yes|xc) = EV(No|xc)

EV(Yes|xc) = EV(No|xc) “Kosten”: CFA positief! VHit• p(Hit) – CFA• p(FA) = VCR•p(CR) - CMiss•p(Miss) VHit• p(signal|xc) – CFA• p(noise|xc) = VCR•p(noise|xc) - CMiss•p(signal|xc) p(signal|xc) VCR + CFA ---------------- = --------------- p(noise|xc) VHit + CMiss Maar hoe weten we die?

p(signal|xc) VCR + CFA ---------------- = --------------- p(noise|xc) VHit + CMiss We willen deze We weten (in principe) deze: p(x|noise) p(x|signal) gevraagd: een manier om van p(A|B) op p(B|A) te komen Regel van Bayes !

p(A|B). p(B|A) p(A) --------- =. ---------- • -------. p(A|¬B) p(A|B) p(B|A) p(A) --------- = ---------- • ------- p(A|¬B) p(B|¬A) p(¬A) (odds form) Toegepast op signaaldetectie: p(signal|xc) --------------- p(noise|xc) p(xc|signal) p(signal) -------------- • ---------- p(xc|noise) p(noise) =

p(signal|xc) VCR + CFA ---------------- = --------------- p(noise|xc) VHit + CMiss Bayes p(xc|signal) p(signal) VCR + CFA -------------- • --------- --- = --------------- p(xc|noise) p(noise) VHit + CMiss p(xc|signal) p(noise) VCR+CFA --------------- = ----------- • ------------- p(xc|noise) p(signal) VHit+CMiss LRc prior odds payoff matrix

p(xc|signal) p(noise) VCR+CFA ---------------- = ------------ • ----------- p(xc|noise) p(signal) VHit+CMiss Dus een ideale observator, op de hoogte van de prior odds en de pay-off matrix, kan een optimaal criterium berekenen. Mensen zijn niet zo handig met rekenen maar passen zich rededelijk aan aan pay-off matrix and prior odds