MBR AtT1 College 6 : covering-theorie (Deel 1) Literatuur: Plausability of diagnostic hypothese The nature of simplicity Y.Peng & J. Reggia Abductive inference models for diagnostic problem solving Y.Peng, J. Reggia reader boek
MBR AtT2 College 6 : covering-theorie (Deel 1) MAB diagnose model: Formalisatie van MAB: gebruik van logica gebruik van verzamelingenleer covering theorie real world model abnormal behaviour observed findings predicted findings match observation predication
MBR AtT3 Covering-theory Model van het systeem 4 soorten kennis: disorders ("hart-falen") manifestations ("bewusteloos") intermediate states (pathologische toestand "shock") causal relations (=diagnostische kennis) infereerbaar: disorders + intermediate states observeerbaar: manifestations
MBR AtT4 Eenvoudig model Causale relaties tussen entiteiten 2 type entiteiten (2-laags netwerk): –disorders –manifestations Voorbeelden van uitbreidingen: –intermediate states –kansen op disorders / causale relaties ¸
MBR AtT5 Onderwerpen “covering theory” Deel 1: Diagnostisch probleem + oplossing eigenschappen van diagnose probleem & oplossing minimaliteiten (parsimony) Deel 2: algebra voor generatoren algorithme Dit college Volgend college
MBR AtT6 Definities D: {d1,d2,....,dn} bekende ziekten M: {m1,m2,..,mn} meetbare symptomen NB: d i is niet direct observeerbaar: D M = leeg M + : M + M: aanwezige manifestaties M + wordt typisch gradueel verkregen Op het eind: M \ M + zijn niet-aanwezige manifestaties
MBR AtT7 Causale relaties C: causale relaties van D M d i veroorzaakt mogelijk m j : in C causale associatie, NIET logische implicatie! Beperkingen causale relaties: –m i kan m j niet verklaren –d i kan d j niet verklaren –m i kan d j niet verklaren
MBR AtT8 Voorbeeld d1d3d2d5d4 m1m3m2m5m4 Manifestations Disorders
MBR AtT9 Diagnose probleem Definitie: DP is een tuple D: verzameling objecten (disorders) M: verzameling objecten (manifestaties) C: relatie C D x M M + M: geobserveerd gedrag
MBR AtT10 Effects en causes verzameling effecten mogelijk veroorzaakt door d i effects(d i ): {m j | C} verzameling mogelijke oorzaken van m i causes(m i ): {d j | C}
MBR AtT11 Voorbeeld causes(m j ) mjmj effects(d i ) didi disorders manifestations
MBR AtT12 Effects & causes effects(D): d i D effects(d i ) verzameling effecten mogelijk veroorzaakt door D (uit vorige college: dus een OAP!) causes(M): m i M causes(d i ) verzameling mogelijke oorzaken van M
MBR AtT13 Voorbeeld effects(d1) = {m1,m2} causes(m2) = {d1,d3} effects({d1,d4}) = {m1,m2,m3,m5} causes({m4,m5}) = {d2,d3,d4,d5} d1d3d2d5d4 m1m3m2m5m4
MBR AtT14 Oplossing van diagnoseprobleem Vier aspecten van "parsimonious covering theory": (1) "cover" van de manifestatie (2) keuze voor minimaliteit (parsimonious) (3) definitie van een verklaring voor de manifestaties (4) definitie van oplossing
MBR AtT15 Oplossing van diagnoseprobleem (1) "cover" van de manifestatie D i D is een cover voor M j M indien: M j effects(D i )
MBR AtT16 Oplossing van diagnoseprobleem (3) definitie van een verklaring voor de manifestaties: E D is een verklaring voor M + indien: E "covers" M + en E voldoet aan gekozen minimaliteitsprincipe (parsimonious)
MBR AtT17 Oplossing van diagnoseprobleem (2) keuze van een notie van minimaliteit : Voorbeelden: –single fault diagnose –minimale kardinaliteit (aantallen) –irredundant (subset minimaal) –relevant
MBR AtT18 Voorbeeld irredundante cover mjmj effects(d1) d1 disorders manifestations d4 effects(d4) M+M+
MBR AtT19 Oplossing van diagnoseprobleem (4) definitie van de oplossing van DP: Gegeven diagnoseprobleem, De oplossing is de verzameling "verklaringen” voor M +
MBR AtT20 Voorbeeld Van dp + oplossingen
MBR AtT21 Eigenschappen Verwachte/gewenste eigenschappen: –effects(d i ) <> –causes(m j ) <> –d i causes(effects(d i )) –m j effects(causes(m j )) –D i causes(effects(D i )) –M j effects(causes(M j )) –d i causes(m j ) iff m j effects(d i ) –effects(D 1 ) effects (D 2 ) effects(D 1 D 2 )
MBR AtT22 Eigenschappen D 1 causes(M 1 ) = IFF M 1 effects(D 1 ) = Als D k een cover is voor M j dan is er een D i D k waarbij D i een irredundante cover is van M j Voor iedere diagnostisch problem M + bestaat minimaal een oplossing Een cover D I voor M J is irredundant IFF voor alle d i D I bestaat een m j M J die uniek gecovered wordt door d i Dus: m j effects(d i ) maar m j effects(D I - d i )
MBR AtT23 Eigenschappen E={} is de enige verklaring voor M + = {} Competing disorders: Als M + effects(d 1 ) M + effects(d 2 ) dan –d 1 en d 2 niet beide in E –Als d 1 E dan is er een andere E’, d 2 E’ zonder d 1 met kleiner of gelijke cardinaliteit
MBR AtT24 Eigenschappen minimaliteit S mc : verzameling cardinaliteitsminimale covers S ic : verzameling irredundante covers S rc : verzameling relevante covers S c : verzameling covers {} S mc S ic S rc S c 2 D
MBR AtT25 Eigenschappen minimaliteit S c : alle covers S rc : alle relevante covers S ic : alle irredundante covers S mc : alle aantal-min. S n : alle non-covers 2D2D
MBR AtT26 Eigenschappen minimaliteit verzameling subset-minimale diagnoses is de representatie van "alle" covers NB: –theoretisch interessant –algorithmisch interessant
MBR AtT27 Minimaliteitsdiscussie Enkele oorzaak: "single fault diagnose" probleem: vaak bestaat er geen "single fault diagnose" relevant: intuïtief te los aantal-minimaal: probleem: zeldzame d1, en vaak voorkomende d2+d3 Vaak gekozen: subset-minimale (irredundant)
MBR AtT28 Alternatieve benadering Idee: Meetbaar criterium bekijken voor de meest waarschijnlijke hypothese. Meetbaar = objectieve maat Gebruik van kanstheorie
MBR AtT29 Alternatieve benadering gebruik van probability theory Uitbreiding: sterkte van causale relatie Sterkte is 0 < c ij < 1 d i veroorzaakt m j met een frequentie c ij c ij = P(d i veroorzaakt m j | d j ) ≠ P(m j | d j ) Uitbreiding: a priori kansen voor disorders d i 0 < p i < 1
MBR AtT30 Aannames Oorzaken zijn onafhankelijk (OAP!) Causale sterktes zijn invariant Geen manifestatie m j kan voorkomen zonder veroorzaakt te worden door een disorder d i
MBR AtT31 Notatie & resultaten P(D I |M + ) D I : alle aanwezige disorders, rest afwezig M + : alle aanwezige manifestaties, rest afwezig standaard kansrekening: P(m j |D I ) = 1 - (1-c ij ) resultaat m.b.v. de regel van Bayes: P(D I |M + ) = ( (1-p i ) / P(M + )) x L(D I,M + ) di DIdi DI di DIdi DI Constant voor alle D I gegeven M + relatieve waarschijnlijkheid van D I gegeven M +
MBR AtT32 Relatieve waarschijnlijkheid (L(D I,M + )) 3 componenten: L 1 : gewicht dat D I de veroorzaker is van de aanwezigheid van M + L 2 : gewicht van de manifestaties die te verwachten zijn bij D I,, maar die afwezig zijn L 3 : gewicht op basis van a priori kans van D I L(D I,M + ) = L 1 (D I,M + ) x L 2 (D I,M + ) x L 3 (D I,M + ) NB: alleen info over D I en M + (=deel van de KB)
MBR AtT33 Componenten relatieve waarschijnlijkheid L 1 : gewicht dat D I de veroorzaker is van de aanwezigheid van M + L 1 (D I,M + ) = P(m j |D I ) P(m j |D I ) = 1 - (1-c ij ) (zie eerdere slide) L 2 : gewicht van de manifestaties die te verwachten zijn bij D I,, maar die afwezig zijn L 2 (D I,M + ) = P(m j |D I ) = (1-c ij ) mj M+mj M+ di DIdi DI _ m j M \ M + di DIdi DI m j effects(d i ) \ M +
MBR AtT34 Componenten relatieve waarschijnlijkheid L 3 : gewicht op basis van a priori kans van D I L 3 (D I,M + ) = p i / (1 - p i ) di DIdi DI
MBR AtT35 Voorbeeld L1({d1},{m1,m3})=0.02 L2({d1},{m1,m3})=0.2 L3({d1},{m1,m3})=0.01 L({d1},{m1,m3})= L({d2,d3},{m1,m3})=0.013 L({d1,d2,d3},{m1,m3})= d1d3d2d4 m1m3m2m M + = {m 1,m 2 } Covers: {d 1 }, {d 2,d 3 }, {d 1,d 2,d 3 } relatieve waarschijnlijkheid
MBR AtT36 Vraag Bevat de verzameling “parsimonious covers” de meest waarschijnlijke cover? Antwoord in termen van relatieve waarschijnlijkheid (L) Twee aspecten: cover minimaliteitscriterium
MBR AtT37 Cover D is geen cover: Relatieve waarschijnlijkheid 0 Eén van de componenten L 1, L 2, L 3 0 D is geen cover, dus min. een c ij is 0. c ij =0 ---> P(m j |D I )=0 --> L 1 =0 --> L=0 Resultaat: meest waarschijnlijke D’s in ieder geval covers van M + ?=?= ?=?=
MBR AtT38 Minimaliteit relevant covers irredundant covers aantal-minimale covers
MBR AtT39 Relevante covers D I relevante cover d k is irrelevant voor M + L(D I {d k },M + ) / L(D I,M + ) = ( (1-c kl )) x p k /(1-p k )) p k is meestal klein p k /(1-p k ) << 1 product van (1-c kl ) < 1 ==> L(D I {d k },M + ) << L(D I,M + ) conclusie: irrelevante cover minder waarschijnlijk dan de inliggende relevante cover m l effects(d k )
MBR AtT40 Relevante covers alleen nodig genereren van relevante covers Uitzondering: –p k is groot –d k heeft weinig en zwakke causale relaties precieser: L(D I,M + ) < L(D I {d k },M + ) als p k > 1 / (1 + (1-c kl )) > 0.5 ( (1-c kl )) x p k /(1-p k )) m l effects(d k )
MBR AtT41 Irredundante covers D I is irredundant cover d k D I, d k causes(M + ) D I {d k } is redundante, maar relevante cover L 1 (D I {d k },M + ) / L 1 (D I,M + ) >= 1 L 2 (D I {d k },M + ) / L 2 (D I,M + ) <= 1 if p k << 1 dan L3(D I {d k },M + ) / L 3 (D I,M + ) = p k / (1 - p k ) << 1 Normaliter: afname van L 2 en L 3 wordt gecompenseerd door toename L 1
MBR AtT42 irredundante covers Heuristiek: Als de priori kans voor alle d i klein zijn (p i << 1) dan zijn de meest waarschijnlijke covers van M + waarschijnlijk irredundante covers. Let op: als d k vaak voorkomt en c kj >> P(m j | D I ), m j M + dan zou een redundante, maar relevante cover waarschijnlijker kunnen zijn
MBR AtT43 Aantal-minimaliteit Heuristiek: als alle d i a priori kansen klein zijn (<<1) als alle d i a priori kansen ongeveer gelijk zijn als alle c ij redelijk groot zijn Meest waarschijnlijke covers van M + zijn minimale covers. L wordt gedomineerd door L 3 kleinere D levert grotere L 3
MBR AtT44 Voorbeeld L({d 1,d 3 },{m 1,m 3 }) redundante cover L({d 1 },{m 1,m 3 }) L({d 2,d 3 },{m 1,m 3 }) irredundante cover redundante cover is waarschijnlijker dan irredundante: L({d 1,d 3 },{m 1,m 3 }) > L({d 1 },{m 1,m 3 }) redundante cover is minder waarschijnlijk dan meest waarschijnlijke irredundante: L({d 1,d 3 },{m 1,m 3 }) < L({d 2,d 3 },{m 1,m 3 })
MBR AtT45 Lessen covering theorie d i veroorzaamt mogelijk m j objectieve maat gebruikt voor analyse van “plausibele hypothese”
MBR AtT46 Case studie: toepassen van minimaliteiten Medische toepassing (hersen beschadiging) 100 patienten 4 criteria voor minimaliteit weinig experimenteel werk in literatuur Artikel : An ecperimental study of criteria for hypothesis plausibility S. Tuhrim, J. Reggia, S. Goodall
MBR AtT47 Volgende keer Parsimonious covering theory MAB-model Daarna correct modellen.
MBR AtT48 Gebruikte criteria Single fault Naïve minimale cardinaliteit irredundantie (subset minimaliteit) relevant meest waarschijnlijke (Bysiaans) minimale cardinaliteit rekening houdend met kennis mbt. aangrensende delen
MBR AtT49 Meest waarschijnlijke (Bysiaans) Definitie : D i is een verklaring IFF P(D i |M + ) P(D j |M + ) voor iedere cover D j van M +. Gebaseerd op causale sterkte c ij van een link c ij : frequentie dat d i als effect m j heeft, als m j geobserveerd is. c ij =0 betekent geen causale relatie
MBR AtT50 Subset minimaliteit + extra kennis (Collapsed cover) Uitgangspunt: subset minimale verklaringen Aangrensende d_i's worden als 1 oorzaak beschouwd (gebruikt extra kennis van domein!) Selecteer dan de aantal minimale oplossingen Merk op: –cardinaliteit van de afzonderlijke diangoses daalt
MBR AtT51 Extra kennis over hersenen Hersen regio's fig. 2 met daarin de orders
MBR AtT52 Voorbeeld Collapsed cover
MBR AtT53 Collapsed cover D' 1 is een verklaring IFF D' 1 is een cardinaliteit minimale "collapsed cover" van een irredundante cover D 1
MBR AtT54 Resultaat Tabel 3
MBR AtT55 Match exact A=B close match A B partial match A B <> diagree A B = A B A B A B A B
MBR AtT56 Resultaat Tabel 4