MBR AtT 1 College 5: Complexiteit van verschillende abductie-problemen Context cursus: MAB diagnose model logica, abductie Artikel The computational complexity of abduction T. Bylander, D. Allemang, M.Tanner, J. Johnson AIJ’91
MBR AtT 2 Kanttekening bij complexiteitsanalyse Analyse versus praktijk: Probleem klein dan "exponentiële tijd" toch in praktijk nog snel genoeg. Probleem groot dan "kwadratische tijd" mogelijk al te langzaam.
MBR AtT 3 Onderwerpen Karakterisering van abductie Verschillende klassen van problemen Verschillende karakteriseringen van domeinkennis Toepassing: medisch kennissysteem RED
MBR AtT 4 College 5: Complexiteit van abductie MAB: formalisatie mbv abductie Moeilijkheid van het abductieprobleem –onafhankelijk van de gebruikte representatie –onafhankelijk van de gebruikte methode Afhankelijk van “explanation” relatie en de “plausability” relatie. Doel: verdieping in het abductieprobleem
MBR AtT 5 Abductie Abductie = het vinden van de beste verklaring voor een gegeven verzameling data Toepassing van abductie Medische diagnose: het vinden van de beste verklaring voor de klachten/symptomen van de patiënt
MBR AtT 6 Abductie Peirce ( ) observatie d kennis h veroorzaakt d d, h d dan mag je h concluderen (=abductie) Terminologie: d: datum h: indiv. hypothese h "explains" d D: set van d H: set van h (samengestelde hypo.)
MBR AtT 7 Formalisering abductieproblemen Abductieprobleem D all,H all,e,pl D all : data die verklaard moet worden H all : individuele hypotheses e: afbeelding van subsets van H all naar subsets van D all (h verklaart e(h)) pl: h heeft plausabiliteit pl(h) pl is een partiële ordering
MBR AtT 8 Voorbeeld d1d2d3d4 h1h2h4h5h3 e(h1)={d1} e(h2)={d1,d2} …. H all ={h1,h2,h3,h4,h5} D all ={d1,d2,d3,d4} d: d1 of d2 … h: h1 of h2 … H: {h1,h2} … D: {d1,d2}... pl(h1)=superior pl(h2)=excellent ….. superiorexcellentgoodfairpoor
MBR AtT 9 Terminologie Hypothese H is een subset van H all H is compleet: e(H) = D all H verklaart alle geobserveerde data H is parsimonious: er is geen echte subset van H die dezelfde data verklaart d1d2d3d4 h1h2h4h5h3 X
MBR AtT 10 Terminologie H is een verklaring indien: H is compleet en H is parsimonious later H is een "beste verklaring" indien: er geen verklaring H' is zodat pl(H') > pl(H)
MBR AtT 11 Terminologie e (d): de individuele hypotheses die bij kunnen dragen aan een verklaring van d d1d2d3d4 h1h2h4h5 h3 e-(d1)={h1,h2} e-(d2)={h2,h3,h4} …..
MBR AtT 12 Merk op h e (d) impliceert niet dat d e(h) h1h2h3 d1d2 e (d1)={h1,h2,h3} e(h1)={}
MBR AtT 13 Aannames en vraagstelling Aannames: e is tractable pl is tractable e is tractable e, pl zijn efficiënt representeerbaar Vraag: Wat is de complexiteit van het doorzoeken van de ruimte van samengestelde hypotheses voor het vinden van een (beste) verklaring bij gegeven data?
MBR AtT 14 NB: Extra vereenvoudigingen Samengestelde hypothese is een combinatie van de individuele hypotheses. Geen onderscheid tussen `relevante data’ en `mogelijke data’, zoals je bij de modellering van specifieke domeinen zou kunnen aantreffen. Geen context (bijv. leeftijd)
MBR AtT 15 Verschillende abductieproblemen (1) Onafhankelijk abd-probleem (2) Monotoon abd-probleem (3) Incompatibel abd-probleem (4) Cancellation abd-probleem (5) Geordend abd-probleem Soort abductie probleem afhankelijk van domeineigenschappen!! onafhankelijk van representatie & methode
MBR AtT Onafhankelijk abductieprobleem (OAP) Aanname: Een hypothese verklaart de data onafhankelijk van andere hypotheses. Karakterisering : H H all (e(H) = h H e(h)) Dus: samengestelde hypothese verklaart een datum iff er één element is dat de datum verklaart
MBR AtT 17 Voorbeeld h1 en h2 verklaren samen d1 geen onafhankelijk abductieprobleem!! h1h2h3 d1d2
MBR AtT 18 Algorithme Vinden van een beste verklaring: stap 1: vind een oplossing stap 2: vind betere oplossingen totdat een beste oplossing gevonden is Merk op : niet nodig alle oplossingen te onderzoeken!
MBR AtT 19 Geen oplossing aanwezig Zoek een oplossing Algorithme voor OAP (stap 1) If e(H all ) D all then return nil W := H all For each h H all If e(W\{h}) = D all then W := W\{h} return(W)
MBR AtT 20 Complexiteitsresultaat OAP Vinden van een oplossing, als er een bestaat is O(nc e + n 2 ). (wil niet zeggen dat het complex is vast te stellen óf een oplossing bestaat)
MBR AtT Monotoon abductieprobleem (MAP) Afzwakking van de aanname “een hypothese verklaart de data onafhankelijk van andere hypotheses” Nu: toegestaan dat een samengestelde hypothese meer verklaart dan de delen afzonderlijk.
MBR AtT 22 Voorbeeld asthma bij tracheo-bronchitis veroorzaakt kortademigheid tracheo-bronchitis veroorzaakt keelpijn (en dus niet noodzakelijk kortademigheid) Vergelijk asthma met asthma bij tracheo-bronchitus NB: “Augmentation problem” in diagnose
MBR AtT 23 Karakterisering MAP H, H’ H all (H H’ e(H) e(H’)) - samengestelde hypothese “verliest” geen verklaarde data - samengestelde hypothese verklaart mogelijk extra data
MBR AtT 24 Voorbeeld e(h1) e(h2) e(h3) e({h1,h2,h3}) samengestelde H verklaart meer dan delen afzonderlijk h1h2h3 d2d4 d1 d3
MBR AtT OAP versus MAP Samengestelde hypothese "verliest" geen verklaarde data verklaart mogelijk wel "meer” data Dus : hypotheses niet onafhankelijk meer! Onafhankelijk abd-probleem monotoon abd-probleem Monotoon abd-probleem onafhankelijk abd-probleem x
MBR AtT 26 Complexiteitsresultaat monotone abductieproblemen: Vinden van een oplossing, als er een bestaat is O(nc e + n 2 ). (zelfde algoritme en complexiteit als onafhankelijke abductieproblemen)
MBR AtT Incompatibel abductieprobleem (IAP) Aanname: samengestelde hypothese is een willekeurige combinatie van individuele hypotheses NU : deze aanname afzwakken! Aanname vaak ongeldig bijv.: electronische component niet tegelijk stuk-0 en stuk-1
MBR AtT Incompatible abductieprobleem Nu: sommige hyp's kunnen geen samengestelde hypothese vormen Voor incompatible abd-probleem geldt niet meer : superset van hypothese is ook een hypothese! Toevoeging: Abductieprobleem D all,H all,e,pl,I I: tuples van hypotheses die incompatibel zijn
MBR AtT Incompatible abductieprobleem Karakterisering incompatibel probleem: H H all (( I I (I H)) e(H) = ) Karakterisering onafhankelijk incompatibel adb-probleem: H H all (( I I (I H)) e(H) = h H e(h))
MBR AtT 30 Voorbeeld I = {{h1,h2},{h2,h3},{h3,h4},{h4,h5}} d1d2d3d4 h1h2h4h5h3 verklaring voor {d1,d2,d3,d4}
MBR AtT 31 Complexiteitsresultaat incompatible ABD-problemen: Bepalen van het bestaan van een oplossing is al NP-hard. (zelfde complexiteit als 3-SAT)
MBR AtT Incompatibel abductieprobleem “het bestaan van een oplossing” is bij dit type probleem moeilijker. moeilijkheid: keuze van incompatibiliteit kan niet lokaal gemaakt worden, maar is afhankelijk van andere incompatibele paren. toevoegen van kennis maakt probleem complexer!! “parsimonious” speelt hier nog geen rol!
MBR AtT Cancellation abd-probleem Bij een cancellation abd-probleem is het mogelijk dat: een individuele hypothese de verklaring van een datum door een andere individuele hypothese "cancelled". {h} verklaart d, maar {h,…} verklaart d niet. dus: de functie e is mogelijk niet- monotoon
MBR AtT 34 Voorbeeld van “cancellation” longontsteking veroorzaakt koorts longontsteking veroorzaakt kortademigheid verhoogde bijnierfunctie veroorzaakt moonface longonsteking bij verhoogde bijnierfunctie veroorzaakt kortademigheid en moonface (dus geen koorts meer)
MBR AtT Cancellation abductieprobleem Uitbreiding: consumeren/produceren Toevoeging: Abductieprobleem D all,H all,e,pl,e proc,e cons e proc, e cons, : afbeelding van H all naar subsets van D all voor resp. produceren en consumeren d e(H) {h| h H d e prod (h)} > {h| h H d e cons (h)}
MBR AtT 36 Voorbeeld e(h1)={d1}, e(h2)={d1,d2},e(h3)={d2,d3}, e(h4)={d2,d4}, e(h5)={d3,d4} e-prod(x) = e(x) e-cons(h1)={d3}, e-cons(h2)={d4}, e-cons(h3)={}, e-cons(h4)={}, e-cons(h5)={} Solutions: {h1,h3,h5}: {d1,d2,d3,d3,d4} > {d3} oplossing {h1,h4,h3}: {d1,d2,d4,d2,d3} > {d3} geen oplossing {h1,h4,h5}: {d1,d2,d4,d3,d4} > {d3} geen oplossing {h2,h4,h5}:{d1,d2,d2,d4,d3,d4} > {d4} oplossing …
MBR AtT 37 Complexiteitsresultaat cancellation abd-problemen: Bepalen van het bestaan van een oplossing is al NP-hard.
MBR AtT 38 Een "beste" oplossing Tot nog toe : vinden van een oplossing Nu : vinden van een beste oplossing Criterium: best/kleinste oplossing H is geprefereerd boven H’: –injectieve relatie m tussen H en H' –alle h uit H moeten plausibiliteit hebben dan zijn corresponderende h' uit H'. –indien H en H' even groot zijn dan moet H een h bevatten die strict plausibeler is dan zijn corresponderende h' in H'
MBR AtT 39 Voorbeeld d1d2d3d4 h1h2h4h5h3 superiorexcellentgoodfairpoor Verklaringen voor {d1,d2,d3,d4}: {h1,h3,h5},{h1,h4,h3},{h1,h4,h5},{h2,h3,h4},{h2,h3,h5},{h2,h5}
MBR AtT 40 Voorbeeld selectie criteria p-functie: h1: superior h2: excellent h3: good h4: fair h5: poor Verklaringen: {h1,h3,h5}, {h1,h3,h4}, {h1,h4,h5}, {h2,h3,h4}, {h2,h3,h5}, {h2,h5} Vergelijk: {h1,h3,h5}, {h1,h3,h4} p(h4) > p(h5) {h1,h3,h4},{h1,h4,h5} {h1,h3,h4},{h2,h3,h4} {h1,h3,h4},{h2,h5} {h1,h3,h4} niet, want groter {h2,h5} niet, want geen juiste afbeelding {h2,h5},{h1,h3,h5} p(h2)>=p(h3), p(h5)>=p(h5)
MBR AtT geordend abductieprobleem Extra aanname : plausabiliteit van alle hypotheses zijn verschillend en totaal geordend. h,h’ H all ( h h’ (pl(h) pl(h’)) )
MBR AtT 42 Complexiteitsresultaat geordend onafhankelijk abd-problemen: Vinden van een beste oplossing, als er een bestaat is O(nc e + n 2 + nc pl ).
MBR AtT 43 Samenvattend Probleem klasse Een oplossing Alle oplossingen Een beste oplossing Alle beste oplossingen onafhankelijk P NP onafhankelijk total order P NP P monotoon P NP monotoon total order P NP P incompatible NP cancellation NP
MBR AtT 44 Complexiteits-analyse Complexiteit van abductie veroorzaakt door: constraints op de verklaringsrelatie tussen hypotheses en data plausibility-ordering op hypothese NB: –onafhankelijk van representatie –onafhankelijk van redeneermethode (causal / logic, probabilistic / default, explicit model-based)
MBR AtT 45 CHECK (college 3, Console & Torasso) Abductie eis Type abductieprobleem: (1) Onafhankelijk abd-probleem? (2) Monotoon abd-probleem? (3) Incompatibel abd-probleem? (4) Cancellation abd-probleem? (5) Geordend abd-probleem?
MBR AtT 46 Medisch kennissysteem: RED Identificeren van antibodies in het serum van een patiënt dat kan reageren met de antigens die mogelijk voorkomt in rode bloedcellen. Verschillende testen worden gebruikt voor het bepalen van aanwezige antibodies Een antibody kan een test uitslag verklaren.
MBR AtT 47 RED systeem antibody-1 veroorzaakt test-1 antibody-2 veroorzaakt test-2 ….
MBR AtT 48 Type abductieproblemen & RED Als 2 antibodies 2 verschillende test uitslagen verklaren dan verklaren ze te samen ook deze beide uitslagen. geen cancellation abd-probleem Als meerdere antibodies voor een zwakke verklaring van een testuitslag gelden, dan gelden ze gezamelijk voor een sterke verklaring geen onafhankelijk abd-probleem, wel monotoon abd-probleem
MBR AtT 49 Type abductie problemen & RED Sommige antibodies kunnen niet te samen in één verklaring voorkomen incompatible abd-probleem Plausabiliteit schaal van 1 tot 7, er zijn 60 antibodies geen geordend probleem (total order)
MBR AtT 50 RED NP-hard probleem Echer: praktijk geen probleem! –Antibodies worden al uitgesloten door testuitslagen, voor het bepalen van een samengestelde diagnose. –Testen zijn bedoeld voor discrimineren van antibodies, dus afwezigheid van juiste testresultaat maakt aanwijzigheid antibody onwaarschijnlijker –Het is zeldzaam dat er meer dan een paar antibodies zijn.
MBR AtT 51 Complexiteitsresultaten laten zien Geen tractable algorithme is dat optimale oplossingen geeft op alle abductieproblemen probleemklassen bekijken Voor het efficiënt oplossen van abductieprobleem features nodig zodat het oplosbaar wordt! Redeneermethode moet gebruik maken van deze features. Vb.: controlekennis & domeinkennis
MBR AtT 52 Volgende keer Y.Peng, J.Reggia Plausibility of diagnosistic hypotheses: the nature of simplicity Nog steeds: diagnose met fout-modellen…
MBR AtT 53 Berekenbaar representeerbaar P NP SAT-3 Exponentieel/kwadratisch