De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Machinaal Leren Luc De Raedt Katholieke Universiteit Leuven Declarative Languages and Artificial Intelligence.

Verwante presentaties


Presentatie over: "Machinaal Leren Luc De Raedt Katholieke Universiteit Leuven Declarative Languages and Artificial Intelligence."— Transcript van de presentatie:

1 Machinaal Leren Luc De Raedt Katholieke Universiteit Leuven Declarative Languages and Artificial Intelligence

2 Overzicht Twee onderwerpen 1. Machinaal leren Leren uit beloning Inductief leren 2. Scientific Discovery AI voor wetenschappelijke toepassingen Een persoonlijke interpretatie

3 Machinaal Leren Wat ? Een “agent” leert indien het in staat is zijn performantie te verbeteren op basis van ervaring op een wel bepaalde taak. Essentieel voor AI: geen intelligentie zonder leervaardigheid. Klassiek voorbeeld: Games, beter spelen naarmate je meer speelt. (Games ~ het fruitvliegje van de KI)

4 Games: 4 klassiekers 1. Dammen (A. Samuel, ) 2. drie op een rij (D. Michie, 1963) 3. Backgammon (G. Tesauro, 1995) 4. Schaken - KnightCap (Baxter, Tridgewell and Weaver, 2000)

5 Dammen (A. Samuel) Eerste dam programma begin de jaren 50 zorgde voor stijging IBM aandeel in 1961, wint het van de toenmalige state champion in VS (de nr. 4 van de VS) Tijdens de jaren verschillende versies die leerden uit ervaring van eind spelen (uit textboeken) evaluatie functies basis voor moderne reinforcement learning

6 Menace (Michie 63)

7 X X OOX X OO X Kies doosje op basis van huidige positie X aan Zet Kies at random een parel uit het doosje Voer de zet uit

8 Menace (Michie 1963) Leert Tic-Tac-Toe Hardware: 287 Luciferdoosjes (1 voor elke stelling) Parels in 9 kleuren (1 kleur per veld) Spel principe: Kies doosje dat overeenkomt met huidige stelling Kies een parel at random uit doosje Zet op het corresponderende veld Leer algoritme: Spel verloren -> bewaar alle gebruikte parels (negatieve belonging - reinforcement) Spel gewonnen -> voor elke geselecteerde parel, voeg een parel van dezelfde kleur toe aan het doosje (positieve beloning - reinforcement) X X OO

9 TD-Gammon G. Tesauro (1995) Backgammon leert via Temporal Difference learning speelt partijen tegen zichzelf bereikt wereld kampioen niveau

10 KnightCap Baxter et al. (2000) Integreert Reinforcement Learning en Game Theory (mini-max) Vertrekt van redelijke kennis (1600 ELO) Speelt via het internet

11 KnightCap (Baxter)

12 Leren uit beloningen Reinforcement learning het volledige AI probleem in het klein leren in een onbekende omgeving Richard Bellman dynamic programming (1957) Toepassingen in Robotica Control, bvb. lift sturing Overzicht -- zie Sutton and Barto 1998 Umgebung Aktion Zustand Belohnung Agent

13 Inductief Leren Leren ~ opgedane ervaringen analyseren Inductief leren ~ leren uit voorbeelden data mining / data analyse / statistiek Vooral interesse in wetenschappelijke toepassingen ~ AI voor wetenschap

14 Inductie Wat ? Uit specifieke observaties algemene wetmatigheden / regels afleiden Voorbeeld er is een zwaan en die zwaan is wit dus alle zwanen zijn wit Deze conclusie is niet algemeen geldig, maar wel falsificeerbaar

15 Bongard (1967) Probleem BP 71 Wat is de regel ? Er is een object in een ander object dat zelf in een verder object zit

16 Michalski’s Treintjes ( ) Clustering : Hoe treintjes in klassen onderverdelen ? Treintjes met twee, drie of vier wagons ? Stel dat je weet dat een “o” lading gevaarlijk is ?

17 Inductief Leren Klassiek : eenvoudige representaties, propositie logica volstaat; gegevens in tabel vorm Inductief Logisch Programmeren en Relational Learning gebruikt predikaten logica of logisch programmeren, en laat toe om ook achtergrond kennis te gebruiken (Muggleton & De Raedt 94)

18 SAR problemen Structure Activity Relationship Prediction Sternberg English:

19 SAR Resultaten behaald met algemeen leersysteem (alhoewel ondertussen specifieke systemen ontwikkeld werden) Nieuwe en interpreteerbare kennis wordt geproduceerd Gepubliceerd in de wetenschappelijke literatuur op vlak van SAR Verschillende andere toepassingen

20 Inductief Logisch Programmeren Gordon Plotkin (1970) begrip “least general generalization” in logica eerste formalisatie leren in logica Ehud Shapiro (1980) “inferring logical theories from facts” geïnspireerd op Karl Popper’s werk Muggleton (1991) term “inductief logisch programmeren” De Raedt en Bruynooghe (1992) starten eerste Europese project in dit gebied op

21 The Model Inference System Ehud Shapiro (1980) ~ programma synthese MIS : X is gesorteerde versie van Y if X is permutie van Y user : tegen voorbeeld sort (3,4,1) geeft (4,1,3) MIS : X is gesorteerde versie van Y if 1ste element X < 2de element X en X is permutatie van Y user : tegen voorbeeld: sort(3,4,1) geeft (1,4,3) MIS : geeft sort(3,4,1) (1,3,4) ? soort Master Mind ~ selecteren relevante voorbeelden / experimenten programma synthese uit vbn. - 70s : Biermann, Summers

22 Robot Scientist (Nature 04) Biologische Experimenten Achtergrond Kennis over Metabolic Pathway Gist (Yeast -Saccharomyces cerevisiae)

23 Expert Systems (70s) Mycin : Medisch domein -- diagnose van patienten, bloed ziektes en anti-biotica Gebruikt regels zoals IF the infection is pimary-bacteremia AND the site of the culture is one of the sterile sites AND the suspected portal of entry is the gastrointestinal tract THEN there is suggestive evidence (0.7) that infection is bacteroid. Grote verzameling regels (500) Semantiek niet echt duidelijk Moeilijk te onderhouden

24 Waarschijnlijkheidsverdeling P(burglary | alarm=true) ? P(marycalls | burglary = true) ?

25 Bayesiaanse Netten Judea Pearl (1988) Kernidee : structuur graaf codeert conditionele onafhankelijkheden P(A,B,E,J,M) = P(B).P(E).P(A|B,E).P(J|A).P(M|A)

26 Leren uit gegevens mary calls john calls earth- quake alarm burg- lary tt?tt t?ttf ttt?f ?tftt

27 Geschiedenis 80s -- opkomst logica 90s -- opkomst probabilistische modellen 00s -- probabilistisch logisch leren

28 Probabilistisch Logisch Leren Een van de belangrijkste open vragen handelt over "probabilistic logic learning", i.e. de integratie van probabilistic reasoning met machinaal leren. eerste order logische representaties en Soms ook Statistical Relational Learning genoemd

29 29 Article Molecular function Gene Cellular component Biological process Pathway Phenotype / Locus Protein Protein Family/Domain Tissue refers to codes contains, has child refers to expressed in interacts with Is found in contains refers to belongs to participates Is found in has is a, is part of is a MeSH term annotated_with related to Een gegevensbank 29

30 30 Een deelgraaf

31 31 Voorbeeld vragen Wat is het meest relevante deel van de graaf gegeven dat ik interesse heb voor genen X1, X2, en X3 en ziekte Z maar niet voor genen Y1, Y2, Y3 ? Wat is de waarschijnlijkheid dat gen X en ziekte Y verbonden zijn (i.e. dat er een pad is van X naar Y) ? verschillende andere...

32 32 Besluit Machinaal Leren inductief leren en reinforcement learning veel andere deelproblemen Toepasbaar op “Scientific Discovery” rol van representatie en achtergrond kennis Zie bvb. Donald Gillies “AI and Scientific Method”, Oxford Univ. Press, 1996.

33 Simon / Lenat Building cognitive models of scientists Try to explain how discoveries could have been made Sometimes, also try to use them Automated Mathematician System / Eurisko


Download ppt "Machinaal Leren Luc De Raedt Katholieke Universiteit Leuven Declarative Languages and Artificial Intelligence."

Verwante presentaties


Ads door Google