De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

The Logic of Adaptive Behavior Knowledge Representation and Algorithms for the Markov Decision Process Framework In First-Order Domains Martijn van Otterlo.

Verwante presentaties


Presentatie over: "The Logic of Adaptive Behavior Knowledge Representation and Algorithms for the Markov Decision Process Framework In First-Order Domains Martijn van Otterlo."— Transcript van de presentatie:

1 The Logic of Adaptive Behavior Knowledge Representation and Algorithms for the Markov Decision Process Framework In First-Order Domains Martijn van Otterlo Lekenpraatje – 30/05/08

2 Leren van Beloningen en Straffen -Dog-

3 Lerende Intelligente Systemen 10 -10 Markov Beslisprobleem Onzekerheid Numerieke beloning Model? Toepassingen: Robot Control Spelletjes Algemeen: acties leren

4 Representatie & Generalisatie Intelligent Systeem Sensoren Actuatoren Representatie R “Hetzelfde” (generalisatie)

5 42 43 44 45 46 97 98 99 101 13 14 Simpele Representaties S = 1, 2, 3, 4, … Generalisatie niet echt mogelijk Enorm aantal toestanden

6 Propositionele Representaties Elke sensor geeft ja/nee Generalisatie mogelijk: Bijv: “als een van de achterste 4 sensoren een ja geeft, dan; Niet naar achteren bewegen”. S= Toestand is een geordend lijstje Van antwoorden (ja/nee)

7 Dit Proefschrift: Objecten en Relaties Eerste-Orde Representatie O: schilderij O: bank O: lamp O: stoel O: vloer R: lamp “naast” stoel R: stoel “op” vloer R: vloer “bruin” O: robot Generalisatie over objecten en relaties

8 “Samenvatting” Leren van Beloningen en Straffen Markov Beslisproblemen Representatie van de Wereld Generalisatie Objecten en Relaties


Download ppt "The Logic of Adaptive Behavior Knowledge Representation and Algorithms for the Markov Decision Process Framework In First-Order Domains Martijn van Otterlo."

Verwante presentaties


Ads door Google