Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdHans Hendrickx Laatst gewijzigd meer dan 10 jaar geleden
1
The Logic of Adaptive Behavior Knowledge Representation and Algorithms for the Markov Decision Process Framework In First-Order Domains Martijn van Otterlo Lekenpraatje – 30/05/08
2
Leren van Beloningen en Straffen -Dog-
3
Lerende Intelligente Systemen 10 -10 Markov Beslisprobleem Onzekerheid Numerieke beloning Model? Toepassingen: Robot Control Spelletjes Algemeen: acties leren
4
Representatie & Generalisatie Intelligent Systeem Sensoren Actuatoren Representatie R “Hetzelfde” (generalisatie)
5
42 43 44 45 46 97 98 99 101 13 14 Simpele Representaties S = 1, 2, 3, 4, … Generalisatie niet echt mogelijk Enorm aantal toestanden
6
Propositionele Representaties Elke sensor geeft ja/nee Generalisatie mogelijk: Bijv: “als een van de achterste 4 sensoren een ja geeft, dan; Niet naar achteren bewegen”. S= Toestand is een geordend lijstje Van antwoorden (ja/nee)
7
Dit Proefschrift: Objecten en Relaties Eerste-Orde Representatie O: schilderij O: bank O: lamp O: stoel O: vloer R: lamp “naast” stoel R: stoel “op” vloer R: vloer “bruin” O: robot Generalisatie over objecten en relaties
8
“Samenvatting” Leren van Beloningen en Straffen Markov Beslisproblemen Representatie van de Wereld Generalisatie Objecten en Relaties
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.