The Logic of Adaptive Behavior Knowledge Representation and Algorithms for the Markov Decision Process Framework In First-Order Domains Martijn van Otterlo.

Slides:



Advertisements
Verwante presentaties
KWALITEITSZORG november 2012
Advertisements

‘SMS’ Studeren met Succes deel 1
Hans De Witte, Eddy Omey, Dieter Verhaest
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
 De Robot  Het Programma  Film By Martijn Hazenboom.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
- Inhoud Artificial Intelligence - Inhoud Wat is AI? OorsprongReasoningLearning • Wat is Artificial Intelligence.
Reinder Vrielink, February 2009 A comparative research among Dutch students in middle and higher vocational education with the Technology Acceptance Model.
Adaptieve Ondersteuning van Mens-Computer Teams Een Verkenning van het Gebruik van Cognitieve Modellen van Vertrouwen en Aandacht Peter-Paul van Maanen.
Een optimale benutting van vierkante meters Breda, 6 juni 2007.
Kwaliteit en betrouwbaarheid van simulaties ir. Rudolf van Mierlo Efectis Nederland BV.
Veilig ander aardgas verbranden
1 Smart System Design Waar gaat dat over? Projectdag 17 april 2008 Prof Ton Mouthaan, decaan EWI.
6 VWO B2 deel 2 A1.1 vraag 3 Karl Friedrich Gauss.
Het verdienmodel van. Inkomsten Spotify Cijfers JaartalOpbrengstVerlies 2009$13 miljoen*$26 miljoen 2010$99 miljoen$42 miljoen 2011$244 miljoen$56,6.
Hoofdstuk 6: Controle structuren
Elke 7 seconden een nieuw getal
1 Datastructuren Sorteren: alleen of niet alleen vergelijkingen College 5.
1 Datastructuren Sorteren: alleen of niet alleen vergelijkingen (II) College 6.
1 introductie 3'46” …………… normaal hart hond 1'41” ……..
Natuurlijke-Taalinterfaces week 3 1. evaluatie van een formule in een model 2. vraag-antwoord dialogen 3. Modellen en applicaties.
Algoritmiek Arrays: wat zijn dat en wat kun je ermee? Loops: hoe hou je ze in bedwang? Hoorcollege 6 - Ma. 9 okt L.M. Bosveld-de Smet.
Geest, brein en cognitie Filosofie van de geest en Grondslagen van de cognitiewetenschap Fred Keijzer.
 (het is niet zo moeilijk…)
TUDelft Knowledge Based Systems Group Zuidplantsoen BZ Delft, The Netherlands Caspar Treijtel Multi-agent Stratego.
Hoofdstuk 2 Samenvatting
Wie het kleine niet eert ... (quarks, leptonen,….)
Kim J. H. Dirkx, Liesbeth Kester, Paul A. Kirschner
Toetsen als Leerinterventie. Samenvatten in het Testing Effect Paradigma. Kim J. H. Dirkx, Liesbeth Kester, Paul A. Kirschner CELSTEC, Open Universiteit.
1 WIJZIGINGEN UNIEK VERSLAG. 2 Agenda Verbeteringen Veranderingen formulieren Praktische herinneringen Nieuwe formulieren Sociale en culturele participatie.
Optellen en aftrekken tot 100 TE + E = TE mb
Designing Knowledge Systems b Hoofdstuk 11 van Knowledge Engineering and Management. The CommonKADS Methodology. b A.Th. Schreiber, J.M. Akkermans, A.A.Anjewierder,
Path planning voor elastische objecten Robin Langerak Planning paths for elastic objects under manipulation constraints LamirauxKavraki.
H7 delen van veeltermen Oef 30 p 159. Oef 30 p 159 a Mogelijke delers? Door x - 1? Door x + 1?
Principes Geo-informatie Nico de Graaff. 2 Van werkelijkheid naar model Bron: Longley et al
Mitsubishi Electric Changes for the Better Masterclass Mitsubishi Electric Servotechniek.
RibNAT01a Natuurkunde bijspijker Oefententamen 2009.
Ontwikkelingen in ongevallen onderzoek
Een bakje kwark kost € 1,27. Hoeveel kosten vijf bakjes? 5 x € 1,27 = 5 x € 1,00 = € 5,00 5 x € 0,20 = € 1,00 5 x € 0,07 = € 0, € 6,35 Een.
Hidden Markov Models Introductie Project: 1. Initializatie 2. Training.
Eindhoven Technische Universiteit Ondersteuning van het Ontwerpproces Bauke de Vries.
Informatiesystemen in de Bouw
ENQUETE A.E.L Hoe is het stagelopen je bevallen? Goed:98% (94% in 2011) Goed:98% (94% in 2011) Matig:1% ( 6% in 2011) Matig:1% ( 6% in 2011) Slecht:1%
Veranderingen van kennis in Kripke-modellen. “A Logic of Epistemic Actions” van Alexandru Baltag.
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
Eerst even wat uitleg. Klik op het juiste antwoord als je het weet.
Geregeld veersysteem Citroën C6
1 Over het examen (1): Modus Mondeling met schriftelijke voorbereiding 4 uur, 3 onderdelen: –Modellering (  schriftelijk, dan mondeling) –Queries / relationeel.
TUDelft Knowledge Based Systems Group Zuidplantsoen BZ Delft, The Netherlands Determining user interface semantics using agents Lein Ton.
Mechanica College in Studiejaar Afdeling Natuurkunde en Sterrenkunde Vrije Universiteit Amsterdam.
Hartelijk welkom bij de Nederlandse Bridge Academie Hoofdstuk 7 De 2 ♦ /2 ♥ /2 ♠ en de 2 ♣ -opening 1Contract 2, hst 7.
STIMULANS KWALITEITSZORG juni 2014.
Inhoud college Bespreken opdracht Lijnbalancering: TPM
BEGINNERs EV3 PROGRAMMeer Les 3
Programmeer les voor gevorderden
Conclusie dmv toepassen regels. Human Inference.
Management Accounting Management Control
1 e-Books & i-Papers Rik Min researcher Centre for Telematics and Information Technology (CTIT) & Faculty of Educational Science and Technology (EDTE)
1. 39 En uit die stad geloofden vele der Samaritanen in Hem om het woord der vrouw, die getuigde: Hij heeft mij gezegd alles wat ik gedaan - heb. 2.
Tircms02-p les 2 Meer operatoren Arrays en pointers Types en conversie.
Vrije Universiteit amsterdamPostacademische Cursus Informatie Technologie Beyond Object-Orientation?
Amsterdam Airport Schiphol 1 Ludo W. van Meeuwen 1,3, Saskia Brand-Gruwel 1, Jeroen J.G. van Merriënboer 1,2, & Jeano J.P.R. de Bock 3 1 Open University.
Van BiSL naar BiSL Next Lucille van der Hagen
Gevorderde EV3 Programmeer lessen Infrarood Sensor
BEGINNER EV3 PROGRAMMEER Les
Kies het woord met de dubbele betekenis en leg uit waarom dat zo is.
Kies het woord met de dubbele betekenis en leg uit waarom dat zo is.
E-learning in het onderwijs
Afscherming carpet table lamp lamp.
Transcript van de presentatie:

The Logic of Adaptive Behavior Knowledge Representation and Algorithms for the Markov Decision Process Framework In First-Order Domains Martijn van Otterlo Lekenpraatje – 30/05/08

Leren van Beloningen en Straffen -Dog-

Lerende Intelligente Systemen Markov Beslisprobleem Onzekerheid Numerieke beloning Model? Toepassingen: Robot Control Spelletjes Algemeen: acties leren

Representatie & Generalisatie Intelligent Systeem Sensoren Actuatoren Representatie R “Hetzelfde” (generalisatie)

Simpele Representaties S = 1, 2, 3, 4, … Generalisatie niet echt mogelijk Enorm aantal toestanden

Propositionele Representaties Elke sensor geeft ja/nee Generalisatie mogelijk: Bijv: “als een van de achterste 4 sensoren een ja geeft, dan; Niet naar achteren bewegen”. S= Toestand is een geordend lijstje Van antwoorden (ja/nee)

Dit Proefschrift: Objecten en Relaties Eerste-Orde Representatie O: schilderij O: bank O: lamp O: stoel O: vloer R: lamp “naast” stoel R: stoel “op” vloer R: vloer “bruin” O: robot Generalisatie over objecten en relaties

“Samenvatting” Leren van Beloningen en Straffen Markov Beslisproblemen Representatie van de Wereld Generalisatie Objecten en Relaties