Agententechnologie Les 5: reactieve en hybriede agenten

Slides:



Advertisements
Verwante presentaties
TimeManagement Coaching
Advertisements

Mediërend leren op bs. Theresia
INTERACTION DESIGN Week 3.
HET ONTSTAAN DER SOORTEN
Dr. Patrick De Causmaecker, KaHo St.-Lieven Agententechnologie Les 7: overeenkomen dr. Patrick De Causmaecker.
Automatisering Uitvoering van taken of functies door producten en systemen die vroeger werden uitgevoerd door mensen. Bijvoorbeeld: openslaande deuren,
Objecten en Volgordediagrammen
Agententechnologie Les 6: meer-agentinteracties
Kunstmatige intelligentie 2: Agent Systems dr. Rogier van Eijk TouW 13 november 2010.
Simulatie van gedistribueerde voetbalstrategieën Tim Vermeulen Promotor: dr. Katja Verbeeck Copromotoren: ing. Tony Wauters, ing. Koen Vangheluwe, Opdrachtgever:
RBVO, rekenbewust vakonderwijs rekenen in andere vakken
Nieuwe media in het onderwijs: wat brengt de toekomst. prof. dr
Dr. Patrick De Causmaecker, KaHo St.-Lieven Agententechnologie Les 8: communiceren dr. Patrick De Causmaecker.
Observeren en rapporteren
The managment of innovation
Op de koffie bij de kabouters
Cognitive Dynamics Voorlichting Master CKI
Autisme en intelligentie
Charles Darwin en de evolutietheorie
Laplace transformatie
Exploratie van de ontwerpruimte 3. Prototypes, emulatie en simulatie Prof. dr. ir. Dirk Stroobandt Academiejaar
Geest, brein en cognitie Filosofie van de geest en Grondslagen van de cognitiewetenschap Fred Keijzer.
1 Beslissingsondersteuning Marakas H12 t/m H16 Robert de Hoog 8 november 2000.
Dr. ir. M. Maris, IIV21 College Multi-Agent Systemen 2de Semester, Dinsdags van 13:00-15:00 uur in zaal P227 Geen Praktikum op vrijdag (staat verkeerd.
TUDelft Knowledge Based Systems Group Zuidplantsoen BZ Delft, The Netherlands Caspar Treijtel Multi-agent Stratego.
Inleiding Kennistechnologie §Hoofdstuk 7: Kennisrepresentaties 1: Eigenschappen en representatievormen §Hoofdstuk 8: Kennisrepresentaties 2: Eenvoud en.
Game Architectuur Case. Game Architectuur Case - Requirements Hardware  het spel moet op een PC draaien met verschillende hardware; Input  het spel.
Dr. Patrick De Causmaecker, KaHo St.-Lieven, Agententechnologie Les 4: praktisch redeneren dr. Patrick De Causmaecker.
Agententechnologie Les 2 dr. Patrick De Causmaecker.
Agententechnologie dr. Patrick De Causmaecker. Referentie “An Introduction to Multiagent Systems”, Michael Wooldridge, Department of Computer Science,
It’s not you, it’s the didactics that matter, stupid…
Quiz. Aaron heeft het gevoel ingeklemd te zitten. De oorzaak van dit gevoel komt vooral door: a. zijn eigen beleving en eigen gedrag; b. de aansturing.
Dr. ir. M. Maris, MAS1 College Multi-Agent Systemen 2de Semester, Donderdags van 11:00-13:00 uur Geen Praktikum op vrijdag (staat verkeerd vermeld in de.
GROEN PROEVEN Workshop 31 maart 2011 Reflectie binnen de PvB
Aan de slag met competenties beoordelen
Veranderingen van kennis in Kripke-modellen. “A Logic of Epistemic Actions” van Alexandru Baltag.
Game Design Document Florian & Maurice Flints Project.
MENSELIJKE ONTWIKKELING OUDER-KIND RELATIE 0 – 3 JAAR
Convergeren en selecteren
Docentendag Intelligente Systemen dr.ir. Michael Franssen Faculteit Wiskunde & Informatica Software Engineering & Technology.
Vitaliteit en gezonde omgeving Lex van Delden.
(zie werkpakket 2, bijlagerapport 5
AI Kaleidoscoop Werkcollege 1: AI Overzicht Radu Serban
Optimaliseren BPV keten
Visie & Strategie.
B6 B5.
Bots en agents Inhoud Bewerkingen voor het daadwerkelijke animeren Implementatie Game Animatie Active Worlds Animatie.
Weerbaarheid politie. Onderzoek Ziekteverzuim is bovengemiddeld vergeleken met andere beroepsgroepen  lage weerbaarheid Theory of planned behaviour.
Begeleiden en Coachen week 5
Wat is een verstandelijke beperking en wat zijn de gevolgen ervan?
Internationale marketing De sociaal-culturele omgeving Svend Hollensen Nederlandse bewerking: Hans Engbers Angelo Mulder.
Ontwerpen van 3D lesmateriaal voor biologie Ecent conferentie 20 mei 2015 Dirk Jan Boerwinkel Freudenthal Instituut voor Didactiek van Wiskunde en Natuurwetenschappen.
(basis)training voor praktijkbegeleiders 13 december 2015 Module rol van de beoordelaar.
Het lijkt eenvoudig, het is ingewikkeld en soms kan je het oplossen: Computerwetenschappers winnen Nobelprijzen. Patrick De Causmaecker.
Techniekfilosofie: waar komen wij vandaan? Martin Meganck KAHO St Lieven, Studiegebied Industriële Ingenieurswetenschappen KU Leuven, Centrum voor Wetenschap,
Media en Kennistechnologie 19 april 2002NIOC vision on e-mission Media en Kennistechnologie een nieuw ICT-curriculum Erik Jansen Faculteit.
Lesdoel en Begrippen deze les: Universalisme Relativisme Vooroordeel
Methodieken Les 3 “ Individuele methodieken en groepsmethodieken” thema 10.1 en 10.2.
Pluriforme samenleving
Executieve functies versterken middels denkspellen.
Agressie op de werkvloer
Psychopathologie v0or 1e jaars BBL 2017
Charles Darwin en de evolutietheorie
Forum ROMAnum Evaluatie
SQL Les February 2019.
Waarden.
HET NIEUWE VEILIGHEIDSDENKEN
Globalisering als kans en als dreiging
Waarden.
VERSNELLEN VAN GEMEENSCHAPPELIJK RESULTAAT
Transcript van de presentatie:

Agententechnologie Les 5: reactieve en hybriede agenten dr. Patrick De Causmaecker dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Reactief?! Symbolische representaties en beslissingen gebaseerd op syntactische manipulatie is een niet werkende methode Intelligent gedrag is onlosmakelijk verbonden met de omgeving waarin de agent verblijft Intelligent gedrag komt voort uit de interactie van eenvoudige acties dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

De “subsumption” architectuur (Brooks) Uitgangspunten over intelligentie: Kan ontstaan zonder expliciete representaties Kan ontstaan zonder abstracte redeneren Is een emergente eigenschap van complexe systemen Twee basis ideeën: Situering en belichaming Intelligentie en emergentie dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 De architectuur Twee karakteristieken Beslissingen via taak uitvoerend gedrag (behaviours als eindige-toestandsmachines) Geen symbolische representaties of redenering Vorm : situatie -> actie De verschillende behaviours kunnen simultaan afvuren Ze komen in een hiërarchie van lagen, de laagste lagen hebben voorrang op de hogere De see(…) blijft bestaan, maar bevat geen ingewikkelde bewerking van de sensorsignalen dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 De actieselectie R: gedragsregels <: voorrangsrelatie function action(p:P):A var fired : (R) var selected:A begin fired <-{(c,a)|(c,a) in R en p in c} for each (c,a) in fired do if there is no (c’,a’) < (c,a) in fired then return a end-if end-for return null End function action dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Steels dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

Luc Steels: de Mars explorer Het doel is op Mars waardevolle gesteenten te zoeken en ze terug te brengen naar de aarde. We weten niet waar de gesteenten zich bevinden, maar we weten dat ze in hoopjes voorkomen. We beschikken over een aantal autonome voertuigen die rond kunnen rijden en stukjes steen kunnen oppikken en naar het moederschip kunnen brengen. Er zijn veel obstakels die verhinderen dat de voertuigjes communiceren. dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Symbolisch? Luc Steels noemt de “klassieke” benadering met logica volstrekt onrealistisch. Hij stelt een methode voor die beperkt is tot Een gradient veld dat de richting van het moederschip aangeeft (bijv. een radiosignaal) Het gebruik van radioactieve kruimels die door de voertuigen geplaatst, gedetecteerd en opgeraapt kunnen worden dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

Individualistische agenten Regels: (1) if detect an obstacle then change direction (2) if carrying samples and at the base then drop samples (3) if carrying samples and not at the base then travel up gradient (4) if detect a sample then pick sample up (5) if true then move randomly Niveaus: (1)<(2)<(3)<(4)<(5) dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Coöperatie Regel 3 verandert in 6: (6) if carrying samples and not at the base then drop two crumbs and travel up gradient Regel 8 wordt toegevoegd: (8) if sense crumbs then pick up 1 crumb and travel down gradient Volgens de prioriteit: (1)<(2)<(6)<(4)<(8)<(5) dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

Maes: Agent Network Architecture (ANA) Agent is een verzameling competentiemodules die overeenkomen met de gedragingen in de subsumption architectuur. Elke module wordt met precondities en postcondities gedefinieerd en heeft een activatieniveau dat de relevantie van de module in de huidige situatie aangeeft Tijdens het uitvoeren worden de modules in een activatienetwerk verbonden via hun pre en post condities dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

Beperkingen van reactieve agenten Agenten moeten voldoende informatie hebben in hun lokale omgeving Hoe kunnen agenten niet-lokale informatie opnemen? Ze hebben een korte termijn visie. Hoe kunnnen ze leren uit ervaring? Emergent gedrag is mooi, maar moeilijk te begrijpen. Hoe ontwerpen we dergelijke systemen? Wat indien de complexiteit veel lagen vereist? -> evoluerende agenten, artificial life dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Hybriede agenten Een manier om de complexiteit te beheersen is te werken met lagen: horizontaal of vertikaal Horizontaal gelaagde agenten zijn in competitie. Het ontwerp lijkt eenvoudig. Een nadeel is de beheersing van de interactie tussen de agenten. Vaak wordt een mediator gebruikt. Zijn werk wordt exponentieel ingewikkelder naarmate het aantal lagen toeneemt. Vertikaal gelaagde agenten beperken de interacties tot de interfaces tussen opeenvolgende lagen dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Hybriede agenten Laag n Input van perceptie … Output actie Laag 2 Laag 1 Laag n Laag n … … Laag 2 Laag 2 Laag 1 Laag 1 dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 TouringMachines Sensor input Modelling layer Perception subsystem Action Subsystem Planning layer Reacive layer Action output Control subsystem dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 The TouringMachine Reactive layer: Eenvoudige situatie-actie regels (voorbeeld obstakels vermijden) Planning layer Proactief gedrag, wat doet de agent, het gebruikt een planotheek van schemata voor plannen Modelling layer Stelt de objecten en de andere agenten in het systeem voor. Voorspelt conflicten en postuleert doelen voor de planning layer Het controle systeem bepaalt welk van de layers de agent op een bepaald ogenblik bestuurt, en kan ook de perceptie beperken voor een bepaalde layer dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 InteRRaP Cooperation layer Social knowledge Plan layer Planning Knowledge Behavious layer World model World interface dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Preview: speltheorie Prisoners dilemma Twee mannen zijn beschuldigd van een misdaad en zitten in afzondering Men zegt ze dat 1. Indien één van hen bekent en de andere niet, dan komt degene die bekent vrij, en de ander gaat in de cel voor 3 jaar 2. Indien beide bekennen gaan ze in de cel voor 2 jaar. Ze weten dat, indien geen van hen bekent, ze allebei voor 1 jaar in de cel gaan. dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Speltheorie Bekennen is verraad, niet bekennen is samenwerken. Wat zou jij doen indien je één van de misdadigers was? dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

4 uitkomsten: utility matrix i verraad i werkt samen j verraad 2 5 j werkt samen 3 dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Nash evenwicht Wat mijn tegenstrever ook kiest, ik bereik … In het voorbeeld is het Nash evenwicht (verraad,verraad) (controleer) Dit is niet helemaal in overeenstemming met ons gevoel voor moraliteit Dit optimaliseert ook niet het totale gevoel van welzijn. dr. Patrick De Causmaecker, KaHo St.-Lieven 2004

dr. Patrick De Causmaecker, KaHo St.-Lieven 2004 Uitbreidingen Geitereerde Prisoners Dilemma De beste strategie is de eerste keer mee te werken en vervolgens te doen wat je partner deed (variatie:uitwisseling van geld en prijs) Geïtereerde Prisoners Dilemma in een groep Individuen die niet meewerken doen het slecht Een klein percentage vergevingsgezindheid doet goed tegen valkuilen Geïtereerde PD met een eindig aantal iteraties (op voorhand bekend) Wat is het Nash evenwicht? dr. Patrick De Causmaecker, KaHo St.-Lieven 2004