Inleiding adaptieve systemen

Slides:



Advertisements
Verwante presentaties
Het tweede werkstuk.
Advertisements

De schaduw van Jan Harrie Geelen Querido.
Tafelmanieren Start de vragen.
Kleine engelen Foto’s, tekst en geluid!.
Plaatje vrienden op een bank
FAIR PLAY NOT ONLY FOR THE GAME !
Het doen van eigen onderzoek
Simultaan Tafelrondje
Aanvullende uitleg zaalregels - clubarbitrage
Hoe ruim ik mijn kamer op?
Uitleg bijwoordelijke bepaling (bwb)
Herkenning? Rot voelen? Leegte opvullen?
Door goede gesprekken groeien
Opkomen voor jezelf.
Voorbereiding Clubbridge Les 12 Omgaan met onregelmatigheden versie VC LES 12.
Uitleg lijdend voorwerp (lv)
Sander Mager Roel Lafeber CE2A. Sinds een aantal maanden ben ik erg fanatiek de game ‘’Candy Crush’’ aan het spelen. Een klasgenootje van mij speelde.
Mijn naam is Willem Wind. Mijn naam is Willem Wind En ik ben hoogbegaafd.
Verkeers- stellingenspel
Schoolplein Rachelle Lisa Chantal Xian Leroy.
Alzheimer Een haperend geheugen
Dialoogdag Ouderswerking Vlaams-Brabant
Agententechnologie Les 6: meer-agentinteracties
Speltheorie een techniek om situaties met strategische interacties tussen verschillende beslissingnemers te analyseren en de uitkomst te voorspellen.
Aanvullende uitleg zaalregels - clubarbitrage
VBS De Bron Meester Ronny Marc Horst
TAALPROBLEMEN ODD ONE OUT.
Ik geloof… Dat onze achtergrond en omstandigheden misschien wel van invloed zijn geweest op wie we zijn, maar dat wìj verantwoorde- lijk zijn voor wie.
Adaptieve Ondersteuning van Mens-Computer Teams Een Verkenning van het Gebruik van Cognitieve Modellen van Vertrouwen en Aandacht Peter-Paul van Maanen.
COMPETITIEREGLEMENT  De wedstrijden worden gespeeld op zaterdagmiddag van 13:00 uur – 17:30 uur  Iedereen wordt 15 minuten voor aanvang van de wedstrijd.
Inleiding adaptieve systemen
STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-
Welkom Woondebat Haaglanden 2013 Wachten tot het overgaat of zorgen dat het goed komt?
HET CURRICULUM VITAE = VISTEKAARTJE NUMMER 2
Inleiding Adaptieve Systemen
Mario Kart Mario kart is een serie van race spellen met wapens.
ADP Tussenopdracht: Horseman Student: Kaj Metz Richting: GAR Module: Design & Research Vak: Action Design Principles Docent: Karel Millenaar Datum:
Het Debat Opbouw en inhoud.
Prisoner’s Dilemma een experiment.
Een bericht speciaal voor jouw m’n
Van Valckenborgh Dirk Februari Definitie “optie op aandelen” : Recht / Verplichting om een standaardhoeveelheid aandelen te kopen (call-optie –
1 Datastructuren Een informele inleiding tot Skiplists Onderwerp 13.
Spelregeltest Oliveo Handbal
Interpreteren van data
Dr. Albertus Risaeusschool
Project Management Fails
Hoe kan ik mijn leven veranderen? Gen. 32: Geldermalsen
Les 3: Verkeer TOETS.
Het begint bij het jonge kind
ZELF SLEUTELEN! JOB CRAFTING OPDRACHT.
Wees eens wat OENiger Open – Eerlijk - Nieuwsgierig
Arthur Japin, de niet-gelovige hoofdredacteur van de #Jezusglossy, over vergeving.
Ik doe mijn presentatie over…
Ik wou dat ik een vulkaan was, dan kon ik de hele dag roken en zou iedereen zeggen: "kijk hij werkt".
Deze presentatie kan als hulpmiddel gebruikt worden om het programma te presenteren aan het bestuur of bv aan sponsoren. Advies: voeg gerust dia’s toe.
Speltheorie/Experimenten
Hoe gaat het verder na Bethel?
Onze doelen en visie in beeld
Golf Basisbegrippen & Uitleg
Briefing
Onderzoeksvaardigheden 3
Het kwetsbare vertrouwen van ouders in de jgz Justine Pardoen Ouders Online.
Kansverdelingen Kansverdelingen Inleiding In deze presentatie gaan we kijken naar hoe kansen zijn verdeeld. We gaan in op verschillende.
Een werkvorm om actief en concreet tot participatie te komen
Welkom op onze thema-avond
Bridge onder begeleiding
Welkom VWO 5..
Nee Zeggen!.
Speltheorie een techniek om situaties met strategische interacties tussen verschillende beslissingnemers te analyseren en de uitkomst te voorspellen.
Transcript van de presentatie:

Inleiding adaptieve systemen Competitie en coöperatie Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Inhoud Twee-persoons competitieve symmetrische niet-nulsom spelen op basis van volledige informatie met simultane zetten en kwantitatieve beloningen Prisoner’s Dilemma ( PD ) Stag Hunt ( SH ) Chicken ( CK ) Begrippen: Pareto-optimale oplossing, Nash-evenwicht Uitbreidingen van het Prisoner’s Dilemma Geïtereerd ( IPD ) Geïtereerd evolutionair ( IEPD ) Geïtereerd ruimtelijk evolutionair ( SIEPD ) Geïtereerd continu ruimtelijk evolutionair ( CSIEPD ) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Coöperatieve spelen Agent 2 Agent 1 a1 a2 a3 11 –30 7 6 5 Doel: coördinatie Agent 2 Agent 1 a1 a2 a3 11 –30 7 6 5 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Doel: eigen winst-maximalisatie Competitieve spelen Doel: eigen winst-maximalisatie Agent 2 Agent 1 a1 a2 a3 11, 11 –30, 1 0, 1 1, –30 7, 7 6, 0 1, 0 0, 6 5, 5 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Competitieve spelen Wie doet de vaat? Gedeelde koffiepot Meeliften in groepswerk Wielrenners in een kopgroep NIMBY problematiek (windmolenpark) Vangstquotum in de visserij Handelsoorlog Wapenwedloop Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Koffiezet dilemma Ik ( De Ander ) Is sociaal Verzaakt Ben sociaal Beiden één pot koffie zetten en samen drinken: B – C ( B – C ) = 1 ( 1 ) De ander profiteert: B – 2C ( B ) = –1 ( 3 ) Verzaak Ik profiteer : B ( B – 2C ) = 3 ( –1 ) We vertikken het allebei om koffie te zetten: 0 ( 0 ) Pot koffie zetten (naar apparaat lopen, alle handelingen doen etc.): kosten C = 2 Pot koffie drinken: baten B = 3 Koffie zetten en drinken: nut is B – C = 1 (C, B) → PD. Voor andere waarden van C en B krijgen we een ander spel. (Doen we nu niet.) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Prisoner’s dilemma (Speler B) (Mondje dicht) (Verklikken) Speler A Taakstraf (Taakstraf) Levenslang (Vrij en getuigen-bescherming) Verklikken Vrij en getuigen-bescherming (Levenslang) Straf (Straf) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Een abstractie Jij bent speler Speler 1. Je speelt één keer, zonder vooraf te (kunnen of willen) communiceren met Speler 2. Wat zou je doen als je wist dat Speler 2 samenwerkt (C)? Wat zou je doen als je wist dat Speler 2 verzaakt (D)? Dus wat zou je i.h.a. doen? Speler 2 Spe-ler 1 C D 3 ( 3 ) 0 ( 5 ) 5 ( 0 ) 1 ( 1 ) Wat zou Speler 2 i.h.a. doen? Zou het uitmaken als Speler 1 en Speler 2 van te voren mochten communiceren? Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Sommeren van nut is geen optie. (Som van Euro’s en Dollars = ??) Pareto front Sommeren van nut is geen optie. (Som van Euro’s en Dollars = ??) Een paar αA (αB) heet een gemeenschappelijke strategie Afgekort met JS (“joint strategy”) α van “actie” Een JS domineert een andere JS als Tenminste één speler daar strict beter van wordt. Geen enkele andere speler daar slechter van wordt. A ( B ) ( C ) ( D ) C 3 ( 3 ) 0 ( 5 ) D 5 ( 0 ) 1 ( 1 ) Een JS welke niet gedomineerd wordt door een andere JS, heet Pareto-optimaal Pareto-front = { PO opl. } Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Probleem: het Nash-evenwicht is NIET Pareto-optimaal Je speelt beiden C (C) (links-boven). Heb je reden om van strategie C af te wijken? Heeft B reden om af te wijken? Jij speelt C, maar B speelt D (rechts-boven). Weer dezelfde vragen voor spelers A en B Dezelfde vragen voor JS (C, D) (links-onder). Tenslotte voor JS (D, D) A ( B ) ( C ) ( D ) C 3 ( 3 ) 0 ( 5 ) D 5 ( 0 ) 1 ( 1 ) We zeggen dat een JS zich in een Nash-evenwicht bevindt als geen partij er baat bij heeft zijn strategie (eenzijdig) te veranderen. Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Normaalvorm (= generieke 2x2 matrix) CC: we werken samen (Reward payoff, R) DC: ik verzaak, de ander is een sukkel (Temptation payoff, T) CD: ik ben coöperatief de ander verzaakt (Sucker payoff, S) DD: we verzaken beiden (Penalty payoff, P) Naam van het spel ( Speler B ) ( C ) ( D ) Spe-ler A C R ( r ) S ( t ) D T ( s ) P ( p ) Je krijgt verschillende spelen als je gaat variëren met P, R, S, T Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Tragedy of the commons Meerdere deelnemers + indirecte interactie, bv. middels gedeelde reserves. Voorbeeld: overbevissing Als iedereen zich aan het visquotum houdt is er niks aan de hand ( R ) Verleiding ( T ): jij houd je er, als één van de weinigen, niet aan Sukkel ( S ): jij houd je er, als één van de weinigen, wel aan Penalty ( P ): iedereen heeft lak aan het quotum → zee leeg Column van Lebbis in Spijkers met Koppen 30 mei 2009, op ong. 00:45 min. Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Prisoner’s dilemma T > R > P > S DC: ik ga praten (verklikken) ten koste van mijn partner CC: we houden beiden onze mond DD: we gaan allebei praten CD: ik houd m’n mond, maar wordt verklikt door mijn partner Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Chicken game

Chicken: T > R > S > P Ook wel: “sway or dare” DC: ik rij rechtdoor, de ander niet CC: we wijken beiden uit CD: ik wijk uit, de ander rijdt rechtdoor DD: we rijden beiden rechtdoor Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Snowdrift: T > R > S > P DC: ik blijf zitten, de ander ruimt sneeuw CC: we ruimen beiden sneeuw CD: ik ruim sneeuw, de ander niet DD: we ruimen beiden geen sneeuw (en vriezen dood) Ook hier geldt weer: T > R > S > P. Dus identiek aan Game of Chicken Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Ontsnapte wielrenner terughalen DC: de ander haalt groen terug en terwijl hij dat doet, ga ik in z’n wiel zitten CC: we halen hem samen terug CD: ik haal hem terug, met die ander in m’n wiel (en verminder zo m’n winstkansen) DD: niemand haalt iemand terug (en we verliezen allebei de wedstrijd) Je con-current Jij Ook hier geldt weer: T > R > S > P. Dus identiek aan Game of Chicken Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Hert of haas: R > T > P > S CC: we jagen samen op een hert DC: ik jaag op een haas (jij vruchteloos op een hert) DD: we jagen beiden op een haas CD: jij jaagt op een haas (ik vruchteloos op een hert) Hier geldt NIET: T > R > S > P. Dus NIET identiek aan Game of Chicken Claude Monet. De Jacht (1876) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Hier geldt weer: R > T > P > S. Dus: Stag Hunt Samen uit, samen thuis CC: we komen allemaal DC: ik zeg af, de anderen komen DD: we zeggen allemaal af CD: ik kom, de anderen zeggen af Hier geldt weer: R > T > P > S. Dus: Stag Hunt Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Battle of the sexes T > S > P > R Man: DC: we gaan samen naar voetbal CD: we gaan samen naar ballet DD: ik ga naar voetbal, jij gaat naar ballet CC: ik ga naar ballet, jij gaat naar voetbal Weer andere ordening dan Prisoner’s, Chicken en Stag Hunt. Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Postulaten voor coöperatie Een meewerkende partner levert meer op dan een partner die verzaakt: CC > CD ( R > S ): als ik meewerk, is het beter dat mijn partner dat ook doet DC > DD ( T > P ): als ik verzaak, kan ik profiteren van een meewerkende sukkel S R P T Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Mogelijke postulaten voor verzaken Verzaken levert winst op: DC > CC ( T > R ): als mijn partner meewerkt, is het beter voor mij te profiteren. DD > CD ( P > S ): als mijn partner verzaakt, kan ik zelf ook beter verzaken R S T P Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Ordening van strategieën DC 2 3 DD CC 4 1 CD Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Chicken: DC > CC > CD > DD 2 3 DD CC ! 4 1 CD Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Hert of haas: CC > DC > DD > CD ! 2 3 DD CC 4 1 CD Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Prisoner’s: DC > CC > DD > CD 2 3 DD CC 4 1 CD Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Generieke 2x2 strategie-matrix Als de ander D … Als de ander C … … dan is het beter voor mij als ik C … dan is het beter voor mij als ik D Werk altijd samen → Spel zonder dilemma’s Coördineer met je partner → Stag Hunt Anti-coördineer met je partner → Chicken (Snowdrift) Verzaak altijd → Prisoner’s Dilemma Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Overzicht van 2x2 competitief Prisoner’s dilemma Pareto: CC, CD, DC; Nash: DD ( Speler B ) ( C ) ( D ) Spe-ler A C 3 ( 3 ) 0 ( 5 ) D 5 ( 0 ) 1 ( 1 ) Stag Hunt Pareto: CC; Nash: CC, DD ( Speler B ) ( C ) ( D ) Spe-ler A C 4 ( 4 ) 1 ( 3 ) D 3 ( 1 ) 2 ( 2 ) Chicken Pareto: CD, DC; Nash: CD, DC ( Speler B ) ( C ) ( D ) Spe-ler A C 0 ( 0 ) -1 ( 1 ) D 1 ( -1 ) -5 ( -5 ) Battle of the sexes Pareto: CD, DC; Nash: CD, DC ( Speler B ) ( C ) ( D ) Spe-ler A C 0 ( 0 ) 2 ( 3 ) D 3 ( 2 ) 1 ( 1 ) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Competitie en coöperatie Gemixte strategieën Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

PrB(C) is bekend A ( B ) C D R ( r ) S ( t ) T ( s ) P ( v ) Stel, A weet dat B met kans q actie C speelt, i.e., PrB(C) = q Wanneer wordt het voor A interessant om samen te werken? Antwoord: als en slechts als: PayoffA( C | PrB(C) = q ) > PayoffA( D | PrB(C) = q ) Als en slechts als: qR + (1 – q)S > qT + (1 – q)P Als en slechts als: { q > (P – S)/(R – T + P – S), als R – T + P – S > 0 q < (P – S)/(R – T + P – S), als R – T + P – S < 0 S > P, anders Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Gemixte strategie Stel, speler A besluit C met kans p te spelen. We zeggen dan dat A volgens een gemixte strategie met parameter p speelt. Kortweg: de strategie van A is p. Evenzo noteren we een gemixte strategie van B als q. Vraagstuk: voor welke paren van kansen vormt (p, q) een Nash-evenwicht? p 1 – p q 1 – q Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Nash-evenwicht bij gemixte strategie Neem aan dat 0 < R – T + P – S < 1 In dat geval zagen we dat A Beter kan samenwerken a.e.s.a. q > (P – S)/(R – T + P – S) Beter kan verzaken a.e.s.a. q < (P – S)/(R – T + P – S) In alle andere gevallen is de waarde van p voor A irrelevant. Hetzelfde geldt voor B, maar dan symmetrisch q p Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

De Ander Ik Stag hunt (samen uit, samen thuis) 4 ( 4 ) Drie NE, waarvan één labiel 3 ( 1 ) 1 ( 3 ) 2 ( 2 ) De Ander Ik Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

De Ander Ik Prisoner’s dilemma Eén NE 3 (3) 0 ( 5 ) 1 (1) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

De Ander Ik Chicken (Snowdrift game) Drie NE 0 ( 0 ) -1 ( 1 ) 1 ( -1 ) -5 ( -5 ) De Ander Ik Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

De Ander Ik Battle of the sexes Eén NE 3 ( 2 ) 1 ( 1 ) 2 ( 3 ) 0 ( 0 ) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Variaties op het Prisoner’s Dilemma Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Variaties Het herhaalde Prisoner’s Dilemma (Eng.: Iterated PD, IPD) Een evolutionaire variant van het IPD (EIPD) Een ruimtelijk-evolutionaire variant van het IPD (SEIPD) Een continu-ruimtelijk-evolutionaire variant van het IPD (CSEIPD) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Iterated Prisoner’s Dilemma (IPD) Enkele strategieën: Altijd samenwerken (ALL-C) Altijd verzaken (ALL-D) Maar wat doen (RAND) Payoff matrix éénmalige interactie Ik De Ander C D 3 ( 3 ) ( 5 ) 5 ( 0 ) 1 ( 1 ) Oog om oog, tand om tand (Engels: tit-for-tat, TFT) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Voorbeeld van 2 Episoden van elk 10 Ronden ALL-D 5 1 TFT C C D RAND 3 5 1 TFT Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Opbrengst van rij t.o.v. kolom ALL-C ALL-D RAND TFT Gem. 3 1.5 1.9 5 1 ↓ 1 2.5 4 0.5 2.25 2.3 ↑ 1 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Met TFT nooit echt veel slechter af dan tegenstander C D C –5 D D D C D 5 C C C D C –5 D C D 5 C 2 1 Speler 2 kan één keer verzaken, maar moet bij wisseling van strategie altijd zijn winst weer inleveren. Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Succes en zwakte van TFT Kan onmogelijk uitgebuit worden Presteert nooit slechter dan tegenstander Zwakte: Kort geheugen: blijft bij D hangen in D, tenzij tegenstander C doet Presteert nooit beter dan tegenstander Tit Tat Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Andere strategieën UNFORGIVING: als tegenstander verzaakt, dan nooit meer meewerken TF2T: tit-for-two-tats: TFT, maar pas vergelden na twee opeenvolgende defects van tegenstander. PAVLOV: start met C. Wissel strategie als sucker of punishment. Werkt beter onder noise dan TFT. Meer: zie mijn master seminar over adaptive agents, onderdeel “repeated games” Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Flake: ecological world Initialisatie: Stel K strategieën vast, bv. { ALL-C, ALL-D, RAND, TFT, UNFORGIVING, PAVLOV }. (Hier K = 6.) Stel aantal ronden N vast. (Zeg, N = 200.) Reward i tegen j = Ri,j = gemiddelde opbrengst voor i tegen j over N ronden. Geef iedere strategie i een initieel aandeel Pi z.d.d. som der gewichten = 1.0. Herhaal voor E episoden: Score i = gemiddelde opbrengst voor strategie i. Pas Pi aan op basis van de gewogen score. Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Update-formule voor strategie-aandeel De score van Strategie i op tijdstip t is gelijk aan de gemiddelde interactie-opbrengst van i, gewogen naar de populatieomvang van soorten: Het aandeel van Strategie i op een volgend tijdstip t+1 is gelijk aan Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Flake: ecological world (ideal) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Flake: ecological world (noise-free) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Flake: ecological world (noise) Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Spatial iterated PD (SIPD) N.B. Het ruimtelijk IPD zoals te vinden in Netlogo ≠ het ruimtelijk IPD zoals dat beschreven is in het boek van Flake Spatial iterated PD (SIPD) Initiële populatie: 60% coöperatief, rest verzaakt. Strategie per cel: Concurreer met acht buren. Adapteer strategie van meest succesvolle buur. Kleuren: Blauw: blijft C Rood: blijft D Geel: D → C Groen: C → D Interessante parameter: beloning om samen te werken α Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Doebeli et al. (1999): continuous spatial iterated PD (CSIPD) Strategie: bepaal investering I Winst(I) = Baten(I) – Kosten(I) Alle kosten zijn voor jezelf—alle baten gaan naar je buren. Stel, als voorbeeld I1 = 0.3 (voorheen: D) I2 = 0.5 (voorheen: C) 8 buren in grid, waarvan 6 x C Baten =Def 8(1 – e(– I)) Max. winst Kosten =Def 0.7 * I Ik ( Andere 8 ) 6 x C 2 x C C 22 14 D 24 15 Investering → Dit voorbeeld geeft een discrete (= geheeltallige) versie van het Prisoner’s Dilemma Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Waardoor samenwerking? I1 < I2 Als Groen van Rood wil winnen dan moet 6B(I2) + 2B(I1) – 8C(I2) > 4B(I2) + 4B(I1) – 8C(I1) Oftewel: B(I2) – B(I1) > 4(C(I2) – C(I1)) Dit is precies het geval als B (een lineaire factor, hier: 4) harder stijgt dan C ↔ in het begin! I2 I1 I1 I2 I2 I2 I2 I2 I2 Voor exacte uitwerking zie slides master seminar adaptive agents, “real-valued spatial games” Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

Samenvatting Centraal probleem: Hoe beweeg je individuen tot samenwerken als er verleidingen zijn om te verzaken? Stag Hunt: er zijn equilibria, t.w.: nooit samenwerken, altijd samenwerken en, met gemixte strategie, soms samenwerken. Chicken: er zijn equilibria. Geen symmetrisch equilibrium voor pure strategieën, wel voor scenario’s met gemixte strategieën (!) Prisoner’s: in 2-persoon scenario is er geen Pareto-optimale gedeelde strategie. Samenwerking kan alleen ontstaan als er herhaling, ruimte, continuïteit, reputatie, vertrouwen of super-rationaliteit in het model wordt ingebouwd. Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk