De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Inleiding adaptieve systemen Competitie en coöperatie.

Verwante presentaties


Presentatie over: "Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Inleiding adaptieve systemen Competitie en coöperatie."— Transcript van de presentatie:

1 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Inleiding adaptieve systemen Competitie en coöperatie

2 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Inhoud Twee-persoons competitieve symmetrische niet- nulsom spelen op basis van volledige informatie met simultane zetten en kwantitatieve beloningen –Prisoner’s Dilemma( PD ) –Stag Hunt( SH ) –Chicken( CK ) Begrippen: Pareto-optimale oplossing, Nash- evenwicht Uitbreidingen van het Prisoner’s Dilemma –Geïtereerd( IPD ) –Geïtereerd evolutionair( IEPD ) –Geïtereerd ruimtelijk evolutionair( SIEPD ) –Geïtereerd continu ruimtelijk evolutionair( CSIEPD )

3 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Coöperatieve spelen Agent 2 Agent 1 a1a1 a2a2 a3a3 a1a1 11–300 a2a2 76 a3a3 005 Doel: coördinatie

4 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Competitieve spelen Agent 2 Agent 1 a1a1 a2a2 a3a3 a1a1 11, 11–30, 10, 1 a2a2 1, –307, 76, 0 a3a3 1, 00, 65, 5 Doel: eigen winst- maximalisatie

5 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Competitieve spelen Wie doet de vaat? Gedeelde koffiepot Meeliften in groepswerk Wielrenners in een kopgroep NIMBY problematiek (windmolenpark) Vangstquotum in de visserij Handelsoorlog Wapenwedloop

6 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Prisoner’s dilemma (Speler B) (Mondje dicht)(Verklikken) Speler A Mondje dicht Taakstraf (Taakstraf) Levenslang (Vrij en bescherming) Verklikken Vrij en bescherming (Levenslang) Straf (Straf)

7 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Prisoner’s dilemma (Speler B) (Cooperate)(Defect) Speler A Cooperate Taakstraf (Taakstraf) Levenslang (Vrij en bescherming) Defect Vrij en bescherming (Levenslang) Straf (Straf)

8 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Prisoner’s dilemma (Speler B) (Cooperate)(Defect) Speler A Cooperate3 (3)0 (5) Defect5 (0)1 (1)

9 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Koffiezet dilemma ik( de ander ) is sociaallift mee ben sociaal altijd koffie, soms corvee ik doe alle werk, hij profiteert lift meeik profiteer, hij doet corvee niemand heeft meer koffie zo Drink je het laatste kopje uit de kan? Zet even nieuwe! 3 (3)1 (5) 5 (1)0 (0)

10 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Hetzelfde dilemma? Koffie-dilemma (B) (C)(D) AC3 ( 3 )1 ( 5 ) D5 ( 1 )0 ( 0 ) Prisoner’s dilemma (B) (C)(D) AC3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 ) Dilemma? (B) (C)(D) ACR ( R )S ( T ) DT ( S )P ( P ) T = Tempation R = Reward P = Penalty S = Sucker T = Tempation R = Reward S = Sucker P = Penalty

11 en en of Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Hoeveel soorten dilemma’s? Dilemma? (B) (C)(D) ACR ( R )S ( T ) DT ( S )P ( P ) In principe zijn er 4! = 24 dilemma’s Alleen lastig als… Reward > Sucker Temptation > Penalty Temptation > Reward Penalty > Sucker I prefer the other to cooperate …but he has motivation to defect

12 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Welke strategie kies je? Jij bent speler Speler 1. Je speelt één keer, zonder vooraf te (kunnen of willen) communiceren met Speler 2. Wat zou je doen als je wist dat Speler 2 samenwerkt (C)? Wat zou je doen als je wist dat Speler 2 verzaakt (D)? Dus wat zou je i.h.a. doen? Wat zou Speler 2 i.h.a. doen? Zou het uitmaken als Speler 1 en Speler 2 van te voren mochten communiceren? Speler 2 Spe- ler 1 CD C3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 )

13 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Pareto-optimale oplossing Een oplossing heet Pareto-optimaal als er geen betere oplossing is die de ander niet schaadt A( B ) ( C )( D ) C3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 )

14 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Nash-evenwicht Een gecombineerde strategie is een Nash-evenwicht als geen van de spelers reden heeft om eenzijdig een andere keus te maken A( B ) ( C )( D ) C3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 )

15 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Prisoner’s dilemma Het Prisinor’s dilemma heeft één Nash-evenwicht… …maar dat is niet Pareto-optimaal Toch is het niet echt een dilemma: Beide spelers kiezen D

16 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Normaalvorm (= generieke 2x2 matrix) CC: we werken samen (Reward payoff, R) DC: ik verzaak, de ander is een sukkel (Temptation payoff, T) CD: ik ben coöperatief, de ander verzaakt (Sucker payoff, S) DD: we verzaken beiden (Penalty payoff, P) Je krijgt verschillende spelen als je gaat variëren met P, R, S, T Naam van het spel ( Speler B ) ( C )( D ) Spe- ler A CR ( r )S ( t ) DT ( s )P ( p )

17 Chicken game

18 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Chicken Ook wel: “sway or dare” DC: ik rij rechtdoor, de ander niet CC: we wijken beiden uit CD: ik wijk uit, de ander rijdt rechtdoor DD: we rijden beiden rechtdoor

19 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Lijkt Chicken op Prisoner of Koffie? Koffie-dilemma (B) (C)(D) AC3 ( 3 )1 ( 5 ) D5 ( 1 )0 ( 0 ) Prisoner’s dilemma (B) (C)(D) AC3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 ) T = Tempation R = Reward P = Penalty S = Sucker T = Tempation R = Reward S = Sucker P = Penalty Chicken is als Koffie, want doodgaan is nog net wat erger dan “Chicken” genoemd worden

20 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Snowdrift DC: ik blijf zitten, de ander ruimt sneeuw CC: we ruimen beiden sneeuw CD: ik ruim sneeuw, de ander niet DD: we ruimen beiden geen sneeuw (en vriezen dood) Ook hier geldt weer: T > R > S > P. Dus identiek aan Chicken en Koffie

21 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Ontsnapte wielrenner terughalen DC: de ander haalt groen terug en terwijl hij dat doet, ga ik in z’n wiel zitten CC: we halen hem samen terug CD: ik haal hem terug, met die ander in m’n wiel (en verminder zo m’n winstkansen) DD: niemand haalt iemand terug (en we verliezen allebei de wedstrijd) Ook hier geldt weer: T > R > S > P. Dus identiek aan Chicken Jij Je con- current

22 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Stag Hunt (Hert of haas) CC: we jagen samen op een hert DC: ik jaag op een haas (jij vruchteloos op een hert) DD: we jagen beiden op een haas CD: jij jaagt op een haas (ik vruchteloos op een hert) Claude Monet. De Jacht (1876)

23 Stag Hunt (Hert of haas) ik( de ander ) doet meepakt de haas doe mee samen een groot hert! ik heb niks, hij eet haas pak de haas ik eet haas, hij heeft niks samen een haasje. 5 (5)0 (3) 3 (0)1 (1) R = Reward T = Tempation P = Penalty S = Sucker Prisoner T = Tempation R = Reward P = Penalty S = Sucker Koffie T = Tempation R = Reward S = Sucker P = Penalty

24 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Samen uit, samen thuis CC: we komen allemaal DC: ik zeg af, de anderen komen DD: we zeggen allemaal af CD: ik kom, de anderen zeggen af Hier geldt weer: R > T > P > S. Dus: Stag Hunt

25 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Man: DC: we gaan samen naar voetbal CD: we gaan samen naar ballet DD: ik ga naar voetbal, jij gaat naar ballet CC: ik ga naar ballet, jij gaat naar voetbal Battle of the sexes

26 ik( de ander ) doet mij plezierdoet eigen zin doe jou een plezier dubbel pechsamen naar ballet doe wat ik zelf wil samen naar voetbal ieder z’n ding 0 (0)2 (3) 3 (2)1 (1) T = Tempation S = Sucker P = Penalty R = Reward

27 Battle of the sexes ik( de ander ) doet mij plezierdoet eigen zin doe jou een plezier dubbel pechsamen naar ballet doe wat ik zelf wil samen naar voetbal ieder z’n ding 0 (0)1 (3) 3 (1)2 (2) T = Tempation S = Sucker P = Penalty R = Reward T = Tempation P = Penalty S = Sucker R = Reward

28 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Overzicht van 2x2 competitief Battle of the sexes Temptation Penalty/ /Sucker Reward ( C )( D ) C0 ( 0 )2 ( 3 ) D3 ( 2 )1 ( 1 ) Stag Hunt Reward Temptation Penalty Sucker ( C )( D ) C5 ( 5 )0 ( 3 ) D3 ( 0 )1 ( 1 ) Chicken Temptation Reward Sucker Penalty ( C )( D ) C3 ( 3 )1 ( 5 ) D5 ( 1 )0 ( 0 ) Prisoner’s dilemma Temptation Reward Penalty Sucker ( C )( D ) C3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 )

29 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Nash evenwichten Battle of the sexes Temptation Penalty/ /Sucker Reward ( C )( D ) C0 ( 0 )2 ( 3 ) D3 ( 2 )1 ( 1 ) Stag Hunt Reward Temptation Penalty Sucker ( C )( D ) C5 ( 5 )0 ( 3 ) D3 ( 0 )1 ( 1 ) Chicken Temptation Reward Sucker Penalty ( C )( D ) C3 ( 3 )1 ( 5 ) D5 ( 1 )0 ( 0 ) Prisoner’s dilemma Temptation Reward Penalty Sucker ( C )( D ) C3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 )

30 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Nash evenwichten Pareto-optimaal Battle of the sexes Temptation Penalty/ /Sucker Reward ( C )( D ) C0 ( 0 )2 ( 3 ) D3 ( 2 )1 ( 1 ) Stag Hunt Reward Temptation Penalty Sucker ( C )( D ) C5 ( 5 )0 ( 3 ) D3 ( 0 )1 ( 1 ) Chicken Temptation Reward Sucker Penalty ( C )( D ) C3 ( 3 )1 ( 5 ) D5 ( 1 )0 ( 0 ) Prisoner’s dilemma Temptation Reward Penalty Sucker ( C )( D ) C3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 )

31 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Nash evenwichten Pareto-optimaal Battle of the sexes Temptation Penalty/ /Sucker Reward ( C )( D ) C0 ( 0 )2 ( 3 ) D3 ( 2 )1 ( 1 ) Stag Hunt Reward Temptation Penalty Sucker ( C )( D ) C5 ( 5 )0 ( 3 ) D3 ( 0 )1 ( 1 ) Chicken Temptation Reward Sucker Penalty ( C )( D ) C3 ( 3 )1 ( 5 ) D5 ( 1 )0 ( 0 ) Prisoner’s dilemma Temptation Reward Penalty Sucker ( C )( D ) C3 ( 3 )0 ( 5 ) D5 ( 0 )1 ( 1 ) tragedy

32 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Tragedy of the commons Meerdere deelnemers + indirecte interactie, bv. middels gedeelde reserves. Voorbeeld: overbevissing Als iedereen zich aan het visquotum houdt is er niks aan de hand ( R ) Verleiding ( T ): jij houd je er, als één van de weinigen, niet aan Sukkel ( S ): jij houd je er, als één van de weinigen, wel aan Penalty ( P ): iedereen heeft lak aan het quotum → zee leeg

33 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Gemixte strategie Stel, speler A besluit C met kans p te spelen. We zeggen dan dat A volgens een gemixte strategie met parameter p speelt. Kortweg: de strategie van A is p. Evenzo noteren we een gemixte strategie van B als q. Vraagstuk: voor welke paren van kansen vormt (p, q) een Nash-evenwicht? p 1 – p q 1 – q

34 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Pr B (C) is bekend  Stel, A weet dat B met kans q actie C speelt, i.e., Pr B (C) = q  Wanneer wordt het voor A interessant om samen te werken?  Antwoord: als en slechts als: Payoff A ( C | Pr B (C) = q ) > Payoff A ( D | Pr B (C) = q )  Als en slechts als: qR + (1 – q)S > qT + (1 – q)P  Als en slechts als: q > (P – S)/(R – T + P – S), als R – T + P – S > 0 q < (P – S)/(R – T + P – S), als R – T + P – S < 0 S > P, anders A( B ) CD CR ( r )S ( t ) DT ( s )P ( p )

35 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Nash-evenwicht bij gemixte strategie Neem aan dat 0 < R – T + P – S < 1 In dat geval zagen we dat A –Beter kan samenwerken als q > (P – S)/(R – T + P – S) –Beter kan verzaken als q < (P – S)/(R – T + P – S) –Keuze er niet toe doet als q = (P – S)/(R – T + P – S) Hetzelfde geldt voor B, maar dan symmetrisch p q

36 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Ik De Ander Stag hunt Drie Nash-evenwichten, waarvan één gemixt 4 ( 4 ) 1 ( 3 ) 3 ( 1 ) 2 ( 2 )

37 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Ik De Ander Prisoner’s dilemma 0 ( 5 ) 3 (3) 1 (1) Eén Nash-evenwicht, niet gemixt

38 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Ik De Ander Chicken (Snowdrift game) -5 ( -5 ) 0 ( 0 ) -1 ( 1 ) 1 ( -1 ) Drie Nash-evenwichten, waarvan één gemixt

39 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Ik De Ander Battle of the sexes 0 ( 0 ) 1 ( 1 ) 3 ( 2 ) 2 ( 3 ) Drie Nash-evenwichten, waarvan één gemixt

40 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Variaties op het Prisoner’s Dilemma

41 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Variaties Het herhaalde Prisoner’s Dilemma (Eng.: Iterated PD, IPD) Een evolutionaire variant van het IPD (EIPD) Een ruimtelijk- evolutionaire variant van het IPD (SEIPD)

42 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Iterated Prisoner’s Dilemma (IPD) Enkele strategieën: Altijd samenwerken (ALL-C) Altijd verzaken (ALL-D) Maar wat doen (RAND) Oog om oog “tit for tat” (TFT) Payoff matrix éénmalige interactie IkDe Ander CD C3( 3 )0( 5 ) D5( 0 )1( 1 )

43 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Voorbeeld van 2 Episoden van elk 10 Ronden DDDDDDDDDD ALL-D TFT CDDDDDDDDD CCCDDCCCDC RAND TFT CCCCDDCCCD

44 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Met TFT nooit echt veel slechter af dan tegenstander C C 0 C C 0 D C –5 D D 0 D D 0 D D 0 C D 5 C C 0 C C 0 C C 0 D D 0 C D 5 C C 0 D C Speler 2 kan één keer verzaken, maar moet bij wisseling van strategie altijd zijn winst weer inleveren. 2 1

45 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Andere strategieën UNFORGIVING: als tegenstander verzaakt, dan nooit meer meewerken TF2T: tit-for-two-tats: als TFT, maar pas vergelden na twee opeenvolgende defects van tegenstander. PAVLOV: start met C. Wissel strategie als tegenstander verzaakt

46 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Toernooi Axelrod (1984) organiseerde toernooi tussen ingezonden strategieën And the winner was… Tit For Tat

47 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Succes en zwakte van TFT Succes: Kan onmogelijk uitgebuit worden Presteert nooit slechter dan tegenstander Zwakte: Kort geheugen: blijft bij D hangen in D, tenzij tegenstander C doet Presteert nooit beter dan tegenstander Tit Tat

48 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Flake: ecological world Initialisatie: Stel K strategieën vast, bv. { ALL-C, ALL-D, RAND, TFT, UNFORGIVING, PAVLOV }. (Hier K = 6.) Stel aantal ronden N vast. (Zeg, N = 200.) Reward i tegen j = R i,j = gemiddelde opbrengst voor i tegen j over N ronden. Geef iedere strategie i een initieel aandeel P i z.d.d. som der gewichten = 1.0. Herhaal voor E episoden: Score i = gemiddelde opbrengst voor strategie i. Pas P i aan op basis van de gewogen score.

49 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Update-formule voor strategie-aandeel De score van Strategie i op tijdstip t is gelijk aan de gemiddelde interactie-opbrengst van i, gewogen naar de populatieomvang van soorten: Het aandeel van Strategie i op een volgend tijdstip t+1 is gelijk aan

50 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Flake: ecological world (ideal)

51 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Flake: ecological world (noise-free)

52 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Flake: ecological world (noise)

53 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Spatial iterated PD (SIPD) Initiële populatie: 60% coöperatief, rest verzaakt. Strategie per cel: 1.Concurreer met acht buren. 2.Adapteer strategie van meest succesvolle buur. Kleuren: –Blauw: blijft C –Rood: blijft D –Geel: D → C –Groen: C → D Interessante parameter: beloning om samen te werken α N.B. Het ruimtelijk IPD zoals te vinden in Netlogo ≠ het ruimtelijk IPD zoals dat beschreven is in het boek van Flake

54 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Doebeli et al. (1999): continuous spatial iterated PD (CSIPD) Strategie: bepaal investering I Winst(I) = Baten(I) – Kosten(I) Alle kosten zijn voor jezelf—alle baten gaan naar je buren. Stel, als voorbeeld –I 1 = 0.3 (voorheen: D) –I 2 = 0.5 (voorheen: C) –8 buren in grid, waarvan 6 x C Baten = Def 8(1 – e (– I) ) Ik( Andere 8 ) 6 x C2 x C C2214 D2415 Dit voorbeeld geeft een discrete (= geheeltallige) versie van het Prisoner’s Dilemma Kosten = Def 0.7 * I Max. winst Investering →

55 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk

56 Waardoor samenwerking? I 1 < I 2 Als Groen van Rood wil winnen dan moet 6B(I 2 ) + 2B(I 1 ) – 8C(I 2 ) > 4B(I 2 ) + 4B(I 1 ) – 8C(I 1 ) Oftewel: B(I 2 ) – B(I 1 ) > 4(C(I 2 ) – C(I 1 )) Dit is precies het geval als B (een lineaire factor, hier: 4) harder stijgt dan C ↔ in het begin! I1I1 I1I1 I1I1 I1I1 I2I2 I2I2 I2I2 I2I2 I2I2 I2I2 I1I1 I2I2 Voor exacte uitwerking zie slides master seminar adaptive agents, “real-valued spatial games”slides master seminar adaptive agents, “real-valued spatial games”

57 Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Samenvatting Centraal probleem: Hoe beweeg je individuen tot samenwerken als er verleidingen zijn om te verzaken? Stag Hunt: er zijn equilibria, t.w.: nooit samenwerken, altijd samenwerken en, met gemixte strategie, soms samenwerken. Chicken: er zijn equilibria. Geen symmetrisch equilibrium voor pure strategieën, wel voor scenario’s met gemixte strategieën (!) Prisoner’s: in 2-persoon scenario is er geen Pareto- optimale gedeelde strategie. Samenwerking kan alleen ontstaan als er herhaling, ruimte, continuïteit, reputatie, vertrouwen of super-rationaliteit in het model wordt ingebouwd.


Download ppt "Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Inleiding adaptieve systemen Competitie en coöperatie."

Verwante presentaties


Ads door Google