STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model- en theorievorming op onderwerpen van eigen wetenschappelijke of maatschappelijke interesse Specifiek: inleiding in en kennismaking met Speltheorie Simulaties als methode van theorievorming Leertheorie
Oplossingen voor het dilemma der gevangenen Het Prisoner’s Dilemma leidt tot een uitkomst die Pareto suboptimaal is: individuele rationaliteit leidt tot collectieve irrationaliteit Drie oplossingen: - sancties [al gezien] - normen [al gezien] - herhaling van het spel We laten steeds zien: als je <sancties / normen / herhaling van het spel> toelaat, dan is de evenwichtsvoorspelling mogelijk wél Pareto-optimaal. situatie in de wereld model uitkomst van het model terugvertaling naar situatie in de wereld
Oplossingen voor het dilemma der gevangenen 1 NB de kunst is bij al dit soort modelmatige analyses te beargumenteren waarom de oplossing in de praktijk werkt. Je moet dat laten zien door te laten zien dat deze werkt in het onderliggende model. Oplossing 1: zet een straf op onwenselijk gedrag [Hobbes] (uitgevoerd door derden). Dit maakt defectie minder aantrekkelijk. <toelichting op bord> Wordt toegepast: - bij de belastingen - bij de bibliotheek - … Aannames: - defectief gedrag moet observeerbaar zijn - in Assurance Games wordt het Pareto optimale evenwicht gespeeld
Sancties op defectief gedrag Origineel Prisoner’s Dilemma Defectie kost een straf van 4 C D 3 , 3 0 , 5 5 , 0 1 , 1 C D 3 , 3 0 , 5-4 5-4 , 0 1-4 , 1-4 Resulterend spel C D 3 , 3 0 , 1 1 , 0 -3 , -3
Oplossingen voor het dilemma der gevangenen 2 Oplossing 2: Normen. Zorg dat men een ‘mentale bonus’ ervaart voor het bijdragen aan het collectief. Dit maakt cooperatief gedrag aantrekkelijker. <toelichting op bord> Aanname: Observeerbaarheid niet meer nodig Nog steeds: in assurance games wordt Pareto optimale evenwicht gespeeld Praktijk: Normen en waarden Sesamstraat
Normen: “coöperatie geeft een prettig gevoel” Origineel Prisoner’s Dilemma Coöperatie +3 C D 3 , 3 0 , 5 5 , 0 1 , 1 C D 3+3 ,3+3 0+3 , 5 5 , 0+3 1 , 1 Resulterend spel C D 6 , 6 3 , 5 5 , 3 1 , 1
Coleman schema in deze toepassing van normen Sociale condities: Al dan niet vigerende normen Sociaal verschijnsel: Productie collectieve goederen Welke aannames zijn nodig voor je op het micro-niveau begint? Zie vorige slide. Transformatie van individuele uitkomsten tot collectief gedrag? In Assurance games wordt het PO-evenwicht gespeeld Wie/wat zijn de actoren? Wat zijn hun doelen en voorkeuren? Homogene populatie actoren, doel=geld, n-actoren, simultane keuze, volledige informatie, … Handelingstheorie: speltheorie, actoren spelen hetgene in evenwicht is Tot welk individueel gedrag leidt dit? Bij sterke normen: evenwichten bij (C,C) en (D,D), maar (C,C) is Pareto optimaal. Het Coleman-bootje
Oplossingen voor het dilemma der gevangenen 3 OPLOSSING: HERHALING VAN HET SPEL [voorbeeld: The Trench warfare] Computertoernooi liet zien: Tit-for-Tat is een goede strategie in het herhaalde gevangenendilemma. Of puur theoretisch beargumenteerd: Het eindig vaak herhaalde spel alleen wederzijdse defectie is evenwicht 2. Het oneindig vaak herhaalde spel met discounting / het zich met zekere kans herhalende spel. evenwicht dat leidt tot wederzijdse coöperatie is mogelijk Robert Axelrod “The evolution of cooperation” (1984) C D 3 , 3 0 , 5 5 , 0 1 , 1
Strategieën in het herhaalde Prisoner’s Dilemma (1) Random – cooperate (and defect) with probability 50% Always Defect Always Cooperate Tit For Tat – Start with cooperating in round 1, then repeat opponent's last choice (ingediend door Anatol Rapoport) Suspicious Tit For Tat - As for Tit For Tat except it begins by defecting. Tit For Tat and Random - Repeat opponent's last choice skewed by random setting.* Naive Prober (Tit For Tat with Random Defection) - Repeat opponent's last choice (as in Tit For Tat), but sometimes probe by defecting in stead of cooperating.* Remorseful Prober (Tit For Tat with Random Defection) - Repeat opponent's last choice (as in Tit For Tat), but sometimes probe by defecting instead of cooperating. If the opponent defects in response to probing, show remorse by cooperating on the next round.*
Strategieën in het herhaalde Prisoner’s Dilemma (2) Naive Peace Maker (Tit For Tat with Random Co-operation) - Repeat opponent's last choice (ie Tit For Tat), but sometimes make peace by co-operating in lieu of defecting.* True Peace Maker (hybrid of Tit For Tat and Tit For Two Tats with Random Co-operation) - Co-operate unless opponent defects twice in a row, then defect once, but sometimes make peace by co-operating in lieu of defecting.* Grudger (Co-operate, but only be a sucker once) - Co-operate until the opponent defects. Then always defect unforgivingly. Pavlov (repeat last choice if good outcome) - If 5 or 3 points scored in the last round then repeat last choice. Adaptive - Starts with c,c,c,c,c,c,d,d,d,d,d and then takes choices which have given the best average score re-calculated after every move. Gradual - Cooperates until the opponent defects, in such case defects the total number of times the opponent has defected during the game. Followed up by two co-operations. Soft Grudger - Cooperates until the opponent defects, in such case opponent is punished with d,d,d,d,c,c. Customised strategy 1 - default setting is T=1, P=1, R=1, S=0, B=1, always co-operate unless suckered (ie 0 points scored). * Strategies with random intervention
Axelrod’s conclusies op basis van zijn computertoernooien Tit-for-Tat doet het heel goed in dit soort toernooien Dit komt doordat Tit-for-Tat de volgende eigenschappen heeft: - aardig (begint niet met defecteren) - provoceerbaar - vergevingsgezind - eenvoudig Later onderzoek heeft deze resultaten wel genuanceerd: - Tit-for-Tat wint lang niet altijd, dat is maar helemaal afhankelijk van de andere strategieën die meedoen - Aardige strategieen doen het ook lang niet altijd het beste - zie ook http://www.iterated-prisoners-dilemma.net/
Dilemma der gevangenen: algemeen kolom cooperatie defectie 3 , 3 R , R 0 , 5 S , T 5 , 0 T , S 1 , 1 P , P rij S < P < R < T (en vaak ook 2R > S + T)
<toelichting op bord> [TFT met TFT is in evenwicht als w groot genoeg is]
Oplossingen voor het dilemma der gevangenen 3 Oplossing 3: herhaling In het met zekere kans w herhaalde dilemma der gevangenen geldt het volgende: De strategieëncombinatie (altijd D, altijd D) is in evenwicht. Als w > (T-R) / (T-P) dan is de strategieëncombinatie (Tit-For-Tat , Tit-For-Tat) in evenwicht. Implicatie: als een gezamenlijke toekomst maar belangrijk/waarschijnlijk genoeg is, dan is wederzijds coöperatief gedrag mogelijk (in de zin dat het wordt ondersteund door een evenwicht). (NB hier staat dus “mogelijk”, en niet “noodzakelijk” of “altijd de juiste keuze” oid)
“Folk theorem”: welke evenwichten zijn mogelijk? Gem. uitbetaling voor speler 2 5 Evenwicht met wederzijdse cooperatie op het evenwichts-pad [als w>(5-3)/(5-1)=0.5] 3 1 Evenwicht met wederzijdse defectie op het evenwichtspad. 1 3 5 Gem. uitbetaling voor speler 1 Folk theorem zegt: Alle elementen in het rode gebied zijn evenwicht als w maar groot genoeg is! (dwz er is een strategieencombinatie te verzinnen die als gemiddelde uitbetaling een punt in het rode gebied heeft) Als Pareto-optimale evenwichten worden verkozen boven Pareto-suboptimale evenwichten voorspelling is dat alleen de evenwichten op de donkerrode “Pareto rand” voor zullen komen
Voorspellingen o.b.v. Axelrod’s herhaalde PD Strikte voorspelling: als w < (T-R)/(T-P), dan NOOIT coöperatief gedrag als w > (T-R)/(T-P), dan wordt coöperatief gedrag door een speltheoretisch evenwicht ondersteund (net zoals veel andere soorten gedrag) met w = kans op het halen van de volgende ronde en P, R en T uitbetalingen in het gevangenendilemma Iets minder strikte voorspelling hoe groter w is (hoe groter de ‘shadow of the future’), des te waarschijnlijker dat coöperatief gedrag voorkomt [coöperatief gedrag wordt makkelijker als er een grotere kans op een gezamenlijke toekomst is] hoe groter (T-R)/(T-P) is, des te onwaarschijnlijker dat coöperatief gedrag voorkomt [coöperatief gedrag wordt moeilijker als de omstandigheden in het onderliggende spel ongunstiger zijn]
Herhaling kan werken Dus: bij collectief goed problemen … … zorg voor herhaling van interactie tussen de betrokken actoren ... met een onzeker einde. samen aan een werkstuk werken etc
Bezwaren tegen “het rationele model” (zoals o.a. vaak in speltheoretische of i.h.a. In economische modellen wordt gebruikt) (Nb staat niet in de reader)
Bezwaar tegen het “strikt rationele model” Bezwaar: speltheorie is dusdanig ingewikkeld, dat het ontzettend onwaarschijnlijk is dat mensen dit bij echte beslissingen toepassen. Zo rationeel zijn mensen niet. Tegenargumenten tegen dit bezwaar: Nash evenwichten zijn (onder bepaalde voorwaarden) ‘evolutionair stabiel’. Je mag dus hopen dat over de loop van de tijd optimaal gedrag van individuen, wellicht onbewust, is ‘ingesleten’. De (minder strikte) voorspellingen komen toch aardig uit. Mensen zijn weliswaar niet volledig rationeel, maar het rationele model levert een goed basis voor uitbouw (“als we het voor rationele egoïsten geregeld krijgen, dan lukt het voor de altruïsten ook wel”) Als je aanneemt dat mensen niet volledig rationeel zijn, wat moet je dan aannemen over menselijk gedrag? [antw: de consistente irrationaliteiten]
Het “model of man” in sociaalwetenschappelijke theorieen In veel gevallen: een model waarin rationele handelingen de basis zijn (ook al klopt dat niet helemaal) is voldoende. Als blijkt dat dat toch onvoldoende is (te zien bijv omdat je voorspellingen op basis van je model niet kloppen): controleer eerst of de uitwerking van de sociale condities op de individuen misschien anders gemodelleerd kan worden. Als dat ook niet werkt, neem iets anders aan over het gedrag van individuen: neem aan dat ze rationeel zijn, maar op een wat eenvoudiger manier (bijv. ze kijken naar hun mede-actoren, en doen vervolgens na wat succesvolle mede-actoren doen). Als dat niet werkt, neem dan aan dat mensen irrationeel zijn, maar neem dan wel aan dat ze allemaal op dezelfde manier irrationeel zijn. NB voor dit laatste is het nodig te weten waar mensen typisch (=op consistente wijze) afwijken van de voorspellingen van het rationele model, en daar zullen we een paar voorbeelden van langslopen.
Afwijkingen van het rationele model - 1 Prospect Theory (Kahneman & Tversky) Wat heb je liever: A 300 B 400 met kans 75% (anders 0) C 300 verlies D 400 verlies met kans 75% (anders 0) Meeste mensen: liever A dan B, maar … liever D dan C. Mensen zijn risicomijdend voor winsten, risicozoeken voor verliezen.
Afwijkingen van het rationele model - 2 Framing (Kahneman & Tversky) Er zal een ziekte uitbreken die naar verwacht 600 mensen zal doden. Er zijn twee mogelijke ‘plannen van aanpak’. A 200 mensen zijn te redden B een kans van 1 op 3 dat 600 mensen zullen worden gered, en een kans van 2 op 3 dat geen mensen zullen worden gered. = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = Idem, maar nu met de volgende ‘plannen van aanpak’: C 400 mensen zullen zeker sterven D een kans van 1 op 3 dat niemand sterft, en een kans van 2 op 3 dat 600 mensen sterven [72% prefereert A] [22% prefereert C]
Afwijkingen van het rationele model - 3 The conjunction effect Mark is 34 jaar oud. Hij is intelligent, maar niet erg spontaan, hij gedraagt zich enigszins dwangmatig. Op school was hij goed in de beta-vakken maar zwakker in talen. Hij heeft weinig echte vrienden en communiceert wat moeilijk. Mark ... 1 is huisarts, en heeft als hobby pokeren 2 is architect 3 is programmeur 4 houdt van Star Wars 5 heeft als hobby wildwatervaren 6 is journalist 7 is programmeur en houdt van Star Wars 8 houdt van bergbeklimmen
Afwijkingen van het rationele model - 4 Base-rate fallacy 2% van de mensen heeft ziekte Z. Als je inderdaad ziekte Z hebt, geeft een bepaalde test een positief resultaat met kans 90%. Als je ziekte Z niet hebt, geeft de test een positief resultaat met kans 5%. Je wordt getest; het resultaat is positief. Wat is de kans dat je de ziekte Z hebt? Test pos. Test neg. Ziek 18 2 20 Niet ziek 49 931 980 Dus: als je weet dat je positief bent getest, dan is de kans dat je de ziekte hebt 18 / (18 + 49) = 27% NB Die 2% en die 5% maken nogal uit voor het resultaat!
Base rate neglect - vervolg Verwarren van Kans(A|B) met Kans(B|A) Voorbeeld: er is een moord gepleegd. Het enige bewijsmateriaal is DNA, gevonden op de plaats van de misdaad. Het resultaat laat een match zien met jouw DNA. De kans dat iemand anders een match heeft met het DNA bewijsmateriaal is 1 op 100.000. Wat is de kans dat je de dader bent? Stel: de moord was gepleegd in Eindhoven (700.000 inwoners). Die komen allemaal in aanmerking om de dader te zijn. Zeven daarvan ‘matchen’ op hetzelfde DNA materiaal. De kans dat jij het hebt gedaan is daarom niet meer dan 1 op 7. Als er verder geen bewijsmateriaal is, zou je moeten worden vrijgesproken. Verwisseling: Kans (DNA match | jij bent dader) Kans (jij bent dader | DNA match)
Afwijkingen van het rationele model - 5 De Wason selectie taak (oorzaak en gevolg) Hypothese: als je leidt aan paranoia, teken je gezichten met in verhouding heel grote ogen Er zijn kaartjes met aan de ene kant de diagnose (“paranoia” of iets anders) en aan de andere kant een tekening van een gezicht, getekend door de betreffende patient. Er liggen vier kaartjes: A een kaartje met “paranoia” B een kaartje met “niet paranoia: normaal” C een kaartje met een gezicht met grote ogen D een kaartje met een gezicht met normale ogen Vraag: welke kaartjes moet je omdraaien om de hypothese te toetsen? Resultaat: men kiest voor A, soms C, soms B, zelden D. Iha: mensen zoeken naar bevestigend feitenmateriaal.
Afwijkingen van het rationele model – 6 Overconfidence (Fischhoff, Slovic, Lichtenstein, 1977) Test: Trivial Pursuit achtige vragen, waarbij men per vraag behalve het antwoord aangeeft hoe zeker men is van het antwoord Algemeen: te veel vertrouwen in eigen kunnen “debiasing” is bijna onmogelijk Te veel vertrouwen speelt sterker bij personen met – in principe – kennis van het onderwerp!
Afwijkingen van het rationele model - 7 Anchoring Draai roulettewiel, kijk waar het balletje op valt, en lees dit voor. Vraag aan respondent (bijvoorbeeld): hoeveel Afrikaanse staten zitten er in de Verenigde Naties? Hoe hoger het roulettenummer was, des te hoger de antwoorden (!).
Conclusie: afwijkingen van het rationele model Als je een situatie modelmatig wilt beschrijven: blijf af van afwijkingen van het rationele model zolang het kan Als je toch afwijkingen van het rationele model mee wilt modelleren: neem dan gedocumenteerde afwijkingen (zoals hiervoor genoemd). nb er staan een paar voorbeelden op de website van onderzoek dat juist gebruik maakt van “irrationeel gedrag” (Prospect theory)
< zie verder uitleg bord > Terug naar rationeel gedrag: “paniek in het theater” (Coleman, zie reader) Bij brand in een theater krijg je soms paniek (iedereen rent tegelijkertijd naar de uitgang), soms niet. Wanneer krijg je paniek, en wanneer niet? nb dit voorbeeld laat zien dat irrationeel ogend gedrag te begrijpen kan zijn als rationeel gedrag “in vermomming” < zie verder uitleg bord >
Simulatiemodellen: voors en tegens Resultaten van simulaties moeten actief onderzocht (“er komt niet één antwoord uit”) … … en dat is typisch lastig omdat bij een beetje model er zo veel parameters zijn die kunnen variëren. Reproduceerbaarheid is lastiger dan bij wiskundige modellen. Tests voor robuustheid zijn nodig (je wilt juist niet dat je conclusie sterk afhangt van een irrelevant ogende aanname) ‘Externe validiteit’ is, zoals bij ieder model, altijd betwistbaar (“de werkelijkheid is ingewikkelder, dus wat heb ik aan zo’n model waar niet alles in zit”) NB Oplossing hiervoor is simpelweg om de implicaties van de modellen met echte gegevens uit de wereld te toetsen.