Download de presentatie
GepubliceerdHugo Aalderink Laatst gewijzigd meer dan 10 jaar geleden
1
STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model- en theorievorming op onderwerpen van eigen wetenschappelijke of maatschappelijke interesse Specifiek: inleiding in en kennismaking met Speltheorie Leertheorie Simulaties als methode van theorievorming
2
Macro vragen en micro oplossingen
Het Coleman-bootje Sociale condities Sociale verschijnselen Welke aannames zijn nodig voor je op het micro-niveau begint? Hoe transformeren de individuele uitkomsten tot collectief gedrag? Voorbeeld: speltheorie Wie/wat zijn de actoren? Wat zijn hun doelen en voorkeuren? Tot welk individueel gedrag leidt dit? Handelingstheorie
3
Opdracht voor volgende keer (“semantische theorievorming”)
Gebruik het Coleman-schema om te komen tot een theoretische reconstructie van een zelf uitgezocht sociologisch probleem. + Kies een sociologisch probleem aan de hand van een “specifieke observatie” op internet of in de krant + Geef aan de hand van het Coleman-schema een verklaring voor het probleem ++ wat zijn de sociale condities en de sociale verschijnselen? ++ wie zijn de relevante actoren, wat streven ze na, en op welke manieren kunnen ze dat doen? ++ hoe leidt dat tot individuele effecten? ++ hoe leiden individuele effecten tot collectieve effecten? + Geef aan wat de toetsbare implicaties zijn die uit de theorie volgen + Maak de theorie (nog) algemener: wat voor implicaties volgen uit de theorie op een ander gebied dan het specifiek onderzochte [inspiratie: Lave & March]
4
Soorten handelingstheorieen [vb:matching]
“Individual decision making”: actoren bepalen hun gedrag in isolatie Zonder rekening te houden met anderen (bijv. actoren op schaakbord bij Pareto’s Law, basale leermodellen) Door het gedrag van anderen als gegeven te zien "Lokale interdependentie": actoren bepalen hun gedrag op basis van wat hun naaste buren doen (zie bijv. de modellen van Schelling in komende weken). Speltheorie (“Game theory”): actoren bepalen hun gedrag, rekening houdend met keuzes van anderen, terwijl ze weten dat die zelf ook weer rekening houden met de keuzes … interdependente keuze (bijv. gedrag in Boudon’s loterij – zie vorige week)
5
Speltheorie: historie
Wetenschappelijk begonnen met Von Neumann en Morgenstern (1944: Theory of games and economic behavior) 1950: John Nash (evenwichtsconcept). Nobelprijs voor zijn werk in 1994, samen met Harsanyi en Selten. Nash Crowe
6
Voorbeeld: het “dilemma der gevangenen”
Aannames gelijktijdige keuze Complete informatie Eenmalig spel kolom zwijgen bekennen -1 , -1 -9 , 0 0 , -9 -3 , -3 rij (0,-9) = ‘rij’ krijgt 0, ‘kolom’ krijgt -9
7
“dilemma der gevangenen” met positieve getallen
kolom 1 vinger (‘cooperatie’) 2 vingers (‘defectie’) 1 vinger (‘cooperatie’) 15 , 15 0 , 30 2 vingers (‘defectie’) 30 , 0 5 , 5 rij (30,0) = ‘rij’ krijgt 30, ‘kolom’ krijgt 0
8
Vraag: wat doen egoistische, rationele actoren in dit eenmalige spel?
Aannames: Actoren hebben egoïstische doelen … … en proberen deze op consistente en consequente (=rationele) wijze te verwezenlijken Onder deze omstandigheden (gelijktijdige keuze, complete informatie, eenmalig spel), is de speltheoretische voorspelling dat rationele egoisten kiezen voor “bekennen” / “2 vingers” WAAROM EIGENLIJK?
9
Speltheoretische begrippen
Een plaatje zoals zojuist is een spel in normaalvorm (“normal form”). Dit i.t.t. de zgn “extensive form”. Een strategie is een regel die beschrijft hoe een actor zich zal gedragen in alle mogelijke situaties die in een spel voor kunnen komen. Een strategie is een dominante strategie voor actor i indien deze strategie voor actor i meer oplevert dan andere strategieen, ongeacht de strategiekeuzes van de andere spelers Een combinatie van strategieen is in Nash-evenwicht indien – gegeven de strategiekeuzes van de anderen – geen enkele actor een prikkel heeft om eenzijdig zijn eigen strategie te veranderen.
10
Uitwerking bij het dilemma der gevangenen
Strategie = “kies 1 vinger” of “kies 2 vingers” De strategie “kies 2 vingers” is een dominante strategie, want wat de strategie van de ander ook is, “kies 2 vingers” levert altijd meer op. Bovendien: de strategieëncombinatie (“kies 2 vingers”, “kies 2 vingers”) is in evenwicht. Extra aanname: als er strategieëncombinaties in evenwicht zijn, dan zal één van die strategieëncombinaties worden gekozen. Gevolg: als er maar één strategieëncombinatie in evenwicht is, dan is dat de voorspelling voor gedrag Als er meer strategieëncombinaties in evenwicht zijn, dan is het nog onduidelijk wat de precieze voorspelling is. In ieder geval zal het één van de evenwichten worden.
11
De paradox van het gevangenendilemma
Definitie: een strategieëncombinatie is Pareto-optimaal, als er NIET een andere strategieëncombinatie is waarbij tenminste één actor erop vooruit gaat, en de rest in ieder geval niet achteruit. Een spel waarbij individueel rationeel gedrag leidt tot een uitkomst die niet Pareto-optimaal is, noemen we een sociaal dilemma. Conclusie: het Prisoner’s Dilemma is een sociaal dilemma. Daarmee is het direct een typisch sociologisch model: individueel redelijk gedrag leidt tot collectieve irrationaliteit onbedoelde gevolgen van gedrag
12
SPELTHEORIE: voorbeeldspelen
De “chicken game”: jezelf aan banden leggen kan voordelig zijn kolom Blijf (‘stay’) Wijk uit (‘swerve’) -50 , -50 20 , -10 Wijk uit (‘swerve’) -10 , 20 -5 , -5 rij
13
kolom rij The assurance game 60 , 60 10 , 50 50 , 10 20 , 20
cooperatie defectie 60 , 60 10 , 50 50 , 10 20 , 20 rij Twee evenwichten in zuivere strategieen; één daarvan Pareto-optimaal, één niet. Evenwichtsverfijning in dit geval zal het de Pareto-optimale wel worden.
14
“The battle of the sexes”
vrouw Boksen Ballet 5 , 2 0 , 0 2 , 5 man In coördinatievraagstukken heb je aan speltheorie niet veel
15
Tennis: gemengde strategieen
Speler 2 Anticipeer backhand Anticipeer forehand Naar backhand 60 , 40 90 , 10 Naar forehand 80 , 20 40 , 60 Speler 1 NB1 Dit is een zogenaamd “nul-som spel”. NB2 Evenwichten?
16
Het Nash existence theorem (Nash, 1950)
Stelling: Als ieder van de n spelers in een spel een eindig aantal (zuivere) strategieën heeft, dan heeft het spel minimaal één Nash evenwicht, dat eventueel ligt in gemengde strategieën. Een gemengde strategie is een kansverdeling over de beschikbare strategieën. Bijv (vorige slide): de serveerder serveert naar de forehand in 40% van de gevallen, en naar de backhand in 60% van de gevallen. NB1 Het aantal evenwichten, als je de gemengde meetelt, is altijd oneven! NB2 Het belang van Nash evenwichten zit hem niet alleen in het voorspellen van gedrag. Ook evolutionaire argumenten spelen een rol.
17
Tennisvoorbeeld: gemengde strategieen
Anticipeer backhand q Anticipeer forehand 1-q Naar backhand p 60 , 40 90 , 10 Naar forehand 1-p 80 , 20 40 , 60 Je ziet: Gedrag van de serveerder wordt bepaald door uitbetalingen van ontvanger Als die (80,20) een (90,10) wordt, dan geldt q=0,63<0,71 en p=0,63>0,57. We bekijken eerst het gedrag van speler 1. Die speelt naar backhand met kans p en naar de forehand met kans 1-p. De ontvanger anticipeert backhand met kans q en forehand met kans 1-q. Opbrengst bij naar backhand: 60 q + 90 (1-q) = 90 – 30 q Opbrengst bij naar forehand: 80 q + 40 (1-q) = q Deze twee moeten in evenwicht gelijk zijn in evenwicht geldt q = 5/7 = 0,71 We bekijken nu het gedrag van speler 2. Opbrengst bij backhand anticiperen: 40 p + 20 (1-p) = p Opbrengst bij forehand anticiperen: 10 p + 60 (1-p) = p Deze twee moeten in evenwicht gelijk zijn in evenwicht geldt Kans op naar backhand serveren van speler 1: p = 4/7 = 0,57
18
Oorsprong: militaire doeleinden
“The battle of the Bismarck sea (1943)”: stuur troepen naar Nieuw-Guinea via de korte Noordroute of de langere Zuidroute (Imamura). En: stuur vliegtuigen naar de Noordroute of de Zuidroute (Kenney). Aannames: Troepen niet op te delen Gelijktijdige keuze Complete informatie Eenmalig “spel” boten van Imamura Noord Zuid 3 , -3 -1 , 1 -2 , 2 vliegtuigen van Kenney
19
Andere soorten spelen Sequentieel ipv simultaan: Extensive form games Tekst + formulevorm: Auctions n spelers ipv 2: het n-persoons Prisoner's Dilemma Herhaald ipv eenmalig: Repeated games
20
Andere manieren om interactie te representeren (1)
In extensive form. Vooral gebruikt bij sequentiële spelen. Voorbeeld: Trust Game 1 Vertrouwen geven Geen vertrouwen geven 2 Vertrouwen misbruiken Vertrouwen honoreren (10, 10) (0, 80) (40, 40)
21
Andere manieren om spelen te representeren (2)
In tekst + formule vorm. Voorbeeld: (NB Boudon’s loterij was ook een voorbeeld) “Second-price auctions” of “Vickrey auctions” Er zijn n bieders in een veiling die ieder één bod uitbrengen, in het geheim, aan de verkoper. De waarde van het object voor de bieder i is w(i). Degene met het hoogste bod krijgt het object, maar betaalt hiervoor het op één na hoogste bod. Laat zien: “de waarheid spreken”, dwz iedere bieder brengt een bod w(i) uit, is een evenwicht. Laat zien: dat de biedingen geheim zijn en niet openbaar, maakt een wezenlijk verschil. Laat zien: in first-price auctions is de waarheid spreken niet een dominante strategie
22
Terug naar het dilemma der gevangenen
kolom 1 vinger (‘cooperatie’) 2 vingers (‘defectie’) 1 vinger (‘cooperatie’) 15 , 15 0 , 30 2 vingers (‘defectie’) 30 , 0 5 , 5 rij Op dezelfde wijze valt een n-persoons dilemma te construeren: Er zijn n spelers, ieder kiest uit ‘bijdragen’ of ‘niet bijdragen’. Bijdragen kost 10 eenheden. De opbrengst voor iemand die bijdraagt is * B – 10 De opbrengst voor iemand die niet bijdraagt is 15 * B Evenwicht?
23
Collectieve goederen: n-persoons PDs
Het probleem zit hem in dat de kosten op het individu neerkomen, terwijl de baten worden verdeeld over iedereen. “Free riders gedrag” Real life voorbeelden Milieubewust gedrag vs niet (voor zowel individuen als bedrijven) - Overbevissing vs niet, uitstootreductie vs niet, … - Belasting betalen vs ontduiken Bewapening verminderen vs niet Schoonmaken/houden van gemeenschappelijke ruimtes Samenwerking tussen bedrijven (patenten, innovaties) … [hier valt echt een eindeloze rij te verzinnen] Probleem Hoe kunnen we free-riders gedrag (een Pareto suboptimale uitkomst) voorkomen?
24
Oplossingen voor het dilemma der gevangenen
Het Prisoner’s Dilemma leidt tot een uitkomst die Pareto suboptimaal is. Drie oplossingen: - sancties - normen - herhaling van het spel We zullen steeds laten zien: als je <sancties / normen / herhaling van het spel> toelaat, dan is de evenwichtsvoorspelling mogelijk wél Pareto-optimaal. situatie in de wereld model uitkomst van het model terugvertaling naar situatie in de wereld
25
Oplossingen voor het dilemma der gevangenen 1
NB de kunst is bij al dit soort modelmatige analyses te beargumenteren waarom de oplossing in de praktijk werkt door te laten zien dat deze werkt in het onderliggende model. Oplossing 1: zet een straf op onwenselijk gedrag [Hobbes] (uitgevoerd door derden). Dit maakt defectie minder aantrekkelijk. <toelichting op bord> Wordt toegepast: - bij de belastingen - bij de bibliotheek - … Aannames: - defectief gedrag moet observeerbaar zijn - in Assurance Games wordt het Pareto optimale evenwicht gespeeld
26
Oplossingen voor het dilemma der gevangenen 2
Oplossing 2: Normen. Zorg dat men een ‘mentale bonus’ ervaart voor het bijdragen aan het collectief. Dit maakt coöperatief gedrag aantrekkelijker. <toelichting op bord> Aanname: Observeerbaarheid niet meer nodig In assurance games wordt Pareto optimale evenwicht gespeeld Praktijk: Normen en waarden Sesamstraat
27
Coleman schema in deze toepassing van normen
Sociale condities: Al dan niet vigerende normen Sociaal verschijnsel: Productie collectieve goederen Welke aannames zijn nodig voor je op het micro-niveau begint? Zie vorige slide. Transformatie van individuele uitkomsten tot collectief gedrag? In Assurance games wordt het PO-evenwicht gespeeld Wie/wat zijn de actoren? Wat zijn hun doelen en voorkeuren? Homogene populatie actoren, doel=geld, n-actoren, simultane keuze, volledige informatie, … Handelingstheorie: speltheorie, actoren spelen hetgene in evenwicht is Tot welk individueel gedrag leidt dit? Bij sterke normen: evenwichten bij (C,C) en (D,D), maar (C,C) is Pareto optimaal. Het Coleman-bootje
28
Oplossingen voor het dilemma der gevangenen 3
Oplossing 3: herhaling van het spel (Axelrod) “The evolution of cooperation” (1984) Bekijk evenwichten in: Het eindig vaak herhaalde spel Het oneindig vaak herhaalde spel met discounting / het zich met zekere kans herhalende spel. <verder uitleg op het bord> [dilemma met “payoffs” S, P, R, T]
29
Dilemma der gevangenen: algemeen
kolom cooperatie defectie 15 , 15 R , R 0 , 30 S , T 30 , 0 T , S 5 , 5 P , P rij S < P < R < T (en vaak ook 2R > S + T)
30
Oplossingen voor het dilemma der gevangenen 3
Oplossing 3: herhaling In het met zekere kans w herhaalde dilemma der gevangenen geldt het volgende: De strategieencombinatie (altijd D, altijd D) is in evenwicht. Als w > (T-R) / (T-P) dan is de strategieencombinatie (Tit-For-Tat , Tit-For-Tat) in evenwicht. Implicatie: als een gezamenlijke toekomst maar belangrijk/waarschijnlijk genoeg is, dan is wederzijds cooperatief gedrag mogelijk (in de zin dat het wordt ondersteund door een evenwicht).
31
Te doen voor volgende keer
Lees de twee hoofdstukken van Axelrod uit “Evolution of cooperation”. Verwerk de stof aan de hand van de leeswijzer op de site. Maak de opdracht (zie site). Inleveren uiterlijk vrijdag 16 februari, 17:00, via naar LEES GOED WAT PRECIES DE BEDOELING IS. BIJ TWIJFEL: MAIL!
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.