Ex. på spel och strategier

(Från [Binmore2012]). För vissa grundläggande begrepp (betalningsmatris, Nashjämvikt, maximin-principen, rena/blandade strategier etc), se Spelteoretiska begrepp.

Fångarnas dilemma

Detta är en intressant spelsituation, som visar att samverkan är svår i ett isolerat möte mellan två individer (namnet härrör från en historia om två fångar, som var för sig kan välja att hålla tyst eller skvallra). Nedan har vi ett förenklat fall hämtat från  [Binmore2012]där båda har tillgång till strategierna duva och hök. Enda Nashjämvikten är att både A och B agerar hökar! Dessutom är (hök,hök) i överensstämmelse med maximin-principen.

I figur nedan ser vi att hök/hök, som alltså är individuellt rationellt val från båda, ger näst sämst utfall för båda. I st skulle samarbetsstrategi  från bådas sida ger näst bäst utfall för båda och bäst genomsnittligt resultat totalt för gruppen, dvs är gruppmässigt rationellt. Om individerna väljer olika strategi får den individuellt rationelle bästa resultat och den samarbetsvillige sämsta resultat. 
Figur 1: Variant av fångarnas dilemma, där parterna har tillgång till  gemensam pott. Varje part kan välja att antingen ge motparten 200:- från potten eller ta 100:- från potten.

Ömsesidighet och upprepade spel förändrar situationen

Det genuina fångarnas dilemma-spelet förutsätts utföras bara en gång. Upprepade kontakter (framför allt obestämt antal) förändrar situationen. Båda parter kan då reagera på den andres beteende genom att belöna eller bestraffa. Tidsdimensionen är alltså viktig och möjlighet till samarbete finns.  Vi ser beträffande fångarnas dilemma enl. figur ovan att situationen då båda agerar hökar är sådan att ingen vinner på att ensam byta strategi. En sådan strategikombination som parterna fastnar i, kallas, som vi sett tidigare, Nashjämvikt. 

Den hårda, oförlåtande s.k. GRIM-strategin - när man upprepar fångarnas dilemma - innebär att A alltid spelar duva så länge B aldrig spelar hök. Om B spelar hök slår A tillbaka genom att hädanefter alltid spela hök. (GRIM, GRIM) är också en Nashjämvikt, men nu för obestämt antal upprepade fångarnas dilemma. Jämför wikip/MAD (Mutually assured destruction).

Det finns andra alternativ för rationellt samarbete. Tänkande "folk" har väl alltid insett att genom samarbete eller i upprepade situationer det går att - även utan externt tvång - söka sig fram till framgångsrika jämvikter (förutsatt att avvikare tillräckligt ofta upptäcks). Denna insikt brukar kallas folkteoremet.

För att exemplifiera kan vi utgå från fångarnas dilemma i figur 1 ovan. Med två varianter av förutsättningar kan vi nå utfall enl figur 2 nedan 
(från [Binmore2012], figur 20). De fyra punkterna som motsvarar rena strategier anges som cirklar i figuren. Två varianter av utfallsområden beroende på förutsättningar:
  • Utfallsområde S för samarbete enl. avtal och med polisiär kontroll (inom finstreckade linjer).
    Parterna kan förhandla och avtala om var utfallet ska hamna innan spelet börjar. Observera att godtycklig punkt kan erhållas genom att de fyra punkterna för rena strategier tilldelas olika sannolikheter (via slantsingling etc), så att man får blandade strategier. Problemet är att det kan behövas en extern (polisiär) funktion för att se till att avtalet efterlevs.
    Ex: Genom att tilldela punkt (D,H) och (D,D) vardera 50 % sannolikhet kommer man till en punkt mittemellan dessa punkter.
  • Utfallsområde F med självkontroll av avtal vid tillräckligt länge upprepat spel (inom grövre streckat område)
    Detta område utgår från S men begränsas till de områden som ger parterna minst sitt maximinvärde, dvs A får minst 100 och B får minst 100. Parterna avtalar om ett utfallspar i F. Om A avviker från detta avtal så kan B straffa A så att denna får minimax-utfallet (100). A kommer i sin tur att straffa tillbaka så att utfallsparet blir (100,100). Det är alltså optimalt att följa avtalet förutsatt att andra parten gör det. Avtalet är således Nash-jämvikt. Parterna fungerar själva som kontrollanter av den andre. Försiktigt kanske var och en - i alla fall efter ett tag - inser att det lönar sig att gå till avtalat jämviktsläge hellre än att hela tiden komma tillbaka till (H,H)
Figur 2: Utfallsområden för fångarnas dilemma (från figur 1) vid samarbete med polisiärt kontrollerat avtal (yta S) resp vid upprepat spel med självkontroll av avtal enl. folkteoremet (yta F) 

Ett praktiskt exempel på insikter i linje med folkteoremet.

Ex 1: På auktionssajter på internet ökar tilliten till motpart genom statistik/kommentarer från tidigare transaktioner som motparten genomfört.

Lika-för-lika (tit-for-tat)

Säger ( beträffande upprepat fångarnas dilemma) att en part bör börja spela duva och sedan göra som motparten gjort vid sitt senast drag. Detta är en Nash-jämvikt liksom (GRIM, GRIM) enl. ovan, men lika för lika är inte hård och obeveklig vid avvikelser. Strategin har blivit populär efter det att Bob Axelrod ordnat en olympiad, där samhällsforskare fått sända in sina datorprogram för simuleringar av (i princip obestämt antal gånger) upprepade fångarnas dilemma. Mest framgångsrika strategin var just lika-för-lika. Dvs strategin överlevde ett antal evolutionära simuleringar tack vare att den kombinerade trevlighet med att ge igen och förlåta och dessutom är tydligt för motspelaren. Axelrod ansåg att  att lika-för-lika var lämplig strategi för mänskligt samspel generellt (en ståndpunkt som dock nyanserats en aning i [Binmore2012], s 107+). 

Efter Axelrods försök (dokumenterat i [Axelrod1984]) har området gått fram. Det har vid evolutionära simuleringar visat sig att det finns strategier, som bättre klarar att möta strategier som kan mutera etc och dessutom ta hänsyn till brus p gr av misslyckat genomförande av strategi eller missuppfattning av motspelaren. I alla fall tycks - enl. Binmore - Axelrods slutsats, att evolution sannolikt skapar samarbetsutfall, vara genuint robust.

Konventioner

Vi lär oss (via imitation, uppfostran, indoktrinering etc) de konventioner (normer) som råder i samhället: Vi tänker inte på att konventioner överlever i det långa loppet bara för att de koordinerar våra beteenden så att dom når jämviktslägen. I ett annat samhälle skulle andra konventioner kunna  leda till andra jämviktslägen.

Ex: Dålig (el obefintlig) konvention: var och en väljer slumpmässigt sida att köra på. Bra konventioner: vänstertrafik eller högertrafik. 

Vi har lätt att acceptera att vi helt enkelt har bestämt vissa konventioner kring t ex språk och pengar, men vi tycker ofta inte att känsliga ämnen som etik och religion styrs av konventioner (som Hume hävdar). Spelteorin har inga åsikter om vilka trosföreställningar man bör ha. Binmore uttrycker det som att spelteorin inte har något substantiellt innehåll. De enda som möjligen skulle behöva  frukta spelteori är dom vars föreställningar (preferenser) är motsägelsefulla. 

I vissa fall har vi inga uppenbara konventioner. Thomas Schelling gjorde på 50-talet experiment, som visar att vi ändå ofta väljer "rätt". Ofta kan man hitta s.k. fokuspunkter (focal points), t ex att följa viss ordning (bokstavs-, nummer-ordning), lita på en guru eller göra ingenting.

Ex 2: Två spelare väljer oberoende av varandra krona eller klave. De vinner 500:- om båda väljer samma. Hur kommer de att välja: Svar: troligen krona eftersom krona är före klave i uttrycket "krona eller klave".
Ex 3: Du ska träffa någon i NY i morgon, men glömde bestämma var. Vart går du? Svar: beror på hur bekanta ni båda är med NY. Vissa skulle välja Grand Central Station om det gällde mitt på dagen.

Ofta är det så att spelets sammanhang  har betydelse (jämför Kahnemans inramningseffekter)..

Sociala dilemman 

är situationer där långsiktiga gemensamma/kollektiva intressen kolliderar med kortsiktiga individuella intressen eller dåliga konventioner.  Fångarnas dilemma ovan var ett kraftigt förenklat exempel med bara två parter, men som ändå fångade en central del av problemet.

Ex 4: Binmore tar upp ett spelexempel (Schellings solitär), där vita grannar inte har nåt emot svarta grannar men vill att minst 50%  är vita. Svarta är lite blygsammare men vill att minst 1/3 av deras grannar är svarta. I de jämviktslägen som då nästan alltid uppstår bor alla efter ett tag i segregerade områden. Slutsats: Synbarligen hyfsade normer kan leda till oönskat resultat.

Ex 5: Hjortjaktspelet (förtroendespelet) med två Nashjämvikter
I [Binmore2012], s. 90, har fångarnas dilemma-spelet enl. figur 1 ovan modifierats enl. figur 2 nedan för att åskådliggöra att det kan finnas flera Nashjämvikter. Spelet kallas hjortjaktspelet, men experter på internationella relationer kallar det säkerhetsdilemmat eller förtroendespeletHjortjaktspelet går till så att A och B kommer överens om att samarbeta i jakten på en hjort. När de går skilda vägar frestas båda att överge hjortjakten och i stället skjuta en hare. Preferensmatrisen antas se ut så här:
Figur 3: Hjortjaktspelet. Både (duva,duva) och (hök, hök) är nu Nash-jämvikter.

Hjortjaktspelet tycks vara ett spel som inte leder till samma problem som fångarnas dilemma. Befinner vi oss i ineffektiva Nash-jämvikten (hök,hök) är det väl bara att byta till den effektiva (duva, duva)? Dock är det inte så enkelt. Vi kan komma överens men kan vi lita på överenskommelsen? Det krävs rätt mycket för att evolutionära krafter ska förflytta oss från (hök.hök) till (duva,duva).

Ex 6: Sovjetunionens kollaps är en intressant fallstudie. Varför lyckades vissa länder snabbt gå från planekonomi till marknadsekonomi och andra inte?

För att kunna reformera ineffektiva konventioner  krävs att nya beteenden leder till jämvikt för att ha chans att överleva. Spelteorin kan ge ramverk inom vilka man kan diskutera vilka jämvikter, som kan tänkas vara tillgängliga i de spel vi håller på med. 

Ex 7: Marx gjorde en katastrofal missbedömning av ett kollektivs förmåga till sammanhållning, när kollektivet består av individer med egna mål och behov, som måste tillfredsställas.

Spel med flera parter komplicerar situationen

Detta är ett viktig exempel på socialt dilemma, som statsvetare ägnat sig åt. Det liknar fångarnas dilemma men här är det många parter i stället för bara två. Det är alltså rationellt för enskilda parter att handla på ett sätt som är dåligt för kollektivet. Nya problem jämfört med fallen med bara två parter::
  • Det är oftast svårt veta vem som fuskar
  • Man behöver följa en norm att straffa den som fuskar
  • Helst ska också den som underlåter att rapportera fusk straffas (metanorm).
Ex 8 (klassiskt ): Frågeställning: 100 familjer har getter, som betar på allmänning. Totala mjölkproduktionen blir maximal med totalt 1000 getter. Hur många getter bör varje enskild familj ha för att maximera sin egen mjölkproduktion? Svar vid första anblick: 10 getter. Svar enl. enskilda familjens privata analys: 11 getter skulle ge c:a 10 % bättre avkastning för familjen; kostnaden för mindre bete för alla getterna är obetydligt, eftersom den kommer att delas av alla 100 familjerna. Resultat: många familjer kommer att ha extra getter, vilket leder till att allmänningen på lite sikt förstörs.

För lite resonemang kring stabil (men sjaskig) jämvikt i allmänningens dilemma se avsnitt Relationen individ -stat och en grov matematisk skiss här.

Allmänningens dilemma fångar logiken bl. a. i de miljökatastrofer vi åsamkar oss själva. Varför förstår vi inte att alla får det bättre om alla envar tar lite mindre andel av resurserna? Enl. Binmore finns det ett elementärt felslut i resonemangen: En spelare i livsspelet är inte ett abstrakt objekt som heter "envar". Vi är alla egna individer, var och en med egna mål och syften.

Bland sedan länge föreslagna metoder att lösa allmänningens dilemma är att privatisera aktuella resurser eller låta staten kontrollera utnyttjandet. Ofta fungerar dessa metoder dåligt. Det finns lovande ansatser, som dock kräver ständigt idogt arbete. Ett exempel (som jag inte hittade i [Binmore2012]):

Ex 9: Ansats till lösning på allmänningens dilemma: Elinor Ostrom (nobelpristagare i ekonomi 2009) har jobbat med långsiktigt hållbara lösningar som bygger på lokal reglering kännetecknad av öppenhet, tillit, demokrati, genuin förståelse för resp. allmännings specifika problem etc. hos aktörerna. Hon har, efter att ha studerat ett stort antal existerande lyckosamma praktikfall, bl a formulerat ett antal avgörande designprinciper.  Ostrom har skrivit Allmänningen som samhällsinstitution. Se introduktion till boken. Eller se och hör hennes 8 min föreläsning 2009 Going beyond the tragedy of commons (Stockholm Whiteboard Seminar).

__________________________________________
Direktlänk till nästa sida Förhandling enl. Nash eller tillbaka till överordnad sida Spelteori som analysverktyg.
Comments