Hva er fangenes dilemma?

I selve spillet er straff (og belønninger, der det er relevant) representert av nytte tall. Positive tall representerer gode utfall, negative tall representerer dårlige utfall, og ett utfall er bedre enn et annet hvis antallet som er knyttet til det er større. (Vær imidlertid forsiktig med hvordan dette fungerer for negative tall, siden -5 for eksempel er større enn -20!)

I tabellen over refererer det første tallet i hver boks til utfallet for spiller 1 og det andre tallet representerer utfallet for spiller 2. Disse tallene representerer bare ett av mange sett med tall som stemmer overens med fangenes dilemmaoppsett.

Når et spill er definert, er neste trinn i å analysere spillet å vurdere spillernes strategier og prøve å forstå hvordan spillerne sannsynligvis vil oppføre seg. Økonomer gjør noen antagelser når de analyserer spill - først antar de at begge spillerne er klar over utbetalingen både for seg selv og for den andre spilleren, og for det andre antar de at begge spillerne leter til rasjonelt maksimere sin egen utbetaling fra spillet.

instagram viewer

En enkel innledende tilnærming er å se etter det som kalles dominerende strategier- strategier som er best uavhengig av hvilken strategi den andre spilleren velger. I eksemplet over er det å velge å tilstå en dominerende strategi for begge spillerne:

Gitt at det å bekjenne er best for begge spillerne, er det ikke overraskende at utfallet der begge spillerne tilstår er et likevektsutfall av spillet. Når det er sagt, er det viktig å være litt mer presis med definisjonen vår.

Konseptet med a Nash-likevekt ble kodifisert av matematiker og spillteoretiker John Nash. Enkelt sagt er en Nash Equilibrium et sett med beste svarstrategier. For et spill med to spillere er en Nash-likevekt et utfall der spiller 2s strategi er den beste responsen på spiller 1s strategi og spiller 1s strategi er den beste responsen på spiller 2s strategi.

Å finne Nash-likevekten via dette prinsippet kan illustreres i resultattabellen. I dette eksemplet er spiller 2s beste svar på spiller en sirklet i grønt. Hvis spiller 1 tilstår, er spiller 2s beste respons å tilstå, siden -6 er bedre enn -10. Hvis spiller 1 ikke tilstår, er spiller 2s beste svar å tilstå, siden 0 er bedre enn -1. (Merk at dette resonnementet er veldig likt resonnementet som brukes for å identifisere dominerende strategier.)

Spillerens beste svar er sirklet i blått. Hvis spiller 2 tilstår, er spillerens beste respons å tilstå, siden -6 er bedre enn -10. Hvis spiller 2 ikke tilstår, er spillerens beste svar å tilstå, siden 0 er bedre enn -1.

Nash-likevekten er utfallet der det er både en grønn sirkel og en blå sirkel, siden dette representerer et sett med beste responsstrategier for begge spillerne. Generelt er det mulig å ha flere Nash-likevekter eller ingen i det hele tatt (i det minste i rene strategier som beskrevet her).

Du har kanskje lagt merke til at Nash-likevekten i dette eksemplet virker suboptimal på en måte (spesielt fordi det ikke er Pareto optimalt) siden det er mulig for begge spillerne å få -1 heller enn -6. Dette er et naturlig resultat av samspillet som er til stede i spillet - i teorien, ville ikke det å bekjenne være et optimal strategi for gruppen samlet, men individuelle insentiver forhindrer at dette resultatet blir oppnådd. Hvis spiller 1 for eksempel trodde at spiller 2 ville forbli taus, ville han ha et insentiv til å ratere ham ut i stedet for å tie, og omvendt.

Av denne grunn kan en Nash-likevekt også tenkes som et utfall der ingen spiller har et insentiv til å ensidig (dvs. av seg selv) avvike fra strategien som førte til det resultatet. I eksemplet ovenfor, når spillerne velger å tilstå, kan ingen av spillerne gjøre det bedre ved å ombestemme seg.