La matrice dei payoff e l’equilibrio di Nash nel dilemma del prigioniero
In questo articolo parleremo del famoso dilemma del prigioniero. Tale dilemma è molto popolare nel mondo dell’economia e viene spesso usato per descrivere i meccanismi della concorrenza imperfetta che ha luogo tra le aziende.
Premessa sulla teoria dei giochi
Il dilemma del prigioniero è un classico esempio della teoria dei giochi, scienza matematica che studia e analizza l’interazione strategica tra più individui in situazioni di conflitto. Essendo coinvolti più giocatori, l’esito finale del gioco dipende dalle scelte operate dai singoli. Tali scelte vengono definite decisioni strategiche, in quanto prese da ogni giocatore tenendo conto delle azioni e delle reazioni degli altri giocatori.
La teoria dei giochi presuppone che i giocatori siano sia intelligenti, cioè in grado di fare ragionamenti logici di complessità abbastanza elevata che razionali, cioè aventi preferenze coerenti sugli esiti finali del processo decisionale. Ogni partecipante ha una propria funzione di utilità sull’insieme degli esiti del gioco. L’obiettivo di ogni giocatore è quello di massimizzare le proprie preferenze.
Il gioco può essere distinto tra cooperativo e non-cooperativo. Nei giochi cooperativi, i partecipanti possono accordarsi preventivamente sulle strategie da seguire, cosa che risulta impossibile nei giochi non-cooperativi.
Il dilemma del prigioniero
Il dilemma del prigioniero è un gioco non-cooperativo che rappresenta una situazione di conflitto di interessi fra due soggetti, nello specifico due prigionieri. Ogni prigioniero ha due possibili scelte, confessare o non confessare. I giocatori scelgono le loro azioni simultaneamente. Con ciò, non si intende che le azioni vengano svolte nello stesso momento, ma che ogni giocatore svolge la propria azione senza conoscere l’azione scelta dall’avversario. La vincita è definita in anni di prigione.
Il dilemma del prigioniero riguarda due individui che vengono accusati di aver commesso un reato, anche se non sono presenti prove sufficienti per incriminarli. Una legge in vigore assicura uno sgravio di pena a chi collabora con la giustizia confessando i propri reati e denunciando quelli del complice. I due imputati vengono interrogati separatamente. Se entrambi confessano, la pena sarà di cinque anni di reclusione ciascuno mentre se solo uno dei due confessa, costui viene liberato e l’altro condannato a dieci anni. Infine, se nessuno confessa, il giudice formula una condanna a 3 anni di reclusione ciascuno per un reato minore di cui si hanno le prove a carico di entrambi gli imputati.
Tale gioco presuppone che i due prigionieri vengano interrogati separatamente, senza alcuna possibilità di accordarsi preventivamente, né di venire a conoscenza della strategia adottata dall’altro prigioniero.
La rappresentazione del dilemma del prigioniero
Il modo più intuitivo per rappresentare il dilemma del prigioniero è la “matrice dei payoff”, una matrice che rappresenta i payoff, ossia gli esiti del gioco generati dalle decisioni strategiche dei giocatori. I payoff rappresentano, dunque, i benefici che deriveranno all’uno e all’altro giocatore in funzione delle scelte da loro prese. La teoria dei giochi si prefigge di determinare la strategia ottimale di ogni giocatore, ovvero la strategia in grado di massimizzare il payoff o beneficio atteso da ogni giocatore.
Trattandosi di un gioco non-cooperativo, per ogni prigioniero risulta più vantaggioso confessare perché, indipendentemente dalla scelta dell’altro giocatore, il suo beneficio sarà maggiore. Tale conclusione appare più chiara se andiamo ad analizzare il gioco nello specifico.
Il primo ad essere interrogato è il prigioniero A per il quale è più vantaggioso confessare, in quanto così facendo sconterebbe 5 anni invece che 10, o 0 anni piuttosto che 3. Allo stesso modo, indipendentemente dalla scelta di A, anche per B sarà più conveniente confessare. Infatti, in caso di avvenuta confessione da parte di A, a B converrebbe confessare così da scontare entrambi 5 anni di carcere; in caso di non avvenuta confessione da parte di A, a B converrebbe a maggior ragione confessare così da poter esser liberato immediatamente, mentre A sconterebbe 10 anni di carcere. L’equilibrio del gioco è posto, dunque, in C-C: entrambi i prigionieri confessano scontando 5 anni di carcere ciascuno.
Prigioniero A/ Prigioniero B | Confessa | Non confessa |
Confessa | (-5, -5) | (0, -10) |
Non confessa | (-10, 0) | (-3, -3) |
L’equilibrio di Nash
Secondo la teoria dei giochi, la scelta di confessare (C) operata dai due prigionieri – alla luce del precedente ragionamento – è detta strategia dominante, ovvero la strategia ottimale per un giocatore indipendentemente da ciò che fa l’avversario. La situazione di equilibrio posta in C-C viene pertanto definita equilibrio in strategie dominanti o equilibrio di Nash, dal nome del noto matematico John Forbes Nash, premio Nobel per l’economia nel 1994, che per primo spiegò questo concetto nel 1951.
Interpretazione del dilemma del prigioniero
Il dilemma del prigioniero ha sollevato grande interesse dato che in tale gioco l’assioma di razionalità alla base del pensiero economico classico sembra apparentemente fallire. Infatti, il gioco sembrerebbe prescrivere un’azione che procura più danno ad entrambi i contendenti rispetto alla scelta alternativa NC-NC (con NC si intende “non confessare”). Gli studiosi di teoria dei giochi chiariscono però che tale interpretazione è basata su una visione distorta del gioco, secondo cui la vittoria verrebbe valutata a partire dalla somma degli anni di carcere presenti in ciascuna cella. Un gioco così impostato avrebbe infatti come equilibrio NC-NC, ovvero la scelta che risulta nel minor numero di anni di carcere per entrambi.
Tuttavia, questa interpretazione assume che il prigioniero debba preferire il danno minore per la coppia. In realtà, l’obiettivo del giocatore secondo la formulazione originaria è quello di massimizzare il proprio beneficio, indipendentemente da quello dell’avversario.
Dato che il gioco presuppone che i giocatori siano intelligenti e razionali, ne consegue che prenderanno tutti la stessa decisione. È dunque impossibile che un giocatore faccia il “furbo” a scapito degli altri, perché automaticamente anche gli altri giocatori si comporterebbero nello stesso modo. Entrambi i prigionieri preferirebbero l’azione di non confessare (NC-NC), così da poter entrambi scontare soltanto 3 anni di detenzione. Tuttavia, questa giocata risulta estremamente rischiosa. Infatti, qualora solo un giocatore confessasse (come è razionale che faccia), costui verrebbe immediatamente liberato, mentre l’altro prigioniero si ritroverebbe a scontare 10 anni di carcere.
Pertanto, nel momento in cui uno dei due prigionieri capisce che le sue conclusioni sono le stesse a cui arriva anche l’altro giocatore, C risulta l’unica azione possibile per entrambi. L’apparente paradosso iniziale viene dunque a cedere e un giocatore razionale, in assenza di accordi vincolanti, sceglierà sempre di confessare.
Una variante del dilemma del prigioniero
L’unica variante del gioco che renderebbe vantaggioso per entrambi i giocatori scegliere l’azione NC sarebbe in caso di un gioco cooperativo; ovvero nel quale i due giocatori abbiano la possibilità di accordarsi preventivamente sulla strategia da adottare. Tuttavia, anche in questo caso, anzi, soprattutto in questo caso, la tentazione di non cooperare (e dunque di confessare) sarebbe maggiore, poiché certo del fatto che l’avversario cooperante giocherà NC, il prigioniero “traditore” – ovvero colui che non ha rispettato l’accordo preventivo – sarà immediatamente liberato a scapito di quello “leale” che rimarrà in carcere 10 anni.
Giulia Venuti per Questione Civile