Il concetto di equilibrio di Nash nella teoria dei giochi

nash-and-wife-300x236Con la tragica morte (in un incidente in taxi) di John Nash e di sua moglie, le persone si sono prese la briga di decantare i contributi di Nash al pubblico in generale. Il miglior pezzo che ho visto finora, è questo di John Cassidy. Tuttavia, perquanto bello possa essere, non chiarisce esattamente come funziona il famoso concetto di equilibrio di Nash. Vi fornirò alcuni semplici esempi in questo post, in modo che anche il laico possa capire quello che Nash scrisse nella sua celebre tesi di dottorato. (Assicuratevi di guardare la sua bibliografia nell’ultima pagina.)

Ho visto molti commentatori dire ai propri lettori che John Nash abbia sviluppato la teoria dei giochi non cooperativi, in (presunto) contrasto col lavoro sui giochi cooperativi di John von Neumann e Oskar Morgenstern. Tuttavia, è un po’ fuorviante parlare in questo modo. E’ certamente vero che von Neumann e Morgenstern hanno fatto un sacco di lavoro sui giochi cooperativi (che coinvolgono le coalizioni di giocatori in cui i giocatori di una coalizione possono fare mosse “comuni”). Ma von Neumann ha svolto anche un lavoro pionieristico sui giochi non-cooperativi – giochi dove non ci sono coalizioni e ogni giocatore sceglie la propria strategia per raggiungere il proprio obiettivo. Tuttavia, von Neumann ha studiato solo il caso speciale di giochi a somma zero con due persone. (Un gioco a somma zero è quello in cui il guadagno di un giocatore è esattamente controbilanciato dalla perdita dell’altro giocatore.) Ciò copre un sacco di argomenti quando si pensa ad un “gioco”, tra cui gli scacchi, la dama e i giochi di carte (se stanno giocando solo due persone).

Il risultato centrale dal lavoro di von Neumann è stato il teorema minimax. I dettagli completi sono qui, ma l’intuizione è questa: in un gioco a somma zero con due persone, c’è un valore V nel gioco in modo tale che un giocatore può garantirsi un guadagno di almeno V mentre l’altro giocatore può limitare la sua perdite di V. Il nome deriva dal fatto che ogni giocatore pensa: “Dato quello che faccio, che cosa farà l’altro tipo per massimizzare il suo beneficio? Dopo aver calcolato la risposta migliore del mio avversario per ogni strategia che potrei scegliere, voglio scegliere la mia strategia per ridurre al minimo tale valore.” Dal momento che si tratta di un gioco a somma zero, ogni giocatore fa del suo meglio per minimizzare il beneficio dell’altro.

Questo era un risultato abbastanza preciso. Tuttavia, anche se un sacco di giochi sono a somma zero con due persone, ci sono molte interazioni strategiche in cui questo non accade. Qui entrò in gioco John Nash. Inventò un concetto di soluzione che avrebbe potuto funzionare per l’intera classe di giochi non cooperativi – ossia, quelli con N giocatori e dove il gioco potrebbe essere a somma negativa, a somma zero, oppure a somma positiva. Poi mostrò le condizioni in cui esisterebbe il suo equilibrio. (In altre parole, non sarebbe stato così impressionante o utile se Nash avesse definito un concetto di equilibrio per questi giochi, se non fosse esistito per un particolare gioco a somma positiva con N persone.)

Per ogni gioco che analizziamo in questo modello, dobbiamo specificare l’insieme dei giocatori, l’insieme delle strategie pure a disposizione di ogni giocatore e, infine, la funzione del beneficio che si posiziona nel profilo delle attuali strategie di ogni giocatore e che per ognuno di loro rappresenta un determinato vantaggio. (Una delle complessità matematiche è che i giocatori possono scegliere strategie miste alle quali assegnare le probabilità in base ai loro set di strategie pure. Dal punto di vista tecnico, quindi, la funzione del beneficio all’interno del gioco si origina da ogni possibile combinazione delle strategie miste di ogni giocatore in base alla lista dei benefici per quel particolare risultato.) Ora che ho dato il quadro, siamo in grado di illustrarlo con alcuni giochi semplici.

Un gioco popolare è la cosiddetta Battaglia dei Sessi. La storia è quella di un marito e una moglie che devono recarsi ad un evento che preferisce il marito (diciamo un film d’azione) o ad un evento che preferisce la moglie (diciamo una commedia romantica). Ma il problema è che ogni persona preferirebbe guardare il film con il suo coniuge, e non da solo, e questa considerazione domina la scena della scelta. Possiamo stilare un modello di questa storia:

Set di giocatori = {Marito, Moglie}

Set delle strategie del marito = {Azione, Commedia Romantica}

Set delle strategie della moglie = {Azione, Commedia Romantica}

Piuttosto che definire formalmente la funzione del beneficio, è più facile costruire una matrice che mostra i profitti dei nostri giocatori in base alle quattro possibili combinazioni delle loro strategie pure (dove il beneficio del marito è il primo numero e il beneficio della moglie è quello dopo la virgola):

 

Tuttavia, la situazione è strategica, nel senso che il beneficio per ogni persona non dipende solo dalla strategia che sceglie la persona, ma anche quella che sceglie l’altra persona. Questo è ciò che rende diversa la teoria dei giochi dalle impostazioni più tradizionali della teoria economica. Ad esempio, nei libro di testo d’economia, il consumatore ha un “dato” budget e considera i prezzi di mercato come “dati”, e quindi massimizza l’utilità in base a tali vincoli. Il consumatore non deve “entrare nella testa” del produttore e preoccuparsi se il produttore cambierà prezzi/produzione in base alla decisione d’acquisto dei consumatori.

Comunque, torniamo alla nostra “battaglia dei sessi”. Anche se il gioco è a somma positiva, c’è ancora l’elemento della “battaglia” perché il marito preferirebbe che entrambi scegliessero il film d’azione. Ciò produrrebbe il miglior risultato possibile per lui (un beneficio di 3), ma solo un 2 per la moglie. La moglie, invece, preferirebbe che entrambi andassero a vedere la commedia romantica, perché otterrebbe un 3 per tale risultato (e 3 > 2). Eppure entrambi preferiscono la compagnia dell’altro piuttosto che vedere il film da soli (cioè 2 > 1). E, naturalmente, il peggior risultato possibile – dove ognuno ottiene un beneficio pari a 0 – si verifica se per qualche strano motivo il marito guarda la commedia romantica (da solo), mentre la moglie guarda il film d’azione (da sola).

In questo gioco, ci sono due equilibri di Nash. In altre parole, se noi diciamo (in questo momento e per semplicità) che il marito e la moglie sceglieranno una delle loro due strategie disponibili, allora ci saranno solo due combinazioni che formeranno un equilibrio di Nash. In particolare, i proflili di strategie (film d’azione, film d’azione) e (commedia romantica, commedia romantica) costituiscono equilibri di Nash.

Dal punto di vista formale, un equilibrio di Nash è definito come un profilo di strategie (possibilmente mescolate) in cui la strategia di ciascun giocatore costituisce una miglior risposta rispetto alla strategia scelta da ogni altro giocatore in un determinato profilo.

Possiamo testare i nostri due profili per vedere se sono davvero equilibri di Nash. Per prima cosa testiamo (film d’azione, film d’azione). Se il marito sceglie “film d’azione” come sua strategia, allora il beneficio a disposizione della moglie sono un 2 (se anche lei sceglie “film d’azione”) o un 1 (se sceglie “commedia romantica”). Dal momento che 2 > 1, la moglie sceglierebbe “film d’azione”. Fin qui ci siamo. Ora passiamo al marito: dato che la moglie sta scegliendo “film d’azione”, può ottenere un beneficio di 3 o di 0. Dal momento che 3 > 0, anch’egli fa bene a scegliere “film d’azione” piuttosto che “commedia romantica”. Anche qui tutto bene. Abbiamo appena dimostrato che (film d’azione, film d’azione) è un equilibrio di Nash.

Andremo più veloci per l’altro equilibrio di Nash (commedia romantica, commedia romantica): se il marito sceglie “commedia romantica”, allora la migliore risposta della moglie è “commedia romantica” perché 3 > 0. Fin qui tutto ok. E se la moglie sceglie “commedia romantica”, allora la risposta migliore del marito è “commedia romantica” perché 2 > 1. E anche qui tutto ok, e dato che abbiamo verificato che ogni giocatore sta rispondendo nel miglior modo possibile rispetto alle altre strategie nel profilo (commedia romantica, commedia romantica), il tutto è un equilibrio di Nash.

Ora, come ultimo esempio, vorrei mostrare la robustezza del contributo di Nash. Ci sono alcuni giochi dove non c’è equilibrio di Nash nelle strategie pure. Ad esempio, considerate questo gioco classico:

Si noti che in questo gioco non c’è equilibrio di Nash nelle strategie pure. Se Joe sceglie “sasso”, allora la miglior risposta di Mary è “carta”. Ma se Mary sceglie “carta”, Joe non vorrebbe scegliere “sasso”. (Farebbe meglio a scegliere “forbici”). E così via per tutte le nove possibili combinazioni di strategie pure.

Anche se non c’è equilibrio di Nash nelle strategie pure, ne esiste uno nelle strategie miste. In altre parole, se diciamo che Joe e Mary assegnano probabilità a ciascuna delle loro strategie pure, allora possiamo trovare un equilibrio di Nash in quel profilo più ampio. Venendo al sodo, se ogni giocatore sceglie in modo casuale ognuna delle sue strategie pure una volta su tre, allora abbiamo un equilibrio di Nash in queste due strategie miste.

Controlliamo il nostro risultato. Dato che Joe può scegliere tra “sasso”, “carta” e “forbici,” Mary è indifferente nei confronti delle sue tre strategie pure. Non importa quale scelga, la speranza matematica di un suo beneficio è 0. Ad esempio, se sceglie “carta” con il 100% di probabilità, allora 1/3 delle volte che Joe sceglie “sasso” Mary ottiene 1, 1/3 delle volte che Joe sceglie “carta” Mary ottiene 0, e 1/3 delle volte che Joe sceglie “forbici” Mary ottiene -1. Così il suo beneficiof atteso prima che possa vedere la scelta di Joe è (1/3 x 1) + (1/3 x 0) + (1/3 x [-1]) = (1/3) – (1/3) = 0. Potremmo fare un calcolo simile per Mary che sceglie “sasso” e “forbici” contro la strategia mista di Joe.

Dal momento che Mary ottiene un beneficio atteso di 0 scegliendo una delle sue strategie pure rispetto a quella mista di Joe, ognuna di esse costituisce una “risposta migliore” e per di più ognuna ponderazione lineare di esse rappresenta una risposta migliore. In particolare, Mary sarebbe perfettamente felice di mescolare 1/3 di ciascuna delle sue strategie contro la strategia di Joe, perché anche in questo caso otterrebbe un beneficio atteso di 0 e non può fare meglio di così. (Sto saltando la parte in cui faccio i calcoli per dimostrare che il mix delle strategie pure che hanno lo stesso beneficio atteso, danno effettivamente lo stesso beneficio atteso. Ma spero che sia intuitivo per il lettore che se Mary ottiene 0 scegliendo qualsiasi delle sue strategie pure, allora se assegna la probabilità a due o tre di esse continua ad ottenere un beneficio atteso di 0.)

Finora abbiamo fatto metà del lavoro per verificare se il nostro profilo di strategie miste fosse davvero un equilibrio di Nash. In particolare, abbiamo appena verificato che se Joe mescola in parti uguali le sue strategie pure, allora anche Mary si accontenta di mescolare in parti uguali le sue strategie pure. Resta da fare l’opposto, vale a dire, verificare se Joe si accontenta di mescolare in parti uguali le sue strategie pure, supponendo che anche Mary faccia lo stesso. Ma dal momento che questo gioco è perfettamente simmetrico, spero che il lettore possa intuire che non c’è altro lavoro da fare; non faremmo altro che costruire l’immagine speculare dei nostri calcoli di sopra.

Per tornare al nostro punto di partenza, e per evitare confusione, vorrei ricordare che anche il modello di von Neumann e Morgenstern sarebbe in grado di gestire il gioco “sasso, carta, forbici”, dal momento che si tratta di un gioco a somma zero tra due persone. In particolare, il valore V del gioco è 0. Se Joe mescola in parti uguali le sue strategie pure, allora può ridurre al minimo il beneficio atteso di Mary e limitare le sue perdite attese a 0. (Per mantenere le cose il più semplici possibile, ho scelto un gioco a somma zero tra due persone per illustrare una strategia mista d’equilibrio di Nash.)

Ora che abbiamo visto in cosa consiste un equilibrio di Nash nelle strategie miste, posso esporre il risultato centrale della dissertazione da 27 pagine di Nash: utilizzando il “Teorema di Kakutani“, Nash ha mostrato le condizioni generali in base alle quali si può dimostrare che esiste almeno un equilibrio Nash per un gioco. (Naturalmente Nash non definì il suo concetto di soluzione un “equilibrio di Nash”, lo chiamò “un punto di equilibrio”. L’etichetta “equilibrio di Nash” venne dopo e fu utilizzata da altri.)

Ah, un’ultima cosa. Ora che sappiamo cosa ha fatto Nash a Princeton, possiamo apprezzare quanto siano assurde le scene più importanti del film di Ron Howard?

Quando il Nash del film (interpretato da Russell Crowe) dice ai suoi amici di smettere di approcciarsi con le donne in termini di mero interesse, e invece capire quello che il gruppo nel suo insieme deve fare per promuovere l’interesse del gruppo, questo è l’esatto opposto dell’analisi nella tesi di dottorato del Nash reale. Infatti, se analizzassimo il contesto strategico del bar nel modo in cui lo fa il Nash del film, il vero Nash direbbe: “Se tutti i ragazzi concordassero d’ignorare la bella donna bionda e si concentrassero sulle sue amiche più ordinarie, tutti i ragazzi sarebbero più felici se invece ciascuno di loro si focalizzasse sulla bella bionda. Ma tale risultato non costituisce un equilibrio di Nash, quindi non possiamo aspettarci che funzioni. Se ci focalizzassimo sulle amiche più ordinarie, ciascuno di noi avrebbe un incentivo a discostarsi e a correre dietro alla bella bionda. Ah, i limiti del comportamento razionale egoistico.

(Spero che il lettore perdoni i toni probabilmente sessisti delle frasi precedenti, ma è come Ron Howard ha scelto di trasmettere al mondo le intuizioni di Nash. Mi sto destreggiando con gli esempi che ho a disposizione.)

John Nash ha fornito agli economisti una struttura potente per l’analisi delle interazioni strategiche. Se volete vedere come gli economisti hanno preso il suo risultato e applicato in questi contesti in cui esso conduce all’assurdo, leggete i miei articoli qui e qui.

Articolo di Robert Murphy su Mises.ca

Traduzione di Francesco Simoncelli