IL PENSIERO
Come molti sapranno, Nash meritò
il Nobel per i suoi risultati sulla Teoria dei Giochi. Ma cos'è questa
teoria dal nome strano, che fa pensare più a una sala
fumosa dove si pratica il gioco d'azzardo che non alla stanza di lavoro -
spesso disordinata e caotica (per gli altri!) - di uno scienziato?
La Teoria dei Giochi e il concetto di equilibrio
di John Nash
Introduzione
La Teoria dei Giochi (TdG) è una
disciplina che tanto i matematici quanto gli economisti considerano, in
entrambi i casi con abbondanti ragioni di legittimità, come peculiarmente
propria ed è stata a più riprese, e lo è tuttora, "luogo" di proficua
collaborazione tra due mondi, quello astratto della
Matematica e quello più concreto dell'Economia, che per tanti aspetti, e per
vizi di entrambi, trovano difficoltà a svilupparsi in modo sinergico.La TdG nasce nel 1928 ad opera di uno dei più grandi scienziati del XX secolo, il
matematico di origine ungherese John von Neumann [1], ma è con l'apparizione nel
1944 del volume Theory of Games and Economic Behavior, dello stesso von Neumann e dell'economista
Oskar Morgenstern, che le potenzialità della stessa
vengono sempre più riconosciute e sviluppate. Per questa ragione è convenzione
generalmente accettata che l'anno di nascita della TdG
sia il 1944 e che il luogo di nascita sia Princeton: l'Institute for Advanced Study.Il
termine TdG è universalmente utilizzato ma non rende
perfettamente l'idea di quale sia il nucleo centrale
della disciplina che in modo più esplicativo potrebbe chiamarsi "Teoria
delle Decisioni Interattive". Talvolta si parla anche di "Teoria
delle Decisioni Strategiche". Le situazioni in cui bisogna prendere
decisioni interattive sono innumerevoli. Nel volume Thinking
strategically [2], gli autori Avinash Dixit e Barry Nalebuff esordiscono
illustrando la differenza tra i contesti decisionali non
interattivi e quelli interattivi facendo ricorso "alla differenza tra le
decisioni di un boscaiolo e quelle di un generale. Quando il
primo decide come tagliare un albero non si aspetta che esso reagisca:
l'ambiente è neutrale. Ma quando il generale cerca di sbaragliare
l'esercito nemico, deve anticipare e superare la resistenza che verrà opposta ai suoi piani." Un minimo di riflessione
fa rilevare che in realtà la non interattività nel caso del boscaiolo è solo dovuta ad un fattore di scala. Forse nel tagliare un
solo albero si può assumere che l'ambiente sia neutrale, ma che cosa dire nel
caso di un foresta (o anche meno)? In altre parole, è
più facile incontrare nel concreto situazioni in cui
le decisioni di un individuo interagiscono con quelle di altri o di altre
entità piuttosto che ambiti decisionali puramente non interattivi. Questa è la
ragione della vasta gamma di applicazioni della TdG ai più diversificati contesti.
Esempi
Per introdurre in modo molto semplice qualche concetto,
esponiamo alcuni esempi. Essi danno anche un'idea di quanto diversi possano essere i contesti in cui l'interazione umana è modellizzabile secondo gli schemi (naturalmente qui vediamo
i più elementari) della TdG. Il primo lo potremmo
chiamare "guerra dei quotidiani". I direttori di due importanti quotidiani, mettiamo il Corriere
della Sera e La Repubblica, devono scegliere il titolo
su cui incentrare la prima pagina basandosi, oltre che sui fatti rilevanti del
giorno, sulle preferenze dei lettori e, ovviamente, con l'obiettivo di
massimizzare il numero di copie vendute o, più correttamente, la penetrazione
nel mercato dei quotidiani.Supponiamo che quel giorno
i due avvenimenti più importanti siano la riforma del sistema pensionistico (tema oggi attuale) e la definizione (qui
anticipiamo un po' i tempi) di un progetto di costituzione europea. Supponiamo,
inoltre, che i lettori acquistino il giornale solo se il titolo principale di
prima pagina rispecchi il loro interesse e che essi siano interessati per il
60% alla questione delle pensioni e solo al 40% alla costituzione europea.
Infine, solo per fissare le idee, ipotizziamo che a parità di titolo il lettore
sia indifferente su quale giornale acquistare per cui
se La Repubblica e il Corriere della Sera aprono con lo stesso argomento essi
si dividono equamente i lettori.
Strategie per La Repubblica
Il direttore può scegliere il titolo
sulle pensioni e, in tal caso, la quota di mercato del suo giornale, che
ovviamente dipende anche dalle scelte operate dal concorrente, è del 30%, nel
caso in cui il Corriere apra anch'esso sulle pensioni,
o del 60%, qualora il Corriere opti per la costituzione europea. Nel caso in
cui, invece, il direttore di Repubblica scelga un
titolo sulla costituzione europea, allora le quote di mercato del suo giornale
saranno, rispettivamente, del 40% o del 20% a seconda che il Corriere si muova
sulle pensioni o sulla costituzione europea.
Strategie per il Corriere della Sera
In modo del tutto simile si possono
analizzare le conseguenze delle possibili decisioni del direttore del Corriere e determinare le quote di mercato realizzate in
funzione delle scelte de La Repubblica.
Il tutto può essere riassunto in una tabella come quella
della fig.1, in cui il direttore de
La Repubblica può scegliere tra la prima e la seconda riga e quello del
Corriere della Sera tra la prima e la seconda colonna. Leggendo le percentuali
che appaiono all'intersezione della riga e della colonna scelte, si ha che il
numero di sinistra rappresenta la quota di mercato de La Repubblica e quella di
destra la quota di mercato raggiunta dal Corriere della Sera.
Guerra dei quotidiani |
Corriere della sera |
||||
Pensioni |
Costituzione Europea |
||||
La Repubblica |
Pensioni |
30% |
30% |
60% |
40% |
Costituzione Europea |
40% |
60% |
20% |
20% |
Fig.1
Alla tabella della fig. 1 si dà il nome di gioco non cooperativo ad informazione completa, con ciò volendo riassumere che tanto
il direttore di Repubblica che quello del Corriere la conoscono
in ogni dettaglio (completezza dell'informazione) e che ciascuno di essi dovrà
operare la propria scelta senza conoscere quella dell'avversario (non
cooperazione) la quale, comunque, influenza le quote di mercato effettivamente
raggiunte. In questo esempio i direttori dei
quotidiani sono i giocatori e le opzioni disponibili per ognuno
sono dette strategie. Si osservi che il fatto che i
giocatori siano due come le strategie e che queste ultime siano le stesse per
ogni giocatore, sono solo circostanze legate al tipo di esempio
e non delle ipotesi necessarie alla TdG che, invece,
può prevedere un arbitrario numero di agenti o giocatori ciascuno dei quali ha
a propria disposizione un certo novero di strategie che, in generale,
differisce da quello degli altri giocatori. Un altro esempio, probabilmente il
più noto gioco di strategia, è il cosiddetto dilemma del prigioniero. Esso può essere descritto nel modo seguente. Mario e
Carlo sono due pregiudicati arrestati perché devono
entrambi scontare due anni di prigione. Tuttavia, essi sono sospettati anche di
essere implicati (forse complici) in un crimine maggiore che comporterebbe per
ognuno una pena ulteriore di 10 anni. Alla Polizia,
che non è in grado di provare il loro coinvolgimento nel crimine maggiore, non
resta che il tentativo di far confessare la partecipazione al misfatto più
grave. Per questo sia a Mario che a Carlo, tenuti in celle separate, la Polizia
avanza la seguente proposta: "se collabori a far
incriminare il tuo amico per il reato più grave, il reato minore ti verrà derubricato e, se non sei coinvolto da lui, allora sei
libero subito". Anche in questo caso con una
tabella come quella in fig. 2 si possono riassumere tutte le eventualità. I
numeri negativi riportati indicano gli anni di prigione.
Dilemma del Prigioniero |
Carlo |
||||
Collabora |
Non Collabora |
||||
Mario |
Collabora |
-10 |
-10 |
0 |
-12 |
Non Collabora |
-12 |
0 |
-2 |
-2 |
Fig.2
Un terzo esempio, anche molto famoso, è il cosiddetto giudizio di Salomone. Si riferisce all'episodio biblico in cui, di fronte alla
contesa di un bambino da parte di due donne, Prima e Seconda, il saggio re
escogita il seguente gioco per affidare alla vera madre (che egli ovviamente
non conosce) il bambino. All'insaputa l'una dell'altra, le due donne sono
chiamate a scegliere fra le tre strategie:
- P, il bimbo è affidato a Prima;
- S, il bimbo è affidato a Seconda;
- U, il bimbo viene diviso in due
metà assegnate alle due donne.
Una volta effettuata le scelta simultanea
delle strategie, la conseguenza è che il bimbo viene:
- affidato a Prima se il risultato delle scelte è P,P
oppure S,U oppure P,U;
- affidato a Seconda se il risultato delle scelte è U,P
oppure U,S oppure S,S;
- ucciso negli altri casi.
La tabella della fig. 3 sintetizza il gioco. Il valore
numerico delle "utilità" è fissato in modo convenzionale ma comunque tale da rispettare quello che la Bibbia lascia
intendere (e su cui faceva affidamento Salomone). E cioè
che per la vera madre, la conseguenza del bimbo ucciso è la peggiore mentre una
donna che contende alla vera madre il figlio è così crudele da preferire il
bimbo morto al bimbo affidato all'altra.
Giudizio di Salomone |
Seconda |
||||||||
P |
S |
U |
|||||||
Prima |
P |
1 |
-1 |
-1 |
0 |
1 |
-1 |
|
|
S |
-1 |
0 |
0 |
1 |
1 |
-1 |
|
|
|
U |
0 |
1 |
0 |
1 |
-1 |
0 |
|
|
Fig. 3
La questione di base
Naturalmente, la questione di base che
si pone riguarda la possibilità o meno di prevedere il comportamento dei
giocatori, ossia di predire il risultato del gioco. In qualche caso
l'individuazione del risultato può essere banale, ma tali
casi sono un'eccezione. Alcuni semplici esempi basteranno a guidarci
verso l'obiettivo di illustrare la problematica a cui il concetto di Equilibrio
di Nash fornisce una soluzione. Non si tratta di una soluzione
esente da punti deboli, ma è un dato di fatto che il concetto di equilibrio di Nash si è
rivelato essere il più fecondo di applicazioni nella TdG.
Non si contano poi gli utilizzi nelle soluzioni proposte per problemi di economia (oligopoli, contrattazione, equilibri di
mercato, beni pubblici, aste, assicurazioni, …), politica (controllo degli
armamenti, elezioni, istruzione superiore) o, anche, biologia (teorie
evolutive).
Esempi astratti
Supponiamo che per il giocatore 1 le
strategie siano "alto", "basso" (nel gioco C vi è una terza
strategia "medio"), mentre per il giocatore 2 sono
"sinistra" e "destra". Consideriamo allora i quattro giochi
A, B, C e D riportati in seguito. Riscontriamo una profonda differenza tra il
gioco A e i giochi B e C. Viene da dire che A non è un
vero gioco dato che in esso non esiste una vera
situazione di conflitto tra i giocatori. Assumendo, come stiamo facendo, il
comportamento razionale di questi ultimi, il risultato di A
non può che essere (basso, destra), ossia in A è possibile che ogni giocatore
raggiunga la massima utilità a sua disposizione.
Gioco A |
Secondo giocatore |
||||||
Sinistra |
Destra |
||||||
Primo giocatore |
Alto |
1 |
2 |
3 |
1 |
|
|
Basso |
2 |
0 |
4 |
6 |
|
|
Gioco B |
Secondo giocatore |
||||||
Sinistra |
Destra |
||||||
Primo giocatore |
Alto |
1 |
2 |
0 |
1 |
|
|
Basso |
2 |
1 |
1 |
0 |
|
|
Sia in B che in C i due giocatori possono
avere una vincita al più pari a 2. Tuttavia la coppia dei guadagni non è mai pari a 2, 2 il che
determina la presenza di un conflitto tra i giocatori sia in B che in C.
Va da sé che i giochi non conflittuali non sono interessanti. Anche tra B e C
vi è una differenza che rende B molto meno
interessante di C. Infatti, sebbene per B il risultato non sia così banale come
per A, con solo un po' di attenzione in più notiamo che B non può che
risolversi in (basso, sinistra). Il punto è
che l'agente 1 non può che scegliere la strategia "basso" in quanto essa gli garantisce comunque una vincita maggiore
indipendentemente da ciò che sceglie il giocatore 2. Analogamente, quest'ultimo, per la stessa ragione, non può che optare per la strategia "sinistra". Nel caso del gioco
B si dice che esso si risolve per dominanza esistendo per il giocatore 1 la strategia
dominante "basso" e per 2 la strategia
dominante "sinistra". Decisamente, il gioco
C è più interessante. Semplicemente perché non siamo in grado
di prevedere il comportamento né del giocatore 1 né di 2.
Effettivamente, quale che sia la scelta dell'agente 1
(lo stesso discorso vale per 2), egli ne sarà soddisfatto o meno esclusivamente
in funzione del comportamento dell'avversario. Dunque, egli non ha alcuna
ragione per preferire a priori una o un'altra delle alternative
disponibili. Questa incapacità di previsione suggerisce di raffinare la nostra
analisi che, d'altra parte, finora si è basata su considerazioni molto ingenue.
Si intuisce che sono due le direzioni da esplorare
quando ci si trova di fronte a giocatori che non hanno strategie preferibili a
priori. Primo, ci si deve chiedere quale può essere in questo caso la
"ratio" che guiderà le scelte dei giocatori; secondo, quale può
essere il senso da attribuire all'espressione "giocata
soddisfacente". Alla prima domanda si risponde pervenendo al concetto di
strategia mista. Quanto alla risposta alla seconda, essa conduce al concetto di Equilibrio di Nash.
Gioco C |
Secondo giocatore |
||||||
Sinistra |
Destra |
||||||
Primo giocatore |
Alto |
2 |
1 |
0 |
0 |
|
|
Medio |
0 |
0 |
1 |
1 |
|
|
|
Basso |
1 |
2 |
2 |
0 |
|
|
Gioco D |
Secondo giocatore |
||||||
Sinistra |
Destra |
||||||
Primo giocatore |
Alto |
1 |
1 |
1 |
0 |
|
|
Basso |
2 |
1 |
0 |
4 |
|
|
Strategie miste
Continuiamo a far riferimento al gioco C e,
indifferentemente, al giocatore 1 oppure 2. All'agente che non ha ragioni per
preferire a priori alcuna delle alternative possibili,
non resta che operare una scelta casuale. Ma anche
questa può essere "razionalizzata" e, allora, egli capirà che possono
esistere scelte casuali più vantaggiose di altre. Verosimilmente, pensando ad
una scelta casuale, il giocatore penserà ad una ingenua
equiprobabilità delle alternative. Tuttavia, questo
non è l'unico modo concepibile di procedere. Simuliamo con dei sorteggi il
meccanismo di scelta a caso. Possiamo immaginare che 1 scelga "alto,
medio, basso" a seguito dell'estrazione di una pallina da un'urna che
contiene solo palline di tre colori differenti, corrispondenti ad "alto,
medio, basso", in una data proporzione. Per fissare le idee, le
percentuali di palline dei tre tipi siano rispettivamente a, m=1-a-b e b. Evidentemente, agendo sulla coppia di
numeri a,b il giocatore 1 potrà stabilire di
propendere di più o di meno per una delle alternative [3]. Analogamente, per il
giocatore 2, un'urna contenente solo palline "sinistre" e
"destre" in una data proporzione s
(di sinistre, 1-s di destre), guiderà la scelta casuale
della strategia di gioco.
Razionalità vuole che i giocatori operino, prima
dell'effettiva estrazione della strategia da giocare, delle scelte di (a,b) ed s mirate, egoisticamente, ad
accrescere le aspettative di vincita individuale.
La coppia di numeri (a,b) ed il numero s sono, per i
due giocatori, le strategie miste:
una nuova gamma di opzioni disponibili, molto più estesa dell'originaria
costituita dalle sole strategie pure "alto, medio, basso" e "sinistra, destra". Il
solo ricorso alle strategie miste non dà però garanzia che un gioco possa risolversi semplicemente. Con riferimento al gioco C,
il conflitto permane (ossia non è possibile trovare (a,b) ed s in modo da massimizzare
simultaneamente le aspettative di entrambi i giocatori) e non esistono
strategie dominanti.
Equilibri
di Nash
Quello che distingue i giochi A e
B dal gioco C è che, mentre nei primi due siamo in grado di isolare, seguendo
banali criteri di razionalità, un comportamento privilegiato dei giocatori, nel
terzo questo non ci pare possibile. Allora non resta che tentare di usare
criteri di razionalità meno semplici e meno vincolanti. A questo scopo, notiamo
che soluzioni (basso, destra) e (basso, sinistra) prospettate
per i giochi A e B hanno in comune l'ovvio fatto che se i due giocatori fossero
chiamati a ripetere il gioco, entrambi non modificherebbero il loro modo di
giocare in quanto ciascuno non
avrebbe potuto giocare meglio dato il gioco avversario. L'idea, semplice e geniale al
contempo, di Nash è quella di isolare proprio questa
circostanza come un possibile criterio di gioco razionale.
Dunque,
in un gioco, con un numero qualsiasi di
giocatori, un risultato rispetta il criterio di Nash
se nessun giocatore modificherebbe la propria strategia, restando ferme le
strategie degli altri.
E' chiaro che di fronte all'effettivo presentarsi di un
risultato che rispetti il criterio di Nash, ogni partecipante al gioco non ha modo di pentirsi
della scelta effettuata: di meglio non avrebbe potuto fare, visto il gioco
avversario; ne segue che sarà così indotto a ripetersi qualora il gioco si
ripetesse. Questa circostanza chiarisce il fatto che
si parli di risultato di equilibrio.
Nel gioco C selezioniamo immediatamente (alto, sinistra)
come equilibrio di Nash. Il gioco D, invece, è privo di equilibri di Nash, ossia questi
ultimi possono anche non esistere.Questa circostanza
annullerebbe la portata del concetto di equilibrio di Nash se non accadesse, invece, che, allargando il gioco con
il coinvolgimento delle strategie miste, è sempre possibile trovare equilibri.
In altri termini, un gioco può non ammettere equilibri di Nash
fin tanto che ci si limita alle strategie pure, ma, e questo è il famoso
Teorema di Nash, il
passaggio a strategie miste garantisce l'esistenza di risultati di equilibrio per qualsiasi gioco.
Il dilemma del prigioniero presenta un unico equilibrio di Nash. Infatti, sia Mario che Carlo hanno
una strategia dominante: collaborare. Ciò determina un singolare risultato per
questo gioco. I due pregiudicati saranno condannati a 10 anni pur essendo a priori disponibile il risultato di gran lunga migliore di
una condanna per entrambi a due anni. Il dilemma del prigioniero mette in evidenza il contrasto che può presentarsi tra
razionalità individuale e collettiva. Se Mario e Carlo optano
entrambi per non collaborare ottengono la massima utilità collettiva possibile;
quando egoisticamente puntano alla migliore utilità individuale finiscono per
danneggiarsi entrambi. Nel giudizio di Salomone ci sono due equilibri di Nash S,S e U,S. In un certo senso
essi sono indistinguibili poiché determinano lo stesso esito: l'affidamento a
Seconda. Per contro, la Bibbia racconta che Prima scelse S e Seconda, pur
avendo una strategia dominante (quella centrale) scelse
U, rivelando così di non essere la vera madre. Un colpo di
fortuna per Salomone che, in verità, non avrebbe mai potuto scoprire la vera
madre se Seconda avesse agito in modo razionale.La
guerra dei quotidiani presenta, in strategie pure, due equilibri di Nash: (pensioni, costituzione) e il simmetrico
(costituzione, pensioni). Questo gioco, pur nella sua semplicità, mette in evidenza, con possibili risultati paradossali, la
delicatezza delle questioni di cui si occupa la TdG.
L'esistenza di due equilibri non consente di garantire una previsione per il
risultato del gioco. E', inoltre, concepibile che l'egoismo di ciascuno porti a
puntare all'equilibrio più vantaggioso. In tal caso il risultato del gioco è
(pensioni, pensioni) e lascerebbe insoddisfatti
entrambi i contendenti.