Tag

, , , , , , , ,

Leggendo il libro di Robert Axelrod, Giochi di reciprocità, Feltrinelli (1985) ci si imbatte in un curioso aspetto derivato dal funzionamento di un programma elettronico; il libro in particolare tratta della Teoria dei giochi, una branca della matematica che ricerca i modelli di comportamento tra due o più soggetti che interagiscono tra loro (in gioco appunto). Axelrod si chiede se, al contrario di quanto afferma il classico “Dilemma del prigioniero”, non sia invece la cooperazione tra le parti, anziché il conflitto, la via migliore per ottenere i risultati più soddisfacenti.

 

Per verificare la sua tesi, sfruttò un concorso tra programmatori: essi avrebbero dovuto creare dei programmi in grado di interagire a due a due tra loro o cooperando (non accusando) o defezionando (accusando) con l’altro giocatore. A seconda dei risultati, i giocatori avrebbero ottenuto le seguenti ricompense:

– R, mutua operazione = 3 punti.

– S, io coopero ma l’altro defeziona = o punti.

– T, io defeziono e l’altro coopera = 5 punti.

– P, mutua defezione = 1 punto.

Un ultimo parametrio da tenere in considerazione è il peso “w”: altro non è che l’importanza della prossima mossa rispetto all’attuale; è una sorta di “parametro di sconto”.

Vince la partita chi al termine della manche totalizza più punti; vince il gioco in generale chi totalizza in complesso più punti rispetto agli altri.

 

A prima vista, potrebbe sembrare che la tecnica vincente sia quella di ricondurre sempre e comunque le possibilità alla scelta T o, in alternativa, alla scelta P; la scelta S dovrebbe invece essere evitata come la peste, mentre la R appare come puro miraggio.

Ebbene, questa NON è la situazione migliore per ottenere la vittoria. Vediamo come mai.

 

Il vincitore assoluto è risultato essere il programma nominato TIT FOR TAT, che potremmo tradurre come “colpo su colpo”; ma quali sono le caratteristiche di tale programma, che gli hanno permesso di risultare come vincitore globale (sebbene da molte manche sia uscito sconfitto)?

Il suo funzionamento è elementare: dato un certo imput, il programma si avvierà con una scelta predefinita (nel nostro caso “non defezionare”), per poi copiare nella sua mossa successiva l’azione precedentemente intrapresa dall’avversario. Esso si basa su 4 assunti:

– Bontà: questa proprietà impedisce al programma di scegliere come mossa iniziale l’azione “defezionare”; in tal modo esso non apparirà ostile all’altro giocatore, che potrà essere indotto in qualche modo a “fidarsi” di lui.

– Clemenza: questa proprietà indica la capacità del programma di “perdonare”, di “dimenticarsi” certe volte del fatto che l’altro programma abbia defezionato contro di lui; ciò però non è a conteggio infinito, e ciò ci porta alla terza proprietà.

– Provocabilità: questa proprietà indica la capacità del programma di reagire in tempi rapidi alla sfida lanciata dall’altro programma; essa limita la proprietà precedente, imponendo un numero limitato di volte in cui il programma “passa sopra” alle cattiverie dell’avversario.

– Trasparenza: questa proprietà indica la capacità del programma di essere facilmente intelligibile dal proprio avversario che, non notando in tal modo aspetti oscuri o poco chiari che potrebbero nuocergli, dovrebbe essere spinto a cooperare con TFT.

 

Eseguendo varie prove e terminando molteplici sfide, TFT non ha dato prova di essere il migliore spesso e volentieri nelle singole sfide; eppure, a conti fatti, al termine della gara è risultato avere il maggior punteggio assoluto, ben più di programmi “cattivi” che avevano seguito in sostanza l’ipotesi iniziale.

Perché è avvenuto questo? Semplice: TFT, nonostante non fosse in grado di vincere contro programmi che adottavano strategia complicate volte a ricadere il più possibile nell’opzione T elencata all’inizio, grazie ai suoi parametri (soprattutto ai primi due) dava prova di essere disposto alla cooperazione se anche dall’altra parte v’era la medesima intenzione, incatenando così una serie positiva di R molto più proficua d’un continuo risolversi in P.

 

Da questi dati, Axelrod ne ricava quattro leggi comportamentali:

Non essere invidiosi nei confronti dell’altro, non dando così pretesti per un’apertura di possibili scontri.

Non essere mai i primi a defezionare, onde non “partire con il piede sbagliato”, generando così un’innata antipatia nell’altro che potrebbe portare anche qui allo scoppio di conflitti.

– Ricambiare sempre sia la defezione che la cooperazione, secondo il principio di reciprocità: porgere sempre ed incondizionatamente l’altra guancia provocherà soltanto danni a noi stessi, mentre accanirsi in modo sadico ci bollerà come esseri malvagi.

Non esagerare in astuzia, bensì cercare di essere i più trasparenti possibili, onde non dare come si è detto motivo di sospetto nei propri confronti da parte dell’altro.

 

Come si vede, “fare i buoni” paga molto di più che non comportarsi egoisticamente. Matematica docet.

 

«La solidarietà dunque è la condizione nella quale l’uomo raggiunge il massimo grado di sicurezza e di benessere; e perciò l’egoismo stesso, cioè la considerazione esclusiva del proprio interesse, spinge l’uomo e le società umane verso la solidarietà». Errico Malatesta

Annunci