A la dècada de 1930, John von Neumann i Oscar Morgenstern es van convertir en els fundadors d'una nova i interessant branca de les matemàtiques anomenada "teoria de jocs". A la dècada de 1950, el jove matemàtic John Nash es va interessar en aquesta direcció. La teoria de l'equilibri es va convertir en el tema de la seva tesi, que va escriure als 21 anys. Així va néixer una nova estratègia de joc anomenada "Nash Equilibrium", que va guanyar el Premi Nobel molts anys més tard, el 1994.
La llarga distància entre escriure una tesi i el reconeixement general s'ha convertit en una prova per a un matemàtic. El geni sense reconeixement va provocar greus trastorns mentals, però John Nash va poder resoldre aquest problema gràcies a la seva excel·lent ment lògica. La seva teoria de l'equilibri de Nash va guanyar un premi Nobel i la seva vida va ser filmada a Beautiful mind.
Breument sobre la teoria de jocs
Com que la teoria de l'equilibri de Nash explica el comportament de les persones en les condicions d'interacció, val la pena considerar els conceptes bàsics de la teoria de jocs.
La teoria de jocs estudia el comportament dels participants (agents) en termes d'interacció entre ells com un joc, quan el resultat depèn de la decisió i el comportament de diverses persones. El participant pren decisions basant-se en les seves prediccions sobre el comportament dels altres, que s'anomena estratègia de joc.
També hi ha una estratègia dominant en què el participant obté el millor resultat per qualsevol comportament dels altres participants. Aquesta és la millor estratègia de guanyar-guanyar del jugador.
El dilema del presoner i l'avenç científic
El dilema del presoner és un cas de joc on els participants es veuen obligats a prendre decisions racionals, aconseguint un objectiu comú davant un conflicte d' alternatives. La qüestió és quina d'aquestes opcions escollirà, adonant-se de l'interès personal i general, així com de la impossibilitat d'aconseguir ambdues. Els jugadors semblen estar empresonats en un entorn de joc dur, cosa que de vegades els fa pensar de manera molt productiva.
Aquest dilema va ser explorat pel matemàtic nord-americà John Nash. L'equilibri que va aconseguir va ser revolucionari a la seva manera. Aquest nou pensament va influir especialment en l'opinió dels economistes sobre com els actors del mercat prenen decisions, tenint en compte els interessos dels altres, amb una estreta interacció i intersecció d'interessos.
El millor és estudiar teoria de jocs a través d'exemples concrets, ja que aquesta disciplina matemàtica en si no és completament teòrica.
Exemple del dilema del presoner
Exemple, dues persones van cometre un robatori, van caure en mans de la policia i estan sent interrogades en cel·les separades. Paral·lelament, els agents de policia ofereixen a cada participant condicions favorables en les quals serà posat en llibertat si declara contra la seva parella. Cadascunels criminals tenen el següent conjunt d'estratègies que tindrà en compte:
- Tots dos testifiquen al mateix temps i reben 2,5 anys de presó.
- Tots dos callen al mateix temps i reben 1 any cadascun, perquè en aquest cas la base d'evidència de la seva culpa serà petita.
- Un declara i és alliberat, mentre que l' altre calla i rep 5 anys de presó.
Òbviament, el resultat del cas depèn de la decisió dels dos participants, però no es poden posar d'acord, perquè estan asseguts en cel·les diferents. També és ben visible el conflicte dels seus interessos personals en la lluita per un interès comú. Cadascun dels presoners té dues opcions d'acció i 4 opcions de resultats.
Cadena d'inferències lògiques
Per tant, el delinqüent A està considerant les opcions següents:
- Jo callo i la meva parella calla; tots dos passarem 1 any de presó.
- Entrego la meva parella i ell em lliura a mi; tots dos tenim 2,5 anys de presó.
- Estic en silenci i la meva parella em traeix: em faré 5 anys de presó i ell serà lliure.
- Entrego la meva parella, però ell calla: tinc llibertat i ell rep 5 anys de presó.
Donem una matriu de possibles solucions i resultats per a més claredat.
Taula de possibles resultats del dilema del presoner.
La pregunta és, què triarà cada concursant?
"Silenci, no pots parlar" o "No pots callar, no pots parlar"
Per entendre l'elecció del participant, cal passar per la cadena dels seus pensaments. Seguint el raonament del penal A: si callo i la meva parella calla, rebrem un termini mínim (1 any), però joNo sé com es comportarà. Si declara contra mi, és millor que declari, sinó puc seure durant 5 anys. Prefereixo seure durant 2,5 anys que 5 anys. Si ell guarda silenci, encara més necessito declarar, perquè així aconseguiré la meva llibertat. Participant B.
No és difícil veure que l'estratègia dominant per a cadascun dels autors és declarar. El punt òptim d'aquest joc arriba quan tots dos delinqüents testifiquen i reben el seu "premi": 2,5 anys de presó. La teoria de jocs de Nash l'anomena equilibri.
Solució de Nash òptima no òptima
La naturalesa revolucionària de la visió de Nashi és que aquest equilibri no és òptim quan es considera el participant individual i el seu propi interès. Després de tot, la millor opció és romandre en silenci i sortir lliure.
L'equilibri de Nash és un punt de convergència d'interessos, on cada participant tria l'opció òptima per a ell només si els altres participants trien una estratègia determinada.
Tenint en compte l'opció quan tots dos delinqüents callen i reben només 1 any, podem anomenar-la una opció òptima de Pareto. No obstant això, només és possible si els delinqüents es poden posar d'acord per endavant. Però fins i tot això no garantiria aquest resultat, ja que la temptació de retirar-se de l'acord i evitar el càstig és gran. La manca de confiança total en els altres i el perill d'aconseguir 5 anys obligats a escollir l'opció amb reconeixement. Reflexioneu sobre què respectaran els participantsopció amb el silenci, actuar en concert, és simplement irracional. Aquesta conclusió es pot extreure si estudiem l'equilibri de Nash. Els exemples només donen la raó.
Egoista o racional
La teoria de l'equilibri de Nash va produir conclusions sorprenents que van desmentir els principis que existien abans. Per exemple, Adam Smith va considerar que el comportament de cadascun dels participants era completament egoista, cosa que va posar el sistema en equilibri. Aquesta teoria es va anomenar la "mà invisible del mercat".
John Nash va veure que si tots els participants actuen en el seu propi interès, això mai conduirà a un resultat grupal òptim. Atès que el pensament racional és inherent a cada participant, és més probable l'opció que ofereix l'estratègia d'equilibri de Nash.
Experiment purament masculí
Un bon exemple és el joc de la paradoxa rossa, que, tot i que sembla fora de lloc, és una clara il·lustració de com funciona la teoria de jocs de Nash.
En aquest joc has d'imaginar que una companyia de nois lliures va arribar a un bar. A prop hi ha una companyia de noies, una de les quals és preferible a les altres, diuen una rossa. Com actuen els nois per aconseguir la millor núvia?
Per tant, el raonament dels nois: si tothom comença a familiaritzar-se amb la rossa, el més probable és que ningú ho entendrà, llavors els seus amics no voldran conèixer-se. Ningú vol ser el segon recurs. Però si els nois decideixen evitarrossa, llavors la probabilitat que cadascun dels nois trobi una bona xicota entre les noies és alta.
La situació d'equilibri de Nash no és òptima per als nois, perquè, perseguint només els seus propis interessos egoistes, tothom escolliria la rossa. Es pot veure que la recerca només d'interessos egoistes equivaldrà a l'enfonsament dels interessos del grup. L'equilibri de Nash significarà que cada noi actua pels seus propis interessos, que estan en contacte amb els interessos de tot el grup. Aquesta no és la millor opció per a tothom personalment, sinó la millor per a tothom, segons l'estratègia general d'èxit.
Tota la nostra vida és un joc
La presa de decisions al món real s'assembla molt a un joc on també esperes certs comportaments racionals d' altres participants. En els negocis, a la feina, en equip, en una empresa i fins i tot en les relacions amb el sexe oposat. Des de grans negocis fins a situacions de la vida normal, tot obeeix una llei o una altra.
Per descomptat, les situacions de joc anteriors amb delinqüents i un bar són només il·lustracions excel·lents que demostren l'equilibri de Nash. Exemples d'aquests dilemes sorgeixen molt sovint al mercat real, i això funciona especialment en els casos en què dos monopolistes controlen el mercat.
Estratègies mixtes
Sovint estem involucrats no en un, sinó en diversos jocs alhora. Escollint una de les opcions en un joc, guiat per una estratègia racional, però acabes en un altre joc. Després d'unes quantes decisions racionals, potser trobareu que el vostre resultat no és del vostre gust. Quèprendre?
Considerem dos tipus d'estratègia:
- L'estratègia pura és el comportament del participant, que prové de pensar en el possible comportament d' altres participants.
- L'estratègia mixta o aleatòria és l' alternança d'estratègies pures a l'atzar o l'elecció d'una estratègia pura amb una certa probabilitat. Aquesta estratègia també s'anomena aleatòria.
Tenint en compte aquest comportament, fem una nova mirada a l'equilibri de Nash. Si abans es deia que el jugador tria una estratègia una vegada, llavors es pot imaginar un altre comportament. Es pot suposar que els jugadors trien una estratègia aleatòriament amb una certa probabilitat. Els jocs que no poden trobar equilibris de Nash en estratègies pures sempre els tenen en estratègies mixtes.
L'equilibri de Nash en estratègies mixtes s'anomena equilibri mixt. Es tracta d'un equilibri on cada participant tria la freqüència òptima per triar les seves estratègies, sempre que altres participants triin les seves estratègies amb una freqüència determinada.
Penals i estratègia mixta
Un exemple d'estratègia mixta es pot trobar al joc de futbol. La millor il·lustració d'una estratègia mixta és potser una tanda de penals. Així doncs, tenim un porter que només pot s altar a un córner i un jugador que farà el penal.
Així doncs, si la primera vegada que el jugador tria l'estratègia per disparar a l'angle esquerre, i el porter també cau en aquest córner i agafa la pilota, com poden evolucionar les coses la segona volta? Si el jugadorcolpejarà a la cantonada oposada, és probable que això sigui massa evident, però colpejar a la mateixa cantonada no és menys evident. Per tant, tant el porter com el llançador no tenen més remei que confiar en la selecció aleatòria.
Així, alternant la selecció aleatòria amb una determinada estratègia pura, el jugador i el porter intenten obtenir el màxim resultat.