Cooperación en un mundo de egoísmo: una mirada desde la teoría de juegos

Por Angelo Garizio

La teoría de juegos es el estudio matemático enfocado específicamente en el análisis de las interacciones estratégicas entre agentes, cuando se tiene en cuenta que los outcomes no solo dependen de sus decisiones, sino que también de las de los demás. Uno de los juegos más conocidos dentro de la teoría de juegos es el “Dilema del Prisionero”, el cual describe una situación en la que dos individuos arrestados por un delito tienen que decidir si cooperar entre ellos o traicionar al otro para obtener un beneficio personal. En el escenario típico se tiene a dos jugadores (prisionero 1 y 2), quienes son interrogados por separado y deben decidir si cooperar con el otro prisionero (mantenerse en silencio) o delatar al otro prisionero con el fin de obtener una sentencia más leve[1]. Tras la toma de decisiones, los posibles resultados del juego estándar son los siguientes:

  • Si ambos permanecen en silencio, ambos obtienen una sentencia moderada.
  • Si ambos delatan, ambos obtienen una sentencia severa.
  • Si uno delata, pero el otro permanece en silencio, el primero obtiene una sentencia leve, mientras que el otro obtiene una sentencia muy severa.

En el equilibrio de este juego se tendrá que ambos prisioneros se traicionarán entre sí, ya que ambos tienen incentivos a desviarse y no cooperar, tratando de obtener la sentencia más leve. Este equilibrio representa un resultado subóptimo en donde, actuando de manera racional, ambos prisioneros están peor que si hubieran cooperado el uno con el otro.

Teniendo este resultado en mente, la cooperación entre individuos (sin que exista una autoridad que obligue a cooperar) pareciera ser un fenómeno inexplicable dentro de la naturaleza. Sin embargo, los resultados pueden variar cuando el juego de los prisioneros ser repite en el tiempo.

En 1981 el cientista político y profesor de política pública en la universidad de Michigan, Robert Axelrod, realizó un experimento para poder investigar y comprender las estrategias que podrían emerger y evolucionar en interacciones sociales repetidas, específicamente en el contexto del dilema del prisionero. El experimento se basó en realizar un “torneo de la iteración del dilema del prisionero», en donde se invitó a académicos y expertos en teoría de juegos a presentar estrategias (o jugadores virtuales) para interactuar repetidamente en el dilema del prisionero con otros participantes (similar a los torneos en donde programas de computador juegan ajedrez entre ellos). Cada estrategia debía enfrentarse a las demás individualmente (1 vs 1) en un número de rondas desconocido para los participantes. En este juego, los posibles puntajes a obtener en cada ronda eran los siguientes:

  • Si ambos cooperan, ambos reciben 3 puntos.
  • Si ambos delatan, ambos reciben 1 punto.
  • Si uno delata, pero el otro coopera, el primero obtiene 5 puntos, mientras que el segundo obtiene 0 puntos.

 

Estrategias como la llamada “Friedman” iniciaban la ronda 1 cooperando, y se mantenían así hasta que el otro jugador lo delatara. De este punto en adelante “Friedman” mantendría un resentimiento y delataría al otro jugador en todas las rondas restantes, sin importar cómo este actuara.

Mientras que otras, como “All Cooperate” (ALLC) siempre cooperaban, independiente de cómo actuara el otro jugador.

Tras la realización del torneo, Axelrod encontró que la estrategia (o jugador) que más puntos había logrado sumar al final de la interacción con cada una de las otras estrategias, era una llamada “Tit-for-Tat” (TFT). Esta era una de las tácticas más simples de todas y consistía en iniciar cooperando en la ronda 1, para luego copiar lo que hiciera el otro jugador en la ronda anterior.

Además, el profesor logró identificar que las estrategias que más puntos habían logrado sumar al final del torneo compartían cuatro cualidades:

  1. Agradables: Nunca son los primeros en delatar.
  2. Clementes: Son capaces de tomar represalias en contra de un jugador que lo delató en la ronda anterior, pero no mantienen el resentimiento en las rondas siguientes.
  3. Firmes: No dejan que nadie saque provecho de ellos. Si un jugador los delata, tomarán represalias inmediatamente en la próxima ronda.
  4. Claras: Es fácil establecer un patrón de confianza con ellas.

Si bien, dada la programación de TFT, este solo era capaz de empatar o perder en los partidos contra cada otro jugador, el hecho de que este tipo de juegos no sea de «suma 0» (es decir, que la ganancia de uno de los tomadores de decisiones no necesariamente resulta en la pérdida de los demás tomadores de decisiones) permite que TFT logre sumar la mayor cantidad de puntos.

Es importante notar que en la gran mayoría de las interacciones que se tienen en el día a día, la ganancia de uno no necesariamente implica la pérdida de otro, lo que posibilita que la cooperación nazca incluso entre rivales que solo velan por su propio bienestar. Un ejemplo de esto es el «Strategic Arms Reduction Treaty», un acuerdo entre Estados Unidos y la Unión Soviética a principios de los 90 que tuvo como fin la prevención de un conflicto nuclear, mediante el desarme gradual del stock de bombas nucleares que cada potencia tenía en su posesión, lo que le permitiría a cada potencia ahorrar una cantidad significativa de dinero y tiempo que originalmente se habrían usado en el desarrollo de estas armas. Para el año 2001, esta cooperación había logrado el desmantelamiento de un 80% de las armas nucleares de todo el mundo [2].

De este análisis se desprende que, en este tipo de interacciones repetitivas a lo largo del tiempo, la cooperación entre dos partes puede surgir incluso sin la más mínima intención altruista, ya que la colaboración en sí puede implicar un beneficio personal tan grande como el ahorro de miles de millones de dólares en el desarrollo de armas nucleares[3]. Además, la adopción de cualidades como la amabilidad, la clemencia, la firmeza y la claridad puede ayudarnos a maximizar los beneficios que se obtienen de este tipo de interacciones, lo que significa que, al menos en este caso, nice guys finish first.

 

Referencias:

Axelrod, R., & Hamilton, W. D. (1981). The evolution of cooperation. Science, 211(4489), 1390-1396. https://doi.org/10.1126/science.7466396

NTI. (2008, 30 septiembre). The costs of U.S. nuclear weapons. The Nuclear Threat Initiative. https://www.nti.org/analysis/articles/costs-us-nuclear-weapons/

Schumann, A. (2023, 19 mayo). Strategic Arms Reduction Treaty (START I). Center for Arms Control and Non-Proliferation. https://armscontrolcenter.org/strategic-arms-reduction-treaty-start-i/#:~:text=The%20Strategic%20Arms%20Reduction%20Treaty,U.S.%20and%20the%20Soviet%20stockpiles

Prisoner’s Dilemma (Stanford Encyclopedia of Philosophy). (2003, 11 agosto). https://users.auth.gr/kehagiat/Research/GameTheory/01Encyclopedia/Prisoner’s%20Dilemma%20(Stanford%20Encyclopedia%20of%20Philosophy).htm

 

 

 

[1] Prisoner’s Dilemma (Stanford Encyclopedia of Philosophy). (2003, 11 agosto).

[2] Schumann, A. (2023, 19 mayo). Strategic Arms Reduction Treaty (START I). Center for Arms Control and Non-Proliferation.

[3] NTI. (2008, 30 septiembre). The costs of U.S. nuclear weapons. The Nuclear Threat Initiative.

Compártelo en tu red social favorita

Get Curated Post Updates!

Sign up for my newsletter to see new photos, tips, and blog posts.