Nueva estrategia para el dilema del prisionero

Nueva estrategia para el dilema del prisionero
Fuente: Wikimedia Commons.
Descubren una nueva estrategia ganadora egoísta en el juego del dilema del prisionero iterado, pero ésta no es evolutivamente estable.

El dilema del prisionero se descubrió durante la guerra fría en RAND, un think tank creado en un principio por las fuerzas armadas norteamericanas y que todavía existe.

El dilema del prisionero se estudió a la luz de la teoría de juegos, una disciplina desarrollada por Von Neumann y mejorada por John F. Nash (sí, el de la película “Una mente maravillosa”).

La teoría de juegos trata de proponer las mejores estrategias de cara a ciertas situaciones o conflictos y trata de explica los sistemas organizativos en la cooperación.

Así por ejemplo, con la teoría de juegos se puede explicar por qué el personaje de James Deen hace bien en desertar en el juego de “Gallina” y no estrellarse junto con el auto que conducía, aunque en la vida real muriera en un accidente de tráfico.

También explica por qué nos colamos en el metro, seguimos en un matrimonio fracasado y por qué es mejor seguir en el puesto de caza de venados en lugar de disparar al primer conejo que aparece. Incluso algunos han aplicado la teoría de juegos con cierto éxito para ganar al póquer Texas holdem.

El dilema del prisionero fue descubierto por Merrill Flood y Melvin Dresher en 1950 mientras que trabajaban en RAND. Trata de dos ladrones a los que captura la policía por cometer un delito, pero sobre los que no tienen pruebas concluyentes a no ser que alguno confiese. Se les interroga por separado y se les ofrece un trato.

Si uno de ellos culpa al compañero saldrá libre y el otro irá un año a la cárcel siempre y cuando éste no le delate. Si ambos se callan (cada uno coopera, en el lenguaje de la teoría de juegos) ambos van un mes a la cárcel, pero si ambos hablan (cada uno deserta, en el lenguaje de la teoría de juegos) van tres meses a prisión.

Es un juego que no es de suma cero. El problema es que los compinches no se pueden comunicarse entre sí y el “juego” es a una sola mano o jugada.
El dilema del prisionero no tiene solución racional. Es decir, no hay una estrategia tomada de modo racional que su adopción no conlleve al arrepentimiento a posteriori por haber tomado esa decisión al final del juego.

Lo más racional parece que es desertar, pero en ese caso ambos van a la cárcel por más tiempo que si hubieran cooperado. Pero si uno coopera se arriesga a que el otro no lo haga.

El dilema del prisionero se usó como modelo de la guerra nuclear, un “juego” que también se jugaría a una sola mano y que tampoco era de suma cero. Era para sentirse aterrorizado ante la posibilidad de que una decisión “racional” llevara a la guerra nuclear total entre superpotencias.

Aunque Neumann estaba deseando que tal cosa ocurriera con tal de borrar a la Unión Soviética del mapa. Neumann murió agónicamente de un cáncer en los huesos después de haber desarrollado la computación moderna, la reformulación de la Mecánica Cuántica y muchas otras cuestiones científicas como la teoría de juegos.

A Nash se le empezó a manifestar su esquizofrenia y quedó fuera del mundo científico durante una larga temporada.

Tiempo más tarde fue recuperado gracias a los fármacos (aunque esas drogas siempre matan esa chispa de inteligencia extra de los que pacientes) y recibió el premio Nóbel. Pese a sus 84 años sigue trabajando y proporcionando contribuciones, la última un trabajo sobre teoría de juegos en 2011.

El dilema del prisionero tiene solución si se juega interactivamente, de este modo se puede forzar la cooperación de la otra parte.

Hay programas de ordenador que así lo demuestran. No son demostraciones matemáticas al uso, sino pruebas de computación experimental que estadísticamente demuestran que una determinada estrategia funciona mejor que otras la mayoría de las ocasiones.

Hay que tener en cuenta que en estos juegos iterados no se tiene en cuenta en ningún momento la psicología de los individuos, una ética o una moral. Los que juegan son agentes computacionales que se juegan puntos fríamente. Podemos dejar de llamar a estos jugadores “compinches” para denominarles “oponentes” o “contrincante”.

Hasta ahora la mejor estrategia que se había encontrado era la “toma y daca”, que consiste en repetir la jugada anterior del contrincante. Así, si la vez anterior el oponente desertó entonces le respondemos desertando y si cooperó entonces cooperamos.

Durante décadas se han hecho simulaciones que parecían indicar que esta solución simétrica era la mejor. Lo que nos dice este resultado es que el egoísmo termina pagando un precio y que, por tanto, la cooperación puede surgir evolutivamente al reprimirse los comportamientos egoístas en una población.

Pero realmente no existe una mejor estrategia universal para jugar al dilema del prisionero iterado. La estrategia ganadora depende del oponente.

Hace unos meses Freeman Dyson y William Press, de las universidades de Princeton y Texas respectivamente, anunciaron el descubrimiento de una nueva estrategia para el dilema del prisionero iterado que garantiza a uno de los jugadores mayores ganancias que el otro, lo que supuso una gran sorpresa.

Esto podría tener una gran impacto en otras disciplinas como en Economía o en Biología Evolutiva. Básicamente el resultado dice que hay comportamientos egoístas que pueden resultar ser estrategias ganadoras sobre la cooperación.

La nueva solución se encuadra en lo que se llama estrategias de determinante cero, porque se fuerza a que el valor de un determinante sea nulo (un determinante es una función matemática que asigna un valor numérico a una matriz cuadrada). La estrategia “toma y daca” sería un caso particular de estrategia de determinante cero, pero hay muchas más dependiendo del tiempo que el contrincante “pasa en la cárcel”.

En esta clase de estrategia se puede forzar al oponente a aceptar un reparto desigual o que no lo acepte con un alto coste para los dos. El truco reside en que el oponente no se tiene que dar cuenta de que está siendo manipulado, porque en ese caso la situación degenera en la que se da en el juego del ultimátum, que tanto hemos visto por aquí

. Si el oponente se da cuenta entonces ambos van mucho tiempo a la cárcel (o pierden el equivalente en puntos).

Este trabajo ha tenido un gran impacto en el mundo académico, aunque no es del todo nuevo. En 1997 Karl Sigmund (Universidad de Vienna), Martin Nowak (Universidad de Harvard) y Maarten Boerlijst (Universidad de Amsterdam) descubrieron estrategias similares, pero no se dieron cuenta de las implicaciones que tenían.

Ahora, Christoph Adami y Arend Hintze de la Universidad del Estado de Michigan State han publicado un artículo en donde exploran las implicaciones de estas estrategias de determinante cero.

En concreto, han estudiado si este tipo de estrategia es evolutivamente estable.

Es decir, si una población completa juega con esta estrategia, ¿podrá una estrategia diferente aparecer y propagarse? Al parecer, según sus resultados, las estrategias de determinante cero no son evolutivamente estables.

Esto se debería a que dos jugadores jugando entre sí este mismo tipo de estrategia permite la aparición de estrategias que terminan ganando

Además, si se permiten mutaciones que permitan una evolución, una estrategia de determinante cero se transforma fácilmente en una estrategia que no es de determinante cero, por lo que también son inestables en este aspecto al no sobrevivir la estrategia de ese tipo en el transcurso de las generaciones.

Sin embargo, hay un caso en el que este tipo de estrategias sí es estable.

Si el jugador sabe si el oponente juega el mismo tipo de estrategia o no puede medrar a base de explotar a algunos de ellos.

Si sabe que el otro no esta jugando una estrategia de determinante cero puede usar estrategia de determinante cero para ganar y si sabe que el oponente juega esa misma estrategia entonces usar una estrategia que sea más defensiva. Naturalmente, esto sólo proporciona una ventaja temporal hasta que los oponentes se den cuenta.

Por tanto, si quieren impedir ser explotados por este tipo de jugadores, entonces deben desarrollar algún tipo de camuflaje que impida que sean identificados y explotados.
Este último resultado explicaría por qué no se han encontrado aún este tipo de estrategias en la Naturaleza, pero eso no significa necesariamente que no existan.

Por si acaso, en la sociedad real, usted siempre podrá aplicar el “toma y daca”, al menos así se asegurará de no ser explotado, aunque no tenga ventaja sobre los demás.

Comunicaciones espaciales y dilema del prisionero

Desde hace unas pocas décadas se tiene la esperanza de poder escuchar cabalgando en ondas de radio algún mensaje procedente de alguna civilización extraterrestre. Es lo que se llama programa SETI.

Carl Sagan incluso soñó con que algún día tuviéramos acceso a la gran enciclopedia galáctica, una especie de Wikipedia confeccionada por todas las civilizaciones avanzadas de nuestra galaxia que se estaría continuamente transmitiendo de forma electromagnética a lo largo de toda la Vía Láctea a modo de un WiFi galáctico.

Probablemente Sagan lo usó más como una metáfora que otra cosa, pero no estaría mal poder acceder a esa enciclopedia de Alejandría cósmica.

Hace un tiempo Stephen Hawking creó una polémica al afirmar que quizás no deberíamos intentar comunicarnos con otras supuestas civilizaciones extraterrestres porque algunas podrían ser belicosas.

Si así fuera podrían tomar nuestras señales de radio como un aviso de que en nuestro planeta hay recursos y entonces podrían invadirnos o liquidarnos tal y como aparece en alguna que otra película.

Un argumento en contra de esta idea es que una civilización avanzada tecnológicamente tiene que haber vivido en paz con sigo misma y con las demás porque de otro modo no habría sobrevivido. Lo malo es que la historia humana nos enseña ejemplos de civilizaciones pacíficas que han sucumbido a civilizaciones belicosas.

Otro argumento, éste más de peso, es que los supuestos recursos a explotar en nuestro mundo por parte de los alienígenas invasores no son tales.

Es más fácil conseguir minerales en otros lugares como los asteroides y no tener que viajar muchos años luz (en caso de que sea posible) para conseguirlos aquí.

El agua es un compuesto abundante en el Universo y también se puede conseguir de muchos sitios, como los cometas, sin necesidad gastar energía en el pozo gravitatorio de la Tierra.

Y si alguien piensa que vienen a comernos a nosotros y a los demás animales nada más alejado de la lógica biológica.

Los extraterrestres tienen que haber seguido un camino evolutivo totalmente distinto al nuestro y su bioquímica debe ser totalmente diferente.

Nosotros o nuestra comida no alimentarían a un alienígena en el mejor de los casos y en el peor de los casos lo envenenaríamos.

De todos modos nuestro planeta y su biosfera ya son conocidos por cualquier civilización lo suficientemente cercana que tenga tecnología avanzada sin necesidad que le enviemos ningún mensaje.

Además la civilización humana ha estado emitiendo ondas de radio desde hace casi 100 años sin intenciones de comunicación, pero que podrían ser detectadas por civilizaciones que vivan a menos de 100 años luz de nosotros.

Siempre queda la posibilidad, claro está, que los alienígenas belicosos puedan ir por ahí destruyendo civilizaciones por deporte, diversión o ideología.

Pero para llegar a ser una civilización avanzada se tiene que haber desarrollado la ciencia y la ciencia está basada en la curiosidad y las ganas de saber.

Los científicos intentan proteger a toda costa sus objetos de estudio y son respetuosos con ellos, entre otras cosas porque los conocen bien. No hay ningún ecólogo que no sea un ecologista sensato.

Lo interesante de pensar sobre este asunto es que decidir si nos comunicamos o no implica que quizás los del otro lado pueden hacer el mismo tipo de análisis.

Ahora Harold de Vladar, del Instituto de Ciencia y Tecnología de Austria, ha aportado un argumento nuevo a favor de intentar comunicarnos con otras civilizaciones. Según él el dilema del prisionero se puede aplicar en este caso

El dilema del prisionero se descubrió durante la guerra fría en RAND, un think tank creado en un principio por las fuerzas armadas norteamericanas y que todavía existe.

El dilema del prisionero se estudió a la luz de la teoría de juegos, una disciplina desarrollada por Von Neumann y mejorada por John F. Nash (sí, el de la película “Una mente maravillosa”).

La teoría de juegos trata de proponer las mejores estrategias de cara a ciertas situaciones o conflictos y trata de explica los sistemas organizativos en la cooperación.

Así por ejemplo, con la teoría de juegos se puede explicar por qué el personaje de James Deen hace bien en desertar en el juego de “Gallina” y no estrellarse junto con el auto que conducía, aunque en la vida real muriera en un accidente de tráfico.

También explica por qué nos colamos en el metro, seguimos en un matrimonio fracasado y por qué es mejor seguir en el puesto de caza de venados en lugar de disparar al primer conejo que aparece.

Incluso algunos han aplicado la teoría de juegos con cierto éxito para ganar al póquer Texas holdem.

El dilema del prisionero fue descubierto por Merrill Flood y Melvin Dresher en 1950 mientras que trabajaban en RAND.

Trata de dos ladrones a los que captura la policía por cometer un delito, pero sobre los que no tienen pruebas concluyentes a no ser que alguno confiese.

Se les interroga por separado y se les ofrece un trato.

Si uno de ellos culpa al compañero saldrá libre y el otro irá un año a la cárcel siempre y cuando éste no le delate.

Si ambos se callan (cada uno coopera, en el lenguaje de la teoría de juegos) ambos van un mes a la cárcel, pero si ambos hablan (cada uno deserta, en el lenguaje de la teoría de juegos) van tres meses a prisión.

Es un juego que no es de suma cero. El problema es que los compinches no se pueden comunicarse entre sí y el “juego” es a una sola mano o jugada.

Según Vladar el dilema SETI es similar al dilema del prisionero, pero en SETI la deserción consiste en no tratar de comunicarse.

Es decir, si ambos callan ambos pierden y mucho. Si uno habla (coopera en este caso) se gana un poco y si ambos se comunican (ambos cooperan) entonces todos ganan mucho.

Además en este caso puede haber más de un jugador.

Básicamente el valor de toda la cultura y ciencia de otra civilización es inmenso, por no decir que simplemente no tiene precio.

Vladar hace unas estimaciones sobre lo que se gana si entramos en contacto con otras civilizaciones, sean pacíficas o supuestamente belicosas.

Concluye con una cierta gama de estrategias de emisión de señales basadas en las frecuencias con la que se emiten mensajes.

Así por ejemplo, se pueden mantener baja la frecuencia con la que emitidos mensajes y así reducir la posibilidad de que nos invadan.

Como siempre que apliquemos teoría de juegos al ámbito humano de la cooperación, el problema siempre está en cuántos puntos ponemos en cada posibilidad.

Seth Shostak, del Instituto SETI, dice, según New Scientist, que la teoría de juegos es una buena aproximación pero que hay demasiadas variables desconocidas.

Quizás los alienígenas no emiten porque no lo necesitan. Shostak ha mostrado recientemente que una civilización un poco más avanzada que nosotros puede usar su sol como una lente gravitacional.

De este modo podrían detectar la luz procedente de una ciudad como Nueva York a 500 años luz de distancia una vez que esa luz haya viajado esa distancia, claro.

Así que si hay civilizaciones cercanas más avanzadas que nosotros ya saben que estamos aquí.

Es interesante plantear un escenario futuro en el que dos civilizaciones no hacen intentos de comunicación entre sí, pero al final las dos saben de la existencia de la otra por este medio o un sistema similar y llegar a eso de “sé que sabes que yo lo sé, ya sabes”.

Quizás se puede hacer el ridículo cósmicamente.

Como siempre que se tratan estos temas, no solamente se piensa sobre el problema en sí, sino que son una excusa para pensar sobre filosofía, moral, sobre tecnologías de exploración espaciales o sobre nuestra historia reciente y nuestras posibilidades futuras de supervivencia a nuestra estulticia.

En cuanto a de si debemos o no intentar comunicarlos da igual si no hay consenso, porque dentro de un tiempo se podrá montar un sistema de emisiones espaciales si se cuentan con un poco de dinero, sea óptico o de radio, e ignorar a los paranoicos.

Copyleft: http://neofronteras.com/?p=3897
Si no se indica lo contrario, el contenido de esta página se ofrece bajo una licencia Creative Commons