La amenaza de castigo crea la cooperación

La amenaza de castigo crea la cooperación
Los seres humanos somos seres sociales. 

Necesitamos de los demás para poder sobrevivir y así hemos evolucionado.

Sin embargo, dentro de una sociedad pueden surgir individuos egoístas que parasitan el sistema en su propio beneficio.

Normalmente se asume que para que el comportamiento cooperativo aparezca evolutivamente debe existir la oportunidad del castigo sobre los individuos indeseables. 

Un nuevo estudio sugiere que la amenaza de castigo es la clave para una cooperación exitosa entre los humanos.

Los humanos cooperamos en toda clase de asuntos y tareas, pero de vez en cuando un miembro del grupo falla a la hora de realizar su parte.

Si tal comportamiento fuera tolerado la cooperación misma se vería comprometida.

Esa es la razón por la cual comunas y otros sistemas cooperativos pueden fallar si no hay un sistema sancionador.

En este experimento publicado en la revista Science se pone de manifiesto por qué el castigo es importante este factor.

Con él las ganancias de la comunidad aumentan.

Bettina Rockenbach de la Universidad de Erfurt en Alemania y sus colaboradores realizaron una prueba económica sobre 84 estudiantes que fueron divididos en dos grupos distintos.

En un grupo en el que el castigo era permitido y el otro donde no lo era.

A cada uno de los participantes se le dieron 20 fichas canjeables por dinero para que pudieran empezar a jugar.

En cada una de las treinta vueltas de las que constaba el juego se permitía a los participantes elegir en qué grupo jugar, cuánto de su propio dinero poner en el bote común para que fuera aumentado según las reglas y que cantidades no compartir e invertir libremente.

Si además estaban en el grupo donde se permitía el castigo podrían decidir cómo recompensar o castigar a los miembros del equipo en función de sus contribuciones.

Al final de cada vuelta todos los participantes veían las ganancias de sus semejantes en ambos grupos y el progreso económico de cada uno.

Las ganancias eran determinadas como un múltiplo de las fichas invertidas y eran repartidas por igual entre todos los jugadores incluyendo aquellos que no contribuían al bote y que jugaban de por libre con su propio dinero.

Al principio dos tercios de los participantes eligieron el grupo sin castigo y contribuían con un poco de su propio dinero al fondo común.

Debido a que cada sujeto compartía el bote común, pero además mantenían dinero propio que no entregaban, lo más egoísta para cada miembro era poner la menor cantidad posible en el fondo común.

Rápidamente esto desembocó en una situación en la que muy poca gente contribuía con dinero al fondo común.

Pero además provocó que casi todos los participantes se movieran hacia el grupo donde había un sistema de incentivos y castigos.

A pesar de que costaba dinero penalizar las conductas egoístas (una ficha), la amenaza de castigo obligaba a un alto nivel de contribuciones y por tanto a un alto nivel de ganancias que finalmente repercutía en cada jugador individualmente.

Tan pronto como los jugadores se exiliaban en el nuevo grupo con castigo comenzaban a castigar a sus compañeros no contributivos aunque eso les costaba dinero.

Al parecer los más beligerantes en este aspecto eran aquellos que habiendo sido jugadores que iban por libre en el grupo sin castigos que al pasarse al grupo con penalizaciones estaban ansiosos por castigar.

Según Rockenbach los nuevos miembros castigaban porque es común hacerlo.

No se puede explicar este cambio tan dramático en el comportamiento diciendo que sólo miran por unas ganancias mayores.

Esta gente sacrificaba parte de las ganancias para obligar al cumplimiento de las normas cooperativas.

Hacia la vuelta número veinte la contribuciones en el grupo de castigo se aproximó al 100% mientras que en el otro grupo cayeron a 0% pocas vueltas después.

Las fichas eran canjeadas por dinero real al final de juego.

Aunque la recompensa parece que tiene poco efecto en el comportamiento del grupo sancionador, sanciones negativas tempranas eliminaban finalmente la necesidad de imponer castigos.

Lo que nos motiva son pues dos cosas: el tamaño de la zanahoria y el uso que se haga del palo.

Según Elinor Ostrom de Indiana University, y no relacionada con el estudio, estos resultados ayudan a entender las condiciones bajo las cuales la gente penalizará a otros para promover la cooperación.
Ostrom ha realizado numerosos trabajos de campo alrededor de todo el mundo preguntando por sistemas comunales donde no se aplique un sistema punitivo y no ha encontrado un sólo ejemplo hasta el momento.

La idea central de este artículo es que cuando la gente comparte ciertos estándares o reglas y algunos de ellos tienen la voluntad de sancionar a los demás entonces la sociedad funciona exitosamente.

Sin embargo, otros expertos afirman que el resultado es una demostración de cómo el interés propio puede triunfar sobre la aversión de la gente a la aplicación de las normas punitivas en el laboratorio.

En el mundo real no está tan claro quién es el jugador que va por libre o incluso si un grupo promueve el comportamiento cooperativo.

Según Duncan J. Watts de la Universidad de Columbia el misterio, si es que lo hay, es cómo estas instituciones evolucionaron al principio, pues es evidente a cualquiera que él mismo puede resolver los problemas de cooperación con este método.

El problema es que el castigo tiene siempre un coste para el que castiga y los beneficios a veces son poco claros.

Para determinados comportamientos puede resultar rentable no castigar.

Aunque si el costo (económico o de otro tipo) del castigo se reparte por igual en toda la sociedad su efecto puede ser más efectivo.

De este modo, nadie va por ahí ajusticiando a asesinos, sino que es el sistema judicial y penal, pagado con los impuestos, el que se encarga de ello.

Pero un nivel bajo de castigo no es el único problema que puede aparecer.

Si el coste del castigo (se individual o colectivo) excede lo sancionado puede que no solamente no merezca la pena castigar, sino que sea mejor no hacerlo.

En experimentos controlados se observó que frecuentemente se abusaba del castigo.

Parece ser que el ser humano tiene una innata sed de justicia y siente placer a la hora de castigar.

Encima, en estos experimentos algunas veces se castigaba incluso las conductas cooperativas.

Siempre se pueden sembrar dudas sobre este tipo de experimentos en los que suele participa estudiantes norteamericanos.

Todo esto hace dudar de que un sistema solamente basado en la cooperación y el castigo pueda aparecer por evolución biológica (o social) de manera natural.

Ahora, Christian Hilbe y Arne Traulsen, del Instituto Max Planck, han desarrollado un modelo basado en la Teoría de Juegos que muestra la dependencia que puede haber entre la reputación y la evolución del la cooperación y el castigo.

Según sus resultados la reputación podría ser la clave para la evolución exitosa de sanciones responsables.

Inicialmente no parece que el castigo responsable tenga una ventaja para el comportamiento que es castigado y, por tanto, no completa los requerimientos para la evolución de semejante comportamiento.

Para resolver este problema estos investigadores desarrollaron un modelo matemático de dos fases.

En la primera fase los jugadores pueden decidir cooperar o no.

Basándose en esto deben decidir en la segunda fase si castigar o no a los jugadores por su comportamiento previo.

Esto muestra que el comportamiento cooperativo y las sanciones justificadas se llevan a cabo si las interacciones pueden ser observadas por otros.

La decisión de alguien de castigar a otros afecta no solamente a las ventajas relativas a corto plazo de los jugadores, sino que además afectan a su reputación.

Nuestra propia reputación parece tener un alto valor y es algo que se considera a la hora de aplicar o no castigos injustos.

Estamos preparados para pagar un alto precio para mantenerla.

Según Christian Hilbe, la sospecha de que alguien nos está vigilando es suficiente para aumentar nuestra voluntad de cooperar.

El castigo es, por tanto, el principal mecanismo para mantener la cooperación, pero sólo si se usa responsablemente.

Las sanciones no solamente tienen el propósito de castigar del comportamiento no cooperativo, sino que además es una señal hacia los intrusos.

Sólo a través de sanciones responsables se puede mantener la voluntad de cooperar en una población en crecimiento.

La tendencia mostrada anteriormente de castigar el comportamiento injusto sería una ventaja a largo plazo.

La habilidad de los humanos a recopilar información a través de los demás permite construir una reputación y en consecuencia parece una de las razones fundamentales para la pronunciada voluntad a cooperar entre la gente.

A veces parece que no sea fácil crear modelos de comportamiento social que incorporaren sentido común.

Hemos visto distintos tipos de estudios acerca de la cooperación y cómo fomentarla.

Básicamente se dividen entre aquellos estudios basados en modelos matemáticos en los que se supone que la gente es racional en sus comportamientos y estudios de Psicología social en los que se estudia el comportamiento de seres humanos reales.

Se intenta con estos modelos y experimentos explicar cómo funcionan las sociedades.

El resultado que vamos a ver ahora es del segundo tipo.

Los comportamientos egoístas son una amenaza para la cooperación mutua entre las personas.

Por encima de cierto umbral este tipo de comportamientos pueden finalmente destruir la cooperación.

Así por ejemplo, cierta gente puede decidir no pagar impuestos o defraudar lo máximo posible al fisco.

Si la población percibe que hay demasiada gente haciéndolo pueden decidir hacer lo mismo y que al final todos nos quedemos sin sanidad, educación o carreteras.

Naturalmente presuponemos aquí que el dinero de nuestros impuestos es bien empleado, pero ese es otro tema.

El caso es que para fomentar la cooperación normalmente se instituye algún tipo de correctivo, como el castigo a los que se desvían de lo que se entiende como lo adecuado.

Así por ejemplo, existe la policía para atrapar a los ladrones y un sistema judicial para encarcelar a esa gente.

También hay multas para aquellos que no pagan convenientemente sus impuestos (de nuevo asumiremos que es el mejor de los mundos posibles y que no son los asalariados los que soportan el peso de la tributación mientras que los ricos no pagan casi nada).

El castigo puede ser además de dos tipos, o bien está institucionalizado como en los ejemplos anteriores o bien es administrado por pares, es decir por personas semejantes al infractor.

La pregunta es qué prefiere la gente, ¿que castigue una institución o castigar ellos mismos?

Según un estudio realizado por Arne Traulsen, Torsten Röhl y Manfred Milinski, todos del Instituto Max Planck de Biología Evolutiva de Plön, la gente sólo prefiere las instituciones de castigo si aquellos que cooperan, pero no están dispuestos a castigar a los demás, pueden también ser castigados.

Gracias a los experimentos de comportamiento se ha podido demostrar que los seres humanos estamos dispuestos a castigar el comportamiento de aquellos seres egoístas que se aprovechan de un bien común en su beneficio.

Vamos a llamar a estos seres “aprovechados de primer orden”. Esta acción castigadora se en pequeños grupos de laboratorio, pero se supone que también pasa en pequeñas comunidades, sobre todo primitivas.

Sin embargo, en las sociedades modernas el castigo suele estar institucionalizado y la gente no suele ejercer de castigadores directamente.

Digamos que la sociedades modernas han substraído este papel a la gente corriente.

Se supone que el costo del castigo debe ser inferior a los beneficios que aporta.

A veces, si el peso de castigar recae sobre los individuos se torna demasiado caro (desde el punto de vista social o económico) para el individuo, por eso el castigo institucionalizado, al repartir el coste del castigo entre todos, puede ser más efectivo, porque de otro modo las malas acciones se quedarían muchas veces sin castigo.

Pero una institución también puede salir cara si no se cometen crímenes, algo que puede pasar si la propia existencia de la institución lo ha fomentado.

Lo lógico sería que el castigo institucional existiera sólo si se cometen muchos delitos y, por tanto, el beneficio excede el costo.

Es aquí cuando entran en escena otro tipo de individuos.

Está bien claro quienes son los aprovechados de primer orden. Pero también hay aprovechados de segundo orden.

Éstos cooperan con los demás y no tienen un comportamiento egoísta descarado, pero a la hora de castigar declinan su responsabilidad.

Digamos que son “pecadores por omisión” que miran hacia otro lado cuando se hace una injusticia.

Se ahorran el costo del castigo al ser otros los que lo realicen, así que están en ventaja sobre los demás.

Seguro que en nuestra comunidad de vecinos todos conocemos a más de uno de este tipo.

La forma de castigo que elige una sociedad depende de cómo esta sociedad se relaciona con los aprovechados de segundo orden.

Sin la existencia de los aprovechados de primer orden los de segundo orden pasan desapercibidos.

Sin embargo, una sociedad con ambos tipos de aprovechados pierde el equilibrio de cooperación, el comportamiento egoísta de los individuos no es castigado y éstos medran por el sistema.

Según Traulsen la clave para establecer el comportamiento cooperativo dentro de una sociedad es precisamente el trato que se da a los aprovechados de segundo orden, de esto depende que el sistema no se desestabilice permanentemente.

Estos investigadores establecieron un juego de bienes comunes que se ha venido usando clásicamente en economía experimental, para estudiar los efectos del castigo.

Si los aprovechados de segundo orden no pueden ser castigados entonces sólo unos pocos jugadores deciden apoyar el castigo institucional.

En estos casos el castigo se impone individualmente.

El castigo sigue como reacción a un incidente y castiga a los “malhechores” rápida y directamente. Esto no requiere planificación ni es costoso.

Pero si se puede castigar a los aprovechados de segundo orden entonces los participantes optan en su mayoría por una “policía institucional” y unos a otros se animan para apoyar esta institución de castigo.

Por tanto, la gente prefiere la institución costosa incluso aunque sea menos eficiente.

Pero el castigo institucional reduce tanto el número de “delitos” que la razón beneficio-coste rápidamente decae y hay que seguir pagando “altos impuestos” para mantener una “policía” que sólo castiga unos pocos “criminales”.

Pero si unos pocos jugadores quieren pasarse al, más económico, castigo directo entonces son castigados inmediatamente.

Según Milinski en su experimento se gana estabilidad a costa de la eficiencia.

Este resultado corrobora los resultados de 2010 de Karl Sigmund (Universidad de Viena) basados en teoría de juegos y proporciona un posible escenario a la aparición de las instituciones sociales de castigo.

Fuentes y referencias: VCN
Copyleft:  http://neofronteras.com/?p=3863

 Creative Commons.