Anda di halaman 1dari 9

TRABAJO FINAL

ECONOMA EXPERIMENTAL
Mauricio Asp Snchez

1.

Contextualizacin del artculo

El Dilema del Prisionero (DP) es un diseo experimental paradigmtico en Teora (Conductual) de Juegos (TJ).
En su versin clsica, el DP es un juego simultneo y one-shot. Consiste en un conjunto de jugadores |N| = 2 y el
conjunto de estrategias {Cooperar, Traicionar}. La matriz de pagos est dada por:

Cooperar

Traicionar

Cooperar

R,R

S,T

Traicionar

T,S

P,P

Donde T > R > P > S. Es fcil deducir que la estrategia estrictamente dominante, para cada jugador, es
Traicionar. El juego muestra cmo sujetos racionales y maximizadores de beneficios, al elegir las estrategias
estrictamente dominantes, terminan en un escenario peor - (P, P) - que el escenario en que hubiesen terminado si
ambos hubiesen elegido la estrategia dominada - (R, R). La interpretacin comn es que el juego ilustra los
conflictos existentes entre racionalidad individual y grupal (Kuhn, 2014).
Una modificacin interesante es la versin iterada del DP (DPI), en la cual los jugadores interactan un nmero
n > 1 de rondas, con una matriz de pagos que incluye la restriccin 2R > T + S1. Esta modificacin permite
observar dinmicas de confianza y cooperacin, dado que ahora los jugadores, al elegir Cooperar, estn
enviando una seal de confiabilidad al otro jugador, esperando que ste tambin elija Cooperar.
Siguiendo la lnea de Bardsley et al. (2010), en el contexto de la Filosofa de a Ciencia, podemos considerar al
DP como un contexto experimental (E) en el cual se ponen a prueba enunciados empricos inferidos tanto desde
el dominio de la TJ como de la Teora Econmica Neoclsica (TEN)2. Bajo esta perspectiva, estos dominios son,
esencialmente, tres:

1
2

Esta modificacin desalienta a los jugadores a utilizar la estrategia de alternar entre Cooperar y Traicionar.
Existe cierta disputa respecto a si el dominio de la TEN es factible de contrastar experimentalmente, en condiciones de
laboratorio. Entre las corrientes que sostienen que experimentos controlados no entregan informacin relevante para la
disciplina, podemos citar, principalmente, el instrumentalismo de Friedmann y posturas como la praxeologa, de la
Escuela Austriaca, que afirma que el estudio de la conducta humana debe realizarse exclusivamente bajo razonamiento
deductivo. Sin embargo, esta disputa parece estar zanjada a favor de quienes consideran que la TEN s es susceptible de
contrastacin emprica (Bardley et al., 2010; pp. 114).

(a) El dominio base (D-B), que se deriva a partir de los objetos formales bsicos de la teora, los cuales son
internos a ella - muchas veces, estos objetos son abstracciones matemticas. De estos objetos formales podemos
inferir correlatos adosados, los cuales son las entidades reales que podemos observar fuera de la teora.
Estos correlatos adosados, usualmente descritos en lenguaje natural, forman el D-B de la teora 3. Jugadores,
estrategias y matrices de pago son parte del D-B de la TJ.
(b) El dominio de intencin (D-I), el cual es el conjunto de fenmenos a los cuales se intenta aplicar la teora,
con el propsito de comprender o predecir los fenmenos de los que busca dar cuenta.
(c) El dominio de contrastacin (D-C), que consiste en el conjunto de fenmenos sobre los cuales la teora puede
aplicarse con el objeto de contrastar (empricamente) sus enunciados.
De este modo, en el D-C de la teora podramos incluir un conjunto de fenmenos contrastables que contiene
enunciados del tipo los jugadores obedecern al Equilibrio Perfecto de Nash en Sub-Juego y, por induccin
hacia atrs, los sujetos utilizarn slo la estrategia {Traicionar, Traicionar}, a partir de los cuales podemos
generar un contexto E en los cuales contrastarlos, como el DP. Un resultado consistente en la literatura es que la
cooperacin en dilemas sociales existe (los sujetos parten contribuyendo aproximadamente un 40% de su capital
disponible). Sin embargo, sta cae en la medida que, en un diseo iterativo, las rondas se aproximan a n. An
una proporcin reducida de free-riders es capaz de alterar la dinmica del juego, de modo tal que la cooperacin
tiende a 0 cuando las rondas tienden a n (Fehr y Gchter, 2000).
Ntese que el contexto E no hace plausible que emerja un fenotipo que no est predicho por el D-B de la teora:
agentes dispuestos a sacrificar recursos para restar de las ganancias de quienes han elegido la estrategia
Traicionar. Fehr y Gtcher (2000) introducen, en el Juego de los Bienes Pblicos, la estrategia de Castigo, la cual
permite a los sujetos la posibilidad de sacrificar unidades monetarias (UMs) para restar UMs de los jugadores a
los que quieren castigar. Con este tratamiento, en el caso del Juego de los Bienes Pblicos, aparecen fenotipos
dispuestos a castigar, y la cooperacin, que tpicamente va cayendo a 0 a medida que el juego se acerca a n = 10,
se sostiene en el tiempo (Fehr y Gtcher, 2000). Sin embargo, no existe consenso respecto a si el castigo
realmente promueve la cooperacin (Bone et al., 2016): en un estudio de Herrmann et al., (2008), por ejemplo,
los experimentadores encuentran, utilizando protocolos experimentales con y sin posibilidad de castigo en 16
grupos de participantes, de distintos pases, que en general (13 de los 16 grupos) que el pago promedio obtenido
por los participantes de los grupos donde el castigo era posible fue menor al pago obtenido por los participantes
de los grupos sin castigo (Herrmann et al., 2008). Gchter et al. (2008), por otra parte, basndose en modelos
evolucionarios de seleccin de grupos (y considerando, por tanto, un diseo experimental donde aumentan la
cantidad de rondas, para simular interacciones durante periodos de tiempo ms largos), realizan experimentos
3

Ntese que no constituyen, necesariamente, instancias naturales o empricas de los objetos formales de la teora.

con n = 10 y n = 50, con y sin posibilidad de castigo, encontrando que la cooperacion es significativamente ms
alta en los juegos con 50 rondas y posibilidad de castigo (Gchter et al., 2008).
Sin embargo, estos experimentos no consideran un elemento generalmente presente en las interacciones
cotidianas: la represalia. La represalia consiste en la accin de castigar, en la ronda n, a un jugador que cooper
pero castig en la ronda n - 1. Engelmann y Nikiforakis (2012), ponen a prueba los resultados que muestran que
los costos del castigo son recompensados por un aumento en la cooperacin de los jugadores si las rondas son
suficientemente largas y si no existe posibilidad de represalia, encontrando que el castigo aumenta los pagos de
los jugadores slo si no existe la posibilidad de represalias (Engelmann y Nikiforakis, 2012).
Estos resultados fuerzan a expandir, al menos, el D-T de la teora (tanto para aumentar su generalidad como su
validez externa) e incluir en el contexto E condiciones experimentales que permitan la existencia de fenotipos
que expresen represalia. En este contexto, el presente artculo incluye dentro del D-B nuevas entidades tericas:
las asimetras de poder, expresadas como la capacidad de castigar con distinta efectividad. A partir de esto, los
investigadores deducen nuevas predicciones de la teora: especficamente, que el ejercicio del castigo no
aumenta la cooperacin y que las asimetras de poder de castigo afectan el resultado de las interacciones
humanas en un DPI.
2.

Hiptesis, diseo experimental y resultados del experimento

Metodologa. En el presente trabajo, los autores utilizan un DPI de 50 rondas, en el cual Cooperar implica un
costo potencial que beneficia al otro, mientras que Traicionar implica optar a un beneficio a costas del otro. En
consecuencia, la matriz de pago est dada por:

Cooperar

Traicionar

Cooperar

1,1

-2,3

Traicionar

-3,2

0,0

Adems, a los jugadores se les otorg la posibilidad de castigo: de este modo, cada jugador poda sacrificar una
unidad de sus haberes para restar a los de su compaero. La manipulacin experimental crucial fue la de
introducir desigualdad en el poder de castigo: un jugador fuerte (F) castiga con una razn de 1:4 (sacrifica 1 para
quitar 4) mientras que un jugador dbil (D) castiga con una razn de 1:1 (sacrifica 1 para quitar 1). Asimismo,
los escenarios fueron divididos en simtricos y asimtricos: en un escenario simtrico (S), los jugadores se
enfrentan a otro del mismo fenotipo (parejas FF o DD), mientras que el asimtrico (A) involucra slo parejas con
fenotipos distintos (FD). Cada jugador particip en una ronda S y en una A: con esto, los investigadores buscan
contrastar la hiptesis central del experimento: que las asimetras de poder de castigo afectan la cooperacin en

un DPI. La suma de dinero base fue igual a 5.00. El dinero obtenido por los jugadores en los escenarios S y A
fue sumado y multiplicado por 0.06 (el valor de cada UM en el juego), lo que equivale al ingreso adicional, el
cual se sum al dinero base.
Los sujetos juegan un juego S (o A) consistente en:
Paso 1: Un DP con el conjunto de estrategias {Cooperar, Traicionar, Salir}.
Paso 2. Tomar la decisin de castigar o no castigar.
Paso 3: Finalmente, conocen los pagos y el monto del dinero total acumulado.
Todo esto durante 50 rondas, para luego conocer el pago final e ingresar al segundo juego A (o S).
Un aspecto crtico de un contexto E bien definido es su capacidad para descartar hiptesis alternativas que
introduzcan ruido en la interpretacin de los resultados: por ejemplo, la hiptesis alternativa de que la conducta
de los sujetos cambia en los juegos A y S a causa del cansancio de los sujetos es descartada por el diseo
experimental, al contrabalancear este orden. Otra hiptesis alternativa a descartar es que los sujetos puedan estar
respondiendo influidos por la connotacin de la terminologa utilizada en el experimento: para esto, los
experimentadores reemplazan trminos como dbil, fuerte, cooperar, traicionar y castigar por
trminos neutros, del tipo jugador tipo 1, opcin A, opcin B, etc. Adems, los investigadores controlan
que no existan mecanismos de coercin, definida sta como el forzar a un sujeto a mantenerse en una situacin
A, siendo que podra estar mejor en posicin distinta de A, pero para el sujeto no es factible moverse de la
situacin A. Para evitar la coercin, que en el contexto del experimento es cooperar con una pareja que traiciona
o que ejercer castigo, los investigadores incluyen la opcin de salir del juego (opt-out) en la presente ronda,
como alternativa a Cooperar o Traicionar.
Finalmente, otra sutileza (a la vez problemtica; ver ms abajo) del diseo es la de introducir la bancarrota: para
evitar los pagos negativos, si el pago de un sujeto es inferior a 0 stos quedan declarados en bancarrota, y el
juego termina para ellos y para su pareja.
Resultados. Los datos, analizados mediante un modelo lineal mixto generalizado, con funciones logit y probit, e
incluyendo la identidad de los sujetos como termino aleatorio, arrojaron como resultados que:
(i) La cooperacin es frecuente, pero tanto los jugadores F como D cooperan ms si su pareja es un jugador F, y
castigan ms si en la ronda anterior han cooperado. Con esto, los autores muestran que la introduccin de
diferencias en el fenotipo de los jugadores incide en la tendencia a Cooperar, pareciendo que la presencia de
jugadores F acta como un elemento disuasivo a Traicionar.
(ii) Los jugadores D cooperan ms en los juegos S, mientras que los jugadores F cooperan ms en los juegos A.
A partir de esto, podemos suponer que las asimetras de poder, contrariamente a lo que podra suponerse a partir

del punto (i), no incitan a la cooperacin slo en base al fenotipo del jugador, sino tambin en base a la
estructura del juego, dado que los jugadores D prefieren cooperar en un juego S, donde no se encuentran con una
pareja con mayor potencial de castigo.
(iii) En suma, los jugadores F cooperan ms que los D, pero castigan ms y el castigo es ms frecuente en los
juegos A. Esto es relevante porque sugiere que un mayor potencial de castigo incita a Cooperar, quiz esperando
que la asimetra de poder funcione como un mecanismo de disuacin a la traicin.
Crucial para los fines del artculo, los autores adems encuentran que:
(iv) Cuando los jugadores traicionan, es ms probable que cooperen en el siguiente ensayo si el otro jugador
coopera, por lo que parece que la cooperacin es ms efectiva para inducir cooperacin que el castigo. Con esto,
los autores encuentran que, en un juego con asimetra en el poder de castigo, que el mecanismo ms efectivo
para promover la cooperacin no es el castigo, sino la misma cooperacin.
(v) Los jugadores no ejercen represalias contra cuando su pareja es D, pero tanto los jugadores D como los F
represalian con frecuencia a los jugadores F. De este modo los resultados, adems, sugieren que las asimetras de
poder tambin influyen en la frecuencia del ejercicio de la represalia, y que la existencia de jugadores con mayor
poder de castigo incita, a su vez, a ejercer represalias contra su conducta, lo que influye en el pago obtenido por
el grupo completo.
En trminos generales, lo que encuentran los autores es que los jugadores F suelen ser ms cooperativos e
inducir ms cooperacin, pero el acto mismo de infligir un castigo no genera beneficios, en el sentido de que
inste a quienes traicionan a cooperar: por el contrario, el infligir castigo provoca mayor traicin y represalias por
parte del otro jugador. En palabras de los autores La conducta cooperativa de la pareja parece ser suficiente
para convertir a quienes traicionan en cooperadores, mientras que el castigo, en adicin a la cooperacin, no
agrega ningn beneficio adicional.
3.

Falencias en el diseo experimental

La principal falencia del diseo experimental est relacionada con la capacidad de castigo de los jugadores D. Si
bien la razn 1:4, en el caso de los jugadores F, no pareciera ser problemtica, y est documentada en la
literatura (Dreber et al., 2008), la razn 1:1 de los jugadores D no reduce las diferencias en la pago de los
jugadores: de este modo si, por ejemplo, en una ronda n un jugador coopera y su pareja traiciona, el pago ser de
(-2, 3); si el cooperador es un jugador F y castiga, el pago de la ronda ser de (-3, -1); si el cooperador es un
jugador D, en cambio, el pago ser de (-3, 2). Ntese que, en el primer caso, la diferencia de pagos para el
jugador cooperador, antes del castigo, ser de -5 y, despus del castigo, de -2; en el segundo caso, en cambio, la
diferencia de pagos antes del castigo ser de -5 y, despus del castigo, tambin de -5. Esto es problemtico, dado

que se ha documentado la existencia de motivaciones relacionadas con aversin a la inequidad (ver, por ejemplo,
Tricomi et al., 2010; Fehr y Schmidt, 2001). De este modo, bajo el presente diseo puede estar subrepresentado
el castigo del jugador D, al hacer infactible que el castigo est motivado por aversin a la inequidad.
Otro aspecto a considerar es la posibilidad de bancarrota. En el presente artculo se reporta que slo tres de los
jugadores entraron en bancarrota: dado que en el diseo experimental la cada en bancarrota de un jugador
implica la salida de su pareja (quien va conociendo, ronda a ronda, el pago de su contrincante), es factible que
los jugadores condicionen su cooperacin o castigo de modo de no hacer quebrar a su pareja. Esto tambin
puede ser un elemento que subrrepresente la frecuencia del castigo en esta interaccin experimental. Sin
embargo, cabe destacar que estas objeciones al diseo no afectan la intepretacin de la contrastacin de la
hiptesis experimental (i.e., que el ejercicio del castigo no aumenta la cooperacin y que las asimetras de poder
de castigo afectan el resultado de las interacciones humanas en un DPI), sino slo la proporcin de castigo
obtenida en el experimento.
4.

Explicaciones alternativas para los resultados

La explicacin alternativa de los resultados es que uno de los principales motivos para el castigo es la aversion a
la inequidad, por lo que la frecuencia de castigo est subrrepresentada por la razn costo/castigo del jugador D.
Adems, esta frecuencia puede estar subrrepresentada por la posibilidad de salir del juego en caso de que el
oponente entre en bancarrota.

5.

Diseo experimental para testear la explicacin alternativa

Para testear la hiptesis alternativa esbozada en el punto 4., es necesario comparar los datos del presente
experimento con los datos obtenidos de un diseo experimental donde la razn costo/castigo de los jugadores D
induzca una reduccin en las diferencias de los pagos obtenidos luego de que un jugador D inflija castigo. Para
esto, se utilizar un DPI de 50 rondas, con la misma matriz de pago:

Cooperar

Traicionar

Cooperar

1,1

-2,3

Traicionar

-3,2

0,0

Si bien los jugadores F castigarn con la misma razn de 1:4, la razn con la que castigarn los jugadores dbiles
ser de 1:2. Los escenarios sern divididos en S y A, donde cada jugador participar en una ronda S y en una A.
El valor de las UM seguir siendo de 0.06, pero la suma de dinero base se aumentar a 6.00 o 7.00, elo

monto necesario, a partir de los datos del experimento anterior, para dificultar que los sujetos entren en
bancarrota.
Los sujetos participarn en el mismo juego S o A, consistentes en un DP con el conjunto de estrategias
{Cooperar, Traicionar, Salir}, una fase de tomar la decisin de castigar o no castigar y luego una fase de conocer
los pagos y el monto del dinero total acumulado, por 50 rondas, para luego ingresar al segundo juego A o S.
Todas las instrucciones se darn con terminologa neutra (jugador tipo 1, opcin B, etc.).
Los resultados de este experimento sern analizados mediante el mismo anlisis que el experimento anterior, y
los resultados de ambos experimentos sern comparados utilizando test no-paramtricos, con las identidades de
los sujetos como trmino de error. Los resultados esperados apuntan a que en el segundo experimento existir
una mayor proporcin de castigo, en comparacin con el experimento original, pero que no se modificarn las
dinmicas de cooperacin, traicin y castigo obtenidas en funcin a los diferentes poderes de castigo presentados
por los sujetos experimentales.
6.

Comentarios finales

En la metodologa de los programas de investigacin cientfica (MPIC), Imre Lakatos propone una heurstica
negativa toma a un subconjunto de enunciados experimentales y les da un estatus privilegiado de ncleo duro.
La actividad cientfica no se enfoca en contrastar estos enunciados, sino un conjunto de enunciados que son
implicados por el ncleo duro y constituyen el cinturn protector de la teora. El ncleo duro, ante evidencia
adversa, puede mantener su estatus en la medida en que esto conlleve progreso, definido como la derivacin de
enunciados tericamente progresivos que son capaces de dar cuenta del contenido no-falseado de la teora, como
de las anomalas que sta presentaba, y que impliquen predicciones nuevas (i.e., aumentan su contenido
predictivo). Esto puede observarse en el presente artculo, dado que su contrastacin experimental ataca a
enunciados que son partes del cinturn protector, como el hecho de si las asimetras de poder influyen en la
conducta de los jugadores, en lugar de contrastar elementos (quiz incontrastables) relacionados al ncleo duro
de la teora4.
Finalmente, podemos decir que el artculo no se enfoca en un punto de frontera cientfica relacionado con un
cambio de paradigma. Un paradigma, en sentido kuhniano, es complejo enmaraado de prcticas comunes y
4

Existe disputa respecto a cul es el ncleo duro de la TEN. Latsis postula que est constituido por (i) los agentes tienen
informacin perfecta y completa y que (ii) responden con la mejor alternativa posible dado su conjunto disponible de
alternativas, entre otras; Weintraub propone que (i) existen agentes econmicos, los cuales (ii) tienen preferencias que
son (iii) optimizadas bajo retricciones y que (iv) manejan informacin completa; otros, simplemente que las
preferencias son (i) completas y (ii) transitivas (Hausman, 1996).

creencias subyacentes que moldean la evolucin del conocimiento en cualquier comunidad cientfica. Estos son
prerrequisitos de cualquier programa de investigacin (algo as como el meta-marco investigativo, o la grille
foucaultiana) cuyos enunciados tericos, al no existir en su propuesta una demarcacin clara entre enunciados
empricos y enunciados tericos, no son factibles de traducir entre el diccionario de un paradigma y el
diccionario del otro (lo denominada tesis de la inconmensurabilidad). Un paradigma define todo un programa
investigativo denominado ciencia normal, el cual se manifiesta bajo una experimentacin exhaustiva dentro de
los lmites del mismo paradigma (como la investigacin actual en economa experimental). Esto, en conjunto
con la inconmensurabilidad de las teoras alternativas, hace que los cambios de paradigmas sean procesos
sociales discontinuos. En este sentido, el artculo (como casi todo nuestro quehacer cientfico) se enfoca en
continuar haciendo ciencia normal, a la espera de que la acumulacin de conocimiento genera la masa necesaria
para un cambio de paradigma en economa experimental.

REFERENCIAS
Bone, J. E., Wallace, B., Bshary, R., & Raihani, N. J. (2016). Power Asymmetries and Punishment in a Prisoners Dilemma with Variable
Cooperative Investment. Plos One, 11(5), e0155773. http://doi.org/10.1371/journal.pone.0155773
Dreber A, Rand DG, Fudenberg D, NowakMA (2008) Winners dont punish. Nature 452: 348351. doi: 10.1038/nature06723 PMID:
1835448125.
Fehr, E., & Gchter, S. (2000). Cooperation and Punishment ind Public Goods Experiments. American Economic Review, 90(4), 980
994. http://doi.org/10.1126/science.151.3712.867-a
Fehr, E., & Schmidt, K. (2001). Theories of fairness and reciprocity-evidence and economic applications. Retrieved from
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=264344
Gchter, S., Renner, E., & Sefton, M. (2008). The long-run benefits of punishment. Science, 322(5907), 1510.
http://doi.org/10.1126/science.1164744
Hausman (1996). The Inexact and Separate Science of Economics. Pp 87-88
Kuhn, Steven, "Prisoner's Dilemma", The Stanford Encyclopedia of Philosophy (Fall 2014 Edition), Edward N. Zalta (ed.), URL =
<http://plato.stanford.edu/archives/fall2014/entries/prisoner-dilemma/>.
Tricomi, E., Rangel, A., Camerer, C. F., & ODoherty, J. P. (2010). Neural evidence for inequality-averse social preferences. Nature,
463(7284), 108991. http://doi.org/10.1038/nature08785

Anda mungkin juga menyukai