Anda di halaman 1dari 14

4

JUEGOS
REPETIDOS

1
@juancaraguado

juancarlos.aguado.franco@gmail.com

2 JUEGOS DINMICOS

4.1 Juegos repetidos un nmero finito de veces


Un juego repetido es un juego concreto, con sus estrategias, jugadores y pagos, que se
juega una y otra vez. En su forma normal, el juego no vara en ninguno de esos tres
ingredientes de un juego a otro.
Si slo existe un Equilibrio de Nash, y se trata de un juego que se repita durante
un nmero finito de veces, es de prever que los jugadores adoptarn las estrategias
que componen dicho Equilibrio de Nash a lo largo de todas las etapas de que conste.
Lo veremos a continuacin con un sencillo ejemplo. Supongamos que dos individuos se enfrentan al juego siguiente, en el que el jugador n 1 ha de elegir entre
Alto y Bajo (A y B) y el jugador n 2 puede optar entre Izquierda y Derecha (I y D).
Realizan su eleccin de forma simultnea y sin poder pactar previamente una forma
de comportamiento de hecho, aunque llegasen a un acuerdo al respecto, si no existen
mecanismos que obliguen a su cumplimiento, ambos actuarn buscando maximizar su
utilidad individual.
Figura 59. Juego con un nico Equilibrio de Nash en estrategias puras.
Jugador
n 1

Jugador n 2
I

1, 3

0, 0

2, 1

1, 2

Como se puede apreciar en la figura 60, el juego de la figura 59 slo tiene un


Equilibrio de Nash en estrategias puras, correspondiente a que el jugador n 1 elija
Bajo (B) y el jugador n 2 escoja Derecha (D).

Jugador n
1

Figura 60. Clculo de los Equilibrios de Nash en estrategias puras de un juego.


Jugador n 2
I

1, 3

0, 0

2, 1

1, 2

Si ambos jugadores vuelven a enfrentarse al mismo juego, es previsible que vuelvan a utilizar las mismas estrategias.
Representaremos a continuacin en forma extensiva el juego al que se enfrentan,
teniendo en cuenta las dos etapas, y calcularemos los Equilibrios de Nash Perfectos
en Subjuegos del juego que en este caso ser uno slo.
2
@juancaraguado

juancarlos.aguado.franco@gmail.com

JUEGOS DINMICOS 3

Los pagos que figuran al final son el resultado de sumar los obtenidos en cada una
de las etapas, en funcin por tanto de la eleccin realizada por uno y otro jugador en
ambas ocasiones.
As, si en la primera etapa juegan el perfil de estrategias (A, I) ambos obtendrn
como pago 1 y 3 unidades respectivamente. Si vuelven a jugar en la segunda etapa de
la misma manera, volvern a ganar 1 y 3, por lo que los pagos finales que percibirn
sern 2 y 6. Igualmente, si en la primera etapa juegan el perfil de estrategias (A, I) y
en la segunda etapa cambian a jugar (A, D), los pagos que obtendrn sern los correspondientes a sumar cero unidades a las que ambos consiguieron en la primera etapa.
Anlogamente, si en la primera etapa juegan el perfil de estrategias (A, I) y en la segunda etapa pasan a jugar (B, I), los pagos que percibirn se calcularn sumando los
pagos de la primera etapa 1 y 3 con los de la segunda etapa 2 y 1, lo que hace un
total de 3 y 4, respectivamente. Repetimos el proceso para todas las posibilidades
existentes, como se puede apreciar en el grfico de la figura 61:

4 JUEGOS DINMICOS

Figura 61. Representacin extensiva de un juego repetido en dos etapas.


I
D

A
J. 1

2, 6

1, 3
J. 2
I

3, 4

D
2, 5

I
I

1, 3

0, 0
J. 1

J. 2

D
I

A
J. 1

2, 1

1, 2

J. 2

3, 4

B
D

I
J. 1

2, 1
J. 2
I

B
D

4, 2

D
3, 3
I
D

A
J. 1

1, 2
J. 2

B
@juancaraguado

2, 5

3, 3

juancarlos.aguado.franco@gmail.com

2, 4

JUEGOS DINMICOS 5

Como se puede ver, este juego cuenta con cuatro subjuegos, que comienzan en el
momento en el que se ha acabado la primera etapa, ven el resultado que han obtenido
en ella, y tienen que elegir por segunda vez.
Para encontrar el E.N.P.S. resolveremos a continuacin los cuatro subjuegos
ayudndonos de la representacin matricial en las figuras 62 a 65, para calcular a
continuacin el Equilibrio del juego en su conjunto, resolviendo por induccin hacia
atrs.

Jugador n
1

Figura 62. Representacin matricial y Equilibrio de Nash del primer subjuego.


Jugador n 2
I

2, 6

1, 3

3, 4

2, 5

Jugador n
1

Figura 63. Representacin matricial y Equilibrio de Nash del segundo subjuego


Jugador n 2
I

1, 3

0, 0

2, 1

1, 2

Jugador n
1

Figura 64. Representacin matricial y Equilibrio de Nash del tercer subjuego.


Jugador n 2
I

3, 4

2, 1

4, 2

3, 3

Jugador n
1

Figura 65. Representacin matricial y Equilibrio de Nash del cuarto subjuego.


Jugador n 2
I

2, 5

1, 2

3, 3

2, 4

Al empezar el juego ambos jugadores pueden analizar a priori el desarrollo posterior del juego, pues conocen que, en funcin de su actuacin en la primera etapa, los
resultados finales a los que pueden llegar son los que acabamos de calcular. En concreto, antes de empezar el juego, y suponiendo que en la segunda etapa vayan a jugar

6 JUEGOS DINMICOS

el Equilibrio de Nash, podran resumir su toma de decisiones de acuerdo a la matriz


de pagos de la figura 66.

Jugador
n 1

Figura 66. Matriz de pagos finales del juego repetido en funcin de


las estrategias en la primera etapa.
Jugador n 2
I

2, 5

1, 2

3, 3

2, 4

El Equilibrio de Nash Perfecto en Subjuegos del juego sera, por tanto, el que recogiera el desarrollo previsible del juego, as como el equilibrio de cada subjuego. En
la primera etapa, como vemos en la figura 66, optarn por el perfil de estrategias (B,
D), as como en cada uno de los subjuegos como hemos visto en las figuras 62, 63,
64 y 65. El Equilibrio de Nash Perfecto en Subjuegos ser: (B, B, B, B, B; D, D, D,
D, D).

Ejercicio de autocomprobacin 33

Jugador
n 1

Suponga que dos individuos se enfrentan al juego representado a continuacin, sabiendo


que consta de dos etapas y que conocern el resultado de la primera etapa antes de jugar
la segunda.
Jugador n 2
I

2, 2

2, 1

1, 0

1, 2

Represente la forma extensiva del juego en su totalidad, y halle los Equilibrios de Nash
Perfectos en Subjuegos.

Axelrod (1981) establece cmo un juego repetido infinitas veces puede llevar a la
cooperacin, mientras que si las repeticiones son finitas predominarn las actitudes no
cooperativas, que surgirn desde el primer encuentro y se repetirn hasta la ltima
repeticin del juego. Este hecho ya lo haban analizado Luce y Raiffa (Luce y Raiffa,
1957).
As, en un Dilema del Prisionero, dado que ambos jugadores tienen una estrategia dominante la defeccin, el equilibrio de Nash ser nico, y ser aquel en el que
cada uno de ellos obtendra un pago inferior al que podra haber obtenido si ambos
hubieran cooperado. Si el juego se desarrolla durante un nmero finito predetermina6
@juancaraguado

juancarlos.aguado.franco@gmail.com

JUEGOS DINMICOS 7

do de partidas, los jugadores seguirn sin tener ningn incentivo para cooperar (vase,
por ejemplo, Luce y Raiffa, 1957; Kreps et al., 1982; Axelrod, 1981; Sandler, 1997;
Andreoni y Miller, 1993).
En efecto, en la ltima partida eso ser as, pues no hay partidas futuras que puedan influir en su comportamiento. Ahora bien, en la penltima jugada ambos prevern
lo que va a ocurrir en la ltima jugada que ninguno cooperar, por lo que tampoco
tendrn incentivos para cooperar. Esto mismo ocurrir en la jugada antepenltima, en
la anterior a sta, etc.
Resolviendo por induccin hacia atrs, siguiendo con el mismo razonamiento,
llegaramos a la conclusin de que ninguno de los jugadores optara por colaborar en
ninguna de las etapas del juego.
En los Dilemas del Prisionero repetidos no existe una regla ptima de comportamiento que sea independiente de la estrategia desarrollada por el otro jugador. En
realidad, los jugadores no se encuentran en un conflicto total de intereses, de modo
que lo que es bueno para uno es malo para el otro y viceversa, como ocurre en una
partida de ajedrez, donde lo lgico es pensar que el otro actuando siempre en su beneficio est hacindolo siempre en contra de nuestros intereses lo que facilitara la
toma de decisiones; en el Dilema del Prisionero ambos podran, por ejemplo, obtener el pago de la mutua cooperacin, que es mayor que el de la mutua defeccin.
En el Dilema del Prisionero repetido, la mejor estrategia depende directamente
de la estrategia que est llevando a cabo el otro jugador, y en concreto de si sta favorece la aparicin de la mutua cooperacin1.
Si, por ejemplo, es un Dilema del Prisionero repetido dos veces, ambos jugadores podrn calcular que para la segunda etapa tienen una estrategia dominante que es
la no cooperativa, pues C > P y T > R. Si esto es as, como hemos visto, ambos
podrn prever que en la ltima etapa el otro no va a cooperar, por lo que la estrategia
dominante en la primera etapa tambin ser la de no cooperar.
Cada jugador considerar su eleccin estratgica en la primera etapa dada la mutua ausencia de cooperacin prevista de la segunda etapa en la que ambos obtendrn
un pago como C, del modo descrito por la figura 67.
Figura 67. Dilema del Prisionero en dos etapas considerado al inicio del juego.

Jugador
n 1

Jugador n 2

Cooperar

No cooperar

Cooperar

R + C, R + C

P + C, T + C

No cooperar

T + C, P + C

2C, 2C

Y esto siempre y cuando no se produzcan errores fortuitos a la hora de manifestar las elecciones. Wu y Axelrod
(1995) estudian la forma de solventar estos errores en los Dilemas del Prisionero Repetidos.

8 JUEGOS DINMICOS

Cada uno de los pagos representados en la matriz indica el pago total de los dos
periodos, suponiendo que se va a producir ese equilibrio no cooperativo en la segunda
etapa. El resultado global sigue siendo el mismo: existe una estrategia dominante para
cada uno de los jugadores no cooperar en la que el pago que perciben es siempre
mayor que siguiendo la otra estrategia cooperar.
Podramos haber llegado a la misma conclusin si el juego se hubiera repetido un
nmero mayor de veces, siempre y cuando ste nmero fuera conocido por parte de
los jugadores, simplemente mediante la resolucin del juego por induccin hacia
atrs.
Lo mismo ocurrir si suponemos que los individuos pueden utilizar estrategias condicionadas, segn las cuales podrn actuar en la segunda etapa en funcin de
cul haya sido el comportamiento del otro jugador en la primera etapa. Para verlo
vamos a utilizar un ejemplo empleado por Shubik (1982), en el que presenta la representacin matricial de un dilema del prisionero como la de la figura n 68.

Figura n 68: Representacin de Shubik de un dilema del prisionero

NC

5, 5

-10, 10

NC

10, -10

0, 0

Fuente: Shubik (1982)

En este juego, en una etapa, la estrategia dominante de ambos jugadores es no


cooperar, NC, por lo que existir un nico Equilibrio de Nash. Supongamos ahora que
este juego se va a desarrollar durante dos etapas; ambos jugadores se enfrentarn al
mismo juego en dos ocasiones consecutivas.
Las distintas estrategias que puedan llevar a cabo consistirn en una accin
para la primera etapa (C NC), y otra accin para la segunda etapa. Esta segunda
accin puede estar condicionada a lo que el otro jugador hizo en la primera etapa o
no. As, una posible estrategia no condicionada sera: (C; C, C) que leeramos como:
cooperar en la primera etapa, y cooperar si el otro lo hizo en la primera etapa y cooperar si el otro no lo hizo en la primera etapa es decir, cooperar siempre, independientemente de lo que el otro haya hecho-. Una estrategia condicionada sera, por ejemplo: (C; C, NC) que interpretaramos de la siguiente manera: cooperar en la primera
8
@juancaraguado

juancarlos.aguado.franco@gmail.com

JUEGOS DINMICOS 9

etapa y despus, cooperar si el otro lo hizo en la primera etapa y no cooperar si l no


cooper.
La matriz de pagos correspondiente sera la de la figura n 69.
Figura n 69: Equilibrios de Nash en un juego repetido.

C; C, C

C; C, NC

C; NC, C

C; NC, NC

NC; C, C

NC; C, NC

NC; NC, C

NC; NC, NC

C; C, C

10, 10

10, 10

-5, 15

-5, 15

-5, 15

-5, 15

-20, 20

-20, 20

C; C, NC

10, 10

10, 10

-5, 15

-5, 15

0, 0

0, 0

-10, 10

-10, 10

C; NC, C

15, -5

-15, -5

5, 5

5, 5

-5, 15

-5, 15

-20, 20

-20, 20

C; NC, NC

15, -5

-15, -5

5, 5

5, 5

0, 0

0, 0

-10, 10

-10, 10

NC; C, C

15, -5

0, 0

15, -5

0, 0

5, 5

-10, 10

5, 5

-10, 10

NC; C, NC

15, -5

0, 0

15, -5

0, 0

10, -10

0, 0

10, -10

0, 0

NC; NC, C

20, -20

10, -10

20, -20

10, -10

5, 5

-10, 10

5, 5

-10, 10

NC; NC, NC

20, -20

10, -10

20, -20

10, -10

10, -10

0, 0

10, -10

0, 0

Fuente: Adaptacin propia a partir de Shubik (1982)

Aunque aparecen cuatro equilibrios, como se puede apreciar claramente en la figura n 69, todos ellos implican que ninguno de los dos jugadores
cooperar en ninguna de las dos etapas.
En efecto, si nos fijamos en las estrategias que conforman los equilibrios, ambos jugadores comienzan no cooperando. Despus, la accin que
tomen en la segunda etapa puede estar condicionada o no. Vemos que un equilibrio se corresponde con la estrategia de los dos jugadores de no cooperar en
ningn caso, por lo que no cabe duda de lo que van a hacer. En otro equilibrio
ambos siguen la estrategia condicionada de cooperar en la segunda etapa si el
otro lo hizo en la primera, y no cooperar si no lo hizo. Como ninguno cooper
en la primera etapa, ninguno lo har tampoco en la segunda. Finalmente, hay
otros dos equilibrios en los que uno sigue esta estrategia condicionada y el otro

10 JUEGOS DINMICOS

acta conforme a la estrategia de no cooperar nunca. Por consiguiente, como


resultado, en el equilibrio ninguno de ellos cooperar.
Como muestra la teora y hemos visto en este ejemplo, por tanto, en cada etapa hemos de esperar que no se produzca la cooperacin si se conoce el final de un
juego repetido un nmero dado de veces.

Ejercicio de autocomprobacin 34

Jugador
n 1

Suponga que dos individuos se enfrentan al juego representado a continuacin, sabiendo


que consta de dos etapas y que conocern el resultado de la primera etapa antes de jugar
la segunda.
Jugador n 2
I

2, 2

0, 3

3, 0

1, 1

Represente la forma extensiva del juego en su totalidad, y halle los Equilibrios de Nash
Perfectos en Subjuegos.

Sin embargo, la intuicin nos indica que no siempre se cumple este comportamiento de los individuos dado que la solucin que se alcanza es la ms desfavorable
para ellos.
En efecto, si los jugadores decidiesen cooperar obtendran mejores pagos. Para
ello tendran que llegar a un acuerdo... y cumplirlo (tngase en cuenta que las decisiones que adoptan los jugadores se comunican por separado, y no es posible obligar al
otro a cumplir sus promesas).
Al considerar los pagos que se producen en distintas etapas, en ocasiones se tiene
en cuenta el valor de stos en el tiempo.
En efecto, el futuro cuenta menos que el presente por al menos dos motivos: porque damos menos valor a los pagos futuros que a los actuales, y menos cuanto ms
alejados del momento presente estn por una motivacin claramente econmica de
que damos menos valor al consumo futuro que al consumo presente; y porque siempre existe la posibilidad de no volver a encontrarnos en el futuro, es decir por la existencia de incertidumbre, ya que no tenemos certeza de que en el futuro realmente nos
vayamos a encontrar en esa misma situacin.

10
@juancaraguado

juancarlos.aguado.franco@gmail.com

JUEGOS DINMICOS 11

Como consecuencia de todo ello, el pago de la jugada siguiente tendr siempre


menor valor que el de la jugada actual.
Una forma habitual de sumar los pagos que se producen a lo largo del tiempo,
considerando que valoramos ms los pagos presentes que los futuros, es suponiendo
que existe una tasa de descuento constante (Shubik, 1970). Valoramos por tanto el
siguiente pago slo como una fraccin, w, del mismo pago en el presente. Obtener un
pago P en infinitos periodos tendra entonces un valor actual de:

P wP w2 P w3 P

P (1 w).

Es importante por tanto el peso que tenga el futuro en el clculo de las cantidades
totales a percibir. Como demuestra Axelrod (1981), si el parmetro de actualizacin
es lo suficientemente grande, no existe una estrategia ptima que sea independiente
de la estrategia utilizada por el otro jugador.
En un juego repetido, si existe ms de un Equilibrio de Nash puede ocurrir que
existan Equilibrios de Nash Perfectos en Subjuegos que incluyan en alguna etapa
combinaciones de estrategias que no sean un Equilibrio de Nash.
Consideremos el juego siguiente, representado en la figura 70, en el que el jugador n 1 puede optar por las estrategias A, B y C, mientras que el jugador n 2 tiene a
su disposicin las estrategias X, Y y Z. Se trata de un juego en dos etapas, es decir,
que van a jugar dos veces:
Figura 70. Matriz de pagos en una etapa de un juego en dos etapas.
X

5, 5

0, 6

0, 1

6, 0

3, 3

0, 2

2, 0

0, 0

1, 1

Los Equilibrios de Nash con los que cuenta este juego son (B, Y) y (C, Z), como
se puede apreciar a continuacin, en la figura 71, cuando subrayamos en la matriz los
pagos correspondientes a la estrategia ptima de cada jugador dada la estrategia del
otro.

12 JUEGOS DINMICOS

Figura 71. Equilibrios de Nash en una etapa.


X

5, 5

0, 6

0, 1

6, 0

3, 3

0, 2

2, 0

0, 0

1, 1

Analizada la matriz de pagos, se constata que la combinacin de estrategias (A, X)


ofrecera muy buen resultado conjunto para ambos individuos, aunque individualmente pudieran obtener mejores pagos individualmente podran llegar a tener un pago de
6, pero sera a costa de que el pago del otro fuera cero. No obstante, lo que est claro
es que la combinacin de estrategias (A, X) es, tanto individual como colectivamente,
mejor para ambos individuos que los Equilibrios de Nash del juego, aunque dicha
combinacin de estrategias no constituya un Equilibrio de Nash.
En este caso, podemos hacer algunos supuestos acerca del comportamiento de los
jugadores, dando por sentado que en la ltima etapa van a jugar un Equilibrio de Nash
de los dos de que disponen. Por ejemplo, podemos imaginar que si en la primera etapa
van a ser capaces de jugar la combinacin de estrategias (A, X), en la segunda etapa
jugarn el Equilibrio de Nash bueno es decir, el mejor de los dos (B, Y), en el que
ambos jugadores obtienen mejor pago que en el otro, mientras que si no son capaces
de coordinarse para obtener esa combinacin de estrategias que les reporta a cada uno
de ellos un pago de 5, el Equilibrio de Nash que jugarn en la ltima etapa ser el que
llamamos malo, es decir, (C, Z).
Bajo ese supuesto, el juego en su conjunto, considerando la suma de los pagos
que percibiran ambos individuos en las dos etapas de la que consta el juego, quedara
de la forma que recoge la figura 72:
Figura 72. Juego con los pagos de las dos etapas.
8, 8

1, 7

1, 2

7, 1

4, 4

1,3

3, 1

1, 1

2, 2

Como se puede apreciar, en la resolucin de esta nueva matriz de la figura 70


que recoge la suma de los pagos de ambas etapas bajo los supuestos realizados,
aparece un Equilibrio de Nash Perfecto en Subjuegos que implica jugar en la primera
etapa (A, X), que es una combinacin de estrategias que no se corresponde con ningn
Equilibrio de Nash del juego original.

12
@juancaraguado

juancarlos.aguado.franco@gmail.com

JUEGOS DINMICOS 13

Figura 73. Equilibrios de Nash del juego repetido


bajo determinados supuestos.
8, 8

1, 7

1, 2

7, 1

4, 4

1,3

3, 1

1, 1

2, 2

Podemos encontrar, por tanto, como vemos en la figura 73, en los juegos repetidos en los que existe ms de un Equilibrio de Nash en la formulacin del juego para
cada etapa, Equilibrios de Nash Perfectos en Subjuegos que impliquen no jugar un
Equilibrio de Nash en alguna de sus etapas.

Ejercicio de autocomprobacin 35
Suponga que dos individuos se enfrentan al juego representado a continuacin, sabiendo
que lo van a jugar durante dos etapas y que conocern el resultado de la primera etapa
antes de jugar la segunda.
X

1, 0

8, 1

2, 2

0, 8

7, 7

1, 1

5, 5

2, 1

0, 0

(a) Calcule los Equilibrios de Nash del juego en una etapa.


(b) Halle un Equilibrios de Nash Perfecto en Subjuegos que implique no jugar un
Equilibrio de Nash en la primera etapa, explicando las estrategias de los jugadores.

14 JUEGOS DINMICOS

4.2 Juegos repetidos un nmero infinito de veces


A diferencia de lo que ocurre con los juegos repetidos un nmero de repeticiones
finitas conocidas, cuando el juego se repite durante un nmero de veces indefinido, es
posible que emerja la cooperacin. El hecho que hace posible que surja la cooperacin es la posibilidad de encontrarse en el futuro. Como acertadamente afirma Axelrod, el futuro puede proyectar una sombra sobre el presente, y de este modo influir
sobre la situacin estratgica actual (Axelrod, 1986).
El trabajo sin duda ms citado en la literatura acerca de las posibles estrategias
que se pueden seguir en una situacin de un juego repetido un nmero infinito o
indeterminado de veces es el de Axelrod. En sus artculos de 1980, public los resultados de torneos informatizados del dilema del prisionero repetido. En ellos buscaba
identificar las condiciones bajo las cuales puede emerger un comportamiento cooperativo en ausencia de un poder central que lo imponga. En su libro de 1986 recoge
esos resultados junto con un mayor anlisis de las estrategias propuestas.
En este torneo, la estrategia que sali vencedora es la remitida por Anatol Rapoport, conocida en la literatura como TIT for TAT, u ojo por ojo.
Segn esta estrategia, en el primer juego la accin que elige es la cooperativa, y
en el resto de jugadas, hacer lo que el otro jugador hizo en la anterior. De esta forma,
si se encontraran dos jugadores que siguiesen esta estrategia, en cada jugada se encontraran en la situacin de equilibrio mutuamente cooperativa.
Si, por el contrario, ante nuestra cooperacin el otro decide no cooperar y obtener
as la renta del free-rider, en la siguiente jugada obtendr nuestra respuesta no cooperativa: ojo por ojo.
Como indica Hoffmann (2000), el xito de la estrategia TIT for TAT se basa en su
capacidad para diferenciar a sus oponentes y adaptarse a ellos. Tambin, porque resiste a la explotacin al contestar con defeccin a la defeccin, y responde positivamente con cooperacin a la cooperacin.
De hecho, el propio Axelrod (1986) describe sus virtudes como una combinacin
de bondad, represalia, olvido perdn y transparencia. Su bondad la previene de
meterse en problemas innecesarios. Su carcter de represalia desanima a la otra
parte de persistir en la defeccin. Su capacidad para olvidar perdonar ayuda a restaurar la mutua cooperacin. Finalmente, su transparencia la hace comprensible para
el otro jugador, promoviendo por tanto la cooperacin a largo plazo.
Adems, el hecho de tomar represalias rpidamente en la jugada siguiente,
aade fuerza a esta estrategia frente a otras opciones o experimentos en los que se
pospone esta actitud (Komorita, S.S.; Hilty, J.A. y Parks, C.D., 1991; Brembs, B.
1996).
14
@juancaraguado

juancarlos.aguado.franco@gmail.com

Anda mungkin juga menyukai