Anda di halaman 1dari 29

JUEGOS DINAMICOS Y ESTATICOS

CON INFORMACION COMPLETA E


INCOMPLETA

INTEGRANTES:
 LOPEZ LORENZO, Miguel Angel
 MARCELO POVIS, Gean Pierth
 VILCAHUAMAN POMA, Luis R.
La teoría de juegos es un área de
la matemática aplicada que
utiliza modelos para estudiar
interacciones en estructuras
formalizadas de incentivos (los
llamados «juegos»). La teoría de juegos
se ha convertido en un herramienta
sumamente importante para la teoría
económica y ha contribuido a
comprender más adecuadamente la
conducta humana frente a la toma de
decisiones. Sus investigadores estudian
las estrategias óptimas así como el
comportamiento previsto y observado
de individuos en juegos.
1. JUGADORES

2. ACCIONES

3. ESTRATEGIAS

4. INFORMACION

5. PAGOS

6. EQUILIBRIO
Juegos Estáticos
Estos juegos se representan de manera natural en forma
estratégica, ya que los jugadores realizan sus jugadas de manera
simultánea.

Juegos Dinámicos
Son aquellos en los que los jugadores pueden tomar decisiones en
distintos instantes del tiempo y donde cada jugador conoce con
toda certeza las funciones de pagos de todos los jugadores.
Los elementos fundamentales Los jugadores toman sus
de un juego estático con decisiones simultáneamente (o
información completa son: dicho con más precisión, sin
jugadores, estrategias conocer las decisiones de los
disponibles para cada jugador, otros) y de una sola vez, y a
y ganancias o pagos resultantes continuación reciben las
para cada jugador (utilidad que ganancias, que dependen de
a cada uno reporta cada la combinación de decisiones
resultado del juego). tomadas.
EJEMPLO

Si tu mejor respuesta es única  acción dominante.


Si existe alguna acción que nunca es mejor respuesta  acción
dominada No
Apartarse
Apartarse
Apartarse 2 , 3* 1,2
No
3,1 0,0
Apartarse

Si varias mejores respuestas, pero una que lo es siempre ante


cualquier acción del rival  débilmente dominante

No
Apartarse
Apartarse
Apartarse 2 , -2 2 , -2
No
1 , -1 3 , -3
Apartarse
Equilibrio de estrategia dominante iterada.- Es una
combinación de estrategias que se encuentra

1) eliminando una estrategia débilmente dominada del


conjunto de estrategias de uno de los jugadores…
2) …recalculando para encontrar las estrategias
débilmente dominadas que quedan…
3) …eliminando una de ellas y continuando el proceso
hasta que sólo queda una estrategia para cada
jugador.
Equilibrio de Nash (EN).- Es una combinación de estrategias
(acciones) tal que la estrategia de cada jugador es la mejor
respuesta a la de sus oponentes.

Def (6) s*  ( s1* , s2* ) es un equilibrio de Nash del juego G si :


u1 ( s1* , s2* )  u1 ( s1 , s2* )  s1  S1 y
u2 ( s1* , s2* )  u2 ( s1* , s2 )  s2  S2

EN ningún jugador tiene incentivos a desviarse


unilateralmente.
Relación entre EN y dominancia
• Si en un juego todos tienen estrategia dominante, entonces la
combinación de estrategias dominantes es un EN
• Si la eliminación de estrategias dominadas da lugar a una única
combinación de estrategias, entonces ésta constituye el único EN.
• En ningún EN un jugador puede utilizar una estrategia fuertemente
dominada.
 Ejemplo.- Dilema del prisionero

Jugador 2
Confesar No Confesar
Confesar (-5,-5) (-1,-10)
Jugador 1
No Confesar (-10,-1) (-2,-2)

¿Es a=(NC,C) un EN?


• U1 (NC,C)= -10 / U1 (C,C) = - 5  Incentivos a desviarse  No EN

¿Es a=(NC,NC) un EN?


• U1 (NC,NC)= -2 / U1 (C,NC) = - 1  Incentivos a desviarse  No EN

¿Es a=(C,C) un EN?


• U1 (C,C)= -5 / U1 (NC,C)= - 10  No Incentivos a desviarse  EN
Duopolio de Cournot

¿Conocemos realmente los costes de la otra empresa?


• Es difícil obtener información fiable sobre los costes del rival.
• El rival considera que es estratégicamente importante mantener a
sus oponentes engañados sobre sus costes.

i Jugadores N  1, 2
ii Acciones si  qi ; Si  qi : qi   0,  
iii Pagos ui  s1 , s2    i  q1 , q2  i  1, 2
iv Costes 1 Conocidos C1  q1   cq1
v Costes 2 Desconocidos C 2  q2   c A q 2 o C 2  q 2   c B q 2
vi Demanda Q  q1  q2
vii Pr ecio p (Q)  a  Q
• Un juego bayesiano estático es un juego estático con
información incompleta en el que cada jugador i € {1,…,n}
tiene un conjunto de acciones disponibles Ai, pero además, al
menos, uno de los jugadores dispone de alguna información
privada.

• Transformación de Harsany.- Transformamos juegos de


información incompleta en juegos de información completa,
pero imperfecta añadiendo un movimiento inicial en el que la
naturaleza elige entre distintos conjuntos de reglas.
• Tratamos a los jugadores que tengan información privada
como si fueran jugadores con distintos tipos.
• Los jugadores comienzan el juego sabiendo su propio tipo
pero no el de sus rivales.
Juego simultáneo con información incompleta
   A1 ,..., An , T1 ,..., Tn , p1 ,..., p n , u1 ,..., u n 
Secuencia temporal.
• La naturaleza o azar determina el perfil de tipos.
• La naturaleza revela a cada individuo su tipo, pero no sabe qué
tipo tiene el resto.
• Cada individuo elige simultáneamente su acción y se obtienen
los pagos
• Estrategia.- Plan de acción completo que especifica qué
acción adoptar para cada uno de sus posible tipos (no sólo
para el que realmente es?
si : Ti  Ai

• En un juego bayesiano las estrategias de cada jugador son


funciones del espacio de tipos al espacio de acciones

• ¿ Por qué debe el jugador que tiene la información privada


preocuparse por su acción para todo tipo t posible cuando él
sabe que es un tipo concreto?
• La razón es que para decidir su curso de acción óptimo, necesita
conjeturar sobre lo que plantea hacer su rival.
• Pero el rival no conoce el tipo de jugador que es, así que se
formará creencias sobre las acciones de los diferentes tipos que
tiene el jugador con información privada.
Estrategias
𝑆1 = 𝐴, 𝐵
𝑆2 = 𝐴, 𝐴 , 𝐴, 𝐵 , 𝐵, 𝐴 , (𝐵, 𝐵)

𝐽𝑢𝑔𝑎𝑟 𝐴 𝑠𝑖 𝐽1 (𝐴) (𝑎, 𝑏)


𝐴, 𝐴 ֜ ቊ
𝐽𝑢𝑔𝑎𝑟 𝐴 𝑠𝑖 𝐽1 (𝐵) (𝑒, 𝑓)
𝐽𝑢𝑔𝑎𝑟 𝐴 𝑠𝑖 𝐽1 (𝐴) (𝑎, 𝑏)
𝐴, 𝐵 ֜ ቊ
𝐽𝑢𝑔𝑎𝑟 𝐵 𝑠𝑖 𝐽1 (𝐵) (𝑔, ℎ)
𝐽𝑢𝑔𝑎𝑟 𝐵 𝑠𝑖 𝐽1 (𝐴) (𝑐, 𝑑)
𝐵, 𝐴 ֜ ቊ
𝐽𝑢𝑔𝑎𝑟 𝐴 𝑠𝑖 𝐽1 (𝐵) (𝑒, 𝑓)
𝐽𝑢𝑔𝑎𝑟 𝐵 𝑠𝑖 𝐽1 (𝐴) (𝑐, 𝑑)
𝐵, 𝐵 ֜ ቊ
𝐽𝑢𝑔𝑎𝑟 𝐵 𝑠𝑖 𝐽1 (𝐵) (𝑔, ℎ)
• Subjuego.- Es una parte de un juego completo que
cuando se separa del juego constituye por sí mismo un
juego.
• Consiste en un nudo que es único en cada conjunto de
información, los nudos sucesivos a él y los pagos asociados
a esos nudos finales.
• Cada juego tiene como subjuego a sí mismo.
• Perfección en subjuego.-
• Una estrategia es perfecta en subjuegos cuando contiene un
equilibrio en cada subjuego
• La solución de un juego en forma extensiva es perfecta en
subjuegos.

• Equilibrio de Nash perfecto en subjuegos.- Es un equilibrio de


Nash para el juego que, además, proporciona un equilibrio de
Nash para todo subjuego propio del juego.
• Una combinación de estrategias es ENPS si cada jugador
juega un equilibrio en cada subjuego.
• Permanece como equilibrio en todas las trayectorias posibles,
la de equilibrio y cualquier otra de algún subjuego.
• En juegos finitos se puede calcular el equilibrio
mediante la Inducción hacia atrás
• Se empieza resolviendo la elección óptima en los
últimos nudos de decisión y entonces se sube por el
árbol para calcular la decisión óptima en los
penúltimos nudos de decisión, y así sucesivamente.
• Comenzamos hallando el equilibrio en el subjuego final,
retrocedemos al subjuego mayor y así hasta llegar a la
primera etapa del juego.
Duopolio de Stackelberg

• 2 empresas compiten en cantidades sobre un bien homogéneo y


con idéntica estructura de costes.
• Una de las empresas decide en primer lugar (líder) y la empresa
seguidora decide en función de lo que diga la líder.
• Diferencia Cournot.- La empresa seguidora sabe lo que va a hacer la
empresa líder.

i Jugadores N  1, 2
ii Acciones Niveles de producción
iii Estrategias S L  qL : qL   0,   y S S  qS : qS  aL 
iv Pagos ui  sL , sS    i  qL , qS  i  L, S
v Costes c
vi Demanda Q  q L  qS
vii Pr ecio p (Q )  a  Q
Cálculo del Equilibrio Nash  Inducción hacia atrás
i. Max Bº de la empresa seguidora

Max  S  (a  (qL  qS ))qS  cS qS


 S a  cS  qL
  / qS  a  2qS  qL  cS  0  qS 
qS 2

ii. Max Bº de la empresa líder, una vez conocida función reacción


empresa seguidora y obtenemos la función mejor respuesta a partir
CPO.

   a  cS  qL 
Max  L   a   qL      q L  cL q L
   2 
 L  a  cS  2qL
 a  2cL  cS
 a  2qL   
 L c  0  q 
qL
L
 2  2
 a  2cL  cS a  3cS  2cL 
Pagos ENPS   , 
 2 4 
¿Qué es un juego con
información incompleta?
 Un juego con información incompleta
es aquel que se caracteriza porque los
jugadores no conocen muy bien la
estructura del juego, es decir, no
conocen del todo los conjuntos de
acciones y los pagos de todos los
jugadores, además de la racionalidad
de todos ellos.
Función de Utilidad:
 Es una función que resume la importancia que
una persona asocia a diferentes cantidades.

𝑈 = 𝑈(𝑥)
Donde U(x) es la utilidad que proporciona el
resultado x.
 La utilidad es la traducción cuantitativa de las
preferencias.
Riesgo e incertidumbre
 Riesgo: Una decisión se toma bajo riesgo
cuando no hay certidumbre pero se puedes
estimar probabilidades objetivas sobre la
ocurrencia de las diversas consecuencias
posibles de la decisión.
 Incertidumbre: una decisión se toma bajo
incertidumbre cuando no se le sube a ciencia
cierta las consecuencias de la decisión y no hay
probabilidades objetivas de la ocurrencia de
cada consecuencia.
Función de utilidad con Riesgo
 Cuando se pueden estimar las probabilidades de tomar
una decisión se dice que hay riesgo.
 𝑥𝑖 : es la cantidad del premio del i-ésimo resultado.
 𝑈 𝑥𝑖 : utilidad proporcionada por ganar 𝑥𝑖 .
 Si un agente tiene su función de utilidad con segunda
derivada igual a cero, se dice que este es indiferente al
riesgo.
 Si un agente tiene en su función utilidad, segunda derivada
menor (mayor) a cero, se dice que tiene aversión
(propensión) al riesgo. La utilidad esperada de un premio
va a ser menor que la utilidad de la esperanza del premio.
 Prima de riesgo ((L)): es la cantidad que un agente
adverso al riesgo esta dispuesto a pagar para librarse al
riesgo de tomar la decisión de la lotería L con valores
(X1,X2….Xn).
 E(L): Valor esperado de la lotería L.
E(L)=p1X1+p2X2+……pnXn
 E(U(L)): utilidad esperada por tomar la lotería L.
E(U(L))=p1U(X1)+p2U(X2)+……pnU(Xn)
E(U(L))=σ𝑛𝑖=1 𝑝𝑖 𝑢(𝑥𝑖 )
 La utilidad de la esperanza del premio esta representada
por UE(L).
 En el siguiente cuadro se resumen los criterios para medir
la utilidad hacia el riesgo.

Medición de la actitud hacia el riesgo

Relación entre U(E(L)) y


prima de riesgo (L) segunda derivada
EU(L)

Aversion al riesgo U(E(L)) > EU(L) (L) > 0 U” < 0

Neutralidad ante el U” = 0
U(E(L)) = EU(L) (L) = 0
riesgo

U(E(L)) < EU(L) U” > 0


Propension al riesgo (L) < 0
Actitudes hacia el riesgo:
definición gráfica
U(x)  En el siguiente grafico se
muestra las diferentes actitudes
A de una agente hacia el riesgo,
B
en el punto A, el agente es
averso al riesgo, en el punto B, el
C
agente es neutra al riesgo y en
el punto C, es propenso o
prefiere el riesgo.

x
Función de utilidad bajo
incertidumbre
 Veamos este ejemplo, el problema del político
corrupto:
El problema del político corrupto

Estados del mundo


Acciones
hay pruebas (E1) no hay pruebas (E2)

Negarlo todo (A1) destituido (X1) reforzado (X3)

Confesar parte (A2) debilitado (X2) debilitado (X2)

Confesar todo (A3) destituido (X1) destituido (X1)

 El político no conoce las probabilidades de los


estados del mundo a la hora de accionar.