Anda di halaman 1dari 24

UNIVERSDIAD AUTONOMA DE SINALOA

FACULTAD DE INGENIRIA MOCHIS

INGENIERÍA CIVIL

MATERIA:
LABORATORIA DE INGENIERIA DE SISTEMAS APLICADA

TRABAJO:
PRACTICA #11 TEORIAS DE JUEGOS (ESTRATEGIAS MIXTAS)

ALUMNO:
BRIAN ALAN LEYVA HERNANDEZ

GRUPO:
3-01

DOCENTE:
ING. JAIME E. RABAGO AGUIRRE

Viernes 23 de Mayo de 2019


Práctica 11 Teoría de Juegos (Estrategias Mixtas)

Objetivo General: Que el alumno conozca las distintas estrategias mixtas donde a cada uno de
los jugadores le asigna una probabilidad.

Materiales: Computadora y Software TORA.

FUNDAMENTO TEÓRICO
La teoría de juegos maneja situaciones de decisión en las que hay dos oponentes inteligentes
que tienen objetivos contrarios. Entre los ejemplos característicos están lanzamientos de
campañas de publicidad para productos que compiten, y la planeación de estrategias bélicas de
los ejércitos contrarios. Estas situaciones contrastan con lo que hemos estudiado hasta ahora, en
las que no se considera que la naturaleza sea un oponente benévolo.
En un conflicto de juegos hay dos oponentes, llamados jugadores, y cada uno tiene una
cantidad (finita o infinita) de alternativas o estrategias. Asociada con cada par de estrategias
hay una recompensa que paga un jugador al otro. A estos juegos se les llama juegos entre dos
personas con suma cero, porque la ganancia de un jugador es igual a la pérdida del otro. Si se
representaban los dos jugadores con A y B, con m y n estrategias, respectivamente, el juego se
suele representar con la matriz de recompensa para el jugador A que es la siguiente:

B1 B2 … Bn
A1 a11 a12 … a1n
A2 a21 a22 … a2n
: : : : :
Am am1 am2 … amn

La representación indica que si A usa la estrategia i y B usa la estrategia j. la recompensa para


A es de an y entonces la recompensa para B es de –an.

Solución óptima de juegos de dos personas de suma cero

Como los juegos tienen su base en el conflicto de interés, la solución óptima escogerá uno más
estrategias para cada jugador de tal modo que cualquier cambio en las estrategias elegidas no
mejore la recompensa para cualquiera de los jugadores. Esas soluciones pueden tener la forma
de una sola estrategia pura o varias estrategias mezcladas de acuerdo con probabilidades
predeterminadas. Los dos ejemplos siguientes muestran los dos casos.
Ejemplo 11.1 -1
Dos empresas A y B venden dos marcas de vacunas para la gripe. La empresa A se anuncia en
radio (A1), en televisión (A2) y en los periódicos (A3). La empresa B además de usar la radio
(B1), la televisión (B2) y los periódicos (B3) también envía folletos por correo (B4). De acuerdo
con el ingenio y la intensidad de la campaña publicitaria, cada empresa puede capturar una parte
del mercado que correspondía a la otra. La matriz siguiente es un resumen del porcentaje del
mercado capturado o perdido por la empresa A.

B1 B2 B3 B4 Min. de renglón

A1 8 -2 9 -3 -3
A2 6 5 6 8 5 Máxima
A3 -2 4 -9 5 -9

Max de columna 8 5 9 8

Mínima

A) Modelo de Programación Lineal


Renglón:

8x11-2x12+9x13-3x14 <= -3

6x21+5x22+6x23+8x24 <= 5

-2x31+4x32-9x33+5x34 <=-9
Columna:
8x11+6x21-2x31 <=8
-2x12+5x22+4x32 <=5
9x13+6x23-9x33 <=9
-3x14+8x24+5x34 <=8

B) Ultima Ventana
C) Conclusión
Jugador A:
A1=0%
A2=100%
A3=0%

Jugador B
B1=0%
B2=100%
B3=0%
B4=0%

La solución del juego se basa en el principio de asegurar lo mejor de lo peor para cada
jugador. Si la empresa A selecciona la estrategia A1 entonces independientemente de lo que haga
B, lo peor que puede suceder es que A pierda el 3% del mercado que adquiere B. esto se
representa con el valor mínimo de los elementos del renglón 1. De igual modo, el peor de los
resultados de la estrategia A3 para A es que B le gane el 9% del mercado. Los resultados se ponen
en la columna “min. Del renglón”. Para lograr lo mejor de lo peor la empresa A escoge la
estrategia A2, por que corresponde al valor máximo o sea el elemento mayor de la columna “min.
del renglón”.
A continuación veamos la estrategia de la empresa B. como la matriz de recompensa dada es
para A el criterio de lo mejor de lo peor de B requiere determinar el valor mínima, para lo cual
B debe seleccionar la estrategia B2.
La solución óptima del juego pide seleccionar la estrategia A2 y B2 esto es, ambas empresas
deben utilizar publicidad por televisión. La recompensa favorecerá a la empresa A, porque su
parte del mercado aumenta 5%. En este caso, se dice que el valor del juego es 5% y que A y B
están usando una solución de estrategia pura de punto de silla.
La solución de punto de silla garantiza que ninguna empresa tenga la tentación de seleccionar
una estrategia mejor. Si B pasa a otra estrategia (B1, B3 o B4) la empresa A puede permanecer
con la estrategia A2 con lo que asegura que B pierda un aparte del mercado (6% u 8%). Por la
misma razón, A no desea usar una estrategia distinta, porque si A pasa a la estrategia A3, B puede
cambiar a B3 y realizar un aumento del 9% en su parte del mercado. Se llega a una conclusión
parecida si a cambia a A1.

La solución óptima de un punto de silla para un juego no necesita estar caracterizada por
estrategias puras. En su lugar, la solución puede requerir una mezcla aleatoria de dos o más
estrategias como se verá en el ejemplo siguiente.

Ejemplo 11.1 - 2

Dos jugadores A y B juegan a tirar la moneda. Cada jugador, desconocido para el otro escoge
una cara (H) o una cruz (T). Los dos jugadores dicen su elección al mismo tiempo. Si coinciden
(HH) o (TT) el jugador A recibe $1 del jugador B. En cualquier otro caso A paga $1 a B.
La siguiente matriz de recompensa para el jugador A muestra los valores mínimos de
renglón y máximo de columna que corresponden a las estrategias de A y B, respectivamente.

BH BT Min. de renglón
AH 1 -1 -1
AT -1 1 -1
Max de columna 1 1

A) Modelo de Programación Lineal


Renglón:

1x11-1x12 <=-1

-1x21+1x22 <=-1

Columna:
1x11-1x21 <=1

-1x12+1x22 <=1

B) Ultimas ventanas

C) Conclusión:
Jugador A:
A1=50%
A2=50%

Jugador B
B1=50%
B2=50%

Los valores maximin y minimax de los juegos son -$1 y $1, respectivamente. Como los
dos valores no son iguales, el juego no tiene solución de estrategia pura. En particular, si el
jugador A usa AH el jugador B seleccionara BT para recibir $1 de A. si eso sucede A puede
cambiar a la estrategia AT para invertir el resultado del juego, y recibir $1 de B. la tentación
constante de los dos jugadores, de cambiar de estrategia, muestra que no se acepta una solución
de estrategia pura. En lugar de ello, ambos jugadores deben usar mezclas aleatorias de sus
estrategias respectivas. En este caso óptimo del juego estará en algún punto entre los valores
maximin y minimax del juego, esto es, Valor maximin (inferior) ≤ valor del juego ≤ valor
minimax (superior)
(Véase el problema 5, conjunto de un problema 11.4a). Así en el ejemplo de lanzar la moneda,
el valor del juego debe estar entre - $1 y + $1.

Conjunto de problemas 11.4 A


1. Determine la solución de punto de silla, las estrategias puras asociadas y el valor del
juego para cada uno de los jugadores siguientes. Las recompensas son para el jugador A.
a)
B1 B2 B3 B4
A1 8 6 2 8
A2 8 9 4 5
A3 7 5 3 5

B1 B2 B3 B4 Min
A1 8 6 2 8 2
A2 8 9 4 5 4
A3 7 5 3 5 3
Max 8 9 4 8

A) Modelo de Programación Lineal


Renglón:
8x11+6x12 +2x13+8x14<=2
8x21+9x22+4x23+5x24<= 4
7x31+5x32+3x33+5x34<=3
Columna:
8x11+8x21+7x31>=8
6x12+9x22+5x32>=9
2x13+4x23+3x33>=4
8x14+5x24+5x34>=8

B) Ultima Ventana

c) Conclusión:
Jugadores A:
A1=0%
A2=0%
A3=100%

Jugadores B:
B1=0%
B2=0%
B3=100%
B4=0%
Punto de silla = 4 Valor de Juego = 4
b)
B1 B2 B3 B4
A1 4 -4 -5 6
A2 -3 -4 -9 -2
A3 6 7 -8 -9
A4 7 3 -9 5

B1 B2 B3 B4 Min
A1 4 -4 -5 6 -5
A2 -3 -4 -9 -2 -9
A3 6 7 -8 -9 -9
A4 7 3 -9 5 -9
Max 7 7 -5 6

A) Modelo de Programación Lineal

Renglón:
4x11-4x12 -5x13+6x14<=-5
-3x21-4x22-9x23-2x24<= -9
6x31+7x32-8x33-9x34<=-9
7x41+3x42-9x43+5x44<=-9
Columna:
4x11-3x21+6x31+7x41>=7
-4x12-4x22+7x32+3x42>=7
-5x13-9x23-8x33-9x43>=-5
6x14-2x24-9x34+5x44>=6
B) Ultima Ventana

c) Conclusión:

Jugadores A: Jugadores B:

A1=100% B1=0%

A2=0% B2=0%

A3=0% B3=100%

A4=0% B4=0%

Punto de silla = -5 Valor de Juego = -5

2 Los juegos siguientes muestran las recompensas de A. determine los valores de p y de q


que hagan que le punto (2,2) de cada juego sea un punto de silla:

a)
B1 B2 B3
A1 1 q 6
A2 p 5 10
A3 6 2 3
B1 B2 B3
A1 1 Q(3) 6 1
A2 P(4) 5 10 4
A3 6 2 3 2
7 6 10

A) Modelo de Programación Lineal


Renglón:
1x11+3x12 +6x13<=1
4x21+5x22+10x23<= 4
6x31+2x32+3x33<=2
Columna:
1x11+4x21+6x31>=7
3x12+5x22+2x32>=6
6x13+10x23+3x33>=10

B) Ultima Ventana
c) Conclusión:
Jugadores A:
A1=0%
A2=80%
A3=20%
Jugadores B:
B1=60%
B2=40%
B3=0%
P=4 y Q=3

b)
B1 B2 B3
A1 2 4 5
A2 10 7 q
A3 4 p 6

B1 B2 B3
A1 2 4 5 2
A2 10 7 Q(8) 7
A3 4 P(5) 6 4
10 7 8

A) Modelo de Programación Lineal


Renglón: Columna:
2x11+4x12 +5x13<=2 2x11+10x21+4x31>=10
10x21+7x22+8x23<= 7 4x12+7x22+5x32>=7
4x31+5x32+6x33<=4 5x13+8x23+6x33>=8
B) Ultima Ventana

C) Conclusión:

Jugadores A:

A1=0%

A2=100%

A3=0%

Jugadores B:

B1=0%

B2=100%

B3=0%

Punto de Silla = 7 y Punto de juego = 7

P= 5 y Q= 8
3 Especifique el intervalo de valores de juego en cada uno de los casos siguientes,
suponiendo que la recompensa es para el jugador A.
a)
B1 B2 B3 B4
A1 1 9 6 0
A2 2 3 8 4
A3 -5 -2 10 -3
A4 7 4 -2 -5

B1 B2 B3 B4
A1 1 9 6 0 0
A2 2 3 8 4 2
A3 -5 -2 10 -3 -5
A4 7 4 -2 -5 -5
7 9 10 4

A) Modelo de Programación Lineal


Renglón:
1x11+9x12 +6x13+0x14<=0
2x21+3x22+8x23+4x24<= 2
-5x31-2x32+10x33-3x34<=-5
7x41+4x42-2x43-5x44<=-5
Columna:
1x11+2x21-5x31+7x41>=7
9x12+3x22-2x32+4x42>=9
6x13+8x23+10x33-2x43>=10
0x14+4x24-3x34-5x44>=4
B) Ultima Ventana

c) Conclusión:
Jugadores A:
A1=0%
A2=86%
A3=0%
A4=14%
Jugadores B:
B1=64%
B2=0%
B3=0%
B4=36%
Punto de juego = 2.71
b)
B1 B2 B3 B4
A1 -1 9 6 8
A2 -2 10 4 6
A3 5 3 0 7
A4 7 -2 8 4

B1 B2 B3 B4 Min
A1 -1 9 6 8 -1
A2 -2 10 4 6 -2
A3 5 3 0 7 0
A4 7 -2 8 4 -2
Max 7 10 8 7

A) Modelo de Programación Lineal


Renglón:
-1x11+9x12+6x13+8x14<=-1
-2x21+10x22+4x23+6x24<= -2
5x31+3x32+0x33+7x34<=0
7x41-2x42+8x43+4x44<=-2
Columna:
-1x11-2x21+5x31+7x41>=7
9x12+10x22+3x32-2x42>=10
6x13+4x23+0x33+8x43>=8
8x14+6x24+7x34+4x44>=8
B) Ultima Ventana

C) Conclusión:
Jugadores A:
A1=30%
A2=0%
A3=47%
A4=23%
Jugadores B:
B1=50%
B2=38%
B3=12%
B4=0%
Punto de juego = 3.65
c)
B1 B2 B3
A1 3 6 1
A2 5 2 3
A3 4 2 -5

B1 B2 B3 Min
A1 3 6 1 1
A2 5 2 3 2
A3 4 2 -5 -5
Max 5 6 3
A) Modelo de Programación Lineal
Renglón:
3x11+6x12 +1x13<=1
5x21+2x22+3x23<= 2
4x31+2x32-5x33<=-5
Columna:
3x11+5x21+4x31>=5
6x12+2x22+2x32>=6
1x13+3x23-5x33>=3
B) Ultima Ventana

C) Conclusión:

Jugadores A:
A1=17%
A2=83%
A3=0%
Jugadores B:
B1=0%
B2=33%
B3=67%
Punto de juego = 2.67

d)
B1 B2 B3 B4
A1 3 7 1 3
A2 4 8 0 -6
A3 6 -9 -2 4
B1 B2 B3 B4 Min
A1 3 7 1 3 1
A2 4 8 0 -6 -6
A3 6 -9 -2 4 -9
Max 6 8 1 4
A) Modelo de Programación Lineal
Renglón:

3x11+7x12 +1x13+3x14<=1

4x21+8x22+0x23-6x24<= -6

6x31-9x32-2x33+4x34<=-9

Columna:

3x11+4x21+6x31>=6

7x12+8x22-9x32>=8

1x13+0x23-2x33>=1

3x14-6x24+4x34>=4

B) Ultima Ventana
C) Conclusión:

Jugadores A:

A1=100%

A2=0%

A3=0%

Jugadores B:

B1=0%

B2=0%

B3=100%

B4=0%

Punto de juego = 1.00

4 Dos empresas anuncian dos productos (uno cada una) que compiten. En la actualidad,
cada producto controla el 50% del mercado. Debido a las mejoras recientes en los dos
productos, cada empresa se prepara para lanzar una campaña publicitaria. Si ninguna
empresa anuncia, seguirán las partes iguales en el mercado. Si cualquiera de ellas lanza
una campaña más intensa, es seguro que la otra perderá un porcentaje proporcional de
sus clientes. El estudio de mercado indica que con televisión se puede llegar al 50% de
los clientes potenciales, con periódicos al 30%, y con el radio al 20%.

a) Resuelva el siguiente juego entre dos personas con suma cero y seleccione los
medios publicitarios adecuados, para cada una de las dos empresas. ¿Puede
operar cada empresa con una sola estrategia pura?

B1 B2 B3
A1 5 3 2
A2 10 6 4
A3 15 9 6
B1 B2 B3
A1 5 3 2 2
A2 10 6 4 4
A3 15 9 6 6
15 9 6
A) Modelo de Programación Lineal
a) Renglón:
5x11+3x12 +2x13<=2
10x21+6x22+4x23<= 4
15x31+9x32+6x33<=6
Columna:
5x11+10x21+15x31>=15
3x12+6x22+9x32>=9
2x13+4x23+6x33>=6

B) Ultima Ventana
C) Conclusión:

Jugadores A:
A1=0%
A2=0%
A3=100%
Jugadores B:
B1=0%
B2=0%
B3=100%

Si, ambas deben de trabajar con la radio

3 Sea aij el elemento (i, j)-esimo de una matriz de recompensa con m estrategias para el
jugador A y n estrategias para el jugador B. La recompensa es para el jugador A.

Max min aij ≤ min Max aij


i j j i
Solución de juegos con estrategia mixta
Se pueden resolver en forma gráfica o con programación lineal los juegos con estrategias mixtas.
La solución grafica es adecuada para juegos en los que al menos un jugador tiene exactamente
dos estrategias puras. El método es interesante, porque explica en forma gráfica la idea de un
punto de silla. Se puede usar la programación lineal para resolver cualquier juego entre dos
personas con suma cero.

Solución gráfica de juegos. Comenzaremos con el caso de juegos (2 x n) en los que el jugador
A tiene dos estrategias. La recompensa es para el jugador A.

y1 y2 … yn
B1 B2 … Bn
x1 A1 a11 a12 … a1m
1 - x₂ A2 a21 a22 … a2m
En el juego se supone que el jugador A mezcla las estrategias A1 y A2 con las probabilidades
respectivas x1 y 1 — x2 0 ≤ x1 ≤ 1. El jugador B mezcla las estrategias B1, B2,…., Bn con las
probabilidades y1, y2,…, siendo y1 ≥ 0 para j = 1, 2,…, n, y y1 + y2 +… + yn = 1. En este caso,
la recompensa esperada por A correspondiente a la j-ésima estrategia pura de B se calcula como
sigue:
(a1j – a2j) x1 – a2j, j = 1, 2,… n
El jugador A trata así de determinar el valor de x1 que maximice las recompensas mínimas
esperadas, esto es,

max min aij {(a1j - 2ij)x1-a2j}

x1 j

Anda mungkin juga menyukai