Anda di halaman 1dari 6

0

INSTITUTO DE ESTUDIOS SUPERIORES DE


OAXACA

Bsqueda entre
adversarios
Juegos, estrategias y decisiones
ptimas
Alumno(a): Santos Zarate Cecilia Victoria

Indice

Juegos........................................................................................................................2
Decisiones
ptimas
en juegos................................................................................................................2
Estrategias ptimas...................................................................................................3

El algoritmo minimax.................................................................................................3
Decisiones ptimas en juegos multi-jugador.............................................................4
Poda Alfa beta ()....................................................................................................4
Conclusiones.............................................................................................................5

Bibliografa.................................................................................................................5

Juegos
En los entornos multi-agente hay un conjunto de agentes autnomos que trabajan
en comn, por lo tanto cualquier agente debe considerar las acciones de los otros
agentes, para determinar cmo le afectan a l.
Existen dos tipos de entornos multi-agente, los cooperativos y los competitivos
dentro de estos se encuentran los juegos, los cuales presentan bsqueda entre
adversarios, debido a que dos o ms agentes alternan acciones dando lugar a
valores iguales y opuestos, por ejemplo cuando un agente gana el otro pierde y
se dice que son adversarios.
Hay factores que determinan el tipo de juego, por ejemplo:

Nmero de jugadores (dos jugadores o multi-jugador).

Suma cero (la ganancia de uno es la prdida del otro) y suma no cero.
1

Informacin perfecta (ambos jugadores tienen acceso a toda la informacin


sobre el estado del juego: no se oculta informacin el uno al otro.

Determinista

Por turnos (los movimientos son intercalados).

Decisiones ptimas en juegos


Un juego es un problema de bsqueda con los siguientes componentes:

Estado inicial: muestra la situacin inicial del juego, y el jugador que jugar
primero.

Funcin sucesor: conjunto de movimientos legales y los estados que


resultarn de cada uno.

Test terminal: condicin que al cumplirse determina que el juego ha


terminado, y el estado en cual se encuentre se llama estado terminal.

Funcin utilidad: da un valor numrico a los estados terminales de cada


jugador, por ejemplo al ganador le da un valor de +1, al perdedor -1 y en
caso de empate, regresa un valor 0.

Para analizar de manera grfica los movimientos posibles en un juego se utilizan


los arboles de juego, en los cuales se manejan los jugadores como max y min,
max es el primer jugador, y los nmeros en los nodos hojas del rbol indican los
valores de utilidad del estado terminal desde el punto de vista de max. Los valores
que son buenos para max son malos para min y viceversa. Al final los nodos hojas
que son los que contiene los valores de utilidad en los posibles estados terminales
son los que determinan el mejor movimiento.

Estrategias ptimas

Las estrategias ptimas son las que se utilizan para encontrar la mejor solucin , o
bien el conjunto de movimientos que un jugador debe realizar para ganar el juego
pero tomando en cuenta los posibles movimientos del contrincante.
El rbol de juegos est compuesto por capas que son los posibles movimientos
que puede hacer cada uno de los jugadores en un solo tiro.
La estrategia ptima se puede calcular utilizando los valores de utilidad para mx,
los cuales tambin son llamados valores minimax debido a que max busca
moverse a los estados que le den un valor de utilidad mximo y min buscara los
estados que den un valor de utilidad mnimo, ya que los estados que producen
valores de utilidad mnimos para max son los que benefician a min.

El algoritmo minimax
El algoritmo minimax hace una bsqueda primero en profundidad realizando un
procedimiento recursivo ya que de acuerdo a la posicin actual se generan los
posibles movimientos, se hace una evaluacin y se elige la mejor posicin para el
jugador correspondiente, y se evala a los niveles anteriores.
En el algoritmo minimax se utilizan valores de utilidad positivos para indicar
buenas situaciones y valores negativos para indicar situaciones que favorecen al
contrincante el jugador max procura maximizar el valor mientras que el oponente
busca minimizarlo.

Decisiones
jugador

ptimas

en

juegos

multi-

En juegos con ms de dos jugadores es ms complicado encontrar los


movimientos para encontrar el resultado ms ptimo ya que a diferencia de un
juego con dos jugadores en el cual las acciones de uno siempre son opuestas
para el otro, en los juegos multi-jugador existen muchas ms posibilidades, por lo
tanto es necesario que se hagan alianzas entre jugadores de manera no planeada.
3

Poda Alfa beta ()


Debido a que con el algoritmo minimax se tienen que analizar muchos estados, se
opta podar (cortar) dividiendo el nmero de estados, eliminando partes del rbol,
sin afectar el resultado, ya que se obtiene el mismo resultado si se utilizara el
algoritmo minimax.
Se da el nombre de alfa beta porque utiliza estas dos variables para almacenar
el valor de la mejor opcin encontrado para max, y para almacenar el valor de la
mejor opcin encontrada para min. Estos valores van cambiando conforme se
avanza en el rbol.
Cuanto mejor se ordenen los movimientos ms efectiva ser la poda, con una
ordenacin perfecta por as llamarlo la complejidad del algoritmo es 0(b d/2) es
decir se requiere la mitad de esfuerzo para analizar el rbol con poda que uno con
minimax.

Conclusiones
Los juegos tienen entornos multi-agente competitivos ya que lo integran un
conjunto de agentes individuales que dependen de las acciones que tomen otros
agentes para tomar sus decisiones. Los juegos deben tener ciertas caracterizas
que los definan como el nmero de jugadores, si es por turnos, si es determinista,
de suma cero y si tiene informacin perfecta.
Los juegos pueden ser tratados como problemas de bsqueda ya que tienen un
estado inicial en el cual se define quien inicia el juego y en qu posicin, una
funcin sucesor con los posibles movimientos de cada jugador y los estados que
produce, un test terminal que determina cundo termina el juego, el estado
terminal en el cual se quedan los jugadores cuando el juego termina y la funcin
4

de utilidad que es un valor numrico que define el estado terminal de cada


jugador.
Existen estrategias especficas que se utilizan para encontrar la mejor jugada
ejemplo de estas estrategias son el algoritmo de minimax el cual utiliza las
funciones de utilidad dentro de un rbol de juego, el jugador max busca los valores
de funcin utilidad ms altos y el jugador min busca los bajos para ganar el juego.
Y el poda alfa beta que es parecido al minimax pero podando o cortando las
ramas de los rboles de juego sin afectar el resultado. Cualquiera de estas dos
tcnicas buscan el resultado ms ptimo.

Bibliografa
(2004). En P. N. Stuart J. Russell, Inteligencia Artificial un enfoque moderno.
Madrid: Pearson Prentice Hall.

Anda mungkin juga menyukai