Anda di halaman 1dari 11

Teora de juegos

Evaluacin aproximada al horizonte finito (Zue,


1945; Wiener, 1948; Shannon, 1950)
Primer programa de ajedrez (Turing, 1951)
Aprendizaje automtico para mejorar precisin de
evaluaciones (Samuel, 1952-57)
Poda para permitir bsquedas ms profundas
(McCarthy, 1956)

Poda alfa-beta

Mejora en promedio un 30% los resultados del


algoritmo minimax, (depende de la distribucin de
los nodos y la funcin objetivo)
No se puede quitar el exponente del la complejidad
de tiempo, pero se puede reducir a la mitad (puede
conseguir la decisin minimax sin revisar cada nodo)
Usando poda para evitar examinar partes del rbol
que no aportan ms informacin

Elimina ramas que no pueden influenciar la decisin final

Poda alfa-beta

Considerar un nodo n en algn lugar del rbol, tal que un


jugador tiene la opcin de moverse a ese nodo.
Si el jugador tiene una mejor opcin m al nivel del padre
del nodo n o en cualquier punto arriba, entonces n nunca
ser alcanzado en el juego.
Cuando se tiene suficiente informacin de n (al examinar
algunos de sus descendientes) se puede podar su rama.
Siendo una bsqueda en profundidad primero, slo se
deben considerar los nodos de una sola ruta en el rbol.

Poda alfa-beta
Recibe su nombre de los dos parmetros que describen limites a
los valores que son pasados hacia arriba en cualquier punto de la
ruta:

Alfa: el valor de la mejor opcin encontrada hasta el momento


para cualquier opcin de la ruta para MAX (por ejemplo: el
valor ms alto)
Beta: el valor de la mejor opcin encontrada hasta el momento
para cualquier opcin de la ruta MIN (por ejemplo: el valor
ms pequeo)

Algoritmo Poda alfa-beta

Minimax

Ejemplo Poda alfa-beta

Ejemplo minimax
MAX
MIN
MAX
MIN

Idea general

Propiedades poda alfa-beta

Anda mungkin juga menyukai