1945; Wiener, 1948; Shannon, 1950) Primer programa de ajedrez (Turing, 1951) Aprendizaje automtico para mejorar precisin de evaluaciones (Samuel, 1952-57) Poda para permitir bsquedas ms profundas (McCarthy, 1956)
Poda alfa-beta
Mejora en promedio un 30% los resultados del
algoritmo minimax, (depende de la distribucin de los nodos y la funcin objetivo) No se puede quitar el exponente del la complejidad de tiempo, pero se puede reducir a la mitad (puede conseguir la decisin minimax sin revisar cada nodo) Usando poda para evitar examinar partes del rbol que no aportan ms informacin
Elimina ramas que no pueden influenciar la decisin final
Poda alfa-beta
Considerar un nodo n en algn lugar del rbol, tal que un
jugador tiene la opcin de moverse a ese nodo. Si el jugador tiene una mejor opcin m al nivel del padre del nodo n o en cualquier punto arriba, entonces n nunca ser alcanzado en el juego. Cuando se tiene suficiente informacin de n (al examinar algunos de sus descendientes) se puede podar su rama. Siendo una bsqueda en profundidad primero, slo se deben considerar los nodos de una sola ruta en el rbol.
Poda alfa-beta Recibe su nombre de los dos parmetros que describen limites a los valores que son pasados hacia arriba en cualquier punto de la ruta:
Alfa: el valor de la mejor opcin encontrada hasta el momento
para cualquier opcin de la ruta para MAX (por ejemplo: el valor ms alto) Beta: el valor de la mejor opcin encontrada hasta el momento para cualquier opcin de la ruta MIN (por ejemplo: el valor ms pequeo)