1
Los árboles de decisión también se pueden dibujar con símbolos de diagramas
de flujo, que a algunas personas les parecen más fáciles de leer y comprender.
2
1. Comienza con la decisión principal. Dibuja un pequeño recuadro para
representar este punto, luego dibuja una línea desde el recuadro hacia la
derecha para cada posible solución o acción. Etiquétalas correctamente.
3
Desde cada nodo de decisión, dibuja soluciones posibles. Desde cada nodo de
probabilidad, dibuja líneas que representen los resultados posibles. Si deseas
analizar tus opciones de forma numérica, incluye la probabilidad de cada
resultado y el costo de cada acción.
4
Para calcular la utilidad esperada de una decisión, solo debes restar el costo de
esa decisión a los beneficios esperados. Los beneficios esperados son iguales al
valor total de todos los resultados que puedan derivar de esa decisión, y cada
valor se multiplica por la probabilidad de que ocurra. A continuación, te
mostraremos cómo nosotros calcularíamos estos valores para el ejemplo
descrito anteriormente:
5
Ventajas y desventajas
Los árboles de decisión siguen siendo populares por razones como las siguientes:
6
Árboles de decisión en minería de datos y aprendizaje automático
Cada dato adicional ayuda a que el modelo prediga de forma más precisa a qué
conjunto finito de valores pertenece el asunto en cuestión. Esa información se
puede usar posteriormente como una entrada en un modelo más grande de toma
de decisiones.
A veces la variable predicha será un número real, como un precio. Los árboles
de decisión con resultados posibles, infinitos y continuos se llaman "árboles de
regresión".
Para una mayor precisión, se suelen combinar múltiples árboles con métodos de
ensamblado:
7
Cada método debe determinar cuál es la mejor forma de dividir los datos en
cada nivel. Los métodos comunes para hacerlo incluyen la medición de la
impureza de Gini, la obtención de información y la reducción de variaciones.
El costo del uso del árbol para predecir los datos disminuye con cada punto
de datos adicional
Funciona para los datos numéricos o categóricos
Puede modelar problemas con múltiples resultados
Usa un modelo de caja blanca (lo que hace que los resultados sean fáciles
de explicar)
La fiabilidad de un árbol se puede cuantificar y poner a prueba
Tiende a ser preciso independientemente de si viola las suposiciones de
los datos de origen