Anda di halaman 1dari 16

Breno Albert Pino Hurtado

ALGUNOS ALGORITMOS
Algoritmos
Aplicaciones Practicas de los Algoritmos
Guia de Ejercicios

1. Association Rules
2. Clustering
3. Sequence Clustering
4. Decision Trees
5. Linear Regression
6. Time Series
7. Naive Bayes
8. Neural Network
9. Logistic Regression


Este se suele usar casi exclusivamente para
anlisis de carro de compra. Detecta
asociaciones comunes entre elementos (por
ejemplo, quien compra cerveza suele comprar
tambin man salado).
Usos tpicos:
Anlisis de carro de compra
Ofrecer recomendaciones al comprador: has comprado
cerveza, seguro que no quieres man salado?

Sirve sobre todo para buscar elementos afines
dentro de un conjunto.
Por ejemplo, podemos usarlo para saber que en una
poblacin hay hombres y mujeres jvenes
solteros, hombres mayores solteros, hombres y
mujeres mayores casados... pero no mujeres
mayores solteras.
Usos Tpicos:
Segmentar un mercado.
Validaciones (las entradas que no pertenecen a un cluster,
pueden ser elementos anmalos).

Es bastante especfico para detectar secuencias
tpicas dentro de un conjunto de eventos.
Por ejemplo... saber en qu orden hace click la gente
en las noticias de una web, puede ayudarnos a
ordenar los titulares de arriba a abajo y de derecha a
izquierda.
Usos tpicos:
Estudio de secuencias de eventos
Deteccin de algunas anomalas de comportamiento
(eventos que llegan fuera de secuencia)

Los rboles de decisin son clarsimamente una herramienta
potentsima de clasificacin... de hecho, son probablemente
el mejor algoritmo que podemos utilizar para clasificar.

Bsicamente, construyen un rbol del que se pueden extraer
reglas, del estilo: "Si eres hombre, tienes unos ingresos
superiores a 'X', y eres comprador de revistas de carros... la
probabilidad de que tengas carro es del 90%".

Usos Tpicos
Clasificacin en general
Validaciones. Podemos detectar elementos anmalos en funcin de si
encajan o no con las reglas surgidas del rbol Por ejemplo, "si tienes carro y
casa, menos de 20 aos probablemente mientas"
Predecir el valor de un atributo con precisin

Este algoritmo es especfico para predecir el
valor de una magnitud en funcin del tiempo.
Por ejemplo:
Anlisis burstiles... subir o bajar el petrleo
maana?
Prediccin de una magnitud analgica, en general.

Este algoritmo es el primero se suele utilizar para explorar datos.
Bsicamente, este algoritmo busca correlaciones entre atributos.

Cuando no tenemos muy claro qu atributo se puede predecir en
funcin de otros, una tcnica muy habitual es tratar de utilizar el
algoritmo de Naive Bayes tratando de predecir el valor de todos los
atributos en funcin de todos los atributos (un "todos contra todos").

Otra ventaja de este algoritmo es fcil de implementar... pero su
desventaja es que no es muy preciso.

Usos Tpicos:
Exploracin inicial de los datos
Tareas de clasificacin, en las que el rendimiento sea crtico.

Al igual que los rboles de decisin, este algoritmo
tambin resuelve problemas de clasificacin y regresin.
Puede ser adecuado para detectar patrones no lineales,
difcilmente descriptibles por medio de reglas.
Se usa como alternativa al algoritmo de arboles de
decisin: lo mejor es probar ambos sobre un mismo
problema y utilizar el que mayor acierto nos de en sus
predicciones.
Usos Tpicos:
Las mismas tareas que los rboles de decisin, cuando los
grupos en los que se divide la poblacin no son lineales.
Regresiones (es similar a la clasificacin, pero cuando se trata
de predecir una magnitud contina).

El departamento de marketing de Adventure Works desea aumentar
las ventas dirigiendo una campaa de correo directo a clientes
especficos.
Mediante el anlisis de los atributos de clientes conocidos, la
empresa espera determinar los patrones que posteriormente se
aplicarn a clientes potenciales.
La empresa pretende utilizar los patrones hallados para predecir qu
clientes potenciales tienen ms probabilidades de comprar un
producto.
Adems, el departamento de marketing desea encontrar las posibles
agrupaciones lgicas de clientes que se encuentran en la base de
datos, como, por ejemplo, aquellos que siguen pautas demogrficas
y de compra similares.
La base de datos de la empresa, Adventure Works DW, contiene una
lista de clientes antiguos y una lista de clientes nuevos potenciales.

Necesitamos
- Un conjunto de modelos de minera de datos que sugerir los clientes que
tienen una mayor probabilidad de serlo entre una lista de clientes
potenciales.
- Una agrupacin de clientes actuales.
bernardorobelo.blogspot.com Ver Video de Solucin en:
Como analista de ventas de Adventure Works, se le ha solicitado una previsin
de las ventas de modelos individuales de bicicletas para el prximo ao.

En concreto, debe obtener los picos en las ventas de bicicletas y determinar
qu regiones lideran las ventas y cules van por detrs.

Adems, debe determinar si las ventas de diferentes modelos varan en funcin
de la poca del ao.

Para hallar la informacin solicitada, en esta leccin examinar los datos
mensuales de la empresa y dividir las ventas en tres regiones: Europa,
Norteamrica y el Pacfico.

- En qu poca del ao se produce un pico en las ventas?

- Cmo interactan las ventas de los diferentes modelos de bicicleta a lo largo
del ao?

- Existe un patrn de ventas para las tres regiones?
bernardorobelo.blogspot.com Ver Video de Solucin en:
El departamento de marketing de Adventure Works desea mejorar
el sitio Web de la empresa para promover las ventas cruzadas.

Antes de actualizar el sitio, necesitan crear un modelo de minera de
datos que pueda predecir los productos cuya adquisicin podra
interesar a los clientes, basndose en otros productos que ya se
encuentran en los carros de compra en lnea de los clientes.

Estas predicciones tambin ayudarn al departamento de marketing
a agrupar en el sitio Web aquellos artculos que los clientes suelen
comprar juntos.

Se Solicita :
Obtener un modelo de minera de datos con el que podr predecir artculos
adicionales que pueden aparecer en una cesta de la compra o que un cliente podra
querer agregar a la cesta de la compra.

Contar con un completo modelo de minera de datos que muestra grupos de artculos
de transacciones histricas del cliente.
bernardorobelo.blogspot.com Ver Video de Solucin en:
El departamento de marketing de Adventure Works desea
saber cmo se mueven los clientes por el sitio Web de
Adventure Works.

La empresa cree que existe un patrn segn el cual los
clientes incluyen productos en las cestas de la compra.

El algoritmo de clsteres de secuencia de Microsoft permite
determinar las secuencias que los clientes siguen para
agregar artculos a las cestas.

Posteriormente, esta informacin se puede utilizar para
mejorar el flujo del sitio Web y propiciar que los clientes
adquieran productos adicionales.

Se Solicita:
Obtener un modelo de minera de datos que le permitir predecir
cul ser el siguiente artculo que los clientes incluirn en sus
cestas de la compra.
bernardorobelo.blogspot.com Ver Video de Solucin en:
Bernardo A. Robelo Jirn
bernardorobelo.blogspot.com

Anda mungkin juga menyukai