Anda di halaman 1dari 2

1.

¿Cuáles fueron las acciones realizadas por el equipo de trabajo para cumplir el
primer paso de la metodología CRIS-DM?

 Tuvieron que permitirse varias reuniones entre las distintas gerencias en la cual
el equipo propone utilizar técnicas de Clustering para la detección de anomalías
con el fin de obtener un listado de clientes que presenten datos distintos a lo que
se conoce. También es importante conocer el proceso actual de detección de
anomalías y fraudes, para ver su eficiencia y que sirve de este para aplicar el
nuevo sistema.

2. ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para comprender
la naturaleza de los datos involucrados en el negocio?

 Para este caso fue necesario analizar el modelo de base de datos relacional del
sistema de información de la empresa, específicamente aquellas entidades que
tienen relación con el proceso de facturación. Esto con la finalidad de poder
conocer los consumos de los clientes y tener una base sólida para poder trasladar
la información.

3. Explique el proceso utilizado para acometer la preparación de los datos en la


organización.

 Para iniciar con el proceso, se diseñó un Almacén de Datos (AD) en el que se


alimente las bases de datos transaccionales a través de un proceso de extracción
de datos previamente establecidos o indicados. Los datos son almacenados en
una especie de carpeta o bodega la cual consiste en hechos y dimensiones
representados a través de un esquema de tipo estrella. La tabla de hechos
almacena los indicadores a verificar y las dimensiones representan los criterios de
análisis.

4. Mencione qué etapa le sigue a la preparación de los datos y de qué modo fue
realizada por el equipo de trabajo
 La etapa que continua a la preparación de los datos, es que los datos que fueron
encontrados son cargados en el Data Mart a través de un proceso ETL que haya
sido diseñado para ello. Para este caso de estudio fue utilizado el 4% de los datos
almacenados en el Data Mart, los que pertenecen a las facturaciones emitidas en
la localidad de Lautaro.

5. ¿Cuáles fueron los algoritmos utilizados?

 Los algoritmos utilizados para el presente caso son: K-means, COBWEB y EM.

6. ¿De qué forma se logró garantizar la fase de evaluación en el proyecto?

 La información que se obtuvo de los registros anómalos encontrados deben ser


analizados y verificados con la información histórica de casos de fraude que tiene
la empresa, con el fin de verificar que la información entregada por el software sea
la correcta.

7. Explique brevemente la fase de implementación del proyecto.

 Para el presente caso de estudio se verifica que la herramienta utilizada


Clementine es apropiada para la detección de fraudes dado que dispone de
algoritmos eficientes de Clusterización y detección de Anomalías. Para esto,
utilizando la metodología CRISP-DM para el diseño de modelos de MD. Se puede
concluir que el presente algoritmo, siendo un algoritmo que realiza Clustering
probabilístico, es más adecuado que el algoritmo k-medias y COBWEB, para
segmentar los datos del AD diseñado para la empresa Aguas Araucanía S.A., con
el fin de encontrar posibles casos de fraude.

Anda mungkin juga menyukai