Anda di halaman 1dari 41

Resumen

Ejecutivo

Este tercer informe registra como CCJ Solutions desarrolla una solucin tecnolgica a
los requisitos de informacin de Mayday y en qu nivel de avance se encuentra.

Mayday! es una empresa del mercado de armado de muebles que cuenta con una
capacidad aproximada de 15.000 trabajos mensuales repartidos en todo Chile.
Actualmente la organizacin carece de informacin importante para la toma de
decisiones, como el porcentaje de reagendamiento de sus pedidos, trabajos dentro y
fuera de plazo, entre otros. Como respuesta a estos requerimientos, el proyecto de CCJ
Solutions propone un Data Mart, cuyos detalles tcnicos son descritos en el presente
informe y el reporte final.

El objetivo general del proyecto es desarrollar un Data Mart para el rea de
Operaciones de la empresa MayDay! con el propsito de facilitar la obtencin de
informacin y a travs de l, generar conocimiento. Especficamente el rea
mencionada obtendr los porcentajes de reagendamientos totales de pedidos y podr
obtener informacin de la concentracin de demanda en distintas comunas del pas
donde opera la empresa.

En este documento se describe la empresa consultora, el cliente y el proceso de
negocios que desemboca en la decisin de realizar el proyecto, los objetivos del
mismo, adems de los logros y beneficios esperados. Posteriormente se desarrolla el
modelo estrella y el DSA, indicando las tablas y el modelo a utilizar, adems de los
archivos de origen y la base de datos final con la que ha de continuar el trabajo.

El foco de este documento corresponde a la etapa de desarrollo del Data Mart llamada
ETL (Extraccin, Transformacin y Carga), donde se especifica el procedimiento
utilizado para obtener los datos (con la calidad adecuada), las transformaciones
necesarias que se aplicaron a las tablas adems de la carga de datos al modelo estrella
definido, todo lo anterior teniendo en cuanta los indicadores que han de ser obtenidos
de manera que los procesos efectuados soporten las consultas necesarias y el modelo
responda a los requerimientos planteados.

Finalmente, se presenta una carta Gantt en que se observan los hitos importantes que
revelan el nivel de progreso del proyecto, donde destacan:

Semana 15 26 de junio: presentacin de la interfaz de consulta. ltima etapa
de proyecto.

Con lo anterior, culmina el proyecto que se concretar con el Data Mart mencionado
para la empresa MayDay! por parte de CCJ Solutions.

ndice


ndice .................................................................................................................................................................. 1
Introduccin .................................................................................................................................................... 2
Descripcin de la empresa ......................................................................................................................... 3
Objetivo de la empresa ........................................................................................................................................... 4
mbito del Proyecto ................................................................................................................................................ 4

CCJ Solutions .................................................................................................................................................... 5


Misin ............................................................................................................................................................................ 5
Visin ............................................................................................................................................................................. 5
Pilares ............................................................................................................................................................................ 5

Modelo de Negocio ........................................................................................................................................ 6


Direcciones de Cambio ........................................................................................................................................... 7

Indicadores ....................................................................................................................................................... 8
Objetivos del proyecto ................................................................................................................................. 9
General .......................................................................................................................................................................... 9
Especficos ................................................................................................................................................................... 9

Logros y Beneficios Esperados ................................................................................................................ 9


Entregables del proyecto ......................................................................................................................... 10
Actividades del proyecto .......................................................................................................................... 10
Carta Gantt ...................................................................................................................................................... 11
Modelo Estrella ............................................................................................................................................. 12
Data Staging Area ........................................................................................................................................ 14
Calidad y tratamiento de datos ........................................................................................................................ 15

ETL ..................................................................................................................................................................... 17
Schema-Workbench ................................................................................................................................... 22
Jaspersoft ........................................................................................................................................................ 25
Aplicaciones ................................................................................................................................................... 29
Anlisis de Resultados Indicadores ..................................................................................................... 31
Conclusiones .................................................................................................................................................. 34
Anexos .............................................................................................................................................................. 35



1

Introduccin

Junto al desarrollo global de empresas, transacciones, productos y servicios, tambin
lo hace la bsqueda de herramientas que permita automatizar sus procesos. En esta
indagacin empresas de variados rubros han comenzado a utilizar los productos Data
Warehouse que corresponden a una coleccin de datos, que proporciona una visin
global de la organizacin Entre sus principales ventajas es que utiliza modelo de
datos orientado a la informacin, lo que hace que las consultas y reportes se efecten
ms rpidamente que en los sistemas transaccionales.

Un Data Mart corresponde a una versin reducida de un Data Warehouse, cuyo
propsito es aportar en un rea de la empresa, de manera de que los datos estn
disponibles para los diferentes requerimientos de forma ordenada y de rpido acceso,
cuyo propsito es aportar, tal como un Data Warehouse lo hace a nivel de toda la
organizacin, a que una gerencia especfica tome mejores decisiones.

En ese contexto se desarrolla el presente informe, para presentar a la organizacin
con la que se trabajar, que es Mayday. Se aade tambin la definicin de las
actividades a realizar con ellos durante el semestre, que corresponden a la
implementacin de un prototipo de Data Mart.

En esta entrega se especificar tambin el proceso de Extraccin, Transformacin y
Carga de los datos, trabajo efectuado de manera que los indicadores que la empresa
ha definido junto a la consultora puedan ser obtenidos. Lo anterior verificando
previamente la calidad de los datos y pertinencia de las estructura.

Finalmente se desarrolla el levantamiento del Cubo Olap y se presentan vistas de
como ste cumple los requerimientos de informacin solicitados, determinando de
manera experimental la poderosa herramienta que constituye el Data Mart para una
empresa como MayDay (y cualquier otra) que desee pasar desde los datos a la
informacin.

Descripcin de la empresa


Mayday! Servicios es una empresa de 7 aos de experiencia en el mercado de armado
de muebles que cuenta con una capacidad de aproximadamente 15.000 trabajos
mensuales repartidos en todo Chile.

La operacin de la empresa es respaldada por un sistema de coordinacin creado para
la logstica, distribucin y control de los servicio a medida. Actualmente estiman su
porcentaje de cumplimiento como el 96% de atenciones dentro de los plazos
establecidos.

A continuacin se presentan los servicios que MayDay! ofrece a sus clientes:

Armado de Muebles a clientes Particulares


Armado de Muebles de Exhibicin



El primero de ellos, consiste en el envo de un tcnico al domicilio del cliente final para
dejar instalado un mueble. Esto es monitoreado y cerrado con un llamado al cliente en
donde se le pregunta por la satisfaccin del servicio.

Lo que corresponde al armado de muebles de exhibicin consiste en generar visitas
peridicas o a solicitud de las tiendas para la instalacin de aquellos muebles que sean
importados o que tengan necesidad de armar para exhibir.

Lo anterior configura el servicio actual de la empresa, que presenta una cobertura a
nivel nacional, con ms de 200 tcnicos en todo Chile, los que son capacitados para la
tarea a desarrollar. En cuanto a plazos de ejecucin, varan de acuerdo al territorio en
el que se solicite el servicio: 48 horas dentro de la regin Metropolitana y 72 horas en
el resto del pas.



3



Objetivo de la empresa

Proveer el servicio de armado e instalacin de mueble a los grandes retailers del pas,
quienes ofrecen a sus clientes finales el servicio de armado como complemento a la
compra realizada. As mismo, apoyar tienda por tienda a sus clientes con el armado
de exhibiciones y reparacin de mermas.
mbito del Proyecto

El desarrollo del proyecto se enmarca dentro de la Gerencia Operacional. La idea es
proveer de un servicio que les reporte obtener informacin de manera rpida y
confiable y a travs de ella tomar decisiones que les permita mejorar su cobertura,
aumentar sus utilidades y cumplir sus objetivos a futuro, entre los que destaca
expandirse con nuevos servicios.

Enfocado en lo anterior, se desarrollar un Data Mart dirigido al rea operacional que
permita obtener informacin de manera automatizada.


Ilustracin 1: Organigrama MayDay!

CCJ Solutions


CCJ Solutions es fundada el da 18 de Marzo de 2014 con el fin de proveer servicios de
apoyo a la toma de decisiones en diversas empresas.

Est compuesta por Christian Lavn , Jaime Jurez y Carolina Vignolo Ziga quienes
conjugan su experiencia en el rea de Gestin de Operaciones y Tecnologas de
Informacin, orientados al proceso, de manera que los clientes puedan participar
activamente en la definicin de la solucin, adems de proveer un servicio integral
que conjugue el producto final y el soporte.

El rea de accin de la consultora est enmarcada en Business Intelligence, de forma
de entregar al cliente estrategias orientadas a la creacin de conocimiento a partir de
los datos existentes en su organizacin.

Misin

Proveer soluciones informticas para la administracin y gestin de conocimiento a
las organizaciones chilenas.

Visin

Posicionarse como actor relevante dentro de la Consultora de Business Intelligence,
dinmica, profesional y distinguida por su excelencia en el servicio.

Pilares

Valorar la importancia de los clientes y por ello estar enfocados en entender las
necesidades actuales y futuras de los mismos.
Comprender los requerimientos de cada uno y hacer nuestro mejor esfuerzo
para lograr exceder sus expectativas.

Modelo de Negocio


MayDay! Tiene como propsito a largo plazo la implementacin de herramientas
BMA o Actividades de Monitoreo en el Negocio (BMA, Business Activity
Monitoring), el cual incluye la revisin continua de KPI (Key Performance Indicators)
en todas sus lneas funcionales: Recursos Humanos, rea Comercial, rea Operativa y
rea de Procesos. En este sentido MayDay! puede clasificarse como una empresa que
aspira a crecer a un nivel de madurez superior, hablando en trminos de Negocios
Orientados a Procesos. Es en este aspecto que CCJ Solutions brinda un primer
acercamiento a este objetivo, al presentar un diseo de Data Mart para el rea
Operativa de MayDay!

Actualmente la empresa percibe un crecimiento en distintos elementos: demanda de
servicios, cartera de clientes y personal tcnico. Con lo anterior la cantidad de datos
almacenada en los servidores ha variado al alza y con ello la necesidad de automatizar
la obtencin de informacin.

MayDay! pretende lograr el anlisis de su base de datos para entender la situacin
actual y proyectar la toma de decisiones a futuro. Lo anterior debido a que se ha dado
importancia dentro de su estrategia a las prcticas crticas orientadas al anlisis de
sus datos, a travs de la obtencin de indicadores.

Se presenta en la tabla 2 una breve descripcin de los niveles de madurez de una
empresa segn Rok y Peter (2012).

Nivel de
Descripcin
MayDay!
madurez
1. Ad Hoc
Los procesos no estn estructurados ni bien definidos, no se
realizan mediciones dentro de los procesos y los trabajos se
realizan acorde a funciones tradicionales.
2.Defined
Los procesos estn definidos y documentados, existen
reuniones estratgicas entre las distintas reas funcionales
para coordinar.
3.Linked
Se implementa la estrategia en cada proceso basado en
anlisis y resultados, enfocndose en responsabilidades
dentro de cada proceso. End to End Process.
4. Integrated La estructura organizacional y trabajos estn subordinados
a los procesos, adems mtricas y rendimientos son
altamente usados en la organizacin.
Ilustracin 2: Niveles de Madurez para un Negocio orientado a Procesos segn Rok Y Peter


Dentro de los niveles mencionados, se evala que MayDay se encuentra en una fase de
transicin entre un nivel 1 (Ad Hoc.) y 2 (Defined), ms an, se perciben cambios y
6



positivismo en torno a prcticas crticas para la implementacin y el avance a un nivel
mayor de madurez en torno a la orientacin a procesos. De lo anterior, se proyecta
que con la realizacin del proyecto en el rea de operaciones, MayDay! podra
desarrollarse dentro de una fase de transicin entre 3 (Linked) y 4 (Integrated).
Direcciones de Cambio

Realizando un anlisis en cuanto a las direcciones de cambio de la empresa, se
diagnostica que son 4 en las que MayDay! est dispuesto crecer implementando
medidas y que estn adems involucradas con el desarrollo del proyecto de Data Mart.

Las cuatro direcciones son: Utilizacin de Tecnologas de Informacin para poder
desarrollar mejores Prcticas de trabajo y de esta manera generar una mejor
Coordinacin con las distintas entidades involucradas y Anticipacin ante cualquier
eventualidad en la demanda del servicio. Para un mejor entendimiento, se detallan a
continuacin las direcciones de cambio encontradas:

Utilizacin de Tecnologas de Informacin:
El desarrollo de un Data Mart en la gerencia operacional crear un primer paso en la
transformacin de datos a informacin. Adems, se prev que finalizado este proyecto
se buscar la implementacin de la arquitectura hacia las dems gerencias, finalizando
con un Data Warehouse que enlace cada una de las lneas funcionales.

Prcticas de Trabajo:
El desarrollo del Data Mart permitir en MayDay la aplicacin de nuevas prcticas de
trabajo, dentro de las cuales se destaca el anlisis de indicadores y, si lo desean, una
posible implementacin a futuro de Sistemas de Soporte a la Decisin, elaboracin de
Sistemas de Alerta o tcnicas de minera de datos, los que sern prcticas de trabajo
que potencialmente brindan un gran valor a la empresa. Aunque cabe mencionar que
estas ltimas escapan del trabajo presente, es importante recalcar la importancia de
este proyecto para una iniciacin en dichas herramientas.

Coordinacin:
La coordinacin en el manejo de informacin y la toma de decisiones ser uno de los
aspectos en los que aportar la implementacin del proyecto iniciando en la gerencia
de operaciones. Adems, la toma de decisiones basada en indicadores sustentar el
contacto y la retroalimentacin entre la gerencia y tcnicos para el continuo
mejoramiento.

Anticipacin:
La toma de medidas para garantizar un determinado nivel de servicio es un ejemplo
de la aplicacin que puede realizarse. As tambin la implementacin de medidas ante
la saturacin de solicitudes y capacidades tcnicas o incluso la proyeccin ante
posibles peaks en las demanda. Todos los anteriores son elementos que forman
parte de las ventajas del proyecto y que aportan en esta direccin de cambio.
7




Es importante mencionar que se ha llevado a cabo una serie de reuniones junto con
MayDay!, en las cuales se han definiendo los indicadores de gestin relativas a la
informacin que tienen disponible. Atendiendo a lo anterior pero de manera
preliminar, las medidas que se desea obtener son descritas a continuacin.

Indicadores



Reprogramaciones

a) Porcentaje de reprogramaciones

Total no Atendidos a Tiempo
100
Total de Ordenes Atendidas

b) Total de reprogramaciones

Total no Atendidos a Tiempo



Servicios

a) Total de Servicios Realizados


Total de rdenes Atendidas

b) Total de rdenes Solicitadas.

Total rdenes Atendidas + Total rdenes no Atendidas




Tcnicos

a) Eficiencia de los tcnicos

Total rdenes Atendidas por Tcnico

100
Total rdenes Atendidas

Objetivos del proyecto


General

Desarrollar un Data Mart para el rea de Operaciones de la empresa MayDay! para
facilitar la obtencin de informacin y a travs de ello generar conocimiento. Con esto,
aportar en la toma de decisiones y el desarrollo de sus metas organizacionales.

Especficos

Implementar tecnologas de informacin y herramientas de anlisis de datos


dentro de la gerencia de operaciones.
Proporcionar indicadores y verificar su pertinencia a lo largo del desarrollo del
proyecto.
Interpretar indicadores y entregar recomendaciones para buenas prcticas en
la gerencia de operaciones.

Logros y Beneficios Esperados


Al terminar este proyecto el cliente tendr los siguientes beneficios:



Data Mart gratuito con el que MayDay! pueda verificar los indicadores
propuestos por ellos mismos, que permita visualizar distintos ratios de
rendimiento. As la empresa podr administrar los distintos factores
operacionales y saber con precisin cuanto cambian sus resultados, para luego
obtener una mayor rentabilidad en las operaciones.
Ahorro en tiempo ocupado en hacer reportes, as su personal podr enfocarse
en tareas que s entreguen valor agregado.
Finalizado el proyecto con MayDay!, sern ellos quienes evaluarn su
satisfaccin con la solucin y podrn decidir si desean implementar
extensiones del Data Mart en las dems reas de la empresa. Lo anterior, dado
las conversaciones y el inters manifestado en la solucin.

Entregables del proyecto



Ser entregado a la empresa lo siguiente:

Prototipo Data Mart.
Informe Final orientado a cmo funciona la herramienta.
Por otra parte al cuerpo docente del curso Data Warehouse se le har entrega de:

Informe final que detalle los pasos y resultados del proyecto.
Cubo OLAP, que soporte las necesidades de informacin mencionados
anteriormente.

Actividades del proyecto



Observando los objetivos planteados, y para crear coherencia en la metodologa
planteada, se aprecia que es necesario establecer una serie hitos o actividades que
estn alineados con la concrecin del proyecto, que son detalladas a continuacin.

1.Definicin del Proyecto



2.Presentacin N1

3.Modelo de Datos

4.Presentacin de modelo de Datos

5.Proceso ETL

6.Presentacin ETL

7. Consultas en el Cubo

8. Presentacin Cubo



Las primeras 5 actividades estn relacionadas con el objetivo de Implementar
tecnologas de informacin y herramientas de anlisis de datos dentro de la gerencia de
operaciones. Ese objetivo se lograr al desarrollar dichas actividades, que son
secuenciales y que estn plasmadas en la Carta Gantt. Ellas estn relacionadas
directamente con la fase inicial y actual del proyecto. Con ellas, se determinan
requerimientos, se establecen plazos, lmites, acuerdos, metodologas y entregables,
10



entre otros. Adems, se entregan los primeros avances, siempre sujetos a
modificacin, de la primera iteracin del trabajo. Tambin se determina la forma en
que se ordenarn los datos para obtener los resultados esperados.

Las Actividades 6 y 7 estn relacionadas con los ltimos dos objetivos especficos:
Proporcionar indicadores y verificar su pertinencia a lo largo del desarrollo del
proyecto. e Interpretar indicadores y entregar recomendaciones para buenas prcticas
en la gerencia de operaciones y corresponden al trabajo que se efectuar desde ahora
en adelante, como se detalla a continuacin en la planificacin.

Carta Gantt


A continuacin se presenta la Carta Gantt del presente trabajo (ver ilustracin 3). La
Carta Gantt es una herramienta de tipo grfica, que tiene por objetivo sealar el
tiempo destinado a tardar en las actividades particulares del proyecto de realizacin
de Data Mart en la empresa MayDay y dar sealar de alerta en plazos que salgan de lo
planificado.

Ilustracin 3 Carta Gantt


De acuerdo a la tabla Gantt, el proceso de trabajo se encuentra con un 100% de
avance, donde el proceso de ETL, realizacin del Cubo y obtencin de indicadores a
travs de consultas MDX est completo.

En este momento el equipo se encuentra esperando confirmacin para realizar
presentacin final a la empresa, debido a que la exposicin al curso ya fue efectuada
con xito.

11

Modelo Estrella

Se presenta a continuacin el modelo que se propone utilizar, resultando ser un
modelo estrella por la estructura presentada en la figura a continuacin:

Ilustracin 4: Estructura Orientada a la informacin, tabla de hechos y dimensiones


En el modelo anterior se observan 6 tablas, que son:

1.- Servicios
2.- Dimensin Clientes
3.- Dimensin Ubicacin
4.- Dimensin Tcnico
5.- Dimensin Tiempo
6.- Dimensin Estado

De las 6 tablas mencionadas anteriormente la tabla Servicios, es la tabla de hechos,
la cual se encargar de recopilar la informacin relevante (a travs de la recuperacin
de las llaves subrogantes) para el clculo de los indicadores definidos. Las tablas
12



restantes son las tablas de dimensiones, por medio de las cuales se podr organizar la
informacin.

En cuanto a la tabla Servicios, se puede apreciar una llave primaria, que estar
definida para cada registro de dicha tabla. Adems se presentan las 5 llaves
secundarias haciendo referencia a tcnico, tiempo, ubicacin, clientes y estado.

A continuacin, en la misma tabla, se presentan 4 medidas que servirn para recopilar
la informacin en torno a los indicadores antes explicados. Cabe mencionar que
debido a que parte de los indicadores son tasas (porcentaje de reprogramaciones y
eficiencia de los tcnicos) es importante calcular con anterioridad las medidas que
forman el numerador y denominador.

Dentro de las tablas de dimensin, se encuentra Dimensin_Clientes la cual adems de
su llave subrogante, presenta el atributo Nombre_Cliente que hace referencia al
nombre de cliente (Falabella, Paris).

La tabla Dimensin_Ubicacin presenta adems de la llave subrogante, 2 atributos
haciendo referencia a la regin y la comuna respectivamente, que describen el lugar
en que se realiza el trabajo por parte de MayDay!.

La tabla Dimensin_Tcnico adems de la correspondiente llave subrogante, presenta
el atributo cdigo, que permitir identificar al colaborador que efectu el trabajo.

Por su parte la tabla Dimensin_Tiempo, adems de la llave subrogante presenta los
atributos Semana, mes y ao.

Finalmente la tabla Dimensin_Estado, adems de la llave subrogante presenta los
atributos A_tiempo (realizados correctamente), No_Realizadas_Cliente (debido a que
el cliente no se encuentra en el lugar), No_Realizadas_Pendiente (por algn problema
de la empresa), No_Atendidas_A_Tiempo y No_Realizada_En_Vano (tipificado por
MayDay en casos diferentes a los anteriores).

Con lo anterior queda descrito el Modelo Estrella que se ha determinado en conjunto
con el equipo de tutores y que luego de las correcciones y sugerencias, ser la manera
de proveer los indicadores de inters para la empresa dada la informacin con que se
cuenta.

13

Data Staging Area


Los registros que MayDay! entreg al equipo de trabajo son parte de uno de los
reportes que generan peridicamente y corresponde a una muestra de los datos con
que la empresa cuenta y es la nica informacin que MayDay proporcionar para el
desarrollo del trabajo actual.

El detalle de esta base de datos se encuentra en la siguiente ilustracin.

Ilustracin 5 Base de datos proporcionada por MayDay!


En esta base se encuentran variadas columnas que para el desarrollo del Data Mart no
son necesarios, ya que no cumplen ningn propsito relacionado con el clculo de
reagendamientos o trabajos por comuna. Entre los datos que no son necesarios (los
cuales estn destacados en la ilustracin) se encuentran:

Informacin
Motivo
Tipo de agendamiento, Marca, Motivo, Estas dimensiones se encuentran vacas.
Status Venta, Num Actividad, Nmero, Ol Adems se desconoce una descripcin
Nmero, Proyecto y Cd. Tienda.
ms detallada de qu se trata cada una.
Motivo Vano, Servicio, Valor, Costo por Aunque presentan algunos datos, no hay
Traslado, Valor Total.
rellenado completo de los campos.
Sumado a esto, no ayudan a los clculos
de los ratios, ni la identificacin entre un
registro y un trabajo.

De los datos obtenidos, se aprecia que la principal dificultad el proyecto en esta etapa,
fue la verificacin de la calidad de datos, debiendo efectuar un importante trabajo de
observacin y estandarizacin para avanzar posteriormente en el proceso de ETL.

Como es solicitado, a continuacin se desglosa el procedimiento utilizado para el
traspaso de datos a la DSA:
14


1) Filtrar desde la base de datos entregada por la empresa en Excel, los datos que
no serviran para el desarrollo del presente trabajo (Explicado ms arriba).
2) Guardar el archivo con la extensin *.ods (Formato de Archivos de
documentos de OpenDocuments).
3) Abrir el servidor Xampp.
4) Ir a phpMyAdmin y presionar la pestaa Importar.
5) Buscar el archivo el archivo *.ods recientemente creado y seleccionarlo.
6) Marcar la pestaa que indica que la primera fila contiene encabezado.
7) Presionar la pestaa continuar.
8) Cargar.
9) Revisar el Archivo.


Luego de este acercamiento a la Base de Datos, se prev que puede ser necesaria la
utilizacin de consultas en SQL e incluso la utilizacin de programacin en R
(software utilizado para el manejo de datos y anlisis), para aprovechar de mejor
manera el reporte disponible y facilitar las consultas, orden y manejo de datos.

Calidad y tratamiento de datos

Estudiando la naturaleza de la base de datos y que el requerimiento del cliente es
conocer principalmente, a partir de su registro, cul es su nivel de reagendamiento, se
destacaron como las columnas ms importantes: Boleta y Solicitud. Se descubri
adems, que los registros asociados a un pack de productos pertenecientes a una
misma compra comparten el mismo nmero de boleta. Debido a lo anterior, esta
columna se transforma en el primer filtro para observar el nmero de veces que
aparece la misma compra en la base de datos. Una vez encontrado lo anterior, se
comparan las columnas Producto, Fecha de Contacto y Fecha de Armado con lo que se
puede indicar si el pedido fue o no agendado una segunda vez.

Respecto a los registros de la base de datos, la calidad que esta presenta no es
suficiente y requiri inminente limpieza. Lo anterior se explica por varios motivos de
inconsistencia de la data. El primero es que existen muchos valores faltantes.
Probablemente la razn por la que estos no se encuentran es por errores humanos, o
bien los datos no existen y no hay una regla de procedimiento para esos casos. Otro
ejemplo es que muchos registros eran incongruentes al presentar boletas con
nmeros y letras, o doble boleta por registro. Estos datos fueron tratados dejando slo
registros numricos en caso de ser posible o eliminado el registro. Otra inconsistencia
similar es que dentro de la columna ms importante que es Boleta, se encontraron
alrededor del 20% de los registros con nmero del tipo 777777777 (ver Ilustracin
6).

15



En la mayor parte de los registros de este tipo, en que los valores faltantes o
inconsistentes fueran una variable crtica, se determin eliminar el registro de la base
final con que se trabajara.

Ilustracin 6: Ejemplo de boletas inconsistentes.


Un punto notable es la ausencia del registro del tcnico en la base de datos entregada.
Lo anterior debido a que esta informacin se relaciona directamente con los
requerimientos del cliente. Hasta ahora, no se encuentra ningn dato relevante que
relacione la asignacin de cada tcnico a cada trabajo. Lo anterior es considerado un
punto crtico, debido a que no le permite a MayDay! conocer, por ejemplo, cuales
tcnicos presentan mayor porcentaje de reagendamiento.

Debido a lo explicado anteriormente y como recomendacin del equipo de tutores, se
crean cdigos que representan a los tcnicos y son asignados de manera aleatoria a
cada registro, con el fin de proporcionar luego a MayDay! un acercamiento al tipo de
resultado posible en caso de que el detalle hubiera existido y representa una manera
prctica de entregar al cliente sugerencias para mejorar su estado actual y cumple
adems con los fines pedaggicos del curso.

16

ETL

Se presenta el siguiente flujo de procesos en el cual se ha contemplado desde la etapa
de Toma de requerimientos y el Data Staging Area (DSA) finalizando con el ETL.

Ilustracin 7: Diagrama de flujo explicativo proceso ETL

Se puede observar que existe una serie de reuniones con la contraparte para recoger
las inquietudes de los directivos, gerentes y encargados de la empresa, respecto a las
cantidades de las que se desea obtener informacin, qu indicadores y cmo
17



definirlos, entre otros. Esto da lugar a la entrega de los archivos y bases de datos por
parte de la empresa, que deben ser filtrados y posteriormente analizar la calidad de
los datos. Paralelamente se da inicio a la creacin del modelo estrella y al pre-
procesamiento de los datos, finalizando con dos archivos con extensin .sql (Modelo
Estrella y DSA) los que servirn para la siguiente etapa.

Luego en un nivel ms general del flujo de proceso, se observa que se da inicio al


llenado de dimensiones, generando un enlace con la base de datos pre-procesada y
estableciendo la estructura de los atributos que la componen (int, varchar, etc).
Efectuando lo anterior para todas las dimensiones, se procede al cargado de la fact
table, para posteriormente generar el archivo .sql que corresponde al modelo estrella
que se utilizar para la siguiente fase.

Respecto al detalle y como se ha mencionado, para la Extraccin Transformacin y
Carga se decidi realizar un pre- procesamiento de los datos. Esto con el fin de hacer
el proceso de carga de una manera ms directa. En un inicio se program un cdigo en
R, por la ventaja que representa realizar ciclos for y condicionales if de manera
ms estructurada (cabe mencionar que si las transformaciones para el clculo de los
indicadores fueran muy complejas, el uso de lenguajes como este puede dar una
solucin, y representa un mtodo muy usado en investigaciones y manejo de datos).
Sin embargo para efectos de este trabajo se resolvi efectuar las transformaciones en
Excel, ya que estas no resultaron muy complejas y el trade off que la programacin en
R proporcionaba no era totalmente beneficioso. A continuacin se especifica una
breve explicacin de las transformaciones realizadas a los datos.

Al estar ordenados los datos por la columna Boleta y en orden en el tiempo, es fcil
generar un indicador 1 0 si sta es pendiente o no. Cabe mencionar que la ltima
observacin de la boleta, deja un estado observado al final del periodo, sin embargo
para efectos de contabilizar el nmero de reprogramaciones tambin es necesario
contabilizar los estados en los que cada boleta ha estado a lo largo de su historial. Las
transformaciones efectuadas fueron las siguientes:

Ordenes Pendientes:

=SI(Y(Estado="Pendiente");1;0)

Puede verse en la Ilustracin 8, que para el cliente ABCDIN se realizaron 2 trabajos (a
la misma tienda) por esa razn el cdigo 0 de la boleta es el mismo. (Pueden realizarse
muchos trabajos y cobrarse en la misma boleta).

Observar el caso que el estado es: Realizada OK. En ese sentido la transformacin se
interpreta de la siguiente manera: Si dentro de la boleta existe el estado Realizado
Ok se colocar un 0 en la columna Pendiente, si no, se pondr un 1. Como ejemplo, se
observa que para la misma boleta aparece un 0 en la columna Pendiente, ya que en
Estado figura Realizada OK.
18



Clientes
ABCDIN
ABCDIN
CIC
CIC
CIC
CIC
CIC
CIC
CIC

Boleta

DeadLine
0
0
43
129
224
320
342
352
434

11
7
3
1
2
2
5
1
2

Estado
Pendiente
Realizada<OK
0
Realizada<OK
0
Pendiente
1
Realizada<OK
0
Realizada<OK
0
Realizada<OK
0
Realizada<OK
0
Realizada<OK
0
Pendiente
1

Ilustracin 8: Transformacin 1

En(Vano
0
0
0
0
0
0
0
0
0

Cliente(Ausente
0
0
0
0
0
0
0
0
0

Realizadas(OK
1
1
0
1
1
1
1
1
0

No(atendidas(a(tiempo
1
1
0
0
0
0
1
0
0


De igual manera se realizaron transformaciones para colocar atributo a las boletas
que se consideran Realizadas OK, En Vano, Cliente Ausente, y Realizadas Ok
pero despus del plazo estipulado por MayDay (Dead line > 3 das). Para esas
transformaciones se realiz el siguiente cdigo respectivamente:

Ordenes Realizadas OK:
=SI(Y(Estado="Realizadas OK");1;0)
______________________________________________________________________
En Vano:
=SI(YEstado="En Vano");1;0)
______________________________________________________________________
Cliente Ausente:
=SI(Y(Estado="Cliente Ausente");1;0)
______________________________________________________________________
Realizadas no a tiempo:
Para este caso se aprovech la estructura en tipo fecha y se rest la fecha realizada de
la fecha en la que se solicit el trabajo, obteniendo la columna DeadLine. sta se utiliz
para comparar con el tiempo estimado por MayDay para realizar trabajos y
catalogarlos como realizados a tiempo.
=SI(Estado="Realizadas Ok";DeadLine>3);1;0)


Una vez realizadas las transformaciones que se consideran necesarias, se procedi a
utilizar la herramienta brindada en el curso, Jaspersoft ETL en la cual se realiz el
cargado de las dimensiones y de la Fact Table. A continuacin se presenta el proceso:

Puede observarse en la Ilustracin 9, que a travs de las herramientas tmap y
taggregate se logra cargar el modelo estrella, en particular la dimensin tiempo para
esta imagen.

19

Ilustracin 9: Carga dimensin tiempo


De lo anterior se aprecia que el modelo estrella est siendo llenado, y como
comprobacin se revisa en phpMyAdmin la dimensin tiempo, que puede visualizarse
en Anexo Ilustracin 1 en la que se aprecia que los atributos mes, ao y semana se
encuentran cargados.

Adems puede observarse que dentro de tmap, no se realiza ninguna transformacin
ya que estas se han realizado previamente en Excel con la funciones para archivos tipo
fecha.

Ilustracin 10: Proceso de Eleccin y transformacin para la tabla tiempo.


A continuacin, se realiza el cargado de las dems tablas, completando as el llenado
de las 5 dimensiones. (Ver Anexo Ilustracin 2: Carga dimensiones tcnico, clientes,
ubicacin, tiempo y estado)

Finalmente se procede con el llenado de la Fact Table, que puede ser realizado debido
a que se dispone de las dimensiones y el DSA de los que se alimenta la tabla.
20

Ilustracin 11: Carga Fact Table


En Anexo Ilustracin 3 puede observarse el tmap para el llenado de la fact table, en
el cual se realiz el enlace de cada campo dentro de las dimensiones y del DSA,
Generando as el llenado del modelo estrella.

Luego se procedi a obtener el archivo SQL directamente desde phpMyAdmin el cual
se muestra una parte a continuacin:

Ilustracin 12: Cdigo SQL Carga dimensiones.

Con lo anterior queda descrito el proceso ETL para la empresa MayDay de acuerdo a
la solicitud de la empresa, el modelo estrella, los indicadores solicitados y las
recomendaciones del equipo docente.

21

Schema-Workbench

Una vez realizado el ETL y teniendo el modelo estrella completo, se puede proceder a
utilizar tal modelo para la formacin del cubo OLAP. Para esto se utiliza la
herramienta Schema-Workbench con el que se van formando las distintas
dimensiones y dentro de ellas las jerarquas, as como los niveles para aquellas
jerarquas que as lo requieran.

Como primer paso ejemplificado en la Ilustracin 13, se procede a la creacin del cubo
llamado CCJCubo, en el que se ve que la tabla llamada Fact es la que contiene la
informacin debidamente procesada luego del ETL. Adems se observa que se han
creado las dimensiones Cliente, Estados, Tcnico, Tiempo, Lugar. De las anteriores,
slo Estados tiene distintas jerarquas y las dems dimensiones contienen 1 nica
jerarqua.

Ilustracin 13: Schema-Workbench1


En la Figura 14 se aprecia el detalle dentro de las dimensiones Cliente y Estados. Se
puede ver que dentro de la dimensin Cliente slo se encuentra Nombre, pudindose
agregar para un trabajo futuro un nivel ms, por ejemplo Tienda. Por su parte en la
dimensin Estados, existen 5 jerarquas denominadas EstadosH1, EstadosH2,
EstadosH3, EstadosH4 y EstadosH5, jerarquas necesarias que contienen el estado de
las distintas rdenes en MayDay. As una orden puede ser: realizada a tiempo,
realizada pero no atendida a tiempo, no realizada cuya justificacin es en vano (cdigo
entendido por la empresa), no realizada (por que el cliente se encuentre ausente) y no
realizada ya que ha quedado pendiente (por razones del tcnico). Por esto las
jerarquas son necesarias, ya que no pueden ser catalogadas como niveles. As al
momento de realizar la consulta MDX se utilizar la categora respectiva como se ver
ms adelante.
22

Ilustracin 14: Detalle dimensin Cliente y dimensin Estados


En Anexos Ilustracin 4 se aprecia el detalle dentro de las dimensiones Tcnico,
Tiempo y Lugar. Dentro de Tcnico se encuentra la jerarqua Cdigo y se ve que hace
referencia a la tabla Tcnico de quien se alimentar. En la Dimensin Tiempo adems
de existir jerarqua, se puede observar la creacin de niveles, en este caso Ao y Mes.
De igual manera en la dimensin Lugar, la cual tiene dos niveles, Regin y Comuna.

Finalmente se observa la mtrica creada, la cual se catalog Ordenes, bajo la
operacin Count, ya que interesa contar las rdenes que se encuentren bajo las
distintas dimensiones, en particular bajo los distintos estados.

Dentro de Schema -Workbench es posible realizar consultas MDX, con el objetivo de
verificar que la estructura del cubo soporta lo que debe realizar. Como ejemplo, en la
Figura 15 se observa el resultado de la consulta siguiente:
SELECT{[Measures].[Ordenes]} ON COLUMNS
{[Cliente].Children} ON ROWS
FROM CCJCubo
Se observa como Children, permite visualizar el contenido de la dimensin.

Puede comprobarse en la base de datos original que las cantidades son las acertadas.

23

Ilustracin 15: Resultado Consulta MDX 1.


Puede verse en la Figura 16 la consulta y su resultado. En este caso, se busc
visualizar el nmero de rdenes del cliente ABCDIN de la Regin Metropolitana
(primer nivel).

Ilustracin 16: Consulta MDX 2.

En Anexo Ilustracin 5 se observa que la consulta se realiza a un nivel ms profundo


(Drill-through). En este caso, se solicita el nmero de rdenes que pertenecen al
cliente ABCDIN que sean de la Regin Metropolitana pero dentro de la zona
Macul, cuyo resultado es 0.

En Anexo Ilustraciones 6 y 7 puede observarse consultas que servirn de referencia
para comentar el anlisis del cubo, sus funcionabilidades, ventajas, mejoras etc.
24

Jaspersoft


Una vez realizada la conexin en Jaspersoft y habiendo indicado el archivo .xml a
utilizar, se pueden realizar las vistas para las consultas MDX. Puede verse en la figura
siguiente que la configuracin ha sido aceptada correctamente:

Ilustracin 17: Conexin dentro de Jaspersoft.


A continuacin se exponen las consultas efectuadas en Jaspersoftque tienen por
objetivo determinar los indicadores desarrollados anteriormente

1) rdenes por Tiempo(Ao>Mes) y por Cliente(Nombre)

SELECT {[Tiempo].Children} ON COLUMNS
{[Cliente.ClienteH1]} ON ROWS
FROM CCJCubo
*Reporte Jaspersof Anexo 0

Con la consulta anterior puede visualizarse por medio de Jaspersoft las Ilustraciones
18 y 19.





25

Ilustracin 18: Tabla de resultado de Todas las rdenes, dimensin Tiempo y Cliente.

Ilustracin 19: Grfico Total de rdenes MayDay.

Pueden modificarse los grficos agregando ttulos y distintas formas de visualizar los
datos. En Anexos Ilustracin 9 pude apreciarse una vista de la Ilustracin 19, pero
26



como un grfico de lneas. Ello muestra las potencialidades del programa para el
mejor entendimiento de sus usuarios.

Para continuar, se presentan una serie de consultas requeridas para el anlisis final.
Los resultados y sus visualizaciones se exportaron a Excel desde Jaspersoft y cada
archivo se anexa al trabajo en la carpeta reportes Jaspersoft Anexos.

2) rdenes Realizadas A Tiempo:

SELECT {[Tiempo].Children } ON COLUMNS,
{ [Cliente.ClienteH1] } ON ROWS
FROM CCJCubo
WHERE([Estados.EstadoH1].[1], [Estados.EstadoH2].[0])
*Reporte Jaspersoft Anexo 1.

3) rdenes No realizadas a tiempo:

SELECT {[Tiempo].Children } ON COLUMNS,
{ [Cliente.ClienteH1] } ON ROWS
FROMC CJCubo
WHERE([Estados.EstadoH2].[1])
*Reporte Jaspersoft Anexo 2.

4) rdenes que no fueron realizadas con justificacin En Vano.

SELECT {[Tiempo].Children } ON COLUMNS,
{ [Cliente.ClienteH1] } ON ROWS
FROM CCJCubo
WHERE([Estados.EstadoH3].[1])
*Reporte Jaspersoft Anexo 3.

5) rdenes que no fueron realizadas Debido al Cliente Ausente.

SELECT {[Tiempo].Children } ON COLUMNS,
{ [Cliente.ClienteH1] } ON ROWS
FROM CCJCubo
WHERE([Estados.EstadoH4].[1])
*Reporte Jaspersoft Anexo 4.

6) rdenes Pendientes.

SELECT {[Tiempo].Children } ON COLUMNS,
27



{ [Cliente.ClienteH1] } ON ROWS
FROM CCJCubo
WHERE([Estados.EstadoH5].[1])
*Reporte Jaspersoft Anexo 5.


Por Tcnico

7) rdenes No Realizadas A Tiempo por Tcnico.

SELECT {[Tecnico].Children } ON COLUMNS,
{ [Cliente.ClienteH1] } ON ROWS
FROM CCJCubo
WHERE([Estados.EstadoH1].[1], [Estados.EstadoH2].[0])
*Reporte Jaspersoft Anexo 6.

8) rdenes Atendidas por Tcnico.

SELECT {[Tecnico].Children } ON COLUMNS,{ [Cliente.ClienteH1] } ON ROWS
FROM CCJCubo
*Reporte Jaspersoft Anexo 7.

28

Aplicaciones


Luego de la realizacin del Cubo, el equipo ha podido observar que corresponde
efectivamente a una til herramienta para las empresas. Esto, debido a que pueden
realizarse adems de las consultas efectuadas y la obtencin de indicadores definidos,
herramientas de anlisis ms poderosas que podrn ser de inters a MayDay! como
predicciones a travs de series de tiempo y pronsticos.

Una aplicacin de lo anterior corresponde por ejemplo a adelantarse en las rdenes
que un cliente pudiera hacer en base a la historia, predecir el rendimiento de un
tcnico u observar las tiendas a las que se est descuidando.

Adems, pueden efectuarse anlisis de marketing, para, por ejemplo, realizar un
ranking de importancia de los clientes, de manera de determinar a quienes conviene
ofrecer descuento en polticas de fidelizacin, o a quienes tratar de mejorar el servicio
para que incrementen las rdenes, basado en la informacin que pueden descubrir a
travs de los datos con los que cuentan.

Futuros Usos

Cmo punto adicional si fuera de inters calcular mtricas que involucren cuociente,
pueden utilizarse la opcin CM+ (Calculated Measure) de Schema-Workbench y
definir la frmula utilizando las agregaciones realizadas en otras mtricas. Por dar un
ejemplo, si a MayDay le interesara encontrar el porcentaje de las ganancias del total
de ingresos en venta, esto aplicado a cada orden, se puede generar la mtrica ventas
con agregacin suma y la mtrica costos con agregacin suma. Luego se puede definir
una CM+ como:

Ventas Costos
100
Ventas

y fcilmente puede visualizarse por las distintas dimensiones, etc.

En la Ilustracin 20 puede verse el resultado de una consulta MDX en la cual se utiliz
primero la mtrica Ordenes, y en Ilustracin 21 puede observarse el resultado en
donde se utiliz la mtrica DosVeces la cual se defini como Ordenes*2, visualizando
el resultado por los Clientes. Esto a manera de ejemplificar que de manera sencilla
pueden crearse otras mtricas que requieran la interaccin de agregaciones de las ya
creadas.





29

Ilustracin 20: Futuros Usos 1

Ilustracin 21: Futuros Usos 2


30

Anlisis de Resultados Indicadores



Con las consultas y las visualizaciones de Jaspersoft se pueden calcular los indicadores
previamente definidos. Sin embargo cabe mencionar que adems de esta informacin,
existe la facilidad de exportar a Excel los reportes y poder trabajar ah las expresiones
definidas o las nuevas que vayan surgiendo.

Reprogramaciones

a) Porcentaje de reprogramaciones:



b) Total de reprogramaciones:
Total&de&Reprogramaciones.
A?CFE2
BB A?CFE

Dimensiones
E E
BB .BA?DI? .BA?DI?2 H
BB .BA?DI? .BA?DI?2 H

7EC

A?CFE2 H

?
)

. 37
.3.
0 H
1 B ?BB
2AI?H
4E DHED H
5A ?
6? JB
6JD E 5A ?
6JI A E
AH
9AB EHAB
9E AC
J 2EC?


Servicios

((

0
0
0
0

0
)

0
)

0
0

0
(
)

31


c) Total de Servicios Realizados
Total,de,Servicios,Realizados.
A
A

Dimensiones
2
)
)

?D )
?D )

?D
?D

C
C

() .2
).)
CF
D C
?C ? C
0 B
1 E B
1E? 0 B
1EDB
BC
4
C
4
E

2224
83
370
54
200
6
14
75
3
10
2
336
5
1036
30

182
14
28
3
3
1
0
1
0
3
0
42
2
85
0

2042
69
342
51
197
5
14
74
3
7
2
294
3
951
30

d) Total de rdenes Solicitadas.



Total,de,Ordenes,Solicitadas.
B D F3
CC B D F B D F3 I

Dimensiones
F?F
CC CB EJ
CC CB EJ

8FD H
CB EJ 3 I
CB EJ 3 I

)
. 048
4
1 IL
2 C
CC
3BJ I
5FAEIFE I
6B? H
7 ? C H
7 E?F 6B? H
7 JHB F
9 HBI
BC FIBC
F?BD
3FD

(
((

)
)

0
0
0
(
)

Tcnicos
32


Para la eficiencia de los tcnicos se muestra nicamente una parte de ellos, los
tcnicos con cdigo 1 hasta el 25. Puede verse que existe un tcnico con 100% de
eficiencia, ya que es quien atendi ms rdenes. En base a esta cantidad se evalu la
eficiencia de los dems.

a) Eficiencia de los tcnicos
Tcnicos
Eficiencia(Por(Tcnico
Dimensiones
717
55 206407 206407. 8

71437

542692.
55 542692

542692. 8
)
)
(

(
)

(
(

(
)
(
(
)

(
)

(
(
)
(
)
(

33

Conclusiones


Para la realizacin del presente informe, uno de los puntos crticos de trabajo
estuvo centrado en la calidad de los datos. Si bien hasta este punto el equipo
estudi la base de datos, filtr lo que se ha de utilizar y desech informacin no
relevante, durante la realizacin del proceso de ETL un porcentaje importante
de tiempo se centr en trabajar nuevamente los datos para que ellos pudieran
ser cargados y proceder a completar modelo estrella, ya que los datos deban
ser cargados con la mejor calidad posible, de lo contrario el proceso alerta
problemas y es imposible continuar. El trabajo sobre la base de datos fue hecho
a travs del software Jaspersoft.

Es importante mencionar que se realizaron muchas iteraciones para el proceso
de transformacin, donde la interpretacin de los datos y el constante dilogo
entre el equipo y gracias a las observaciones de los tutores, hicieron ms claros
los objetivos de esta etapa al enlazarla con los indicadores. En esta ocasin
resultaron transformaciones sencillas realizadas en Excel, pero stas pudieran
llegar a ser incluso bajo un cdigo ms estructurado y de esta manera brindar
atributos a cada record.

Dentro de las transformaciones fcilmente puede establecerse algn algoritmo
para la generacin de informacin y utilizar tcnicas estadsticas para realizar
test de hiptesis (por dar un ejemplo). De esta manera puede cargarse el Data
Mart con informacin interesante para luego ser vista por la contraparte.

En el caso de que MayDay! apruebe el Data Mart efectuado por el equipo y
quiera implementar esta solucin en sus procesos, entonces es recomendable
que ajusten sus polticas de registro de trabajo hacindolas ms estrictas. Esto,
dado a que como se registra actualmente la informacin, muchos datos son
intiles, de mala calidad o inexistentes, por lo que la base pierde informacin o
se hace ms compleja la implementacin de soluciones como la propuesta por
CCJ Solutions.

El cubo olap








34

Anexos

Anexo Ilustracin 1: Verificacin carga dimensin tiempo

Anexo Ilustracin 2: Carga dimensiones tcnico, clientes, ubicacin, tiempo y estado


35

Anexo Ilustracin 3: Tmap llenado Fact table

Anexo Ilustracin 4: Dimensiones Tcnico, Tiempo y Lugar







36

Anexo Ilustracin 5: Consulta MDX Clientes ABCDIN, Regin Metropolitana, Macul

Anexo Ilustracin 6: Consulta MDX


La consulta, mostrada en Anexo Ilustracin 6, presenta la cantidad de rdenes que son
realizadas a tiempo (Ya que dentro de las que son realizadas se quitan las que son
realizadas No a tiempo). Para obtener esto, se realiza una interseccin utilizando la
dimensin Estado, y las Jerarquas 1 y 2.



37

Anexo Ilustracin 7: Consultas MDX

Anexo Ilustracin 8: Consultas MDX

38

Anexo Ilustracin 9: Grfico de lneas Ordenes MayDay.

39

Anda mungkin juga menyukai