Anda di halaman 1dari 12

PROYECTO FINAL

Integrantes:
Medrano Gomez Jefferson David
Rivera Enrquez Jenny Cecilia
Tandazo Jimenez Karla Cecibel
Zambrano Tello Carlos Alberto

1. RESUMEN EJECUTIVO DEL TRABAJO

El presente trabajo es la cristalizacin de lo aprendido en la


materia Datawarehouse, mediante el uso de la metodologa
Kimball aplicada en casa practico de implementacin de un
Datawarehouse
Mediante el uso de la metodologa Kimball se implement el
proyecto de Bussiness Inteligence la misma que permite cubrir
todas las fases del ciclo de vida de los proyectos de BI

Pentaho Schema Workbench para el diseo de los cubos, la base


de datos usada en el desarrollo del proyecto es postgress, y
posterior generacin de reportes en Pentaho

1. Objetivo General

Implementar solucin BI mediante el uso de Pentaho que permita la toma de


decisiones en empresa de telefona.

1. Objetivos especficos.

Aplicar metodologa Kimball en el desarrollo de proyecto BI

Elaborar la documentacin y entregables de la construccin del Data Warehouse


en base a la metodologa de Kimball

Elaborar tres reportes analticos en base a las herramientas escogidas.

1. PENTAHO
Pentaho se encuentra en el cuadrante de Garner en los Visionarios, este ao fue
calificado como visionario por ser un jugador ms en el espacio de Big Data y el IoT
(Internet of things, que es un concepto que se refiere a la interconexin digital de
objetos cotidianos con internet). Sus prioridades se enfocan en grandes proyectos de
datos y el IoT, sin dejar de tener una fuerte presencia en el OEM (fabricante de
equipamiento original) y el mercado de BI

1. DESARROLLO
PROYECTO
1.

Metodologa de Ralph Kimball

DEL

Modelo Dimensional

Ventajas
Entorno grfico de desarrollo
Uso de tecnologas estndar: Java, XML, JavaScript
Fcil de instalar y configurar
Multiplataforma: windows, macintosh, linux
Basado en dos tipos de objetos: Transformaciones (coleccin de pasos en un proceso
ETL) y trabajos (coleccin de transformaciones)
Incluye cuatro herramientas:
Spoon:para disear transformaciones ETTL usando el entorno grfico
PAN:para ejecutar transformaciones diseadas con spoon
CHEF:para crear trabajos
Kitchen:para ejecutar trabajos
Descubrir patrones ocultos y correlacinales en los datos
Prevenir eventos futuros basados en patrones histricos
Contar con la tecnologa de:
Poderoso motor de Data Mining

Ventajas
Contar con la tecnologa de:
Poderoso motor de Data Mining
Herramientas de Diseo Grafico
Seguridad y conformidad
Servicios Web, Repositorios y definiciones basadas en XML
Rendimiento y escalabilidad
Potente motor de ETL
Trabajo con variedad de fuentes de datos
Las capacidades de la plataforma abarcan desde la integracin de datos con PDI hasta
la analtica avanzada con Weka y la integracin con. R.
El acceso a los datos y la integracin es la principal razn para la adopcin de
Pentaho.
Costo de la licencia y la funcionalidad son otras dos razones para adoptar Pentaho.

Desventajas
En experiencia de cliente, Pentaho esta por debajo de la media del proveedor en
cuanto a beneficios alcanzados del negocio, acceso y habilitacin de usuarios y
disponibilidad de recursos especializados en el mercado.

Pentaho esta clasificado con un puntaje bajo en la experiencia migratoria, lo que


podra retrasar las futuras actualizaciones que abordan sus problemas existentes o la
utilizacin de la capacidad de innovacin

Pentaho tiene bajas calificaciones administracin e implementacin, desarrollo de


contenidos y el consumo del usuario final

Componentes Pentaho
Table Input

Este ejecuta la sentencia SQL, la cual trae los datos de la base origen los cuales sern usados para
la carga del Data Mart

Get System Info

Con esta herramienta se puede obtener algunos datos del sistema que servirn para la tabla de
auditora.

Dimension lookup/update

Permite implementar la dimensin actualizacin o insertar

Indicadores

El paso Grid de datos permite introducir una lista esttica de filas en una cuadrcula aqu
ponemos los indicadores que nosotros definimos.

Insert/Update

Crear un Insert/Update, para controlar la insercin y actualizacin en la base DW.

Gererar Fecha

Generamos 10 mil veces un valor del tipo fecha, con el valor 20050101, que corresponde a la
fecha inicial que queremos procesar. Esta fecha es el punto de partida de la generacin de toda la
secuencia de fechas has

Aadir 1 dia:

con un paso del tipoAdd Secuencegeneramos un valor nmerico, que empieza por 1, y
que se va incrementando en cada ejecucin

Ordena Valores:

con el pasoSelect / Rename values, seleccionamos los campos que queremos pasar al
siguiente paso, y el orden

Calculo de Textos:

con un paso del tipoFormula, calculamos algunos campos ms, como el identificador de la
semana y su descripcin, el mes, el dia de la semana,

CONCLUSIONES
Kimball proporciona un conjunto de conocimientos que aseguran y modelan una
serie de acciones para el desarrollo ptimo de un Data warehouse por versatilidad,
enfoque ascendente y renovador, gracias a su mantenimiento constante e
intercambio de informacin con los usuarios finales por medio de las herramientas
de BI y todos los documentos que se manejan en el anlisis final de datos.

El uso de la herramienta Open Source Pentaho previamente investigada y


analizada. Permiti la implementacin de un Data Warehouse de un manera gil,
fcil de comprender y brindando la estabilidad necesaria al momento de integrar
los datos. Se tiene que tomar en cuenta que uno de los inconvenientes comunes es
el origen de datos al momento de realizar el proceso de extraccin,
transformacin y carga ETL.

Un buen diseo del Data Warehouse puede optimizar las consultas reflejadas en
tiempos de respuesta obteniendo datos relevantes para el anlisis del negocio. En
un Data Warehouse a diferencia de una base de datos Transaccional no es posible
realizar un CRUD. El proceso de extraccin, transformacin y carga es ejecutado
mediante un proceso ETL