Anda di halaman 1dari 12

1ERA PARTE

SOBRE LA HERRAMIENTA
PENTAHO ANTECEDENTES
Pentaho se define a s mismo como una plataforma de BI orientada
a la solucin y centrada en procesos que incluye todos los
principales componentes requeridos para implementar soluciones
basados en procesos y ha sido concebido desde el principio para
estar basada en procesos. Las soluciones que Pentaho pretende
ofrecer se componen fundamentalmente de una infraestructura de
herramientas de anlisis e informes integrados con un motor de
workflow de procesos de negocio. La plataforma ser capaz de
ejecutar las reglas de negocio necesarias, expresadas en forma de
procesos y actividades y de presentar y entregar la informacin
adecuada en el momento adecuado.
Su modelo de ingresos parece estar orientado a los servicios
(soporte, formacin, consultora y soporte a ISVs y distribuciones
OEM) aunque en alguno de los documentos y pginas que hemos
examinado aparece mencionado algunas funcionalidades Premium
que

hacen

pensar

en

ingresos

por

futuras

versiones

funcionalidades de pago.
En su web presenta una organizacin por productos: Reporting,
Analysis,

Dahsboards

Data

Mining,

acompaado

por

dos

introducciones: a la plataforma y a los productos. En dichas


introducciones se hace mencin especfica al workflow como una de
las capacidades BI claves de la plataforma.
Productos
Pentaho Reporting:
Las caractersticas generales son:
Proporciona funcionalidad crtica para usuarios finales como:
Acceso va web
Informes parametrizados
Scheduling
Suscripciones
Distribucin (bursting)
Proporciona claras ventajas a especialistas en informes:
Acceso a fuentes de datos heterogneos: relacional (va jdbc),

OLAP, XML, transformaciones de Pentaho Data Integration.


Capacidad de integracin en aplicaciones o portales: jsp,
portlet, web service.

Definicin modular de informes (distincin entre presentacin

y consulta)
Diseo de informes flexible
Entorno de diseo grfico
Capacidad de uso de templates
Acceso a datos relacionados, OLAP y XML
Desarrollado para:
Ser entendible
Ser fcil de extender
No consumir muchos recursos
100% Java: portabilidad, escalabilidad e integracin
Multiplataforma (tanto a nivel de cliente como servidor): MAC,

Linux/Unix y Windows
Pentaho Analysis:
Sus caractersticas generales son:
Vista dimensional de datos (por ventas, por periodo)
Navegar y explorar
o Anlisis Ad Hoc
o Drill-down
o Seleccionar un especifico miembro para el anlisis
Interactuar con alto rendimiento
o Tecnologa optimizada para rpida respuesta interactiva

Data Mining:
Sus caractersticas son:
Descubrir patrones ocultos y correlacinales en los datos
Prevenir eventos futuros basados en patrones histricos
Contar con la tecnologa de:
o Poderoso motor de Data Mining
o Herramientas de Diseo Grafico
o Seguridad y conformidad
o Servicios Web, Repositorios y definiciones basadas en XML
o Rendimiento y escalabilidad.

Versiones
6.0
5.4
5.3
5.2
5.1

2015-1012
2015-0615
2015-0217
2014-1006
2014-061

24
2013-1119
2012-1129
2012-0507
2011-1028
2011-0915
2011-0404
2010-1205
2010-0621
2010-0225
2009-1019
2009-0521
2009-0106
2008-0822
2008-0717
2007-1112
2007-0221

5.0
4.8.0stable
4.5.0stable
3.10.0stable
3.9.0stable
3.8.0stable
3.7.0stable
3.6.0stable
3.5.2stable
3.5.0stable
3.0.0stable
2.0.0stable
1.7.1stable
1.7.0stable
1.6.0stable
1.2.0stable

REQUISITOS PREVIOS DE INSTALACIN

Para instalar Pentaho se debe cumplir con unos requisitos

minimos :
Tener instalado JDK y configurado la variable de entorno

JAVA_HOME con la ruta donde se instal.


Poseer memoria suficiente en memoria RAM mnimo 8gb
Espacio en Disco Duro 80GB Minimo
2

PASOS DE LA INSTALACIN
Descargar Pentaho de la suite oficial suite (Pentaho Business

Analytics)
Descomprimir el fichero.
Ejecutar el instalador

2DA PARTE

IMPLEMENTACIN

DE

ETL

EMPRESA

DE

TRABAJO

PRCTICO

ANTERIOR
Extraccin de los datos de la fuente del trabajo practico
anterior.
Primeramente para extraer los datos ingreso al CRM antes implementado
en STEAK HOUSE

Se exporta el fichero de los cantos creados.


4

Creacin de los datos de entrada de las diferentes


fuentes de datos

Para los datos de entrada definir de ORO CRM


Tabla: Cuentas Clientes
Datos del Clientes
Fecha del ingreso cliente
5

Definicin de tablas de dimensiones

La tabla dimensin se define de la siguiente manera


Cuenta Clientes
Nombres
Apellidos
Telfono
Direccin
Email

Definicin de tablas de hechos


Registro Clientes
Datos
Fecha

Filtrado de los datos: limpieza, consolidacin, etc.

Ingresa a data integracin para proceder a limpiar los datos que estn
mal.

Se escoge entrada CSV

Para la limpiar los valores que estn mal se utiliza Mapear valores que lo
utilizare para agregar informacin en un campo nulo.

Carga inicial del almacn: ordenacin, agregaciones, etc.

Ejecutar

10

Correcto se comprueba en gestor de base de datos con la trasformacin


efectuada en este caso el campo nulo se lo puso nuevo cliente

11

Anda mungkin juga menyukai