Materia: Datawarehouse
Manual para
transformación ETL a
usando la herramienta
PENTAHO
Integrantes:
Alvear Jackeline
Bobadilla Vilma
Tambo Ruthsbel
Zúñiga Herdiz
7/Mayo/2009
Manual para transformación ETL a través
del programa PENTAHO
Instalación
Bajar el software desde el siguiente link:
http://www.pentaho.com/products/try_bi_suite.php
• Tomcat (Servidor)
2
Proceso de migración
Para el proceso de migración se considera que ya se tiene instalado en la
máquina Microsoft access.
“C:\Archivos de programa\pentaho\design-tools\data-integration\data-
integration”
3
Una vez dentro del mismo existe la opción “View”, dando clic podremos
observar que se muestran dos carpetas:
“Transformations”
“Jobs”
4
Arrastramos la opción “Table Input” al panel en blanco derecho, damos doble
clic sobre el mismo y nos pedirá que escojamos desde donde vamos a obtener
los datos a migrar, en la opción “Connection” seleccionamos “New”, aparecerá
una ventana que nos solicitará el nombre de la conexión a configurar, como
esta es la tabla de la que vamos a leer los datos, debemos configurar la
conexión para Microsoft Access de la opción “Connection Type” seleccionamos
“MS Access”, nos pedirá el “ODBC DSN Source Name” en este campo lo
llenaremos con la siguiente trama de conexión:
5
Damos click en el botón de test y este generará una ventana con el mensaje
OK, una vez realizados los cambios procedemos aprobar la configuración.
• User name: es el usuario con que realizaremos las conexiones ene ste
caso por defecto es root
6
Damos click en el botón de test y este generará una ventana con el mensaje
OK, una vez realizados los cambios procedemos aprobar la configuración.
Este proceso haremos para cada tabla a migrar desde la base de datos Access,
en nuestro caso son dos configuraciones por cada tabla, cabe recalcar que
debemos especificar en cada configuración cual es la tabla a migrar, para eso
en la configuración de la base Access escogemos la opción “Get SQL
Statement” esta alternativa nos permitirá seleccionar la tabla que se va a
migrar.
Una vez configuradas todas las conexiones tanto para las tablas que se van a
leer y para las que se van a llenar, debemos indicar al programa cual es el
orden de los procesos a realizarse y como estos van a estar unidos al
ejecutarse, para esto debemos unir las configuraciones tanto las de ingreso
como las de salida.
Al final cada tabla de entrada y salida estaría unida por una flecha en verde.
7
Se configuró un proceso adicional el cual genera la base y las tablas en la base
de datos mysql.
Para esto nos ubicamos dentro de la mism opción “Design”, nos ubicamos en
“Scripting” y arrastramos al lado derecho el proceso “Execute SQL script”.
8
Nos ubicamos en el elemento arrastrado damos doble clic y lo configuramos,
para ejecutar un script el programa nos pide la conexión de la base de datos en
la cual ejecutaremos el script, como ya previamente configuramos la conexión
a mysql, seleccionaríamos ese tipo de conexión.
9
Hasta el momento en resumen hemos configurado las tablas de ingreso y
salida para la migración de la base, además hemos configurado un script para
generar la base donde va a residir los datos a migrar.
Una vez dentro de la opción “View”, dando clic podremos observar que se
muestran dos carpetas:
“Transformations”
“Jobs”
10
Dando doble clic escogeremos la opción “Jobs”, se generará una nueva opción
“Design”, desde esta opción escogemos la alternativa “General”.
11
Previamente ya tenemos dos configuraciones realizadas una transformación
para que el PENTAHO procese el script sql y otra que contiene todas las
configuraciones para migrar las tablas de Access a Mysql.
13
El programa pregunta si queremos mandar a ejecutar seleccionamos “Launch”
y después nos mostrará un log de los procesos que se están realizando con su
respectivo resultado.
Cabe recalcar que se realizó las configuraciones tanto para la migración de las
tablas, asi como las configuraciones para le ejecución de los querys que
ejecutan el proceso para la generación de las tablas de hecho respectivas.
14