Anda di halaman 1dari 11

INFORME DE PRCTICA 2

BODEGA DE DATOS

KERWIN TORRES CASTILLO


COD.92532615

GRUPO: 301125_24

TUTOR:
ANIVAR NESTOR CHAVEZ

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD


BASES DE DATOS AVANZADAS
PROGRAMA DE INGENIERIA DE SISTEMAS
CCAV COROZAL
2014

INTRODUCCION

El uso de las bodegas de datos como medio de informacin en una empresa, ha


revolucionado el ambiente empresarial, principalmente en lugares donde se desea
tener un conocimiento ms profundo sobre la manera de mejorar sus estrategias de
mercado. Empresas como Prometeus S.A. buscan incrementar su productividad y
ventajas frente a la competencia mediante nuevas estrategias de negocio, que solo
podrn cumplirse utilizando toda la informacin que es almacenada diariamente en sus
bases de datos.
Un problema comn que se presenta actualmente en las organizaciones es la poca
eficiencia en el manejo y uso de la informacin, haciendo tediosa la tarea de sacar
conclusiones e informes eficientes de los datos almacenados, debido a la redundancia
de los mismos y el procesamiento lento de grandes volmenes de informacin
almacenada, sumado a esto la informacin resultante no ayuda en la toma de
decisiones de la organizacin, debido a que su confiabilidad es muy baja.
La funcin de una Bodega de Datos es la de entregar la informacin correcta a la gente
indicada en el momento adecuado en el formato correcto. As las cosas la
implementacin de una Bodega de datos para la empresa Prometeus, le permitir tener
a si disposicin, informacin clave para la toma de decisiones empresariales, aumento
de la productividad, una comunicacin confiable entre todos los departamentos de la
empresa, mejorar las relaciones con los proveedores y los clientes, pero sobre todo
reducir los tiempos de respuesta y los costos de operacin.
En el presente informe se presenta una propuesta para la implementacin de una
Bodega de Datos en la empresa Prometeus.

1. MARCO DE REFERENCIA

1.1.

BODEGA DE DATOS (DATAWAREHOUSE).

Una Bodega de Datos es un recurso integrado de datos basado en un modelo que


permite almacenar informacin histrica proveniente de sistemas de procesamiento de
transacciones en lnea (OLTP) y cuyo objetivo es proporcionar informacin pertinente
para el proceso de toma de decisiones en las empresas.
Un Data Warehouse proporciona una visin global, comn e integrada de los datos de
la organizacin, independiente de cmo se vayan a utilizar posteriormente por los
consumidores o usuarios, con las propiedades siguientes: estable, coherente, fiable y
con informacin histrica. Al abarcar un mbito global de la organizacin y con un
amplio alcance histrico, el volumen de datos puede ser muy grande (centenas de
terabytes). Las bases de datos relacionales son el soporte tcnico ms comnmente
usado para almacenar las estructuras de estos datos y sus grandes volmenes.
Una definicin formal, dada por W.H.Inmon expresa que una bodega de datos es una
coleccin de datos integrados, orientados a temas, que dan soporte a las
funcionalidades del DSS, donde cada unidad de dato es relevante en algn momento
en el tiempo.

1.2.

MINERIA DE DATOS (DATAMINING)

La Minera de datos, es el conjunto de tcnicas y tecnologas que permiten explorar


grandes bases de datos, de manera automtica o semiautomtica, con el objetivo de
encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de
los datos en un determinado contexto. Bsicamente, la minera de datos surge para
intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin,
hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda
prximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario
les atribuye algn significado especial pasan a convertirse en informacin. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que
surge entre la informacin y ese modelo represente un valor agregado, entonces nos
referimos al conocimiento.

2. DESCRIPCION DEL SISTEMA ACTUAL

Prometeus es una empresa de comercializacin de electrodomsticos y servicio de


mantenimiento y reparacin en general. Sus actividades consisten en la
comercializacin de diferentes electrodomsticos, como: estufas, lavadoras, neveras,
nevecones, equipos de sonido, televisores, etc., y el servicio de mantenimiento
preventivo y correctivo. Prometeus tiene agencias en las principales ciudades del pas.
Esta empresa requiere mejorar la gestin de la informacin de manera que pueda
acceder a los datos de todas sus agencias de forma oportuna y con facilidad.
Actualmente Prometeus, cuenta con un sistema de Bases de Datos Distribuidas, para
el manejo y procesamiento de la informacin generada por las actividades diarias
propias de su objeto comercial, en cada una de sus agencias.
El sistema actual permite el registro y almacenamiento de la informacin a nivel local,
en cada una de las agencias, generada por ventas, servicios de mantenimiento y/o
reparacin, inventario local, movimientos, informacin de empleados, entre otras. As
mismo el sistema permite la consulta de toda la informacin generada en cada agencia,
desde el nivel central, facilitando los procesos de auditoria, marketing y dems.
Muy a pesar de las ventajas que ofrece un sistema de bases de datos distribuidas, para
el manejo de la informacin de Prometeus, los volmenes de informacin a procesar
son altos y difciles de manejar, sobrepasando la capacidad ofrecida por el sistema
actual y haciendo que los procesos de consulta y actualizacin de la informacin sean
ms complejos y tardos; esto se ve reflejado al momento que todas las agencias
generan informacin que necesita ser revisada, analizada y verificada a nivel central
dentro del mismo periodo, para lo que se requiere que el sistema tenga la capacidad de
realizar diversas consultas de informacin de forma rpida y al tiempo, incluso por
parmetros que antes no hayan sido tenidos en cuenta; la ausencia de estas
caractersticas complican la toma de decisiones a nivel gerencial, as como la
generacin de las estadsticas de la empresa, la entrega de informes , y la distribucin
de los recursos.
Un sistema de apoyo a la toma de decisiones permitir contar con informacin
estadstica confiable, consolidada, asequible y prcticamente en tiempo real. En
trminos de confiabilidad, el sistema contar con acceso al origen de la informacin a
travs de los sistemas operacionales existentes, consolidndola y ahorrando mucho
tiempo de clasificacin y reduciendo la posibilidad de error.

3. SISTEMA PROPUESTO

3.1.

DESCRIPCION DEL SISTEMA PROPUESTO

El sistema propuesto para la empresa Prometeus consiste en la implementacin de una


bodega de datos para la consulta de la informacin, tomando como base el sistema de
Bases de Datos Distribuidas con el que cuenta actualmente la empresa, llevndolo a un
modelo dimensional. En la arquitectura a utilizar se identifican seis subsistemas, en los
cuales el sistema se estructura de la siguiente manera:

Fuentes de Datos
Extraccin Transformacin y
Carga.
OLAP
Presentacin
Seguridad
Administracin

El sub-sistema correspondiente a las Fuentes De Datos contiene las distintas fuentes


que alimentan el sistema; que para el presente caso corresponden a bases de datos
relacionales de SQL y Oracle, sin embargo, tambin se podra obtener informacin
desde otro tipo de fuentes distintas.
El rea de ETL es la seccin donde se agrupan una serie de sub-procesos que llevan a
cabo tareas relacionadas con la extraccin, manipulacin, control, integracin, limpieza
de datos, carga y actualizacin de la Bodega de Datos.
El sub-sistema OLAP es el ncleo del sistema que corresponde al repositorio central de
informacin donde residen los datos actualmente utilizados. En la Bodega de Datos se
almacenan los datos operacionales en estructuras multidimensionales que optimizan su
acceso para las consultas y que son muy flexibles, adems de contener la metadata de
la informacin almacenada que ofrece informacin descriptiva sobre el contexto, la
calidad, condicin y caractersticas de los datos.
La Presentacin es el rea correspondiente a la interaccin con el usuario, cuya
personalidad es mostrar los datos almacenados de forma til y transparente a travs de
las distintas herramientas. Este sub-sistema se comunica directamente con el servidor

de cubos a travs de consultas, las cuales retornan la informacin requerida donde


sta es transformada y presentada para la visualizacin final. Los reportes requeridos
en el proyecto se encuentran en esta rea.
En el rea de Seguridad se encuentran definidas las restricciones de acceso a los
objetos de la plataforma y a los diferentes recursos.
Por ltimo, en el sub-sistema de Administracin se encuentran las herramientas
administrativas de la plataforma; gestin de usuarios, administracin de conexiones de
fuentes de datos, herramientas de limpieza de los diferentes cachs y el sistema de
archivos interno de la Bodega de Datos, se encuentran en esta rea.

3.2.

OBJETIVOS

Implementar una solucin informtica a los problemas de manejo de informacin,


presentes en Prometeus, mediante una bodega de datos que contenga informacin
accesible para la organizacin.
Disear una bodega de datos que ofrezca informacin confiable para la empresa
Prometeus, utilizando las herramientas que ofrece la Minera de Datos.

3.3.

VENTAJAS PARA LA ORGANIZACIN

La implementacin de una Bodega de Datos para el almacenamiento y consulta de la


informacin en la empresa Prometeus, le permitir contar con disponibilidad y
confiabilidad de la informacin, facilitando la toma de decisiones a nivel gerencial y la
entrega oportuna de reportes e informes, tanto a las directivas de la organizacin como
a las entidades que los regulan.
Permite contar con informacin confiable para la proyeccin de ventas y marketing de
la empresa, control de cumplimiento de metas en el departamento de ventas.
La informacin financiera y contable de la empresa permanecer actualizada, gracias a
que cada movimiento realizado en las agencias se ver almacenado en la bodega de
datos; lo mismo que el inventario de productos, permitiendo un control de las entradas,
salidas y faltantes.

3.4.

METODOLOGIA DE IMPLEMENTACION DE LA BODEGA DE DATOS

El modelado dimensional es una tcnica de diseo lgico que busca presentar los
datos en un marco de trabajo estndar que es intuitivo y permite acceso de alto
desempeo. Es inherentemente dimensional y se adhiere a una disciplina que usa el
modelo relacional con restricciones de consideracin. Para el diseo de la Bodega de
Datos a implementar, se ha definido el modelo de estrella, ya que es uno de los ms
simples y utilizados en las bodegas de datos, adicionalmente su estructura permite
implementar mecanismos bsicos para utilizar una herramienta de consulta OLAP.
A continuacin el diseo lgico relacional del prototipo de la bodega de datos a
implementar.

Dimensin PROD_SERV. Se utiliza para el analisis de las salidas y entradas de


productos y el control de existencias, asi como los servicios tecnicos ofrecidos,
identificados por sus atributos COD_PROD_SERV y DESC_PROD_SERV. Dimensin
FACTURAS. Permite el analisis de la informacin comercial de la empresa, producto de
la venta y/o prestacin de servicios. Dimensin CLIENTES. Permite el analisis de toda
la informacin referente a clientes de la empresa, as como las consultas de los
movimeintos de los mismos. Dimensin AGENCIA. La empresa cuenta con agencias
en varias ciudades, la informacin de las cuales es recopilada en esta dimensin.
Dimensin TIEMPO. Tiene la finalidad de almacenar las fechas en las que se realiza

cada movimiento de ventas de la empresa. La tabla MOVIMIENTOS, constituye la tabla


de hechos de la Bodega de Datos.

3.5.

MINERIA DE DATOS

Para el diseo del prototipo de la Bodega de Datos propuesta se utilizara SQL Server,
Oracle y Lenguaje de programacin XML, lo que permitir que la bodega de datos se
integre facilmente con cualquier plataforma, sistema operativo y otras aplicaciones,
facilitando los procesos de consultas y analisis de la informacin.
El proceso de mineria de datos utilizado, est determinado por la implementacin de
cubos OLAP como herramienta para los procesos de extraccin, transformacin y
carga (ETL) de los datos en la bodega, y la elaboracin de arboles de operacin en
lenguaje XML.
La integracin de algoritmos en XML (Extensible Markup Language), junto con SQL
Server permite la construccin del ETL para el almacenamiento de datos. SQL Server
facilita la construccin de los cubos OLAP mediante la herramienta Analisys Service
que viene integrada en el mismo. Con XML se construyen los rboles de operaciones
modelados durante el proceso, sirve para controlar e inspeccionar los procesos en
ejecucin, y seguimiento continuo de la visualizacin del proceso de resultados.
Para llenar la tabla de Hechos MOVIMIENTOS, se realizan las siguientes
transformaciones: Se ordenan los atributos de la Dimensin TIEMPO, por periodo, da,
mes y ao. Se toman los atributos ID_CLIENTE, NUM_FACT, COD_PROD_SERV, ID_AGE e
ID_TIEMPO, respectivamente, se realiza la validacin necesaria para agregar nuevos
registros y por ltimo se realiza la carga en la tabla. El algoritmo que realiza este
proceso es el siguiente.
Algoritmo Carga de la tabla de hechos MOVIMIENTOS
1. Para cada tupla de la tabla CLIENTES hacer
2. Agrupar por ID_CLIENTE, ID_AGE
3. se obtiene el campo FECHA, que contiene la informacin de la tabla TIEMPO
4. se obtiene el campo NUM_FACT, que contiene la informacin de la tabla
FACTURAS
5. Si no se encuentra nmero de factura entonces
6. se ordena la tupla en funcin de las dimensiones de la tabla de hechos
7. se agrupan las tuplas
8. se insertan en la tabla de hechos

9. Si no
10. Se envia mensaje de error, posible registro duplicado.
11. Fin Si
12. Fin Para.

3.6.

RESULTADOS ESPERADOS

Brindar solucin a los requerimientos de manejo de informacin identificados en la


empresa Prometeus.
Realizacin de consultas de informacin agiles, oportunas y confiables, que permiten la
optimizacin de los procesos al interior de la organizacin.
Entrega de reportes e informes de manera oportuna que faciliten la toma de decisiones
a nivel gerencial en la organizacin.
Disponibilidad inmediata de la informacin para los procesos de Auditorias, control de
inventarios y dems procesos de seguimiento.
Informacin contable y financiera actualizada.
Crecimiento organizacional.

CONCLUSIONES

Una Bodega de datos debe tener informacin confiable y fcil de acceder en una
empresa, tomando la informacin de la fuente ms confiable.
Se debe tener en cuenta que la Metodologa escogida para la implementacin de la
bodega de datos, sea la que mejor se adapte a las necesidades del negocio y la que
ofrezca mejores resultados con la tecnologa a utilizar.
El proceso de Minera de Datos, es una tarea que no es fcil de realizar ya que se
necesita hacer una gran cantidad de pruebas para llegar a obtener algn resultado,
quizs no el mejor o esperado pero si uno que puede dar cierta claridad en los
movimientos que se pueden dar en organizaciones de ventas como en este caso.
Se debe tener claro el tipo de datos al cual se le va a aplicar la Minera de Datos, ya
que de esto depende que se elijan los correctos algoritmos para encontrar los mejores
resultados.

BIBLIOGRAFIA

BATINI C.; Ceri S.; Navathe S. Diseo conceptual de bases de datos. Un enfoque de
entidades-interrelaciones. 1994. Ed. Addison-Wesley.
CASTAO A.; Piattini M. Fundamentos y modelos de bases de datos. 1999. Ed.
Alfaomega. Segunda edicin.
CERI S, Pelagatti G.,Distributed databases principles & systems.. Ed. MacGraw-Hill.
1985.
DATE, C. J, Introduccin a los sistemas de bases de datos. Ed. Prentice Hall. Sptima
edicin.
DORSEY, P, Hudicka Oracle8. Diseo de bases de datos con UML. J. Ed. Oracle
press. 1999.
KROENKE,D. Procesamiento de bases de datos. Fundamentos,
implementacin. 2003. Ed. Pearson Education. Octava edicin

diseo

http://informationmanagement.wordpress.com/2007/10/07/data-warehousing-datawarehouse-y-datamart/
http://www.sinnexus.com/business_intelligence/datamining.aspx