Anda di halaman 1dari 32

FACULTAD DE CIENCIA Y

TEGNOLOGIA
CARRERA DE INGENIERIA DE SISTEMAS

DOCUMENTACION PARA EL SISTEMA DE DATAWAREHOUSE “NORTHWIND”


BAJO LA METODOLOGIA HEFESTO

Proyecto final de Nuevas Tecnologías

ESTUDIANTE: ALVARO ESTEBAN MOSTACEDO


CUELLAR
COD. ESTUDIANTE: 201302998

SANTA CRUZ DE LA SIERRA – BOLIVIA


2018
PASO I
ANÁLISIS DE
REQUERIMIENTOS

P á g i n a 2 | 32
ÍNDICE
1. IDENTIFICACIÓN DE LA EMPRESA ......................................................................................... 2
1.1. OBJETIVOS ..................................................................................................................... 2
1.2. POLÍTICAS ...................................................................................................................... 2
1.3. ESTRATEGIAS ................................................................................................................. 3
2. ANÁLISIS DE REQUERIMIENTO .................................................................................................. 6
2.1. IDENTIFICAR PREGUNTAS................................................................................................... 6
2.2. Identificación de indicadores y perspectivas de análisis.................................................... 7
2.3. MODELO CONCEPTUAL ...................................................................................................... 8
3. ANÁLISIS DE LOS OLTP ............................................................................................................. 10
3.1. DETERMINACIÓN DE INDICADORES ................................................................................. 10
3.2. ESTABLECER CORRESPONDENCIAS .................................................................................. 11
3.3. NIVEL DE GRANULIDAD .................................................................................................... 13
3.4. MODELO CONCEPTUAL AMPLIADO ................................................................................. 14
4. MODELO LÓGICO DEL DW ....................................................................................................... 16
4.1. TIPO DE MODELO LÓGICO DEL DW .................................................................................. 16
4.2. TABLAS DE DIMENSIONES ................................................................................................ 16
5. Procesos ETL ............................................................................................................................ 21
5.1. CREACIÓN DE CUBOS MULTIDIMENSIONALES ................................................................. 24
5.1.1. CREACIÓN DE INDICADORES ..................................................................................... 25
5.1.2. CREACIÓN DE ATRIBUTOS ......................................................................................... 26
5.1.3. CREACIÓN DE JERARQUÍAS ....................................................................................... 27
1. IDENTIFICACIÓN DE LA EMPRESA

Norwind es una empresa que comercializa productos de EEUU, con la


posibilidad de ir ampliando progresivamente la gama de productos disponibles,
siguiendo siempre la más estricta línea de calidad de estos productos.

El jefe de compras y los responsables de las compras se encargan de hacer los


pedidos periódicamente de acuerdo a la rotación de los productos que se
realizan en el transcurso del tiempo.

Su estructura está formalizada y posee características de una organización


funcional.

1.1. OBJETIVOS
El objetivo principal es el de tener una mejor organización, tener una herramienta
que permita mejorar la gestión de productos. Entender, obtener conocimiento y
tomar de decisiones a partir del análisis de la Base de Datos de la Empresa
Northwind, que originalmente fue creada en el Administrador de Base Datos
SQL.

1.2. POLÍTICAS

La empresa posee escasos grandes clientes con un gran poder adquisitivo, y


son precisamente estos, los que adquieren el volumen de los productos que se
comercializan.

Debido a ello, la política que se utiliza para cubrir los objetivos antes
mencionados, es la de satisfacer ampliamente las necesidades de sus clientes,
brindándoles confianza y promoviendo un ambiente familiar entre los mismos.
Esta acción se realiza con el fin de mantener los clientes actuales y para que
nuevos se interesen en su forma de operar.

Existe otra política que es implícita, por lo cual, no está definida tan estrictamente
como la anterior, y es la de mejorar continuamente, con el objetivo de sosegar
las exigencias y cambios en el mercado en el que actúa y para conseguir una
mejor posición respecto a sus competidores.

P á g i n a 2 | 32
1.3. ESTRATEGIAS

Dentro de las estrategias existentes, se han destacado dos por considerarse más
significativas, ellas son:

 Evitar los sobre stocks.


 Evitar el desabastecimiento de productos.
 Mantener el mercado abastecido en fechas importantes.

ORGANIGRAMA

Gerente
General

Departamento
de compras

Departamento
de RRHH

Departarmento
de sistemas

Datos de entorno específico

La empresa Northwind tiene un departamento de compras que se encarga de


realizar los pedidos a los diferentes proveedores mediante las empresas de
transporte, según solicite el personal de ventas.

P á g i n a 3 | 32
Relación de las metas de la organización con las del DW

El DW coincide con la metas de la empresa, ya que esta necesita mejorar su


eficiencia en la toma de decisiones y contar con información detallada a tal fin.
Esto es vital, ya que es muy importante para procurar una mayor ventaja
competitiva conocer cuáles son los factores que inciden directamente sobre su
rentabilidad, como así también, analizar su relación con otros factores y sus
respectivos por qué.

El DW aportará un gran valor a la empresa, entre las principales ventajas e


inconvenientes que solucionará se pueden mencionar los siguientes:

 Permitirá a los usuarios tener una visión general del negocio.


 Transformará datos operativos en información analítica, enfocada a la
toma de decisiones.
 Soportará la estrategia de la empresa.
 Aportará a la mejora continua de la estructura de la empresa.

PROCESOS

El principal proceso que se lleva a cabo es el siguiente:

Compra:

• El departamento de Compras, al recibir del departamento de Depósito las


necesidades de mercadería, realiza una comparación de los productos ofrecidos
por sus diferentes proveedores en cuestión de precio, calidad y confianza.
Posteriormente, se efectúa el pedido correspondiente.

P á g i n a 4 | 32
PASO I
ANÁLISIS DE
REQUERIMIENTO

P á g i n a 5 | 32
2. ANÁLISIS DE REQUERIMIENTO

El objetivo principal de esta fase, es la de obtener e identificar las necesidades de


información clave de alto nivel, que es esencial para llevar a cabo las metas y
estrategias de la empresa, y que facilitará una eficaz y eficiente toma de decisiones.

2.1. IDENTIFICAR PREGUNTAS

Por ello se consultó a los ejecutivos en busca de sus necesidades de información


dentro del proceso de compras y que estuviese soportado de alguna manera por
algún OLTP. El proceso elegido para el caso de estudio fueron las compras que
realiza dicho departamento.

Se les preguntó cuáles eran según ellos, los indicadores que representan de mejor
modo el proceso de Compras y ¿qué sería exactamente lo que se desea analizar
del mismo? La respuesta obtenida, fue que se deben tener en cuenta y consultar
datos sobre la cantidad de unidades vendidas y el monto total de compras.

Luego se les preguntó cuáles serían las variables o perspectivas desde las cuales
se consultarán dichos indicadores. Para simplificar esta tarea se les presentó una
serie de ejemplos concretos de otros casos similares. El resultado obtenido fue el
siguiente:

 Se desea conocer cuántas unidades de cada producto fueron Ordenadas


(compradas) a sus proveedores en un periodo determinado. O en otras
palabras: “Unidades adquiridas de cada producto a cada proveedor en un
tiempo determinado”.

 Se desea conocer ¿cuál fue el monto total de compras de productos a cada


proveedor en un determinado periodo de tiempo? O en otras palabras:
“Monto total de compras de cada producto a cada proveedor en un tiempo
determinado”.

P á g i n a 6 | 32
2.2. Identificación de indicadores y perspectivas de análisis

A continuación, se analizarán las preguntas obtenidas en el paso anterior y se


detallarán cuáles son sus respectivos indicadores y perspectivas.

“Unidades Compras de cada producto a cada proveedor en un tiempo determinado”

“Unidades Compras de cada producto por empleado en un tiempo determinado”

“Unidades Compras de cada producto mediante diferentes compañías despachante


en un tiempo determinado”

“Unidades Compras de cada producto por ciudad de origen en un tiempo


determinado”

En síntesis los indicadores son:

 Unidades ordenadas(compradas)
 Monto total de Unidades
 Ordenadas(Compradas)
 Despachante
 Tiempo

Y las perspectivas de análisis son:

 Proveedor
 Producto
 Ciudad
 Empleado

P á g i n a 7 | 32
2.3. MODELO CONCEPTUAL

El modelo conceptual resultante de los datos que se han recolectado, es el


siguiente:

Como puede observarse, la relación mediante la cual se unen las diferentes


perspectivas, para obtener como resultado los indicadores requeridos por los
usuarios, es precisamente “Pedidos”.

P á g i n a 8 | 32
PASO II
ANÁLISIS DE LOS OLTP

P á g i n a 9 | 32
3. ANÁLISIS DE LOS OLTP

Seguidamente, se analizarán las fuentes OLTP para determinar cómo serán


calculados los indicadores y para establecer las respectivas correspondencias entre
el modelo conceptual creado en el paso anterior y las fuentes de datos. Luego, se
definirán qué campos se incluirán en cada perspectiva. Finalmente, se ampliará el
modelo conceptual con la información obtenida en este paso.

3.1. DETERMINACIÓN DE INDICADORES

Los indicadores se calcularán de la siguiente manera:

”Unidades Compras”:

• Hechos: Compras.

• Función de sumarización: SUM.

Aclaración: el indicador “Unidades Compradas” representa la sumatoria de las


unidades que se han vendido de un producto en particular.

”Monto Total de Compras”:

• Hechos: (Unidades Comprasdas) * (Precio de Compra).

• Función de sumarización: SUM.

Aclaración: el indicador “Monto Total de Compra” representa la sumatoria del


monto total que se ha comprado de cada producto, y se obtiene al multiplicar las
unidades compradas, por su respectivo precio.

P á g i n a 10 | 32
3.2. ESTABLECER CORRESPONDENCIAS

En el OLTP de la empresa analizada, el proceso de compras está representado por


el diagrama de entidad relación de la siguiente figura.

P á g i n a 11 | 32
A continuación, se expondrá la correspondencia entre los dos modelos:

El monto total fue obtenido


mediante una consulta (select)
almacenado dado que en la base
de datos no se contaba con ello

P á g i n a 12 | 32
Las relaciones identificadas fueron las siguientes:

 La tabla “Customer” se relaciona con la perspectiva “Proveedor”.


 La tabla “Products” se relaciona con la perspectiva “Producto”.
 El campo “City” de la tabla “Customer” se relaciona con la perspectiva “Ciudad”.
 La tabla “Employees” se relaciona con la perspectiva “Empleado”.
 La tabla “Shippers” se relaciona con la perspectiva “Despachante”
 El campo “Orderdate” de la tabla “Orders” se relaciona con la perspectiva
tiempo.
 El campo “Quanty” de la tabla “Order Details” se relaciona con el indicador
 “Unidades Ordenadas”.
 La consulta realizada se relaciona con el indicador “Monto total de unidades”

3.3. NIVEL DE GRANULIDAD

Una vez que se recolectó toda la información pertinente y se consultó con los
usuarios cuales eran los datos que consideraban de interés para analizar los
indicadores ya expuestos, los resultados obtenidos fueron los siguientes:

 En la perspectiva “Proveedor” solo se tendrá en cuenta el nombre del proveedor


es decir el campo “CompanyName”
 En la perspectiva “Producto” solo se considerara el nombre del producto
es decir el campo “ProductName”
 En la perspectiva “Empleado” solo se tendrán en cuenta los campos
“FirtsName” y “LastName” que serán unidos para resultar en un solo dato.
 En la perspectiva “Despachante” solo se tendrá en cuenta el nombre de
la empresa despachante es decir el campo “CompanyName”
 En la perspectiva “Tiempo” se tomara el dato completo y mediante funciones se
obtendrán los datos como: Año, Cuarto, Mes, Semana, día.

P á g i n a 13 | 32
3.4. MODELO CONCEPTUAL AMPLIADO

Teniendo en cuenta, se completara el diseño del diagrama conceptual.

P á g i n a 14 | 32
Paso III

P á g i n a 15 | 32
4. MODELO LÓGICO DEL DW

A continuación, se confeccionará el modelo lógico de la estructura del DW, teniendo


como base el modelo conceptual que ya ha sido creado. Para ello, primero se
definirá el tipo de modelo que se utilizará y luego se llevarán a cabo las acciones
propias al caso, para diseñar las tablas de dimensiones y de hechos. Finalmente,
se realizarán las uniones pertinentes entre estas tablas.

4.1. TIPO DE MODELO LÓGICO DEL DW

El esquema que se utilizará será en estrella, debido a sus características, ventajas


y diferencias con los otros esquemas.

4.2. TABLAS DE DIMENSIONES


A continuación, se diseñaran las tablas de dimensiones.

Perspectiva “Products”:

• La nueva tabla de dimensión tendrá el nombre “Producto”.

• Se le agregará una clave principal con el nombre “ProductoID”.

• Se modificará el nombre del campo “ProductName” por “NProducto”.

Se puede apreciar el resultado de estas operaciones en la siguiente gráfica:

Products

ProductName

Proddfds

Perspectiva “Ciudad”:

• La nueva tabla de dimensión tendrá el nombre “Ciudad”.

• Se le agregará una clave principal con el nombre “CiudadID”.

P á g i n a 16 | 32
• Se modificará el nombre del campo “City” por “NCiudad”.

Se puede apreciar el resultado de estas operaciones en la siguiente gráfica:

Costumers

City

Proddfds

Perspectiva “Suppliers”:

• La nueva tabla de dimensión tendrá el nombre “Proveedor”.

• Se le agregará una clave principal con el nombre “ProveedorID”.

• Se modificará el nombre del campo “CompanyName” por “NProveedor”.

Se puede apreciar el resultado de estas operaciones en la siguiente gráfica:

Suppliers

CompanyName

Proddfds

Perspectiva “Empleado”:

• La nueva tabla de dimensión tendrá el nombre “Empleado”.

• Se le agregará una clave principal con el nombre “EmpleadoID”.

• Se modificará el nombre del campo “firtsname”,”Lastname” por “Nempleado”,


siendo una concatenación de ambos campos

P á g i n a 17 | 32
Se puede apreciar el resultado de estas operaciones en la siguiente gráfica:

EmployeeTerritories

FirtsName

LastName

Proddfds
Perspectiva “Transportista”:

• La nueva tabla de dimensión tendrá el nombre “Transportista”.

• Se le agregará una clave principal con el nombre “TransportistaID”.

• Se modificará el nombre del campo “CompanyName” por “NTransportista”.

Se puede apreciar el resultado de estas operaciones en la siguiente gráfica:

Shippers

CompanyName

Proddfds

P á g i n a 18 | 32
Perspectiva “Tiempo”:

• La nueva tabla de dimensión tendrá el nombre “Tiempo”.

• Se le agregará una clave principal con el nombre “TiempoID”.

• Se modificara el nombre del campo “OrderDate” será modificado por “año, mes”.

Se puede apreciar el resultado de estas operaciones en la siguiente gráfica:

Orders

OrderDate

Proddfds

P á g i n a 19 | 32
PASO IV
PROCESOS ETL

P á g i n a 20 | 32
5. Procesos ETL

A continuación, se generarán las sentencias SQL para cargar las diferentes tablas
de dimensiones y la tabla de hechos.

Tabla de dimensión “producto”

En este caso, aunque existían productos eliminados, el usuario decidió que está
condición no fuese tomada en cuenta, ya que habían movimientos que hacían
referencia a productos con este estado.

SELECT ProductID, ProductName FROM Northwind.dbo.Products order by


ProductID, ProductName

Tabla de dimensión “proveedor”

A continuación, se generarán las sentencias SQL para cargar la tabla de proveedor.

Se consultó con los usuarios y se averiguó que deseaban tener en cuenta solo
aquellos proveedores que no estén eliminados y que tengan su cuenta habilitada.

Los proveedores eliminados son referenciados mediante el campo “Eliminado”, en


el cual un valor “1” indica que este fue eliminado, y un valor “0” que aún permanece
vigente. Cuando se examinaron los registros de la tabla, para muchos proveedores
no había ningún valor asignado para este campo, lo cual, según comunicó el
encargado del sistema, se debía a que este se agregó poco después de haberse
creado la base de datos inicial, razón por la cual existían valores faltantes. Además,
comentó que en el sistema, si un cliente posee en el campo “Eliminado” un valor “0”
o un valor faltante, es considerado como vigente.

SELECT SuppliersID, CompanyName FROM Northwind.dbo.Suppliers

P á g i n a 21 | 32
Tabla de dimensión “ciudad”

Al igual que en las tablas de dimensiones, se recolectaron las condiciones que


deben cumplir los datos para considerarse de interés, y en este caso, se trabajará
solamente mostrando los datos con un select.

SELECT customer ID,city FROM Northwind.dbo.ciudad

Tabla de dimensión “empleados”

En este caso se muestra solamente el nombre de un empleado para poder realizar


el pedido.

SELECT EmployeeID, FirstName FROM Northwind.dbo.Employees

Tabla de dimensión “transportista”

En este caso se necesita el nombre de la compañía ala que el expendidor necesita


acceder.

SELECT ShipperID, CompanyName FROM Northwind.dbo.Shippers

Tabla de dimensión “tiempo”

Para generar esta tabla de dimensión, infaltable en todo DW, existen varias
herramientas y utilidades de software que proporcionan diversas opciones para su
confección.

Pero, si no se cuenta con ninguna, se puede realizar a mano o mediante algún


programa, llenando los datos en un archivo, tabla, hoja de cálculo,etc y luego
exportándolos a donde se requiera.

SELECT CONCAT(YEAR(OrderDate),DATENAME( MONTH,OrderDate),

DAY(OrderDate)),YEAR(OrderDate),MONTH(OrderDate) , DAY(OrderDate)
P á g i n a 22 | 32
FROM Northwind.dbo. Orders GROUP BY CONCAT(YEAR(OrderDate),

DATENAME(MONTH,OrderDate),DAY(OrderDate)),YEAR(OrderDate),MONTH

(OrderDate), DAY(OrderDate)

TABLA DE “HECHOS”
Para la confección de la tabla de hechos, se tuvieron que tomar como fuente

las tablas “empleado”, “producto” y “cliente”.

SELECT
CustomerID,EmployeeID,ProductID,CustomerID,CONCAT(YEAR(OrderDate),DAT
ENAME(MONTH(OrderDate),DAY(OrderDate)),ShipVia,Quantity as cantidad,
Quantity* UnitPrice FROM Northwind.dbo. [Order Details] det inner join
Northwind.dbo.Orders ord on ord.OrderID=det.OrderID

P á g i n a 23 | 32
5.1. CREACIÓN DE CUBOS MULTIDIMENSIONALES

La creación de este cubo tiene las siguientes finalidades:

 Ejemplificar la creación de cubos multidimensionales.


 Propiciar la correcta distinción entre hechos de una tabla de hechos e indicadores
de un cubo.
 Propiciar la correcta distinción entre campos de una tabla de dimensión y
atributos de un cubo

P á g i n a 24 | 32
5.1.1. CREACIÓN DE INDICADORES

En este momento se crearán dos indicadores que serán incluidos en el cubo “Cubo
de Pedidos”:

De la tabla de hechos “PEDIDOS”, se sumarizará el hecho “Cantidad” para crear el


indicador denominado:

• “Unidades Pedidas”.

La fórmula utilizada para crear este indicador es la siguiente:

• “Unidades Pedidas” = SUM(PEDIDOS.Cantidad).

De la tabla de hechos “PEDIDOS”, se sumarizará el hecho “Total” para crear el


indicador denominado:

• “Monto Total de Pedidos”.

La fórmula utilizada para crear este indicador es la siguiente:

• “Total de Pedidos” = SUM(PEDIDOS.Total).

Entonces, el cubo quedaría conformado de la siguiente manera:

P á g i n a 25 | 32
5.1.2. CREACIÓN DE ATRIBUTOS

Ahora se crearán y agregarán al cubo seis atributos:

De la tabla de dimensión “PROVEEDOR”, se tomará el campo “CompanyName”


para la creación del atributo denominado:

• “Nproveedor”.

De la tabla de dimensión “PRODUCTO”, se tomará el campo “ProductoName”


para la creación del atributo denominado:

• “Nproducto”.

De la tabla de dimensión “CIUDAD”, se tomará el campo “City” para la creación del


atributo denominado:

• “Nciudad”.

De la tabla de dimensión “EMPLEADO”, se tomaran los campos “LastName,


FirstName” concatenándolos para la creación del atributo denominado:

• “Nempleado”.

De la tabla de dimensión “TRANSPORTISTA”, se tomará el campo


“CompanyName” para la creación del atributo denominado:

• “Ntransportista”.

De la tabla de dimensión “TIEMPO”, se tomará el campo “OrderDate” para la


creación del atributo denominado:

• “Años”.

De la tabla de dimensión “TIEMPO”, se tomará el campo “OrderDate” para la


creación del atributo denominado:

• “Meses”.

P á g i n a 26 | 32
5.1.3. CREACIÓN DE JERARQUÍAS

Finalmente se crearán y agregarán al cubo las jerarquías:

Se definió la jerarquía “Jerarquía Productos”, que se aplicará sobre los atributos

recientemente creados “Nproductos”, Gráficamente:

Jerarquía

“PRODUCTO”, relación padre-hijo.

P á g i n a 27 | 32
Se definió la jerarquía “Jerarquía Proveedor”, que se aplicará sobre los atributos
recientemente creados “Nproveedor”, Gráficamente:

Jerarquía

“PROVEEDOR”, relación padre-hijo.

Se definió la jerarquía “Jerarquía Ciudad”, que se aplicará sobre los atributos

recientemente creados “Nciudad”,

Gráficamente:

Jerarquía

“CIUDAD”, relación padre-hijo.

Se definió la jerarquía “Jerarquía Empleado”, que se aplicará sobre los atributos

recientemente creados “Nempleado”, Gráficamente:

Jerarquía

“EMPLEADO”, relación padre-hijo.


P á g i n a 28 | 32
Se definió la jerarquía “Jerarquía Transportista”, que se aplicará sobre los atributos

recientemente creados “Ntransportista”, Gráficamente:

Jerarquía

“TRANSPORTISTA”, relación padre-hijo.

Se definió la jerarquía “Jerarquía Fechas”, que se aplicará sobre los atributos


recientemente creados, “Año” y “Mes”, en donde:

• Un Mes pertenece a un año. Un año tiene uno o más meses. Gráficamente:

Jerarquía

“TIEMPO”, relación padre-hijo.

P á g i n a 29 | 32
Entonces, el cubo quedaría conformado de la siguiente manera:

P á g i n a 30 | 32

Anda mungkin juga menyukai