Anda di halaman 1dari 95

Modelamiento Dimensional

Por
Elizabeth Len Guzmn, Ph.D.
Profesora
Ingeniera de Sistemas
Grupo de Investigacin MIDAS
Agenda
Modelo Dimensional
Definicin
Componentes
Ejemplos
Comparacin con E/R
Proceso del diseo dimensional
Modelos de arquitectura
Arquitectura en bus

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelamiento dimensional
Definicin
Una tcnica para disear el modelo
lgico de la bodega de datos
Permite alto rendimiento en el momento
de acceder a los datos (orientado a
consultas)
Dimensional (orientado al negocio)
Usa algunos conceptos del modelo
entidad/relacin
Diferente del modelo entidad/relacin

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelo dimensional
Define un nivel mnimo de detalle
(granularidad)
Se compone de:

Hechos

Medidas

Dimensiones

Atributos

Elementos

Jerarquas

Relaciones

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Hechos: algo que ocurre en el tiempo
(operacin o actividad)

Medidas: Valores numricos que


describen el hecho que se est
analizando

Dimensiones: Son categoras que


describen el contexto en el cual se
analizan las medidas

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelo dimensional

Dimensin
Tiempo Dimensin
Cliente
Tabla de
hechos

medidas

Dimensin
Dimensin Geografa
Producto

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelo E/R

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Comparacin
Operacionales BI (Dimensional)
Enfocado a la actualizacin:
Enfocado a eliminar redundancia,
coordinar actualizaciones y repetir Enfoque a la consulta
el mismo tipo de operaciones
muchas veces en el da
Altamente normalizadas para Altamente desnormalizada ya que
soportar actualizaciones se requiere disminucin de tiempos
consistentes y mantenimiento de la en la obtencin de grandes
integridad referencial cantidades de datos
Tiempos de respuesta aceptables
Tiempos de respuesta en segundos o pueden ser segundos, minutos,
inferior horas
Gran cantidad de datos derivados
Almacenan pocos datos derivados (redundancia)
Agregacin: Varios niveles de datos
Pocos datos agregados precalculados

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Medidas
Son las variables que ayudarn a medir el
desempeo del negocio.
Las medidas bsicas, existen fsicamente
en el warehouse junto a los atributos que
los caracterizan
Las medidas derivadas o calculadas se
construyen a partir de las medidas bsicas
y pueden o no estar almacenados
fsicamente en el data warehouse

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Hechos y medidas
Una fila en una tabla de hechos
corresponde a una o varias medidas
Todas las medidas en la tabla de hechos
deben tener el mismo nivel de
granularidad
Las medidas mas usadas son numricas y
aditivas
Las tablas de hechos representan la
relacin muchos a muchos que existe
entre las dimensiones!

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones
Son las reas temticas o sujetos del
negocio.
Proveen un mtodo general para organizar
la informacin corporativa
Se definen como un grupo de uno o ms
atributos. Las dimensiones no comparten
atributos
Las dimensiones definen los niveles de
anlisis (Jerarquas). Esto permite
obtener agregacin o sumarizacin.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Atributos
Los atributos son una agrupacin de
elementos o items dentro de una
dimensin.
Representan categoras o clases de
elementos que tienen el mismo nivel lgico
dentro de una dimensin.
La finalidad de los atributos es ver la
informacin de cada dimensin a
diferentes niveles de detalle y agrupar
los datos para ser analizados.
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Elementos
Son las instancias o valores de los
atributos que, como componentes
atmicos del modelo.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Relaciones
Los atributos dentro de una dimensin
estn directamente relacionados uno con
otros a travs de los diferentes tipos de
relaciones antes definidos.

Los atributos en las diferentes


dimensiones estn relacionados otros a
travs de las medidas o variables del
negocio definidas como interseccin de
las dimensiones.
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Relaciones
Son asociaciones lgicas de atributos
dentro de una jerarqua definida por las
instancias de los atributos y transitivas
dentro de una jerarqua:

Uno-a-uno (1:1)
Uno-a-muchos (1:M)
Muchos-a-uno (M:1)
Muchos-a-muchos (M:N)

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Jerarquas
Representadas por un ordenamiento
lgico dentro de la dimensin, se
encuentran formadas por los diferentes
tipos de relaciones entre los atributos de
una misma dimensin.
Como convenciones del modelado, la
jerarqua principal se dibuja verticalmente
desde el atributo ms agregado (arriba)
hasta el ms atmico (abajo) y las
jerarquas caractersticas se adicionan por
los costados.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Ejemplo
Empresa: Cadena de supermercados
Actividad objeto de anlisis: ventas de
productos
Informacin registrada sobre una venta:
Se vendi 5 unidades del producto A, en
el almacn nmero 1, el da 20/01/2007
por un total de 250.000 pesos
Para hacer el anlisis no interesa la venta individual realizada
por un cliente, si no las ventas diarias de productos en los
distintos almacenes de cadena

U. Nacional Prof. Elizabeth Len BDA Modelamiento


U. Nacional Prof. Elizabeth Len BDA Modelamiento
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Mitos del modelo
dimensional
Modelos dimensionales y data marts

Solo para datos sumarizados


Son construidos por departamentos
Son no escalables
No pueden ser integrados

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Proceso de diseo
dimensional
Pasos
1. Seleccionar el proceso del negocio a
modelar
2. Definir el nivel de granularidad del
proceso del negocio
3. Escoger las dimensiones que aplican en
cada fila de la tabla de hechos
4. Identificar los hechos numricos que
poblaran la tabla de hechos

U. Nacional Prof. Elizabeth Len BDA Modelamiento


1. Seleccionar el proceso de
negocio a modelar
El primer modelo dimensional debe ser uno
con gran impacto (debe responder la
mayora de preguntas del negocio y estar
accesible para la extraccin de los datos)

Decidir el proceso(s) del negocio a modelar


combinando y entendiendo los
requerimientos del negocio con los datos
disponibles

U. Nacional Prof. Elizabeth Len BDA Modelamiento


2. Definir el nivel de
granularidad del proceso
Preferiblemente, desarrollar el modelo
dimensional con los datos mas atmicos
capturados del proceso de negocio

Datos atmicos son los mas detallados

Una bodega casi siempre requiere los


datos expresados al mas bajo nivel de
granuralidad posible en cada dimensin.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


3. Escoger las dimensiones
La granularidad determina la
dimensionalidad de la tabla de hechos
Es posible adicionar mas dimensiones a la
granularidad bsica de la tabla de hechos:
Toman solo un valor bajo cada combinacin de
las dimensiones
Si la dimensin adicional viola la
granularidad causando mas filas en la
tabla de hechos, la granularidad debe ser
revisada para acomodar la dimensin.
U. Nacional Prof. Elizabeth Len BDA Modelamiento
4. Identificar los hechos

Determinar las medidas que aparecern en


la tabla de hechos
La granularidad define el nivel de detalle
de las medidas

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 10: Permanecer enamorado con la
tecnologa y los datos en lugar de enfocarse
en los requerimientos y metas del negocio

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 9: No apadrinarse de un
administrador visionario, influyente,
accesible y razonable y metas del negocio
que cumpla las veces de patrocinador del
datawarehouse.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 8: Embarcarse en un proyecto muy
galctico y milenario antes que perseguir un
proyecto ms manejable con
procesos iterativos.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 7: Asignar energa para construir
un modelo de datos normalizado, buscando
ahorrar recursos fsicos en vez de optar
por la facilidad de entendimiento que se
le puede dar al usuario final.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 6: Poner mas atencin en el
rendimiento operacional y facilidad de
desarrollo del backroom que en el
rendimiento y facilidad de uso del front-
room

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 5: Los diseadores de base de datos
que prefieren una presentacin mas
compleja posteriormente gastan una
enorme cantidad de tiempo dando soporte
a los usuarios.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 4: Poblar los modelos dimensionales
sobre una base aislada sin considerar una
arquitectura de datos que opere unida,
utilizando dimensiones
compartidas.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 3: Cargar nicamente datos
sumarizados en las estructuras
dimensionales del rea de presentacin.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 2: Presumir que el negocio, sus
requerimientos y analticas, as como los
datos subyacentes y la tecnologa que lo
soportan, son estticos.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Errores comunes - prevenir
Error 1: Negarse a reconocer que el
xito de un datawarehouse esta
ligado directamente a la aceptacin de los
usuarios.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Cadena de almacenes
100 almacenes en cinco (5) regiones
Cada almacn tiene varios departamentos

Realidad de
los datos
Modelo dimensional
1. Proceso del negocio
2. Granularidad
3. Dimensiones
4. Hechos Requerimientos
del
negocio
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Tomado de [5]
Caso de estudio
1. Seleccionar el proceso de negocio a
modelar
Administrador desea
Entender las compras de los clientes desde el
POS (punto de venta)

Proceso del negocio


Ventas realizadas en el POS

Analizar que productos se estn vendiendo, en que almacenes,


en que das, y en que condiciones de promocin

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
2. Definir el nivel de granularidad del proceso
del negocio

Cul es el nivel de detalle de los datos?


Posibles anlisis:
Diferencia de ventas entre Lunes y Viernes
Existencia de productos en ciertos almacenes,
ej: cereales
Entender por que ciertos compradores tomaron
la promocin del shampoo

Requieren datos detallados en diferente forma


No es posible responder con datos sumarizados
A nivel de producto
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Caso de estudio
3. Escoger las dimensiones

La fecha, producto y almacn


(dimensiones primarias)
otras dimensiones?
Promocin
Nueva dimensin viola la granularidad?
(nuevas filas en la tabla de hechos)

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Modelo preliminar

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
4. Identificar los hechos
Qu ms debe aparecer en la tabla de
hechos?
Hechos que correspondan con la
granularidad: Transaccin de venta
Precio por unidad
Cantidad vendida
Venta total
Costo del producto
Calcular la ganancia (Venta total Costo total)

Dilema: Almacenar calculado o calcular


U. Nacional Prof. Elizabeth Len con herramienta de consulta?
BDA Modelamiento
Caso de estudio
4. Identificar los hechos
Porcentaje de ganancia (calculada al dividir la
ganancia por el total de la venta)

No puede ser sumarizada por ser


con respecto a la dimensin!

Los porcentajes y proporciones no son aditivos. El numerador y el


denominador deben ser almacenados en la tabla de hechos.
La proporcin puede ser calculado a tiempo de consulta de acuerdo
con la situacin.

La proporcin de las sumas != La suma de las


proporciones

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
4. Identificar los hechos
Estimar el nmero de filas que se
almacenarn en la tabla de hechos
Caso de estudio: Hablar con la persona experta
para conocer cuantas transacciones de venta
pueden ocurrir en un periodo de tiempo
Estimar el nmero de filas que se
almacenarn anualmente a la tabla de
hechos

Determinar si es razonable

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Atributos de las
dimensiones
La seleccin de los atributos de cada
dimensin es un paso muy importante ya
que este permitir a los analistas responder
muchas mas preguntas del tipo Por qu?

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensin Tiempo
Est presente en casi todos
los esquemas
multidimensionales.

Es la dimensin esencial.

Casi siempre se usa como el


primer criterio de un
ordenamiento y/o filtro

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensin Tiempo
Por qu usar una dimensin de tiempo si con el
tipo de dato Datetime y las funciones de SQL
puedo obtener diferentes atributos?
Por que hace ms fcil de entender y manejar el
modelo.
Depende del negocio se presentar atributos
particulares por ejemplo:
Calendarios fiscales diferentes.
Das laborales o festivos

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensin Tiempo

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades
Dimensin Tiempo

Puede ser construida con anticipacin


(historia y aos futuros)
La bodega siempre necesita una dimensin
de tiempo.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades- Dimensin
Tiempo

La Dimensin Tiempo en detalle

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades- Dimensin
Tiempo

Si se desea acceder al tiempo de la


transaccin por partes del da (Ej: tardes)
Conviene una Dimensin por horas
Es mejor tener las mismas 3.650 filas y una
dimensin con 1.440 filas correspondientes a
los minutos del da
Si se maneja en una dimensin a nivel de
Fecha y hora (HH:MM), se tendra una
dimensin con demasiados registros:
365 das x 10 aos x 24 horas x 60 minutos
= 5.256.000 filas

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Dimensin Producto
Su definicin debe ser lo mas amplia posible y sus
atributos van a dar respuestas a las diferentes
reas funcionales de la empresa.

Ejemplo: Compras se preguntar por las marcas


mas Vendidas
Logstica por la presentacin ms vendida
Mercadeo por el color de los productos ms
vendidos.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades
Dimensin Producto

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades- dimensin
producto

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Dimensin Almacen
Describe cada almacn de la cadena del
retail.
Posiblemente no existe un archivo
maestro de tiendas. Por lo tanto en
ocasiones debe construirse manualmente.
Contiene atributos geogrficos de
anlisis

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades
Dimensin Almacn

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Dimensin Promocin
Describe las
condiciones de la
promocin bajo las
cuales se ha vendido un
producto.
Se clasifica como una
dimensin casual.

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades
Dimensin promocin

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Atributos de las entidades
Dimensin degenerada
Nmero de transaccin del POS

Las dimensiones degeneradas son comunes cuando la granularidad de la


tabla de hechos representa una simple transaccin (Ej: nmero de
ordenes, nmero de recibos, nmero de la factura, etc)

Algunas veces la dimensin degenerada es llave primaria de la tabla de hechos


U. Nacional Prof. Elizabeth Len BDA Modelamiento
Caso de estudio
Modelo

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Modelo extendido

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Bodegas de Datos
Modelos de Arquitectura
Dos arquitecturas de acuerdo con la
normalizacin de sus dimensiones:

Estrella
Desnormalizado

Copo de Nieve
Normalizado

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Estrella vs Copo de nieve
Estrella
Desnormalizado
Habilidad para anlisis dimensional
Copo de nieve
Variacin del modelo estrella
Forma normalizada de las dimensiones (solo
las dimensiones primarias estn enlazadas con
la tabla de hechos)
Rompe el anlisis dimensional
Se usa cuando no se puede implementar un
modelo estrella

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelo Estrella

Dimensin Dimensin
Tiempo Geografia

Tabla de
hechos

Dimensin
Dimensin Cliente
Producto

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelo Copo de nieve
Dimensiones desnormalizadas (valores
repetidos) puede llevar a la normalizacin
de una dimensin

Dimensin
Clase de Producto
Dimensin
Tabla de Producto
Hechos Dimensin
Categora
de Producto

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelo Copo de nieve
Atributos redundantes son removidos de la
entidad y creando una segunda dimensin.
Reduce espacio
Fcil de mantener (si la descripcin de un
departamento cambia, solo se necesita
actualizar una ocurrencia y no alrededor
de 3.000)
Extensin del modelo dimensional (vlido)

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Dimensin producto (parcial) en copo
de nieve

Normalizado en 3FN

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Modelo Copo de nieve
En el diseo del modelo se debe tener en
cuenta: uso y desempeo
Consideraciones de este modelo
Mltiples tablas aumentan la complejidad de uso
Mas tablas y joins afectan el desempeo de las
consultas
Navegar a travs de las dimensiones puede ser
ms lento (cruce de dimensiones)
No se pueden aprovechar los ndices Bitmap que
son tiles para indexar campos con baja
cardinalidad
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Modelo Copo de nieve
El espacio salvado en las dimensiones es
insignificante comparado con el tamao de la
tabla de hechos.
Descripcin del depto (20 bytes) Nueva dimensin con 2 bytes
En la tabla de producto (150.000 filas) de cdigo

Reducir 2.7 MB
(150.000*18 bytes)

La tabla de hechos ocupa 10GB

Prdida de tiempo tratar de normalizar la dimensin!


U. Nacional Prof. Elizabeth Len BDA Modelamiento
Muchas dimensiones
Una tabla de hechos es normalizada y
compacta. Tentacin de desnormalizar
Una tabla de hechos con muchas
dimensiones lleva a un crecimiento
significativo de requerimientos de espacio
La mayora de procesos del negocio
pueden ser representados con menos de
15 dimensiones

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Muchas dimensiones (2)
Un nmero largo de dimensiones es signo
de que varias dimensiones no son
completamente independientes y pueden
ser combinadas en una sola dimensin
Si el negocio tiene mas de 25 dimensiones,
se debe combinar dimensiones
correlacionadas en una sola dimensin
Es un error representar elementos de una
jerarqua como dimensiones separadas

U. Nacional Prof. Elizabeth Len BDA Modelamiento


U. Nacional Prof. Elizabeth Len BDA Modelamiento
Llaves subordinadas(1)
Llaves artificiales,
llaves sintticas,
llaves enteras
Se recomienda el uso
de estas llaves
Son enteros que son
asignados
secuencialmente al
poblar una dimensin

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Llaves subordinadas(2)
Cada join entre dimensiones y tabla de
hechos debe estar basado en llaves
subordinadas.
Evitar el uso de cdigos naturales de los
sistemas que soportan la operacin
Beneficios:
Mantener flexibilidad al cambio.
Permite integracin
Ventajas de rendimiento computacional
(pequeas)

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Anlisis de la canasta de
mercado
Analizar que productos son vendidos en la
misma canasta de mercado!
Grado de afinidad de los productos: paales
son vendidos con cerveza
OLAP y minera de datos pueden ser
usados
Se puede tener una solucin a nivel de
bodega!

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Caso de estudio
Anlisis de la canasta de mercado

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Arquitectura en Bus
Construir la bodega en un solo paso?
Usar una arquitectura incremental
Arquitectura de bus!

Los Data Marts son construidos por tema de negocio en


tiempos diferentes o con grupos diferentes.
Los Data Marts pueden ser conectados y ser usados
consistentemente si se adhieren al estndar

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Arquitectura en Bus

U. Nacional Prof. Elizabeth Len BDA Tomado


Modelamiento
de [2]
Arquitectura en Bus
Permite una mejora en la administracin
de los componentes de la bodega.
Basado en el principio reduccionista de
control sobre cada uno de los elementos.
Los elementos de desarrollo de los Data
Mart siguen las pautas de la arquitectura
Fcil incorporacin de nuevos Data Marts a
la arquitectura (plug and play)

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Bus Matrix
Herramienta para documentar y comunicar la
arquitectura de bus.

Data
marts

U. Nacional Prof. Elizabeth Len BDA Tomado


Modelamiento
de [2]
Bus Matrix
1. Lista de data marts de primer nivel
Derivados de una fuente
Minimizar el riesgo en implementaciones
ambiciosas ( ETL, diseo e implementacin)
Suficientes datos interesantes para los
usuarios, mientras se continua trabajando en
implementaciones ms difciles
1. Identificar data marts consolidados
Con mltiples fuentes
Ms difciles de implementar

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones que cambian
lentamente
La dimensin puede cambiar con el tiempo
(no esttica): cambian atributos
Inaceptable colocar todo en la tabla de
hechos o crear dimensiones dependientes

Si el valor de un atributo cambia en el sistema operacional

Cmo responder a ese cambio en el modelo dimensional?

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones que cambian
lentamente
1. Sobrescribir el valor
12345 NioInte1.0 Software ABC922-Z

Se decide que NioIntwl1.0 debe ser retirado del depto


de software y adicionado al depto de estrategia en
enero 5 del 2006

12345 NioInte1.0 Estrategia ABC922-Z

El atributo siempre refleja el nuevo valor


La historia mostrar que NioInte1.0 siempre ha
pertenecido al depto de estrategia
Es fcil de implementar, pero no mantiene
la historia de los cambios los atributos
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Dimensiones que cambian
lentamente No puede
ser llave
1. Adicionar una fila a la dimensin primaria

12345 NioInte1.0 Educacin ABC922-Z

35896 NioInte1.0 Estratega ABC922-Z

Llave
subordinada
Representa la historia correctamente
En la tabla de hechos, antes de enero 5 del 2006 se
referencia el articulo con llave primaria 1234, despus
de esta fecha el articula tendr la llave 35896
Es poderosa ya que la nueva fila divide
automticamente la historia en la tabla de hechos
Sin embargo no permite asociar el nuevo valor del
atributo con la historia de los hechos y viceversa
U. Nacional Prof. Elizabeth Len BDA Modelamiento
Dimensiones que cambian
lentamente
1. Adicionar una columna a la dimensin
12345 NioInte1.0 Estrategia Educacin ABC922-Z

Modificar
(aplicar 1)

Es apropiado cuando se necesita soportar dos vistas del


mundo al mismo tiempo
Es inapropiado si se desea hacer seguimiento de valores
intermedios de los atributos
Menos usada

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones que cambian
lentamente
Tcnicas Hbridas
Ms flexibles pero ms complejas
Combinan las tcnicas simples
Usarlas si son necesarias para cumplir con los
requerimientos

1. Cambios predecibles con versiones


mltiples sobrepuestas
2. Cambios no predecibles con nica
versin sobrepuesta

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones que cambian
rpidamente
Mensualmente
Separar los atributos que cambian en una
o ms dimensiones separadas
La tabla de hechos tendr dos llaves forneas

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones que cambian
rpidamente - Ejemplo
Compaas de Actualizacin de los
seguros clientes peridicamente!

Tabla de hechos Tabla de hechos


Id_cliente Dimensin cliente
Id_cliente
Id_cliente Id_demog
Nombre
Dimensin cliente
Fecha_nacimiento
Id_cliente
Nombre
Direccin
Dimensin demografa
Fecha_nacimiento
Id_demog
Ingresos Direccin
Educacin Ingresos
Nmero_hijos Educacin
Estado_civil Nmero_hijos
Puntaje-credito Estado_civil
U. Nacional Prof. Elizabeth Len Puntaje-credito
BDA Modelamiento
Dimensiones Junk
Banderas, indicadores, atributos que no
son usados frecuentemente (parecen no
organizados coherentemente!)
No se debe:
Dejarlos en la tabla de hechos
Colocar cada uno en su propia dimensin

Estudiarlos cuidadosamente y colocarlos


en una o ms dimensiones junk

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones Junk
Ejemplo: 10 indicadores Si/No
210 registros
Encuestas con preguntas de si y no.

Una dimensin junk compone un grupo de banderas y


atributos de texto removidos de la tabla de hechos

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Tablas de dimensiones
extendidas
Muchos a muchos Tabla de hechos
Registro Medico

Id_time(FK)
Id_paciente(FK)
Dimensin diagnstico Mltiples diagnsticos
Id_proveedor(FK)
Id_diagnstico(PK) para el mismo
Id_diagnostico(FK)
paciente?

Crear una tabla puente entre la dimensin y la


tabla de hechos Tabla de hechos
Registro Medico

Tabla puente que agrupa


diagnsticos
Id_time(FK)
Dimensin diagnstico Id_paciente(FK)
Id_diagnstico (PK) Id_diagnstico_grupo (PK) Id_proveedor(FK)
Id_diagnstico (PK) Id_diagnostico_grupo(FK)
Peso_diagnstico
Len
U. Nacional Prof. Elizabeth BDA Modelamiento
Tablas de dimensiones
extendidas
Con el tiempo el paciente puede tener varios
grupos de diagnstico Tabla de hechos
Registro Medico

Tabla puente que agrupa Id_time(FK)


diagnsticos
Dimensin diagnstico Id_paciente (FK)
Id_diagnstico (PK) Id_diagnstico_grupo (PK) Id_proveedor (FK)
Id_diagnstico (PK) Id_diagnostico_grupo (FK)
Id_paciente (PK)
Peso_diagnstico
fecha_inicial
fecha_final

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Ejercicio
Cuentas de balance. Una cuenta puede
pertenecer a ms de una persona.
Tabla de hechos Balance mensual de la cuenta

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Dimensiones Role-playing
Una sola dimensin aparece muchas veces
en la tabla de hechos
Tabla de hechos
fecha_orden (FK) Todos los atributos
fecha_de_empaque (FK) son FK a la dimensin
fecha_de_compra (FK) fecha
fecha_de_envio (FK)
fecha_de_pago (FK)
fecha_de_devolucin (FK)

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Construir la matrix
Lista de data marts
Lista de dimensiones
Usar el mtodo de 4 pasos para cada tabla
de hechos (data mart)
Descripcin detallada de los atributos de
las dimensiones
Hoja de datos derivados o calculados
Definiciones de los datos fuente
Mapa de fuente-destino (entrada al ETL)

U. Nacional Prof. Elizabeth Len BDA Modelamiento


Referencias
[1] Wiley - Mastering Data Warehouse Design -
Relational And Dimensional Techniques 2003.
[2] Wiley - Data Analysis -The Data Warehouse
Toolkit - Second Edition.
[3] Wiley - Building The Data Warehouse - Third
Edition
[4] Wiley - The Data Warehouse ETL Toolkit
-2005.
[5] Wiley - The Data Warehouse Lifecycle Toolkit
1998
[6] MicroStrategy - Business Intelligence - 2006

U. Nacional Prof. Elizabeth Len BDA Modelamiento

Anda mungkin juga menyukai