INDICE
Inteligencia de Negocios
OLTP y OLAP
Data Warehouse. Procesos
Diseo de Data Warehouse
Data Mart
Inteligencia de Negocios
Algo peor que no tener
informacin disponible es
tener mucha informacin
El problema
El departamento de sistemas destinan mucho tiempo a la
elaboracin de reportes
No existe una sola versin verdadera de la informacin
No permite la realizacin de comparativos, anlisis ni
tendencias
Gran cantidad de reportes
La solucin
Implementar un Sistema de Informacin Ejecutiva y
Sistemas de Soporte a las Decisiones
Utilizar las mejores tecnologas del mercado
Involucramiento de los dueos de los procesos del negocio
Alineacin a los objetivos estratgicos de la organizacin
Los beneficios
Habilidad de tomar las decisiones correctas en el momento
correcto
Aplicaciones del BI
la organizacin
Plataforma integrada
Herramientas ETL de gestin, administracin y carga, el
almacenamiento de datos y las funciones relacionadas con
informes, servicios
Procedimientos analticos integrados (OLAP)
Minera de datos (Uso de mtodos inteligentes para extraer
conocimiento )
15
16
17
18
19
BI en la Empresa
Fuentes de
datos
Extraccin
Almacn
Herramientas
Usuarios
20
DISEO
ESTRUCTURAL
Lgica
El Diseo Transaccional es:
Orientado a aplicaciones con
movimientos constantes.
Datos normalizados. Se
busca ahorrar espacio de
almacenamiento.
Datos voltiles
No existe sumarizacin de
datos.
Grandes niveles de detalle.
Lgica
El Data Warehouse esta:
Orientado a reas de la
organizacin
Integrado
Los datos no son voltiles
Diversos niveles de detalle
con sumarizacines.
Se disminuye la cantidad de
ligas con modelos tipo
estrella o copo de nieve.
Conceptos Generales
Fundamentos.
Transacciones
Ventas
Inventarios
Contabilidad
Recursos Humanos
Etc-
Registrar y
Controlar (OLTP)
Analizar y
Evaluar (OLAP)
Velocidad de Transaccin
Integridad de Informacin
Evitar Redundancias
3 Forma Normal
Velocidad de Consultas
Apoyo Toma de Decisiones
Desnormalizado
On-Line Transaction
Processing
On-Line Analytical
Processing
www.EasyBI.cl
26
Meses
Cantidad
Productos
Sales
Expenses
Cost of goods
Sales
Expenses
Cost of goods
Sales
Expenses
Cost of goods
Sales
Sales
Expenses
Cost of goods
Sales
Expenses
Cost of goods
January
January
January
February
February
February
March
March
March
Qtr1
April
April
April
May
May
May
25000
15000
5000
27000
20000
6000
2700
8000
19000
54700
23000
6100
1800
7600
1200
2000
Large
Large
Large
Large
Large
Large
Large
Large
Large
Large
Medium
Medium
Medium
Medium
Medium
Medium
Lgica
Variable
Months
Sales
January
Expenses
January
Cost of goods
January
Sales
February
Expenses
February
Cost of goods
February
Sales
March
Expenses
March
Cost of goods
March
Sales
Qtr1
Sales
April
Expenses
April
Cost of goods
VariableApril
Sales
May
Expenses
May
Cost of goods
Sales May
Expenses
Amount
Product
25000
Large
15000
Large
5000
Large
27000
Large
20000
Large
6000
Large
2700
Large
8000
Large
19000
Large
54700
Large
23000
Medium
6100
Medium
1800 February
Medium
January
March
7600
Medium
1200
Medium
2000 27000
Medium
25000
24000
15000
de esta estructura
a esta
se necesita
5000
OLAP
Vista Multidimensional
Poder observar los datos desde distintas perspectivas.
Denver
Accounts by Product
LA
SF
West
February
Actual
Sales
Margin
Camera
TV
VCR
Audio
Camera
TV
VCR
Audio
Apr
Mar
Feb
Jan
Budget
VCR
East
West
South
Total
East
West
South
Total
East
Actual
Budget
position only
VCR
Products by Region
Actual
Margin
Products by Time
March
Actual
TV
Sales
TV
Profit
Total Exp
Margin
Cogs
Jan
Feb
Mar
Qtr 1
Jan
Feb
Mar
Qtr 1
Actual
Apr
Mar
Feb
Jan
Regions by Scenario
Sales
Margin
TV
East
West
Actual
Budget
Forecast
Variance
Actual
Budget
Forecast
Variance
Budget
position only
Budget
Sales
West
Budget
Margin
VCR
TV
VCR
Inteligencia de Negocios
Componentes de Business Intelligence
Todas las soluciones de BI tienen funciones parecidas,
pero deben de reunir al menos los siguientes
componentes:
Multidimensionalidad
Data Mining
Agentes
Data Warehouse
Inteligencia de Negocios
Multidimensionalidad: la informacin multidimensional
se puede encontrar en hojas de clculo, bases de datos,
etc.
Por ejemplo, un pronstico de ventas de un nuevo
producto en varias regiones no est completo si no se
toma en cuenta tambin el comportamiento histrico de
las ventas de cada regin y la forma en que la
introduccin de nuevos productos se ha desarrollado en
cada regin en cuestin.
Anlisis de Datos
Mercado .- Localizacin de una Sucursal o Agencia (Calle,
Colonia, Delegacin o Municipio)
tres niveles de detalle
Tiempo .- Da de Facturacin, Da de Entrega a Sucursales
o Agencias, Da de Entrega al Consumidor
tres niveles de detalle
Producto .- Suministro de Energa Elctrica Monofsica,
Bifsica y Trifsica
tres niveles de detalle
Inteligencia de Negocios
Data Mining.- Las empresas suelen generar grandes
cantidades de informacin sobre sus procesos productivos,
desempeo operacional, mercados y clientes.
Las aplicaciones de data mining pueden identificar tendencias
y comportamientos, no slo para extraer informacin, sino
tambin para descubrir las relaciones en bases de datos que
pueden identificar comportamientos que no muy evidentes.
Inteligencia de Negocios
Agentes: Los agentes son programas que piensan. Ellos
pueden realizar tareas a un nivel muy bsico sin necesidad de
intervencin humana.
Por ejemplo, un agente pueden realizar tares un poco
complejas, como elaborar documentos, establecer diagramas
de flujo, etc.
Inteligencia de Negocios
Data Warehouse: Es la respuesta de la tecnologa de
informacin a la descentralizacin en la toma de decisiones.
Coloca informacin de todas las reas funcionales de la
organizacin en manos de quien toma las decisiones. Tambin
proporciona herramientas para bsqueda y anlisis.
Data Warehouse
Un Data Warehouse es un
almacenamiento separado y
homogneo
donde
son
de
diferentes
Data Warehouse
Coleccin integrada de informacin corporativa diseada para
la recuperacin y el anlisis en apoyo a los procesos de toma
de decisiones.
Una sola visin de la informacin de su empresa.
Mltiples y ambiguas definiciones habran sido eliminadas...
Mecanismo
integrada.
para
entregar
informacin
de
negocios
Data Warehouse
Coleccin de datos integrados, variantes en el tiempo, no
voltiles, orientados a temas de inters para la gestin de una
organizacin o empresa, que ayuda en los procesos de toma
de decisiones.
Es una combinacin de conceptos y tecnologas destinadas a
satisfacer los requerimientos de una organizacin o empresa,
en trminos de mejorar la gestin, con eficiencia y facilidad
de acceso.
40
Conceptos Generales
Caractersticas de un DataWarehouse
Orientado a
Temas
Integrado
Variantes en
el Tiempo
No Voltil
Conceptos Generales
Componentes del Cubo
Tabla de
Hechos
Tabla de
Dimensiones
Conceptos Generales
Topologa
Estrella
Copo de
Nieve
43
46
de
datos
desde
los
sistemas
operacionales
Carga de Datos :
Carga de datos en el DW.
Control de Calidad :
Garantizar que los datos son limpios y consistentes.
47
Auditoria y Seguridad :
Cuidar que los usuarios accedan a la informacin que les
corresponde y registrar un seguimiento del acceso a los datos.
48
49
CONCEPTO
ESENCIAL
Tecnologa
DATAWAREHOUSE
50
Concepto Esencial
Los Hechos :
Un hecho es un dato sensible al tiempo que es funcionalmente
dependiente de las dimensiones que lo definen.
Ejemplo : Una matrcula.
Una matrcula es un hecho en el que un estudiante, en una
determinada fecha, a travs del banco o el departamento de
finanzas, paga la matrcula de una determinada carrera.
Las dimensiones son estudiante, fecha, medio de pago y carrera.
La matrcula es un valor agregado del hecho.
51
Metodologa de Diseo
Tecnologa
DATAWAREHOUSE
52
53
Diseo de Datawarehouse
Etapa I : Anlisis de los sistemas de Informacin
54
Diseo de Datawarehouse
Etapa II : Especificacin de Requerimientos
55
Diseo de Datawarehouse
Etapa III : Diseo Conceptual
56
Diseo de Datawarehouse
Etapa III : Modelo de Hechos Dimensional (MHD)
Un Esquema Dimensional, que es una representacin de la
realidad usando el MHD, consiste en un conjunto de
esquemas de hechos (uno o mas hechos) cuyos elementos
bsicos son hechos, dimensiones y jerarquas.
Las metas del modelo de [Go99] son :
Soportar eficientemente el diseo conceptual
Proveer un ambiente expresivo para formular consultas
Favorecer el refinamiento de los requerimientos
Proveer una plataforma slida para el diseo lgico
Producir documentacin expresiva y no ambigua
57
Diseo de Datawarehouse
58
Diseo de Datawarehouse
Etapa III : Conceptos Claves
Una Instancia de Hecho Primario es una unidad de informacin
presente en el DW.
Una Instancia de Hecho Secundaria corresponde a una
agregacin de una conjunto de hechos primarios.
Una Jerarqua es una relacin de Muchos a Uno que se da entre
los valores de un determinado conjunto de atributos
pertenecientes a una dimensin.
Una Dimensin es un conjunto de atributos pertenecientes a
una entidad asociada a uno o ms hechos. Los atributos
pertenecientes a una dimensin se utilizan como elementos de
agrupacin de los hechos o como mecanismos de bsqueda.
Frecuentemente, los atributos de una dimensin conforman una
jerarqua.
59
Diseo de Datawarehouse
Etapa IV : Refinamiento de Cargas y Validacin de Esquemas
Esta fase esta orientada a:
1. Reformular las cargas de trabajo preliminares por medio de
una reformulacin detallada y profunda de los esquemas
dimensionales.
2. Validar los esquemas desarrollados en las etapas anteriores.
Las consultas correspondientes a las cargas de trabajo pueden
ser correctamente formulada si las dimensiones o medidas han
sido identificadas, jerarquizadas y correctamente formuladas.
60
Diseo de Datawarehouse
Etapa V : Diseo Lgico
La etapa del diseo lgico recibe como entrada un diseo
multidimensional, cargas de trabajo e informacin adicional
(frecuencias de actualizacin, disponibilidad de espacio de
disco, etc.) para producir un esquema de DW que debera
minimizar los tiempos de respuesta a las consultas, respetando
las restricciones de espacio de disco.
61
Diseo de Datawarehouse
Etapa V : Modelo Estrella
Se denomina modelo estrella cuando se define una gran tabla
central con tablas ms pequeas desplegadas en torno a ellas.
62
Diseo de Datawarehouse
Etapa V : Modelo Copo de Nieve (Snowflake)
Cuando la normalizacin no interfiere en el rendimiento de DW
esta se puede aplicar y en este caso se obtienen estructuras que se
denominan snowflake.
63
Datamart
Un
subconjunto
del
Datamart
o Qu es
o Es una parte de un DWH
o De un fin especfico o actividad de negocio
o Una solucin tctica
o Datamarts integrados
o Asegurar la consistencia de datos
o Requiere de una planeacin avanzada
Anlisis y
definicin del
alcance
Creacin de vistas
ejecutivas
Documentacin
Extraccin de
informacin
Mapeo de
datos
Creacin de cubos
multidimensionales
Capacitacin a
usuarios y
sistemas
Transformacin
de informacin
Proceso de
desarrollo
FIN
67