Anda di halaman 1dari 67

Sistemas de Informacin Gerencial

Tema 5: Inteligencia de Negocios y Data Warehouse

Ing. Francisco Rodrguez Novoa

INDICE
Inteligencia de Negocios
OLTP y OLAP
Data Warehouse. Procesos
Diseo de Data Warehouse
Data Mart

Inteligencia de Negocios
Algo peor que no tener
informacin disponible es
tener mucha informacin

Y no saber qu hacer con


ella.

Inteligencia de Negocios Porqu?


Nivel ejecutivo no cuenta con una solucin integrada donde
pueda analizar los indicadores operativos y financieros
No cuentan con una perspectiva que les permita tomar
decisiones
La informacin reside en diferentes sistemas: ERP, CRM,
archivos planos
Cuando surge la necesidad de informacin mucha gente se
ve involucrada

El problema
El departamento de sistemas destinan mucho tiempo a la
elaboracin de reportes
No existe una sola versin verdadera de la informacin
No permite la realizacin de comparativos, anlisis ni
tendencias
Gran cantidad de reportes

La solucin
Implementar un Sistema de Informacin Ejecutiva y
Sistemas de Soporte a las Decisiones
Utilizar las mejores tecnologas del mercado
Involucramiento de los dueos de los procesos del negocio
Alineacin a los objetivos estratgicos de la organizacin

Los beneficios
Habilidad de tomar las decisiones correctas en el momento
correcto

Por medio de las herramientas necesarias para poder


comparar y analizar tendencias
El tiempo invertido en la realizacin de presentaciones
ejecutivas se ve reducido de forma significativa

Aplicaciones del BI

Anlisis de carteras de clientes


Reduccin de costos
Anlisis de riesgo
Planificacin de Marketing
Segmentacin de clientes

Ciclo de Vida de la Informacin

Definicin de inteligencia de negocios


Es el proceso de integracin y tratamiento de los

datos para convertirlos en informacin que


permita apoyar a los tomadores de decisiones en

la organizacin

Definicin de inteligencia de negocios


Es una alternativa tecnolgica que permite generar
conocimiento a la empresa
Es el uso de tecnologas para descubrir conocimiento
a partir de los datos que posee la empresa
Aplica el proceso KDD (Knowledge Discovery
Databases) (Descubrir conocimiento en bases de
datos)

Inteligencia de negocios. Caractersticas


La solucin es un sistema:
Para soporte de toma de decisiones (nivel gerencial)
Con capacidades de anlisis de alcance empresarial
global
Integracin y anlisis de la informacin desde fuentes de
datos heterogneas

Plataforma integrada
Herramientas ETL de gestin, administracin y carga, el
almacenamiento de datos y las funciones relacionadas con
informes, servicios
Procedimientos analticos integrados (OLAP)
Minera de datos (Uso de mtodos inteligentes para extraer
conocimiento )

Inteligencia de negocios. Caractersticas


Servicios de Anlisis

Entorno en tiempo real

Indicadores claves de desempeo


Servicios de Reporte

Creacin, administracin y visualizacin de informes


Motor para alojar y procesar informes

Inteligencia de negocios. Caractersticas


Inteligencia de negocios provee soluciones a nivel
empresarial que permiten a los tomadores de decisiones
transformar informacin clave de su negocio en
acciones concretas traducindose en beneficios
tangibles:
Reduccin de costos
Mayor rentabilidad
Mejores relaciones comerciales

Fases de una solucin de Inteligencia de Negocios

15

ETL Extraction, Transformation and Load


Herramientas de software que permiten:

Extraccin y Transformacin de los datos desde las


fuentes: Bases de datos, ERP, excel, archivos texto,
etc.
Carga de los datos transformados a la bodega

16

Bodega de Datos. Definicin


Es un conjunto de datos integrados o orientados a un
objetivo especfico, que varan con el tiempo (datos
histricos) y que no son transitorios.
Soportan el proceso de toma de decisiones de la
administracin y est orientada al manejo de grandes
volmenes de datos provenientes de diversas fuentes o
diversos tipos

17

Bodega de Datos. Definicin


Una Bodega de Datos es una base de datos que
organiza y almacena una coleccin de informacin
derivada directamente de los sistemas operacionales y
de algunos datos externos

18

Bodega de Datos. Informacin


Se apoyan en tres procesos de organizacin de alto nivel:
Operaciones del negocio: Se refiere a las transacciones
cotidianas diarias del negocio.
La inteligencia de negocio: se refiere a la bsqueda de
una mejor comprensin de la compaa de sus
productos, y sus clientes
La gerencia de negocio: es la funcin en la cual el
conocimiento nuevo y las acciones determinadas en la
inteligencia del negocio se institucionalizan y se
introducen en las operaciones diarias del negocio.

19

BI en la Empresa

Fuentes de
datos

Extraccin

Almacn

Herramientas

Usuarios

20

DISEO
ESTRUCTURAL

OLTP (On Line Transactional Process)


Son sistemas de informacin operacionales que tienen
transacciones en lnea y de esa manera se van aadiendo
datos.
Gran detalle de cada operacin.

Lgica
El Diseo Transaccional es:
Orientado a aplicaciones con
movimientos constantes.
Datos normalizados. Se
busca ahorrar espacio de
almacenamiento.

Datos voltiles
No existe sumarizacin de
datos.
Grandes niveles de detalle.

OLAP (Online Analytical Process)


Tecnologa que permite la
explotacin de datos en
diferentes
niveles
organizacionales
y
periodos de tiempo

Lgica
El Data Warehouse esta:

Orientado a reas de la
organizacin
Integrado
Los datos no son voltiles
Diversos niveles de detalle
con sumarizacines.
Se disminuye la cantidad de
ligas con modelos tipo
estrella o copo de nieve.

Conceptos Generales
Fundamentos.
Transacciones

Ventas
Inventarios
Contabilidad
Recursos Humanos
Etc-

Registrar y
Controlar (OLTP)

Analizar y
Evaluar (OLAP)

Velocidad de Transaccin
Integridad de Informacin
Evitar Redundancias
3 Forma Normal

Velocidad de Consultas
Apoyo Toma de Decisiones
Desnormalizado

On-Line Transaction
Processing

On-Line Analytical
Processing

www.EasyBI.cl

26

Como operan las B.D. Relacionales


Los datos se almacenan en tablas
Variable

Meses

Cantidad

Productos

Sales
Expenses
Cost of goods
Sales
Expenses
Cost of goods
Sales
Expenses
Cost of goods
Sales
Sales
Expenses
Cost of goods
Sales
Expenses
Cost of goods

January
January
January
February
February
February
March
March
March
Qtr1
April
April
April
May
May
May

25000
15000
5000
27000
20000
6000
2700
8000
19000
54700
23000
6100
1800
7600
1200
2000

Large
Large
Large
Large
Large
Large
Large
Large
Large
Large
Medium
Medium
Medium
Medium
Medium
Medium

Lgica
Variable

Months

Sales
January
Expenses
January
Cost of goods
January
Sales
February
Expenses
February
Cost of goods
February
Sales
March
Expenses
March
Cost of goods
March
Sales
Qtr1
Sales
April
Expenses
April
Cost of goods
VariableApril
Sales
May
Expenses
May
Cost of goods
Sales May

Expenses

Amount

Product

25000
Large
15000
Large
5000
Large
27000
Large
20000
Large
6000
Large
2700
Large
8000
Large
19000
Large
54700
Large
23000
Medium
6100
Medium
1800 February
Medium
January
March
7600
Medium
1200
Medium
2000 27000
Medium
25000
24000

15000

Cost of goods 5000

de esta estructura
a esta

se necesita

April May June


28000 30000 29000

20000 15000 17000 19000 14000


6000

5000

7000 7000 6000

OLAP
Vista Multidimensional
Poder observar los datos desde distintas perspectivas.
Denver

Accounts by Product

LA
SF
West

February
Actual

Sales

Margin

Camera
TV
VCR
Audio
Camera
TV
VCR
Audio

Apr
Mar
Feb
Jan

Budget

VCR

East
West
South
Total
East
West
South
Total

East
Actual

Budget

position only
VCR

Products by Region
Actual
Margin

Products by Time

March
Actual

TV

Sales
TV

Profit
Total Exp
Margin
Cogs

Jan
Feb
Mar
Qtr 1
Jan
Feb
Mar
Qtr 1

Actual

Apr
Mar
Feb
Jan

Regions by Scenario
Sales

Margin

TV
East

West

Actual
Budget
Forecast
Variance
Actual
Budget
Forecast
Variance

Budget

position only

Budget
Sales

West
Budget

Margin
VCR

TV

VCR

Inteligencia de Negocios
Componentes de Business Intelligence
Todas las soluciones de BI tienen funciones parecidas,
pero deben de reunir al menos los siguientes
componentes:
Multidimensionalidad

Data Mining
Agentes
Data Warehouse

Inteligencia de Negocios
Multidimensionalidad: la informacin multidimensional
se puede encontrar en hojas de clculo, bases de datos,
etc.
Por ejemplo, un pronstico de ventas de un nuevo
producto en varias regiones no est completo si no se
toma en cuenta tambin el comportamiento histrico de
las ventas de cada regin y la forma en que la
introduccin de nuevos productos se ha desarrollado en
cada regin en cuestin.

Modelado de Datos Multidimensional


Tabla de Dimensiones
Ubicacin
Tiempo
Mercado
Productos
Tablas de Hechos
Definicin de Eventos

Anlisis de Datos
Mercado .- Localizacin de una Sucursal o Agencia (Calle,
Colonia, Delegacin o Municipio)
tres niveles de detalle
Tiempo .- Da de Facturacin, Da de Entrega a Sucursales
o Agencias, Da de Entrega al Consumidor
tres niveles de detalle
Producto .- Suministro de Energa Elctrica Monofsica,
Bifsica y Trifsica
tres niveles de detalle

Modelado de Datos Multidimensional

Inteligencia de Negocios
Data Mining.- Las empresas suelen generar grandes
cantidades de informacin sobre sus procesos productivos,
desempeo operacional, mercados y clientes.
Las aplicaciones de data mining pueden identificar tendencias
y comportamientos, no slo para extraer informacin, sino
tambin para descubrir las relaciones en bases de datos que
pueden identificar comportamientos que no muy evidentes.

Inteligencia de Negocios
Agentes: Los agentes son programas que piensan. Ellos
pueden realizar tareas a un nivel muy bsico sin necesidad de
intervencin humana.
Por ejemplo, un agente pueden realizar tares un poco
complejas, como elaborar documentos, establecer diagramas
de flujo, etc.

Inteligencia de Negocios
Data Warehouse: Es la respuesta de la tecnologa de
informacin a la descentralizacin en la toma de decisiones.
Coloca informacin de todas las reas funcionales de la
organizacin en manos de quien toma las decisiones. Tambin
proporciona herramientas para bsqueda y anlisis.

Data Warehouse

Un Data Warehouse es un
almacenamiento separado y

homogneo

donde

son

cargados datos transformados


provenientes
bases de datos.

de

diferentes

Data Warehouse
Coleccin integrada de informacin corporativa diseada para
la recuperacin y el anlisis en apoyo a los procesos de toma
de decisiones.
Una sola visin de la informacin de su empresa.
Mltiples y ambiguas definiciones habran sido eliminadas...

Mecanismo
integrada.

para

entregar

informacin

de

negocios

Data Warehouse
Coleccin de datos integrados, variantes en el tiempo, no
voltiles, orientados a temas de inters para la gestin de una
organizacin o empresa, que ayuda en los procesos de toma
de decisiones.
Es una combinacin de conceptos y tecnologas destinadas a
satisfacer los requerimientos de una organizacin o empresa,
en trminos de mejorar la gestin, con eficiencia y facilidad
de acceso.

40

Conceptos Generales
Caractersticas de un DataWarehouse
Orientado a
Temas

Los datos se organizan y estructuran de acuerdo a las reas


temticas que son de inters para los directivos de la empresa y
no en funcin de procesos operacionales especficos. Todos los
datos relativos a una misma entidad quedarn en una tabla.

Integrado

Debido a que la informacin procede desde distintos sistemas,


es tarea del DW integrar las diversas fuentes y normalizar los
datos.

Variantes en
el Tiempo

Un DW se organiza como una sucesin de fotografas de la


organizacin o empresa, cada una asociada a un periodo o punto
especfico del tiempo, lo que permite realizar anlisis en funcin
del tiempo, con la finalidad de realizar pronsticos y anlisis de
tendencias.

No Voltil

No se realizan actualizacin o eliminaciones de los datos, los


datos se insertan como nuevos registros y por tanto no
sobrescriben los existentes.
41

Conceptos Generales
Componentes del Cubo

Tabla de
Hechos

Almacena los indicadores del negocio (datos numricos),


tanto bsicos como elementos calculados.

Tabla de
Dimensiones

Almacena los datos descriptivos, por lo general son tablas


con un porcentaje muy bajo de filas en relacin a las tablas
de Hechos, pero pueden contener muchas ms columnas.
Una correcta y completa definicin de campos en la tabla de
dimensiones puede ayudar a realizar anlisis robusto sobre
los datos.

Conceptos Generales
Topologa

Estrella

Las dimensiones se relacionan directamente con la tabla de


hechos.
Por lo general esta estrategia es utilizada cuando hay grandes
volmenes de informacin y/o cuando existe un proceso
robusto de administracin de Informacin (por ejemplo EIAD).

Copo de
Nieve

Las dimensiones se pueden relacionar con las tablas de


hechos, o con otras dimensiones.
Esta estrategia es mejor para la administracin directa en el
modelo de DW.

43

Cmo justificar la inversin en un data


warehouse?
- Estn las ventas de artculos deportivos sujetas a tendencias por
temporada? Qu artculos se ven afectados y cundo?
- Cuntos autos se vendieron el mes pasado? Cmo se compara
esta cantidad con el mismo mes en los ltimos cinco aos?
- Quines son los diez primeros vendedores o clientes en
Latinoamrica? Qu porcentaje del ingreso generan?
- Cules son los diez artculos de menor rentabilidad en el catlogo
de ventas?

Ventajas - Data Warehouse


Datos de toda la compaa, organizados para facilitar las
consultas ms analticas que transaccionales.
Modelo de datos multidimensional para hacer ms fcil la
navegacin y explotacin de datos.
Provee acceso a los datos organizacionales y corporativos.
Integra y asocia informacin de diversas fuentes de datos.
Brinda consistencia de datos y conceptos.
La informacin es de calidad, consistente y garantizada.
Soporta grandes volmenes de informacin.
Puede resumir y totalizar la informacin.

Data Warehouse. Principales Procesos

46

Data Warehouse. Principales Procesos


Extraccin de Informacin :
Extraccin

de

datos

desde

los

sistemas

operacionales

(alimentar procesos de transformacin de datos).

Carga de Datos :
Carga de datos en el DW.

Control de Calidad :
Garantizar que los datos son limpios y consistentes.

47

Data Warehouse. Principales Procesos


Unificacin, Transformacin y limpieza de datos :
Unificacin, validacin y limpieza de tatos que pueden estar en
mas de un sistema.

Auditoria y Seguridad :
Cuidar que los usuarios accedan a la informacin que les
corresponde y registrar un seguimiento del acceso a los datos.

48

Sistema de Data Warehousing

49

CONCEPTO
ESENCIAL
Tecnologa

DATAWAREHOUSE

50

Concepto Esencial
Los Hechos :
Un hecho es un dato sensible al tiempo que es funcionalmente
dependiente de las dimensiones que lo definen.
Ejemplo : Una matrcula.
Una matrcula es un hecho en el que un estudiante, en una
determinada fecha, a travs del banco o el departamento de
finanzas, paga la matrcula de una determinada carrera.
Las dimensiones son estudiante, fecha, medio de pago y carrera.
La matrcula es un valor agregado del hecho.

51

Metodologa de Diseo
Tecnologa
DATAWAREHOUSE

52

Diseo de Data Warehouse

53

Diseo de Datawarehouse
Etapa I : Anlisis de los sistemas de Informacin

- Averiguar con los administradores de sistemas sobre


posibles datos desconocidos o anormales (tratamiento de
los valores nulos).
- Seleccionar las fuentes operacionales en funcin de la
calidad de los datos y estabilidad de sus esquemas
(sincronizacin de vistas).
- Determinar cuales datos pueden ser totalmente integrados
con el objeto de obtener un vista completa del dominio de
la base de datos.

54

Diseo de Datawarehouse
Etapa II : Especificacin de Requerimientos

- Consiste en recolectar y filtrar los requerimientos de los


usuarios. Como resultado se obtiene la definicin de los
hechos e indicaciones concernientes a las cargas de trabajo.
- La seleccin de los hechos se basa en la documentacin de
los sistemas de informacin. Los hechos son conceptos de
inters primario para los procesos de toma de decisiones.
- De la comparacin de los datos preliminares de la etapa
anterior es posible saber que requerimientos pueden ser
satisfechos.

55

Diseo de Datawarehouse
Etapa III : Diseo Conceptual

Suponiendo que los sistemas operacionales son


relacionales, para cada Hecho se deben realizar las
siguientes acciones :
Construir el rbol de atributos
Podar e injertar el rbol de atributos
Definir las Dimensiones

Definir las Medidas


Definir las Jerarquas

56

Diseo de Datawarehouse
Etapa III : Modelo de Hechos Dimensional (MHD)
Un Esquema Dimensional, que es una representacin de la
realidad usando el MHD, consiste en un conjunto de
esquemas de hechos (uno o mas hechos) cuyos elementos
bsicos son hechos, dimensiones y jerarquas.
Las metas del modelo de [Go99] son :
Soportar eficientemente el diseo conceptual
Proveer un ambiente expresivo para formular consultas
Favorecer el refinamiento de los requerimientos
Proveer una plataforma slida para el diseo lgico
Producir documentacin expresiva y no ambigua
57

Diseo de Datawarehouse

58

Diseo de Datawarehouse
Etapa III : Conceptos Claves
Una Instancia de Hecho Primario es una unidad de informacin
presente en el DW.
Una Instancia de Hecho Secundaria corresponde a una
agregacin de una conjunto de hechos primarios.
Una Jerarqua es una relacin de Muchos a Uno que se da entre
los valores de un determinado conjunto de atributos
pertenecientes a una dimensin.
Una Dimensin es un conjunto de atributos pertenecientes a
una entidad asociada a uno o ms hechos. Los atributos
pertenecientes a una dimensin se utilizan como elementos de
agrupacin de los hechos o como mecanismos de bsqueda.
Frecuentemente, los atributos de una dimensin conforman una
jerarqua.
59

Diseo de Datawarehouse
Etapa IV : Refinamiento de Cargas y Validacin de Esquemas
Esta fase esta orientada a:
1. Reformular las cargas de trabajo preliminares por medio de
una reformulacin detallada y profunda de los esquemas
dimensionales.
2. Validar los esquemas desarrollados en las etapas anteriores.
Las consultas correspondientes a las cargas de trabajo pueden
ser correctamente formulada si las dimensiones o medidas han
sido identificadas, jerarquizadas y correctamente formuladas.

60

Diseo de Datawarehouse
Etapa V : Diseo Lgico
La etapa del diseo lgico recibe como entrada un diseo
multidimensional, cargas de trabajo e informacin adicional
(frecuencias de actualizacin, disponibilidad de espacio de
disco, etc.) para producir un esquema de DW que debera
minimizar los tiempos de respuesta a las consultas, respetando
las restricciones de espacio de disco.

Existen distintas alternativas de implementacin tales como :


OLAP, HOLAP, MOLAP o ROLAP.

61

Diseo de Datawarehouse
Etapa V : Modelo Estrella
Se denomina modelo estrella cuando se define una gran tabla
central con tablas ms pequeas desplegadas en torno a ellas.

62

Diseo de Datawarehouse
Etapa V : Modelo Copo de Nieve (Snowflake)
Cuando la normalizacin no interfiere en el rendimiento de DW
esta se puede aplicar y en este caso se obtienen estructuras que se
denominan snowflake.

63

Datamart
Un

subconjunto

del

Data Warehouse para


cierto grupo de usuarios

o funciones del negocio.

Datamart
o Qu es
o Es una parte de un DWH
o De un fin especfico o actividad de negocio
o Una solucin tctica

o Porqu construir un Datamart


o Consultas ms rpidas y menos usuarios
o Tiempo de desarrollo ms rpido

o Datamarts integrados
o Asegurar la consistencia de datos
o Requiere de una planeacin avanzada

Anlisis y
definicin del
alcance

Creacin de vistas
ejecutivas

Documentacin

Extraccin de
informacin

Mapeo de
datos

Creacin de cubos
multidimensionales

Capacitacin a
usuarios y
sistemas

Transformacin
de informacin

Proceso de
desarrollo

FIN

67

Anda mungkin juga menyukai