Flvio Ceci
Crditos
Universidade do Sul de Santa Catarina | Campus UnisulVirtual | Educao Superior a Distncia
Avenida dos Lagos, 41 Cidade Universitria Pedra Branca | Palhoa SC | 88137-900 | Fone/fax: (48) 3279-1242 e 3279-1271 | E-mail: cursovirtual@unisul.br | Site: www.unisul.br/unisulvirtual
Reitor
Ailton Nazareno Soares
Vice-Reitor
Sebastio Salsio Heerdt
Chefe de Gabinete da Reitoria
Willian Corra Mximo
Pr-Reitor de Ensino e
Pr-Reitor de Pesquisa,
Ps-Graduao e Inovao
Mauri Luiz Heerdt
Pr-Reitora de Administrao
Acadmica
Miriam de Ftima Bora Rosa
Pr-Reitor de Desenvolvimento
e Inovao Institucional
Valter Alves Schmitz Neto
Diretora do Campus
Universitrio de Tubaro
Milene Pacheco Kindermann
Diretor do Campus Universitrio
da Grande Florianpolis
Hrcules Nunes de Arajo
Secretria-Geral de Ensino
Solange Antunes de Souza
Diretora do Campus
Universitrio UnisulVirtual
Jucimara Roesler
Equipe UnisulVirtual
Diretor Adjunto
Moacir Heerdt
Assessoria de Assuntos
Internacionais
Murilo Matos Mendona
Assessoria de Inovao e
Qualidade de EAD
Assessoria de Tecnologia
Coordenao Cursos
Coordenadores de UNA
Auxiliares de Coordenao
Coordenadores Graduao
Vice-Coordenadores Graduao
Adriana Santos Ramm
Bernardino Jos da Silva
Catia Melissa Silveira Rodrigues
Horcio Dutra Mello
Jardel Mendes Vieira
Joel Irineu Lohn
Jos Carlos Noronha de Oliveira
Jos Gabriel da Silva
Jos Humberto Dias de Toledo
Luciana Manfroi
Rogrio Santos da Costa
Rosa Beatriz Madruga Pinheiro
Sergio Sell
Tatiana Lee Marques
Valnei Carlos Denardin
Smia Mnica Fortunato (Adjunta)
Coordenadores Ps-Graduao
Gerncia Administrao
Acadmica
Angelita Maral Flores (Gerente)
Fernanda Farias
Gesto Documental
Gerncia Administrativa e
Financeira
Renato Andr Luz (Gerente)
Ana Luise Wehrle
Anderson Zandr Prudncio
Daniel Contessa Lisboa
Naiara Jeremias da Rocha
Rafael Bourdot Back
Thais Helena Bonetti
Valmir Vencio Incio
Elaborao de Projeto
Reconhecimento de Curso
Maria de Ftima Martins
Extenso
Pesquisa
Ps-Graduao
Biblioteca
Capacitao e Assessoria ao
Docente
Tutoria e Suporte
Nordeste)
Gerncia de Desenho e
Desenvolvimento de Materiais
Didticos
Assuntos Jurdicos
Desenho Educacional
Marketing Estratgico
Acessibilidade
Multimdia
Avaliao da aprendizagem
Portal e Comunicao
Gerncia de Produo
Design Visual
Conferncia (e-OLA)
Gerncia de Logstica
Logsitca de Materiais
Avaliaes Presenciais
Gerncia de Marketing
Produo Industrial
Business Intelligence
Livro Digital
Palhoa
UnisulVirtual
2012
Coordenao de Curso
Vera Rejane Niedersberg Schuhmacher
Design Instrucional
Silvana Souza da Cruz Clasen
Joo Marcos de Souza Alves (2 edio rev. e atual).
Diagramao
Daiana Ferreira Cassanego
Reviso
Diane Dal Mago
ISBN
978-85-7817-465-1
005.74
C38
Ceci, Flvio
Business intelligence : livro digital / Flvio Ceci ; design instrucional
Silvana Souza da Cruz Clasen ; Joo Marcos de Souza Alves. Palhoa :
UnisulVirtual, 2012.
176 p. : il. ; 28 cm.
Inclui bibliografia.
ISBN 978-85-7817-465-1
1. Banco de dados. 2. Inteligncia em negcios. 3. Tecnologia da
informao. 4. Sistema de informao gerencial. I. Alves, Joo Marcos de
Souza. II. Ttulo.
Flvio Ceci
Business Intelligence
Livro Digital
Designer instrucional
Joo Marcos de Souza Alves
2 edio revista e atualizada
Palhoa
UnisulVirtual
2012
Sumrio
Sumrio
Apresentao
Palavras do Professor
11
Plano de estudo
15
Unidade 1
O poder da informao e do conhecimento nas organizaes
45
Unidade 2
Colocando inteligncia nos negcios
63
Unidade 3
Data Warehouse
95
Unidade 4
Descobrindo o conhecimento
131
Unidade 5
Processo OLAP
Minicurrculo
169 Referncias
Apresentao
Caro/a estudante,
O livro digital desta disciplina foi organizado didaticamente, de modo a oferecer a
voc, em um nico arquivo pdf, elementos essenciais para o desenvolvimento dos
seus estudos.
Constituem o livro digital:
Palavras do professor (texto de abertura);
Plano de estudo (com ementa, objetivos e contedo programtico
dadisciplina);
Objetivos, Introduo, Sntese e Saiba mais de cada unidade;
Leituras de autoria do professor conteudista;
Atividades de autoaprendizagem e gabaritos;
Enunciados das atividades colaborativas;
Para concluir estudos (texto de encerramento);
Minicurrculo do professor conteudista; e
Referncias.
Lembramos, no entanto, que o livro digital no constitui a totalidade do material
didtico da disciplina. Dessa forma, integram o conjunto de materiais de estudo:
webaulas, objetos multimdia, leituras complementares (selecionadas pelo
professor conteudista) e atividades de avaliao (obrigatrias e complementares),
que voc acessa pelo Espao UnisulVirtual de Aprendizagem.
Tais materiais didticos foram construdos especialmente para este curso, levando
em considerao as necessidades da sua formao e aperfeioamento profissional.
Atenciosamente,
Equipe UnisulVirtual
Palavras do Professor
Plano de estudo
Objetivo geral
As empresas devem tomar decises em todos os nveis organizacionais e em
todas suas reas de atuao. Ter informao precisa e de qualidade pode ser
a diferena entre tomar decises certas ou no. Nesse sentido, a qualidade
da informao um diferencial competitivo nas empresas. Apenas armazenar
dados sobre clientes, fornecedores, vendas, compras e colaboradores, no o
suficiente. Asorganizaes buscam a qualidade dos dados e sua transformao
em informaes que gerem conhecimento dentro da empresa, apoiando o
processo de tomada de deciso. O objetivo da disciplina trazer para o aluno
conhecimento sobre conceitos, arquitetura e componentes dos sistemas de
BI (BusinessInteligence). Os sistemas de BI fornecem uma arquitetura com a
viso do analista de negcios, permitindo s organizaes a transformao e a
extrao dos dados coletados em seus sistemas de informao, em informao e
conhecimento, para auxlio ao processo decisrio das organizaes.
Ementa
Informao e deciso nas organizaes. Dados, informao e conhecimento.
Sistemas de Informao nas organizaes: sistemas transacionais e de apoio
deciso. Arquitetura e componentes de uma soluo de BI-BusinessIntelligence.
Data Warehouse: motivao, conceitos, definio e caractersticas.
ModeloDimensional: fatos, dimenses, medidas e granularidade. Sistemas ETL:
extrao limpeza, transformao e carga de um modelo dimensional. rea de
apresentao: caractersticas das tcnicas analticas (OLAP) como ferramentas de
apresentao e extrao de informao.
Contedo programtico/objetivos
A seguir, as unidades que compem o livro digital desta disciplina e os seus
respectivos objetivos. Estes se referem aos resultados que voc dever alcanar
ao final de uma etapa de estudo. Os objetivos de cada unidade definem o
conjunto de conhecimentos que voc dever possuir para o desenvolvimento de
habilidades e competncias necessrias a este nvel de estudo.
Unidades de estudo: 5
Ps-graduao
Business Intelligence
Unidade 1
O poder da informao e do
conhecimento nas organizaes
Objetivos de Aprendizagem
Compreender o papel da informao e do conhecimento como
facilitadores para a tomada de decises e planejamento em organizaes.
Entender em que mbito a tecnologia contribui no processo de tomada
de decises.
Diferenciar sistemas de informao dentro de um ambiente organizacional.
Introduo
No novidade que as organizaes esto cada vez mais utilizando recursos
computacionais para auxiliar nas suas operaes. Com o uso indiscriminado
dos computadores, gerase, diariamente, uma quantidade enorme de dados
estruturados(em banco de dados), semiestruturados(emails, logs, entre outros)
e no estruturados(texto livre como, por exemplo: relatrios, manuais, artigos,
entre outros).
Esses dados, de maneira isolada, no trazem vantagens para o gerenciamento das
operaes e tomada de deciso, mas servem como matriaprima para a gerao
de informaes. Os sistemas de informao vm com esse propsito, entregar
informaes organizacionais a partir dos dados armazenados.
Os sistemas de informao tradicionais so focados no apoio das operaes de
uma organizao, no trazendo vantagens diretas camada tomadora de deciso,
tendo em vista essas carncias, desenvolveuse um subtipo especfico de sistemas
de informao, chamados de sistemas de apoio deciso.
16
A cada dia mais e mais as pessoas esto produzindo dados de maneira involuntria,
seja efetuando compras, navegando pela internet, escutando msicas online,
fazendo buscas em sites como Google, Yahoo e Bing, participando de redes sociais,
entre outras atividades. Esses dados de maneira bruta no revelam segredos,
apenas apresentam trajetrias e dados provenientes de operaes, mas a partir
do seu processamento podese chegar a valiosas informaes.
Bill Tancer um especialista em anlise de dados do mundo virtual, em seu livro
Click, lanado no Brasil no ano de 2009 pela editora Globo, o autor apresenta sua
trajetria no mundo da anlise de dados virtuais. A partir das consultas feitas em
sites de busca, Tancer demonstra como os dados gerados pelas buscas esto
diretamente relacionados com eventos atuais e como esses dados cruzados de
maneira correta podem apresentar tendncias e indicadores.
Percebese que o processamento do dado bruto gera a informao. Para
Fialhoetal.(2006), dados so representaes simblicas para descries de
atributos de qualquer nvel. Segundo Pinheiro(2008), a camada de dados
responsvel pela existncia dos sistemas transacionais, que tem como funo
apoiar as operaes da organizao. Segundo Ceci(2010), h bastante tempo
as organizaes utilizam seus dados operacionais para gerar informao que os
ajudem na etapa de tomada de deciso. Mas nunca se produziu tantos dados no
ambiente virtual como nos dias de hoje. O surgimento de uma srie de dispositivos
que mantm cada vez mais as pessoas conectadas proporciona uma verdadeira
avalanche de novos dados por segundo.
Tendo esse cenrio como atual, muitas empresas esto utilizando no apenas os
seus dados operacionais(dados provenientes de operaes como, por exemplo,
uma venda ou compra de um determinado produto) e transacionais(dados em
nvel de transao), mas tambm os disponveis na web, como por exemplo,
textos publicados em microblogs, como o twitter, para identificar a opinio de
um grupo sobre um dos seus produtos ou servios. Esses dados disponveis na
web combinados com os internos da organizao geram informaes ainda mais
relevantes e estratgicas para a etapa da tomada de deciso.
Don Tapscott considerado por muitos como gnio das estratgias empresariais
em seu bestseller Wikinomics, lanado em 2006, e escrito em parceria com seu
colega de trabalho Anthony D. Williams, fala sobre como a colaborao pode
auxiliar e muito as organizaes. Nesse livro apresentado um caso em que
uma organizao tinha um problema que no conseguia encontrar uma soluo
Ps-graduao
17
Dados
Indivduos
Processamento
Organizao
Informao
18
Imaginase que todas as notas dos alunos esto armazenadas numa mesma tabela,
no banco de dados, como apresentado abaixo:
Tabela 1 - Tabela de relacionamento entre aluno e disciplina
codAluno
codDisciplina
prova1
prova2
prova3
Media
98413
2009412
10
9,5
9,5
87536
2007324
4,7
96784
2009413
...
...
...
...
...
...
Ps-graduao
19
Informao
Conhecimento
20
Ps-graduao
21
22
Ps-graduao
23
Referncias
CECI, Flvio. Um modelo semiautomtico para a construo e manuteno de ontologias
a partir de bases de documentos no estruturados. 2010. Dissertao(Mestrado em
Engenharia e Gesto do Conhecimento) Universidade Federal de Santa Catarina,
Florianpolis, 2010. Disponvel em: <http://btd.egc.ufsc.br/wpcontent/uploads/2011/04/
Fl%C3%A1vio_Ceci.pdf>. Acesso em: 10 de dez. 2011.
FIALHO, Francisco Antnio Pereira et al. Gesto do conhecimento e aprendizagem: as
estratgias competitivas da sociedade psindustrial. Florianpolis: Visualbooks, 2006.
GHISI, Fernando B.; CECI, Flvio; SELL, Denilson. Aspectos relacionados com a eficcia
do processo de aquisio de conhecimento a partir de apresentao de informaes
numricas: sumrios textuais podem ser mais adequados que representaes grficas?
5CIDI Congresso Internacional de Design da Informao. Florianpolis, 2011.
GOUVEIA, Lus B.; RANITO, Joo. Sistemas de informao de apoio gesto. Porto,
Portugal: Sociedade Portuguesa de Inovao, 2004.
PINHEIRO, Carlos Andr Reis. Inteligncia analtica: minerao de dados e descoberta de
conhecimento. Rio de Janeiro: Cincia Moderna, 2008.
PRIMAK, Fbio Vincius. Decises com B.I. Rio de Janeiro: Editora Cincia Moderna, 2008.
STUDER, Rudi; BENJAMINS, V. Richard; FENSEL, Dieter. Knowledge engineering: principles
and methods. IEEE Transactions on Data and Knowledge Engineering, 1998.
TANCER, Bill. Click: O que milhes de pessoas esto fazendo online e por que isso
importante. Editora Globo S.A. So Paulo, 2009.
TAPSCOTT, Don; WILLIAMS, Anthony D. Wikinomics: Como a colaborao em massa pode
mudar o seu negcio. Editora Nova Fronteira, Rio de Janeiro, 2006.
24
Sistemas de informao
Glucio Adriano Fontana e Flvio Ceci
Ps-graduao
25
Qualidade
Compras Compras
Compras
Tesoureiro
Tesoureiro
Gerenciamento
Qualidade
Recebimento
Remessa
Recepo
Empacotamento
Pessoal
Recebimento
Pessoal Remessa
Marketing
Marketing
Vendas
Vendas
26
Ps-graduao
27
28
Plano de Ao
Fonte: Almeida(1998).
Ps-graduao
29
Gesto de
atividades
Pessoas
Sistema de
informao
Tecnologia
30
Referncias
ALMEIDA, Adiel Teixeira de. Um modelo de deciso para a priorizao no planejamento de
sistemas de informao. Prod., So Paulo, v. 8, n. 2, Dec. 1998. Available from <http://www.
scielo.br/scielo.php?script=sci_arttext&pid=S010365131998000200003&lng=en&nrm=iso>.
Acessado em 15 Dez. 2011
AXELROD, R.; COHEN, M. D. Harnessing Complexity: Organizational Implications of a
Scientific Frontier. Free Press, New York, 1999.
BIO, Srgio Rodrigues. Sistemas de informao: um enfoque gerencial. So Paulo: Atlas, 1996.
CECI, Flavio. O conhecimento nas organizaes como um sistema adaptativo complexo. In:
ROVER, Aires J.; CARVALHO Marisa A..(Org.). O sujeito do conhecimento na sociedade em
rede. 001 ed. Florianpolis: Editora: Fundao Jos Arthur Boiteux, 2010, v. 001, p. 2072010
GORDON, Steven R.; GORDON, Judith. Sistemas de informao: uma abordagem gerencial.
3. ed. Rio de Janeiro: LTC, 2006.
GOUVEIA, Lus B.; RANITO, Joo. Sistemas de informao de apoio gesto. Porto,
Portugal: Sociedade Portuguesa de Inovao, 2004.
LAUDON, Kenneth C.; LAUDON, Jane P. Sistemas de informao gerenciais: administrando
a empresa digital. So Paulo: Prentice Hall, 2001.
MAAS, Antonio Vico. Administrao de sistemas de informao. So Paulo: rica, 1999.
Ps-graduao
31
32
Apoio s
Estratgias para
Vantagem Competitiva
Ps-graduao
33
Apoio s
Operaes
Sistemas de
Apoio s
Operaes
Apoio
Sistema de
Tomada de
Apoio Gerencial Deciso Gerencial
Sistema de
Processamento
de Transaes
Sistemas de
Controle
de Processos
Sistemas de
Colaborativos
Sistemas de
Informao
Gerencial
Sistemas de
Apoio
Deciso
Sistemas de
Informao
Executiva
Processamento
de Transaes
Controle de
Processos
Industriais
Colaborao entre
Equipes e Grupos
de Trabalho
Relatrios
Padronizados
para os Gerentes
Apoio Interativo
Deciso
Informao
Elaborada
Especificamente
para Executivos
34
Ps-graduao
35
36
Referncias
LAUDON, Kenneth C.; LAUDON, Jane P. Sistemas de informao gerenciais: administrando
a empresa digital. So Paulo: Prentice Hall, 2001.
LOH, Stanley. Material das disciplinas de Sistemas de Informao e Data Mining.
Disponvel em: atlas.ucpel.tche.br/~loh/. Acesso em: jul. 2009.
OLIVEIRA, Andr Luis B.; CARREIRA, Marcio Luis; MORETI, Thiago Moura. Aprimorando a
gesto de negcios com a utilizao de tecnologias de informao. Revista de Cincias
Gerenciais. Vol XIII, N 17, 2009.
Ps-graduao
37
38
Desenho
Escolha
Fonte: Cabral, 2001.
Ps-graduao
39
40
Modelos Internos
e Externos
Banco de
Dados
Banco de
Modelos
Gerenciador
de Dados
Gerenciador
de Modelos
Software
SAD
Interface
Usurio
Fonte: Sprague e Watson(1989) apud Heinzle(2010).
Ps-graduao
41
Fonte de
dados
Operacionais
Data
Warehouse
Fonte de
dados
Operacionais
OLAP
Metadados
Metadados
Metadados
Business Intelligence
Fonte: Fourlan; Gonalves Filho, 2005.
42
Referncias
BARBOSA, Gilka Rocha; ALMEIDA, Adiel Teixeira de. Sistemas de apoio deciso sob o
enfoque de profissionais de TI e de decisores. XXII Encontro Nacional de Engenharia de
Produo. Curitiba, 2002.
CABRAL, Pedro da Costa Brito. Sistemas espaciais de apoio deciso O Sistema de
Apoio ao Licenciamento da Direo Regional do Ambiente do Alentejo. Dissertao para
obteno do grau de Mestre em Sistemas de Informao Geogrfica. Universidade Tcnica
de Lisboa. Portugal, 2001.
FOURLAN, Marcos Roberto; GONALVES FILHO, Eduardo V. Uma proposta de aplicao de
Business Intelligence no chodefbrica. Gesto e Produo. V.12, n.1, p. 5566, 2005.
GOUVEIA, Lus B.; RANITO, Joo. Sistemas de informao de apoio gesto. Porto,
Portugal: Sociedade Portuguesa de Inovao, 2004.
HEINZLE, Roberto. Um modelo de engenharia de conhecimento para sistemas de apoio
deciso com recursos para raciocnio abdutivo. Tese para obteno do grau de Doutor
em Engenharia e Gesto do Conhecimento. Universidade Federal de Santa Catarina.
Florianpolis, 2010.
HEINZLE, Roberto; GAUTHIER, Fernando A. Ostuni; FIALHO, Francisco Antonio P.
Semntica nos sistemas de apoio deciso: o estado da arte. Revista da Unifebe, v. 1,
p.Artigo 14, 2010.
LAUDON, Kenneth C.; LAUDON, Jane P. Sistemas de informao gerenciais: administrando
a empresa digital. So Paulo: Prentice Hall, 2001.
Ps-graduao
43
Atividades de Autoaprendizagem
1) Levando em considerao o contedo apresentado nesta unidade, assinale as
alternativas verdadeiras com V e as falsas com F:
a. ( ) As ontologias so estruturas formadas para representao de dados.
b. ( ) O processo de sntese utilizado na transformao da informao para
oconhecimento.
c. ( ) O paradigma de transporte demonstrou, ao longo do tempo, sua
eficincia e utilizado at hoje na Nova Engenharia do Conhecimento.
d. ( ) Os Sistemas de Informao possuem uma classificao muito bem definida.
e. ( ) A arquitetura clssica de um Sistema de Apoio Deciso composta por
trs subsistemas: de dados, de modelo e de interface.
f. ( ) Podese afirmar que Business Intelligence uma evoluo de sistemas de
apoio deciso.
g. ( ) O subsistema de modelo da arquitetura clssica de SAD equivalente ao
Data Warehouse da arquitetura de BI.
h. ( ) Uma organizao pode ser vista como um sistema, desde que ela faa uso
de computadores.
Atividade colaborativa
Nesta unidade, voc estudou uma srie de conceitos relacionados com sistemas
de informao e de apoio deciso. Responda pergunta a seguir utilizando a
ferramenta Frum, no se esquea de comentar as respostas dos seus colegas.
O uso de dados disponveis na Web(como por exemplo, em mdias sociais) pode
auxiliar os sistemas de apoio deciso na entrega de uma informao mais
estratgica para a organizao?
44
Sntese
Nesta unidade foi apresentada uma viso geral entre dado, informao e
conhecimento, quais as suas fronteiras e sua aplicabilidade. Aps isso, foi visto o
que so sistemas de informao, qual a sua utilidade e como se pode classificlos.
Por fim, foi apresentada uma viso geral sobre os sistemas de apoio deciso e
como eles podem agregar valor camada gerencial das organizaes.
Saiba Mais
Artigos muito interessantes que valem a pena serem lidos para complementar o
estudo desta unidade.
HEINZLE, Roberto; GAUTHIER, Fernando A. Ostuni; FIALHO, Francisco Antonio
P. Semntica nos sistemas de apoio deciso: o estado da arte. Revista da
Unifebe, v. 1, p. Artigo 14, 2010. Disponvel em: <http://www.unifebe.edu.br/
revistadaunifebe/2010/artigo014.pdf>.
FOURLAN, Marcos Roberto; GONALVES FILHO, Eduardo V. Uma proposta de
aplicao de Business Intelligence no chodefbrica. Gesto e Produo. V.12, n.1,
p. 5566, 2005. Disponvel em: <http://www.scielo.br/pdf/%0D/gp/v12n1/a06v12n1.pdf>.
Ps-graduao
Unidade 2
Objetivos de Aprendizagem
Assimilar conceitos bsicos de Business Intelligence;
Examinar a arquitetura bsica de um sistema de BI e suas partes;
Identificar o BI em diferentes meios.
Introduo
As organizaes esto inseridas num cenrio que est em constante modificao
e mutao. Teorias baseadas na ideia da complexidade so aplicadas sobre o
modelo organizacional, para terse um melhor entendimento e uma possvel
previso de modificao em curto prazo.
Esse contexto, combinado com a crescente quantidade de dados digitais gerados
de maneira desordenada e distribuda em vrios setores da organizao, gera
uma srie de demandas para o departamento de TI, de modo que seja gerado
ferramental computacional para ajudar a camada gerencial no ganho de agilidade
na tomada de deciso.
As utilizaes de estratgias de BI esto cada vez mais presentes nas organizaes,
como suporte computacional para a camada tomadora de deciso, mas ser que
o BI por si s resolve os problemas citados anteriormente? E qual o futuro do BI,
ser que existem pesquisadores que esto pensando em sua evoluo de modo a
sempre acompanhar as tendncias do mercado? Este captulo tem como objetivo
dissertar sobre essas perguntas.
46
Histrico
O termo Business Intelligence foi patenteado pela empresa Gartner, mas, na
prtica, esse conceito j era aplicado muito antes do invento dos computadores,
pelos povos antigos. A sociedade do Oriente Mdio antigo utilizavase dos
princpios bsicos de BI quando cruzavam informaes obtidas pela natureza
Ps-graduao
47
2002
1996
Baixo
Ao - BI
Relatrios
Baixo
Recursos analticos
Alto
48
Definio
Percebese que as prticas de business intelligence representam uma das
abordagens mais modernas da evoluo dos sistemas de apoio s decises
tradicionais. Mas afinal, o que business intelligence?
Segundo Crtes(2002) apud Sell(2006), business intelligence um conjunto
de conceitos e metodologias que visam a apoiar a tomada de decises nos
negcios, a partir da transformao do dado em informao e da informao
emconhecimento.
Silva(2011, p.32), afirma que business intelligence:
consiste na transformao metdica e consciente dos dados
provenientes de quaisquer fontes de dados(estruturados e no
estruturados) em novas formas de proporcionar informao e
conhecimento dirigidos aos negcios e orientados aos resultados.
Ps-graduao
49
Objetivos
O foco de solues de BI facilitar o entendimento do negcio das organizaes,
fornecendo a todos os nveis das organizaes informaes relevantes sobre
suas operaes internas e o ambiente externo, incluindo clientes e competidores,
parceiros e fornecedores(SELL, 2006). O ambiente externo inclui ainda variveis
independentes que possam impactar no negcio, como tecnologia, leis e
economia mundial, entre outros(BROHMAN et al., 2000 apud SELL 2006).
Segundo Napoli(2011), as tcnicas de BI objetivam definir regras e tcnicas para
a formatao adequada dos dados, tendo em vista a sua transformao em
depsitos estruturados de informaes, no levando em considerao a sua
origem. Para Reginato e Nascimento(2007), BI tem como objetivos transformar
grandes quantidades de dados em informaes de qualidade, para a tomada
de deciso, de modo a possibilitar uma viso sistmica do negcio e auxiliar na
distribuio uniforme dos dados entre os seus usurios.
50
Evoluo
A evoluo das solues de BI est relacionada com a evoluo do papel dos
sistemas de informao nas organizaes. Inicialmente, nos anos 70 e at
meados dos anos 80, solues de processamento e impresso de relatrios em
lote dominavam a cena do processo de apoio deciso. Os usurios tinham,
ento, que trabalhar sobre extensos relatrios para extrair elementos bsicos de
informao. Com a proliferao dos terminais de acesso aos mainframes, o acesso
aos relatrios digitais foi disseminado, mas o acesso informao era dificultado
devido complexidade dos sistemas da poca(SELL, 2006).
A segunda fase dos sistemas de apoio deciso marcada pelo surgimento do
Data Warehouse(DW), repositrios de dados integrados e preparados para o
apoio deciso, que, em conjunto com a evoluo das ferramentas analticas,
ofereceu performance e poder analtico para o nvel ttico e executivo nas
organizaes(INMON, 2002; KIMBALL et al., 1998).
Ps-graduao
51
BI 2.0
52
BI
BI 2.0
Dados estruturados.
Ps-graduao
53
Relatrios
Portais
Clientes
Gerenciador
de Anlises
Mdulos Funcionais
Gerenciador
de Servios
Gerenciador
de Ontologias
Infraestrutura WSS
Reasoner
Ontologia
do Domnio
Ontologia
de Servios
Ontologia
BI
Data Warehouse
Mecanismos
de Inferncia
Repositrios
de Ontologias
Fontes de Dados
Fonte: Sell(2006).
54
Referncias
GORDON, Steven R.; GORDON, Judith. Sistemas de informao: uma abordagem gerencial.
3. ed. Rio de Janeiro: LTC, 2006.
INMON, W. H. Como construir o Data Warehouse. Rio de Janeiro: Campus, 1997. 388 p.
LUNARDI, Riccardo. Panoramic and main features of Business Analytics. Tese(Doutorado)
2011 Universita Degli Studi di Padova, Facolta di Ingegneria. Ingegneria Informatica,
Padova(Itlia), 2011.
KIMBALL, Ralph. Data warehouse toolkit. So Paulo: Makron Books, 1998. 379 p.
NAPOLI, Marcio. Aplicao de ontologias para apoiar operaes analticas sobre fontes
estruturadas e no estruturadas. 2011. Dissertao(Mestrado) Universidade Federal de
Santa Catarina, Programa de PsGraduao em Engenharia e Gesto do Conhecimento,
Florianpolis, 2011.
PINTAS, Juliano T.; SIQUEIRA, Sean W. M. O papel da semntica no Business Intelligence2.0:
Um exemplo no contexto de um programa de psgraduao. VIISimpsio Brasileiro de
Sistemas de Informao. Salvador, 2011.
Ps-graduao
55
PRIMAK, Fbio Vincius. Decises com B.I. Rio de Janeiro: Editora Cincia Moderna, 2008.
RASMUSSEN, Nils; GOLDY, Paul S.; SOLLI, Per O. Financial Business Intelligence Trends,
Technology, Software Selection, and Implementation. John Wiley and Sons, Inc., New
York, 2002.
REGINATO, Luciane; NASCIMENTO, Auster Moreira. Um estudo de caso envolvendo
business intelligence como instrumento de apoio controladoria. Revista Contabilidade
& Finanas. So Paulo, p.6983, 2007.
SASSI, Renato Jose. Data Warehouse e Business Intelligence Operacional: Revistando a
Tecnologia e Analisando as Tendncias do Armazm de Dados. XXX Encontro Nacional de
Engenharia de Produo. ENEGEP 2010. So Carlos, 2010.
SELL, Denilson. Uma arquitetura para business intelligence baseada em tecnologias
semnticas para suporte a aplicaes analticas. 2006. Tese(Doutorado) Universidade
Federal de Santa Catarina, Centro Tecnolgico. Programa de PsGraduao em
Engenharia de Produo, Florianpolis, 2006.
SILVA, Dhiogo Cardoso da. Uma arquitetura de business intelligence para processamento
analtico baseado em tecnologias semnticas e em linguagem natural. 2011.
Dissertao(Mestrado) Universidade Federal de Santa Catarina, Programa de
PsGraduao em Engenharia e Gesto do Conhecimento, Florianpolis, 2011.
XAVIER, Fabrcio S. V.; PEREIRA, Leonardo Bruno R. SQL dos Conceitos s Consultas
Complexas. Editora Cincia Moderna, Rio de Janeiro, 2009.
56
Arquitetura tpica de BI
Flvio Ceci
Muitas das prticas utilizadas no BI j eram utilizadas pelos povos antigos para
auxiliar na sua prtica na agricultura e pecuria. O termo em si ganhou mais
representao quando suportado por ferramental computacional. medida
que novas tendncias surgem, as arquiteturas de BI se moldam para atender os
novos desafios e de modo a utilizar os novos recursos da organizao. possvel
perceber essa linha de evoluo olhando o surgimento do conceito de Semantic
Business Intelligence, junto popularizao e ascenso da rea de Web Semntica,
ou ainda, com o surgimento e a grande utilizao das redes sociais surgem
trabalhos que alguns autores utilizam o termo business intelligence 3.0, como
sendo os que utilizam os dados desse tipo de mdia para auxiliar a anlise e
tomada de deciso nas organizaes. Tambm so utilizadas tcnicas avanadas
de processamento de linguagem natural, alm dos componentes da arquitetura
tpica(clssica) de BI.
Essa leitura est mais focada na aplicao das solues de BI, bem como na sua
arquitetura clssica. Dando continuidade aos nossos estudos, apresentado
abaixo um quadro adaptado por Sell(2006), que exibe as caractersticas de
utilizao das solues de BI:
Quadro 1 - Caractersticas de utilizao das solues de BI
FOCO
AMBIENTE INTERNO
AMBIENTE EXTERNO
Segmentao, preferncias e
comportamentos dos clientes.
Operaes do negcio.
Objetivos
de anlise
Cadeia de suprimentos.
Gesto de relacionamento
com os clientes.
Clientes e fornecedores.
Economia.
Aspectos regulatrios.
Concorrncia:
-- segmentao;
-- lderes.
Perfil de compra.
Objetivos
Utilizao
Eficincia.
Anlise, refinamento
e reengenharia do
desempenho do mercado.
Posicionamento no mercado.
Modelagem e previso do
comportamento do mercado.
Posicionamento no mercado.
Aprendizagem das tendncias de consumo.
Identificao de riscos, tecnologias e regulao.
Ps-graduao
57
58
Fonte: Silva(2011).
Ps-graduao
59
Iniciando um projeto de BI
A implantao de uma soluo de BI em nvel organizacional no uma tarefa
fcil, nem to pouco rpida! necessrio um bom planejamento e reservar uma
boa parcela de tempo para ter sucesso nesse processo. Segundo Primak(2008),
deve ficar claro que apesar desses projetos envolverem o uso de ferramentas e
solues de Tecnologia da Informao(TI), importante entender que BI um
projeto de negcio aplicado para a empresa no contexto geral. O que o autor
quer dizer com a afirmao anterior que o uso de uma soluo de BI no igual
ao uso de um sistema de informao comum, necessrio que a organizao
esteja preparada para utilizar o sistema e saber como chegar s informaes e aos
conhecimentos implcitos.
Para Primak(2008), existem dois tipos de planejamento que devem ser feitos para
a execuo bemsucedida de um projeto de BI, que so:
Planejamento Estratgico Corporativo(PEC): explicitam as oportunidades,
os riscos, os pontos fortes e fracos da organizao. Esse procedimento que
traa as principais metas e as estratgias para alcanlas.
Planejamento Estratgico da Informao(PEI): de responsabilidade
darea de administrao de dados e visa a identificar todos os sistemas
da organizao, suas bases de dados, alm da avaliao da qualidade
dosdados.
Partindo para o desenvolvimento e implantao da soluo de BI, devese,
inicialmente, ter uma viso sistmica da organizao, de modo que sejam
facilmente identificados quais tipos de pergunta desejase responder utilizando
a soluo de BI. Quando essas informaes j tiverem sido levantadas, podese
partir para a modelagem do repositrio nico dos dados e informaes(DW).
Geralmente esses repositrios utilizam para a organizao a modelagem
dimensional, que constituda por tabelas de dimenses(filtros e informaes
que sero cruzadas) e tabelas fato(possuem uma srie de valores j processados
e distribudos pelas dimenses em questo).
Aps a construo do DW, necessrio criar rotinas para carga, para isso se
utilizam ferramentas ETL. Essas ferramentas devem ler os dados armazenados
nas vrias bases operacionais da organizao, processlos(de modo que os
agrupe de modo mais natural para a anlise) e, posteriormente, carreglos nas
tabelas do DW.
Tendo os repositrios de dados e informaes modelados e devidamente
carregados, devese identificar quais tcnicas de anlises(minerao de
dados) podem ser aplicadas para a extrao de informaes implcitas e at
mesmoconhecimento.
60
Referncias
HODGE, P. Business intelligence Architecture. Disponvel em <http://sites.google.com/a/
paulhodge.com/www/architecture>. Acesso em 21 de Janeiro de 2012.
PRIMAK, Fbio Vincius. Decises com B.I. Rio de Janeiro: Editora Cincia Moderna, 2008.
SELL, Denilson. Uma arquitetura para business intelligence baseada em tecnologias
semnticas para suporte a aplicaes analticas. 2006. Tese(Doutorado) Universidade
Federal de Santa Catarina, Centro Tecnolgico. Programa de PsGraduao em
Engenharia de Produo, Florianpolis, 2006.
SILVA, Dhiogo Cardoso da. Uma arquitetura de business intelligence para processamento
analtico baseado em tecnologias semnticas e em linguagem natural. 2011.
Dissertao(Mestrado) Universidade Federal de Santa Catarina, Programa de
PsGraduao em Engenharia e Gesto do Conhecimento, Florianpolis, 2011.
Ps-graduao
61
Atividades de Autoaprendizagem
1) Levando em considerao o contedo apresentado nesta unidade, assinale as
alternativas verdadeiras com V e as falsas com F:
a. ( ) As prticas de BI s foram possveis com o advento dos computadores.
b. ( ) DW nada mais do que um banco de dados que utiliza como modelagem
de dados a abordagem relacional.
c. ( ) ETL o processo de minerao de dados previsto pela arquitetura de BI.
d. ( ) O planejamento estratgico corporativo e da informao so
planejamentos que devem ser feitos para um projeto de BI bem sucedido.
e. ( ) A chamada rea de apresentao onde as informaes so organizadas
ecentralizadas.
f. ( ) A ideia de adicionar recursos semnticos arquitetura de BI anterior aos
chamados BI 2.0 e BI 3.0.
Atividade colaborativa
Nesta unidade, voc estudou uma srie de conceitos relacionados com sistemas
de informao e sistemas de apoio deciso. Responda pergunta a seguir
utilizando a ferramenta Frum, no se esquea de comentar as respostas dos
seuscolegas.
O uso de recursos semnticos permite uma sria de possibilidades para as
anlises de informaes disponveis pelo BI, quais possibilidades so essas?
Comoelas podem auxiliar na anlise das informaes?
Sntese
Nesta unidade, estudado com mais detalhes a arquitetura de BI, qual a sua
origem, seus fatores histricos, quais so os seus principais objetivos, como
se deu a sua evoluo, quais as suas tendncias(BI 2.0, BI 3.0...). Tambm
apresentado como iniciar um projeto de BI e quais so os principais componentes
de uma arquitetura de BI.
62
Saiba Mais
O artigo abaixo foi publicado em 2012 e traz uma viso geral sobre BI e como as
tecnologias semnticas podem dar suporte as suas anlises, vale muito a pena
esta leitura:
SELL, Denilson; SILVA, Dhiogo, C.; GHISI, Fernando B.; NAPOLI, Marcio; TODESCO,
Jos L. Adding Semantics to Business Intelligence: Towards a Smarter Generation
of Analytical Tools. In. Business Intelligence: Solution for Business Development.
InTech, 2012.Disponvel em: <http://www.intechopen.com/articles/show/title/
adding-semantics-to-business-intelligence-towards-a-smarter-generation-ofanalytical-tools>.
Ps-graduao
Unidade 3
Data Warehouse
Objetivos de Aprendizagem
Compreender a construo e o funcionamento dos Data Warehouses,
como suporte ao armazenamento das informaes das organizaes;
Identificar as principais caractersticas de um Data Warehouses;
Entender o que modelagem dimensional.
Introduo
A crescente produo de dados pelos sistemas transacionais da organizao,
de maneira distribuda pelos vrios setores e ferramentas, acaba dificultando a
visualizao e a anlise dos dados pela camada gerencial.
Desse modo, importante a utilizao de repositrios de dados centralizados,
que facilitam o acesso aos dados e permitam que eles possam ser cruzados e
comparados. Alm da disponibilizao dos dados em um repositrio, tambm
necessrio que esses repositrios possuam os dados organizados de maneira mais
natural para a anlise, sendo, assim, mais eficiente.
Esta unidade focada no estudo dos repositrios de dados do tipo Data
Warehouse(DW), sua arquitetura, como ele pode ser desenvolvido, quais as
etapas necessrias para a sua implantao e como feita a integrao e a carga
dos seus dados.
64
Componentes de um DW
Flvio Ceci e Glucio Adriano Fontana
Com o aumento do uso dos sistemas de informaes transacionais, cada vez mais
so armazenados dados em bases no centralizadas. O que funciona bem para o
controle operacional dos setores da organizao apresenta um problema para a
camada gerencial, que atua transversalmente, pois no traz uma viso sistmica
das operaes organizacionais.
Alm de no possuir uma viso integrada das operaes da organizao, esta
abordagem mantm todos os dados operacionais distribudos entre vrios
sistemas, o que dificulta a anlise deles, alm de no possuir uma garantia de que
esto corretos.
Os Data Warehouse(DW) tm como funo atuar neste contexto. Segundo Teorey,
Lightstone e Nadeau(2007), um DW um grande repositrio de dados histricos
da organizao, que podem ser integrados, a fim de apoiar o processo decisrio.
Para Xavier e Pereira(2009), DW uma grande base de dados que organiza e
armazena informaes integradas a partir de bases de dados operacionais.
DW um conjunto de dados orientado por assuntos, no voltil, varivel com o
tempo e integrado, criado para dar suporte deciso. Isto , direcionar a viso
do negcio da empresa, de maneira no modificvel, como nos bancos de dados
transacionais, pois neste nterim dados passados so histricos, variveis no
tempo, sincronizados e integrados, necessrios ao pensamento estratgico e
tomada de decises(CIELO, 2008; INMON, 2001).
Em um exemplo simples e claro: A empresa X possui um cliente chamado Joo,
que solteiro. Joo realizou diversas compras de cerveja e macarro durante dois
anos. Ento, ele se casou, agora, na base de dados(BD), Joo agora casado.
Eele passou a comprar fraldas. Uma anlise nesse BD dos produtos comprados
por um cliente iria nos informar que Joo casado, compra cerveja, macarro,
refrigerante e fraldas. O fato de ele ter mudado seu perfil de compra aps o
casamento no seria registrado pelo banco de dados transacional, logo, seria
informao perdida, que poderia ser muito melhor aproveitada pela organizao.
O DW permite ter uma base de dados integrada e histrica para anlise dos dados,
isso pode e deve se tornar um diferencial competitivo para as empresas. Tendo
uma ferramenta desse porte na mo, o executivo pode decidir com muito mais
eficincia e eficcia. As decises sero embasadas em fatos e no em intuies,
podero ser descobertos novos mercados, novas oportunidades, novos produtos,
podemse criar relaes melhores com clientes, por exemplo, conhecendo hbitos
mais a fundo e com mais detalhes do que se poderia imaginar.
Ps-graduao
65
Cliente
Lucro
Telefonia Pblica
Ano
Data Warehouse
66
Data Warehouse
Acesso
Alterao
Acesso
Acesso
Remoo
Insero
Remoo
Carga
Acesso
Alterao
Carga em massa/
acesso aos dados
Ps-graduao
67
A integrao talvez seja a parte mais importante desse processo, pois ela ser
responsvel por sincronizar os dados de todos os sistemas existentes na empresa
e coloclos no mesmo padro.
Como sabemos, o Warehouse extrai dados de vrios sistemas da empresa e,
emalguns casos, dados externos, como a cotao do dlar. Porm, geralmente
os dados no esto padronizados, devido aos problemas que citamos acima,
enecessrio integrar antes de carregarmos no DW.
Um exemplo clssico o do sexo. Em um sistema, esse dado est guardado no
formato M para masculino e F para feminino, j no outro, o mesmo dado est
guardado como 0 para masculino e 1 para feminino. Isso geraria um grande problema
na hora da anlise, porm, na fase de ETL(Extrao, Transformao e Carga), isso
tudo vira uma coisa s, ou seja, todos os formatos so convertidos em um nico
padro, que decidido com o usurio final e ento carregado no Warehouse.
Data Warehouse
68
A Figura 4 representa como funciona a integrao dos dados das tabelas azul,
vermelha e laranja, ou seja, registros em vrias bases de dados distribudos pelos
sistemas transacionais da organizao. Nesse exemplo vse que a informao
relacionada com o sexo apresentada de trs maneiras completamente
diferentes, no caso da tabela azul, est por extenso, na tabela vermelha utilizado
M para masculino e F para feminino, j no caso da tabela laranja, o sexo masculino
representado pelo nmero inteiro 0 e o feminino pelo 1. A tabela em verde
demonstra a integrao dos dados, essa tabela representa uma dimenso Sexo
que possui um identificador padro, ou seja, em todas as tabelas do DW que tiver
referncia para sexo, ser utilizado um identificador que, nesse caso, M para
masculino e F para feminino.
Viso geral do DW
O uso dos Data Warehouse traz uma srie de benefcios para a tomada de
deciso da camada gerencial da organizao, os autores Teorey, Lightstone
e Nadeau(2007), desenvolveram uma tabela que compara os sistemas
transacionais(OLTP online transaction processing):
Ps-graduao
69
Data Warehouse
Orientado a transao(operao)
Milhares de usurios
Poucos usurios
(normalmente a camada gerencial)
Dados atuais
Dados histricos(fotografias)
Dados normalizados
(muitas tabelas, poucas colunas por tabela)
Dados no normalizados
(poucas tabelas com muitas colunas)
Atualizao contnua
Atualizaes em lote
(processo de carga de tempos em tempos)
Data Warehouse
70
Principais Componentes de um DW
Sabese que os data warehouses so repositrios de dados, mas eles, por si s, no
trazem suporte s etapas de apoio deciso. Para viabilizar um projeto de DW,
fazse necessria a presena de uma srie de componentes. Turban et al(2009)
desenvolveram a seguinte figura para ilustrar esses componentes e suas interaes:
Ps-graduao
71
Legados
Extrair
Transformar
OLTP
Externos
Integrar
Manter
Preparao
Sistemas
operacionais/
dados
Relatrios de
metadados
Data
warehouse
empresarial
Data
Mart
Marketing
Data
Mart
Gesto
de Risco
Data
Mart
A
P
I
S
M
i
d
d
l
e
w
a
r
e
Ferramentas
de produo
de relatrios
Ferramenta
de consulta
relacional
Visualizao
de Informao
OLAP/ROLAP
Navegadores
Web
Minerao
de Dados
Fonte: Turban et al(2009), p. 61.
Data Warehouse
72
Referncias
ANGELONI, Maria Terezinha. Organizaes do conhecimento: infraestrutura, pessoas e
tecnologias. So Paulo: Saraiva, 2008. 363 p.
BONOMO, Peeter. Construo de Data Warehouse(DW) e Data Mart(DM). Artigo online.
Disponvel em <http://imasters.uol.com.br/artigo/11178> Acesso em: julho de 2009.
CIELO, Iv. Data Warehouse como diferencial competitivo. Artigo on line. Disponvel em
<http://www.always.com.br/site2005/internet_clip07.html> Acesso em: julho de 2008.
INMON, W. H.; TERDEMAN, R. H.; IMHOFF, Claudia. Data Warehousing: como transformar
informaes em oportunidades de negcios. So Paulo: Berkeley, 2001. 266 p.
INMON, W. H.. Como construir o Data Warehouse. Rio de Janeiro: Campus, 1997. 388 p.
KIMBALL, Ralph. Data warehouse toolkit. So Paulo: Makron Books, 1998. 379 p.
TEOREY, Toby; LIGHTSTONE, Sam; NADEAU, Tom. Projeto e Modelagem de Bancos de
Dados. Elsevier, Rio de Janeiro, 2007.
TURBAN, Efraim et al. Business Intelligence Um enfoque gerencial para a inteligncia do
negcio. Editora Bookman, Porto Alegre, 2009.
XAVIER, Fabrcio S. V.; PEREIRA, Leonardo Bruno R. SQL dos Conceitos s Consultas
Complexas. Editora Cincia Moderna, Rio de Janeiro, 2009.
Ps-graduao
73
Data Warehouse
74
Arquitetura
As implementaes de Data Warehouse possuem algumas possveis arquiteturas
para a sua implantao. Entendese como arquitetura de um DW, a estrutura fsica
dos componentes, como esto organizados e relacionados. Segundo Dill(2002),
uma arquitetura de DW um conjunto de normas que possibilitam uma viso da
sua estrutura e auxilia no entendimento de como ocorre o fluxo dos dados ao
longo do processo.
Ps-graduao
75
Ferramentas ETL
Data Warehouse
Ferramentas analticas
Data Warehouse
76
Data
Warehouse
Corporativo
Fonte
Fonte
Fonte
Integrao
de Dados
Data
Warehouse
Departamental
Data
Warehouse
Departamental
Transformao de Dados
Usurios
Fonte: Dill(2002), p. 19
Ps-graduao
77
Data Warehouse
Integrador
Extrator
Extrator
BD
BD
Extrator
BD
Prs
Fceis de construir
organizacionalmente;
Fceis de construir
tecnicamente.
Visualizao da
empresa indisponvel
Custos redundantes
com dados;
Contras
Deixar os dados
onde esto
No h necessidade
de ETL;
No h necessidade
de plataforma
separada.
Data marts
dependentes
Facilidade de
customizao de
interfaces de usurios
e relatrios.
Dados centralizados
integrados com
acesso direto
Visualizao da
empresa, consistncia
de projeto e qualidade
dos dados;
Dados podem ser
reutilizados.
Visualizao da
empresa desafiadora;
Custo com dados
redundantes;
Altos custos
operacionais e
com DBA;
Exige liderana e
viso corporativa.
Latncia de dados;
Data Warehouse
78
Integrao de dados
O processo de integrao de dados uma dos mais importantes relacionados com
o ciclo de vida de um data warehouse, ele garante que os dados que alimentaro o
DW sejam de qualidade e representativos para os assuntos escolhidos.
Segundo Turban et al(2009), a integrao de dados possui trs grandes processos:
Acesso aos dados: a capacidade de acesso e extrao de dados de
qualquer fonte;
Federao de dados: integrao das visualizaes de negcios em
diversos data stores;
Captura de alteraes: baseado na identificao, captura e entrega das
alteraes feitas nas fontes de dados da organizao.
No processo de acesso aos dados necessrio, anteriormente, identificar todas as
bases de dados operacionais da organizao que devem ser fontes para o DW. O
prximo passo verificar os recursos tecnolgicos, algumas perguntas podem ser
feitas para auxiliar:
Todas as bases so acessveis pela mesma rede onde ser abrigado o DW?
Se no est na mesma rede, o acesso possvel via requisio HTTP?
O uso de crawler auxiliaria neste processo?
Com o acesso a todas as fontes j mapeadas, necessrio qualificar quais
dadosso relevantes, ou seja, quais consultas devem ser feitas para extrair os
dados desejados.
O prximo processo organizar os dados coletados e verificar em quais
assuntos se encaixam melhor, nesse ponto, so montadas as instrues INSERTs
para o repositrio DW.
O ltimo processo(captura de alteraes) muito importante, pois por meio
dele que so detectadas as atualizaes nos dados organizacionais. Entendese
por alterao como:
alterao() = situao atual situao armazenada.
Ps-graduao
79
Esse processo mais complexo que apenas identificar as alteraes nos dados.
Como j sabido, a modelagem de dados utilizados pelos DWs os organizam
como fotografias de um perodo especfico. Tendo em vista essas caractersticas,
devese verificar todos os novos dados inseridos nas bases operacionais,
no intervalo de tempo escolhido para compor as fotografias. A seguir
apresentado um exemplo:
Imaginase que a unidade mnima de tempo utilizada seja um ms, todos os
dados estariam agrupados por ms e distribudos pelas dimenses. Caso os
gestores da organizao tenham interesse apenas nos dados do ms fechado,
ou seja, do ms com todas as vendas e compras finalizadas, podese configurar o
sistema de integrao de dados para rodar a cada final de ms. Agora imagine se
os gestores dessa organizao querem os dados agrupados por ms, mas no caso
do ms atual desejase verificar as vendas at o momento, neste cenrio o sistema
de integrao de dados deve ser configurado para ter ciclos num intervalo menor
de tempo(por exemplo, a cada hora). Assim, as alteraes que se devem levar
em conta seriam todas as operaes feitas no perodo da primeira hora do ms
corrente, at o momento, inserir esses registros no repositrio.
Segundo Turban et al(2009), faz parte dos objetivos de um data warehouse a
integrao de dados de mltiplos sistemas. Para isso, existem vrias tecnologias
que permitem a integrao de dados e metadados:
Integrao de aplicaes corporativas(EAI): possibilita um meio para
transportar dados dos sistemas de origem para o data warehouse.
Seufoco na integrao das funcionalidades da aplicao, o que permite
a reutilizao da aplicao e flexibilidade;
Integrao de informaes corporativa(EII): promete a entrega da
informao em tempo real, a partir de diversas fontes relacionais, web
services e fontes dimensionais. Extrai dados dos sistemas fontes para
atender ao pedido da informao;
Extrao, transformao e carga(ETL): este processo apresentado
com mais detalhes a seguir.
O processo de ETL responsvel pela carga das tabelas do DW. A Figura 5, aseguir,
elaborada por Turban et al(2009), ilustra este processo:
Data Warehouse
80
Aplicao
pronta
Sistema
legado
Data
warehouse
Extrair
Transformar
Outras
aplicaes
internas
Limpar
Carregar
Data mart
Ps-graduao
81
Referncias
DILL, Srgio Luis. Uma metodologia para desenvolvimento de Data Warehouse e
Estudo de Caso. Dissertao submetida para obteno do grau de Mestre em Cincia da
Computao. Universidade Federal de Santa Catarina, Florianpolis, 2002.
KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling. Wiley, 2002.
NAPOLI, Marcio. Aplicao de Ontologias para apoiar operaes analticas sobre fontes
estruturadas e no estruturadas. 2011. Dissertao(Mestrado) Universidade Federal de
Santa Catarina, Programa de PsGraduao em Engenharia e Gesto do Conhecimento,
Florianpolis, 2011.
OLIVEIRA, Wilson J. Data Warehouse. Visual Books, Florianopolis, 2002.
TEOREY, Toby; LIGHTSTONE, Sam; NADEAU, Tom. Projeto e Modelagem de Bancos de
Dados. Elsevier, Rio de Janeiro, 2007.
TURBAN, Efraim et al. Business Intelligence Um enfoque gerencial para a inteligncia do
negcio. Editora Bookman, Porto Alegre, 2009.
Data Warehouse
82
Modelagem Dimensional
Flvio Ceci
Ps-graduao
83
Data Warehouse
84
Escopo
FATOS
DIMENSES
MEDIDAS
Representam um item,
uma transao ou um
evento de negcio.
Determinam o contexto
de um assunto de
negcios, como por
exemplo, uma anlise
da produtividade dos
grupos de pesquisa.
So os atributos
numricos que
representam um fato
e so determinados
pela combinao
das dimenses que
participaram desse fato.
Objetivo
Refletem a evoluo
dos negcios.
So os balizadores de
anlise de dados.
Representam o
desempenho de
um indicador de
negcios relativo
s dimenses que
participam de um fato.
Tipo de dado
So representados por
conjuntos de valores
numricos(medidas)
que variam ao
longo do tempo.
Normalmente no
possuem atributos
numricos, pois so
somente descritivas
e classificatrias
dos elementos que
participam de um fato.
Podem possuir
uma hierarquia de
composio de seu valor.
Ps-graduao
85
Produto
40
253
10
541
36
103
698
457
66
269
399
620
87
30
20
10
Loja
Data Warehouse
86
Como base de dados para a carga do DW, existe um sistema transacional que
gerencia as operaes dirias dessa biblioteca. A Figura 3 apresenta a modelagem
relacional da base de dados utilizados por esse sistema:
Figura 3 Modelo relacional da biblioteca universitria
O modelo apresentado acima serve como base para a carga do DW, o sistema
transacional que o utiliza gerencia as operaes dirias da biblioteca, como
porexemplo:
Gerenciamento de usurios;
Gerenciamento do acervo;
Controle das multas referente a atrasos na devoluo de livros.
Aps o entendimento do cenrio base, foi levantado, junto aos gestores da
biblioteca, quais necessidades eles possuem e quais perguntas eles gostariam
deobter respostas por meio da implantao do DW.
O que foi identificado junto aos gestores que se deseja ganhar agilidade
na compra dos livros, para isso necessrio identificar quais ttulos so mais
solicitados, para a compra de mais exemplares. Alm desse ponto, desejase
Ps-graduao
87
Data Warehouse
88
Ps-graduao
89
Inmon
Kimball
Metodologia e
arquitetura
Abordagem geral
DW para toda a
empresa(atmico) alimenta os
bancos de dados departamentais
Complexidade
do mtodo
Bastante complexo
Bastante simples
Comparao com
metodologias
consagradas de
desenvolvimento
Discusso do
projeto fsico
Bastante detalhada
Bastante leve
Modelagem de dados
Acessibilidade ao
usurio final
Baixa
Alta
Objetivo
Data Warehouse
90
Alguns autores afirmam que possvel trabalhar com uma abordagem mista,
que utiliza vantagens especficas de cada modelo para o seu cenrio em
questo(DILL, 2002).
Evoluo do DW
A ideia do uso dos repositrios do tipo DW est cada vez mais presente nas
organizaes, por conta dessa demanda, comum novos trabalhos sobre esse
tema, o que muito bom, pois faz com que essa abordagem acompanhe a
evoluo dos cenrios que as emprega.
No livro de Inmon, Strauss e Neusjloss(2007), foi cunhado o termo DW 2.0, que
trata da chamada segunda gerao dos data warehouse. Nessa nova abordagem,
oDW no se preocupa apenas em integrar dados de vrias bases operacionais, mas
tambm integrar dados estruturados com dados no estruturados(texto livre).
O trabalho de Silva(2011, p. 36) apresenta mais detalhes sobre os DW 2.0:
a segunda gerao do DW apresenta distintos setores conforme a
necessidade de acesso e a temporalidade da informao. Esses setores so:
Interactive, Integrated, Near line e Archival. Outra mudana importante que
os metadados, tanto tcnicos quanto de negcio, precisam de um ambiente
comum e uma estrutura local para cada componente das plataformas de BI.
Referncias
CAMPOS, R. A. Qualidade de dados em Data Warehouse. TCC(Graduao em Bacharelado
em Sistemas de Informao). Centro de Ensino Superior de Juiz de Fora, Juiz de Fora, 2005.
INMON, W.; STRAUSS, D.; NEUSHLOSS, G. DW 2.0 The Architecture for the Next
Generation of Data Warehousing. 2007.
KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling. Wiley, 2002.
Ps-graduao
91
NAPOLI, Marcio. Aplicao de Ontologias para apoiar operaes analticas sobre fontes
estruturadas e no estruturadas. 2011. Dissertao(Mestrado) Universidade Federal de
Santa Catarina, Programa de PsGraduao em Engenharia e Gesto do Conhecimento,
Florianpolis, 2011.
OLIVEIRA, Wilson J. Data Warehouse. Visual Books, Florianopolis, 2002.
SELL, Denilson. Uma arquitetura para business intelligence baseada em tecnologias
semnticas para suporte a aplicaes analticas. 2006. Tese(Doutorado) Universidade
Federal de Santa Catarina, Centro Tecnolgico. Programa de PsGraduao em
Engenharia de Produo, Florianpolis, 2006.
SILVA, Dhiogo Cardoso da. Uma arquitetura de business intelligence para processamento
analtico baseado em tecnologias semnticas e em linguagem natural. 2011.
Dissertao(Mestrado) Universidade Federal de Santa Catarina, Programa de
PsGraduao em Engenharia e Gesto do Conhecimento, Florianpolis, 2011.
TURBAN, Efraim et al. Business Intelligence Um enfoque gerencial para a inteligncia do
negcio. Editora Bookman, Porto Alegre, 2009.
Data Warehouse
92
Atividades de Autoaprendizagem
1) Levando em considerao o contedo apresentado nesta unidade, assinale as
alternativas verdadeiras com V e as falsas com F:
a. ( ) A utilizao dos repositrios do tipo DW esto cada vez mais presentes nas
empresas.
b. ( ) O processo de integrao dos dados algo bastante simples e rpido
deconceber.
c. ( ) Os dados nas tabelas fato so agrupados e consolidados de modo a facilitar
o consumo da informao.
d. ( ) Podese fazer uma analogia das dimenses de um DW com filtros a serem
aplicados numa consulta.
e. ( ) As abordagens de DW esto em constante evoluo, a prova disso a
concepo do chamado DW 2.0.
f. ( ) As medidas de um DW uma nomenclatura equivalente a tabelas fato.
Atividade colaborativa
Nesta unidade, voc estudou uma srie de conceitos relacionados com sistemas
de informao e sistemas de apoio deciso. Responda pergunta a seguir
utilizando a ferramenta Frum, no se esquea de comentar as respostas dos
seuscolegas.
Nesta unidade, foi estudado sobre os repositrios data warehouse, tambm foi
visto que Inmon, considerado como um dos pais dessa abordagemj trabalha
com o conceito do DW2.0. Sendo assim, faa um paralelo dessa evoluo com a
evoluo do BI, BI 2.0 e BI 3.0.
Ps-graduao
93
Sntese
Nesta unidade, so estudados os componentes de um DW, bem como qual o
seu ciclo de vida de desenvolvimento, qual a sua importncia para a tomada de
deciso, sua arquitetura bsica, como se d a integrao e carga dos seus dados,
quais as suas possveis abordagens e construes.
Saiba Mais
Bill Inmon apresenta um artigo para o site Information Management, falando
sobre as novas tendncias dos Data Warehouse e mais detalhes sobre DW2.0;
uma leitura bastante interessante, vale a pena:
http://www.informationmanagement.com/issues/20060401/10511111.html
Data Warehouse
Unidade 4
Descobrindo o conhecimento
Objetivos de Aprendizagem
Compreender as fases do processo de descoberta de conhecimento
emvolume de dados.
Conhecer tcnicas de minerao existentes e aplicveis em um sistema
de Business Intelligence.
Julgar o uso de cada tcnica levando em considerao o contexto
doproblema.
Introduo
O conhecimento junto aos ativos intangveis das organizaes est cada vez
mais ganhando espao como um dos bens mais valiosos para as chamadas
organizaes do conhecimento. Os sistemas de apoio deciso surgiram como
resposta falta de sistemas focados em auxiliar a camada gerencial.
Com a evoluo desses sistemas nascem as solues de Business Intelligence, que
possuem repositrio de dados unificados, prprocessados e com uma organizao
focada para facilitar a anlise dos seus dados. Para conseguir chegar ao
conhecimento que est implcito nesses dados e nos repositrios de documentos,
devemse utilizar solues baseadas em descoberta de conhecimento.
Esta unidade est focada nas estratgias de descoberta de conhecimento,
utilizando como fonte bancos de dados ou textos no estruturados, que sejam
relevantes para o domnio da organizao.
96
Ps-graduao
97
KDT
KDD
Banco de
Dados
Documentos
no estruturados
Fonte: Elaborao do autor(2012).
Descobrindo o conhecimento
98
KDD
Data Mining
Fonte: Carvalho(2002).
Visualizao
Estatstica
Descoberta de
Conhecimento
Processamento de
Linguagem natural
Ps-graduao
99
Referncias
ADRIAANS, P.; ZANTINGE, D. Data mining. Addison Wesley Longman, England, 1996.
CARVALHO, D. R. Um mtodo hbrido rvore de deciso / algoritmo gentico para data
mining, Tese Doutorado PUCPR, Curitiba, 2002.
CARVALHO, Lus Alfredo V. Data Mining: A Minerao de Dados no Marketing, Medicina,
Economia, Engenharia e Administrao. Editora Cincia Moderna. Rio de Janeiro, 2005.
GARCIA, Ana Cristina B.; VAREJO, Flvio M.; FERRAZ, Inhama N. Aquisio de
Conhecimento. In Sistemas Inteligentes: Fundamentos e Aplicaes. Organizao:
REZENDE, Solange O. Editora Manole, So Paulo, 2005.
REZENDE, Solange. Sistemas Inteligentes; Fundamentos e aplicaes. So Paulo:
Ed.Manole, 2005.
Descobrindo o conhecimento
100
O processo de KDD
Flvio Ceci e Glucio Adriano Fontana
Ps-graduao
101
Descobrindo o conhecimento
102
Ps-graduao
103
Descobrindo o conhecimento
104
Dados
Integrao
Pr Processamento
Ps Processamento
Conhecimento
Fonte: Romo(2002).
Ps-graduao
105
Descobrindo o conhecimento
106
Referncias
DIAS, Cristiano Araujo. Descoberta de Conhecimento em Banco de Dados para Apoio
Tomada de Deciso. Especializao em Informtica Empresarial. Unesp. Guaratinguet, 2002.
NAVEGA, Sergio. Princpios do DataMining. Cenadem 2002, Anais do Infoimagem, 2002.
Disponvel em: <http://www.intelliwise.com/reports/i2002.htm>. Acesso em: maro de 2012.
OLIVEIRA, Robson Butaca Taborelli de. O Processo de Extrao de Conhecimento de
Base de Dados Apoiado por Agentes de Software.(Dissertao) Cincia da Computao.
Universidade de So Paulo. So Carlos, 2000.
ROMO, Wesley. Descoberta de Conhecimento Relevante em Banco de Dados sobre
Cincia e Tecnologia.(Tese) Programa de PsGraduao em Engenharia de Produo.
Universidade Federal de Santa Catarina. Florianpolis, 2002.
Ps-graduao
107
Descobrindo o conhecimento
108
Base de
Dados Bruta
Visualiza
2 Etapa de Seleo
dos Dados
Limpa
1 Etapa
Problema que ser
objeto de estudo
Base de Dados
de Trabalho
3 Etapa de
Preparao dos Dados
Data Mining
Anlise dos
resultados
Assimilao do
Conhecimento
4 Etapa de
Anlise dos dados
Ps-graduao
109
Descobrindo o conhecimento
110
Ps-graduao
111
Descobrindo o conhecimento
112
N de registros com X e Y
N de registros com X
Gaze
Esparadrapo
Mercrio
10
Fonte: Carvalho(2000).
0,88
{Esparadrapo}=Gaze
0,88
{Gaze}=Mercrio
0,77
{Mercrio}=Gaze
0,87
{Esparadrapo}=Mercrio
0,77
{Mercrio}= Esparadrapo
0,87
{Gaze, Esparadrapo}=Mercrio
0,75
0,85
{Esparadrapo, Mercrio}=Gaze
0,85
Fonte: Carvalho(2000).
Ps-graduao
Fator de confiana
113
Quem leva mercrio tambm leva gaze? Vale comentar aqui que essa relao nem
sempre comutativa. Veja as linhas 3 e 4 da tabela. Ela contm valores diferentes
e regras invlidas e vlidas, respectivamente, simplesmente modificando a ordem
dos produtos, como precedente e consequente. Como voc pode notar, podese
confiar que quem leva mercrio, leva gaze(87% dos clientes), mas est abaixo do
limiar afirmar que quem leva gaze, leva mercrio. O precedente normalmente ser
o carrochefe das vendas, ele chamar o cliente para dentro do estabelecimento e
o far consumir mais.
( pi
i=1
qi )
Descobrindo o conhecimento
114
Renda
0,00
27
3.000,00
42
5.000,00
29
3.500,00
18
500,00
22
1.000,00
31
3.200,00
39
4.600,00
20
800,00
10
0,00
0,00
46
4.500,00
40
1.500,00
42
1.000,00
39
1.200,00
Fonte: Arago(2008)
Para usar esses clusters como classes, precisamos antes identificlos e nomelos
adequadamente. Por exemplo:
C1: Crianas. Nesses clusters temos apenas crianas, que no podem trabalhar,
portanto, sua renda nula.
C2: Jovens Iniciando a Carreira. Nesses clusters temos pessoas com idade
prxima mnima para poder trabalhar. Mas, como provavelmente no possuem
formao superior nem experincia, tm uma renda relativamente baixa.
C3: Profissionais com Curso Superior. Nesses clusters temos pessoas que
j tmexperincia e pelo patamar salarial provavelmente tambm possuem
formao superior.
C4: Altos Executivos. Nesses clusters temos pessoas de certa idade que, para
ter uma renda to alta em tal faixa etria, provavelmente fazem parte de alto
escalo gerencial.
C5: Profissionais sem Curso Superior. Nesses clusters temos pessoas de
certa idade que, por terem uma renda relativamente baixa, provavelmente no
possuem curso superior.
Ps-graduao
115
C4
Renda
5.000
4.000
C3
3.000
2.000
C2
1.000
C5
C1
0
0
10
20
30
40
50
Idade
Fonte: Arago(2008).
Concluso
O uso das tcnicas de minerao de dados para apoiar o processo de tomada de
deciso pela camada gerencial, possibilitaa descoberta de conhecimento a partir
dos seus repositrios de dados.
Essa descoberta de conhecimento se d a partir da aplicao de tcnicas baseadas
em estatsticas e na inteligncia artificial para encontrar padres e informaes
implcitas nos dados armazenados nos repositrios das organizaes.
A minerao de dados utilizada hoje em vrios segmentos de mercado, como
por exemplo: rea mdica, geologia, economia, marketing, administrao,
engenharias, entre outras reas.
Descobrindo o conhecimento
116
Referncias
AGRAWAL, R.; SRIKANT, R. Mining Sequential Patterns. Proceedings of Eleventh
International Conf on Data Engineering. 1995.
ARAGO, Pedro O. Um estudo sobre conceitos e tcnicas de minerao de dados. 2008.
Monografia(Graduao em Tecnologia)Faculdade de Tecnologia de So Paulo, So Paulo,
2008.
BERGER, Gideon et al. Discovering Unexpected Patterns in Temporal Data using Temporal
Logic; Temporal Databases Research and Practice. Heidelberg: Ed SpringerVerlag, 1998.
CARVALHO, Lus Alfredo V. Data Mining: A Minerao de Dados no Marketing, Medicina,
Economia, Engenharia e Administrao. Editora Cincia Moderna. Rio de Janeiro, 2005.
CARVALHO, Juliano et al. Utilizao de tcnicas de datamining para reconhecimento de
caracteres manuscritos. Universidade Federal da Paraba, 2000.
FAYYAD, Usama M; PIATESTSKYSHAPIRO, Gregory; SMYTH, Padhraic; UTHURUSAMY,
Ramasamy.Advance. Knowledge Discovery and Data Mining. 1996.
LOH, Stanley. Material das disciplinas de Sistemas de Informao e Data Mining.
Disponvel em: atlas.ucpel.tche.br/~loh/. Acesso em: jul. 2009.
MARTINHAGO, Srgio. Descoberta de Conhecimento sobre o Processo Seletivo da
UFPR.(Dissertao) Mestrado em Mtodos Numricos em Engenharia. Universidade
Federal do Paran, Curitiba, 2005.
NAVEGA, Sergio. Princpios do DataMining. Cenadem 2002, Anais do Infoimagem, 2002.
QUONIAM, Luc; et al. Inteligncia obtida pela aplicao de data mining em base de teses
francesas sobre o Brasil. Cincia da Informao, v. 30, n.2, p, 2028. Braslia, 2001.
REZENDE, Solange. Sistemas Inteligentes Fundamentos e aplicaes. So Paulo: Ed.
Manole, 2003.
WITTEN, Ian H.; FRANK, Eibe. Data Mining Practical Machine Learning Tools and
Techniques with Java Implementations. Morgan Kaufmann Publishers. 2000.
Ps-graduao
117
O processo KDT
Flvio Ceci
Conhecimento
Seleo
Base de
Dados
Data set
Dado
Dado
Transformado
Pr-processado
Padres
Fonte: Gonalves(2006).
Descobrindo o conhecimento
118
Pr-processamento
Conhecimento
Padres
Texto
Data set
Dado
Pr-processado
Fonte: Gonalves(2006).
Ps-graduao
119
Algoritmos
Aplicaes
Associao
Anlise de mercado.
Classificao
Controle de qualidade,
avaliao de riscos.
Agrupamento
Segmentao de mercado.
Modelagem
Regresso linear e no
linear, redes neurais.
Previso de sries
temporais
Previso de vendas,
controle de inventrio.
Padres sequenciais
Anlise de mercado
sobre o tempo.
Fonte: Gonalves(2006).
Descobrindo o conhecimento
120
Indexao
O processo de indexao fundamental para a minerao de texto, pois organiza
os dados presentes no texto de uma forma que seja facilmente recuperado. Por
conta disso, a indexao uma das tarefas mais importantes para a recuperao
de informao(CECI, 2010).
Segundo Ebecken, Lopes e Costa(2003), a indexao tem como funo permitir
que se efetue uma busca em texto sem a necessidade de varrer o documento
inteiro, similarmente ao que acontece com o processo homnimo utilizado
convencionalmente em bancos de dados. Os autores classificam a indexao em
quatro tipos distintos, a saber:
indexao de texto completo;
indexao temtica;
indexao semntica latente;
indexao por tags.
A indexao para Wives(2002) consiste na identificao de caractersticas
para um dado documento, o que proporciona a construo de uma estrutura
chamada ndice. O objetivo do ndice selecionar os documentos de maior
relevncia, filtrandoos entre os irrelevantes. Essa estruturao descrita aqui
pode ser realizada de forma manual normalmente utilizada pela rea de
biblioteconomiaou por um processo automatizado, relacionado com a rea de
computao, qual esse trabalho est intrinsecamente ligado.
Segundo Igarashi(2005), o ndice possui uma estrutura composta dos seguintes
termos:
DocCnt: identifica em quantos documentos o termo est contido;
FreqCnt: identifica a frequncia total do termo em relao a todos
osdocumentos;
Freq: nmero de vezes em que o termo se encontra no documento;
Posio termo: identifica a posio do termo no documento.
Ps-graduao
121
Uma das tcnicas mais utilizadas a baseada em ndice invertido, de acordo com
BaezaYates e RibeiroNeto(1999 apud AIRES, 2005). A Tcnica de Arquivo(ou
ndice) Invertido trabalha com uma lista de palavraschave ordenadas, onde cada
palavra est ligada ao documento que a possui. Esse documento associado
a uma lista invertida de palavraschave, que passa a ser ordenada por ordem
alfabtica. Essas palavraschave possuem um peso. Aps o processamento, alista
fica dividida em dois arquivos, um de vocabulrio e outro de endereamento.
AFigura 3 apresenta um exemplo de um ndice invertido:
Figura 3 - Exemplo de ndice invertido
Apontadores
Dicionrio
Term
Doc #
Freq
Term
N docs
Tot freq
Doc #
Freq
aid
aid
all
all
and
come
the
their
Prprocessamento
Esta etapa no possui um nico algoritmo ou tcnica disponvel, na verdade,
existem algumas operaes que podem ser feitas dependendo diretamente do
contexto e da anlise pretendida.
Quando a semntica no importante, ou seja, no ser feita nenhuma
anlise baseada em processamento de linguagem natural, como por exemplo,
umaaplicao focada em busca completa a documentos textuais(recuperao de
informao), utilizase:
Descobrindo o conhecimento
122
Minerao de texto
Como j foi afirmado anteriormente, as tcnicas de minerao de texto so
baseadas em mtodos estatsticos e algoritmos da rea de inteligncia artificial.
Nessa etapa, que de fato descoberto novos conceitos e relacionamentos.
Podese reparar que no existe uma nica forma para trabalhar com minerao
de dados e texto, esse tipo de soluo diretamente dependente do contexto do
problema que se deseja resolver, ou do tipo de informao que pretende extrair.
Ps-graduao
123
Para exemplificar uma situao vamos imaginar que uma organizao pretende
desenvolver um mapa de conhecimento baseado nos principais termos que a
representam, para isso podese obter tais termos a partir da frequncia que eles
ocorrem nos documentos relevantes para o contexto organizacional. Alguns
problemas que so encontrados inicialmente.
Problema 1: quantidade de documentos para serem analisados. Como j foi
apresentado, o processo de indexao minimiza esse problema, mantendo todo o
contedo dos documentos estruturados, de modo que seja fcil recuperar tanto
os documentos quanto a anlise do seu contedo.
Problema 2: identificao do limite(fronteiras) das palavras. Ou seja, como
identificar uma palavra composta, por exemplo, comUnisul Virtual, no meio de
um texto que nada mais que um conjunto de palavras?
Para resolver esse problema, podese utilizar uma tcnica chamada de
Reconhecimento de Entidades Nomeadas(NER Named Entity Recognition).
Essatcnica tem como objetivo encontrar as fronteiras de um termo no texto
e se disponvel uma base de conhecimento, tambm classificar este termo, como
por exemplo, podese reconhecer o termo Unisul Virtual e apresentlo como
uma organizao.
Problema 3: como relacionar os termos encontrados para formar o mapa? Paraisso
podese utilizar a tcnica apresentada anteriormente, ou seja, o clculo de
coocorrncia, que ir pegar os termos reconhecidos pela tcnica de NER, voltar
no ndice gerado e identificar as relaes dos termos.
importante destacar que as tcnicas utilizadas podem compor etapas
diferentes em situaes diferentes, como por exemplo, a utilizao da tcnica de
reconhecimento de entidades na etapa de prprocessamento para j levantar esses
termos anteriormente e utilizlos para anotar os documentos semanticamente.
Para ilustrar a ltima etapa do processo KDT Interpretao/avaliao,
apresentado o estudo de caso do trabalho de Ceci et al(2010).
Descobrindo o conhecimento
124
Ps-graduao
125
Descobrindo o conhecimento
126
127
Referncias
AIRES, Rachel Virgnia Xavier. Uso de marcadores estilsticos para a busca na Web em
portugus. 2005. 202 f. Tese(Doutorado) Programa de Ps Graduao em Cincias da
Computao e Matemtica Computacional Instituto de Cincias e Matemticas e de
ComputaoICMC, Universidade de So PauloUSP, So Carlos(SP).
BOVO, Alessandro Botelho. Um modelo de descoberta de conhecimento inerente
evoluo temporal dos relacionamentos entre elementos textuais. 2011. 127(Doutorado).
Programa de PsGraduao em Engenharia e Gesto do Conhecimento, UFSC,
Florianpolis(SC).
CECI, Flavio. Um modelo semiautomtico para a construo e manuteno de ontologias
a partir de bases de documentos no estruturados. 2010. 131(Mestrado). Programa de
PsGraduao em Engenharia e Gesto do Conhecimento, UFSC, Florianpolis(SC).
CECI, Flavio; SILVA, Dhiogo C.; SELL, Denilson; GONALVES, Alexandre L. Towards a
SemiAutomatic Approach for Ontology Maintenance. 7 CONTECSI International
Conference on Information Systems and Technology Management. USP, So Paulo, 2010.
EBECKEN, Nelson F. F.; LOPES, Maria Celia S.; COSTA, Myrian C. A. Minerao de texto.
In: REZENDE, Solange O.(Coord.). Sistemas inteligentes: fundamentos e aplicaes. So
Paulo: Manole, 2005.
FELDMAN, R.; HIRSH, H. Exploiting Background information in Knowledge discovery
from text. Journal of Intelligent Information System, 1997.
GONALVES, A. L. Um modelo de descoberta de conhecimento baseado na correlao de
elementos textuais e expanso vetorial aplicado engenharia e gesto do conhecimento.
2006. 196(Doutorado). Programa de PsGraduao em Engenharia de Produo, UFSC,
Florianpolis(SC).
IGARASHI, Wagner. Construo automtica de vocabulrios temticos e
clculo de aderncia curricular: uma aplicao aos fundos setoriais. 2005. 95 f.
Dissertao(Mestrado) Programa de PsGraduao em Engenharia de Produo e
Sistemas, Universidade Federal de Santa Catarina, Florianpolis(SC).
KORFHAGE, Robert R. Information storage and retrieval. New York: Wiley Computer
Publishing, 1997.
TURBAN, Efraim et al. Business Intelligence Um enfoque gerencial para a inteligncia do
negcio. Editora Bookman, Porto Alegre, 2009.
WIVES, Leandro Krug. Tecnologia de descoberta de conhecimento em textos aplicados
inteligncia competitiva. Monografia apresentada ao Exame de Qualificao do Programa
de PsGraduao em Computao, Universidade Federal do Rio Grande do Sul, Porto
Alegre, 2002.
Descobrindo o conhecimento
128
Atividades de Autoaprendizagem
1) Levando em considerao o contedo apresentado nesta unidade, assinale as
alternativas verdadeiras com V e as falsas com F:
a. ( ) A minerao de dados responsvel pela modelagem do conhecimento
daorganizao.
b. ( ) As tcnicas utilizadas no processo KDD so completamente diferentes das
utilizada no processo KDT.
c. ( ) Reconhecimento de entidades nomeadas pode ser utilizada para facilitar o
processo KDT.
d. ( ) Os Data Warehouse so uma alternativa ao processo KDD, no tendo
nenhuma relao.
e. ( ) A minerao de dados e texto vivel pela utilizao de algoritmos, com
base estatstica e de inteligncia artificial.
f. ( ) Os processos KDT e KDD utilizam como fonte solues do tipo DW.
Atividade colaborativa
Nesta unidade, foram estudados conceitos de descoberta de conhecimento em
bases de dados e em texto, sabendo que muito do conhecimento organizacional
est disponvel em documentos no estruturados. Responda pergunta a seguir
utilizando a ferramenta Frum, no se esquea de comentar as respostas dos
seuscolegas.
As redes sociais so hoje um dos principais canais de comunicao das
organizaes com o seu cliente final. Dessa forma, possvel utilizar a descoberta
de conhecimento em texto a fim de extrair informaes para contribuir com a
base de conhecimento da organizao e auxiliar no processo decisrio?
Ps-graduao
129
Sntese
Nesta unidade, so estudados os processos de descoberta de conhecimento,
tanto utilizando como base repositrios DW quanto por meio da anlise dos
seusdocumentos.
O processo KDT funciona igual ao processo KDD, so conjuntos de tcnicas para
se obter conhecimento de uma determinada base de dados. O KDD utiliza bases
j estruturadas para descobrir informaes e o KDT usa textos, normalmente em
Linguagem Natural, tambm para descobrir informaes. No caso, os mtodos mais
utilizados so a Extrao de informao e o Processamento de Linguagem Natural.
Saiba Mais
Dborah Oliveira, da Computerworld, apresenta um artigo com o seguinte ttulo:
Data mining comea a conquistar espao na estratgia empresarial, leitura
bastante recomendada:
http://cio.uol.com.br/gestao/2012/03/19/data-mining-comeca-a-conquistar-espaco-naestrategia-empresarial/
Descobrindo o conhecimento
Unidade 5
Processo OLAP
Objetivos de Aprendizagem
Identificar o processo OLAP, bem como as suas caractersticas.
Examinar as funcionalidades exploratrias do processamento OLAP.
Entender qual a sua participao numa arquitetura de BI.
Introduo
As solues de Business Intelligence so compostas por uma srie de componentes
tecnolgicos que possibilitam um ambiente propcio tomada de deciso. Essas
solues podem combinar os componentes para cada situao, para a camada de
apresentao dos dados e das informaes utilizamse as solues OLAP.
As solues OLAP apresentam uma alternativa para a publicao dos dados
e informaes vindas dos modelos dimensionais. A apresentao dessas
informaes pode ser de maneira tabular ou grfica, tanto dos dados histricos
armazenados nos repositrios data warehouse, bem como os dados reais para
auxiliar o processo decisrio.
132
Ps-graduao
133
produtos;
entre outros.
Funes e algoritmos utilizados na minerao de dados:
regresses;
redes neurais;
rvores de deciso;
clustering.
Sobre o conceito de OLAP, Gouveia et al(2011) afirmam que uma soluo
desenvolvida para a recuperao das informaeschave, com o intuito de
proporcionar facilidade e flexibilidade para a anlise de dados da organizao
como um todo, permitindo uma melhor tomada de deciso pela camada gerencial.
Para Vinci e Narciso(2006), a multidimensionalidade uma caracterstica que faz
parte desse conceito, isso quer dizer que se pode ver uma anlise em diferentes
graus de detalhamento, chegando at no nvel atmico, que foi modelado o
repositrio de origem dos dados.
Segundo Thomsen(2002), podese falar em conceitos de OLAP(mltiplas
dimenses hierrquicas que podem ser utilizadas em vrias escalas), linguagens
OLAP(Data Definition LanguageDDL, Data Manipulation LanguageDML,
DataRepresentation LanguageDRL e seus analisadores e compiladores), camadas
de produto OLAP(geralmente residem sobre os bancos de dados relacionais e
geram SQL como sada) e produtos OLAP completos.
Processo OLAP
134
Para entender os conceitos por trs do cubo multidimensional, podese fazer uma
analogia com o brinquedo cubo mgico ou cubo de Rubik). Nesse brinquedo, a
pessoa deve mover as fases do cubo e chegar at a situao em que todas as fases
fiquem com a mesma cor. A Figura 2 apresenta este brinquedo.
Ps-graduao
135
Da mesma forma que quem manipula o brinquedo movendo uma das fases
tem uma nova viso sobre o mesmo brinquedo, no cubo dimensional, ao mover
uma das dimenses do cubo gerase uma nova viso sobre os mesmos dados
do repositrio. Essa interao entre as dimenses possibilita uma anlise muito
maior e chega a informaes antes no conhecidas. Cada dimenso que o cubo
possui pode ser uma tabela de dimenso de um modelo dimensional como o
apresentado na Figura 3.
Figura 3 - Representao de um modelo dimensional
Processo OLAP
136
Ps-graduao
137
Concluindo
De maneira geral, podese verificar que as solues OLAP possuem uma grande
importncia para a tomada de deciso, elas podem ser utilizadas de maneira
isolada numa arquitetura de Business Intelligence, ou combinadas com tcnicas de
minerao de dados e texto.
As ferramentas OLAP geram relatrios analticos em tempo de execuo, ou
seja, a partir do cruzamento de informaes podemse gerar vrios relatrios
dinmicos, permitindo uma visualizao mais detalhada ou mais resumida, a partir
das interaes com o cubo multidimensional resultante.
Processo OLAP
138
Referncias
ANZANELLO, C. A. OLAP Conceitos e Utilizao. Universidade Federal do Rio Grande do
Sul(UFRGS), 2002.
CASTRO, Sergio A.; GONALVES, Pablo R.; CAZARINI, Edson W. O uso do OLAP na
estratgia de vendas em uma indstria de calados alavancando a gesto de cadeia de
suprimentos. XXIV Encontro Nacional de Engenharia de Produo, Florianpolis, 2004.
GOUVEIA, Henrique C. et al. Aplicao da ferramenta OLAP em diferentes mdulos de
um sistema ERP melhorando a tomada de deciso. Revista Eletrnica de Sistemas de
Informao e Gesto Tecnolgica. Vol. 01, n. 01, 2011.
THOMSEN, Erik. OLAP Solutions: building multidimensional information systems. 2ndEdition.
John Wiley & Sons, Inc, 2002.
TURBAN, Efraim et al. Business IntelligenceUm enfoque gerencial para a inteligncia do
negcio. Editora Bookman, Porto Alegre, 2009.
VINCI, Wilson L.; NARCISO, Marcelo G. Integrao AccessExcel para produzir um sistema
de apoio deciso que simula um Data Warehouse e OLAP. XIII SIMPEP, Simpsio de
Engenharia de Produo, Bauru, 2006.
Ps-graduao
139
As solues de Business Intelligence tem ganhado cada vez mais espao entre as
organizaes, o motivo para tal a falta de ferramentas eficientes e focadas na
tomada de deciso.
Uma soluo de Business Intelligence(BI) composta por uma srie de
componentes e etapas que possuem arquiteturas e ferramentas particulares,
basicamente uma soluo de BI composta por um repositrio unificado de
dados, geralmente na forma de um Data Warehouse(DW); para consumir esse
dados, transformando em informao e possibilitando uma melhor anlise, dessa
forma, so utilizadas as ferramentas do tipo OLAP(On Line Analytical Processing).
Segundo Xavier e Pereira(2009), OLAP uma abordagem para fornecimento
de respostas rpidas para consultas analticas de fonte multidimensional.
ParaOliveira(2002), o processo OLAP focado na transformao de dados em
informao, a fim de dar suporte ao processo de tomada de deciso de uma
maneira amigvel e flexvel ao usurio em um tempo hbil, utilizando um conjunto
de tecnologias para acesso e anlise adhoc de dados.
O processo OLAP se diferencia do processo de transaes online(OLTP), segundo
Turban(2009), explica que o OLTP focado em processamento de transaes
repetitivas em grande quantidade e de manipulao simples, diferente do OLAP,
que envolve uma anlise de muitos itens de dados em relacionamentos complexos,
buscando padres, tendncias e excees, ou seja, focado no suporte a deciso.
No trabalho de Anzanello(2012), apresentada uma tabela comparativa entre os
requisitos funcionais e de desempenho entre aplicaes OLAP e OLTP:
Tabela 1-Comparao entre aplicaes OLAP e OLTP
Caractersticas
OLTP
OLAP
Operao Tpica
Atualizao
Anlise
Telas
Imutvel
Nvel de Dados
Atomizado
Altamente Sumarizado
Presente
Recuperao
Poucos registros
Muitos registros
Orientao
Registro
Arrays
Modelagem
Processo
Assunto
Fonte: Anzanello(2012).
Processo OLAP
140
Ps-graduao
141
Atributo 1
(1 dimenso)
5
4
Atributo 3
(3 dimenso)
3
2
1
1
Atributo 2
(2 dimenso)
Processo OLAP
142
Ps-graduao
143
Descrio
Acessibilidade
Arquitetura Cliente/Servidor
Transparncia
Fonte: Sell(2006).
Descrio
Relato flexvel
Tratamento dinmico
de matriz esparsa
Fonte: Sell(2006).
Descrio
Viso conceitual
multidimensional
Dimensionalidade genrica
Dimenses e nveis de
agregao limitados
Operaes irrestritas de
dimenso cruzada
Fonte: Sell(2006)
Processo OLAP
144
Referncias
ANZANELLO, Cynthia A. OLAP Conceitos e Utilizao. Instituto de InformticaUniversidade
Federal do Rio Grande do Sul. Porto Alegre. Disponvel em: <http://bit.ly/I0WoEb>. Acessado
em: 10 de abril de 2012.
CODD, E. F.; CODD, S. B.; SALLEY, C. T. Providing OLAP(online analytical processing) to
useranalysts: An IT mandate. 1995.
DONALD, B. High performance Oracle Data Warehousing. USA: The Coriolis Group, 1997.
OLIVEIRA, Wilson J. Data Warehouse. Visual Books, Florianopolis, 2002.
SELL, Denilson. Uma arquitetura para business intelligence baseada em tecnologias
semnticas para suporte a aplicaes analticas. 2006. Tese(Doutorado)Universidade
Federal de Santa Catarina, Centro Tecnolgico. Programa de PsGraduao em
Engenharia de Produo, Florianpolis, 2006.
SILVA, Joo; SAIAS, Jos. OLAP em mbito hospitalar: transformao de dados de
enfermagem para anlise multidimensional. JIUE 2011, 2th Jornada de Informtica da
Universidade de vora, Portugal, 2011.
THOMSEN, Erik. OLAP Solutions: building multidimensional information systems. 2ndEdition.
John Wiley & Sons, Inc, 2002.
TURBAN, Efraim et al. Business IntelligenceUm enfoque gerencial para a inteligncia do
negcio. Editora Bookman, Porto Alegre, 2009.
VINCI, Wilson L.; NARCISO, Marcelo G. Integrao AccessExcel para produzir um sistema
de apoio deciso que simula um Data Warehouse e OLAP. XIII SIMPEP, Simpsio de
Engenharia de Produo, Bauru, 2006.
XAVIER, Fabrcio S. V.; PEREIRA, Leonardo Bruno R. SQL dos Conceitos s Consultas
Complexas. Editora Cincia Moderna, Rio de Janeiro, 2009.
Ps-graduao
145
Processo OLAP
146
Ps-graduao
147
Processo OLAP
148
Origens
Usurios
2 origens
2 usurios (tipos)
01 = Dados de vendas
M204
MVS
IBM
U1 = analista de marketing
Excel
Windows 95
Compaq 586
02 = dados de Marketing
Oracle 7.3
Unix
Dell
1 milho de linhas
32 colunas
Nmerico
Dirio
Dados OLAP
100.000 linhas
128 colunas
Nmerico
Semanal
30 relatrios dirios
200 relatrios semanais
100.000 navegaes semanais
25 relatrios dirios
25 relatrios dirios
500 relatrios semanais
100.000 navegaes semanais
25 relatrios dirios
U2 = Gerente regional
Forest & Trees
Approach
NT
Fonte: Thomsen(2002).
Ps-graduao
149
Projeto da soluo
O primeiro passo para a definio do projeto da soluo a definio do modelo
lgico, essa definio nada mais que a concepo do modelo multidimensional.
Para o desenvolvimento desse modelo podese utilizar de qualquer metodologia j
conhecida para esta etapa.
Tento em vista a utilizao de uma metodologia para auxiliar a criao do
modelo multidimensional, o autor chama a ateno para alguns pontos que so
apresentados abaixo:
Cubos e dimenses;
Refinar a quantidade de dimenses;
Verificar as dimenses que mudam com o tempo;
Quais vnculos devem existir no modelo?
Hierarquias da dimenso;
Hierarquias mltiplas;
Membros da dimenso;
O contexto da deciso;
Frmulas.
Os pontos apresentados anteriormente tm como funo auxiliar o projetista
na validao e concluso do modelo multidimensional necessrio para a
ferramenta OLAP. Aps finalizar o projeto de soluo, devese investir tempo no
levantamento de informaes sobre as agregaes e anlises mais complexas.
Processo OLAP
150
Referncias
THOMSEN, Erik. OLAP Solutions: building multidimensional information systems.
2ndEdition. John Wiley & Sons, Inc, 2002.
Ps-graduao
151
Processo OLAP
152
Esse tipo de ambiente traz uma srie de benefcios, j que bastante intuitivo e
permite que o seu usurio final no precise ser um especialista em computao,
bastando apenas ter um conhecimento mdio em informtica e, principalmente,
conhecer o domnio em questo.
Podese facilmente cruzar as dimenses funcionrio com estado e chegar
seguinte situao:
Figura 3-Tabela de funcionrios por estado
Ps-graduao
153
Processo OLAP
154
Ps-graduao
155
Referncias
ANVISA. Diretrio de Conhecimento da vigilncia Sanitria. Disponvel em:
http://dcvisa.anvisa.gov.br. Acesso em: 16 jul. 2012.
THOMSEN, Erik. OLAP Solutions: building multidimensional information systems.
2ndEdition. John Wiley & Sons, Inc, 2002.
Processo OLAP
156
Atividades de Autoaprendizagem
1) Levando em considerao o contedo apresentado nesta unidade, assinale as
alternativas verdadeiras com V e as falsas com F:
a. ( ) Para o desenvolvimento de solues OLAP, existem vrias metodologias
que se podem seguir para obter sucesso no mesmo.
b. ( ) MOLAP, HOLAP, DOLAP so tipos de arquiteturas OLAP.
c. ( ) Podese fazer uma analogia das solues OLAP com o brinquedo cubo mgico.
d. ( ) OLAP e OLTP so siglas para o mesmo tipo de processo.
e. ( ) A minerao de dados uma tcnica utilizada para compor a base de dados
consumida pelas ferramentas OLAP.
f. ( ) ROLAP um tipo de arquitetura OLAP que utiliza como base um banco de
dados com modelo relacional.
Atividade colaborativa
Nesta unidade, voc estudou sobre as solues OLAP. Responda pergunta a
seguir utilizando a ferramenta Frum, no se esquea de comentar as respostas
dos seus colegas.
As ferramentas OLAP apresentam uma forma amigvel de navegar entre as
dimenses modeladas na base de dados, essa forma geralmente tabelar(por
meio de tabelas), voc acha que existem outras formas de navegao? Se sim,
falesobre elas e apresente quais as suas vantagens e desvantagens.
Ps-graduao
157
Sntese
Nesta unidade, so estudadas as solues OLAP, os seus conceitos, como so
montadas, quais as suas dependncias tecnolgicas e exemplos.
As solues OLAP so baseadas na disposio das informaes disponveis nos
modelos dimensionais, essas solues tm como funo auxiliar no consumo e
explicitao dos dados e informaes, de modo a apoiar a tomada de deciso,
tambm possvel acompanhar os dados em tempo real, a fim de acompanhar os
dados de entrada para apoiar o processo decisrio de maneira mais gil.
Saiba Mais
A professora Cynthia Aurora Anzanello, da Universidade Federal do Rio Grande do
Sul, escreveu um timo artigo falando sobre OLAP e suas utilizaes, vale a pena
ler este material:
http://www.fag.edu.br/professores/limanzke/Administra%E7%E3o%20de%20
Sistemas%20de%20Informa%E7%E3o/OLAP.pdf
Processo OLAP
Chegamos ao final deste livro sobre Business Inteligence, onde passamos pelas
principais reas que esto relacionadas com essa proposta. Inicialmente, foi
abordada uma reviso sobre o conceito de dado, informao e conhecimento,
chegando aos sistemas de informao. Nesse tpico verificouse que no existe
uma classificao nica, mas que iramos nos concentrar no tipo de sistemas de
informao chamado de sistemas de apoio deciso.
Os conceitos relacionados a Business Inteligence (BI) nasceram muito antes da
era da computao, mas nesse contexto as ferramentas de BI so representadas
como evoluo dos sistemas de apoio deciso. Dentro dessa abordagem,
utilizamse, normalmente, repositrios de dados e informao para apoiar os
processos analticos. Costumeiramente, utilizase a modelagem dimensional para
esse tipo de proposta.
Os Data Warehouse (DW) so responsveis pelo armazenamento centralizado
dos dados e informaes, de maneira dimensional e prprocessada, garantindo
uma qualidade muito maior na sua fonte de informao. Para isso, utilizamse
ferramentas ETL, as quais tm como funo a coleta de dados das bases
operacionais, proveniente dos sistemas de informao transacionais da
organizao. A partir dessa coleta, feita a transformao e limpeza dos dados e
posteriormente a carga no repositrio do tipo DW.
Para consumir e apresentar esses dados e informaes contidos nos repositrios
podese utilizar algumas abordagens. Quando se deseja descobrir conhecimento
implcito nos repositrios, podese utilizar de tcnicas de minerao de dados,
as quais podem auxiliar no reconhecimento de padres e gerar indicativos para
acontecimentos futuros.
Quando se deseja visualizar os dados e informaes histricos, podendo cruzar
vrias dimenses, de modo a chegar em novas informaes, utilizamse as
solues OLAP, que, alm de navegao pelos dados histricos, podem fazer um
acompanhamento em tempo real das operaes da organizao.
160
Podese verificar que cada vez mais os dados no estruturados esto fazendo
parte das solues de BI, o motivo para tal que muito do conhecimento
organizacional est implcito nas bases de documentos. O cruzamento e
carga dessas informaes cada vez mais comum nos repositrios e bases de
conhecimento, alm dos dados no estruturados provenientes dos documentos
da organizao. Tambm, cada vez mais esto utilizando como base os dados
publicados em mdias sociais, que representam um canal direto do cliente com as
organizaes, podendo auxiliar e muito no processo de tomada de deciso.
Ps-graduao
Minicurrculo
Unidade 1
Atividades de Autoaprendizagem
1) Gabarito: F V F F V V F F
a. ( F ) As ontologias so estruturas formais para a representao de dados.
Comentrio: As ontologias so estruturas formais para a representao
deconhecimento.
c. ( F ) O paradigma de transporte demonstrou, ao longo do tempo, sua
eficincia e utilizado at hoje na Nova Engenharia do Conhecimento.
Comentrio: A nova engenharia do conhecimento baseada no paradigma de
modelagem, devido falta de sucesso do paradigma de transporte na concepo dos
sistemas de apoio deciso.
d. ( F ) Os Sistemas de Informao possuem uma classificao muito bem definida.
Comentrio: Essa afirmao no est correta, at hoje os pesquisadores dessa
rea ainda no chegaram em um consenso sobre a classificao dos sistemas
deinformao.
g. ( F ) O subsistema de modelo da arquitetura clssica de SAD equivalente ao
Data Warehouse da arquitetura de BI.
Comentrio: os Data Warehouse so equivalentes ao subsistema de dados e no de
modelo da arquitetura clssica de um SAD.
h. ( F ) Uma organizao pode ser vista como um sistema, desde que ela faa uso
de computadores.
Comentrio: Um sistema qualquer ambiente que seja composto de trs processos
bsicos: Entrada, processamento e sada. Exemplo: sistema digestivo.
164
Atividade colaborativa
O uso de dados disponveis na Web (como por exemplo, em mdias sociais) pode
auxiliar os sistemas de apoio deciso na entrega de uma informao mais
estratgica para a organizao?
Comentrio: Atualmente, as mdias sociais representam um canal direto entre as
organizaes e seus clientes, nelas podemse encontrar informaes sobre um
produto, servio e atendimento. Cada vez mais as organizaes esto utilizando essas
informaes para montar campanhas de marketing, e at cruzar essas informaes
com as internas, para auxiliar na tomada de deciso.
Unidade 2
Atividades de Autoaprendizagem:
1) Gabarito: F F F V F V
a. ( F ) As prticas de BI s foram possveis com o advento dos computadores.
Comentrio: apresentado durante a unidade 2 que as tcnicas de BI no possuem
dependncia com sistemas computacionais, que at mesmo em tempos remotos j
existiam tcnicas de BI inseridas nas suas atividades produtivas, como por exemplo,
asociedade egpcia.
b. ( F ) DW nada mais do que um banco de dados que utiliza como modelagem
de dados a abordagem relacional.
Comentrio: Um DW utiliza como modelagem para os seus dados a modelagem
dimensional, que mais indicada para anlise de dados.
c. ( F ) ETL o processo de minerao de dados previsto pela arquitetura de BI.
Comentrio: O processo de ETL responsvel pela coleta dos dados das bases
operacionais, processamento, transformao e carga desses dados no DW.
e. ( F ) A chamada rea de apresentao onde as informaes so organizadas
ecentralizadas.
Comentrio: Essas caractersticas so dos repositrios DW.
Ps-graduao
165
Atividade colaborativa
O uso de recursos semnticos permite uma sria de possibilidades para as anlises
de informaes disponveis pelo BI, quais possibilidades so essas? Como elas
podem auxiliar na anlise das informaes?
Comentrio: O uso de recursos semnticos est cada vez mais presente na web
(web semntica) e dentro das organizaes. Os artifcios semnticos podem estar
presentes tanto no processamento das informaes, podendo classificlas levando
em considerao o contexto do dado em questo, bem como na apresentao das
informaes, sabendo qual a melhor maneira de apresentla.
Unidade 3
Atividades de Autoaprendizagem:
1) Gabarito: V F V V V F
b. ( F ) O processo de integrao dos dados algo bastante simples e rpido
deconceber.
Comentrio: Sabese que o processo de integrao de dados um dos mais custosos
e demorados.
f. ( F ) As medidas de um DW uma nomenclatura equivalente a tabelas fato.
Comentrio: As medidas representam os valores totalizados, que so colunas de uma
tabela fato.
Atividade colaborativa
Nesta unidade, foram estudados os repositrios data warehouse, tambm foi
visto que Inmon, considerado como um dos pais dessa abordagem, j trabalha
com o conceito do DW2.0. Dessa forma, faa um paralelo dessa evoluo com a
evoluo do BI, BI 2.0 e BI 3.0.
Comentrio: O chamado DW 2.0 baseado na utilizao de fontes no estruturadas,
junto modelagem dimensional. No caso do chamado BI2.0 e BI3.0 tambm
previsto que seja utilizado contedo no estruturado, utilizandose de recursos de
processamento de linguagem natural e web semntica, o no s contedo interno
para apoiar a tomada de deciso, mas tambm contedo disponvel na internet.
Business Intelligence
166
Unidade 4
Atividades de Autoaprendizagem:
1) Gabarito: F F V F V F
a. ( F ) A minerao de dados responsvel pela modelagem do conhecimento
daorganizao.
Comentrio: A minerao de dados baseada em tcnicas estatsticas e apoiadas
por algoritmos da inteligncia artificial, que tm como funo analisar e apoiar a
descoberta de conhecimento.
b. ( F ) As tcnicas utilizadas no processo KDD so completamente diferentes das
utiliz11,5ada no processo KDT.
Comentrio: O processo KDD e KDT compartilha de vrias tcnicas, diferenciando
mais da etapa de processamento dos dados e informaes de entrada (dado
estruturado ou no estruturado).
d. ( F ) Os Data Warehouse so uma alternativa ao processo KDD no tendo
nenhuma relao.
Comentrio: Os Data Warehouse so responsveis por armazenar os dados
estruturados que sero consumidos pelo processo KDD.
f. ( F ) Os processos KDT e KDD utilizam como fonte solues do tipo DW.
Comentrio: O processo KDT utiliza como base textos e dados no estruturados,
diferente do processo KDD, que utiliza como base dados estruturados geralmente
provenientes de um DW.
Atividade colaborativa
Nesta unidade, foram estudados conceitos de descoberta de conhecimento em
bases de dados e em texto, sabendo que muito do conhecimento organizacional
est disponvel em documentos no estruturados. Responda pergunta a seguir
utilizando a ferramenta Frum, no se esquea de comentar as respostas de
seus colegas.
Ps-graduao
167
Unidade 5
Atividades de Autoaprendizagem:
1) Gabarito: F V V F F V
a. ( F ) Para o desenvolvimento de solues OLAP, existem vrias metodologias
que se podem seguir para obter sucesso no mesmo.
Comentrio: Existem recomendaes para a construo de solues OLAP, mas
nenhuma metodologia consolidada ou definida.
d. ( F ) OLAP e OLTP so siglas para o mesmo tipo de processo.
Comentrio: No so todos os processo diferentes, no caso do processo OLAP, os
dados em questo so analticos.
e. ( F ) A minerao de dados uma tcnica utilizada para compor a base de dados
consumida pelas ferramentas OLAP.
Comentrio: A minerao de dados pode ser utilizada combinando com as solues
OLAP, mas ambos atuam no consumo dos dados e informaes para apresentar
informaes e conhecimentos para o usurio da soluo.
Atividade colaborativa
Nesta unidade, voc estudou sobre as solues OLAP. Responda pergunta a
seguir utilizando a ferramenta Frum, no se esquea de comentar as respostas
dos seus colegas.
Business Intelligence
168
Ps-graduao
Referncias
ADRIAANS, P.; ZANTINGE, D. Data mining. Addison Wesley Longman, England, 1996.
AGRAWAL, R.; SRIKANT, R. Mining sequential patterns. Proceedings of Eleventh
International Conf on Data Engineering. 1995.
AIRES, Rachel Virgnia Xavier. Uso de marcadores estilsticos para a busca na Web em
portugus. 2005. 202 f. Tese (Doutorado) Programa de Ps Graduao em Cincias
da Computao e Matemtica Computacional Instituto de Cincias e Matemticas e
de Computao-ICMC, Universidade de So Paulo-USP, So Carlos (SP).
ALMEIDA, Adiel Teixeira de. Um modelo de deciso para a priorizao no
planejamento de sistemas de informao. Prod., So Paulo, v. 8, n. 2, Dec. 1998.
Available from <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010365131998000200003&lng=en&nrm=iso>. Acessado em 15 Dez. 2011
ANGELONI, Maria Terezinha. Organizaes do conhecimento: infraestrutura,
pessoas e tecnologias. So Paulo: Saraiva, 2008. 363 p.
ANZANELLO, C. A. OLAP: conceitos e utilizao. Universidade Federal do Rio
Grande do Sul (UFRGS), 2002.
ARAGO, Pedro O. Um estudo sobre conceitos e tcnicas de minerao de dados.
2008. Monografia (Graduao em Tecnologia)-Faculdade de Tecnologia de So
Paulo, So Paulo, 2008.
AXELROD, R.; COHEN, M. D. Harnessing complexity: organizational implications
of a scientific frontier, Free Press, New York, 1999.
BARBOSA, Gilka Rocha; ALMEIDA, Adiel Teixeira de. Sistemas de Apoio Deciso
sob o enfoque de Profissionais de TI e de Decisores. XXII Encontro Nacional de
Engenharia de Produo. Curitiba, 2002.
BERGER, Gideon et al. Discovering unexpected patterns in temporal data
using temporal logic; Temporal Databases - Research and Practice. Heidelberg:
EdSpringer-Verlag, 1998.
170
Ps-graduao
171
Business Intelligence
172
Ps-graduao
173
Business Intelligence
174
Ps-graduao
175
Business Intelligence
176
WITTEN, Ian H.; FRANK, Eibe. Data mining practical machine learning tools and
techniques with Java implementations. Morgan Kaufmann Publishers. 2000.
WIVES, Leandro Krug. Tecnologia de descoberta de conhecimento em textos
aplicados inteligncia competitiva. Monografia apresentada ao Exame de
Qualificao do Programa de Ps-Graduao em Computao, Universidade
Federal do Rio Grande do Sul, Porto Alegre, 2002.
Ps-graduao