Anda di halaman 1dari 4

BLOCO A | 110h

Bloco B | 110h

Bloco C | 110h

Bloco D | 110h

Obteno,
Anlise e
Visualizao de
Dados: Valor

Infraestrutura
para Big Data:
Volume

Armazenamento
Heterogneo
de Dados:
Velocidade

Indexao e
Tratamento
de Dados
Heterogneos:
Variedade

Cases:
Solues utilizadas em diversas
reas: mdica, marketing,
mercado financeiro, educao,
redes sociais; Motores de Busca;
Arquitetura de Solues Big
Data; Correlao de Dados.

Map Reduce/ Hadoop:


Hadoop como framework;
Papel desempenhado por
servidores mster e slaves;
Arquitetura: Map Reduce; HDFS
e Ferramentas (Hive, HBase,
Mahout, Pig, Oozie, Flume,
Scoop, Spark/shark); Solues
em Python; Papeis Task tracker,
Data node, Job tracker e Name
node; Tolerncia a falhas;
Clusterizao; Transparncia
de programao; Gerncia de
usurios; Estudo de caso.

Gerenciamento de
Dados:
SGBDs Relacionais vs. NoSQL;
Agregaes; No Schema; Bases
Distribudas; Consistncia;
Map-Reduce; Gerenciadores
Key-Value (Redis, Memcached,
Riak); Gerenciadores Orientados
a Documento (MongoDb,
CouchBase, RavenDB); Bancos
InMemory (SAP HANA e
VoltDB); Gerenciadores
Relacionais para Big Data
(Vertica, Pivotal). Neste mdulo
teremos laboratrios prticos
visando realizar comparaes
entre os diversos produtos.

Mecanismos de
Busca:
Indexao; Recuperao de
Informao; Solr; elasticsearch.

Big Data Analytics:


Analtica Descritiva, Preditiva
e Prescritiva; Formulao
de Problemas; Modelagem;
Mensurao; Anlise de
Resultados; Ferramentas
Analticas; Anlises Quantitativa
e Qualitativa; Formulao de
questes; Estudos de Caso
Aplicados (Marketing, Cadeia
de Fornecimento, Finanas, RH,
Pesquisa e Desenvolvimento);
Visualizao de Resultados
(data visualization).
Projeto de Bloco:
Com base no estudo de caso
de uma grande rede de varejo,
elaborar questes, coletar
dados, realizar anlises e
apresentar resultados que
respondam s questes
levantadas.
Competncias
Adquiridas:
O aluno recebe uma viso geral
sobre aplicaes de solues
adotadas no mundo Big Data.
Alm disso, desenvolve o
raciocnio analtico e trabalha
com a apresentao de
resultados.

Programao:
Rstudio; Lendo e gravando
dados; Estruturas de
processamento; Simulaes;
Otimizao; Coleta e limpeza
de dados (leitura, mescla,
agregao); Grficos;
Clusterizao de dados;
Bases da Linguagem Python;
Introduo ao Machine
Learning.
Projeto de Bloco:
Modelar e projetar uma soluo
composta por infraestrutura
Hadoop e desenvolvida
utilizando a linguagem Python,
observando as prticas
recomendadas no presente
Bloco.
Competncias
Adquiridas:
O aluno aprende a desenvolver
solues simples envolvendo
Hadoop e Map Reduce,
assim como a criar pequenos
programas utilizando RStudio
ou Python.

MongoDB:
Instalao; Organizao de
Dados; Trabalhando com
Dados; GridFS; Consultas;
Administrao; Otimizao;
Replicao; Particionamento de
dados (sharding). Integrao
com Hadoop.
Projeto de Bloco:
Prova prtica em laboratrio
envolvendo resoluo de
problemas de administrao e
otimizao com MongoDB.
Competncias
Adquiridas:
O aluno recebe uma viso geral
sobre os principais produtos
NoSQL. Torna-se capaz tambm
de realizar a instalao,
configurao e otimizao de
base NoSQL MongoDB.

Minerao de Texto:
Manipulao de dados brutos;
Dados temporais; Algoritmos
de busca; Anlise de resultados;
Busca inferente em bases
texto; Identificao de padres;
Ferramentas; Web Mining; Text
Mining; Algoritmos genticos;
Anlise de sentimento.
Projeto de Bloco:
Prova prtica em laboratrio
envolvendo resoluo de
problemas de minerao de
textos.
Competncias
Adquiridas:
O aluno ser capaz de dominar
conceitos relativos a predies
de dados, construir, gerenciar e
consultar modelos preditivos, e
por fim, conhecer as principais
ferramentas do mercado de
minerao de texto.

TCC
Orientao para o
desenvolvimento do Trabalho
de Concluso de Curso
individual.

Anda mungkin juga menyukai