17 de Janeiro de 2015
Big Data
Randy Quindai
preciso trabalhar duro para fazer o simples
Steve Jobs
Graduando em Engenharia
da Computao (UFAL)
Bolsista do NTI(UFAL)
Bolsista da
RIM(Blackberry)
Desenvolvedor de diversos
projetos acadmicos em
Java, C++, VB6, HTML5,
AngularJS
Membro do GDG Luanda
f g+ in
Velocidade
Valor
Veracidade Variedade
Velocidade
Valor
Veracidade Variedade
Volumes extremamente
grandes de dados:
Em 2007 o Google processava
mais de 400PB dados/ms
Usurios do facebook
produzem mais de 300PB
dados/dirios
Velocidade
Valor
Veracidade Variedade
Velocidade
Valor
Veracidade Variedade
Velocidade
Valor
Veracidade Variedade
Volume+Velocidade+Variedade
de nada adianta se os dados
no so confiveis.
Informao no s poder,
informao patrimnio.
Velocidade
Valor
Veracidade
Variedade
reas de Aplicao
Big Data
transporte
ensino
algoritmos genticos
governo
finanas
social
cincia
sade
10
reas de Aplicao
O limite a sua imaginao
ensino
transporte
governo
finanas
social
cincia
sade
11
Quem Usa
Anlise de sentimento no
Twitter e exrcito de
apoiadores no Facebook.
Levantamento de dados de
mdia
Alcanar o eleitor na hora
certa
12
Jeffrey Dean
http://research.google.com/
people/jeff/
Sanjay Ghemawat
http://research.google.com/
pubs/SanjayGhemawat.html
14
Quem Usa
17
18
Elasticidade
No ACID (Atomicidade,
Consistncia, Isolamento e
Durabilidade)
NoSQL
BASE(Basically available, Soft
state, Eventually consistency)
19
20
Open Source
Tolerante a falhas
Escalvel
Processamento paralelo
EMR
Coerncia de dados
21
Ecossistema Hadoop
22
Sandbox
23
Sandbox
24
Sandbox
Pig http://pig.apache.org
Hive https://hive.apache.org
vs
25
Sandbox
vs
SELECT * FROM Tabela
WHERE Campo = ABC;
SELECT a.* FROM a
JOIN b
ON (a.id = b.id)
Perguntas
Big Data
Links Interessantes:
http://ohundo.tempsite.ws
http://www.cloudera.com/content/cloudera/en/downloads/quickstart_vms/cdh-5-3-x.html
https://www.vagrantup.com/downloads.html
https://www.hashicorp.com
https://www.virtualbox.org/wiki/Downloads
http://hortonworks.com/hdp/downloads/
http://mahout.apache.org/
https://crunch.apache.org/
http://avro.apache.org/docs/1.7.7/gettingstartedjava.html
http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/YARN.html
http://bigtop.apache.org/
27
Big Data
Fim
28