Introduo
O que Data Science?
I Os Data scientists
I usam a habilidade de achar e interpretar ricas fontes de dados;
I gerenciam grande quantidade de dados, levando em conta as
disponibilidades de Hardware, de Software e das limitaes de
banda;
I gerenciam os dados: agrupando dados de diferentes fontes e
garantindo a consistncia deles;
I criam visualizaes para entender os dados;
I criam modelos matemticos ou estatsticos usando os dados;
I apresentam e comunicam as descobertas encontradas nos dados
para uma audincia tcnica ou no-tcnica.
As etapas de um projeto em Data Science
Fonte: Nina Zumel and John Mount. Practical Data Science with R,
Manning, 2014.
Definio de um objetivo
A primeira etapa de um projeto em Data Science a definio de
um objetivo mensurvel ou quantificvel.
Seria importante responder a essas perguntas:
Uma vez que voc j tem um boa idia de seu objetivo, voc pode
agora focar na coleta de dados para alcan-lo.
Coleta e gerenciamento dos dados
Uma vez que voc possui um modelo que satisfaz seus critrios de
sucesso, voc dever apresentar os seus resultados para o
patrocinador ou para outras audincias.
Ao mesmo tempo, voc dever documentar o modelo para aqueles
que sero responsveis pela sua utilizao e manuteno (quando
entregue).
Diferrentes audincias requerem diferentes tipos de informao.
Apresentao e documentao
Fonte: Nina Zumel and John Mount. Practical Data Science with R,
Manning, 2014.
Resumo
I Hlio Lopes
I http://www.inf.puc-rio.br/~lopes
I lopes@inf.puc-rio.br
I Simone Barbosa
I http://www.inf.puc-rio.br/~simone
I simone@inf.puc-rio.br