Anda di halaman 1dari 5

Ciência de dados

Origem: Wikipédia, a enciclopédia livre.


Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou
não, que visa a extração de conhecimento ou insights para possíveis tomadas de decisão, de maneira similar à mineração de
dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística,
economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A
ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores
como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados
pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas
em tomadas de decisões para atingir melhores resultados.[1]

Índice
Origem
Relação com estatísticas
Aplicações
Busca na internet
Propaganda digital
Sistemas de recomendação
Reconhecimento de imagens
Logística
Saúde
E-commerce de viagens
Serviços financeiros
Comparação de preços
Cientista de dados
Mercado de trabalho
Principais Linguagens utilizadas
Principais abordagens utilizadas
Referências

Origem
Atualmente o volume de dados gerado por ações online como, uma simples curtida no Facebook ou até o upload de vídeos ou
fotos no Instagram, é enorme. A cada 10 minutos, o volume de dados gerados no mundo todo é maior do que o volume de dados
gerados desde a pré-história até o ano de 2003. Junto com esse aumento na geração de dados também aumentou a nossa
capacidade de processamento. Desde os anos 1970 a cada dois anos a nossa capacidade de processamento praticamente dobrou. E
com esse grande aumento na quantidade de dados e na capacidade de processamento, um novo conceito surgiu, o Big Data. E
com a necessidade de analisar e tentar extrair desse grande volume de dados informações úteis, surge a Ciência de dados, que
também é considera como uma versão mais recente do Busines Intelligence.[2] Mas apesar das semelhanças, as duas ciências
possuem funções e abordagens diferentes. Enquanto Busines Intelligence utiliza uma análise de dados "descritiva" ou
"retrospectiva" para tentar responder a pergunta "o que aconteceu?", a ciência de dados faz uso da análise preditiva e tenta
descobrir "o que vai, ou pode acontecer?".[3]

Relação com estatísticas


A popularidade do termo "ciência de dados" explodiu nos ambientes de negócios e na academia, alavancado pelas vagas de
emprego.[4] No entanto, muitos acadêmicos e jornalistas críticos não vêem distinção entre ciência de dados e estatísticas. Em
artigo na Forbes, por Gil Press, argumenta que a ciência de dados é uma buzzword sem uma definição clara e simplesmente
substituiu "analista de negócios" no contextos das programas de graduação.[5] Na seção de perguntas e respostas de seu principal
discurso na Reuniões estatísticas da American Statistical Association (http://www.amstat.org/), notório estatístico aplicado Nate
Silver disse: “Eu acho que cientista de dados é um termo sexualizado para um estatístico .... A estatística é um ramo da ciência. O
cientista de dados é um pouco redundante de alguma forma e as pessoas não devem repreender o termo estatístico."[6]
Similarmente, no setor de negócios, vários pesquisadores e analistas afirmam que os cientistas de dados, por si só, estão longe de
ser suficientes para conceder às empresas uma vantagem competitiva real.[7] e considere os cientistas de dados como apenas uma
das quatro maiores famílias de empregos que as empresas precisam para usar grandes dados com eficiência, a saber: analistas de
dados, cientistas de dados, desenvolvedores e engenheiros de dados.[8]

Existe uma polêmica envolvendo a ciência de dados, no que se refere ao fato desta se confundir com a estatística. Em 2015, a
American Statistical Association (http://www.amstat.org/) fez uma declaração através de um comunicado de imprensa que
procura apaziguar essa questão. Basicamente ela afirma que as ciências são complementares, e a estatística procura fomentar um
relacionamento mais próximo à ciência de dados para benefício mútuo.[9]

Aplicações

Busca na internet
Os principais mecanismos de pesquisa na internet fazem o uso da ciência de dados em conjunto com o aprendizado de máquina
para encontrar o resultado mais refinado em frações de segundos. A velocidade dos motores de busca atuais só é possível graças à
ciência de dados.

Propaganda digital
Praticamente todo o conteúdo de marketing digital que existe é escolhido por algoritmos que utilizam ciência de dados. Com isso
as empresas obtêm um resultado muito melhor do que o marketing convencional, pois os anúncios são montados de acordo com o
histórico do usuário. É por esse motivo que duas pessoas podem ver diferentes anúncios em uma mesma página.

Sistemas de recomendação
Aliando os dados do perfil do usuário com os dados do seu histórico de buscas, é possível ter melhores insights sobre os tipos
sugestões que mais se adequam a cada pessoa, e é isso que ocorre quando visualizamos novas sugestões de amizades no
Facebook ou Linkedin, bem como as sugestões de filmes e séries no Netflix e até mesmo as sugestões de produtos no site da
Amazon.

Reconhecimento de imagens
Utilizando algoritmos de reconhecimento de imagens, várias aplicações são possíveis, como qr code que permite que você
escaneie uma imagem com seu Smartphone para poder utilizar o Whatsapp web ou até mesmo o recurso automático de tags para
marcar amigos em fotos postadas em redes sociais.

Logística
A UPS, empresa do ramo de logística, desenvolveu um sistema chamado ORION, que é responsável por gerenciar as rotas de
seus caminhões de entrega nos EUA. Esse sistema foi alimentado, a partir de 2008, com informações oriundas de sua frota sobre
rotas, tempo de veículos parados e até se os motoristas estavam utilizando o cinto de segurança. A partir daí, foi desenvolvido um
complexo algoritmo para resolver os problemas de rota dos caminhões. Isso gerou um impressionante código com 1000 paginas,
que transforma os dados obtidos em instruções para otimizar as rotas dos caminhões. Atualmente, esse sistema consegue otimizar
as rotas em segundos e, rodando em segundo plano, está sempre atualizando a mesma para garantir a melhor rota para seus
caminhões, fazendo com que a UPS economize até 50 milhões de dólares ao ano.[10]

Saúde
A Walgreens utiliza ferramentas avançadas de analytics na área de drogarias para o cuidado de pacientes, avaliando melhor as
suas condições e fornecendo recomendações que fortalecem a saúde e evitam despesas médicas futuras.

E-commerce de viagens
Muitas empresas de e-commerce de viagens como Booking, Trivago, Expedia, entre outras, utilizam a Ciência de Dados para
melhorar os resultados em seus motores de busca, trazendo para o cliente não só os resultados de pesquisas sobre hotéis ou voos,
como também sugerindo serviços complementares a essas viagens (reserva de carros, pacotes de passeios no destino, seguro de
viagens, etc.).[11]

Serviços financeiros
A ciência de dados auxilia na análise e compreensão dados armazenados sobre gastos passados, concessões de crédito entre
outras variáveis, e com isso os bancos podem traçar perfis que são capazes de projetar a probabilidade de um determinado cliente
se tornar inadimplente ou não.[12]

Comparação de preços
Com o imenso volume de dados gerado pela grande quantidade de lojas virtuais, os sites como: Buscapé, Trivago, Bondfaro
dentre muitos outros, utilizam a ciência de dados para mostrar os menores preços do produto que o cliente está
procurando.[13][14]

Cientista de dados
Os cientistas de dados são profissionais da "nova geração" com conhecimentos em Matemática, Estatística e T.I. e com
habilidades em análises de dados complexos e soluções para possíveis problemas extraídos a partir desses dados.[15]

Mercado de trabalho
O profissional dessa área encontra-se em primeiro lugar das melhores profissões da América, de acordo com uma lista do site
Glassdoor[16] . O alto número de vagas (devido a pouca quantidade de profissionais qualificados), os bons salários e a satisfação
de no trabalho foram os fatores que colocaram essa profissão no topo dessa lista.[17] Segundo uma pesquisa realizada pela IBM, a
demanda por esses profissionais deve subir 28% até 2020 e atualmente, 60% da procura por esses profissionais encontra-se na
área de finanças.[18]

Principais Linguagens utilizadas


R (linguagem de programação)
SAS (informática)
Python (linguagem de programação)
SQL

Principais abordagens utilizadas


Árvores de decisão
Rede neural
Aprendizado profundo
Lógica de programação indutiva
Máquinas de vetores de suporte
Clustering
Redes Bayesianas
Aprendizado por reforço
Aprendizado por representação
Aprendizado por similaridade e métrica
Aprendizado por dicionário esparso
Algoritmos genéticos

Referências
1. Slveira, Debora Priscila (20 de julho de 2016). «O que é Data Science» (https://www.oficinadanet.com.br/post/16
919-o-que-e-data-science). Consultado em 22 de outubro de 2017
2. Cavique, Luís (2014). «Big Data e Data Science» (https://repositorioaberto.uab.pt/bitstream/10400.2/3918/1/2%2
0Boletim_51.11-14.pdf) (PDF)
3. Fabris, Felipe (setembro de 2017). «A evolução de Business Intelligence para Data Science» (http://www.bigdata
business.com.br/business-intelligence-a-data-science/). Consultado em 20 de novembro de 2017
4. Darrow, Barb (21 de maio de 2015). «Data science is still white hot, but nothing lasts forever» (http://fortune.com/
2015/05/21/data-science-white-hot/). Fortune. Consultado em 20 de novembro de 2017
5. «Data Science: What's The Half-Life Of A Buzzword?» (https://www.forbes.com/sites/gilpress/2013/08/19/data-sci
ence-whats-the-half-life-of-a-buzzword/). Forbes. 19 de agosto de 2013
6. «Nate Silver: What I need from statisticians» (http://www.statisticsviews.com/details/feature/5133141/Nate-Silver-
What-I-need-from-statisticians.html). 23 de agosto de 2013
7. Miller, Steven (10 de abril de 2014). «Collaborative Approaches Needed to Close the Big Data Skills Gap» (http://
www.jorgdesign.net/article/view/9823). Journal of Organization Design (em inglês). 3 (1): 26–30. ISSN 2245-408X
(https://www.worldcat.org/issn/2245-408X). doi:10.7146/jod.9823 (https://dx.doi.org/10.7146%2Fjod.9823)
8. De Mauro, Andrea; Greco, Marco; Grimaldi, Michele; Ritala, Paavo. «Human resources for Big Data professions:
A systematic classification of job roles and required skill sets» (http://linkinghub.elsevier.com/retrieve/pii/S030645
7317300018). Information Processing & Management. doi:10.1016/j.ipm.2017.05.004 (https://dx.doi.org/10.101
6%2Fj.ipm.2017.05.004)
9. Myers, Jeffrey A. (1 de outubro de 2015). «ASA Issues statement on role of statistics in Data Science» (http://ww
w.amstat.org/asa/files/pdfs/pressreleases/2015-ASA-StatisticsFoundationaltoDataScience.pdf/) (PDF). Consultado
em 21 de novembro de 2017
10. «ORION Backgounder» (https://pressroom.ups.com/pressroom/ContentDetailsViewer.page?ConceptType=FactS
heets&id=1426321616277-282). 2017. Consultado em 28 de novembro de 2017
11. «Data Science and AI in the Travel Industry: 9 Real-Life Use Cases» (https://www.altexsoft.com/blog/datascienc
e/data-science-and-ai-in-the-travel-industry-9-real-life-use-cases/). 9 de outubro de 2017. Consultado em 29 de
novembro de 2017
12. Zaidi, Deena (7 de outubro de 2017). «Data Analytics in Banking» (https://www.datasciencecentral.com/profiles/bl
ogs/data-analytics-in-banking). Consultado em 29 de novembro de 2017
13. «Data Science aplicado ao MKT: Entenda como isso funciona na prática» (https://web.archive.org/web/20171201
033044/https://www.borealtecnologia.com/single-post/2017/07/04/Data-Science-aplicado-ao-MKT-Entenda-como-
isso-funciona-na-pr%C3%A1tica). 4 de julho de 2017. Consultado em 22 de novembro de 2017. Arquivado do
original (https://www.borealtecnologia.com/single-post/2017/07/04/Data-Science-aplicado-ao-MKT-Entenda-como
-isso-funciona-na-pr%C3%A1tica) em 1 de dezembro de 2017
14. Saraswat, Manish (21 de setembro de 2015). «13 aplicações práticas de data science hoje» (https://www.vooo.pr
o/insights/13-applicacoes-praticas-de-data-science-hoje/). Consultado em 22 de novembro de 2017
15. Pereira, Tiago (24 de junho de 2017). «Cientista de Dados - por onde começar em 8 passos» (http://datascience
academy.com.br/blog/cientista-de-dados-por-onde-comecar-em-8-passos/). Consultado em 25 de novembro de
2017
16. «50 Best Jobs in America» (https://www.glassdoor.com/List/Best-Jobs-in-America-LST_KQ0,20.htm). 2017.
Consultado em 29 de novembro de 2017
17. Zhang, Vivian (14 de abril de 2017). «3 razões pelas quais o cientista de dados continua sendo o principal
emprego na América» (https://www.infoworld.com/article/3190008/big-data/3-reasons-why-data-scientist-remains-
the-top-job-in-america.html). Consultado em 25 de novembro de 2017
18. Columbus, Louis (13 de maio de 2017). «IBM prevê demanda por dados Os cientistas aumentarão em 28% até
2020» (https://www.forbes.com/sites/louiscolumbus/2017/05/13/ibm-predicts-demand-for-data-scientists-will-soar-
28-by-2020/#3ec2993c7e3b). Consultado em 25 de novembro de 2017

Obtida de "https://pt.wikipedia.org/w/index.php?title=Ciência_de_dados&oldid=55400590"

Esta página foi editada pela última vez às 18h05min de 4 de junho de 2019.

Este texto é disponibilizado nos termos da licença Atribuição-CompartilhaIgual 3.0 Não Adaptada (CC BY-SA 3.0) da
Creative Commons; pode estar sujeito a condições adicionais. Para mais detalhes, consulte as condições de
utilização.

Anda mungkin juga menyukai