Resumo
A participao das pessoas em redes sociais inegavelmente um fenmeno contemporneo
que apresenta como caracterstica no s o fluxo de informaes explcitas em forma de
dados, singulares e autorais, mas tambm uma informao (dados) proveniente do
movimento da prpria rede. nesse contexto que este artigo se insere com o objetivo de
revelar informaes que esto implcitas nos movimentos participativos de redes
sociotecnolgicas. Para isso, contamos com o aporte terico conceitual sobre a Teoria AtorRede (TAR), de Bruno Latour (2012): seguir as coisas atravs das redes em que elas se
transportam. Entendemos que, ao seguir os movimentos das redes sociais, podemos
visualizar informaes que refletem sentimentos e aes que esto implcitas nas conexes
sobre fatos e acontecimentos. Neste artigo, vamos analisar e monitorar as redes sociais
durante os jogos do Brasil na Copa do Mundo 2014. Essa abordagem nos remete a uma
pesquisa aplicada e experimental.
Palavras-chave: teoria ator-rede, jornalismo digital, redes sociais, redes sociotecnolgicas.
Introduo
Este artigo pretende desmistificar o processo de anlise de sentimentos em redes
sociais, de forma a apresentar o referencial terico sobre o assunto e a interface com o
jornalismo digital. Para atingir esse objetivo, pretende-se testar e pesquisar ferramentas
tecnolgicas de anlise de sentimentos e ferramentas de visualizao de informaes de
acesso livre. Como estudo de caso, vamos analisar o sentimento e a nfase de assuntos que
aparecem durante as partidas dos jogos da Seleo Brasileira durante a Copa do Mundo de
2014. Essa abordagem sistmica est sustentada pelo conceito da Teoria Ator-Rede (TAR),
de Bruno Latour (2012). Para registrar as interconexes pesquisadas de uma informao s
vezes presente mas implcita nas redes sociais, contamos com as ferramentas de
visualizao de dados de acesso livre para mostrar a informao e gerar uma memria dos
fatos ou acontecimentos marcantes.
Trabalho apresentado no GP Contedos Digitais e Convergncias Tecnolgicas, XIV Encontro dos Grupos de Pesquisas
em Comunicao, evento componente do XXXVII Congresso Brasileiro de Cincias da Comunicao.
2
sentimentos expressos por seus usurios em simples conversas ou mensagens (ARAJO M.,
2014).
Analisar sentimentos atravs das redes sociais no uma rea nova na web. Em
2009, j se divulgava na mdia esse campo at ento desconhecido para a rea das Cincias
Sociais e Computacionais. A ascenso das redes sociais e a participao dos internautas com
seus comentrios e opinies chamaram a ateno de muitas empresas que comearam a
monitorar os comentrios sobre seus produtos.
Um campo emergente conhecido como anlise de sentimentos est se
desenvolvendo em torno de uma das fronteiras inexploradas do mundo da
computao: traduzir as incertezas da emoo humana em forma de dados
slidos.3
http://tecnologia.terra.com.br/internet/analise-de-sentimentos-e-novo-campo-naweb,48e8887dc5aea310VgnCLD200000bbcceb0aRCRD.html
4
Scout Labs, Jodange e Newssift (2009)
5
Um algoritmo uma sequncia finita de instrues bem definidas e no ambguas, cada uma das quais
pode ser executada mecanicamente num perodo de tempo finito e com uma quantidade de esforo finita<
http://pt.wikipedia.org/wiki/Algoritmo>.
6
http://pt.wix.com/blog/2013/11/o-que-sao-hashtags/
O hashtag uma palavra-chave precedida pelo smbolo # que as pessoas incluem em suas mensagens.
Essencialmente, ela faz com que o contedo do seu post seja acessvel a todas as pessoas com interesses
semelhantes, mesmo que eles no sejam seus seguidores ou fs.
http://www.socialmention.com/
primeiro jogo do Brasil (Heurstica 1). Para mostrar as menes sobre um determinado
assunto ou fato, utilizamos, alm da hastag-chave, as variveis de nfase para esboar o
volume de menes e as palavras ou termos para identificar o nome da meno. No quadro
abaixo, podemos identificar que, em um determinado momento da anlise, os assuntos mais
citados relacionados com a Copa do Mundo nas redes sociais foram a prpria Copa do
Mundo, Abertura, Brasil, Crocia, Vamos, Torcendo... Essas palavras tiveram os crculos
maiores e enfatizam uma mobilizao e um sentimento que podemos arriscar ser de certa
forma positivo dos internautas sobre o comeo do Brasil na Copa do Mundo.
Outra informao que pode ser visualizada pela nfase das menes nas redes sociais so os
nomes dos jogadores que mais se destacaram durante o jogo. No momento que o jogador
Marcelo, da Seleo Brasileira, fez um gol contra, muitos comentrios foram postados nas
redes sociais. Um crculo maior com o nome Marcelo representa essa nfase de comentrios
Documentao: https://code.google.com/p/socialmention-api/wiki/APIDocumentation
julho, trs dias depois da derrota do Brasil para o time da Alemanha, e percebe-se que ainda
h um sentimento negativo sobre a derrota.
Processo de anlise, coleta e visualizao dos dados
O jornalismo de dados um termo que, ao meu ver, engloba um
conjunto cada vez maior de ferramentas, tcnicas e abordagens para
contar histrias. Pode incluir desde a Reportagem com o Auxlio do
Computador (RAC, que usa dados como uma "fonte") at as mais
avanadas visualizaes de dados e aplicativos de notcias. O
objetivo em comum jornalstico: proporcionar informao e
anlise para ajudar a nos informar melhor sobre as questes
importantes do dia. Aron Pilhofer, New York Times.9
O que vamos abordar na prxima seo o processo que envolve a coleta de dados
at a visualizao grfica que foi adotada no estudo de caso sobre os jogos do Brasil na
Copa do Mundo 2014 (grficos 1 e 2). Seguindo o comentrio do jornalista Aron Pilhofer,
do New York Times, esse processo de captao e visualizao de dados exige do jornalista
conhecimento de ferramentas para esse fim. E mais importante do que entender o processo
perceber que essas tcnicas servem para o jornalista responder a perguntas e que atravs
de grficos ou infogrficos gerados a partir dos dados, ele pode contar uma histria ou um
fato.
As etapas e o resultado desta pesquisa sero apresentados concomitantemente descrio
de cada etapa do processo.
1 etapa: coleta de dados
xapturar os dados que voc deseja, ou seja, acess-los em suas fontes originais
sites, bases de dados, PDFs, documentos fsicos, imagens, etc. e adapt-los para um
formato que permita que eles sejam utilizados da forma pretendida.
No estudo de caso dos jogos do Brasil, a primeira etapa foi identificar quais #hastags
estavam sendo mais usadas no momento do jogo do Brasil. Essas hastags variam de
intensidade. Para tal, foi utilizado o Twitter com o objetivo de identificar as #hastags que
representavam comentrios sobre o jogo do Brasil. Nos primeiros jogos, as #hastags que
representavam
contexto
daquele
momento
foram
#WorldCup2014Brazil,
Apesar de alguns resultados ainda na fase da coleta, uma verificao mais expressiva se fez
necessria, e um dos pontos positivos do SocialMention que toda informao de uma
hastag registrada em tabelas Excel sobre as seguintes unidades de anlises (Tabela 1):
Unidades de anlise
sentimento
retweets
urls_cited
hashtags
referncias
top_users
10
Descrio
pontuao positiva ou negativa inteiro, ex: -1, 0, 8, etc
falar de um retweet, boolean, ex: "RT @ ..."
nmero de ligaes em meno
nmero de hashtags em meno, ex: "... # hashtag"
nmero de referncias @ em meno
conjunto de principais usurios por atividade
http://www.socialmention.com
top_hashtags
conjunto de top hashtags
top_keywords
conjunto de palavras-chave top
Tabela 1 - Unidades de anlise do algoritmo do programa SocialMention
Todo resultado de busca sobre uma #hastag-chave vem acompanhado dos resultados das
unidades de anlise sob a tica da #hastag pesquisada, ou seja, uma busca para identificar
os sentimentos da hastag #Brasil2014 #WorldCup2014 vem acompanhada dos seguintes
relatrios de dados: retweets, urls_cited, hashtags (relacionadas), referncias, top_users,
top_hashtags, top_keywords.
Grfico 4 Interface do programa SocialMention, com a indicao dos resultados das unidades de
anlise em tabela Excel para download
2 etapa: filtragem
Nessa fase, temos os dados coletados sobre a #hastag-chave, mas nem sempre esses
dados aparecem de forma limpa. H a necessidade de correo de possveis falhas nos
dados, sendo possvel se referir #hastag-chave tambm como complementao. Essa fase
corresponde edio jornalstica, em que so selecionadas, trabalhadas e verificadas as
informaes que efetivamente faro parte da reportagem final.
Relatrio sobre as #hastags relacionadas
hastag-chave #Brasil2014
#WorldCup2014, apresentadas em
planilha Excel.
3 Etapa: visualizao
RAW , de uso aberto, para criar visualizaes personalizadas sobre as unidades de anlises
relacionadas s #hastags-chave, baseadas em vetores da biblioteca D3.js12 .
Vale ressaltar que o D3.js apresenta uma biblioteca de vrias formas de
visualizao, e sendo assim exige do jornalista ou designer uma anlise sobre o tipo de
grfico mais adequado aos dados que se deseja visualizar. importante perceber que a
visualizao deve auxiliar na leitura e na identificao de uma histria ou fato (Heurstica
4). Mas nem sempre isso possvel devido s relaes e variveis que se tem de um dado.
Os grficos nesta pesquisa geralmente foram usados para identificar uma nfase de
publicaes de uma #hastag ou palavar-chave, ento as variveis empregadas no grfico
foram Hierarquia, Tamanho, Nome e Cor. A forma de crculo foi a mais efetiva para
mostrar tais variveis, como pode ser percebido no grfico.
11
12
http://raw.densitydesign.org/
http://d3js.org/
Consideraes finais
Foram sete jogos do Brasil na Copa do Mundo de 2014 em que o processo de coleta,
filtragem e visualizao dos dados foi aplicado para identificar o sentimento do internauta
que estava interagindo nas redes sociais no momento dos jogos. As heursticas propostas
foram observadas e em todos os jogos foram identificadas de tal forma que a visualizao
pudesse contar a histria do jogo (Heurstica 4).
No jogo #brasilvsmexico, a participao do goleiro Ochoa13 referenciada na
visualizao dos dados daquele jogo pela nfase dos posts (volume do crculo) sobre a boa
atuao na partida contra o Brasil (Heurstica 2).
13
Manchete do site do Globo Esporte sobre a partida Brasil x Mxico - Ochoa brilha, Brasil empata
sem gols com o Mxico, mas ainda lidera. Disponvel em: <http://globoesporte.globo.com/jogo/copa-domundo-2014/17-06-2014/brasil-mexico.html>.
REFERNCIAS
ARAJO M., GONALVES P., CHA M., BENEVENUTO F., ifeel: A system that
compares and combines sentiment analysis methods - Proceedings of the companion
publication of the 23rd international conference on World wide web companion p.7578,2014
BUENO F. Mtodos Heursticos - Teoria e Implementaes. (2009) Disponvel em:
https://wiki.ifsc.edu.br/mediawiki/images/b/b7/Tutorial_m%C3%A9todos_heur%C3%ADs
ticos.pdf, acessado 12/07/2014.
BRUNS, A.; BURGESS, J. The Use of Twitter Hashtags in the Formation of Ad Hoc
Publics. In: European Consortium for Political Research Conference, Reykjavik, 2011.