Anda di halaman 1dari 64

UNIVERSIDAD CARLOS III DE MADRID

FACULTAD DE HUMANIDADES COMUNICACIN Y DOCUMENTACIN


DEPARTAMENTO DE BIBLIOTECONOMA Y DOCUMENTACIN
Mster en Investigacin en Documentacin
2011/2012
Trabajo de Fin de Mster

LA RELACIN DEL PERIODISMO DE DATOS CON BIG DATA Y OPEN DATA

Autora: ngeles Mario


Tutor: Dr. Luis Joyanes Aguilar

TRABAJO DE FIN DE MSTER HA SIDO POSIBLE GRACIAS A LA BECA MAEC-AECID PARA


EXTRANJEROS, CONVOCADA POR LA AGENCIA ESPAOLA DE COOPERACIN INTERNACIONAL
PARA EL DESARROLLO Y QUE ME FUE CONCEDIDA EN EL PERODO ACADMICO 2011-2012.

CONTENIDO
1.INTRODUCCIN A LA INVESTIGACIN ....................................................................... 5
1.1 ANTECEDENTES Y MOTIVACIN ............................................................................................................................... 5
1.2 OBJETIVOS ............................................................................................................................................................... 5
1.3 OBJETO Y ESTADO DE LA CUESTIN ......................................................................................................................... 6
1.4 HIPTESIS ................................................................................................................................................................ 9
1.5 JUSTIFICACIN ......................................................................................................................................................... 9
1.6 METODOLOGA ......................................................................................................................................................... 9

1.6.1 LA WEB 2.0 EN MI TRABAJO DE INVESTIGACIN ................................................................ 12


2.PERIODISMO DE DATOS .................................................................................................. 13
2.1 INTRODUCCIN ...................................................................................................................................................... 13
2.2 LOS ANTECEDENTES DEL PERIODISMO DE DATOS: PERIODISMO DE PRECISIN Y CAR ......................................... 15
2.3 DEFINICIONES DE PERIODISMO DE PRECISIN ...................................................................................................... 16
2.4 LA EVOLUCIN DEL PERIODISMO DE PRECISIN Y DEL PERIODISMO DE DATOS ................................................... 17
2.5 CARACTERSTICAS DEL PERIODISMO DE DATOS .................................................................................................... 25
2.5.1 OBJETIVIDAD Y TRANSPARENCIA ....................................................................................... 25

2.5.2 NECESIDAD DE ORDENAR ................................................................................................... 26


2.5.3 TRABAJO EN GRUPO ........................................................................................................... 27
2.6 CMO SE HACE PERIODISMO DE DATOS? ............................................................................................................ 27
2.6.1 COMPILAR LOS DATOS ........................................................................................................ 28

2.6.2 FILTRADO Y LIMPIEZA DE DATOS ....................................................................................... 29


2.6.3 CONTEXTUALIZAR LA INFORMACIN ................................................................................. 30
2.6.4 COMBINAR LOS DATOS ....................................................................................................... 31
2.6.5 COMUNICACIN DE LOS DATOS .......................................................................................... 32
2.7 DOS EJEMPLOS DE PERIODISMO DE DATOS ............................................................................................................ 38
2.7.1 DNDE VAN MIS IMPUESTOS? ....................................................................................... 38

2.7.2 METADONA Y LA POLTICA DEL DOLOR ......................................................................... 39


3.HERRAMIENTAS PARA EL PERIODISMO DE DATOS .............................................. 40
3.1 MAPAS .................................................................................................................................................................... 40
3.2 SCREEN SCRAPING (RASPADO)................................................................................................................................ 41
3.3 LENGUAJE DE SCRIPTS ........................................................................................................................................... 41
3.4 MANEJO DE BASES DE DATOS ................................................................................................................................. 41
3.5 VISUALIZACIN DE DATOS ..................................................................................................................................... 42
3.6 LIMPIEZA DE DATOS ............................................................................................................................................... 42
3.7 ANLISIS ESTADSTICO ........................................................................................................................................... 43
3.8 OTRAS HERRAMIENTAS .......................................................................................................................................... 43

4.BIG DATA .............................................................................................................................. 44


4.1 BIG DATA Y SU INFLUENCIA EN EL PERIODISMO .................................................................................................... 49
4.2 EJEMPLO DE TRABAJO PERIODSTICO CON GRANDES BASES DE DATOS .................................................................. 50

5.OPEN DATA (DATOS ABIERTOS) ................................................................................... 52


5.1 OPEN DATA Y EL PERIODISMO ............................................................................................................................... 53
5.2 ESPAA................................................................................................................................................................... 54
5.3 FORMATO ............................................................................................................................................................... 56

6.CONCLUSIN ....................................................................................................................... 56
7. ANEXO .................................................................................................................................. 58
7.1 FRASES ................................................................................................................................................................... 58
7.2 BIBLIOGRAFA ........................................................................................................................................................ 59

7.2.1 BIBLIOGRAFA INTRODUCCIN A LA INVESTIGACIN ........................................................ 59


7.2.2 BIBLIOGRAFA PERIODISMO DE DATOS .............................................................................. 60
7.2.3 BIBLIOGRAFA BIG DATA Y OPEN DATA ............................................................................ 62

ILUSTRACIONES
ILUSTRACIN 1. "THE COLOUR OF MONEY". .............................................................................................................. 18
ILUSTRACIN 2. "LESS WIND, LOTS OF DAMAGE". ................................................... ERROR! MARCADOR NO DEFINIDO.
ILUSTRACIN 3. "THE HOMICIDE REPORT". ............................................................................................................... 21
ILUSTRACIN 4. "AFGHANISTAN IEDS MAPPED"........................................................................................................ 22
ILUSTRACIN 5. THE INVERTED PYRAMID OF DATA JOURNALISM. ....................... ERROR! MARCADOR NO DEFINIDO.
ILUSTRACIN 6. EXPORTS AND IMPORTS TO AND FROM DENMARK & NORWAY FROM 1700 TO 1780. ................... 33
ILUSTRACIN 7. MAPA GEOLGICO DE WILLIAM SMITH (1815). ........................................................................... 33
ILUSTRACIN 8. DISTRIBUCIN DE LA AYUDA INTERNACIONAL DE ESTADOS UNIDOS EN ELTIEMPO: 1946-2005.. 34
ILUSTRACIN 9. SIETE GNEROS.. ........................................................................................................................... 35
ILUSTRACIN 10. WHERE THE HEAT AND THE THUNDER HIT THEIR SHOTS............................................................. 37
ILUSTRACIN 11. "DNDE VAN MIS IMPUESTOS?". ................................................................................................... 38
ILUSTRACIN 12. METHADONE AND THE POLITICS OF PAIN. ................................................................................... 40
ILUSTRACIN 13. A DECADE OF DIGITAL UNIVERSE GROWTH.. ............................................................................. 45
ILUSTRACIN 14. "DATA INFLATION".. ....................................................................................................................... 46
ILUSTRACIN 15. "DOLLARS FOR DOCS". ................................................................................................................... 50

1. INTRODUCCIN A LA INVESTIGACIN
A medida que la informacin disponible en Internet se ha ido multiplicando, el Periodismo tambin
fue ampliando sus fuentes de informacin de manera tan relevante que naci una nueva forma de
contar historias: el Periodismo de Datos (Data Journalism en ingls), aquel que se basa principal o
exclusivamente en bases de datos y documentacin en lnea para crear una historia.
Dos de los fenmenos que ms han ido acelerando el desarrollo de esta nueva especialidad han sido
Big Data y Open Data, los cuales han ido impulsando el desarrollo de nuevas herramientas para su
anlisis y comunicacin. De ah que los periodistas fueron y continan- adquiriendo nuevas
habilidades en orden a analizar, filtrar y hacer visibles grandes masas de datos.
Lo que pretende este Trabajo de Fin de Mster es estudiar esta nueva disciplina en el marco de la
Documentacin y ser tanto material de consulta para periodistas que quieren adentrarse en la actividad
como para documentalistas que quieren hacer llegar el material de su trabajo a la poblacin a travs de
los medios de comunicacin.
1.1 ANTECEDENTES Y MOTIVACIN
Mi formacin de grado y mi experiencia profesional se han dado ms que nada en el periodismo
grfico. Por ello, cuando comenc el Mster de Investigacin en Documentacin en la Universidad
Carlos III cre que mis estudios apuntaran a perfeccionar la tarea documentalista del periodista.
Sin embargo, diferentes factores se conjugaron para que encontrara en el Periodismo de Datos un
inters an mayor. Pues en este caso no se trata slo de la tarea de documentarse para contextualizar
una noticia, sino de que los datos se vuelven la noticia misma.
Y entre los factores que me llevaron a tomar esta decisin se encuentra el rpido desarrollo del
Periodismo de Datos a nivel internacional, aunque con todava poco anclaje en el mundo acadmico en
espaol. Y, aunque el Periodismo de Datos tiene sus antecedentes en tiempos previos a la llegada de
Internet, ste sumado a Big Data, Open Data y otros fenmenos han cambiado el panorama hasta
llegar al actual contexto que es de sobreabundancia de informacin.
Profesionalmente entonces, es de mi inters que tanto los periodistas conozcan el potencial de las
enormes cantidades de datos disponibles para la creacin de noticias como que los mismos
responsables de la creacin y puesta a disposicin de datos, los documentalistas, conozcan dicho
potencial.
1.2 OBJETIVOS

Por lo tanto, el objetivo general planteado para esta investigacin, es realizar una introduccin
actualizada al Periodismo de Datos (tanto su contextualizacin y definicin como las herramientas y
habilidades que involucra) y relacionarla con los fenmenos de Big Data y Open Data.
Por ende, los objetivos especficos que se han determinado son los siguientes:
1. El Periodismo de Datos. Dar a conocer las caractersticas de esta especializacin del
periodismo, analizando tanto sus antecedentes como su presente.
2. Big Data y Open Data y su influencia en el Periodismo de Datos. Describir cmo ambos
fenmenos potencian nuevos contenidos informativos.
3. Herramientas del Periodismo de Datos. Repasar las principales herramientas que facilitan el
trabajo de elaboracin y lectura de los datos aplicables a los medios de comunicacin.
1.3 OBJETO Y ESTADO DE LA CUESTIN
Wikileaks didn't invent data journalism. But it did give newsrooms a reason to adopt it. There was just
too much data for it to happen any other way.
Simon Rogers, enero 2011
Es de destacar que el trabajo presente se centrar en el tratamiento con fines periodsticos del enorme
volumen de datos disponibles en el entorno digital. Esto es, el Periodismo de Datos o Data Journalism
como se le llama ms comnmente en su terminologa anglosajona.
El trmino Periodismo de Datos comienza a divulgarse en los aos noventa como respuesta a
cantidades de informacin antes desconocidas y a nuevas herramientas para su tratamiento en las
noticias. Sin embargo, cobr ms fuerza en los ltimos aos, con las iniciativas aisladas sobre todo de
diarios de Estados Unidos y de Gran Bretaa, hasta la actualidad cuando ya se han sumado al
movimiento medios de otros pases y no slo diarios sino tambin programas de televisin.
Para entender mejor el agitado momento en que se encuentra el Periodismo de Datos alcanza con
destacar acontecimientos relevantes recientes:
-

En 2011, de 16 ganadores del concurso Knight News Challenge de la Knight Foundation


para subvencionar innovaciones en los medios de difusin, 14 eran de proyectos relacionados
con el Periodismo de Datos. Asimismo, la convocatoria 2012 tambin repartir ms de 1
milln de dlares en iniciativas centradas especficamente en este tema.

En enero de 2012 se lanza el primer concurso internacional de Periodismo de Datos. La


iniciativa es de la Global Editors Network (GEN) en asociacin con Google y el European

Journalism Centre. Durante los tres meses que se mantiene abierta la convocatoria, se postulan
ms de 300 trabajos procedentes de 60 pases.
-

Recientemente, en abril de 2012, en el marco de The School of Data, durante el Festival


Internacional de Periodismo en Italia se lanz The Data Journalism Handbook, un manual
para Periodismo de Datos de cdigo abierto y escrito de manera colaborativa entre
especialistas de todo el mundo.

Y, a pesar de que hechos como este hacen parecer que el Periodismo de Datos es un fenmeno nuevo,
este tiene importantes antecedentes. Pero el caudal informativo actual y las herramientas a disposicin
de los periodistas son los que marcan la gran diferencia.
De estos antecedentes, cabe destacar que el Periodismo de Datos tiene sus races en el Computer
Assisted Reporting (CAR), que en espaol se traduce como Periodismo Asistido por Computadora
y en el Periodismo de Precisin, el cual cobr impulso en los aos sesenta sobre todo gracias al
profesional y acadmico Philip Meyer1.
Por parte de CAR, este naci en la dcada del 50 transformndose en el primer acercamiento
organizado y sistemtico del uso de los ordenadores para recolectar y analizar datos en orden a
mejorar las noticias. Su primer uso fue por parte de la CBC (Canadian Broadcasting Corporation) que
en 1952 que lo implement para predecir los resultados de las elecciones presidenciales
(BOUNEGRU, 2012).
Y, en tanto que CAR es una tcnica, basndose en ella es que Meyer comienza a vislumbrar un
cambio de concepcin de la actividad periodstica, en la que la vieja tradicin de los periodistas
transportadores de informacin est siendo sustituida por periodistas procesadores de informacin

Actualmente, Philip Meyer es profesor emrito de la Universidad de North Carolina en Chapel Hill.

(MEYER, 1993). Y fue el mismo Philip Meyer quien, inspirado en la propuesta de un colega, llam
as entonces al Periodismo que era el objeto de sus estudios y aficin y asent el nombre en su libro
del ao 1973, Precision Journalism. A Reporters Introduction to Social Science Methods. Este
libro fue fundamental para un acercamiento acadmico a esta prctica del Periodismo, rol que cumple
hasta la actualidad ya que sigue siendo un manual de consulta.
Este ltimo tipo de Periodismo, segn la definicin de Meyer (1993) es la aplicacin de mtodos
cientficos de investigacin social y comportamental a la prctica del Periodismo. Tales mtodos
pueden incluir sondeos, encuestas, anlisis de contenidoconsiguiendo que su eje sean los nmeros y
las estadsticas.
Sin embargo, aunque hay una relacin directa entre el Periodismo de Precisin y el Periodismo de
Datos, este ltimo trmino es ms amplio ya que abarca toda informacin procesable por ordenadores.
Su prctica se ha fortalecido desde 2010 a partir de la forma en que medios como The Guardian y The
New York Times trataron las grandes cantidades de informacin que se derivaron de los cables de
WikiLeaks.
Pero hasta llegar all, segn Liliana Bounegru (2012), del European Journalism Centre una de las
primeras alusiones a lo que hoy se conoce como Periodismo de Datos es la que hizo en 2006 el
periodista Adrian Holovaty en su ensayo A fundamental way newspaper sites need to change. El
texto de Holovaty discurre sobre que hay contenidos que si se los tratase a partir de una base de datos
podran complementar los big blob of text, es decir los grandes bloques de texto.
A la actualidad todava existe una discusin sobre si Periodismo de Datos no es lo mismo que CAR o
el Periodismo de Precisin pero actualizado. Sin embargo, quienes lo defienden como una nueva
especializacin apuntan a que los datos son la noticia en s.
1.3.1 TCNICAS Y HERRAMIENTAS QUE LO HACEN POSIBLE
Asimismo, el Periodismo de Datos no puede comprenderse en su totalidad sin mencionar las
herramientas tecnolgicas que involucra y que constantemente estn evolucionando. Por lo tanto, este
existe no slo porque hay ms informacin a disposicin sino tambin porque surgen nuevas tcnicas
para el proceso de esta.
Hablar de Periodismo de Datos es referirnos a tcnicas nuevas en la creacin de informacin
periodstica que requiere de conocimientos especficos y destrezas en el uso de bases de datos y
presentacin (visualizacin) de la informacin en nuevas interfaces. (FLORES Y CEBRIN, 2012)

Tal es la conclusin de Jess Flores Vivar Doctor en Ciencias de la Informacin de la Universidad


Complutense de Madrid- y de Cebrin Herreros, quienes en la actualidad trabajan en un proyecto de
investigacin de tcnicas del Periodismo de Datos2.
1.4 HIPTESIS
El caudal de informacin disponible que se ha visto potenciado en los ltimos aos gracias a Internet
ha derivado en una nueva manera de informacin periodstica: el Periodismo de Datos. Especialmente
la extensin de fenmenos como Big Data y Open Data ha llevado a que los periodistas aprendan tanto
el uso de las nuevas herramientas que exige la lectura de grandes cantidades de datos, como la
limpieza (o normalizacin y unificacin) de estos para luego comunicar la informacin al pblico.
1.5 JUSTIFICACIN
Por una parte, la intencin de este trabajo es dar a conocer el nuevo uso que se est haciendo en el
Periodismo de la cantidad de informacin disponible en el mundo digital, especialmente de bases de
datos tanto pblicas como privadas.
Por otra parte, entendemos que hay una necesidad de dar un anclaje acadmico en espaol a un tema
que prolifera a gran velocidad pero que lo hace ms que nada en ingls y ms en circuitos
profesionales de la informacin que en mundo universitario.
Adems, aquello que se desarrolla en el presente trabajo es de utilidad tanto para periodistas e
informadores como para documentalistas, quienes son los responsables de crear y hacer accesibles
bases de datos y documentos.
1.6 METODOLOGA
El presente trabajo requiri una documentacin incesante debido a que el Periodismo de Datos es un
tema que est floreciendo tanto desde el mbito de la investigacin como del profesional y relacionado
al cual surgen constantemente nuevos conocimientos y, ms que nada, herramientas.
As pues, entre las fuentes de informacin utilizadas para realizar esta investigacin es de mencionar
que primero se hizo una lectura de los contenidos ms recientes, para luego ir a los antecedentes y a
las fuentes acadmicas. De los primeros destacamos el Data Journalism Handbook, el cual fue
publicado muy recientemente, ya iniciado este trabajo, y es un manual completo y actualizado sobre el
tema.

En el marco del Proyecto Cybermedia II: Desarrollos e innovaciones del periodismo en las redes sociales en Internet y
telefona mvil. Convergencias, modelos de negocios, servicio y formacin.

Este naci como una iniciativa colectiva en el Festival Mozilla 2011 en Londres y culmin en abril de
2012 cuando fue presentado en el International Journalism Festival, en Perugia (Italia). Sus
principales propulsores fueron la Open Knowledge Foundation y el European Journalism Centre que
convocaron a algunos de los profesionales ms expertos en el tema para colaborar de manera conjunta
en su redaccin.
La intencin era escribir un manual que sirviese de introduccin al Periodismo de Datos y que
respondiese a las siguientes preguntas:
-

Dnde puedo encontrar datos?

Cmo puedo pedir datos?

Qu herramientas puedo utilizar?

Cmo puedo encontrar historias en los datos?

Por otra parte, entre las fuentes de constante actualizacin caben mencionar los artculos que brindan
fundaciones e instituciones con autorizada voz en lo que respecta al estudio constante del Periodismo
y de las Ciencias de la Informacin como el Nieman Journalism Lab -un proyecto conjunto de la
Nieman Foundation y la Universidad de Harvard-, el Poynter Institute y el Freedom Forum for Media
Studies (www.freedomforum.org).
Tambin estn aquellos contenidos de consultoras privadas especialistas en temas de tecnologa como
OReilly Media que posee un sello editorial propio y la asociacin Investigative Reporters and Editors
(IRE) que en su sitio web cuenta con revistas, publicaciones y enlaces a su centro asociado, el
National Institute for Computer-Assisted Reporting (NICAR). Tambin son importantes los estudios
de la consultora internacional McKinsey Global Institute, al igual que los de Cisco Systems o IBM.
En cuanto a publicaciones, algunas de las ms prestigiosas que han tratado de manera especial los
temas que se citan en este trabajo son The Economist, Wired y Nature. Luego estn los aportes
de blogs de profesionales en el marco o no de sus medios de trabajo- y que se han convertido en unos
de los principales promotores del tema en cuestin, como el de Paul Bradshaw, tambin consultor y
profesor de Periodismo on-line de la Universidad de Birmingham o las columnas de Simon Rogers en
The Data Blog, del diario ingls The Guardian.
Este ltimo tambin es autor del libro que se cuenta entre los de ms reciente publicacin relacionados
al Periodismo de Datos, llamado Facts are sacred (ROGERS, 2011) que, basado en la experiencia
propia, propone que una nueva misin del periodista es la de mediar entre la informacin disponible
de organizaciones pblicas o privadas y el procesamiento de esta para la audiencia.

10

Otra voz especializada que cabe mencionar es la del profesor y periodista espaol Alberto Cairo, con
quien tom el curso en lnea "Introduccin a la Infografa y Visualizacin para Periodistas, ofrecido
por el Centro Knight para el Periodismo en las Amricas. El espaol es autor de dos libros
recomendables para la puesta en prctica de este periodismo, especialmente en lo que refiere a la
visualizacin de los datos: El arte funcional: infografa y visualizacin de la informacin e
Infografa 2.0: visualizacin interactiva de informacin en prensa.
En cuanto a los antecedentes acadmicos, bas gran parte de la bibliografa en el creador del concepto
de Periodismo de Precisin Philip Meyer y en quienes siguieron y ampliaron sus enseanzas.
De Meyer revis aquella bibliografa suya a mi alcance incluyendo el discurso de su ltima
comparecencia pblica de relevancia, la cual la hizo en 2011 con ochenta aos de edad. Su gran aporte
ha estado en reforzar el costado cientfico del Periodismo con sus mtodos de investigacin tomados
de las ciencias sociales (encuestas, estadsticas, matemticas).
En Espaa, su traductor y principal divulgador es Jos Luis Dader, profesor de la Universidad
Complutense de Madrid y quien ampli tambin su teorizacin con libros como Periodismo de
Precisin: va socioinformtica de descubrir noticias. En l procura dar importancia y contenido
terico a una rama del periodismo descuidada en su criterio ya que afirma que mientras disponemos
de ros de tinta sobre el deber ser o los valores del periodismo, la cuestin de los mtodos
ingenuamente se soslaya y resulta casi inexistente en la discusin de la profesin (DADER, 1997).
Dader sugiere tambin el aprovechamiento de las bases de datos, de las nuevas tecnologas
informativas y de Internet para descubrir y tratar nuevas noticias mediante tcnicas estadsticas y
cientficas que lleven a un periodismo preciso.
As pues, estos dos autores han sido la base bibliogrfica de este trabajo, a partir de quienes enlac
para conocer otros acadmicos y otros estudiosos del Periodismo de Precisin.
En la actualidad se habla ms del Periodismo de Datos y su bibliografa ha ido actualizndose de
manera permanente y por vas no slo acadmicas: publicaciones, libros, ponencias y congresos,
medios de comunicacin e Internet, sobre todo.
Para este trabajo he procurado concentrarme sobre todo en estas ltimas publicaciones, de las cuales
por lo menos el setenta por ciento se encuentran en ingls.
Cabe mencionar tambin que en el mes de julio de 2012 (del 23 al 27) asist al Curso de Verano
Periodismo de Datos organizado por la Universidad Complutense. All tambin ampli mis
conocimientos y fuentes de informacin.
11

1.6.1 LA WEB 2.0 EN MI TRABAJO DE INVESTIGACIN


El desarrollo de Internet y de las tecnologas de la informacin ha alterado el panorama de las fuentes
y de los sistemas de recuperacin inherentes a ellas, debido a la aparicin de tipos documentales
completamente nuevos y de aplicaciones de navegabilidad e intercambio de informacin que han
potenciado la interconexin entre usuarios y la transferencia de informacin entre ellos. (CORDN
et alter, 2012)
Con esta frase de las primeras pginas del libro Las Nuevas fuentes de informacin: informacin y
bsqueda documental en el contexto de la web 2.0 quiero destacar cunto me ha servido el
intercambio de informacin al que se refieren los autores, para llegar a contenido valioso y de
importancia para este trabajo.
Pues tanto Internet como la web 2.0 han venido a complementar los medios convencionales de
informacin. Entre las herramientas utilizadas y ms consultadas para este trabajo destaco:
-

Herramientas RSS o de Sindicacin de Contenidos: imprescindibles para el manejo de la


informacin y la actualizacin permanente.

Twitter: las cuentas de especialistas en Periodismo de Datos como Alberto Cairo


@albertocairo, Guardian Data Store @datastore, Paul Bradshaw @paulbradshaw, Sandra
Crucianelli @spcrucianelli, Mar Cabra @cabralens, La Nacin Data @LNdata, Marcelo
Soares @msoares, entre otros

Wikis: destaco sobre todo el del grupo de Periodismo de Datos del MediaLab Prado de
Madrid donde los profesionales aportan todo aquello que consideran de relevancia para el
desarrollo de esta prctica.

Blogs de actualizacin permanente y novedades constantes. Cabe mencionar:


o

Data Driven Journalism (datadrivenjournalism.net), una iniciativa del European


Journalism Centre (http://ejc.net/) para acercar a los periodistas al uso de bases de
datos y fuentes de informacin con distintas tcnicas, herramientas y habilidades.

Open Knwoledge Foundation Blog (http://okfn.org/)

El Online Journalism Blog (http://onlinejournalismblog.com/), el cual comenta y


debate acerca de entre otros temas, el Periodismo de Datos. Su editor es Paul
Bradshaw

NacinData (http://blogs.lanacion.com.ar/data/), blog del diario La Nacin de


Argentina especializado en periodismo y datos. Naci en 2012, durante el proceso de
este trabajo.

12

DataBlog (http://datablog.ahref.eu/), el cual forma parte del proyecto iData,


patrocinado por la fundacin Ahref y que pretende desarrollar la primera plataforma
italiana para el Periodismo de Datos.

A final de contas (http://afinaldecontas.blogfolha.uol.com.br/), blog del diario Folha


de So Paulo con iniciativa similar a la de otros medios. Escrito por el periodista
Marcelo Soares, tambin naci en abril de 2012.

DataBlog de The Guardian(http://www.guardian.co.uk/news/datablog), blog pionero


especializado en este tema e inspirador de otros. Naci en 2009 como parte del
proyecto DataStore que dirige Simon Rogers.

ProPublica (http://www.propublica.org/), fundacin periodstica sin fines de lucro de


Estados Unidos que ya ha ganado dos premios Pulitzer por sus trabajos de
investigacin. Destaca por la importancia que da al Periodismo de Datos.

Revistas y libros electrnicos, a algunos de los cuales tuve acceso mediante la biblioteca y los
recursos electrnicos de la Universidad Carlos III de Madrid.

Sistema de citas y fuentes bibliogrficas


En el texto del trabajo he utilizado el sistema de citas autor-fecha y para crear las referencias
bibliogrficas de las fuentes de informacin consultadas he utilizado las normas ISO 690 e ISO 690-2.
En cuanto a la bibliografa, esta se ha reunido y figuran tras lo grandes bloques que conforman el
trabajo. En primer lugar, figura la dedicada a la introduccin; le sigue el apartado relacionado con el
Periodismo de Datos y, por ltimo, la destinada a fuentes sobre Big Data y Open Data.
Para la gestin de toda la informacin bibliogrfica y documental me he auxiliado con los gestores de
informacin Refworks y Zotero. Este ltimo ha sido usado particularmente para las pginas web.
1.PERIODISMO DE DATOS
2.1 INTRODUCCIN
Un campo que se est perfeccionando y est desarrollando una nueva especializacin a raz de la
multiplicacin de los datos en el mundo digital es el Periodismo. Y, si bien para esta disciplina no es
algo nuevo la lectura, el anlisis y la publicacin de bases de datos, s lo son la importancia que estas
han adquirido y las nuevas herramientas y habilidades necesarias para mejor aprovechamiento de los
datos en orden a su comunicacin.
De ello trata el Periodismo de Datos, una especializacin que suena cada vez ms entre los
profesionales de los medios a partir sobre todo de la avalancha de informacin que ha significado la
13

aparicin de Internet y de fenmenos como Big Data, Open Data y la lectura y comunicacin de las
historias que hay detrs de los datos.
Pues en este tipo de periodismo el eje no es retransmitir los datos de las bases de datos tal cual se
consiguen o estn disponibles si bien puede hacerse-, sino que su funcin es la de informar a partir de
ellas. Entonces, se pueden establecer relaciones entre los datos, practicar minera de datos, aplicar
estadsticas, armar una secuencia Es decir, extraer una historia de los datos. Y los datos pueden ser
tanto el origen de una investigacin para una noticia como pueden acompaar una noticia o pueden ser
la noticia misma.
Periodismo de Datos hace entonces referencia al conjunto de herramientas y prcticas que utilizan
datos para la construccin de una historia (o noticia). Y estos datos pueden tanto acompaar una
historia como ser fuentes de una investigacin.
Segn la definicin del profesor Jess Flores Vivar (2012): El Periodismo de Datos es una forma de
periodismo de investigacin que utiliza la informtica (ordenadores y sistemas algortmicos) para
buscar, contrastar, visualizar, combinar datos y proporcionar informacin de diferentes fuentes,
pblicas o privadas.
El video documental Journalism in the age of data (2010) que llev a cabo el periodista
especializado en multimedia Geoff McGhee (2009) para la universidad de Standford, fue un
disparador para dejar asentado tanto la necesidad de desarrollar ms este Periodismo como las
iniciativas que ya apuntaban en esa direccin.
En el vdeo, McGhee procura mostrar la importancia de fusionar las narrativas tradicionales del
periodismo con los avances tecnolgicos en torno a la explotacin de los datos. Para ello entrevist a
profesionales de medios de comunicacin e investigadores de distintos centros que trabajaban tanto en
el desentraar y comunicar los datos como en las herramientas idneas para ello, sobre todo en lo que
refiere a su visualizacin.
Y como ya demostraba McGhee en dicho material, en la actualidad, cada vez ms los medios son
conscientes de la cantidad de historias que hay detrs de los datos y que no se las conoce porque no se
las busca. Pero estn ah, estn en los archivos, en las bases de datos, en los Boletines Oficiales de
Estados, en los informes oficiales, en las bibliotecas, en las empresas, en Internet.
Desentraarlas, darles contexto y hacerlas visibles y notorias al resto de la poblacin es la misin del
Periodismo de Datos (en ingls, Data Journalism), ms que nunca ahora que existe tanta informacin
al alcance de la mano gracias a Internet y a las nuevas tecnologas de la informacin.

14

Claro que hay algunos medios que han sido pioneros o que llevan la delantera respecto de otros. As
por ejemplo, el peridico estadounidense The New York Times tiene un equipo de 25 personas slo
para proyectos de visualizacin de datos. Algunas de ellas son expertas en estadsticas, otras en
Periodismo, otras en diseo grfico, programacin
Tambin hay medios que destacan por haber hecho una verdadera apuesta al Periodismo de Datos,
tanto desde la incorporacin de herramientas especficas como desde su promocin. Entre los que cabe
mencionar se encuentran el diario britnico The Guardian con su Datablog, el estadounidense Los
Angeles Times, el diario La Informacin de Espaa, el proyecto NacinData del diario La Nacin de
Argentina y el blog Ao final de Contas del diario Folha de So Paulo.
2.2 LOS ANTECEDENTES DEL PERIODISMO DE DATOS: PERIODISMO DE
PRECISIN Y CAR
Pero, qu es exactamente y en qu consiste el Periodismo de Datos? Para entenderlo conviene revisar
sus antecedentes pues esta no es una forma nueva y desconocida de comunicar. La diferencia est en
cmo se la practica en la actualidad, en un contexto de una cantidad de informacin difcil de prever
hace un tiempo.
El movimiento principal que antecede al Periodismo de Datos es el ya mencionado Periodismo de
Precisin, una rama del Periodismo de Investigacin que surgi como una respuesta al Nuevo
Periodismo de la dcada del 60 y que se entiende como la utilizacin de programas informticos y
tcnicas de las ciencias sociales como las estadsticas para aportar pruebas y no slo ancdotas en
reportajes periodsticos.
Como trmino, Periodismo de Precisin toma fuerza a partir del libro de 1973 del acadmico Philip
Meyer Precision Journalism. A Reporters Introduction to Social Science Methods. Y, a pesar de
que Meyer ha sido el principal promotor de esta disciplina, acadmicos sugieren que su historia podra
remontarse a los aos treinta cuando la revista Fortune public la que se cree fue la primera encuesta
cientfica llevada a cabo por un medio de comunicacin (DEMERS Y NICHOLS, 1987),.
A ello le seguirn otros ejemplos periodsticos espordicos hasta que en la dcada del 60 los
ordenadores hicieron ms fcil el trabajo de la recoleccin de datos y su anlisis (DEMERS Y
NICHOLS, 1987). Es para estos aos que Philip Meyer se interesa en el estudio de los mtodos
empricos de investigacin social para su aplicacin en el periodismo y lo lleva a cabo con una beca
Nieman en la Universidad de Harvard.
A partir de all combinar una carrera tanto acadmica y de investigacin como una profesional en
medios periodsticos. As es que en 1968 gana un premio Pulitzer por su publicacin en el Detroit
15

Free Press acerca de las causas de una protesta racial en Detroit. Esta investigacin se realiz con los
mtodos del Periodismo de Precisin y se volvi una referencia en la historia de este hasta la
actualidad.
Lo que all haba hecho el estudio del equipo de Meyer fue un cruce de datos que llevaron a
contradecir la idea errnea de que los disturbios haban sido causados por negros procedentes del sur
de Estados Unidos o por personas de bajo nivel educativo.
Despus de ello, Meyer se dedicar a divulgar sus conocimientos y mtodos de investigacin
periodstica en el mbito acadmico - actualmente es profesor emrito de la School of Journalism and
Mass Communication en la Universidad de North Carolina at Chapel Hill- y con publicaciones y
libros.
De manera paralela, una variante del Periodismo de Precisin que se desarrolla junto con este, es el
Periodismo de Investigacin Asistido por Ordenador (Computer-Assisted Investigative Reporting,
CAR por sus siglas en ingls).
Este periodismo es todava promovido bajo este nombre si bien podra enmarcarse dentro de la
disciplina ms general que tratamos en este trabajo, el Periodismo de Datos. Su principal divulgador es
el National Institute for Computer-Assisted Reporting (NICAR) un programa del Investigative
Reporters and Editors, Inc. Bajo su patrocinio es que anualmente desde 1989 se lleva a cabo la
conferencia

CAR, donde se difunden los avances en herramientas para encontrar y analizar

informacin en formato electrnico.


2.3 DEFINICIONES DE PERIODISMO DE PRECISIN
Para Meyer, el Periodismo de Precisin es la aplicacin de mtodos cientficos de investigacin
social y comportamental a la prctica del Periodismo (MEYER, 1993). Para el autor, en 1973 algunos
de esos mtodos incluan el sondeo o encuesta de opinin, el experimento psicosocial y el anlisis de
contenido.
Es decir, propona tomar herramientas de las ciencias sociales para el anlisis cuantitativo para que
fueran aplicadas en el periodismo, sin por ello alterar la misin de localizar hechos, comprenderlos y
explicarlos sin prdida de tiempo.
Demers y Nichols (1987) tambin sugieren que el Periodismo de Precisin es un mtodo de
investigacin, un modo de aprender sobre el mundo. Y su diferencial, segn afirman, radica en que
esos mtodos cuantitativos de investigacin social sirven para conseguir la noticia.

16

Por su parte, la definicin que brinda el acadmico espaol Jos Luis Dader es: se entiende por
Periodismo de Precisin la informacin periodstica que, sobre cualquier asunto de trascendencia
social, aplica o analiza sistemticamente mtodos empricos de investigacin cientfica, de carcter
numrico o no numrico, con especial inclinacin al campo de las ciencias sociales. En dicha actividad
el nfasis corresponder a la validez y fiabilidad del mtodo de anlisis, por encima de la mayor o
menor espectacularidad de los resultados (DADER, 1997).
Respecto a su comparacin con el Periodismo de Investigacin, Dader ha escrito que estos guardan
relacin pero no se tratan de lo mismo pues ni todo el Periodismo de Investigacin aplica las
estrategias metodolgicas y conocimientos instrumentales del Periodismo de Precisin, ni este ltimo
se aplica tan slo en proyectos de investigacin periodstica (DADER, 1997).
La diferencia est en la metodologa de investigacin pues el periodista de precisin es el que aplica
mtodos como el anlisis estadstico, la encuesta sociolgica y el rastreo en bases de datos.
2.4 LA EVOLUCIN DEL PERIODISMO DE PRECISIN Y DEL PERIODISMO DE
DATOS
Al momento en que Philip Meyer comienza a hacer difusin y practica el Periodismo de Precisin,
todava no era posible pensar en computadores personales para cada periodista, lo que dificultaba su
puesta en marcha.
Es durante la dcada del setenta que esto empieza a ser posible y es finalmente en los ochenta que los
ordenadores se vuelven ms accesibles y permiten a los periodistas tener acceso a un conjunto de datos
que antes no era posible.
Por ese entonces proliferan tambin las encuestas y los sondeos de opinin. Incluso para finales de los
ochenta los principales peridicos anglosajones tenan ya departamentos exclusivamente de
informacin socio-estadstica. Estos eran llevados por profesionales de las ramas de estadsticas y
gestin de bases de datos que, entre otras misiones, daban soporte a casos de investigacin
periodstica.
De a poco entonces, esta rama del periodismo fue generando visibilidad, sobre todo en los Estados
Unidos. Algunos de los hechos que lo ilustran y marcan antecedentes en la historia reciente del
Periodismo de Datos son:
1986. Reconocimiento con un premio Pulitzer al reportaje del Dallas Morning News que, basndose
en cruce de bases de datos por ordenador, denunciaron la existencia de discriminacin racial en la
adjudicacin de viviendas pblicas en Texas.

17

1989. Premio Pulitzer de Periodismo Investigativo al periodista Bill Dedman por el reportaje The
colour of money. Este se trataba de una serie de artculos publicados en el diario estadounidense The

Atlanta Constitution en los que, a partir de un anlisis informtico de los formularios que deban
rellenar prestamistas hipotecarios, quedaba en evidencia que haba discriminacin por parte de estos.
Como consecuencia de dicha investigacin se introdujeron reformas en las condiciones crediticias de
bancos de todo el pas. A continuacin, una imagen que formaba parte del reportaje:
ILUSTRACIN 1. "THE COLOUR OF MONEY". FUENTE: HTTP://POWERREPORTING.COM/COLOR/

1991. Philip Meyer publica The new precision journalism: a reporters introduction to social science
methods, tercera edicin de su libro donde explica y actualiza cmo hacer anlisis de datos y
estadstica con los ordenadores del momento.

18

1993. The Miami Herald gana un premio Pulitzer por su especial sobre la devastacin producida por el
huracn Andrew titulado What went wrong?. En este nmero, un equipo de periodistas entre los que
se encontraba Steve Doigt -hoy un frreo impulsor del Periodismo de Datos-, decidi comprobar
cunto del nivel de destruccin del huracn haba sido responsabilidad de autoridades municipales y
constructores. Para ello recopil cuatro bases de datos oficiales que, segn el acadmico Jos Luis
Dader (2006) fueron las siguientes:
1) Los informes de las 50.000 inspecciones de daos realizadas en el condado tras el paso del huracn
2) El registro de datos de la propiedad de 1992, que inclua informacin detallada del tipo de vivienda,
valor y ao de construccin de todas las edificaciones del rea
3) El fichero de Memorias de Edificacin de todas esas construcciones, que recoga informacin
minuciosa sobre los tipos y calidades de los materiales utilizados
4) El Censo de Edificacin y Planificacin del condado, con ms de 7 millones de expedientes de
permisos de construccin e inspecciones realizadas en los ltimos aos.
Tras un cruce de toda esta informacin, el Miami Herald realiz un especial de 16 pginas en las que
poda verse un mapa de las zonas afectadas por el huracn y cuadros estadsticos. Lo que terminaron
por demostrar fue que el nmero de casas construidas despus de 1979 y que declaraban haber sido
destruidas totalmente doblaba a las de construccin previa. Adems, dejaban evidencia de que los
vientos ms fuertes no haban sido causantes de ms destruccin sino que tambin, esto se
correlacionaba con los hogares de construccin posterior a 1979.
En conclusin, haba sido causante de ms dao la reduccin de los controles de calidad de
construccin que la fuerza el huracn.

19

ILUSTRACIN 2 "LESS WIND, LOTS OF DAMAGE". FUENTE: CUENTA DE FLICKR


HTTP://WWW.FLICKR.COM/PHOTOS/JUGGERNAUTCO/SETS/72157607210036175/DETAIL/

DE

DANIEL

X.

O'NEIL,

2006. El periodista Adrian Holovaty (2006) publica su ensayo A fundamental way newspaper sites
need to change a partir del cual se extiende la necesidad de profundizar en el Periodismo de Datos.
Segn especialistas en el tema como el periodista Simon Rogers, Holovaty pudo haber sido el primero
en hablar de Data Journalism, trmino anglosajn de Periodismo de Datos, para anclarlo como
una tendencia.

20

2007. Entre ejemplos de Periodismo de Datos que empiezan a multiplicarse destaca el de Los Angeles
Times

llamado

The

homicide

report

consiste

en

un

mapa

interactivo

(http://projects.latimes.com/homicide/map/) con una base de datos para conocer todos los casos de
homicidio en el distrito de Los ngeles desde 2007 hasta la actualidad, presentando detalles de cada
uno de los asesinatos que de la regin. En este mapa se pueden filtrar los datos de las vctimas segn
raza, edad, gnero, causa de muerte, ubicacin y otros parmetros. Tambin pueden verse fotos de
estos.
Para Rich Gordon (2007), profesor asociado de la escuela Medill de Periodismo en la Northwetern
University de Estados Unidos), esta iniciativa representa que cuando se unen el reportaje tradicional
con las nuevas capacidades de uso de las bases de datos, surgen nuevas formas de periodismo.
ILUSTRACIN 3. "THE HOMICIDE REPORT". FUENTE: LOS ANGELES TIMES

21

2009. Premio Pulitzer para el diario estadounidense St. Petersburg Times por el proyecto Politi Fact
en el que se comparaban las declaraciones juradas de polticos con hechos reales y concretos para
evaluar el grado de veracidad. Trabajo basado en el uso de estadsticas y bases de datos.
2010. Las filtraciones ms importantes de Wikileaks cambian el panorama del Periodismo de Datos y
sitios de noticias como The Guardian, a travs de su Datablog, y The New York Times llevan esta
modalidad a su auge.
ILUSTRACIN 4. "AFGHANISTAN IEDS MAPPED". FUENTE: GUARDIAN.COM.UK

2011. Los 16 proyectos ganadores del Knight News Challenge, un concurso anual de la Knight
Foundation destinado a promover las mejores ideas relacionadas con la innovacin en el mbito del
periodismo, tienen al Periodismo de Datos como principal objetivo. El total de dinero que se les
destina testimonia su importancia, 4,7 millones de dlares.
En 2011 nace tambin el proyecto Overview, una herramienta de visualizacin de documentos. Ofrece
organizarlos y conectarlos para ayudar a los periodistas a encontrar historias en medio de tanta
informacin. Es una iniciativa del periodista Jonathan Stray con la financiacin de la agencia de
noticias Associated Press.

22

2012. Algo que marc la transicin que est viviendo el Periodismo de Datos fue el lanzamiento en
enero de 2012 del primer concurso internacional de esta especialidad, una iniciativa del Global Editors
Network en alianza con Google. Adems, este mismo ao se publica el manual de Periodismo de
Datos, ya citado anteriormente, The Data Journalism Handbook, una iniciativa colaborativa en la
que participaron periodistas de todo el mundo.

Como puede deducirse, el Periodismo de Precisin tuvo al comienzo una mayor incidencia en Estados
Unidos mientras que en Europa la evolucin fue ms lenta (Dader, 1993). En Espaa incluso, como
tambin documenta el acadmico Jos Luis Dader, haban aplicaciones de un Periodismo de Precisin
pero sin que sus profesionales supieran del movimiento: la relativa presencia de actuaciones
periodsticas intuitivas, catalogables entre nosotros bajo el rtulo que nos ocupa, choca con la
perplejidad generalizada que su sola mencin contina produciendo entre la mayora de los periodistas
y profesores espaoles de Ciencias de la Informacin.
Aos despus, ya para cuando comienza a hablarse de Periodismo de Datos a raz de la multiplicacin
de bases de datos y herramientas para su tratamiento, la evolucin se da paralelamente en distintos
mbitos geogrficos. Estados Unidos no pierde su vanguardia con medios de comunicacin cabeceras
como The New York Times mientras que en Europa sus primeros promotores estn en Inglaterra con
The Guardian y en Alemania con Der Spiegel.
Y la gran bisagra en la evolucin del Periodismo de Datos no est slo en fenmenos de desarrollo
continuo como puede ser Big Data. Tambin, hubo hechos puntuales y entre ellos es de mencionar el
Cablegate, la filtracin de documentos diplomticos -especialmente de Estados Unidos- y que
difundi el sitio Wikileaks.
Al respecto, en diciembre de 2010, Paul Bradshaw escribi en su blog onlinejournalismblog.com un
artculo que titul Un embajador avergonzado es una tragedia, 15 mil civiles muertos es una
estadstica. All deduca, a partir del efecto Wikileaks en la prensa, que el Big Data traa nuevos
desafos: hay que humanizar y personalizar grandes conjuntos de datos de una manera tal que ello no
vaya en contra de la complejidad del tema que se est tratando.

23

Es decir, en medio de enormes cantidades de datos, el periodista debe intentar lograr un inters con
ellos a pesar de que a los lectores les interesen ms las historias individualizadas, como la del
embajador avergonzado con el que ejemplifica este punto.
Al respecto, es vlido tambin comentar que los mismos datos necesitan de los medios de
comunicacin pues de otra manera es posible que el pblico no se acerque a ellos, por la complejidad
que esto representa.
Como escribi el periodista John Keenan (agosto 2010) en The Guardian: Sin el anlisis, el
comentario y la explicacin de periodistas especializados, los documentos habran quedado en el sitio
de Wikileaks llamando la atencin slo de aquellos con un ferviente inters en el conflicto. La Casa
Blanca y el Pentgono, apenas se habran inmutado.
Eso es precisamente lo que entendi Julian Assange, el fundador de Wikileaks, cuando decidi hacer
la distribucin de sus documentos a travs de grandes diarios occidentales, los cuales fueron El Pas
de Espaa; The New York Times de Estados Unidos; The Guardian de Reino Unido, Le Monde de
Francia y Der Spiegel de Alemania.
Al mismo tiempo, en una visin actualizada del Periodismo de Precisin y ya con el Periodismo de
Datos como una tendencia, Philip Meyer dio un discurso el 3 de octubre de 2011, como invitado a la
Hedy Lamarr Lecture sobre Changing Needs in Journalism en la Academia Austraca de las Ciencias.
En su exposicin, que luego fue difundida por los reportes Nieman, dijo:
Necesitamos una estructura para ver la verdad de los hechos. (). Es posible que encontremos la
manera de unir estas dos estrategias (Periodismo Narrativo y Periodismo de Precisin) y contar
historias sobre los datos que se basan en teoras verificables?
Para dar una respuesta a este interrogante, se remont a la historia del trmino Periodismo de
Precisin, el cual fue acuado por el profesor Everette E. Dennis en la Universidad de Obregn en
1971. Lo que intentaba este, era explicar el nuevo Periodismo, basado en mtodos cientficos. Pero
como desde haca unos aos se hablaba de nuevo periodismo para referirse a la corriente literaria del
oficio, lo diferenciaron.
Y continu entonces con su discurso, acercndose a la definicin de lo que se conoce como
Periodismo de Datos:
Ambos gneros, el Periodismo Narrativo y el Periodismo de Precisin, son especialidades que
requieren determinadas habilidades. Si tuviramos que mezclar ambos, cmo lo llamaramos? El
trmino que me gusta es narrativa basada en evidencia. Ello implica una buena historia basada en
24

evidencia verificable. S, esa sera una especialidad esotrica. Pero creo que hay un mercado que se
est desarrollando para ella. El mercado de la informacin nos est llevando cada vez hacia una
mayor especializacin. Y tanto el Periodismo de precisin como el Periodismo narrativo atraen a una
audiencia sofisticada, una que aprecia la necesidad de estructurar la informacin de una manera que
centre la atencin en la verdad.
Y casi cuarenta aos despus de que el profesor Meyer remarcara por primera vez la necesidad de
aplicar mtodos sociales en la investigacin periodstica hoy no slo se aplican en los ms importantes
medios de comunicacin, sino que tambin las nuevas tecnologas permiten toda una variante de
actividades a partir de ello. El ejemplo principal es la exploracin personal que puede hacer la
audiencia de tantas bases de datos ahora a su disposicin.
2.5 CARACTERSTICAS DEL PERIODISMO DE DATOS
En la actualidad, el Periodismo de Datos exige una especializacin, tal como remarc Philip Meyer.
De ah que sobrevenga la necesidad de aprender las nuevas herramientas, de sortear las dificultades
que representa la lectura de cierto formato de datos y de facilitar la tarea de lectura de la audiencia.
Es decir que, como cualquier nueva tendencia tambin tiene sus puntos fuertes y dbiles. En cuanto a
una de sus principales consecuencias positivas se encuentra la objetividad y transparencia que pueden
brindar los datos, ya que el lector tambin tiene la posibilidad de interpretarlos y sacar sus propias
conclusiones.
Por otra parte, tanta informacin a disposicin puede complicar la tarea de su lectura. De ah la
necesidad de ordenar. A continuacin, un listado de caractersticas del Periodismo de Datos.
2.5.1 OBJETIVIDAD Y TRANSPARENCIA
"Aquel periodista que adapte los instrumentos del mtodo cientfico a su propia tarea, gozar de la
posibilidad de realizar tiles evaluaciones con la mucha ms potente objetividad de la ciencia
Philip Meyer, 1993
El profesor de grficos en la Universidad de Miami, Alberto Cairo (25 de abril 2011) coincide
indirectamente con Philip Meyer cuando en un texto sobre infogrficos peligrosos se refiere al
mtodo cientfico como el mayor avance de la Humanidad en su lucha por superar limitaciones
perceptivas, ilusiones inconscientes e impulsos emocionales: un sistema que antepone la evidencia
emprica a la opinin subjetiva, aunque esta ltima se rebele contra sus conclusiones, a veces
contrarias a la intuicin, al statu quo... y al sentido comn.

25

Como es comn aprender en las carreras de Periodismo, la objetividad es un principio de este, si bien
hay quienes la defienden y quienes no pues la neutralidad absoluta no es algo que pueda asegurarse en
el discurso comunicativo
En relacin con el Periodismo de Datos, la lectura de los datos y su puesta a disposicin contribuye a
una mayor transparencia y objetividad en la tarea comunicativa. Es ms, hay quienes defienden que
la transparencia es la nueva objetividad (THE ECONOMIST, julio 2011).
2.5.2 NECESIDAD DE ORDENAR
Philip Meyer tambin reflexion en 2011 en su discurso en la Academia Austraca de las Ciencias
acerca de la gran cantidad de informacin actual y la necesidad de organizar: Creera que todos
estamos de acuerdo en que las tecnologas de la era de la informacin producen datos ms rpido de lo
que producen conocimiento. En lugar de remplazar el periodismo, Internet est creando una nueva
necesidad de mercado: para la sntesis y la interpretacin del flujo constante de hechos.
Para el acadmico, los datos sin procesar son lo mismo que el ruido, de ah que a medida que se
multiplica la informacin disponible en el mundo, tambin se multiplican las necesidades para
procesarlo.
Asimismo, Guy Laurence, CEO de Vodafone Reino Unido argumentaba en una entrevista de Simon
Rogers editor del Datablog del peridico britnico The Guardian- que antes el acceso a la
informacin era un gran problema mientras que ahora, la prioridad es saber manejarla: Nos hicieron
creer que cuanto ms datos, mejor, pero eso ya no es verdad.
Regresando a Meyer, en su discurso ya mencionado (2011) tambin dijo que ahora que la informacin
es abundante lo importante es su procesamiento: Necesitamos una estructura para ver la verdad de
los hechos.
Para ello, Meyer (1993) reconoce que en la actualidad no slo alcanza con aplicar el mtodo cientfico
a los datos. Ahora tambin es necesario saber nadar entre un mundo de datos: El periodista debe
ahora ser un administrador de datos acumulados, un procesador de datos y un analista de esos datos.
Los pasos que Meyer enumera para trabajar con los datos en periodismo son:
1. Recopilarlos
2. Almacenarlos
3. Recuperarlos
4. Analizarlos

26

5. Resumirlos
6. Comunicarlos
2.5.3 TRABAJO EN GRUPO
Una caracterstica que todos los expertos en Periodismo de Datos coinciden es que cuanto ms un
trabajo en equipo sea, mejores resultados se pueden obtener. Sobre todo a la actualidad, cuando las
herramientas se multiplican y se valoran cada vez ms las especializaciones.
Cierto es que as como se multiplican las herramientas estas se simplifican. Sin embargo, en un trabajo
completo de Periodismo de Datos intervienen diferentes capacidades como las que dan la Estadstica,
la Sociologa, la Programacin, el Diseo Grfico y el Periodismo.
Puede haber reporteros que renan conocimientos de estadstica por ejemplo, pero no es lo ms
comn. Por tanto, segn mencionaba Meyer (2011) ello exige una inversin por parte de los medios:
Necesitaremos ms reportaje en equipo y editores capaces de reclutar y manejar los talentos que
hacen falta.
Jos Luis Dader (1993) asegura tambin en el prlogo de la versin espaola de Periodismo de
Precisin. Nuevas Fronteras para la investigacin periodstica que este tipo de aventura profesional
es una tarea de equipo. Pues el periodista puede encontrarse en su tarea con dificultades tcnicas y de
mtodos, para lo que es una solucin buscar la ayuda de especialistas.
2.6 CMO SE HACE PERIODISMO DE DATOS?
En un post de julio de 2011 Paul Bradshaw propuso en su blog cuatro fases de trabajo en el
Periodismo de Datos: compilar los datos, filtrarlos, contextualizarlos y combinarlos para luego
transmitirlos.

27

Ilustracin 5 THE INVERTED PYRAMID OF DATA JOURNALISM. FUENTE: ONLINEJOURNALISMBLOG.COM

2.6.1 COMPILAR LOS DATOS


Para Paul Bradshaw, la bsqueda de datos puede iniciarse por dos razones: o porque hay una pregunta
que necesita datos para su respuesta o porque hay datos que plantean un interrogante. Como sea, hay
que encontrarlos o incluso crearlos, por ejemplo, a travs de encuestas.
Para ello estn las bases de datos, pblicas o privadas. Las privadas no necesariamente son secretas,
pero no est pensadas para el uso de los periodistas por lo que se puede pedir consultarlas o pagar por
ellas, dado el caso.
Algunas de las fuentes ms consultadas a partir de las cuales surgen historias son (BRADSHAW, abril
2010):
-

Fuentes gubernamentales, locales, nacionales e internacionales

Organismos que monitorean a diferentes organizaciones

Instituciones acadmicas y cientficas

Organismos de la salud

28

Grupos de presin y organizaciones sociales

Empresas

Los medios comunicacin

Los modos de recuperacin que Philip Meyer enumeraba en la versin actualizada de Periodismo de
Precisin eran los siguientes:
-

CdRom, para ser ledas en el ordenador personal.

Conexin

Fuentes de acceso pblico

Recepcin mediante conexin a Internet

De texto completo y bibliogrficas

Con las nuevas tecnologas y facilidades de la informtica, las maneras de recuperacin se han
ampliado considerablemente. De ah que las enumeradas por Paul Bradshaw en su artculo de 2011
sean diferentes y actualizadas. A continuacin, citamos algunas de las que el periodista ingls
propone, ms otras a considerar:
-

Informacin provista al periodista directamente por una organizacin (todava no es comn


que los datos estn adjuntos a los comunicados de prensa)

Recuperada luego de bsquedas avanzadas dentro de sitios gubernamentales

Haciendo scraping en bases de datos ocultas con herramientas como Scraperwiki,


Yahoo!Pipes y el complemento de Firefox Outwit Hub.

A travs de la conversin de documentos para su anlisis.

Tomando informacin de las APIs

Recolectando informacin por uno mismo a travs de observaciones, encuestas o formularios,


entre otras formas.

2.6.2 FILTRADO Y LIMPIEZA DE DATOS


Un problema que presenta el trabajar con bases de datos pblicas o ajenas incluso propias- es que
pueden contener errores de tipeo o de otro tipo- que podran alterar la verdad de los contenidos que se
pretenden comunicar.
Para evaluar la informacin de una base de datos hay que preguntarse siempre quin suministr los
datos originales y cundo y cmo se recolectaron. Muchas bases de datos gubernamentales son
compilaciones de material procedente de muy diversas fuentes, cuya fiabilidad y meticulosidad no es
uniforme. (MEYER, 1993)

29

Para ello es que un paso fundamental al trabajar con estas bases de datos es proceder a su revisin y
limpieza. Numerosas herramientas permiten descubrir tpicos errores humanos sin necesidad de ir
registro por registro. Una de ellas es Google Refine que descubre palabras aproximadas, entradas
vacas y duplicados.
Philip Meyer tambin repeta en su libro Periodismo de Precisin. Nuevas Fronteras para la
investigacin periodstica. (1993): Nunca consideres como palabra de Dios lo que el ordenador te
indica. Habr siempre que rastrear el paso anterior a la creacin de la base de datos, comprobando
los documentos impresos o lo realizado por las personas que reunieron los datos.
Asimismo, este tem tambin incluye la conversin de datos al formato con el que se pretende trabajar.
Lo ms comn en este caso es el paso de informacin presente en archivos PDF a planillas de clculo
como Microsof Excel. No siempre es una tarea sencilla y, a pesar de que existen herramientas gratuitas
(PDFtotext, Cometdocs.com, PDFtoexcelonline.com, Zamzar.com) y de pago (PDFconverter, Adobe
Acrobat X Pro, Nitro PDF), es necesaria una revisin meticulosa.
Relacionado a este punto, otra tarea frecuente en el Periodismo de Datos es la extraccin de
informacin de una pgina web a un documento de texto. Y, para cuando el copiar y pegar no
funciona correctamente, sobre todo con listas y tablas, existen herramientas para convertir informacin
en lenguaje HTML para su uso en un documento de texto o planilla de clculo. Un ejemplo de ellas
es la que facilita Google: ImportHTML.
2.6.3 CONTEXTUALIZAR LA INFORMACIN
Es necesario preguntarse de dnde viene la informacin, cul es su historia, qu instituciones
intervinieron, porqu se recolect, cmo, dnde
Entonces, si llega a manos de un periodista la base de datos de crmenes de una ciudad esta slo tendr
sentido si se conoce la cantidad de poblacin, el historial, la calidad de vida, el desempleo, la
inflacin, etctera.
Es decir, una base de datos puede no ser interesante en s misma hasta que se cruzan dos variables. As
por ejemplo, un registro de accidentes de una ciudad que se combina con el nivel educativo de los
conductores protagonistas de estos puede tal vez dar lugar a una conclusin relevante. Es entonces
cuando entra en juego la capacidad del periodista para hacerse las preguntas que deriven en material
de noticia.
Es en este paso tambin que entran en juego los conocimientos estadsticos y la importancia de esta
ciencia dentro del periodismo y del mundo de la informacin.
30

Respecto a las estadsticas, en una entrevista de 2008 a Hal Varian, economista jefe de Google y
profesor de Tecnologas de la Informacin en la Universidad de Berkeley, este ya predeca que en la
prxima dcada se iba a tender inevitablemente al campo estadstico: "La capacidad de trabajar los
datos - ser capaz de entenderlos, procesarlos, extraer valor de ellos, visualizarlos, comunicarlos- va a
ser una habilidad de enorme importancia en las prximas dcadas (..). Porque es ahora que realmente
se dispone de datos, esencialmente libres y en todas partes. As que el factor que falta es la capacidad
de entenderlos y extraer valor de ellos (MCKINSEY QUARTERLY, enero 2009)
Y Philip Meyer (1993) tambin ya lo deca en cuanto a su aplicacin en el oficio del periodista:
Hubo un tiempo en que todo lo que haca falta era amor a la verdad, vigor fsico y cierta gracia
literaria. Todava el periodista necesita esos recursos, pero ya han dejado de ser suficientes.
Un nmero por s solo no significa mucho. Debe tener un contexto, debe ser comparado con otros
nmeros. Para Jos Luis Dader (1997), la estadstica consiste en una aplicacin prctica de la
matemtica, destinada a hacer visible, mediante una explicacin condensada y por tanto asequible al
conocimiento humano-, la variabilidad de relaciones ciertas, pero a primera vista invisibles, que
existen en grandes masas de datos o poblaciones.
Es de mencionar que, en la actualidad, uno de los ms grandes precursores de las estadsticas es el
mdico sueco Hans Rosling. l no slo insiste en la necesidad de aplicar las estadsticas en la tarea de
la comunicacin sino tambin en todas las reas de la vida para entender el mundo actual.
Conocido tambin por sus presentaciones en las charlas TED (organizacin internacional de
divulgacin de ideas) para promover el entendimiento del mundo a travs de las estadsticas, en una
entrevista de Ulrike Reinhard (marzo 2011), Rosling pone en palabras su percepcin respecto al
universo de datos actual: Mi idea fundamental es que el mundo ha cambiado tanto que lo que la gente
necesita no es ms datos sino una nueva mentalidad. Necesita un nuevo sistema de almacenamiento
con el que poder manejar esta informacin.
2.6.4 COMBINAR LOS DATOS
Este paso se refiere a la fusin de datos de diferentes fuentes en una sola. Un modo tpico en
periodismo que incluye esta tarea est representado por los mashups, aplicaciones que toman y
mezclan datos existentes en la web para crear algo nuevo.
El de mapas es de los ms utilizados en el periodismo y sirve para ver cmo se distribuye algo en el
espacio. Un ejemplo sera un mapa qu muestre cules son los pases que acumulan ms de cien

31

medallas de oro en la historia de los Juegos Olmpicos basndose en los datos de una tabla de
informacin extrada de, por mencionar una fuente probable, Wikipedia.
2.6.5 COMUNICACIN DE LOS DATOS
La forma de transmitir los datos a la audiencia es lo que ms ha variado en los ltimos aos gracias a
las nuevas tecnologas de la informacin y herramientas que permiten que estos se vuelvan ms fciles
de manipular y de acceder. De all que una caracterstica fundamental del Periodismo de Datos actual
es la visualizacin de estos en tablas y grficos.
2.6.5.1 INFOGRAFA Y VISUALIZACIN DE DATOS
En el mundo acadmico suele diferenciarse entre la infografa y la visualizacin de datos alegando
que la infografa se preocupa en presentar la informacin de una manera que pueda ser asimilada por
la audiencia, mientras que la visualizacin permite la exploracin al usuario a travs de esos datos.
Sin embargo, Alberto Cairo, autor del libro El arte funcional: infografa y visualizacin de
informacin habla de una frontera difusa entre ambos conceptos (16 de abril, 2011). Pues este
periodista espaol considera que la relacin entre infografa y visualizacin es un continuo ya que
todo grfico (de datos, cartogrfico, etc.) presenta, pero tambin puede convertirse en una
herramienta que una audiencia manipule mentalmente para explicarse unos datos, para extraer de ellos
significados, tendencias, para vincularlos con su propia vida, para buscar en ellos su propio barrio, su
ciudad, su vivienda.
He ah parte del potencial de la visualizacin de datos en los medios de comunicacin ya que permite
esa interaccin del lector sobre todo con las nuevas herramientas.
Y, aunque las formas visuales de presentar datos parecen novedosas, lo cierto es que, al menos las ms
tpicas, existen desde hace dos siglos gracias a los estudios de mapas en historia y geografa y en otras
disciplinas como las matemticas.
As, al que se considera como el inventor de la tabla moderna es al ingeniero escocs William Playfair
quien en The Commercial and Political Atlas de 1786 y en el Statistical Breviary de 1801 invent y
utiliz un grfico de barras, uno de fiebre y otro de tarta, los grficos estadsticos que son ms
utilizados en la actualidad. Uno de ellos es el que presentamos a continuacin y que plasma en un
diseo grfico la evolucin del comercio de Inglaterra en relacin a Dinamarca y Noruega entre 1700
y 1780.

32

ILUSTRACIN 6. EXPORTS AND IMPORTS TO AND FROM DENMARK & NORWAY FROM 1700
HTTP://UPLOAD.WIKIMEDIA.ORG/WIKIPEDIA/COMMONS/D/D8/PLAYFAIR_TIMESERIES.PNG

TO

1780. FUENTE:

Adems de las mencionadas, otras formas de comunicacin visual de datos se inventaron durante el
siglo XIX como el mapa geolgico de William Smith de 1815 que los cartografistas llaman el mapa
que cambi el mundo:
ILUSTRACIN
7.
MAPA
GEOLGICO
DE
WILLIAM
SMITH
HTTP://EN.WIKIPEDIA.ORG/WIKI/FILE:GEOLOGICAL_MAP_BRITAIN_WILLIAM_SMITH_1815.JPG

(1815).

FUENTE:

33

Pero cuando comienzan a asomar las cantidades masivas de datos, se tornan necesarias nuevas
herramientas para su lectura y comprensin. De ah que se comenzaran a utilizar aquellas especficas
para la visualizacin de datos que poco a poco fueron mejorando y convirtindose de uso comn,
sobre todo desde el momento en que se las comprendi como una forma alternativa de comunicacin.
As, cada vez ms herramientas facilitan a cualquier usuario la visualizacin de datos. Una que tuvo
especial repercusin fue ManyEyes, de IBM, la cual funciona en Internet y es de acceso gratuito. Con
esta herramienta, a partir de bases de datos se pueden disear visualizaciones para cruzar los datos y
encontrar nuevas relaciones.

ILUSTRACIN 8. DISTRIBUCIN DE LA AYUDA INTERNACIONAL DE ESTADOS UNIDOS EN ELTIEMPO: 1946-2005. FUENTE:


MANYEYES.

La visualizacin entre otras cosas, sirve para poner datos en contexto, segn explica Jeffrey Heer, de
la Universidad de Stanford en el video de Geoff McGhee (2010) Journalism in the age of data
(2010).
A su vez, Cole Nussbaumer (2011), experta en visualizacin de datos en Silicon Valley- prefiere
hablar de humanizacin de datos, pues al presentarlos de manera creativa es posible hacer de ellos
una historia ms transparente.
Uno de los medios precursores y que constantemente est innovando en visualizacin de datos es The
New York Times.
2.6.5.1.1 LA NARRATIVA DE LA VISUALIZACIN
Para Edwar Segel y Jeffrey Heer (2010), de la Universidad de Stanford, la visualizacin de datos no
slo revela historias sino que tambin puede contarlas, igual que si fuese una historia escrita.

34

Para ambos acadmicos las visualizaciones estticas a lo largo del tiempo han sido utilizadas para
apoyar la narracin, generalmente en forma de diagramas insertos en un cuerpo mayor de texto. Y es
en este formato que el texto transmite la historia, y la imagen por lo general proporciona evidencia de
apoyo o detalles relacionados.
Ahora, para ellos, una nueva clase de visualizaciones cada vez ms complejas tratan de combinar
narraciones con grficos interactivos y narradores y periodistas, especialmente en lnea.
A su vez, describieron siete gneros de narrativas de visualizacin: el estilo revista, el grfico anotado,
el diagrama de flujo, la tira cmica, las diapositivas, el vdeo y el cartel dividido.
ILUSTRACIN 9. SIETE GNEROS. FUENTE: (SEGEL Y HEER, 2010).

El gur del Periodismo de Precisin, Philip Meyer (2011) tambin considera que la narrativa va a la
par de los datos, pues en el siglo XXI es necesario tanto el Periodismo de precisin el cual toma sus
herramientas de la ciencia- como el Periodismo narrativo, basado en el arte:
La ciencia crea estructura con lo que Lippmann denomina modelos esquemticos, que provienen de
la teora. El arte crea la estructura a travs del diseo de la narrativa en la narracin.
Por ello no es cuestin de poner los datos como son y abrumar al lector. Hay que preguntarse qu es lo
que este quiere saber a partir del grfico, qu es lo que puede llegar a preguntarse.
Igualmente, Alberto Cairo insiste en la necesidad de no caer en la simplificacin excesiva. Y habla de
dos corrientes en el campo de la visualizacin de la informacin: la de los minimalistas (racionales,
cientficos) y la de los de una perspectiva ms emocional y esttica.

35

En cuanto a la teora, Cairo (2011) recuerda a Edward Tufte, un influyente profesor de estadstica que
es defensor de la corriente minimalista y un aberrador de la ideologa de la decoracin. Incluso este
habla de la basura de grficos (chart junk) que hay que evitar, como estilos que dificultan la lectura
de los datos, grillas sobrecargadas, texturas incomprensibles
Algunas de las reglas que enumera en su libro bsico The visual display of quantitative information
son:
-

Mostrar los datos

Maximizar el uso de data-ink (tinta destinada a los datos).3

Evitar el chart-junk, o todo lo que dificulte la lectura de los datos

Utilizar elementos multifuncionales, que facilitan la lectura.

Mltiplos pequeos

Textos y leyendas con la orientacin tradicional

Hacer un uso cuidadoso del color

Su postura es en ocasiones extrema. Sin embargo, sus principios tuvieron y tienen hasta la actualidad
gran percusin entre diseadores y comunicadores. Sin embargo, en las dos ltimas dcadas tambin
se le ha rebatido su postura minimalista, basada ms en apreciaciones personales que en hechos
empricos.
Por su parte, estn aquellos defensores de un uso ms esttico y emocional de los grficos. Entre ellos
se incluye el influyente Nigel Holmes, referente de la infografa moderna y defensor de la inclusin de
ilustraciones junto a los datos.
Para Cairo (2011), la esttica no est de ms siempre y cuando el grfico no est por encima del rigor
informativo: rendirse en ocasiones a lo ldico y crear un grfico que tenga ms artificio que sustancia
puede ser positivo, dependiendo del asunto y del contexto.
Por su parte, las nuevas herramientas tecnolgicas permiten que sin llegar a la simplificacin absoluta
se creen grficos interactivos que permiten a la audiencia buscar aquello que les sea de ms inters.
El siguiente es un ejemplo de grfico interactivo que realiz el The New York Times el pasado junio
llamado Where the Heat and the Thunder hit their shots. Aqu se pueden comparar las fortalezas de
los jugadores de baloncesto del Miami Heat y del Oklahoma City Thunder basndose en sus patrones
de disparo.

La regla central de Tufte es la ratio data-ink, la cual representa la cantidad de tinta que debe llevar la ilustracin
en orden a representar los datos de manera aceptable.
36

ILUSTRACIN 10. WHERE THE HEAT AND THE THUNDER HIT THEIR SHOTS. FUENTE: THE NEW YORK TIMES.

2.6.5.2 OTRAS FORMAS DE COMUNICAR LOS DATOS


La visualizacin de los datos se presenta como una de las formas que se estn volviendo cada vez ms
populares para presentar la informacin a los lectores. Sin embargo, segn Paul Bradshaw (abril 2010)
en su teora de la Pirmide Invertida del Periodismo de Datos, hay otras maneras de comunicar los
datos:

37

La narracin: un artculo escrito de manera tradicional en el que se incluyen los datos


recolectados.

Comunicacin social: los datos pueden conseguirse a travs de las redes sociales o a travs de
convocatorias y concursos.

Humanizacin: presentar los nmeros con ejemplos reales para ilustrar una historia. No solo
datos abstractos.

Personalizar: la interaccin con los datos permite a los usuarios buscar aquello que les es de su
inters personal. Por ejemplo: cmo le afectan los recortes de este trimestre segn regin?.

Utilizar: semejante a personalizar, la comunicacin de los datos puede permitir al usuario


buscar aquella informacin que le interese, sea o no que lo afecte a nivel personal.

2.7 DOS EJEMPLOS DE PERIODISMO DE DATOS


2.7.1 DNDE VAN MIS IMPUESTOS?
En Internet, el sitio espaol www.dondevanmisimpuestos.es es una iniciativa de la Fundacin
Ciudadana Civio la cual cuenta con el apoyo de la Open Knowdlege Foundation. Se trata de un
proyecto de Periodismo de Datos para dar conocer los destinos del dinero segn los Presupuestos
Generales del Estado desde 2008 hasta 2011.
Inspirada en el proyecto ingls Where Does My Money Go?, bsicamente es una visualizacin
interactiva en la que el usuario o lector puede ir desplegando los grficos segn cules sean sus
intereses. Por ejemplo, puede ver los presupuestos que se destinan a Cultura, Artes Recreativas y
Religin y a su vez cunto de esto va, por ejemplo, a Bibliotecas y Archivos. Tambin est la
posibilidad de ver los presupuestos por comunidades autnomas ao a ao.
Esta informacin es posible porque est disponible en los Boletines Oficiales del Estado. Sin embargo,
lo que ya no puede saberse en Espaa es si efectivamente ese dinero fue destinado tal como estaba
planeado por las trabas que presenta el no contar con una Ley de Acceso a la Informacin4.
En este caso se trata de un diseo realizado a travs de las tablas en las que se recolect la informacin
de los Presupuestos Generales de los gastos anuales de la Administracin Central del Estado
(ministerios, agencias dependientes y otros organismos pblicos, como el Congreso) y la Seguridad
Social.
ILUSTRACIN 11. "DNDE VAN MIS IMPUESTOS?". FUENTE: WWW.DONDEVANMISIMPUESTOS.ES

Ver apartado sobre Open Data.


38

2.7.2 METADONA Y LA POLTICA DEL DOLOR


Es un reportaje de The Seattle Times de Estados Unidos cuyo ttulo original es Methadone and the
politics of pain y fue publicado en tres partes en diciembre de 2011. Galardonado con el premio Data
Journalism Award en la categora Data-Driven Investigation, consisti en la denuncia de todo lo
que hay detrs del consumo del analgsico metadona.
Su elaboracin llev diez meses y en el equipo participaron cinco personas. Entre otras cosas
revelaban que desde 2003 haban muerto 2173 personas en el estado de Washington por sobredosis de
metadona, la mayora de ellas de clases bajas. Denunciaban tambin que el frmaco tiene un inters
financiero para el Estado, adems de que deja a los pacientes con un dolor crnico.
El reportaje incluy representaciones grficas de los datos demogrficos de las muertes relacionadas
con la metadona. El ms ambicioso de ellos traza las direcciones de aquellas personas que haban
muerto por una sobredosis accidental vinculada a la metadona. Utilizando un cdigo de colores, el
grfico del Estado fue dividido en cinco partes segn ingresos lo que permita ver que haba ms
muertes en las comunidades ms pobres.
A su vez, la investigacin estuvo sustentada en tres bases de datos: la de los certificados de muerte del
Estado con detalles de la causa de muerte, entre otros; las notas de texto acerca de las muertes, por
ejemplo las escritas por los mdicos y la del Comprehensive Hospital Abstract Reporting System
(CHARSEl) con datos sobre cientos de miles de hospitalizaciones, diagnsticos, procedimientos
realizados, costo de la estancia y la situacin econmica de cada paciente.

39

ILUSTRACIN 12. METHADONE AND THE POLITICS OF PAIN.FUENTE: THE SEATTLE TIMES

3.HERRAMIENTAS PARA EL PERIODISMO DE DATOS


Como se ha mencionado a lo largo del trabajo, numerosas herramientas estn a disposicin de los
periodistas, diseadores o quien lo quiera para hacer Periodismo de Datos. A continuacin, algunas de
ellas clasificadas segn el uso que se le puede dar en la elaboracin de un contenido.
3.1 MAPAS
QUANTUM GIS (QGIS): sistema de informacin geogrfica de cdigo libre. Herramienta para crear

mapas a partir del anlisis de bases de datos.

40

OPENHEATMAP : una herramienta fcil de usar mientras los datos estn clasificados por pas, regin

o provincial.
ARC GIS: Sistema de informacin que permite crear, analizar, almacenar y difundir datos, modelos,

mapas y globos en 3D.


POSTGIS: mdulo que aade soporte espacial a la base de datos objeto-relacional PostgreSQL, para

su utilizacin en Sistema de Informacin Geogrfica (SIG).


GRASS: tambin un software SIG libre.

3.2 SCREEN SCRAPING (RASPADO)


Esta actividad se refiere a una tcnica de programacin para extraer mediante ingeniera inversa la
informacin de un PDF, plantilla de Excel, pgina web, grfico
SCRAPERWIKI: una herramienta en lnea que permite a cualquiera recoger, guardar y publicar la

informacin de una pgina web y convertirla en una base de datos.


READABILITY: aplicacin para facilitar la lectura de contenido en la web y que permite extraer el

texto.
SCRAPER (extensin para Chrome): sirve para extraer tablas de pginas webs.

3.3 LENGUAJE DE SCRIPTS


RUBY: lenguaje de programacin de cdigo abierto y dinmico.
PYTHON: lenguaje de programacin tambin de cdigo abierto fcil de leer y escribir.
ACTIONSCRIPT: lenguaje de la plataforma Adobe Flash
PERL: lenguaje de programacin.
PHP: lenguaje de programacin.

3.4 MANEJO DE BASES DE DATOS


MICROSOFT EXCEL: no es un gestor de bases de datos sino una hoja de clculo, pero cuando se trata

de conjuntos de datos hasta de tamao medio es la herramienta ms utilizada por los periodistas. Su
funcionalidad primera es el trabajo con planillas de clculo y la aplicacin de diversas funciones en
estas, en orden al anlisis y administracin de datos.

41

OPENOFFICECALC: tiene la misma finalidad que MicrosoftExcel aunque es de cdigo abierto y

presenta menos funciones que este.


Cuando las hojas de clculo no son suficientes para el trabajo del periodista este necesita un gestor de
bases de datos relacional, sobre todo cuando se trata de unir varias hojas de clculo o si se trabaja con
grandes conjuntos de datos. Algunos de estos gestores pueden ser: SQLITE,

MYSQL,

POSTGRESQL, MICROSOFTACCESS Y SQL SERVER .

3.5 VISUALIZACIN DE DATOS


MANYEYES : aplicacin que mezcla los datos y convierte nmeros complejos y datos de bases de

datos en visualizaciones que pueden ser tanto para la web como para la prensa escrita. Es una creacin
del grupo de investigacin de IBM, el cual procuraba con esta herramienta la democratizacin de la
visualizacin ya que es fcil de utilizar y de compartir.
YAHOO PIPES: es una herramienta informtica semejante a ManyEyes.
TABLEAU PUBLIC: versin gratuita del software Tableau. Es integrable y puede insertarse con facilidad en
la pgina web, blog o medio del usuario. No es confidencial pues queda abierto al pblico y tiene un lmite de
cien mil registros y 50 MB por usuario. Su herramienta Show me indica qu tipo de grficos se adapta a la
informacin que se est analizando.
GOOGLE FUSION TABLES: es una herramienta ideal para principiantes. Permite visualizar los datos y
publicarlos y compartirlos como mapas, lneas de tiempo y grficos. Se pueden combinar las tablas de datos,
filtrarlos y ordenarlos. Adems, permite a otros dejar comentarios sobre cada uno de estos. Una desventaja es
que los datos quedan en los servidores de Google, aun cuando se elija configurarlos en privado.

3.6 LIMPIEZA DE DATOS


Esto es para unificar criterios antes de cruzar datos. Es decir, formateo de datos.
Por ejemplo, si a la ciudad de Buenos Aires se la nombra como BA, Capital Federal o Ciudad
Autnoma de Buenos Aires en la misma base de datos; entonces ser necesario unificarlas. En este
caso se trata de establecer consistencia en los datos estableciendo un control de autoridades dirigido a
denominar a cada entidad, sea nombre de persona, corporacin o concepto, de una nica manera.
DATA WRANGLER: herramienta del Grupo de Visualizacin de la Universidad de Standford.

Funciona en el mismo explorador y todava est en fase demo. Su ventaja es que permite, entre otras
cosas, borrar de manera sistemticas filas en blanco, reacomodar los datos para que haya slo uno por
fila, formatear datos mediante la deduccin automtica Su desventaja es la relacionada con la

42

seguridad de los datos pues estos son enviados a un sitio externo, por lo que para informacin
confidencial no es tan recomendable (KANDEL et al., 2011)
GOOGLE REFINE : se trata de una poderosa herramienta gratuita para explorar datos y limpiarlos de

fcil manera. Funciona a travs del navegador, pero es una aplicacin de escritorio por lo que los datos
con los que se trabaja no se hacen pblicos.
Su principal funcin es el clustering o limpieza de datos basada en similitudes y correccin de erratas
tanto en textos como en nmeros-, que agrupa por aproximacin distintos valores de celda que
pueden referirse a lo mismo. Para ello utiliza diferentes algoritmos y el usuario puede elegir el que
desea utilizar, pues van desde los ms simples hasta los ms estrictos.
Su desventaja es que no tiene todas las funciones de una hoja de clculo aunque se parezca a una. Sin
embargo, los datos se pueden importar y exportar desde formatos varios como CVS, Excel, XML y
JSON.
3.7 ANLISIS ESTADSTICO
EL PROYECTO R: R es un sistema estadstico que sus autores prefieren llamar de entorno y es la

evolucin o nueva implementacin del lenguaje S que haba sido desarrollado en AT&T por Rick
Becker, John Chambers y Allan Wilks. Es OpenSource, multiplataforma y su uso se est extendiendo
cada vez ms. Algunas de las operaciones que pueden realizarse son: almacenamiento y manipulacin
efectiva de datos; operadores para clculo sobre variables indexadas (Arrays), en particular matrices; una
coleccin de herramientas para anlisis de datos; posibilidades de visualizacin de datos y un lenguaje de
programacin. Su gran potencial es que es extensible.
SPSS (STADISTICAL PRODUCT AND SERVICE SOLUTIONS): software estadstico muy poderoso,
de pago.

3.8 OTRAS HERRAMIENTAS


DOCUMENT CLOUD: proyecto ganador de uno de los desafos de la Knight Foundation que est

pensado para que los periodistas de diferentes medios de comunicacin publiquen sus documentos en
una misma plataforma, con marcaciones propias si se quiere. Un caso de su uso que merece mencin
tambin por relacionarse con informacin abierta es el del diario The New York Times que public
25.000 hojas de correos electrnicos de la candidata a vicepresidenta de Estados Unidos, Sarah Palin.
As, al estar a disposicin del pblico, los lectores tambin podan marcar aquello que les pareca
relevante y ayudar a los periodistas.
TEXTMATE: editor de texto plano con soporte para mltiples lenguajes de programacin.
43

4.BIG DATA
Big Data o lo que es lo mismo en espaol, los grandes volmenes de datos, es el fenmeno que en
tecnologa de la informacin hace referencia precisamente a aquellas cantidades de datos tan altas que
es difcil imaginarlas.
Y as como es difcil imaginarlas, es de comprender el problema que representan en distintos mbitos
de la vida, tanto a nivel individual como general. Pues as como Big Data trajo beneficios tambin
surgen constantemente nuevas necesidades en orden a poder almacenar tanta informacin, compartirla,
organizarla y visualizarla.
Para intentar imaginar a qu se refiere Big Data conviene destacar el ltimo informe sobre el Universo
Digital de la consultora internacional IDC de junio de 2011 (GANTZ, Jhon; REINSEL, David, 2011)
segn el cual toda la informacin digital del mundo se duplica cada dos aos. Y lo que calculaban para
fines de dicho ao es que se llegara a los 1,8 zettabytes de datos cifra todava por confirmar si se
alcanz-. Para tener una idea aproximada, un zettabyte son 1.000.000.000 billones de bytes.
Dicho estudio -patrocinado por la empresa lder en almacenamiento EMC- se realiza anualmente
desde 2007 y cada ao ha arrojado conclusiones sorprendentes, como la que deduce que el 75 por
ciento de la actual informacin en la web es creada por los individuos y que los datos a la actualidad
siguen superando la capacidad de almacenamiento disponible.
Las principales conclusiones del ao a ao de este estudio podran resumirse de la siguiente manera:
-

En 2006, la cantidad de informacin digital creada, capturada y replicada fue de 161 mil
millones de gigabytes, lo mismo que tres millones de veces la informacin contenida en todos
los libros de la historia. La conversin de lo analgico en digital es gran responsable del
crecimiento.

En 2007, la cantidad de informacin digital era de 281 mil millones de gigabytes. Este mismo
ao, por primera vez toda la informacin creada, capturada y replicada haba excedido el
almacenamiento disponible.

En 2008 se crearon 487 mil millones de gigabytes y alrededor del 70 por ciento fue
responsabilidad de los individuos.

En 2009, segn revelaba el informe 2010 de IDC, la informacin haba crecido en el mundo
un 62 por ciento hasta casi alcanzar 800.000 petabytes. Para imaginarlo, el informe compara
esta cantidad con una torre de DVDs que va y vuelve de la Tierra a la Luna.

Por ltimo, en 2010 la informacin ya alcanzaba y superaba la barrera del zettabyte llegando a
1,2 de esta ltima medida. Adems, los usuarios se vuelven responsables del 75 por ciento del
44

contenido disponible y no slo por la creacin de informacin sino por la informacin que
generan alrededor de ello.
ILUSTRACIN 13. A DECADE OF DIGITAL UNIVERSE GROWTH. FUENTE: IDCS DIGITAL UNIVERSE STUDY.

Los efectos de tanta informacin disponible se manifiestan constantemente y hasta han transformado
el panorama social. As es que el trfico de datos tambin ha crecido exponencialmente y segn el
Informe Global de la Nube (2010-2015) de Cisco se calcula que este se cuadriplicar para 2015 hasta
llegar a los 4,8 zettabytes.
Por aclarar aqu a qu es lo que se refiere el trmino la nube o computacin en la nube (Cloud
Computing), esta no tiene una definicin estndar aceptada. Por lo que una que encuentra acepcin y
que puede considerarse en este trabajo es la de 2008 del IEEE Computer Society (MCFEDRIES,
2008):
Estamos al borde de la computacin en la nube, en la que no slo los datos sino incluso nuestro
software reside dentro de la nube, y podemos acceder a todo, no slo a travs de nuestros equipos, sino
tambin a travs de dispositivos como telfonos inteligentes, PDAs, electrodomsticos, consolas de
juegos e incluso coches "
A su vez, para el profesor y experto Luis Joyanes Aguilar los datos y las aplicaciones se reparten en
nubes de mquinas, cientos de miles de servidores de ordenadores pertenecientes a los gigantes de
Internet, Google, Microsoft, IBM, Sun Microsystems, Oracle, Amazon, y poco a poco a cientos de
grandes empresas, universidades, administraciones, que desean tener sus propios centros de datos a
disposicin de sus empleados, investigadores, doctorandos, etc. (JOYANES, 2009).

45

De parte de todo esto se trata el fenmeno al que se llama Big Data, que no es una cosa o algo
esttico, sino que alude a un concepto dinmico. Segn la definicin de IDC, las tecnologas de Big
Data, describen una nueva generacin de tecnologas y arquitecturas, diseadas para extraer valor de
grandes volmenes de datos, permitiendo la captura a alta velocidad, su descubrimiento y/o anlisis
(GANTZ, Jhon; REINSEL, David, 2011).
Las medidas
Para conocer con exactitud las medidas y tamaos de datos a los que se hace mencin en este trabajo,
es pertinente prestar atencin al grfico siguiente.
ILUSTRACIN 14. "DATA INFLATION". FUENTE: THE ECONOMIST.

Este cuadro corresponde al artculo All too much de la revista The Economist (febrero 2010) e
ilustra de manera clara las unidades que miden la informacin digital. Como all se especifica, estas
estn tomadas de la Oficina Internacional de Pesos y Medidas que en 1991 agreg los trminos zetta y
yotta, siendo estos los dos ltimos.
As, para tener una estimacin de cuanta informacin representa cada medida, The Economist hace
comparaciones. Un B (byte) podra ser un nmero en cdigo informtico. Dos KB (kilobytes) son una
pgina de slo texto. Cinco MB (megabytes) podran ser todas las obras de Shakespeare. Entre uno y
dos GB (gigabytes) alcanzan para una pelcula comprimida de dos horas. Todos los libros catalogados
de la Biblioteca del Congreso de Estados Unidos son 15 TB (terabytes). Luego, un PB (petabyte)

46

equivala en 2010 a toda la informacin que Google procesaba en una hora. Un EB (exabyte) podran
ser mil millones de copias de la revista The Economist. Por su parte, 1,2 ZB (zettabyte) es la cantidad
de informacin que haba en total en 2010. Mientas que un YB (yottabyte) es todava muy grande
como para imaginar.
Un desafo en todos los mbitos
Con el correr de los ltimos aos es as como Big Data se ha ido convirtiendo en un elemento central
del mundo actual. Y, sobre todo se ha vuelto un desafo. Por ejemplo para aquellas empresas que
manejan inmensurables cantidades de informacin a cada hora. Pensar sino solamente en Facebook,
Google o Twitter. Slo en la plataforma de videos de YouTube se suben 72 horas de contenido por
minuto5, para tener una idea aproximada de los volmenes de informacin a los que hacemos mencin.
Precisamente, por el lado empresarial es que el tema Big Data fue objeto de una cobertura especial de
la revista The Economist de febrero de 2010 que se titul Data, data, everywhere. All se dio cuenta
de la astronmica cantidad de informacin que es procesada cada segundo -en el mundo hay una
cantidad de informacin digital inimaginable que se multiplica cada vez ms rpido- y del negocio
que representa la economa centrada en los datos, si bien todava faltaban las herramientas. En ese
mismo reportaje as lo admita el ejecutivo de Microsoft Craig Mundie: Usted puede ver las lneas
generales de esta economa pero las implicaciones tcnicas de esta, la infraestructura e incluso el
modelo de negocio, en este momento todava no se comprenden bien.
La empresa del buscador Google bien sabe tambin la importancia que tiene la informacin y su
potencial de negocio. Esto lo pone constantemente de manifiesto y puede evidenciarse en que el
primer nmero de la primera revista de su autora, Think Quarterly estuvo destinada a los datos y se
llam The Data Issue. En su introduccin, Matt Brittin (2011), el Managing director de Google
Reino Unido e Irlanda, invita a los lectores a inspirarse con la revista para encontrar, entre un mar de
informacin, los indicadores mgicos que le ayudarn a transformar su negocio.
Big Data es un desafo empresarial tanto por los problemas que puede acarrear, como por las
oportunidades que representa. Un importante ejemplo es el tema del almacenamiento disponible que
todava es inferior a la cantidad de datos existente. Tener en cuenta al respecto que un gigabyte de
contenido almacenado puede generar un trfico de hasta un petabyte sin que este sea almacenado,
como es el caso del streaming de televisin o de las llamadas de voz.

Cfr. It's YouTube's 7th birthday... and youve outdone yourselves, again. YouTube Blog (Mayo 2012)

47

Pero, segn el informe de IBM, What is big data? Bringing big data to the Enterprise(2012), este
fenmeno de Big Data, es ms que una simple cuestin de tamao, es una oportunidad para encontrar
ideas en nuevos y emergentes tipos de datos y contenidos, para hacer un negocio ms gil y dar
respuestas a preguntas que antes podan parecer fuera de alcance.
Lo mismo deca la consultora Gartner Inc.-especializada en tecnologas de la informacin- en
Pattern-Based Strategy IT Research Report, una publicacin de 2011 en la que adverta que las
empresas no deban tomar el almacenamiento como el nico problema que acarrean los grandes
volmenes de datos. Tambin estn la variedad y la velocidad. La variedad en el sentido de que cada
vez hay ms tipos de informacin con los que lidiar y la velocidad tanto por la rapidez con la que se
producen los datos como por lo rpido que la informacin deber ser procesada para satisfacer la
demanda.
De todas maneras, para los analistas de Gartner, BigData es un tema complejo pero el verdadero
problema est en encontrarle sentido a tanta informacin y en buscar patrones que ayuden a las
organizaciones a tomar mejores decisiones.
Y, as como The Economist o Google con Think Quarterly no fueron ni los primeros medios relevantes
ni los nicos en centrarse en Big Data como un tema actual y preponderante, previamente ya haba
habido otros indicios como el de la revista Wired. Esta, en su nmero de julio de 2008 habl de la
Era del Petabyte, enfocada a destacar el potencial de la lectura matemtica y estadstica de los datos,
sin importar el mbito de su aplicacin pues es la cantidad de informacin lo que hace la diferencia.
Es en ese sentido que BigData permite una nueva forma de investigacin en la que los nmeros hablan
por s mismos: La nueva disponibilidad de grandes volmenes de datos junto con las herramientas
estadsticas de hacer clculos de estas cifras ofrece una nueva forma de entender el mundo. Se refiere
a la aplicacin de algoritmos tan solo sea para descifrar tendencias y costumbres de los usuarios, por
ejemplo.
Asimismo, el desafo no slo alcanza a las empresas en lo que refiere a almacenamiento y buen uso.
Tambin alcanza a los individuos y a la sociedad en general que deben aprender a manejarse en un
mundo con sobreabundancia de informacin y aprovechar su potencial.
O puede tambin alcanzar mbitos especficos, como el cientfico por mencionar uno. Es as como la
prestigiosa revista Nature en septiembre de 2008, hizo tambin su especial sobre el tema Big Data
para resaltar los cambios que este fenmeno exige en el mbito de la investigacin: Los
investigadores deben obligarse a documentarse y manejar la informacin con el mismo
profesionalismo que invierten en sus experimentos. Incluso, en su editorial llega a afirmar que el
48

futuro de la ciencia puede depender en parte de la inteligencia que se aplique en navegar por la gran
abundancia de datos para su propio beneficio.
Tambin a nivel social y econmico estn las consecuencias. El Foro Econmico Mundial en su
informe de 2012 Big Data, Big Impact: New Possibilities for International Development la ha
considerado como una herramienta de desarrollo econmico, al referirse como ejemplo a los datos
generados por los mviles y su utilidad en situaciones de emergencia como un terremoto: Los
investigadores y los responsables polticos estn empezando a darse cuenta del potencial que tiene la
canalizacin de flujos de datos en informacin que puede ser utilizada para identificar necesidades,
proveer servicios, y predecir y prevenir crisis en beneficio de las poblaciones de bajos ingresos.
4.1 BIG DATA Y SU INFLUENCIA EN EL PERIODISMO
Today, making sense of Big Data, particularly unstructured data, will be a central goal for data
scientists around the world, whether they work in newsrooms, Wall Street or Silicon Valley.
Alex Howard (O'Reilly Media)
Pero Big Data no slo ha supuesto desafos para los mundos corporativos, gubernamentales y a nivel
individual. Tambin ha supuesto cambios para el periodismo y la manera de contar historias.
El anlisis de grandes bases de datos -ajenas o propias- supone el acceso a nuevas historias gracias a
los vnculos que se pueden establecer.
En esta lnea es que el periodista alemn Mirko Lorenz (2012), especializado en datos, define data
como pequeos puntos de informacin que frecuentemente no son relevantes de manera aislada pero
que a nivel masivo s lo son cuando se los analiza desde el ngulo correcto.
Sin embargo, no es tan simple como suena pues exige a los comunicadores nuevas habilidades para
dar contexto a enormes cantidades de informacin. O, en el caso que los comunicadores no incorporen
estos nuevos conocimientos, lo idneo es que tengan compaeros de equipo que s lo hagan. Lo mismo
en lo que refiere a la visualizacin de los datos.
Al mismo tiempo es de destacar que las herramientas para el manejo de mucha informacin se vuelven
ms accesibles y permiten ms fcilmente volver legibles y visibles grandes masas de datos que
pueden provenir de diferentes sitios y que son demasiado grandes como para ser ledas o analizadas
con los mtodos tradicionales.
En general, cada vez hay una mayor toma de conciencia en el valor que tiene encontrar patrones de
informacin para la elaboracin de noticias. Por ejemplo, una gran fuente de informacin actual es la
49

que est disponible en las redes sociales, como Facebook o Twitter. Aplicando all los algoritmos
adecuados y extrayendo patrones es posible reunir informacin noticiable de todo el fluir constante
de datos.
O si los recursos son pocos y la informacin a analizar y cruzar es mucha, un trabajo en conjunto con
la audiencia es tambin una nueva posibilidad. Lo mismo si se analiza una base de datos y se pone a
disposicin del pblico para que haga sus propios cruces de informacin y, si la plataforma lo permite,
la comparta. Pues los intereses varan de persona a persona y de comunidad a comunidad, de ah parte
la ventaja de alojarlas en algn sitio del Internet.
Asimismo, las herramientas para el manejo de Big Data en una redaccin no sirven slo para encontrar
informacin, tambin es posible utilizarlas para conocer en tiempo real o no las reacciones de la
audiencia digital y predecir aquello que ser ms de su inters, o que - tratndose de una empresavender ms.
4.2 EJEMPLO DE TRABAJO PERIODSTICO CON GRANDES BASES DE DATOS
El proyecto Dollars for Docs de la organizacin periodstica sin fines de lucro ProPublica
constituye un vlido ejemplo de trabajo con varias y grandes fuentes de datos. Lo que permite es que
el lector pueda averiguar cul es la relacin de su mdico de inters de Estados Unidos- con las
industrias farmacuticas.
Ello fue posible gracias a la apertura de datos que las mencionadas industrias farmacuticas
comenzaron a hacer en 2010 por un tema legal 6 . La intencin no es desenmascarar relaciones
fraudulentas sino reconocer que estas pueden plantear cuestiones ticas. Adems, su foco est puesto
en poner a disposicin dicha informacin de manera sencilla y desde all es posible sacar conclusiones.
As es como medios de diferentes estados del pas norteamericano basaron investigaciones
periodsticas en la fuente facilitada por ProPublica. O la misma organizacin bas notas periodsticas
en su base de datos durante estos ltimos aos.
ILUSTRACIN 15. "DOLLARS FOR DOCS". FUENTE: PROPUBLICA.

A raz de la reforma sanitaria de Estados Unidos. La ley que as lo dispone es la llamada Physician Payments Sunshine que
exige un informe anual para declarar cualquier pago o regalo por un monto mayor a los 10 dlares, lo que incluye viajes,
subvenciones para investigacin, invitaciones a congresos, etctera.

50

51

5.OPEN DATA (DATOS ABIERTOS)


La teora democrtica sostiene que la informacin sobre lo pblico ha de ser accesible de modo
igualitario para todos los miembros del pblico.
Philip Meyer, 1993
El acceso a la informacin pblica se ha ido multiplicando en los ltimos aos en distintos pases y,
aunque todava se est lejos del nivel deseado, esto ya ha ido revolucionando la manera de hacer
periodismo.
El concepto de Open Data (cuya traduccin sera datos abiertos) hace referencia a la informacin de
carcter pblico que se pone a disposicin del ciudadano o usuario, en orden a una mayor
transparencia de accin.
Se trata simplemente de abrir al pblico informacin que se aloja en los servidores propios o en la
Nube y que son de autora de la institucin local, nacional o internacional. Puede tratarse de informes,
de bases de datos, de encuestas, de estadsticas y dems, en formatos compatibles con los potenciales
usuarios y terceros.
Segn la definicin de la Unesco, el libre acceso consiste en permitir a todos acceder libremente a la
informacin relativa a la investigacin cientfica evaluada por expertos (artculos cientficos y datos de
investigacin). Ello supone que los titulares de los derechos conceden un derecho de acceso universal
e irrevocable para copiar, utilizar, distribuir, transmitir y crear obras derivadas en cualquier formato en
el marco de actividades legales, siempre y cuando se mencione como corresponde el autor original
(UNESCO, 2011).
Su nfasis en el libre acceso a la informacin de carcter cientfico hace referencia a que la institucin
internacional fomenta el crecimiento del conocimiento en los mbitos de la educacin, la ciencia, la
cultura y la comunicacin e informacin. Por ello es que participa activamente en su promocin.
Asimismo, en la declaracin de la Sociedad de Gobierno Abierto sus miembros firmantes defienden
el valor de la apertura en nuestro compromiso con los ciudadanos para mejorar los servicios,
gestionar los recursos pblicos, promover la innovacin y crear comunidades ms seguras. Adoptamos
los principios de transparencia y gobierno abierto para que haya ms prosperidad, bienestar y dignidad
humana en nuestros propios pases y en un mundo cada vez ms interconectado.
Esta Sociedad (Open Government Partnership, por sus siglas en ingls) fue lanzada en septiembre de
2011 entre los presidentes de Estados Unidos y Brasil, Barack Obama y Dilma Rousseff para

52

promover la transparencia como medio para mejorar la gestin de los recursos pblicos y aumentar la
participacin cvica. La conforman gobiernos de diferentes pases y organizaciones civiles, pblicas y
privadas.
Una administracin pionera y ejemplo en lo que refiere a Open Data es la de Estados Unidos con su
portal data.gov que fue luego replicado en otros gobiernos, entre ellos el de la Comisin de la Unin
Europea o el de Gran Bretaa.
Este ltimo, para su lanzamiento en enero de 2010 cont incluso con el apoyo del inventor de la World
Wide Web, Tim Berners-Lee. Este sitio, http://data.gov.uk/, funciona como buscador y tiene indexadas
miles de bases de datos ordenadas por distritos y estadsticas. Adems, cuenta con foros en los que los
usuarios pueden discutir temas relacionados con el manejo de datos. Incluso tiene tutoriales sobre
cmo utilizar la informacin y aprovechar las diferentes herramientas para su uso.
En ellos puede encontrarse desde la cantidad de homicidios de un municipio o ciudad hasta las
planillas con informacin detallada de los gastos pblicos.
No es el caso de Espaa a nivel de estado aunque s en algunos casos a nivel autonmico, como es el
Pas Vasco o el Principado de Asturias, que son los pioneros en el pas. El Pas Vasco tiene la
plataforma Open Data Euskadi donde puede encontrarse la informacin reutilizable, es decir aquella
que ya se ha hecho pblica y est librada a su reutilizacin.
Adems, estn las iniciativas ciudadanas de datos abiertos, sobre todo a nivel de organizacin civil y
que procuran facilitar al ciudadano el acceso a la informacin. Dos de ellas mencionables y que sirven
a modo de ejemplo son TheyWorkForYOU y FixMyStreet.
La primera se traduce como EllosTrabajanParaT y es un portal que, aprovechando la ley de acceso
a la informacin britnica crea una plataforma para que fcilmente un ciudadano sepa todo aquello que
hay disponible sobre sus representantes polticos en el Parlamento. Desde qu leyes votaron a favor o
en contra, hasta qu preguntas hicieron en las intervenciones parlamentarias y dems.
La segunda se traducira como ArreglaMiCalle y es una aplicacin de la misma organizacin civil
britnica que cre la anterior y se llama MySociety. Esta permite notificar sobre problemas en un radio
determinado para solicitar la intervencin del ayuntamiento y no slo eso, sino que es posible ver
cules de todos los problemas denunciados fueron resueltos y tambin pueden recibirse notificaciones
de cuando se denuncian problemas en el cdigo postal de inters. Dicha aplicacin es de cdigo
abierto y se ha aplicado en otros pases.
5.1 OPEN DATA Y EL PERIODISMO
53

Si tanta informacin abierta al pblico tiene un valor agregado a nivel ciudadano tambin lo tiene a
nivel periodstico. Y ah es donde entra la funcin del periodismo y, especialmente, del Periodismo de
Datos que se vio potenciado con el movimiento de datos abiertos. No porque necesitara de este para
afirmarse como tendencia, sino porque hizo crecer la cantidad de fuentes de informacin oficiales.
Wikileaks tambin ha sentado un precedente en lo que refiere a informacin disponible al pblico. Sus
documentos no se consiguieron de manera legal pero dieron relevancia a la necesidad de una apertura
de datos y de normas que avalen esta.
Pero es sobre todo la informacin pblica abierta la que ya continuar dando lugar a la elaboracin de
noticias. Claro que no toda ni siempre, pues puede simplemente haber informacin de carcter pblico
que no interesa.
He ah tambin parte del trabajo adicional del periodista o documentalista ms all de lo que podra
mirar un ciudadano comn y buscar entre el montn de informacin aquella historia que ser de
inters en los medios.
Luego quedar buscar la manera de comunicarla, conectndola e interpretndola procurando siempre
dejar libre el acceso a la fuente de informacin original.
5.2 ESPAA
En Europa, Espaa es de los pocos pases que no cuenta con una Ley de Acceso a la Informacin. Los
otros son Chipre, Luxemburgo y Malta. Es decir, es el nico pas de la regin con ms de un milln de
habitantes que no tiene esta legislacin.
La Ley de Transparencia, Acceso a la Informacin Pblica y Buen Gobierno es todava un proyecto si
bien su texto ha sido aprobado por el Consejo de Ministros el pasado 27 de julio. Antes de ello hubo
una consulta abierta para los ciudadanos que quisieran aportar algo, aunque esta consulta irnicamente
no fue transparentada y se desconoce si se tuvo en cuenta o no. Sobre su texto ha dicho la experta
Helen Darbishire, directora ejecutiva de Access Info Europe que es insuficiente, poco progresista y
est por debajo de los estndares internacionales, a raz de que no se considere el derecho a saber
como un derecho fundamental, asociado a la libertad de expresin y a la calidad democrtica
(GARCA GMEZ, 2012)
Constitucionalmente lo que est contemplado es el derecho a la informacin (artculo 20) y el acceso a
los archivos y registros administrativos (artculo 105). Sin embargo, una ley que desarrolle el libre
acceso no ha sido formulada e incluso el derecho a la informacin se encuentra con numerosos

54

obstculos, sobre todo de los que devienen de la Ley Orgnica de Proteccin de Datos (LOPD) pues
suele anteponerse el derecho a la privacidad.
Entonces, si bien a nivel de las comunidades autnomas s hay iniciativas en orden a un gobierno
abierto a nivel Estado hasta ahora slo hubo aproximaciones a una ley de acceso a la informacin
A nivel autonmico las iniciativas ya sancionadas son las siguientes:
-

Ley Foral de la Transparencia y del Gobierno Abierto de la Comunidad de Navarra:


aprobada en 2012, y con una propuesta muy ambiciosa para la participacin ciudadana. A su
respecto dijo Helen Darbishire (2012), directora de Access Info Europe: "Esta es una ley muy
fuerte, a la altura de las mejores leyes de acceso a la informacin del mundo. De hecho esta
ley va ms lejos incorporando principios datos abiertos y participacin ciudadana al concepto
de Gobierno Abierto".

Open Data Euskadi: sitio web a cargo del Gobierno Vasco donde se alojan los documentos
abiertos, con informacin reutilizable a disposicin de cualquier ciudadano.

Principado de Asturias: Catlogo de Datos Asturias, pionero en las iniciativas de gobierno


abierto de Espaa.

Catalua: Datos Abietos GenCat, de la Generalitat de Catalunya.

Xunta de Galicia: portal Open Data, para la reutilizacin de informacin pblica

Lo que es posible en Espaa es la reutilizacin de contenidos ya pblicos siendo una gran fuente de
informacin los Boletines Oficiales del Estado. La dificultad de estos reside en su lectura ya que en los
sitios estatales donde se alojan se encuentran en formato PDF que exige herramientas especficas y
tiempo para extraer los datos.
Adems, sobre Espaa es posible encontrar informacin a nivel de la Unin Europea que tiene ms
polticas de datos abiertos. La Unin Europea lanz en diciembre de 2011 una estrategia Open Data
para Europa que establece normas para un mejor uso de la informacin en manos de los gobiernos. Se
trata de un borrador de ley que pretende abrir una importante fuente de informacin pblica en
sectores varios como el cientfico, el gubernamental, geogrfico, de diferentes administraciones,
etctera.
Asimismo existen en Espaa iniciativas para promover la apertura de datos que parten del mbito
civil. Entre ellas:
-

Access Info Europe. Organizacin dedicada a promover el derecho a la informacin en Espaa


y el resto del mundo.

55

Tuderechoasaber.es Plataforma para hacer solicitud de informacin a instituciones pblicas.

5.3 FORMATO
El hecho de que los documentos de carcter pblico estn a disposicin de quien as lo quiera no es
suficiente. De all que el concepto de Open Data tambin hace alusin al formato en que esta
informacin es presentada. Pues, es conocido el problema que significa recolectar datos relevantes de
archivos PDF, uno de los ms comunes.
Es de destacar la iniciativa de Sun Microsystems que desarroll el formato de documento abierto ODF
(OpenDocumentFormat) en 2006 con la intencin de crear un formato libre que funcionara con
distintos sistemas operativos, es decir, que fuera interoperable. As es que numerosas iniciativas de
datos abiertos lo han adoptado para facilitar la lectura de la informacin a publicar.
6.CONCLUSIN
El Periodismo de Datos no es algo estrictamente nuevo pero el contexto de abundancia de informacin
actual ha hecho que en los ltimos aos su prctica se disparara, se diversificara y se facilitara. Pero no
es solamente la cantidad lo que ha intervenido en su potenciamiento, tambin ha sido responsable la
concientizacin sobre librar la informacin para uso y desuso de los usuarios, sean estos periodistas o
no.
Adems, la aparicin constante de herramientas que facilitan el acceso y la comunicacin de datos que
de otra manera resultaran complejos de interpretar, ha contribuido tambin a perfeccionar y extender
esta forma de comunicacin. Desde aplicaciones masivas como las de Google Fusion Tables para la
gestin y visualizacin de datos hasta otras ms especficas como Scraperwiki para la extraccin de
datos.
El especialista en Documentacin debe conocer tambin esta faceta periodstica de las diferentes bases
de datos y fuentes de informacin con las que trabaja constantemente para poder ayudar en el proceso
de su comunicacin a travs de medios de difusin, en caso de que sea de inters.
Y el Periodismo de Datos, sobre todo para temas de gran envergadura o que exigen la revisin de
pesadas fuentes de informacin, tiene la particularidad de combinar diferentes talentos en orden a un
mejor resultado.
Consideramos que, puesto que no es comn que se d el caso de un periodista con habilidades para
programar, para realizar estadsticas, para investigar temas que no sean de su especialidad, para
manejar bases de datos, para realizar infografas, etctera el Periodismo de Datos se trata de una forma

56

de periodismo idnea para el trabajo en equipo donde confluyen distintas especialidades entre las que
no debe quedar fuera la del documentalista.
En cuanto a su divulgacin acadmica, el Periodismo de Datos todava no es una materia muy presente
en programas de formacin, siquiera de Periodismo, por lo que tampoco ocupa un lugar fundamental
en el rea de Documentacin. Sin embargo, el fenmeno se va imponiendo por su fuerza e influencia
por lo que se espera que en los prximos aos su aproximacin acadmica se potencie y precisamente
este trabajo de fin de Mster es un intento de agilizar este proceso.
Y as como hay cada vez ms acceso a bases de datos que antes era impensable que estuviesen
disponibles para cualquiera, es cierto que el Periodismo de Datos alcanzara una mayor expresin con
una ley de acceso a la informacin pblica o de transparencia que no ponga trabas cuando se necesita
tal o cual dato. Y este escollo est presente todava en muchsimos pases, incluido entre ellos Espaa
con una ley encaminada, pero una ley que no reconoce el acceso a la informacin pblica como un
derecho inherente a la libertad de expresin, sino como una norma.
Este mismo anteproyecto de ley de transparencia encuentra contradicciones con la anterior ley
orgnica de proteccin de datos. Entonces, por ejemplo, sera posible acceder a cierta informacin de
carcter pblico pero no sera legal difundirla a travs un medio de difusin por si posible violacin al
derecho a la privacidad.
As pues, lo ms comn es que un trabajo de Periodismo de Datos se base en fuentes pblicas y
accesibles. Pues puede darse el caso de que haya pases que cuenten con normas para el acceso a la
informacin pero cuando esta se solicita ponen trabas o no las presentan en formatos legibles e
interoperables, lo que puede complejizar el trabajo de su lectura.
Eso s, segn recomienda Jos Luis Dader (2012), los datos incrustados sin ms en una informacin,
a partir de la iniciativa de fuentes externas no constituyen una transformacin sustancial del
Periodismo convencional. Bajo su perspectiva ello tendr valor en la medida en que aporte una
diferencia apreciable frente al periodismo de narracin episdica y enfoque dramatstico
(infoentretenimiento).
Es decir, ir por aquella informacin por la que el ciudadano no ira por motu proprio o encontrar en
ella lo que no podra verse a primera vista en una larga lista de datos.
En cuanto a la sobreabundancia de informacin, esta no es nueva. Ya en 1970 Alvin Toffler hablaba
de information overload (sobrecarga de informacin) en su libro Future Shock.

57

Incluso hasta podramos remontarnos a los aos que siguieron a la invencin de la imprenta y la
anecdtica queja del tologo Juan Calvino que en 1550 hablaba de que haba tantos libros que ni
tiempo tena de leer los ttulos.
As es que, si tanto el Periodismo de Datos en s no es nuevo o si la gran cantidad de datos (Big Data)
tampoco lo es, no se trata de una revolucin en la forma de comunicar. Sin embargo, las circunstancias
actuales de las tecnologas de la informacin y la necesidad de informarse reclaman un reconocimiento
a las nuevas caractersticas del tipo de periodismo que trabaja con datos.
Por ello, este trabajo pretende ser un llamado de atencin para documentalistas, especialmente para
aquellos que trabajan directamente en medios de comunicacin y tambin para otros profesionales de
los medios. Pues el Periodismo de Datos brinda la oportunidad de una lectura ms objetiva y diferente
de la actualidad, basndose en las mltiples herramientas disponibles, tanto para su produccin como
para su lectura.
Puede incluso ser la oportunidad para que el periodismo tradicional se reinvente a s mismo y
encuentre el potencial de la comunicacin y visualizacin de los datos, derivados de fuentes abiertas o
recopilados por otros medios.
7. ANEXO
7.1 FRASES
I THINK DATA-DRIVEN JOURNALISM IS ONE OF THE BIG
POTENTIAL GROWTH AREAS IN THE FUTURE OF JOURNALISM
(). IN FACT, I BELIEVE IT IS JOURNALISM IN ITS TRUEST
ESSENCE: UNCOVERING AND MINING THROUGH INFORMATION
THE PUBLIC DO NOT HAVE ENOUGH TIME TO DO THEMSELVES,
INTERROGATING IT, AND MAKING SENSE OF IT BEFORE SHARING
IT WITH THE AUDIENCE.

Adam Westbrook, autor de Next Generation Journalist. Fuente:European Journalism Centre

ONLY TIME WILL TELL, BUT INFORMATION OUGHT TO HELP


DEMOCRACY, NOT HURT IT. WE NEED NEW INSTITUTIONS TO
BUILD NEW MEDIA FORMS THAT WILL LET TRUTH STAND OUT
FROM THE NOISY BABBLE AND COMMAND ATTENTION BECAUSE
THEY

are

TRUSTED

AND

COMPREHENDED.

NARRATIVE

58

JOURNALISM COMBINED WITH PRECISION JOURNALISM COULD


DO THAT JOB. LETS GET STARTED.

Philip Meyer, autor de Precision Journalism. Fuente: Nieman Lab.


ONE OF OUR BIG GOALS IN THE STORYTELLING PROCESS IS TO
HUMANIZE THE STATISTICS. ITS HARD FOR PEOPLE TO CARE
ABOUT NUMBERS, ESPECIALLY LARGE NUMBERS.

Brian Storm, fundador de Mediastorm. Fuente: European Journalism Centre.

"DATA JOURNALISM" IS NOT ALWAYS PRESENTING THE DATA


*AS* JOURNALISM. IT'S ALSO FINDING THE JOURNALISM WITHIN
THE DATA.

Jay Rosen, profesor de Periodismo en la Universidad de Nueva York. Fuente: Twitter.


7.2 BIBLIOGRAFA
7.2.1 BIBLIOGRAFA INTRODUCCIN A LA INVESTIGACIN
BOUNEGRU, Liliana. Data Journalism in Perspective. En GRAY, Jonathan; CHAMBERS, Lucy;
BOUNEGRU, Liliana (ed) The Data Journalism Handbook. Estados Unidos. O'Reilly Media. 2012.
Disponible en: http://datajournalismhandbook.org/1.0/en/introduction_4.html. [Consulta: 2 febrero
2012].

CORDN GARCA, J.A; ALONSO ARVALO, J.; GMEZ DAZ, R. Y LPEZ LUCAS, J. Las
Nuevas fuentes de informacin: informacin y bsqueda documental en el contexto de la web 2.0.
Madrid. Pirmide. 2012.
DADER, Jos Luis. Periodismo de precisin. Va socioinformtica de descubrir noticias. Espaa:
Editorial Sntesis. 1997.
EGIDO, Moiss. Se desarrolla el Periodismo de precisin. Telos N 45. Madrid. 1996. P.136- 143.
FLORES VIVAR, Jess Miguel y CEBRIN HERREROS, Mariano. El data journalism en la
construccin de mashups para Medios digitales. En: SABS TURMO, Fernando y VERN LASSA,
Jos Juan (Eds.). El Periodismo digital analizado desde la investigacin procedente del mbito
acadmico. XIII Congreso de Periodismo Digital de Huesca 15/16 de marzo 2012. Huesca:
Asociacin de la Prensa de Aragn. 2012. P. 215-229.

59

MEYER, Philip. Periodismo de precisin: Nuevas fronteras para la investigacin periodstica.


Espaa: Editorial Bosch. 1993.
ROGERS, Simon. Facts are Sacred: The power of data. Guardian Shorts. Edicin para Kindle. 2011.
ROGERS, Simon. Wikileaks data journalism: how we handled the data [en lnea]. Guardian.go.uk.
Enero 2011. Disponible en: http://www.guardian.co.uk/news/datablog/2011/jan/31/wikileaks-datajournalism. [Consulta: 2 febrero 2012].
ROGERS, Simon. Executive Insight [en lnea].

Think Quarterly by Google. Marzo 2011.

Disponible en: http://www.thinkwithgoogle.co.uk/quarterly/data/executive-insight-guy-laurence-ceovodafone.html [Consulta: 14 junio 2012].


7.2.2 BIBLIOGRAFA PERIODISMO DE DATOS
BRADSHAW, Paul. Data journalism pt1: Finding data (draft comments invited) [en lnea]. Online
Journalism Blog. Abril 2010. Disponible en: http://onlinejournalismblog.com/2010/04/21/datajournalism-pt1-finding-data-draft-comments-invited. [Consulta: 2 febrero 2012].
BRADSHAW, Paul. One ambassadors embarrassment is a tragedy, 15,000 civilian deaths is a
statistic

[en

lnea].

Online

Journalism

Blog.

Diciembre

2010.

Disponible

en:

http://onlinejournalismblog.com/2010/12/07/wikileaks-cablegate/ [Consulta: 14 junio 2012].


CAIRO, Alberto. El arte funcional. Infografa y visualizacin de la informacin. Espaa. Alamut.
2011.
CAIRO, Alberto. Periodismo de precisin y visualizacin de datos (parte 2) [en lnea]. Periodismo
con futuro. Blogs EL PAS. 16 de abril de 2011. Disponible en: http://blogs.elpais.com/Periodismocon-futuro/2011/04/Periodismo-de-precision-y-visualizacion-de-datos-parte-2.html

[Consulta:

febrero 2012].
CAIRO, Alberto. Los abusos de Guantnamo y una apologa de los infogrficos peligrosos [en
lnea]. Periodismo con futuro. Blogs EL PAS. 25 de abril de 2011. Disponible en:
http://blogs.elpais.com/Periodismo-con-futuro/2011/04/infograficos-peligrosos.html

[Consulta:

15

febrero 2012].
DADER, Jos Luis. "Introduccin. En: MEYER, Philip. Periodismo de Precisin: Nuevas Fronteras
para la investigacin periodstica. Barcelona. Bosch. 1993.

60

DADER, Jos Luis. Periodismo de precisin. Va socioinformtica de descubrir noticias. Espaa:


Editorial Sntesis. 1997.
DADER, Jos Luis. Periodismo De Precisin: El Anlisis Matemtico e Informtico Como
Vigilancia De Las Estadsticas Sociales y Su Manipulacin Por El Poder. Espaa. 2006. Disponible
en:

http://www.juntadeandalucia.es:9002/jornadas/jornadas-informacion/ponencias-jornadas-

periodistas/Periodismo-de-Precision.Sevilla06.pdf [Consulta: 5 julio 2012].


DEMERS, David Pearce y NICHOLS, Suzanne. Precision journalism: A practical guide. Estados
Unidos: Sage Publications. 1987.
DJA nominee of the day: Methadone and the Politics of Pain [en lnea]. Data Driven Journalism.
Mayo

2012.

Disponible

en:

http://datadrivenjournalism.net/featured_projects/DJA_nominee_of_the_day_Methadone_and_the_Pol
itics_of_Pain#When:15:37:36Z [Consulta: 20 julio 2012].
FLORES VIVAR, Jess Miguel. Reflexiones, tendencias y perfiles del Periodismo de Datos.
Durante: Curso de verano Periodismo de Datos. San Lorenzo del Escorial, Madrid. 2012.
GORDON, Richard. Data as journalism, journalism as data. Readership Institute. Noviembre 2007.
Disponible

en:

http://getsmart.readership.org/2007/11/data-as-journalism-journalism-as-data.html

[Consulta: 14 julio 2012].


Hal Varian on how the Web challenges managers [en lnea]. McKinsey Quarterly. Enero 2009.
Disponible

en:

http://www.mckinseyquarterly.com/Energy_Resources_Materials/Oil_Gas/Hal_Varian_on_how_the_
Web_challenges_managers_2286 [Consulta: 14 junio 2012].
HOLOVATY, Adrian. A Fundamental way newspaper sites need to change [en lnea].
Holovaty.com. Septiembre 2006. Disponible en: http://www.holovaty.com/writing/fundamentalchange/ [Consulta: 14 julio 2012].
How to Shape Your Data [en lnea]. Tableau Public. 7 de abril 2011. Disponible en:
http://www.tableausoftware.com/public/blog/2011/04/data-shaping [Consulta: 25 de mayo 2012].
Impartiality: The

Foxification of

news.

The Economist. Julio 2011. Disponible en:

http://www.economist.com/node/18904112?fsrc=scn/tw_ec/the_foxification_of_news [Consulta: 25
de mayo 2012].

61

KANDEL, Sean; PAEPCKE, Andreas; HELLERSTERIN, Joseph y HEER, Jeffrey. Interactive


Visual Specification of Data Transformation Scripts. ACM Human Factors in Computing Systems
(CHI). 2011.
KEENAN, John. Why raw data sites need journalism [en lnea]. Guardian.co.uk. Agosto 2010.
Disponible

en:

http://www.guardian.co.uk/commentisfree/libertycentral/2010/aug/11/raw-data-

journalism-wikileaks [Consulta: 25 de junio 2012].


MCGHEE, Geoff. Journalism in the Age of Data: A Video Report on Data Visualization.
[Videoreportaje] Estados Unidos. 2010. Disponible en: http://datajournalism.stanford.edu/ [Consulta:
2 1 junio 2012].
MEYER, Philip. Periodismo de precisin: Nuevas fronteras para la investigacin periodstica.
Espaa. Bosch. 1993.
MEYER, Philip. Precision Journalism and Narrative Journalism: Toward a Unified Field Theory.
Nieman

Reports.

2011.

Disponible

en

http://www.nieman.harvard.edu/reports/article-online-

exclusive/100044/Precision-Journalism-and-Narrative-Journalism-Toward-a-Unified-FieldTheory.aspx [Consulta: 14 junio 2012].


NUSSBAUMER, Cole. Data Stories [en lnea]. Think Quarterly by Google. Marzo 2011. Disponible
en: http://www.thinkwithgoogle.co.uk/quarterly/creativity/data-stories.html [Consulta: 10 febrero
2012].
REINHARD, Ulrike. A Data State of Mind [en lnea]. Think Quarterly by Google. Marzo 2011.
Disponible

en:

http://www.thinkwithgoogle.co.uk/quarterly/data/hans-rosling-a-data-state-of-

mind.html [Consulta: 25 de junio 2012].


SEGEL, Edward y HEER, Jeffrey. Narrative Visualization: Telling Stories with Data. The IEEE
Transactions on Visualization and Computer Graphics.2010. Vol. 16, no. 6, pp. 1139-1148.
7.2.3 BIBLIOGRAFA BIG DATA Y OPEN DATA
"All Too Much". The Economist. Vol. 394. Nmero 8671. Seccin especial, pg 5. Febrero 2010.
Disponible en: http://www.economist.com/node/15557421 [Consulta: 5 Junio 2012].
Big Data, Big Impact: New Possibilities for International Development. World Economic Forum.
Enero 2012. Vital Wave Consulting. Disponible en: http://www.weforum.org/reports/big-data-bigimpact-new-possibilities-international-development [Consulta: 15 de junio 2012].

62

BRITTIN, Matt. Data [en lnea]. Think Quarterly by Google. Marzo 2011. Disponible en:
http://www.thinkwithgoogle.co.uk/quarterly/data/note.html [Consulta: 9 Junio 2012].
"Data, Data Everywhere." The Economist. Vol. 394. Nmero 8671. Seccin especial. Febrero 2010.
Disponible en: http://www.economist.com/node/15557443 [Consulta: 5 Junio 2012].
It's YouTube's 7th birthday... and youve outdone yourselves, again [en lnea]. YouTube Blog.
Mayo 2012. Disponible en: http://youtube-global.blogspot.com.es/2012/05/its-youtubes-7th-birthdayand-youve.html [Consulta: 25 de mayo 2012].
GANTZ, Jhon; REINSEL, David. "The 2011 Universal Digital Study: Extracting value from chaos".
IDC

research

report,

sponsored

by

EMC.

Vol.

19.

Junio

2011.

Disponible

en:

http://www.emc.com/collateral/demos/microsites/emc-digital-universe-2011/index.htm [Consulta: 25
de junio 2012].
GARCA GMEZ, Rosario. Donde no hay luz pasan cosas. El Pas. 15 de agosto 2012. Disponible
en: http://sociedad.elpais.com/sociedad/2012/08/15/actualidad/1345050724_942894.html [Consulta:
23 de agosto 2012].
JOYANES AGUILAR, Luis. Computacin en la nube. Estrategias de Cloud Computing en las
empresas.

Edicin

Latinoamericana:

Mxico.

Alfaomega.

Edicin

Espaola:

Barcelona.

Marcombo/Alfaomega. 2012.
LORENZ, Mirko. Why Journalists Should Use Data. En GRAY, Jonathan; CHAMBERS, Lucy;
BOUNEGRU, Liliana (ed). The Data Journalism Handbook. Estados Unidos. O'Reilly Media. 2012.
Disponible en: http://datajournalismhandbook.org/1.0/en/introduction_4.html [Consulta: 25 de mayo
2012].
MCFEDRIES, Paul. The Cloud Is The Computer. IEEE Spectrum. Agosto 2008. Disponible en:
http://spectrum.ieee.org/computing/hardware/the-cloud-is-the-computer [Consulta: 23 de julio 2012].
Navarra open government law [en lnea]. Access Info Europe. Madrid, 20 de enero de 2012.
Disponible en: http://www.access-info.org/es/coalicion-pro-acceso/215-navarra-open-government-law
[Consulta: 23 de agosto 2012].
OPEN GOVERNMENT PARTNERSHIP. Declaracin sobre Gobierno Abierto. Septiembre 2011.
Disponible

en:

http://www.opengovpartnership.org/declaraci%C3%B3n-sobre-gobierno-abierto

[Consulta: 20 de agosto 2012].

63

Pattern-Based

Strategy

IT

Research

Report.

Gartner

Inc.

Disponible

en:

http://www.gartner.com/technology/research/pattern-based-strategy/ [Consulta: 25 de junio 2012].


Special: Big Data. Nature. Vol. 455. Nro. 7209. 4 septiembre 2008. Disponible en:
http://www.nature.com/news/specials/bigdata/index.html [Consulta: 27 de junio 2012].
The Petabyte Age : Because More Data Isn't just More - More is Different. Wired. 16 julio 2008.
San

Francisco,

Estados

Unidos.

Disponible

en:

http://www.wired.com/science/discoveries/magazine/16-07/pb_intro [Consulta: 25 de julio 2012].


UNESCO. Proyecto revisado de estrategia sobre la contribucin de la UNESCO a la promocin del
libre acceso a la informacin y la investigacin cientficas. Pars. Agosto 2011. Disponible en:
unesdoc.unesco.org/images/0021/002133/213342s.pdf [Consulta: 20 de agosto 2012].
What is Big Data? Bringing Big Data to the Enterprise. IBM. 2012. Disponible en:

http://www-

01.ibm.com/software/data/bigdata/ [Consulta: 25 de mayo 2012].

64

Anda mungkin juga menyukai