Imagen: www.ted.com/playlists/130/the_dark_side_of_data
INTRODUCCIÓN
Los datos se han convertido en activos empresariales más importantes de una
compañía, y aunque en algunos casos aún existe desconocimiento en cómo
convertirlos en conocimiento y en una ventaja competitiva fuera del papel, la Gestión
de Información y el Gobierno de Información, ya son una prioridad para las empresas
que han tomado un enfoque “data driven”, es decir, empresas que basan sus
decisiones estratégicas en la información.
Basado en experiencia, para empezar a experimentar con Scrum y Big Data, una
propuesta puntual sería la creación de equipos multifuncionales que integran
miembros del negocio y tecnología en un “Laboratorio de Datos" o “Centro de
Excelencia” si queremos ponerle un nombre más “formal”.
1. Identificación de datos
2. Adquisición y filtrado
Se procede a extraer y filtrar los datos necesarios ya que por más que se trate de un
Data Lake, no es una mejor práctica cargar información que no sea de utilidad
posterior.
3. Extracción y homologación
4. Validación y limpieza
5. Agregación de datos
Se unifican las distintas fuentes de información para formarán parte del data lake
para análisis.
6. Análisis de datos
RESUMEN
Las tecnologías de Analítica y Big Data al igual que muchas otras, presentan su mayor
complejidad no a nivel de infraestructura o implementación como herramienta, sino
al momento de desarrollar e implementar las necesidades del usuario, capturadas
frecuentemente por medio de historias de usuario.