Artículo de investigación
Para citar este artículo: Camargo, J. J. Camargo, J. F. y Aguilar, L. (2015). Arquitectura tecnológica para Big Data.
Revista Científica, 21, 7-18. Doi: 10.14483/udistrital.jour.RC.2015.21.a1
1
Universidad Pontificia de Salamanca campus Madrid–España. Contacto: jjcamargovega@uptc.edu.co
2
Universidad del Bosque, Bogotá- Colombia. Contacto: jfcamargo@unbosque.edu.co
3
Universidad Pontificia de Salamanca campus Madrid–España. Contacto: luis.joyanes@upsam.es
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[7]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[8]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Arquitectura De Big Data • M2M. Son datos que se generan de máquina a má-
quina (hardware a hardware), tales como: lectu-
Existen varios modelos de arquitectura de Big ras de sensores, medidores y otros dispositivos. Por
Data, de los cuales se mostrarán tres: ejemplo, como lo menciona Soares (2012a):
Varias utilidades están desplegando contadores
Arquitectura de procesamiento de Big Data inteligentes para medir el consumo de agua, gas y
propuesta por Krishnan electricidad a intervalos regulares de una hora o me-
nos. Estos contadores inteligentes generan grandes
La arquitectura presentada por Krishnan (2010), cantidades de datos de intervalo que necesitan ser
representada en la Figura 1, es similar al tratamien- gobernados de manera apropiada. Las utilidades
to de la gestión de datos que hace bastante tiempo deben salvaguardar la privacidad de estos datos de
se conoce, el cual consiste en cuatro etapas: re- intervalo, ya que potencialmente puede revelar las
colección o recopilación, carga, transformación y actividades del hogar del abonado, así como cuán-
extracción de datos. Para este caso, el autor lo lla- do un dueño de casa puede estar lejos.
ma enfoque de procesamiento de Big Data (Dem- • Transacciones. Son datos que pueden provenir de
chenko, Ngo y Membrey, 2012). registros detallados de llamadas (charging data re-
cord, CDR) de las telecomunicaciones, registros de
Etapa 1. Recolección o recopilación o fuentes de facturación de servicios públicos que están cada vez
datos de Big Data más disponibles en formatos semiestructurados y
no estructurados. Por ejemplo, como lo menciona
En la primera etapa, los datos son recibidos de di- Soares (2012a):
ferentes orígenes o fuentes, que pueden ser: pá- • Un gran plan de salud procesa más de 500 millo-
ginas web, redes sociales, máquina a máquina nes de reclamaciones por año, con cada registro de
(M2M), transacciones, biometría o generados por las reclamaciones que consta de 600 a 1.000 atri-
el ser humano (Krishnan, 2013). butos. El plan utiliza el análisis predictivo para de-
Páginas web. Puede registrar las huellas en pá- terminar si se requieren ciertas medidas proactivas
ginas web, con el seguimiento de clics que rea- para un pequeño subconjunto de los miembros. Sin
lice el usuario (Soares, 2012a; Mysore, Khupat y embargo, el equipo de inteligencia de negocios en-
Jain, 2013). contró que los médicos estaban usando los códi-
gos de procedimiento inconsistentes para presentar
• Redes sociales. De medios o redes como Facebook, reclamaciones, lo que limitó la efectividad de los
Twitter, LinkedIn y blogs. Por ejemplo, como men- análisis predictivos. El equipo de inteligencia de ne-
ciona Soares (2012a): gocios también cuestionó el texto dentro de docu-
• Muchas compañías de seguros ahora utilizan los mentos de reclamos.
medios sociales para investigar las denuncias. Sin Biometría. Este tipo de datos incluye huellas di-
embargo, la mayoría de los reguladores todavía no gitales, la genética, la escritura a mano, escáner de
permiten a las aseguradoras usar los medios sociales retina, entre otros. Por ejemplo, como menciona
para establecer las tasas de política durante el proce- Soares (2012a):
so de suscripción. Por ejemplo, si una aseguradora • Un informe de marzo de 2012 de la Comisión Fe-
de vida que ve el perfil de Facebook de un solicitan- deral de Comercio de EE. UU. detalla cómo los
te indica que ella es una estudiante de aviación, la minoristas podrían potencialmente utilizar la tec-
aseguradora no puede usar ese conocimiento para nología de reconocimiento facial en combinación
aumentar sus primas debido a que podría ser consi- con una foto de los medios sociales para hacer ofer-
derado un alto riesgo. tas personalizadas a los clientes en función de su
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[9]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 10 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
de sensores electrónicos e incluso algunos datos Etapa 3. Transformación de datos de Big Data
transaccionales” (Tucker, 2013).
En este punto, los datos se transforman mediante
Etapa 2. Carga de datos de Big Data la aplicación de las reglas del negocio y el proce-
samiento de los datos. Respecto al procesamien-
En esta etapa, los datos se cargan aplicando el to, en cada etapa producen resultados intermedios
concepto de metadatos (datos que describen otros que se pueden almacenar para un posterior exa-
datos). Además de la carga como tal, es la pri- men. El resultado de esta etapa son unas cuantas
mera vez que los datos se estructuran (Krishnan, claves de metadatos con modelo clave-valor (Kri-
2013) . Es de aclarar que los metadatos son infor- shnan, 2013).
mación que describe características de cualquier
dato, como el nombre, la ubicación, la importan- Etapa 4. Extracción de datos de Big Data
cia percibida, la calidad y sus relaciones con otros
objetos de datos que la empresa considere digno El objetivo de la extracción es obtener datos para
de la gestión (Soares, 2012b). La siguiente tarea su posterior análisis, generar informes operativos
es la capacidad de usar metadatos, bibliotecas se- y su posible visualización y, por último, y no el
mánticas y datos maestros. Se busca vincular los más importante, para su almacenamiento (Krish-
datos entre el conjunto de datos estructurados y nan, 2013) .
no estructurados con metadatos y datos maestros.
Se deben transformar los datos no estructurados en Arquitectura de Big Data propuesta por Bob
estructurados. Es importante acudir a la integridad Marcus
referencial, la cual ayuda inicialmente con la cla-
ve principal y las demás relaciones en una base de El modelo de arquitectura por niveles fue propues-
datos tradicional (Soares, 2012b). to por Bob Marcus (Tabla 1).
Fuente: [18]
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 11 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 12 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Fuente: [18]
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 13 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Krishnan Marcus
Etapa 1. Recolección de datos (A) Fuentes de datos externas
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 14 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Krishnan Microsoft
Etapa 1. Recolección de datos Fuentes de datos
Etapa 2. Carga de datos Transformación de datos
Etapa 3. Transformación de datos Transformación de datos
Etapa 4. Extracción de datos Infraestructura de Big Data
más grande. Al final se obtiene que cada objeto sea Comparación de arquitecturas propuestas
enriquecido. por Krishnan y Marcus
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 15 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 16 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
en la etapa “(G) Servicios de Apoyo”, no debe ser Krishnan, K. (2013). Data warehousing in the age
parte de la labor de la persona que implementa un of big data. Morgan Kaufmann Series on Busi-
Big Data, pues hoy existen herramientas que ayu- ness Inteligence. USA: Elsevier.
dan con esta gestión. Es decir, no es necesario se- Mysore, D., Khupat, S., y Jain S. (2013). Big data
guir en este aspecto el modelo de Marcus. architecture and patterns, Part 1: Introduction
Finalmente, el modelo de arquitectura de Mar- to big data classification and architecture. [En
cus, en el paso llamado “(G) Servicios de Apoyo”, línea]. Recuperado de http://www.ibm.com/
muestra algo denominado “Gestión de recursos developerworks/library/bd-archpatterns1/in-
de datos”, donde menciona las “Herramientas de dex.html?ca=drs [Consultado el 11 de mayo
control de datos de código abierto que son todavía de 2014].
inmaduras”; este no se debe tener presente para NIST Big Data Program. (2013). Big Data Archi-
abordar proyectos de Big Data, pues realmente lo tecture Models: A Survey Version 1.2 [En lí-
que se necesita son herramientas para el Big Data nea] Disponible en: http://bigdatawg.nist.gov/
que muestren altos niveles de calidad. show_InputDoc.php [Consultado: 01-Jun-14].
Pettey C., y Goasduff L. (2011). Gartner Says Sol-
Referencias ving ‘Big Data’ Challenge Involves More Than
Just Managing Volumes of Data. [En línea]. Re-
Dans, E. (2011). Big Data: una pequeña introduc- cuperado de: http://www.gartner.com/news-
ción. [En línea]. Recuperdao de http://www. room/id/1731916 [Consultado el 17 de mayo
enriquedans.com/2011/10/big-data-una-pe- de 2014].
quena-introduccion.html [Consultado el 28 de Preimesberger, Chris. eWeek 28. 13 (2011), [En
abril de 2014]. línea] Disponible en: http://search.proquest.
Demchenko, Y., Ngo, C., y Membrey, P. (2012). Ar- com/docview/885430073/1366B171EE72ED-
chitecture Framework and Components for the B474F/1?accountid=43790, [Consultado el 30
Big Data Ecosystem. Draft Version 0.2. [En lí- de abril de 2014].
nea]. Recuperado de http://www.uazone.org/ searchdatacenter.techtarget.com. (2013). Repor-
demch/worksinprogress/sne-2013-02-techre- te de Gartner analiza “big data” alrededor de
port-bdaf-draft02.pdf tecnología de datos. [En línea]. Recuperado de
es.wikipedia.org, [En línea] Disponible en: http:// http://searchdatacenter.techtarget.com/es/no-
es.wikipedia.org/wiki/Big_data,(2013). [Con- ticias/2240171952/Reporte-de-Gartner-anali-
sultado: 25-Mar-13]. za-big-data-alrededor-de-tecnologia-de-datos
Gualtieri, M. (2012). The Pragmatic Definition of [Consultado el 30 de diciembre de 2014].
Big Data. [En línea]. Recuperado de http:// Soares, S. (2012a). A Framework that Focuses on
blogs.forrester.com/mike_gualtieri/12-12-05- the “Data” in Big Data Governance. [En lí-
the_pragmatic_definition_of_big_data [Con- nea]. Recuperado de http://ibmdatamag.
sultado el 4 de enero de 2013]. com/2012/06/a-framework-that-focuses-on-
Hopkins, B. (2011). Beyond the Hype of Big Data. the-data-in-big-data-governance/ [Consultado
[En línea]. Recuperado de http://www.cio. el 5 de mayo de 2014].
com/article/692724/Beyond_the_Hype_of_ Soares, S. (2012b). Big Data Reference Architectu-
Big_Data [Consultado el 1 de mayo de 2012]. re. [En línea]. Recuperado de http://sunilsoares.
Joyanes, L. (2013). Big Data: análisis de grandes wordpress.com/2012/07/22/big-data-referen-
volúmenes de datos en organizaciones (1ª edi- ce-architecture-2/ [Consultado el 5 de mayo
ción). México: Alfaomega. de 2014].
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 17 ]
Arquitectura tecnológica para Big Data. Revista Científica
Camargo, J. J. Camargo, J. F. y Aguilar, L.
Sun, H. y Heller, P. (2012). Oracle Information Ar- zdnet.com, CBS Interactive, (2013), [En lí-
chitecture: An Architect’s Guide to Big Data nea] Disponible en: http://translate.google.
[En línea] Disponible en: http://www.oracle. com.co/translate?hl=es&sl=en&tl=es&u=h-
com/technetwork/topics/entarch/articles/oea- ttp%3A%2F%2Fwww.zdnet.com%2Fblo-
big-data-guide-1522052.pdf [Consultado: g%2Fvirtualization%2Fwhat-is-big-data%-
11-May-14]. 2F1708&anno=2 [Consultado el 11 de
Tucker, T. (2013). Developing a big data application marzo de 2013].
for data exploration and discovery. Tips, tech- Zdnet.com. (2010). [En línea]. Recuperado de:
niques, and practical guidelines to help you get http://www.zdnet.com/search?q=big+data
started. [En línea]. Recuperado de http://www. [Consultado el 3 de abril de 2014].
ibm.com/developerworks/library/bd-explora- Zikopoulos, P., Eaton C., DeRoos D., Deutsch T. y
tion/index.html?ca=dbg-twodw [Consultado Lapis G. (2012). Understanding Big Data. Uni-
el 11 de mayo de 2014]. ted States of America: McGraw-Hill.
Revista Científica • ISSN 0124-2253 • e-ISSN 2344-2350 • Bogotá-Colombia • No. 21 • pp. 7-18
[ 18 ]