Anda di halaman 1dari 4

CASSANDRA [8]:http://www.frm.utn.edu.ar/alumnosis/index.php?

option=com_content&view=article& id=6 1:base-de-datos-cassandra&catid=3:newsflash&Itemid=37

desarrollada por facebook hoy twitter y Digg

Riptano soporte comercial Escalable Actual release 0.7 Soporte de ndice secundario Trabaja con altos volumnenes de informacin la cual se distribuye en muchos servidores de forma tal que su disponbilidad se asegura ya que no existe nico punto de falla. Maneja el concepto de consistencia eventual (programacin paralela) Las claves se mapean hacia familias de columnas

-a-apache-cassandra/ [7] http://www.agevaled.com/2010/12/31/introduccion Mientras que en las bases de datos relacionales la informacin se almacena en forma de fila, en Cassandra se introduce en forma de columnas. (explicacin key-values , key-map) Cassandra tiene una capacidad de manejo de informacin por encima de varios terabytes de datos si es requerido, asi como millones de archivos con un rendimiento de aproximadamente 20K de insert por segundo.

[4] http://www.nosql.es/forum/viewtopic.php?f=9&t=11 Cassandra es una base de datos NoSQL que fue liberada por Facebook como cdigo abierto en el 2008, dearrollada en Java y actualemte es mantenida por apache, Es gratuita y de uso libre y distribucin. Se fundamenta en la consistencia eventual (Dynamo) y las familias de columnas de BigTable

Las caractersticas de los datos son las siguientes: una tabla por cada instancia, las columnas se agrupan en familias de columnas y cada columna tiene elementos clave-valortiempo. Una fila puede tomar valores en unas determinadas columnas de una familia de columnas mientras que otra fila puede tomas valores en otras columnas. [4] [2] http://www.linux-magazine.es/issue/39/047-050_PythonLM39.pdf Bigtable es una creacin de Google que tiene la capacidad de almacenar gran cantidad de informacin logrando el orden de los Petabytes. Para esto cada tabla se divide en tablets. Es posible aadir columnas en cualquier momento a una tabla pero no es posible borrar filas, solo se sobre escriben. La localizacin de datos se hace usando tres llaves: fila, columna y un timestamp. El timestamp es un tipo de dato fecha-hora.Las celdas almacenan los datos sin tipo y en forma binaria[2]. [3] http://www.nosql.es/blog/nosql/amazon-dynamo.html

Dynamo es una base de datos NoSQL implementada por Amazon y de cdigo cerrado. Utiliza una gran tabla Hash distribuida (DHT) y un mecanismo de clave-valor. Garantiza el 99.9% de acceesos con un tiempo de respuesta menor a 300ms. En esta base de datos las bsquedas de informacin entre nodos no se realiza a travs de saltos hasta llegaral requimiento sin que cada nodo contiene suficiente informacin como para realizar la peticin directamente al nodo que maneja la informacin a devolver[3].

[6] http://blog.iqingenieros.com/2009/11/cassandra-db-que-tienen-facebook.html Los datos en Casandra se almacenan en column families de forma ordenada con el fin de simplificar las bsquedas que sean muy comunes, las cuales se conoce con anticipacin y se ordenan de acuerdo a las claves o keys que sean de inters. Otra caracterstica sobresaliente de cassandra es el balanceo entre consistencia y latencia segn se quiera dar mayor importancia a la rapidez o ala seguridad. Una potencialidad que se destaca en cassandra es el hecho de incrementar fcilmente nodos a los cluster proporcionando replicacin automtica de los datos, conservando la consistencia y de igual forma permite el retiro de nodos sin afectacin del servicio [6].

[5] http://www.loudertechnology.com/site/devzone/show/28/integracioacuten -de-kumbiaenterprise-con-apache-cassandra.html Cassandra es una base de datos hbrida, no relacional, que presenta mayores ventajas que las bases de datos clave-valor como redis pero menos posiblidades de consulta que MongoDB.

Empresas como Cisco, Digg, Facebook, Twitter, Reddit, Rackspace, y muchas otras grandes empresas ya han empezado a utilizarla debido a su potente manejo de altos volmenes de informacin con requerimientos permanentes de escalabilidad. Existen aplicaciones de Casandra con requerimientos de 100TB trabajando sobre 150 m quinas. Las bases de dato No SQL como cassandra no son un reemplazo de las bases de datos relacionales. Todas aquellas aplicaciones que requieran estricta integridad de datos siguen reuiriendo el uso de bases de datos relacionales. Cassandra se caracteriza por su flexibilidad en cuanto a que no es necesario definir los campos que deben llevar cada registro ni los tipos de datos a manejar. De igual forma se pueden agregar o quitar campos. Cassandra tambin es escalable horizontalmente ya que si se requiere mayor procesamiento, simplemente se agrega una nueva mquina sin necesidad de reiniciar instancias, ni copiar datos, ni modificar aplicaciones. Las lecturas y escrituras se pueden realizar indistintamente en cualquier nodo dentro del mismo cluster obteniendo el mismo resultado ya que todos los datos son replicados en todas las mquinas muy rpidamente.

[1] http://www.linux-magazine.es/issue/61/050-054_PythonLM61.pdf

La carencia de almacenamiento distribuido de grandes volmenes de informacin, ha conllevado al desarrollo de tcnicas alternativas en la gestin de las bases de datos para requerimientos relacionados con millones de usuarios que mueven terabytes de informacin. Un movimiento que ha surgido es el llamado NoSQL el cual no pretende reemplazar las bases de datos relacionales sino que provee una serie de tecnologas alternativas para bases de datos en las cuales la integridad puede manejarse de forma flexible y cuyo primordial objetivo es el manejo de gran informacin distribuida, multilenguaje y replicada a muchos nodos independientes [1]. De esta forma surgen diversas tecnologas como son Bigtable, Dynamo, Cassandra y otras ms que no sern mencionadas en este artculo.

Anda mungkin juga menyukai