Anda di halaman 1dari 9

Historia

El progreso de las comunicaciones y la gran necesidad de cooperar con otras entidades


independientes, obligan a replantear los conceptos fundamentales de las bases de datos,
forjando la tendencia de crear software que brinde el acceso a varias bases de datos
autnomas preexistentes almacenadas en un sistema gestor de base de datos heterogneos.
Sin embargo, el acceso a varias bases de datos como si de una sola se tratara viene
acompaado de problemas como la integracin, seguridad, control, entre otras. Para poner
solucin a estos problemas y ofrecer un adecuado acceso a varias bases de datos se han
desarrollado nuevos esquemas como los Sistemas Gestores de Bases de Datos Federadas.
Un sistema de bases de datos federadas es una coleccin de sistemas de bases de datos
cooperativos y autnomos. En un sistema federado los usuarios tienen acceso a los datos, de
los distintos sistemas, a travs de una interfaz comn sin embargo, no existe un esquema
global que describa a todos los datos de las distintas bases de datos, en su lugar hay varios
esquemas unificados, cada uno describiendo porciones de bases de datos y archivos para el
uso de cierta clase de usuarios.
Los primeros gestores de bases de datos nacen en los sesentas, despus Edgar Frank Codd
en las dcadas de los setenta trabaj en sus teoras sobre modelado de datos, y escribi un
artculo con el nombre: "A Relational Model of Data for Large Shared Data Banks", con este
artculo y otras publicaciones, defini el modelo de bases de datos relacionales y las reglas
para poder evaluar un administrador de bases de datos relacionales.
No obstante, el concepto de bases de datos federadas viene de Hammer y McLeod en 1979 y
luego retomado en 1985 por Heimbigner y McLeod, posteriormente en 1990 y 1991 por Sheth y
Larson, y luego por Saltor.

Objetivo

En la actualidad, la importancia y el impacto de las bases de datos es incuestionable ya que las


organizaciones gubernamentales, instituciones acadmicas, y entidades comerciales crean y
mantienen importantes bases de datos que contienen toda clase de informacin desde
documentos de texto en lenguaje natural, tablas estadsticas, datos financieros y objetos
multimedia hasta datos de naturaleza tcnica y cientfica.
Las tecnologas de bases de datos se estn desarrollando rpidamente para mantenerse al da
con esta demanda de mecanismos de administracin de la informacin. Estas deben manejar
cantidades masivas de datos, extraer informacin til desde los repositorios, y tener la habilidad
para reflejar las relaciones entre los datos mantenidos en diferentes bases de datos. Sin dejar
de lado la integridad, recuperacin, concurrencia, y seguridad.
La creciente necesidad de cooperacin entre entidades independientes requiere el acceso
integrado a mltiples bases de datos autnomas y heterogneas, es decir, acceder a los datos
como si de una sola base de datos se tratase. El acceso integrado implica interconectar los
sistemas de bases de datos mediante una red de comunicaciones, y superponer una capa de
software sobre los sistemas existentes que soporte la comunicacin y la comparticin de sus
datos, respetando su autonoma al nivel de aplicaciones locales preexistentes, pero cediendo
parte del control al nivel federado. Esta coleccin de bases de datos que cooperan, conocidas
como Bases de Datos Componentes (BDCs), forman una federacin de bases de datos y el
software encargado de gestionarlas recibe el nombre de Sistema de Gestin de Bases de
Datos Federadas (SGBDF).
La importancia principal de las bases de datos federadas fuertemente acopladas radica
principalmente en su bi-procesamiento. Es decir, en su capacidad de atender consultas
globales y permitir que la base de datos siga atendiendo a sus aplicaciones locales.
En un sistema federado los usuarios tienen acceso a los datos, de los distintos sistemas, a
travs de una interfaz comn sin embargo, no existe un esquema global que describa a todos
los datos de las distintas bases de datos, en su lugar hay varios esquemas unificados, cada
uno describiendo porciones de bases de datos y archivos para el uso de cierta clase de
usuarios
La existencia de un esquema global permite que el lenguaje implementado para llevar a cabo
las consultas sea fcil de aprender y entender debido a que este da a la multibase de datos la
apariencia a que accesa a una base de datos sencilla y por lo tanto las operaciones de
distribucin son transparentes para el usuario.

Caractersticas

Un sistema federado debe cumplir con ciertas caractersticas, algunas son:


Distribucin: Los datos pueden estar ubicados entre mltiples bases de datos.
Heterogeneidad: Se debe permitir diferencias en el hardware, software y en los
sistemas de comunicacin.
Heterogeneidad de semntica: Ocurre cuando hay discrepancias acerca del
significado, interpretacin o pretensin de utilizacin de los mismos datos o datos
relacionados.
Autonoma: Se define como la capacidad de manejar su propio sistema de base
de datos, es decir, que tengan control separado e independiente.
Inter operatividad: Es una condicin mediante la cual sistemas heterogneos
pueden interactuar entre s. La inter operatividad entre componentes de sistemas de
bases de datos es alcanzar por medio de la capacidad de componentes individuales el
compartir e intercambiar unidades de informacin de manera activa y cooperativamente
con otrosc componentes de la federacin.
El manejador de bases de datos federadas MBDF recibe una consulta sencilla y
este a su vez la descompone en varia consultas parciales.Tambin deber tener un
optimizador de recursos para aprovechar correctamente todos los componentes.

Modelo de datos

Los SGBDF se pueden clasificar en 2 grandes categoras: fuertemente acoplados y dbilmente


acoplados.

La imagen anterior muestra un esquema que especfica los diferentes tipos de bases de datos
federadas. Aparece el concepto de autonoma como elemento diferenciador entre sistemas
federados y sistemas que no lo son.

Fuertemente acoplados
Este tipo posee un esquema conceptual global que est formado por un subconjunto de los
esquemas conceptuales locales, compuesto de los datos que cada sistema local decide
compartir. El esquema conceptual global en un sistema fuertemente acoplado implica la
integracin de partes de los esquemas conceptuales locales o de los esquemas externos
locales.
Caractersticas:
El administrador global del sistema federado tiene todo el control sobre la creacin y el
acceso a los sistemas de bases de datos componente.
Soporta uno o ms esquemas federados.
Ventajas:
Capacidad de soportar actualizaciones.
La interpretacin de la semntica de los mltiples datos integrados en el sistema
federado es uniforme.
Desventajas:
Debido a la libertad que disfrutan los administradores globales se puede llegar a violar
la autonoma que poseen los sistemas componente.
No soporta la evolucin dinmica de los esquemas de exportacin o componentes.

Dbilmente acoplados.

Se basa en no tener un esquema conceptual global. En este caso, los esquemas externos
estn compuestos por uno o ms esquemas conceptuales locales.
Caractersticas:
Los usuarios son los responsables de la creacin y el mantenimiento de las federaciones
mediante la utilizacin de vistas.
Soporta sistemas de bases de datos altamente autnomos, los cuales los usuarios deben
tratar.
Ventajas:
Dispone de gran flexibilidad para mapear diferentes semnticas de los mismos objetos en
distintos esquemas de exportacin.
Se tiene mayor facilidad para soportar la evolucin de los componentes.
Desventajas:
Resulta de gran dificultad la comprensin de grandes cantidades de esquemas de exportacin.
Los esfuerzos para gestionar este tipo de sistema se duplican.
Existen problemas para actualizar las vistas que utilizan los usuarios.

Arquitectura(s) : Para las bases de datos federadas se destacan 2 arquitecturas


Propuesta por Sheth, la cul contiene 5 niveles, y los esquemas
definidos son:
Esquema local: Es un esquema conceptual de un
componente de base de datos.
Esquema de componente: Es derivado traduciendo
el esquema local en un modelo de datos comn (CDM) o cannico.
Esquema de exportacin: Representa un
subconjunto de un esquema de componente disponible en los sistemas
de bases de datos federadas.
Esquema federado: Es una integracin de mltiples
esquemas de exportacin.
Esquema externo: Define un esquema para un
usuario o aplicacin o clase de usuarios/aplicaciones.
Luego se destaca otra arquitectura basada en 3 niveles:
Esquema privado: Describe la porcin de los
componentes de datos que es local al componente.
Esquema de exportacin: La porcin de esquemas
de exportacin de un componente que especifica la informacin que el
componente est dispuesto a compartir con otros componentes de la
federacin.
Esquema de importacin: El esquema de
importacin de un componente especifica la informacin que el
componente desea utilizar de otro componente.
Adems se menciona que hay dos requerimientos conflictivos que hay que resolver, debido a la
ausencia de una autoridad central: uno es que los componentes deben mantener su autonoma
como sea posible, y otro es que los componentes deben estar habilitados para alcanzar cierto
grado de intercambio de informacin.
Funcionamiento
Hay dos tipos de tareas que describen el funcionamiento de los sistemas de bases de bases de
datos federadas, las tareas de desarrollo y las de operacin.
Tareas de Desarrollo:
Traduccin de esquemas: Se ejecuta cuando un esquema representado en un
modelo de datos es mapeado a un esquema equivalente representado en diferente
modelo de datos.
Control de acceso: Un sistema federado debe estar diseado para controlar el
acceso a los componentes de la base de datos por usuarios federados.
Negociacin: Es el dilogo entre dos administradores para alcanzar un acuerdo
respecto a los esquemas de exportacin y a las operaciones permitidas, se debe hacer
por medio de un protocolo para el intercambio de mensajes.

Integracin de esquemas: Se refiere a la integracin de mltiples vistas de


usuarios en un solo esquema, es decir, integrar esquemas en un solo esquema
federado integrando esquemas de exportacin por medio de bottom-up.
Tareas de Operacin :
Formulacin de consultas: El lenguaje de consultas puede ser el mismo que se
utiliza para bases de datos centralizados, debido a que las bases de datos federadas
son transparentes en ese aspecto.
Transformacin de comandos: Debe existir un procesador de transformaciones
de comandos, que traduce esos comandos en un lenguaje, llamado lenguaje origen, a
otro lenguaje, llamado lenguaje destino.
Procesamiento de consultas y optimizacin: El procesamiento implica convertir
una consulta de un esquema federado a un esquema de exportacin y luego
ejecutarlas. Respecto a los procesos de optimizacin y de procesamiento son similares
a los de las bases de datos distribuidas.
Administracin de transacciones globales: Es el responsable de mantener la
consistencia entre las bases de datos, mientras se permita cierta concurrencia a travs
de mltiples bases de datos, aunque esta tarea es muy complicada en ambientes
heterogneos.

Implementaciones reales
Remote-Exchange
Varios enfoques de frameworks se han propuesto, entre algunos de ellos sobresale el
Remote-Exchange, es un proyecto de investigacin que propone un enfoque y
mecanismo para apoyar el intercambio del comportamiento entre los sistemas de bases
de datos en una federacin.
En el modelo se utilizan tres diferentes tipos de funciones: de almacenamiento,
derivadas y computadas.
En la implementacin se utilizaron componentes de bases de datos federadas de
Omega e Iris. La importancia del enfoque radica en la separacin de la ubicacin de
datos y de la ubicacin de la ejecucin de los mtodos.
PEER
Es un sistema federado de administracin de informacin orientado a objetos, desarrollado
para apoyar el intercambio de informacin a travs de nodos cooperativos autnomos y
heterogneos.
Su arquitectura est basada por esquemas, cada nodo se representa por:
- Esquema local (LOC)
- Esquema de importacin (IMP)
- Esquema de exportacin (EXP)
- Esquema integrado (INT)
Su caracterstica principal es la transparencia fsica y lgica de la distribucin de informacin de
los nodos a travs del procesamiento de consultas federadas.

Myraid
Es un prototipo de sistema de bases de datos federadas desarrollado por la Universidad de
Minnesota para satisfacer los orgenes de datos heterogneos, las incompatibilidades a nivel
de sistema y la falta de integracin. Posee una arquitectura flexible que permite la
administracin de transacciones y procesamiento de consultas.
SQL Server
En SQL Server se puede implementar un servidor a travs de particiones horizontales, se utiliza
esta tcnica para grandes bases de datos que consideran la federacin como la manera de
balancear el procesamiento a travs de diferentes servidores, aunque su implementacin
requiere de nodos con SQL Server u servidores de bases de datos que implementen la
particin horizontal.
En la biblioteca en lnea de SQL Server 2008 se plantea una capa de servidor federado que
proporciona ciertas diferencias internas a comparacin con los servidores centralizados:
- Hay una instancia ejecutndose de SQL Server en cada servidor miembro.
- Cada servidor miembro tiene una base de datos miembro, y los datos estn propagados a
travs de las diferentes bases de datos.
- Las tablas de la base de datos original est particionada de manera horizontal en tablas
miembro. Hay una tabla miembro por cada base de datos miembro, y las vistas particionadas y
distribuidas son utilizadas para hacer que parezca como si hubiera una copia total de la tabla
original en cada servidor miembro.
- La capa de aplicacin debe estar habilitada para hallar sentencias SQL en el servidor
miembro, que contengan la mayora de datos referenciados por la sentencia.

IBM Federated Database


Las capacidades de federacin de IBM estn disponibles a travs de una variedad de
productos, entre los cuales se destaca DB2 UDB, DB2 DataJoiner, entre otros. Dichas
herramientas proveen facilidades para combinar la informacin de mltiples fuentes de datos,
implementando as las bases de datos federadas.
Entre algunas caractersticas importantes destacan la transparencia, la heterogeneidad, el alto
grado de funcin, la extensibilidad, la autonoma y el rendimiento optimizado.
7.6.MySQL: Federated Store Engine
El motor de almacenamiento federado est disponible desde la versin 5.0.3, y sirve para
acceder datos en tablas tanto de bases de datos remotos como locales.
Segn la documentacin de MySQL se puede crear tablas federadas y tendrn la extensin
.frm para tablas remotas y para tablas locales tendrn la extensin .myd. Para la lectura de

datos se utiliza un API de cliente de MySQL, y utiliza un formato de esquema para la conexin
entre tablas.
Entre algunas limitaciones de esta implementacin estn:
- Los servidores remotos deben ser MySQL.
- No soporta transacciones.
- No soporta ndices.
- No soporta ALTER TABLE
- Los BULK INSERT son lentos.
- No soporta cache de consultas.
Para citacin y elaboracin de las referencias utilice el formato de la
American Psychological Association (APA), versin 6.
Referencias:

D. Heimbigner and D. McLeod, "A Federated Architecture for Information


Management," in ACM Transactions on Office Information System, vol. 3, no. 3, United
States of America, 1985, pp. 253-278.
A. P. Sheth and J. A. Larson, "Federated Database Systems for Managing
Distributed, Heterogeneous, and Autonomous Databases," in ACM Computing Surverys,
vol. 22, no. 3, United States of America, 1990, pp. 183-236.
D. Fang, J. Hammer, and D. McLeod, "An Approach to Behavior Sharing in
Federated Database Systems," University of Southern California, 1992.
H. Afsarmanesh, M. Wiedijk, and L. Hertzberger, "Flexible and Dynamic
Integration of Multiple Information Bases," in Proceedings DEXA94 - 5th IEEE
International Conference on Databases and Expert Systems Applications, SpringerVerlag, 1994, pp. 277-288.
L. Haas and E. Lin, "IBM Federated Database Technology," IBM Corporation,
2002.

Anda mungkin juga menyukai