Anda di halaman 1dari 13

Base de Datos Federadas

Las bases de datos federadas son vistas unificadas de bases de datos independientes. Aparentan ser una sola base de datos, pero son una coleccin de sistemas de bases de datos independientes, cooperativos, heterogneos, que son autnomos y que permiten compartir todos o algunos de sus datos. Una BDF aparenta se una BD normal y corriente, pero no tiene existencia fsica, es una vista lgica. Se usa una interfaz comn pero no existe un esquema global que describa a todos los datos de las distintas bases, en su lugar hay varios esquemas unificados, cada uno describiendo porciones de bases de datos. El componente principal es el administrador quien recibe una consulta y la descompone en varias consultas parciales sobre los componentes. Las bases de datos federadas son muy importantes en la web, pues dan una vista comn de los datos procedentes de fuentes muy distintas (Agencias de noticias, portales, foros, peridicos y revistas electrnicas, etc.)

Propiedades
Este tipo de manejadores, tiene un manejo transparente para los usuarios. Se aprecia como una sola base de datos. A esto se le conoce como nter operar y existen tres formas: Distribuidas, federadas o multibase.
El sistema est conformado por un conjunto de bases de datos

heterogneas. Esto significa que pueden o no tener diferentes sistemas operativos, diferente equipo de computo (hardware), diferentes manejadores de bases de datos, diferente modelo de datos (J, red, Relacional, orientada a objetos), diferente estructura de datos.
Las bases de datos que participan en la BDF mantienen su

autonoma. Esto quiere decir que cada elemento de la federacin decide con quien, qu y cmo compartir sus datos, adems de que cada una cuenta con su respectivo diseo de acuerdo con las necesidades del usuario.
El MBDF (Manejador de Bases de Datos Federadas) recibe una

consulta sencilla y este a su vez la descompone en varia consultas parciales. El MBDF deber tener una optimizador de recursos para aprovechar correctamente todos los componentes. Pueden ser fsicamente distribuidas en diferentes lugares e incluso en lugares muy lejanos.

Clasificacin
Los SGBDF se pueden clasificar en 2 grandes categoras: fuertemente acoplados y dbilmente acoplados. Antes de detallar ambas categoras, se muestra un esquema que especfica los diferentes tipos de bases de datos federadas.
Fuertemente acoplados

Este tipo de sistema federado posee un esquema conceptual global que est formado por un subconjunto de los esquemas conceptuales locales, compuesto de los datos que cada sistema local decide compartir. El esquema conceptual global en un sistema fuertemente acoplado implica

la integracin de partes de los esquemas conceptuales locales o de los esquemas externos locales.

Caractersticas de un SGBDF fuertemente acoplado: o El administrador global del sistema federado tiene todo el control sobre la creacin y el acceso a los sistemas de bases de datos componente. o Soporta uno o ms esquemas federados. Ventajas de la utilizacin SGBDF fuertemente acoplado: o Capacidad de soportar actualizaciones. o La interpretacin de la semntica de los mltiples datos integrados en el sistema federado es uniforme. Desventajas de la utilizacin SGBDF fuertemente acoplado: o Debido a la libertad que disfrutan los administradores globales se puede llegar a violar la autonoma que poseen los sistemas componente. o No soporta la evolucin dinmica de los esquemas de exportacin o componentes.

Dbilmente acoplados

Se basa en no tener un esquema conceptual global. En este caso, los esquemas externos estn compuestos por uno o ms esquemas conceptuales locales.

Caractersticas SGBDF dbilmente acoplados: o Los usuarios son los responsables de la creacin y el mantenimiento de las federaciones mediante la utilizacin de vistas. o Soporta sistemas de bases de datos altamente autnomos, los cuales los usuarios deben tratar. Ventajas de utilizar SGBDF dbilmente acoplados: o Dispone de gran flexibilidad para mapear diferentes semnticas de los mismos objetos en distintos esquemas de exportacin. o Se tiene mayor facilidad para soportar la evolucin de los componentes. Desventajas de utilizar SGBDF dbilmente acoplados:

Resulta de gran dificultad la comprensin de grandes cantidades de esquemas de exportacin. o Los esfuerzos para gestionar este tipo de sistema se duplican. o Existen problemas para actualizar las vistas que utilizan los usuarios.
o

Arquitectura
En esta oportunidad se demostraran 2 tipos de arquitecturas para el manejo de bases de datos federadas. Existen muchas otras, pero nos vamos a centrar en la arquitectura de Sheth A.P. and Larson, J.A. y la arquitectura propuesta por ANSI/SPARC.
Arquitectura de 3 niveles (ANSI/SPARC)

Este tipo de arquitectura es muy utilizada en el diseo de bases de datos relacionales. Est formada por los siguientes niveles:

Nivel Fsico: Est compuesto por el esquema interno. Dicho esquema contiene las diferentes bases de datos componente que forman la base de datos federada. Nivel Lgico: Corresponde al esquema conceptual. Este nivel contiene el modelo global de datos, es decir, el conjunto de datos compartido por todas las bases de datos componente. Nivel Externo: Est representado por el esquema externo. Este esquema est compuesto por las diferentes vistas que poseen los usuarios a los datos compartidos.

Arquitectura de 5 niveles por Seth y Larson

La arquitectura propuesta por Sheth y Larson se trata de una arquitectura con cinco niveles de esquemas para un SBDF: Esquema Local: Se entiende como el esquema conceptual de los componentes.

Esquema Componente: Un esquema componente es derivado de trasladar el esquema local en un modelo de datos llamado cannico o modelo de datos comn.

Esquema de Exportacin: Representa un subconjunto de la totalidad de los datos que contiene el esquema componente. Este subconjunto de datos es el que se quiere compartir en la base de datos federada.

Esquema Federado: Un esquema federado es una integracin de mltiples esquemas de exportacin de cada base de datos componente.

Esquema Externo: Representa una vista hacia un usuario o conjunto de usuarios determinado. No necesariamente este esquema contiene todos los datos que forman el esquema federado, sino que puede ser un subconjunto de estos.

Base de Datos Mviles


Es una Base de datos donde los usuarios pueden acceder a la informacin lejos de donde se encuentra almacenada la base de datos, se hace utilizando una conexin inalmbrica. Se encargan recuperar la informacin de los sistemas de computacin y/o repositorios de informacin sobre dispositivos mviles en cualquier momento en cualquier lugar. Adems de introducir o actualizar informacin en los sistemas principales de forma remota desde el dispositivo mvil. Esto da toda la libertad al usuario de manipular toda la informacin desde lejos.Es un Sistema distribuido que soporta conectividad mvil, posee todas las capacidades de un sistema de base de datos y permiten a las unidades mviles, una completa movilidad espacial por medio de la tecnologa inalmbrica

Desafos para las bases de datos mviles


Velocidad en los enlaces inalmbricos Escalabilidad Movilidad Limitacin de la batera Desconexin Replicacin/Caching

Estructura y Caractersticas

Todas las bases de datos mviles tienen una arquitectura similar, donde debemos distinguir una serie de elementos principales que caractersticos de este tipo de sistemas: Servidor de base de datos corporativo y SMBD que gestiona y almacena los datos corporativos y proporciona aplicaciones corporativas. Se correspondera con el SMBD y el servidor que se utiliza en la organizacin. Base de datos remota y SMBD que gestiona y almacena los datos mviles. Son las bases de datos que deben estar implementadas en los dispositivos mviles. Plataforma de base de datos mvil, que puede ser un ordenador porttil, PDA u otro dispositivo de acceso a Internet, es decir, los dispositivos mviles en cuestin. Enlaces de comunicacin bidireccionales entre el SMBD corporativo y el SMBD mvil. Que pueden ser redes inalmbricas de distinta naturaleza, comunicaciones va satlite, etc.

Arquitectura
En una base de datos mvil, la comunicacin entre los dispositivos es una parte importante, ya que es imprescindible una buena comunicacin para el acceso a los datos. La arquitectura de comunicaciones ms utilizada consiste en tener una o varias estaciones base en contacto con la base de datos corporativa y una serie de estaciones mviles que acceden a los datos a travs de las estaciones base. Por tanto podemos encontrarnos con alguna cuestin importante relacionada con el acceso o la localizacin, como puede ser localizar una estacin mvil que contenga los datos que necesitamos en un momento determinado. Para solucionar dicho problema existen varias soluciones propuestas, por ejemplo, que cada estacin mvil est asociada a una estacin base principal la cul conoce en todo momento la localizacin de la estacin mvil debido a que la principal reciba notificaciones de los movimientos de la estacin mvil.

Ventajas e Inconvenientes
Las principales ventajas que hemos detectado en las bases de datos mviles son las siguientes: Permiten la movilidad de los usuarios, por lo que no es necesario estar fsicamente en la organizacin para acceder a sus datos. stos pueden ser accedidos remotamente. El mercado potencial de este tipo de bases de datos es bastante amplio, ya que multitud de empresas de todo tipo poseen trabajadores que necesitan acceder a los datos de la compaa mientras se encuentran en localizaciones remotas. Estas bases de datos poseen un gran mbito de aplicacin ya que en principio cualquier base de datos relacional puede ampliarse para ofrecer los servicios de las bases de datos mviles.

Los principales inconvenientes que hemos observado en las bases de datos mviles son los siguientes: Los enlaces de comunicaciones juegan un papel importante es el desarrollo de estos sistemas, por lo que su dependencia puede suponer un freno para ellos.

Los datos pueden estar replicados, por lo que consistencia y coherencia de los mismos son fundamentales y puede generar conflictos importantes. El tratamiento de fallos es un aspecto delicado ya que al tratarse de un entorno distribuido, los fallos de transmisin de datos deben de solucionarse y detectarse de forma eficiente para que no produzcan errores en la informacin tratada. La capacidad de procesado de los dispositivos mviles son tambin un inconveniente importante y tambin hay que tener en cuenta que dicha capacidad no es la misma para todos los dispositivos.

Base de Datos Distribuidas


Una base de datos distribuida (BDD) es un conjunto de mltiples bases de datos lgicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lgicos (pej. un servidor corriendo 2 mquinas virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamiento autnomo, esto permite realizar operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si estos fueran accedidos de forma local. Un sistema distribuido de bases de datos se almacena en varias computadoras. Los principales factores que distinguen un SBDD de un sistema centralizado son los siguientes: Hay mltiples computadores, llamados sitios o nodos. Estos sitios deben de estar comunicados por medio de algn tipo de red de comunicaciones para transmitir datos y rdenes entre los sitios.

Inicio y evolucin de las bases de datos distribuidas


Originalmente se almacenaba la informacin de manera centralizada, pero con el paso del tiempo las necesidades aumentaron y esto produjo ciertos inconvenientes que no era posible solucionarlos o volverlos eficientes de la forma centralizada. Estos problemas impulsaron la creacin de almacenamiento distribuido, los cuales hoy en da proveen caractersticas indispensables en el manejo de informacin; es decir, la combinacin de las redes de comunicacin y las bases de datos. Hay varios factores que han hecho que las bases de datos evolucionen a bases de datos distribuidas. En el mundo de los negocios se ha dado una globalizacin y a la vez las operaciones de las empresas son cada vez ms descentralizadas geogrficamente. Tambin el poder de las computadoras personales aument y el costo de los Mainframes ya no tena sentido. Adems la necesidad de compartir datos ha hecho que crezca el mercado de las bases de datos distribuidas.

Componentes
Hardware involucrado

El hardware utilizado no difiere mucho del hardware utilizado en un servidor normal. Al principio se crea que si los componentes de una base de datos eran especializados seran ms eficientes y rpidos, pero se comprob que el decentralizar todo y adoptar un enfoque "nada compartido" (shared-nothing) resultaba ms barato y eficaz. Por lo que el hardware que compone una base de datos distribuida se reduce a servidores y la red.
Software

Sistema manejador de base de datos distribuida (DDBMS) Este sistema est formado por las transacciones y los administradores de la base de datos distribuidos. Un DDBMS implica un conjunto de programas que operan en diversas computadoras, estos programas

pueden ser subsistemas de un nico DDBMS de un fabricante o podra consistir de una coleccin de programas de diferentes fuentes. Administrador de transacciones distribuidas (DTM) Este es un programa que recibe las solicitudes de procesamiento de los programas de consulta o transacciones y las traduce en acciones para los administradores de la base de datos. Los DTM se encargan de coordinar y controlar estas acciones. Este DTM puede ser propietario o desarrollado en casa. Sistema manejador de base de datos (DBMS) Es un programa que procesa cierta porcin de la base de datos distribuida. Se encarga de recuperar y actualizar datos del usuario y generales de acuerdo con los comandos recibidos de los DTM. Nodo Un nodo es una computadora que ejecuta un DTM o un DBM o ambos. Un nodo de transaccin ejecuta un DTM y un nodo de base de datos ejecuta un DBM.

Tipos de arquitecturas/implementaciones
En un sistema de bases de datos distribuidas, existen varios factores que deben tomar en consideracin que definen la arquitectura del sistema: Distribucin: Los componentes del sistema estn localizados en la misma computadora o no. Heterogeneidad: Un sistema es heterogneo cuando existen en l componentes que se ejecutan en diversos sistemas operativos, de diferentes fuentes, etc. Autonoma: Se puede presentar en diferentes niveles, los cuales se describen a continuacin: Autonoma de diseo: Habilidad de un componente del sistema para decidir cuestiones relacionadas a su propio diseo. Autonoma de comunicacin: Habilidad de un componente del sistema para decidir cmo y cundo comunicarse con otros SGBD (Sistema Gestor de Bases de Datos).

Autonoma de ejecucin: Habilidad de un componente del sistema para ejecutar operaciones locales como quiera.

Ventajas y Desventajas de los sistemas distribuidos


Ventajas

El acceso a los datos es ms rpido debido a que los datos se localizan ms cercanos al lugar donde se utilizan. El procesamiento es rpido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo, Nuevos nodos se pueden agregar fcil y rpidamente. La probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe una autonoma e independencia entre los nodos. Control local de los datos con que se interacta. Mayor tolerancia a los fallos

Desventajas Es ms complicado el control y la manipulacin de los datos Es compleja el aseguramiento de la integridad de la informacin

en presencia de fallas no predecibles tanto de componentes de hardware como de software. La integridad se refiere a la consistencia, validez y exactitud de la informacin. El control de concurrencia y los mecanismos de recuperacin son mucho ms complejos que en un sistema centralizado dado que los datos pueden estar replicados.

Las 12 reglas de un SGBDD


El principio fundamental de las Bases de Datos Distribuidas o regla cero plantea que: "Desde el punto de vista del usuario, un sistema distribuido deber ser idntico a un sistema no distribuido" La regla cero conduce a las restantes 12 reglas. Todas las reglas no son independientes entre s, ni tienen igual importancia pero son tiles para entender la tecnologa distribuida. 1. Autonoma Local: Los sitios de un sistema distribuido deben ser autnomos. La autonoma Local Implica: Propietario local.

Administracin local. Responsabilidad local. Integracin local. Representacin local.

2. No dependencia de un sitio central: No debe existir un nico sitio, ya que implicara: Cuello de botella. Vulnerabilidad. 3. Operacin contina: Adicin de elementos Actualizacin de versiones 4. Independencia de Localizacin: El usuario desconoce dnde estn fsicamente los datos. 5. Independencia de fragmentacin: Deseable porque simplifica los programas de los usuarios y sus actividades en la terminal. 6. Independencia de rplica: La creacin y destruccin de rplicas debe hacerse transparente al usuario. La rplica proporciona: Ventajas: o Mayor Prestacin: los datos son locales. o Mayor disponibilidad: los datos son accesibles siempre. Desventajas o Hay que propagar las actualizaciones.

7. Procesamiento distribuido de consultas: Los Sistemas relacionales brindan herramientas de consulta muy eficientes. Varias maneras de trasladar los datos 8. Manejo distribuido de transacciones Transaccin distribuida: varios agentes de la transaccin en varios lugares. Control de recuperacin: una transaccin atmica. Todos los agentes avanzan o retroceden juntos. Control de concurrencia: Bloqueos mediante paso de mensajes.

9. Independencia con respecto al equipo: El SGBD se ejecutar igual sea cual sea el equipo 10. Independencia con respecto al Sistema Operativo: El SGBD debe ser multi-operativo sin afectar al usuario. 11. Independencia con respecto a la Red: El SGBD debe soportar mltiples redes sin afectar al usuario. 12. Independencia con respecto al SGBD: Se pueden manejar distintas copias de SGBD si manejan la misma norma estndar de SQL: Oracle, Informix, Multibase, etc

Anda mungkin juga menyukai