Contenido
Introduccin .............................................................................................................................................. 3
Administracin de replicas ................................................................................................................... 4
Replicacin mediante primario y respaldos ................................................................................. 6
Comunicacin en grupos ................................................................................................................... 7
Compromiso distribuido .................................................................................................................... 9
Transacciones....................................................................................................................................... 9
Sincronizacin y coordinacin distribuida ..................................................................................... 11
Mecanismos de sincronizacin entre procesos ........................................................................ 11
Mecanismos de sincronizacin distribuida ............................................................................ 12
Conclusin ............................................................................................................................................... 13
2
Pgina
Introduccin
Cuando un nodo falla o cuando el subsistema de comunicaciones que permite que los
nodos se comuniquen falla, los nodos se han de adaptar a las nuevas condiciones, para
que puedan seguir cooperando.
En los sistemas tolerantes a fallo, los fallos que se pueden tolerar son aqullos que est
previsto que pueden ocurrir. El primer paso necesario para que un sistema pueda
recuperarse de un fallo, es detectarlo. El siguiente paso es llevar al sistema a un estado
consistente, para ello, es necesario que las acciones realizadas antes del fallo
mantengan la consistencia. La clave para tolerar fallos es la replicacin, es decir, que
varios elementos del sistema puedan dar el mismo servicio.
3
Pgina
Administracin de replicas
La propiedad fundamental que caracteriza una mquina de estados es que los resultados
de salida que produce estn completamente determinados por la secuencia de peticiones
que recibe, con independencia del momento en que las recibe y de cualquier otra
actividad del sistema. Una gran ventaja de este enfoque consiste en que casi cualquier
sistema puede descomponerse en clientes y mquinas de estados, por lo que puede ser
utilizado en gran parte de los casos.
Para conseguir una versin tolerante a t fallos de una mquina de estados podemos
replicarla, colocando cada rplica en un nodo diferente de la red. Si todas las rplicas
comienzan en el mismo estado, y reciben la misma secuencia de peticiones, todas harn
lo mismo, y producirn los mismos resultados. El nmero de rplicas que son necesarias
para tolerar t fallos depende del modelo de fallo que se considere. Si son fallos bizantinos,
4
hacen falta como mnimo 2t + 1, y para obtener resultados correctos basta con tomar los
Pgina
que producen la mayora de las rplicas. Si se considera que slo puede haber fallo-
parada, basta con t + 1 rplicas.
ok(res) ] al cliente .
2. El cliente espera hasta que recibe la primera respuesta, o hasta que recibe todas
las respuestas. Si las rplicas no se comportan de manera maliciosa (es decir, no
5
Pgina
En los sistemas que usan este enfoque para lograr tolerancia a fallos, los emisores
envan mensajes slo al proceso marcado como primario. Si ste falla, uno de los
respaldos toma su lugar. Los clientes deben darse cuenta de estas cadas y actualizar el
primario para poder enviar sus mensajes al proceso adecuado.
Ms formalmente, para que un protocolo pueda ser considerado del tipo primario-
respaldos, deben cumplir las siguientes condiciones:
Comunicacin en grupos
Las herramientas software para comunicacin con grupos utilizan una arquitectura
conocida con el nombre de 3T (three-tier). En este modelo los clientes (client-tier)
interactan con una capa intermedia (middle-tier) que se encarga de enviar las peticiones
a los servidores replicados (end-tier), manteniendo en todo momento la consistencia.
7
Pgina
Para lograrlo, la capa intermedia anida dos componentes bsicos, el secuenciador y el
manejador de replicacin activa, que se encargan de garantizar que todas las rplicas
reciben y ejecutan las peticiones de los clientes en el mismo orden en que fueron
enviadas.
Otro factor importante a la hora de elegir una herramienta de comunicacin con grupos
Pgina
es su capacidad para adaptarse a las necesidades del usuario, pudiendo tener sistemas
monolticos y sistemas modulares. En un sistema monoltico no se permite al usuario
adaptar el sistema, sin embargo, en un sistema modular el usuario es libre para adaptar
el sistema a sus necesidades configurando la pila de protocolos de la forma que
considere ms oportuna.
Compromiso distribuido
O todas tienen xito: commit - Si alguna falla: rollback de todas las operaciones.
Cada operacin debe estar preparada a que se le ordene deshacer los cambios: No es
posible en general si algn elemento no colabora (por ejemplo: una impresora)
Protocolos de compromiso: Un proceso coordina la transaccin y los dems participan
con sus votos: Compromiso en dos fases: el coordinador enva PREPARAR y los dems
responden OK o NOK. Si alguno respondi NOK, el coordinador enva ABORT. Si todos
respondieron OK, el coordinador enva COMMIT.
Transacciones
10
Pgina
Sincronizacin y coordinacin distribuida
Estos son los mecanismos que se basan en la existencia de una unidad de sincronizacin
centralizada, la cual debe tener un nombre Tcnico conocido para todos los procesos
que requieren ser sincronizados.
Reloj fsico. La idea es proveer de un nico bloque de tiempo para el sistema. Los
procesos pueden usar la marca fsica del tiempo (timestamp) provista o leda de un reloj
central para expresar algn orden en el conjunto de acciones que inician. La principal
ventaja de este mecanismo es la simplicidad, aunque existen varios inconvenientes: el
correcto registro del tiempo depende en la posibilidad de recibir correctamente y en todo
momento, el tiempo actual desplegado por el reloj fsico; los errores de transmisin se
convierten en un impedimento para el orden deseado, el grado de exactitud depende de
las constantes puestas en el sistema. Proceso central. Este mecanismo se basa en un
proceso que recibe todas las peticiones de los procesos que sern sincronizados. La
sincronizacin se logra por la exclusin mutua ejecutada por este proceso central. La
ventaja principal de este mecanismo es que se asegura totalmente de la exclusin mutua.
Como desventajas tiene: Requiere tres mensajes por seccin critica.
Si el proceso tiene que tomar su lugar y ejecutar los siguientes pasos: 1) deteccin de
una falla, i el coordinador falla, un nuevo 2) eleccin de un nico y nuevo coordinador y
3) reconstruccin de la cola de peticiones.
12
Pgina
Conclusin
13
Pgina