Prof. Alisson Sena Redundância e Contingência de Sistemas O que é Redundância de Sistemas? Falhas de Sistemas
São eventos danosos, provocados por
deficiências no sistema ou em um dos elementos internos dos quais o sistema depende. Falhas de Sistemas
• Erros no projeto do software
• Degradação do hardware • Erros humanos • Dados corrompidos Qual a diferença de Indisponibilidade e Instabilidade de Sistemas? Indisponibilidade Corresponde ao período de inatividade ou "downtime" do sistema (programado ou não).
As características do projeto devem ser
suficientes para garantir que a informação seja replicada automaticamente do ambiente de produção para o ambiente de contingência. Instabilidade É imprescindível conhecer quais são os parâmetros considerados como normais dentro do ambiente.
• Definição de métricas de qualidade
• Implantação de mecanismos de coleta • Controle de variáveis do sistema • Configuração de ações de correção imediata • Análises de tendências Redundância de Sistemas É capacidade de um sistema superar a falha de um de seus componentes através do uso de recursos redundantes.
Um sistema redundante possui um segundo
dispositivo que está imediatamente disponível para uso quando acontece a falha do dispositivo primário do sistema. Redundância de Sistemas
• Sistemas de ventilação • Ar condicionado • Sistemas operacionais • Unidades de disco rígido • Servidores de rede • Links de comunicação Exemplo de Redundância O que é Contingência de Sistemas? Contingência de Sistemas
• É a possibilidade de um fato acontecer
ou não.
• É uma situação de risco existente, mas
que envolve um grau de incerteza quanto à sua efetiva ocorrência. Contingência de Sistemas • Possibilidade de um acontecimento futuro resultante de uma condição existente
• Incerteza sobre as condições operacionais
envolvidas
• Resolução destas condições dependerem de
eventos futuros Contingência de Sistemas • Suporte técnico • Sistemas de segurança • Esquemas de backup • Planos de contingência • Redundância de equipamentos • Gerenciamento pró-ativo. Plano de Contingência
Conjunto de procedimentos e medidas de
segurança preventivas, previamente planejadas, a serem adotados após a ocorrência de uma falha com o objetivo de minimizar os impactos da mesma. Plano de Administração de Crise Tem o propósito de definir passo-a-passo o funcionamento das equipes envolvidas com o acionamento da contingência antes, durante e depois da ocorrência do incidente. Plano de Continuidade Operacional Tem o propósito de definir os procedimentos para contingenciamento dos ativos que suportam cada processo de negócio, objetivando reduzir o tempo de indisponibilidade e, consequentemente, os impactos potenciais ao negócio. Plano de Recuperação de Desastres Tem o propósito de definir um plano de recuperação e restauração das funcionalidades dos ativos afetados que suportam os processo de negócio, a fim de restabelecer o ambiente e as condições originais de operação. Plano de Recuperação de Desastres
Descreve as medidas que uma empresa deve
tomar, incluindo a ativação de processos manuais ou o recurso a contratos, para assegurar a continuidade dos processos do negócio no caso de falha no sistema de informações. Objetivos do Plano de Contingência
Dar providência imediata invocando os
procedimentos de recuperação dos sistemas corporativos, considerando o tempo de espera previsto para restabelecimento da atividade definido pelos gestores do sistema. Características do Plano de Contingência • Ser desenvolvido por uma equipe de trabalho que envolva todas as áreas de conhecimento e de negócio da empresa a qual o plano de contingência diz respeito; • Ser avaliado periodicamente; • Estar disponível em local reservado e seguro, mas de fácil acesso ao pessoal autorizado. Etapas da Implantação do Plano de Contingência • Avaliação do projeto: escopo e aplicabilidade; • Análise de risco; • Análise de impacto em negócios; • Desenvolvimento dos planos de recuperação de desastres; • Treinamento e teste dos planos; • Implementação e manutenção. Estratégia Host-site
• Pronta para entrar em operação assim que
uma situação de risco ocorrer. O tempo de operacionalização desta estratégia está diretamente ligado ao tempo de tolerância à falhas; Estratégias Warm-site
• Se aplica a objetos com maior tolerância à
paralisação, podendo se sujeitar à indisponibilidade por mais tempo, até o retorno operacional da atividade. Estratégias Cold-site
• Alternativa de contingência a partir de um
ambiente com os recursos mínimos de infra- estrutura e telecomunicações, desprovido de recursos de processamento de dados. Portanto, aplicável à situação com tolerância de indisponibilidade ainda maior; Estratégias Realocação de Operação
• O objetivo é desviar a atividade atingida
pelo evento que provocou a quebra de segurança, para outro ambiente físico, equipamento ou link, pertencentes à mesma empresa. Estratégias Bureau de Serviços
• Considera a possibilidade de transferir a
operacionalização da atividade atingida para um ambiente terceirizado, portanto, fora dos domínios da empresa. Estratégias Acordo de Reciprocidade
• Propõe a aproximação e um acordo formal
com empresas que mantêm características físicas, tecnológicas ou humanas semelhantes a sua, e que estejam igualmente dispostas a possuir uma alternativa de continuidade operacional. Estratégias Auto-suficiência
• Utilizada quando nenhuma outra estratégia
é aplicável, quando os impactos possíveis não são significativos ou quando estas são inviáveis, seja financeiramente, tecnicamente ou estrategicamente. FIM