Anda di halaman 1dari 7

ARTIGO

RAID Eduardo Augusto ZSCHORNACK1 Miquias Daniel MICHELON1 Alex Rosch de FARIA2 mdmichelon@fasul.edu.br eazschornack@hotmail.com RESUMO Esse artigo foi realizado com o principal objetivo de estudar a tecnologia RAID (Redundant Arrays of Independent Disks ou Conjunto Redundante de Discos Independentes), seus modos de utilizao em bancos de dados, suas principais aplicaes, mostrando seus nveis de funcionamento em relao s vantagens e desvantagens na sua utilizao. O foco principal do artigo estaria na pesquisa de como funciona tal tecnologia e para que usos esta voltada, alm da sua viabilidade. Para a sua construo foram realizadas pesquisas bibliogrficas em torno de sites, livros e artigos cientficos. A pesquisa revelou resultados satisfatrios em relao ao problema proposto, demonstrando que os diferentes nveis da tecnologia RAID so eficazes para tipos especficos de aplicao e diferentes nveis de segurana que se deseja possuir, viabilizando pelo menor custo com equipamento. Destacaram-se seis nveis principais de RAID, cada um com funes e estruturas diferentes de funcionamento. Assim, foi concludo que o uso de RAID torna o armazenamento de dados seguro e eficiente atravs da redundncia, alm de vivel, desde que escolhida sua forma ideal para cada situao de uso. Palavras-chave: Banco, dados, redundante.
Eduardo Augusto Zschornack FASUL1 Miquias Daniel Michelon FASUL1 Alex Rosch de Faria FASUL2

INTRODUO O tema em foco deste artigo o RAID (Redundant Arrays of Independent Disks ou Conjunto Redundante de Discos Independentes). RAIDs so tcnicas de organizao de discos, baseados na interligao de dois ou mais discos rgidos independentes de menor capacidade para a formao de uma grande unidade de dados, como tambm oferecer maior segurana e um melhor desempenho no armazenamento de dados atravs da redundncia. Mas isso realmente funcional e eficiente? Se sim, como funciona? Quais so os meios e possibilidades de organizao de discos de dados atravs desta tecnologia? A escolha do tema est diretamente relacionada com o grande avano de certas aplicaes nos ltimos anos, como web sites, bancos de dados cada vez maiores e multimdia, que tornam cada vez mais necessrias unidades de armazenamentos de dados com grandes capacidades e maior velocidade de escrita e leitura de dados. Foram realizadas pesquisas bibliogrficas em sites, livros e artigos cientficos, voltados

essencialmente ao tema proposto no artigo. Foram utilizados sites para complementao de conceitos encontrados nos livros sobre o tema em questo, alm do uso de imagens encontradas nos livros e sites pesquisados. UM BREVE HISTRICO Segundo Campos, para melhorar a confiabilidade e segurana de sistemas computacionais, a primeira ideia de RAID foi desenvolvida pela IBM em 1978, baseada basicamente na redundncia. Mais tarde, em 1987, David A. Patterson, Garth A. Gibson e Randy H. Katz publicaram pela Universidade de Berkeley um artigo chamado "A Case for Redundant Arrays of Independent Disks RAID", um artigo que descrevia vrios tipos de matrizes de discos. A idia bsica do RAID era a de combinar muitos pequenos e independentes discos em uma matriz de discos, cujo desempenho seria superior ao de um grande e nico disco rdigo (Single Large Expensive Drive SLED), onde tal matriz deveria aparecer como um nico dispositivo no computador. O MTBF (Mean Time Between Failure, ou Tempo Mdio Entre Falhas), que seria uma forma

Faculdade Sul Brasil - Toledo Paran 2011 ISSN 2175-7135

ARTIGO

de medida da quantidade de erros provocados por essas matrizes igual ao menor MTBF individual dos discos, dividido pelo nmero de discos. Por isso, o MTBF dessas matrizes se torna extremamente baixo para muitas aplicaes. Alm disso, matrizes de discos podem ser feitas, e as disposies de disco podem garantir vrias formas de armazenamento dos arquivos. Silberschatz explica que o fato de se ter vrios discos de baixa capacidade ligados em paralelo em um nico sistema cria grandes oportunidades de se obter maior velocidade de escrita e leitura de dados, alm da maior segurana gerada pela redundncia, j que no caso de um dos discos parar de funcionar todos os dados guardados neste estaro salvos em outros discos. Anos atrs, os programadores e projetistas de sistemas viam os sistemas de armazenamento compostos de vrios discos pequenos e de baixo custo como uma alternativa econmica ao uso de discos de grande capacidade e de alto valor. Isso est relacionado ao fato de que a sigla original RAID significar Redundant Arrays of Inexpensive Disks, diferente do significado atual de Redundant Arrays of Independent Disks. O alto preo era visvel pelo fato de que o custo por megabyte dos discos de baixa capacidade era menor que o dos discos de alta capacidade, o que no ocorre nos dias de hoje, devido ao fato de que todos os discos so fisicamente menores. Assim, hoje o RAID utilizado como forma de se obter maior segurana, e no baixo custo. ARQUITETURA DE RAID

configurao ou o prprio kernel do sistema operacional. Via hardware: Todo o processamento feito por um controlador que faz apenas o processamento de RAID, necessitando de processadores internos e de memria cache, ento o CPU fica livre desse processamento, deixando-o conseqentemente mais rpido. Se compararmos o RAID via software e via hardware podemos perceber que quando implementados por software eles so mais flexveis, mas por outro lado exigem todo o processamento atravs do CPU, o que pode deixar o sistema, em alguns casos, muito lento, no viabilizando a implementao. Ao contrrio do implementado por hardware, onde todo o processamento feito pelo controlador, que so desenvolvidos somente para esse fim, deixando o CPU livre para outros processos. Outra grande vantagem de utilizar o RAID via hardware, que como o controlador utilizado somente para esse fim, a memria cach do dispositivo oferece altas taxas de transferncia, pois usada somente para este fim. NVEIS DE RAID Segundo Silberschatz os nveis de RAID so esquemas alternativos que buscam melhorar a redundncia com menor custo, cada um com determinado custo-desempenho. Cada nvel possui a sua caracterstica, dependo da finalidade do uso em seu sistema, se escolhe o que mais se adapta a voc. Consiste em um conjunto de dois ou mais discos rgidos, basicamente com a finalidade de tornar o disco mais rpido (striping) ou em alguns casos torn-lo mais seguro (mirroring). Esses dois mtodos podem ser usados tambm em conjunto, como ser explicado melhor a seguir. Inicialmente o RAID 0 oferece aos conjuntos de discos o espelhamento no nvel de blocos, mas sem uso de redundncia. Ele pode ser dividido em dois tipos, o Linear e o Striping. O RAID 0 Linear uma simples concatenao de pequenos discos para se criar um grande e nica partio. Essa concatenao diminui a confiabilidade total do sistema, pois caso houver falha em um dos discos, toda partio estar comprometida. usado geralmente para extender o tamanho total de um volume.

Consoante Campos existem seis tipos de arquiteturas de matrizes de discos: RAID-0 at RAID-5. Elas foram definidas pelo mesmo artigo de Berkeley, cada uma oferecendo MTBFs, formas de armazenamento e performances diferentes. Basicamente, RAID seria dois ou mais discos trabalhando simultaneamente para um mesmo fim, por exemplo, o RAID-1 serviria como um espelhamento simples, rpido e confivel entre dois discos, para fazer o backup de um disco em outro. Um sistema RAID pode ser configurado de duas maneiras: Via software: Todo o processamento feito pela CPU, usando alguma aplicao que gere a

Faculdade Sul Brasil - Toledo Paran 2011 ISSN 2175-7135

ARTIGO

FIGURA 1: Modelo do funcionamento do RAID 0 Linear

FIGURA 2: Representao da forma de armazenamento de dados do RAID 0 Striping.

O RAID 0 (striping) subdivide os dados em segmentos consecutivos, os quais so escritos seqencialmente atravs de cada um dos discos. Esses segmentos possuem tamanhos definidos em blocos. Segundo Campos, esse mtodo oferece um melhor desempenho se o tamanho de cada segmento for ajustado corretamente de acordo com a aplicao utilizada, comparado a um disco individual. Caso a aplicao armazenar pequenos registros, segmentos maiores so preferenciais, pois se o segmento conseguir abrigar o registro por completo, os discos podem responder independentemente para as requisies simultneas de dados. Caso contrrio, se a aplicao for armazenar grandes registros, os segmentos pequenos so mais apropriados. Pois, se os registros forem armazenados em pequenos segmentos em vrios discos, o contedo do registro pode ser lido em paralelo, aumentando o desempenho do sistema. Podemos ressaltar os pontos negativos dessa implementao, confiabilidade e desempenho. No RAID 0 (striping), caso o sistema operacional utilizado no oferecer suporte a busca combinada de setores o desempenho do sistema no atingir o resultado desejado, alm de que no ir oferecer paralelismo. Outra desvantagem que a confiana no sistema se torna menor, um disco SLED com um tempo mdio de vida de 20000 horas ser 4 vezes mais seguro do que 4 discos funcionando em paralelo com RAID 0 (striping). Como no existe redundncia de dados, no h muita confiabilidade neste tipo de implementao.

O RAID 1 o prximo nvel de RAID, o qual implementa o espelhamento de disco, tambm conhecido como mirror. Para implement-lo so necessrios no mnimo dois discos. O funcionamento simples, todos os dados sero gravados em dois discos diferentes, recomenda-se discos do mesmo tamanho e marca, deixando os dados em ambos os disco idnticos. Caso um disco falhar ou for removido, os dados do outro disco estaro preservados, permitindo a continuao de operao do sistema.

FIGURA 3: Representao do funcionamento do RAID 1

Geralmente as implementaes de RAID 1 envolverem apenas dois grupos de dados, pode-se utilizar tambm trs ou mais grupos, caso se deseje uma confiabilidade ainda maior no sistema. Este nvel de RAID o que oferece a maior segurana, pois todas as informaes que so guardadas, estaro sendo gravados em mais de um disco. Caso ocorra uma falha em um dos discos, o sistema pode continuar o trabalho utilizando o disco que ficou operacional.

Faculdade Sul Brasil - Toledo Paran 2011 ISSN 2175-7135

ARTIGO

Os dados sero reconstrudos, em um disco de reposio, usando dados dos discos que estaro funcionais. O sistema sofrer um impacto sobre o desempenho quando feito esse processo, pois todos os dados tero que ser lidos e copiados dos discos intactos para o novo disco de reposio. Utilizando o RAID 1 pode-se tambm duplicar o desempenho de leitura de informaes, pois como os dados sero gravados igualmente em mais de um disco, as operaes de leitura podem ser repartidas pelos discos. Este nvel tambm oferece uma alta disponibilidade de dados, porque os dados sero completamente gravados em pelo menos dois discos. Caso os discos forem conectados em controladoras separadas, aumenta-se ainda mais a confiabilidade dos dados, pois elimina a controladora como um ponto de falha nica. Este nvel possui um custo um pouco mais elevado, pois utilizaremos mais de um disco para gravar a mesma informao. Este nvel se adapta, e geralmente usado, em pequenos bancos de dados ou sistemas de pequeno porte que necessitam grande confiabilidade. A tendncia de operao, no necessariamente, gravar os dados mais lentamente, porm fazer uma leitura mais rpida dos mesmos.

4. Este fato at possibilitou uma pequena proteo adicional, porm os discos mais novos incorporam essa funo internamente. Esse nvel origina uma maior consistncia nos dados se houver alguma queda de energia, durante a escrita. Baterias de segurana ou um encerramento correto provm os mesmos benefcios. O nvel RAID 3 tambm muito similar ao RAID 4, mas ele utiliza tamanhos de stripes menores em relao ao RAID 4. Sendo assim, qualquer pedido utilizara todos os discos, tornando requisies de sobreposio difceis ou at impossveis. O RAID 3 exige que todos os eixos das unidades de discos estejam sincronizados, a fim de evitar o atraso da latncia rotacional. As unidades de discos mais recentes geralmente no possuem ou no so capazes de fazer este tipo de processo, sendo necessrio utilizar-se de conectores ou cabos, sendo invivel a implementao.

FIGURA 5: Representao do funcionamento do RAID 3.

FIGURA 4: Representao da forma de armazenamento de dados do RAID 1.

Sistemas em RAID 2 raramente so usados, e em algum momento ficaram obsoletos pelas novas tecnologias de disco. bem similar ao RAID 4, porem ele armazena informaes ECC (Error Correcting Code), que so informaes de controle de erros, ao invs da paridade que usada no RAID

O RAID 4, funciona com dois ou mais discos. Um dos discos ir guardar a paridade, que seria uma forma de segurana, das informaes contidas nos discos. Caso alguma dos discos se danificar, a paridade pode ser imediatamente usada para reconstruir todo o seu contedo. Os discos restantes so usado para armazenar dados, so configurados para usarem segmentos grandes, para acomodar registros inteiros, permitindo assim leituras independentes das informaes armazenadas. Geralmente este nvel utilizado para ambientes transacionais que requerem muitas leituras pequenas e simultneas. O RAID 4, assim como todos os outros nveis que se utilizam da paridade, usam um processo de recuperao de dados mais envolvente do que o utilizado em nveis que utilizam

Faculdade Sul Brasil - Toledo Paran 2011 ISSN 2175-7135

ARTIGO

espelhamento, como o RAID 1. Este nvel tambm til quando se quer criar grandes discos virtuais, pois ele soma o total oferecido por todos os discos, menos o disco de paridade. O desempenho razovel nas operaes de leitura, pois utiliza todos os discos de forma simultnea. O RAID 5 bastante utilizado e funcionar similarmente ao RAID 4, mas melhora alguns dos problemas comuns sofrido por este nvel. No RAID 5 as informaes de paridade para os dados so distribudos em todos os discos, ao invs de possuir um disco dedicado apenas para isso, oferecendo assim mais desempenho que o RAID 4 e tolerncia a falhas. Para aumentar o desempenho de leitura do RAID 5, o tamanho de cada segmento em que os dados so divididos pode ser otimizado dependendo da finalidade para que ele ser usado. O desempenho geral de um RAID 5 equivalente ao de um RAID 4, exceto pelas leituras seqenciais, que reduzem a eficincia dos algoritmos de leitura por causa da distribuio das informaes sobre paridade. Esta, por ser distribuda por todos os discos, havendo a perda de um, reduz a disponibilidade de ambos os dados e da informao sobre paridade, at recuperao do disco que falhou. Isto pode causar degradao do desempenho de leitura e de escrita.

Assim, possvel ter um bom rendimento do nvel 0 com a redundncia do nvel 1. No entanto, para este nvel necessrio no mnimo 4 discos, tornando-se invivel em alguns casos. As caractersticas deste nvel o tornam o mais rpido e mais seguro de ser implementado, porm, o mais caro.

FIGURA 7: Representao da forma de armazenamento de dados do RAID 0+1.

O nvel RAID 10 idntico ao RAID 0+1, utiliza-se quatro discos, os dois primeiros funcionaro em mirroring dobrando a segurana dos dados enquanto os outros dois funcionaro em striping melhorando a performance. A nica diferena que eles possuem, seria o nome.

FIGURA 6: Representao do funcionamento do RAID 5.

A seguir teremos variaes ou combinaes entre os seis nveis de RAID explicados anteriormente, voltados a outros O RAID 0 + 1 a combinao do RAID 0 (striping) e do RAID 1 (mirror), onde os dados sero divididos entre discos para melhorar o desempenho e simultaneamente a isso, se utilizar de outros discos para fazer a duplicao dos dados.

FIGURA 8: Representao da forma de armazenamento de dados do RAID 10.

Faculdade Sul Brasil - Toledo Paran 2011 ISSN 2175-7135

ARTIGO

O RAID-50 um arranjo hbrido que usa as tcnicas de RAID com paridade em conjuno com a segmentao de dados, um arranjo com as informaes segmentadas atravs de dois ou mais arranjos RAID-5. Dependendo do tamanho de cada segmento estabelecido durante a configurao do arranjo, estes arranjos hbridos podem oferecer os benefcios de acesso paralelo dos arranjos com paridade (alta velocidade na transferncia de dados) ou de acesso independente dos arranjos com paridade (grande quantidade). Como em outros arranjos RAID com paridade, a reconstruo de um disco falho gera um impacto no desempenho do programa usando o arranjo. Silberschatz ainda prope o RAID de nvel 6, que seria muito semelhante ao de nvel 5, mas que armazena informaes redundantes extras para proteger contra mltiplas falhas de disco. Dessa forma, o RAID 6 no utiliza paridade, mas sim cdigos de correo de erros. RAID COM ALTA DISPONIBILIDADE A implementao do RAID com alta disponibilidade pode se tornar dificultosa e de elevado custo. Quanto mais importante for o objetivo de se fazer um sistema que seja tolerante a falhas, mais complexa ser sua implementao. Como os discos IDE podem falhar de uma maneira que um disco que falhou em uma parte do cabo IDE possa impedir que o disco bom que esteja no mesmo cabo seja acessado, tal situao acaba cedendo a impresso de que ambos os discos estejam com falhas. O RAID no oferece proteo contra estes tipos de falhas em dois discos, recomendando-se sempre usar um disco por cabo, ou se houver uma maior possibilidade usar tambm um controlador RAID para cada disco, ou pelo menos mais de uma controladora em todo o array de discos, fazendo com que a falha em um controlador no acabe com toda a configurao e de a impresso de que todos os discos falharam. Segundo Campos, no se deve utilizar modelos ou nmeros idnticos para todos os discos. comum em variaes eltricas bruscas ocorrer a perda de discos alm do calor e a ventilao insuficiente. A utilizao de diferentes tipos de discos e controladores reduz a possibilidade de danificao dos discos consideravelmente.

HOT SWAP Hot swap a capacidade de retirar/substituir componentes de uma mquina, geralmente um computador, enquanto ele est em operao, sem ser necessrio desligado. Os exemplos mais comuns, geralmente os dispositivos plug and play, so os dispositivos USB e Firewire tais como: mouse, teclado, impressoras e pen drive. Os discos RAID so hot-swap, ou seja, um disco com falha pode ser removido ou substitudo sem perda de dados ou interrupes do servidor graas a controladora de hardware RAID e o carregador de disco. Com o hot-swap RAID, o sistema continua operando, enquanto o contedo do disco avariado reconstrudo em um disco sobressalente, usando informao redundante ou paridade. CONCLUSO A tecnologia RAID realmente vivel e gera maior segurana ao sistema na qual implantada. Isso ocorre devido ao fato de que ela voltada redundncia, o uso de dois ou mais discos de dados e cdigos de deteco e correo de erros. Assim, caso ocorram falhas em um dos discos utilizados o sistema no ir parar de funcionar ou perder seus dados, j que outros discos tambm os tero armazenado. Na realizao do artigo foi entendido que a tecnologia em si foi criada com o principal objetivo de se obter alta velocidade de escrita e leitura de dados nos discos e baixo custo com maior confiabilidade. Utilizar vrios discos pequenos ligados entre si era uma opo econmica na poca em que o RAID foi desenvolvido, j que discos de alta capacidade possuam um custo muito alto. Por fim, o RAID dividido em seis nveis, cada um voltado a um grau de segurana diferente, utilizando uma estrutura de armazenamento de dados diferentes, fazendo uso ou no da paridade e da redundncia, variando a quantidade de possveis falhas que venham a ocorrer.

Faculdade Sul Brasil - Toledo Paran 2011 ISSN 2175-7135

ARTIGO

REFERNCIAS SILBERSCHATZ, Abraham. Sistema de Banco de Dados / Abraham Silberschatz, Henry F. Korth, S. Sudarshan ; traduo de Daniel Vieira Rio de Janeiro : Elsevier, 2006. CAMPOS, Erick Rigon. HD Discos Rgidos / Erick Rigon Campos, Victor Fernando Campos; < http://www.gta.ufrj.br/grad/07_ 1/hd/contato.html>. REZENDE, Ricardo. RAID / Ricardo Rezende; < www.sqlmagazine.com.br/Colunistas/ RicardoRezende/06_Raid_P1.asp>. SZTOLTZ, Lisiane. Guia do Servidor Conectiva Linux / Lisiane Sztoltz, Roberto Selbach Teixeira, Evelyne de Oliveira Ferraz Ribeiro; < http://conectiva.com/doc/livros/ online/9.0/servidor/book.html> ; Copyright 2003 Conectiva S.A.

Faculdade Sul Brasil - Toledo Paran 2011 ISSN 2175-7135