Sistema de
armazenamento
inteligente
Esta aula apresenta uma viso geral sobre sistema de armazenamento inteligente e
seus principais componentes e sobre gerenciamento do cache.
Course Introduction
Operaes de gravao com cache oferecem vantagens de desempenho sobre a gravao direta nos discos.
Quando uma I/O gravada no cache e reconhecida, completada em muito menos tempo (da perspectiva do
host) do que demoraria para ser gravada diretamente no disco. Gravaes sequenciais tambm oferecem
oportunidades para otimizao, pois muitas gravaes pequenas podem ser consolidadas para transferncias
maiores para drives de disco com o uso do cache.
Uma operao de gravao com cache implementada da seguintes forma:
Write-back cache: Os dados so colocados no cache e um reconhecimento enviado para o hospedeiro
imediatamente. Posteriormente, dados de diversas gravaes so confirmados (de-staged) para o disco. Tempos
de resposta de gravao so muito mais rpidos, j que as operaes de gravao so isoladas dos atrasos
mecnicos do disco. Entretanto, dados no confirmados correm o risco de perda caso haja falhas no cache.
Write-through cache: Os dados so colocados no cache e so gravados imediatamente no disco e o
reconhecimento enviado para o host. Como os dados so confirmados no disco assim que chegam, o risco de
perda de dados baixo, mas o tempo de resposta de gravao maior devido s operaes de disco.
O cache pode ser evitado em determinadas condies, como quando o volume de gravao de I/O for muito
grande. Nesta implementao, se o tamanho de uma solicitao de I/O exceder o tamanho predefinido, chamado
write-aside size, as gravaes so enviadas diretamente para o disco para reduzir o impacto de grandes gravaes
consumindo um grande espao do cache. Isto especialmente til em um ambiente onde os recursos do cache
so restritos e o cache for solicitado por I/Os pequenas e aleatrias.
O cache pode ser implementado como sendo dedicado ou global. Com o cache dedicado, conjuntos separados de
locais de memria so reservados para leituras e gravaes. Na cache global, tanto as leituras quanto as gravaes
podem utilizar quaisquer endereos de memria disponveis. A gesto do cache mais eficiente em uma
implementao do cache global, j que apenas um agrupamento global de endereos tem que ser gerenciado.
O cache global permite que os usurios especifiquem as porcentagens do cache disponveis para leituras e
gravaes na gesto do cache. Geralmente, o cache de leitura pequeno, mas deve ser aumentado caso o
aplicativo que estiver sendo utilizado executar muitas leituras. Em outras implementaes do cache global, a taxa
do cache disponvel para leitura versus gravao ajustada dinamicamente com base nas cargas de trabalho.
O cache um recurso finito e caro que precisa de gesto apropriada. Apesar dos sistemas de
armazenamento inteligente possurem grande volume do cache, quando todas as pginas do
cache estiverem preenchidas, algumas tero que ser liberadas para acomodar novos dados e
evitar a degradao de desempenho. Diversos algoritmos de gerenciamento do cache so
implementados em sistemas de armazenamento inteligente para manter de forma proativa
um agrupamento de pginas livres e uma lista de pginas que podem ser potencialmente
liberadas, sempre que necessrio.
Os algoritmos mais utilizados so apresentados na lista a seguir:
LRU (Least Recently Used - menos utilizados recentemente): algoritmo que monitora
continuamente o acesso aos dados no cache e identifica as pginas do cache que no foram
acessadas h muito tempo. O LRU libera estas pginas ou as marcas para serem reutilizadas.
Este algoritmo baseado na suposio de que os dados que no tiverem sido acessados h
um determinado tempo, no sero solicitados pelo host. Entretanto, se uma pgina possuir
dados de gravao que ainda no tiverem sido confirmados no disco, eles sero primeiro
gravados no disco, antes que a pgina seja reutilizada.
MRU (Most Recently Used - mais recentemente utilizada): este algoritmo o oposto da
LRU, onde as pginas mais utilizadas recentemente so liberadas ou marcadas para
reutilizao. Este algoritmo baseado na suposio de que dados recentemente utilizados
podem no ser solicitados por um determinado tempo.
10
Quando o cache fica cheio, o sistema de armazenamento inteligente deve agir para
limpar as pginas sujas (dados gravados no cache mas ainda no gravados em disco)
a fim de gerenciar a disponibilidade de espao. Flushing o processo de confirmao
de dados do cache no disco. Com base na taxa e padro de acesso de I/O, nveis alto
e baixo chamados marcas d'gua, so marcados no cache para gerenciar o processo
de flushing.
O limite mximo (HWM- high watermark) o nvel de utilizao do cache no qual o
sistema de armazenamento inicia o flushing dos dados no cache em alta velocidade.
O limite inferior (LWM- low watermark) o ponto no qual o sistema de
armazenamento pra o flushing de dados para os discos. O nvel de utilizao do
cache determina o modo de descarga a ser utilizado:
Flushing ocioso: ocorre continuamente, em uma relao modesta, quando o nvel de
utilizao do cache est entre o limite mximo e o inferior.
Flushing de limite mximo: ativado quando a utilizao do cache atinge limite. O
sistema de armazenamento dedica alguns recursos adicionais para o flushing. Este
tipo de flushing tem pouco impacto no processamento de I/O.
Flushing forado: ocorre no caso de um grande aumento de I/O quando o cache
atinge 100% da sua capacidade, o que afeta significativamente o tempo de resposta
de I/O. No flushing forado, o sistema limpa o cache prioritrio alocando mais
recursos.
11
12
Course Introduction
12
13
O back end fornece uma interface entre o cache e os discos fsicos e formado por
dois componentes: portas e controladoras back-end. O back-end controla a
transferncia de dados entre o cache e os discos fsicos. Os dados so enviados do
cache para o back end e depois direcionados para o disco de destino. Os discos fsicos
esto conectados s portas no back end. A controladora back-end se comunica com
os discos ao executar leituras e gravaes. Alm disso, fornece armazenamento
adicional e temporrio de dados, porm limitado.
Os algoritmos implementados nas controladoras back-end proporcionam deteco e
correo de erros junto funcionalidade do RAID.
Os sistemas de armazenamento so configurados com controladoras duplas com
mltiplas portas, a fim de oferecer maior proteo e disponibilidade de dados. Tais
configuraes oferecem um caminho alternativo para os discos fsicos, caso ocorra
falha na controladora ou na porta. Esta confiabilidade pode ser melhorada se os
discos tambm possurem portas duplas. Neste caso, cada porta de disco pode se
conectar com uma controladora separadamente. Mltiplas controladoras tambm
facilitam o equilbrio da carga.
14
15
16
17
18
Course Introduction
18
19
O provisionamento virtual permite criar e apresentar uma LUN com capacidade maior
do que est fisicamente alocada no storage array. A LUN criada utilizando o
provisionamento virtual chamada de thin LUN para ser diferenciada da LUN
tradicional. Thin LUNs no necessitam armazenamento fsico para serem totalmente
alocadas quando so criadas ou apresentadas ao host. O armazenamento fsico
alocado ao host sob-demanda a partir do pool compartilhado da capacidade fsica.
Um pool compartilhado formado por discos fsicos e , no provisionamento virtual,
equivalente ao grupo de RAID, uma coleo de drives nos quais as LUNs so criadas.
Um pool compartilhado suporta um nvel de proteo de RAID simples, semelhante a
um grupo de RAID. Entretanto, diferentemente deste, o pool compartilhado pode
conter grande nmero de drives. Os pools compartilhados podem ser homogneos,
(que contm somente um tipo de drive) ou heterogneo, (que contm vrios tipos de
drives, combinados como flash, FC, SAS e SATA).
O provisionamento virtual permite a alocao de armazenamento ao host mais
eficiente e uma superatribuio, no qual uma capacidade maior do que a realmente
est disponvel no storage array apresentada ao host. Tanto pool compartilhado
como thin LUN podem ser expandidos ininterruptamente enquanto as solicitaes de
armazenamento do host aumentam. Mltiplos pools compartilhados podem ser
criados dentro de um storage array e compartilhados por mltiplas thin LUNs.
20
Mscara de LUN o processo que fornece o controle de acesso aos dados, definindo
quais LUNs um host pode acessar. Sua funo est implementada no storage array, o
que assegura que o acesso do volume pelos hosts seja controlado apropriadamente,
evitando uso no autorizado ou acidental em um ambiente compartilhado.
Considere, por exemplo, um storage array com duas LUNs que armazenam dados dos
departamentos de vendas e financeiro. Sem o mascaramento de LUN, os dois
departamentos podem facilmente ver e modificar dados um do outro, representando
um alto risco segurana e integridade dos mesmos. Com o mascaramento de LUN,
as LUNs estaro acessveis somente aos hosts designados.
21
22
Course Introduction
22
Sistemas de armazenamento midrange, tambm conhecidos como arrays ativopassivo, so mais adequados para aplicativos de mdias ou pequenas empresas,
oferecendo timas solues de armazenamento um custo mais baixo. Em um array
ativo-passivo, o host executa I/Os para uma LUN somente atravs da controladora
que possui a LUN. O host executa a leitura ou gravao para a LUN somente pelo
caminho para a controladora A, pois esta a que possui a LUN em questo. O
caminho para a controladora B permanece passivo e nenhuma atividade I/O
executada por ele.
Os sistemas de armazenamento midrange so normalmente projetados com duas
controladoras, cada uma com as interfaces do host, controladoras RAID e interface
para drives de disco.
Os arrays midrange so projetados para atender ao requisitos de aplicativos de
empresas mdias ou pequenas, portanto hospedam menos capacidade de
armazenamento e cache do que os storage arrays high-end. H tambm, menos
portas front-end para conexes com o host. Porm, eles asseguram alta redundncia
e desempenho para aplicativos com carga de trabalho previsvel, alm de suportarem
replicaes baseadas em arrays remotos ou locais.
23
24
Course Introduction
25
Course Introduction
26
Course Introduction
27
Mdulo 5
Rede de rea de
armazenamento Fibre
Channel (FC SAN)
28
29
30
31
Course Introduction
31
32
33
34
35
As implementaes SAN utilizam cabos de fibra tica. O cobre pode ser utilizado para
distncias mais curtas em conectividade back-end, pois proporciona uma relao
aceitvel entre sinal-rudo at 30 metros de distncia. Os cabos de fibra tica levam
dados em forma de luz. H dois tipos de cabos ticos: multimode e single-mode. Os
cabos de fibras multimode (MMF)levam mltiplos feixes de luz projetados
simultaneamente em diferentes ngulos sobre o ncleo do cabo. Com base na largura
da banda, as fibras multimode so classificadas como OM1 (ncleo 62.5m), OM2
(ncleo 50m) e laser-otimizados OM3 (ncleo 50m). Em uma transmisso MMF,
mltiplos feixes que viajam dentro do cabo tendem a dispersar e colidir. Esta coliso
enfraquece a fora do sinal depois de uma certa distncia, processo que conhecido
como disperso modal. Um cabo MMF normalmente utilizado para distncias
curtas devido a degradao de sinal (atenuao) como resultado da disperso modal.
A fibra single-mode leva um simples feixe de luz projetado no centro do ncleo. Estes
cabos esto disponveis com ncleos de dimetros de 7 a 11 mcrones, sendo o de 9
mcrones o tamanho mais comum. Em uma transmisso SMF, um nico feixe de luz
viaja em linha reta pelo ncleo da fibra. O pequeno ncleo e o feixe de luz nico
ajudam a limitar a disperso modal. Entre os tipos de cabos de fibra, os de singlemode proporcionam atenuao mnima de sinal at 10 km de distncia. Um cabo
single-mode utilizado para longas distncias, que geralmente dependem de
potncia do laser no transmissor e da sensibilidade do receptor.
MMF so geralmente utilizados dentro de data centers para percorrer distncias
36
Course Introduction
36
37
38
39
40
41
Em uma configurao FC-AL, os dispositivos esto ligados ao loop compartilhado. FCAL possui as caractersticas das topologias anel token e estrela fsica. No FC-AL, cada
dispositivo compete com outros para executar as operaes I/O. Os dispositivos no
loop devem arbitrar para ganhar o controle do loop, pois a qualquer momento,
somente um dispositivo pode executar as operaes I/O no loop.
Como configurao loop, o FC-AL pode ser implementado sem qualquer dispositivo
de interconectividade atravs de conexo direta de um dispositivo a outros dois em
um anel atravs de cabos.
Entretanto, as implementaes FC-AL tambm podem utilizar hubs onde o arbitrated
loop estiver fisicamente conectado em uma topologia em estrela.
A configurao FC-AL tem as seguintes limitaes relacionadas a escalabilidade:
FC-AL compartilha o loop e somente um dispositivo por vez pode executar as
operaes I/O. O desempenho geral em um ambiente FC-AL baixo pois cada
dispositivo num loop tem que ficar aguardando sua vez para processar a
solicitao de I/O.
FC-AL utiliza somente 8 bits dos 24 bits endereados ao Fibre Channel (os 16 bits
restantes esto mascarados) e permite a atribuio de 127 endereamentos
vlidos para as portas. Portanto, pode suportar at 127 dispositivos no loop. Um
endereo reservado para conectar, opcionalmente, o loop uma porta switch FC.
Consequentemente, at 126 ns podem ser conectados a um loop.
42
Course Introduction
42
Course Introduction
43
44
Course Introduction
45
Course Introduction
46
47
48
49
Course Introduction
49
50
primitivos que indicam eventos em uma porta de transmisso. Alm disso, a camada
FC-1 executa a inicializao de link e recuperao de erro.
Camada FC-0: a camada mais baixa dentro de um conjunto FCP. Esta camada define
a mdia de interface fsica e a transmisso de bits. A especificao FC-0 inclui cabos,
conectores e parmetros eltricos e ticos para uma variedade de taxas de dados.
Course Introduction
50
51
52
A topologia mesh pode ser de dois tipos: total ou parcial. Numa mesh total, cada
switch est conectado todos os outros switch na topologia e adequado quando o
nmero de switches envolvidos for pequeno. Uma implementao tpica envolveria
at quatro switches ou controladoras, cada um deles servindo o trfego altamente
localizado entre o host e o armazenamento. Numa topologia mesh total necessrio
somente um ISL ou n de rede para o trfego entre o host e o armazenamento.
Entretanto, com o aumento no nmero de switches, o nmero de portas de switches
utilizadas pelo ISL tambm aumenta, o que reduz a disponibilidade de portas de
switch para a conectividade de ns.
Numa topologia parcial mesh, vrios ns de rede ou ISLs podem ser necessrios para
que o trfego atinja seu destino. A mesh parcial oferece maior escalabilidade do que
a mesh total. Entretanto, sem a colocao apropriada do host e dos dispositivos de
armazenamento, o gerenciamento do trfego pode ser mais complicado e as ISLs
poderiam ficar sobrecarregadas devido ao trfego agregado excessivo.
53
54
55
Course Introduction
55
56
57
58
Course Introduction
58
Slide 58
A5
slide no traduzido
Autor; 02/05/2015
A1
Este slide uma cpia do slide 32, por isso nao foi traduzido.
Autor; 16/05/2015
59
SAN virtual, tambm chamado fabric virtual, um fabric lgico em FC SAN, que
permite a comunicao entre um grupo de ns independentemente de suas
localizaes fsicas no fabric. Em um VSAN, um grupo de hosts ou de portas de
armazenamento se comunicam entre si utilizando a topologia virtual definida no SAN
fsico. Mltiplos VSANs podem ser criados em um nico SAN fsico. Cada VSAN atua
como um fabric independente com seu prprio conjunto de servios, como o nome
do servidor e zoneamento. As configuraes relacionadas ao fabric em um VSAN no
afetam o trfego em outra.
VSANs melhoram a segurana, escalabilidade, disponibilidade e gerenciamento de
SAN e fornecem segurana elevada isolando os dados confidenciais em um VSAN e
restringindo o acesso aos recursos localizados dentro daquele VSAN. O mesmo
endereo de FibreChannel pode ser atribudo aos ns em diferentes VSANs
aumentando, assim, a escalabilidade do fabric. Os eventos que causam a interrupo
de trfego em um VSAN so contidos dentro daquele VSAN e no so propagados
para outros. VSANs simplificam o gerenciamento de redes de modo mais fcil, flexvel
e barato. Configurar um VSANs mais fcil e rpido comparado criao de FC SANs
fsicas separadas para vrios grupos de ns. Para reagrupar os ns, o administrador
simplesmente muda as configuraes VSAN sem mover os ns e cabos.
60
61
Course Introduction
62
Course Introduction
63
Course Introduction
64
Situao Atual:
A infraestrutura de TI de uma organizao consiste de 3 arrays de armazenamento
ligados diretamente a uma combinao heterognea de 45 servidores. Todos os
servidores so dual-attached aos arrays para alta disponibilidade. Como cada array de
armazenamento possui 32 portas front-end, ento cada porta poderia suportar 16
servidores. Entretanto, cada array de armazenamento existente possui a capacidade
de disco para suportar no mximo 32 servidores.
65
66