Cristiano C. A. Vieira
Universidade Federal de Mato Grosso do Sul (UFMS)
Campo Grande MS Brasil
cargemon@ead.ufms.br
1. Introduo
A necessidade de manipular uma quantidade grande de dados unida necessidade de
aumentar o desempenho na resoluo de problemas complexos, proporcionou, nas duas
ltimas dcadas, um crescimento expressivo na busca de arquiteturas paralelas que
combinam esforos de vrios computadores. Neste sentido, surgiram arquiteturas de
processamento de alto desempenho (PAD), tais como, Clusters[7] e Computao em
Grade[1, 8, 9] como solues alternativas e de baixo custo em relao aos
supercomputadores. A utilizao de uma arquitetura PAD objetiva a diviso de um
problema em vrias tarefas menores cujas partes podem ser resolvidas somando os
esforos de vrios computadores concorrentemente. Algumas reas de conhecimento (por
exemplo, astronomia, meteorologia e gentica) requerem, para os problemas estudados,
muitos recursos computacionais com alto desempenho para suprir clculos complexos e
repetitivos.
Computao em grade pode ser definida como uma infra-estrutura de software
capaz de interligar e gerenciar diversos recursos computacionais (capacidade de
processamento, dispositivos de armazenamento, instrumentos cientficos, etc.),
possivelmente distribudos por uma grande rea geogrfica, de maneira a oferecer ao
usurio acesso transparente a tais recursos, independente da localizao dos mesmos
[10]. Apesar de permitir a incluso de supercomputadores, esse paradigma se baseia no
uso de estaes de trabalho comuns, possivelmente de arquiteturas heterogneas. Os
recursos so conectados atravs de tecnologias de rede e oferecidos ao usurio de forma
transparente. O nome Grade uma analogia s malhas de interligao do sistema de
energia eltrica (Power Grids) e se refere vontade de tornar o uso dos recursos
computacionais to transparente e acessvel quanto o uso da eletricidade.
a) Computao seqencial
b) Computao paralela
Cluster
417 (83.40 %)
MPP
81 (16.20 %)
Outros
2 (0,4%)
3.Computao em Clusters
Em um ambiente cluster a alocao de recursos efetuada por domnio administrativo
centralizado, sendo desnecessria a segurana do processo e do recurso, caso a rede de
interconexo (intracluster) seja desacoplada da rede de acesso externo.Alm disso, este
tipo de ambiente pode se beneficiar de protocolos de comunicao mais eficientes entre
suas unidades de processamento, pois como a rede de interconexo pertence ao mesmo
domnio administrativo, o recurso controlado [3,16].
A abordagem cluster possui alta escalabilidade, pois tarefas de incluso ou
excluso de ns escravos no exigem que sejam feitas modificaes no ambiente, sendo
realizadas de forma isolada, partindo do n mestre, por meio da execuo de algum
comando especfico do software escolhido. No entanto, um fator limitante o nmero
de ns, na ordem de dezenas de recursos. A figura 1 ilustra, resumidamente, este
ambiente.
4. Computao em Grade
As Grades Computacionais [8,9] surgiram como uma alternativa para a execuo de
aplicaes com necessidade de grande poder computacional, atravs da integrao de
recursos possivelmente heterogneos e geograficamente dispersos.
O gerenciamento dos recursos que compe a grade feito por um gerenciador
global que, alm de gerenciar os recursos, trata problemas comuns em ambientes de
computao distribuda como: extensibilidade, adaptabilidade, autonomia, qualidade de
servio, alm de outros problemas que so mais comuns em ambientes de grade como:
escalabilidade, tolerncia a falhas, instabilidade dos recursos e privilgios de utilizao.
Krauter et al [4] definiram uma taxonomia para classificar os sistemas de grade
conforme a atividade principal qual se destinam:
Cluster
Grade
Domnio
nico
Mltiplos
Ns
Milhares
Milhes
Segurana do Processamento e
Recurso
Desnecessria
Necessria
Custo
Alto, pertencente a um
nico domnio
Granularidade do problema
Grande
Muito grande
Sistema Operacional
Homogneo
Heterogneo
6. Concluso
Nas duas ltimas dcadas houve um crescimento bastante expressivo na busca e
utilizao da computao de alto desempenho. Este momento, no por acaso, coincidiu
com o fortalecimento de microprocessadores de alta performance, redes de alta
velocidade, e ferramentas padronizadas para computao distribuda de alto
desempenho que subsidiaram a computao de problemas relativos meteorologia,
simulao ssmica, seqenciamento de DNA, e vrios outros. Este trabalho, apresenta
algumas caractersticas da computao em cluster e computao em grade e uma breve
comparao entre eles.
Referncias
[1] ALVARENGA, A. e M DANTAS, A. R. Um Ambiente para Processamento
Paralelo Oportunstico na Internet, Dissertao de Mestrado, Cincia da
Computao, UNB, 2003.
[2] BEZERRA, G. C. Anlise de Conglomerados Aplicada ao Reconhecimento de
Padres de Uso de Recursos Computacionais. Masters thesis, Department of
Computer Science - University of So Paulo, So Paulo, March 2006.
[3] BUYYA, R. High Performance Cluster Computing: Architectures and Systems,
USA: Prentice Hall, 1999.
[4] CASAVANT ,T. L. e KUHL, J. G. A Taxonomy of Scheduling in General-Purpose
Distributed Computing Systems, IEEE Transactions on Software Engineering, 1988.
[5] CIRNE, W; BRASILEIRO, F; ANDRADE, N; COSTA, L; ANDRADE, A;
NOVAES, R; MOWBRAY, M. Labs of the World, Unite!!! Journal of Grid
Computing, 4(3):225246, 2006.
[6] CHOI, S. Group-based Adaptive Scheduling Mechanism in Desktop Grid.
PhDthesis, Department of Computer Science and Engineering Graduate School
Korea University, June 2007.
[7] FOSTER, I. e KESSELMAN ,C. Globus: A Metacomputing Infrastructure
Toolkit, The International Journal of Supercomputer Applications and High
Performance Computing, 1996.
[8] FOSTER, I; KESSELMAN, C; NICK, J; TUECKE, S. The Physiology of the Grid.
An Open Grid Services Architecture for Distributed Systems Integration, 2002.
[9] FOSTER, I; KESSELMAN, C; TUECKE, S. The Anatomy of the Grid. International
Journal of Supercomputer Applications, 15(3):200222, 2001.