Anda di halaman 1dari 18

Arquitetura de

computadores II
Very Long Instruction Word
(VLIW)
Introduo
A arquitetura VLIW visa alcanar o pice do paralelismo com instrues longas,
compostas de vrias operaes aritmticas, lgicas e de controle, cada uma das
quais poderia ser uma operao individual em um processador RISC simples.
O processador VLIW executa o conjunto das operaes, alcanando um alto grau
de paralelismo de mquina.
Ele deixa a cargo do compilador escalonar as operaes de modo a utilizar as
unidades disponveis da melhor forma.
Histria
Os processadores VLIW passam a ser possveis com o desenvolvimento de uma
tcnica chamada trace scheduling, por Joseph A. Fisher, que permitia adaptar
os cdigos sequenciais para arquiteturas do tipo VLIW.
Graas a isso, surge o compilador trace scheduling Buldog juntamente com o
processador ELI-512.

Por volta do ano de 84 Bob R. Rau criou a Cydrome, primeira empresa


responsvel por desenvolver processadores VLIW. Ela tambm foi a primeira a
utilizar tcnicas de software pipeline com suporte arquitetural a loops
escalonados. No mesmo ano surge a Multiflow, de Joseph Fischer, com o intuito
de construir supercomputadores VLIW
Histria
No ano de 87 a Cydrome lana o Cydra 5, com um nico processador numrico
VLIW com palavras de instruo de 256 bits e capacidade de 7 operaes por
ciclo. Alm disso, ainda possua diversos processadores escalares para
processamento de entrada e sada (I/O) e trabalhos de propsitos gerais.
Durante este perodo, a Multiflow Computer lana o Trace/200, com palavras de
256 at 1kb, porm nenhum dos lanamentos conseguiu valores expressivos no
mercado.
Cydrome encerrou as atividades no ano de 88, enquanto a Multiflow ainda lanou
um segundo modelo de expresso, o Trace/300 para representar a segunda
gerao de computadores VLIW, porm fechou as portas no ano de 90.
Histria
Apesar de as pesquisas terem sido herdadas por outras empresas (como a HP e
a IBM), no receberam grandes investimentos, e seguem at hoje sem grande
sucesso.
Outros exemplos de processadores VLIW so o IA-64(Itanium), da Intel, o
Crusoe, da Transmeta e o Trimedia, da Philips (comerciais), e o Playdoh, da HP,
o Tinker, da North Carolina State University e o processador de imagens Imagine,
da Standford University.
Conceito
Palavra de Instruo Muito Longa (VLIW em ingls) uma arquitetura de CPUs
que explora o processamento paralelo a nvel de instruo.
Cada instruo formada por vrias operaes arranjadas em blocos (ou
palavras) pelo compilador. A posio de cada operao dentro da palavra define
que unidade. Operaes paralelizveis so includas na mesma palavra, j as
serializveis so postas em palavras diferentes, num mesmo bloco de palavras.
Escalonamentos mais complexos que ultrapassam as fronteiras entre blocos
exigem tcnicas mais sofisticadas.
Conceito
O Desempenho computacional depende principalmente ao tempo de compilao,
visto que o mesmo que encaminha as instrues longas para a unidade de
processamento.
Por fim, vale ressaltar que poucas instrues integram as palavras que se
agrupam conforme a similaridade (as com mesma natureza, funo ou efeito se
renem), mantendo uma relao simples com a mquina. Para facilitar o trabalho
do hardware, as instrues trazem dados redundantes sobre funes por
executar, executando, o destino e atual localizao, assim como todas as
unidades funcionais do sistema, gerando em uma instruo demasiadamente
grande.
Mquina VLIW Ideal
De acordo com Kai Hwang, a arquitetura VLIW generalizada a partir de 2
conceitos, micro-cdigo horizontal e processamento superescalar.
Uma instruo composta normalmente de palavras de centenas de bits e um
banco de registradores em comum, compartilhado pelas unidades funcionais do
sistema.
Estas ento tratam de executar as operaes sincronizadas de acordo com os
opcodes presentes em cada palavra da instruo no micro-cdigo horizontal.
Processador Itanium IA-64
Funciona com um clock de 800MHz, foi fabricado com tecnologia de 18 microns
(18000 nanmetros) e possui uma pipeline de 10 estgios. Possui:

Arquitetura VLIW de 64 bits, podendo executar at 6 operaes por ciclo( duas


palavras);

4 unidades inteiras, 4 multimedia, 2 de load/store, 2 de ponto flutuante com


preciso simples e outras 2 com preciso extendida.
Processador Itanium IA-64

Palavras com tamanho de 128b compostas por 3 operaes e um template que


indica se as instrues podem ser executadas em paralelo ou no (e ento quais
devem ser serializadas) e se pacote pode ser executado em paralelo com os
pacotes vizinhos.
128 registradores de uso geral (64b), outros 128 registradores de ponto
flutuante(82b) e 64 de predicado.

Registradores de uso geral do 0-31 so fixos, ja os 32-127 podem ser


renomeados pelo programa, nos de predicado, os fixos so os de 0-15, e de 16-
63 podem ser renomeados tambm.

Suporta especulao de dados, predio dinmica e esttica de desvios, possui


instrues de SIMD para processamento multimdia.

o processador VLIW mais complexo j projetado (VLIW busca simplificar o


hardware)
Vantagens
Baseia-se totalmente no compilador, proporcionando maior liberdade de
otimizao atravs do escalonamento de instrues, j que existem poucas
restries no acesso aos recursos do processador.

O compilador tem conhecimento prvio da latncia e outros efeitos de cada


operao, o que o ajuda a manter a integridade com o clock universal sem
mecanismos de sincronizao durante a execuo.

Mltiplas operaes simultneas.

Grande reduo no nmero total de instrues por programa.


Desvantagens

Os caminhos das instrues podem ser previstos de forma equivocada, gerando


atrasos no processamento e desvios forados, diminuindo a performance da
mquina VLIW.

Qualquer evento externo compromete o processamento (como um erro na


memria ou outro dispositivo), que, sem soluo, interrompe a mquina.

No possui compatibilidade com cdigos convencionais ( e as vezes at com


outros cdigos paralelos).
Desvantagens

Necessita de vrias unidades funcionais, mas para garantir seu funcionamento,


ocupa grande nmero de acessos a memria cache.

Causa a m utilizao de memria graas ao grande nmero de cdigos


necessrios para manter o processamento VLIW lgico-eficiente.
Concluses Finais
Apesar de ter revolucionado o mercado de processamento de alto desempenho,
tornou-se um fracasso comercial devido ao alto grau de complexidade de seus
inconvenientes problemas. Dito isso, bom ressaltar que a tecnologia representa
hoje um grande potencial futuro, barrado apenas por estas questes que
desencorajam grandes investimentos e pesquisas.