Anda di halaman 1dari 13

3

Duo Core

Autor:
Luciano Pinheiro dos Santos
4

História do Core Duo

A idéia de processamento duplo adota-se já faz tempo. Esse emprego é mais


perceptível nos computadores de grande porte, servidores ou estações de trabalho,
mais conhecido como Mainframes, onde se trabalha com dois ou mais
processadores acoplado em uma placa mãe. O interessante a ser frisado é que
esses processadores são alocados em soquetes diferentes na placa e não em uma
mesma pastilha, como realizado nos modelos duais atuais.
Antigamente uma das principais preocupações dos fabricantes desses
produtos era com a velocidade (freqüência do clock) de processamento. Mas os
mesmos perceberam que essa busca poderia sim ser alcançada, contudo este
processo resultaria em um consumo de energia muito alto e em conseqüência
também uma dissipação alarmante de calor. Para um consumidor utilitário de
desktop ficaria inviável a refrigeração desse processador, além do custo final ficar
bastante elevado.
Deixando o raciocínio de elevar o clock, a lógica agora é duplo
processamento e redução de energia. Esta técnica consiste em acoplar dois
processadores em uma mesma pastilha. Estes trabalharam ao mesmo tempo para a
realização da mesma tarefa, logo esse trabalho será concluído bem mais rápido que
apenas um processador. Este ganho de performance é melhor visualizado ao se
trabalhar com com várias tarefas.
Pensando desta forma os dois principais fabricantes desses componentes,
Intel e AMD, lançaram seus produtos com essa tecnologia. Os primeiros
lançamentos da intel baseado nessa tecnologia foi o Pentium D e o Pentium
Extreme Edition, ocorrido em 2005. Ambos são baseados em uma tecnologia de
núcleo denominada de NetBurst, a qual foi herdada do Pentium 4, ela tem o objetivo
de proporcionar maior freqüência de clock. A principal diferença entre os dois é que
o segundo além de ter dois núcleos, possui também a tecnologia Hyper Treading
armazenada nesses núcleos, esta se comporta como dois processadores reais, mas
no entanto, são processadores virtuais. Portanto o Sistema operacional irá
reconhecê-lo como quatro processadores. Em 2006 a Intel lança novos
processadores: o Core 2 Duo, o Core 2 Quad e o Core 2 Extreme, estes por sua vez
são baseados em uma nova tecnologia criada pela mesma e batizada de Core. Esta,
5

agora, visa redução do consumo de energia concomitante a um maior poder de


processamento. Esta tecnologia permite desativar parte do processador que não
esta sendo utilizado, desta forma usa somente o potencial necessário a realização
da tarefa.
O período de lançamento dos processadores duais da AMD foi também em
2005. Esses modelos foram o Opteron e o Athlon X2, o primeiro é pra servidor e o
segundo para desktop. A AMD também pensa em projetar outros processadores,
agora com quatro núcleos. Nesta nova proposta será implantado duas pastilhas em
socketes diferentes, sendo que cada pastilha conterá dois processadores, assim
totalizando quatro processadores. Logo o ganho de desempenho deste será bem
acentuado.
De acordo com as informações colhidas, observa-se que esses
processadores é tão recente que não há muita história a ser contada. O que
percebe-se, na verdade, é um constante aparecimento de novos modelos de
processadores, tanto pelo lado da Intel quanto da AMD, com características
diferentes e muito mais poderosos que os anteriores, contribuindo assim para que
possamos adquirir produtos excelentes a preços acessíveis. O modelo Core 2 Duo
é atualmente ,segundo avaliações feitas por instituições competentes no assunto, o
mais poderoso, entretanto os da AMD é também espetacular e a um custo mais
baixo, portanto a depender da finalidade destinada a segunda opção pode ser mais
indicada, onde a relação custo benefício é requerida.

Processadores de Duplo Núcleo da Intel

Pentium 4

Diante de tantos aplicativos e softwares cada vez mais exigentes, a Intel viu-
se em uma determinada situação em que trabalhar com processadores de núcleo
único já não era mais tão eficaz quanto ela imaginava. Devido a isso, no final de
2003 (Q4 período em que a Intel divide como sendo seu último trimestre), a Intel
lançou o Pentium 4 baseado na arquitetura NetBurst, era um processador voltado
para aplicações de alto nível e com um rendimento muito bom, trabalhava com
6

instruções MMX, SSE, SSE2, e SSE3. Nessa versão de processador a Intel


simulava um núcleo duplo a partir da tecnologia Hyper Treading, que visava dividir o
processador em dois processadores lógicos . Contudo a Intel, não estava mais
conseguindo aliar o clock, ficando com ele até algo mais de 3.8Ghz e um pipeline
de 31 estágios. Além de ter havido problemas, pois acima desse clock, a eletricidade
perdida pelos transistores do processador, era alta tornando assim o Pentium 4, um
processador com o consumo e dissipação térmica altas demais.

Pentium D

No início de 2004 (Q1), surgiu o Pentium D, processador dual core para


notebooks, que começou a se utilizar de 90 nm. O Pentium D, trabalha com
instruções MMX, SSE, SSE2 , SSE3 e EM64T, além de se utilizar de uma tecnologia
similar a usada no Pentium III, onde gerencia a energia de modo ao processador só
usá-la quando necessário. E passou a se destacar dos outros processadores, devido
ao fato de trabalhar com 2 MB de cache L2, tem o processamento basicamente
comparado a dois Pentium 4, trabalhando simultaneamente. Os processadores Dual
Core da Intel, melhoram bastante ao executar várias tarefas simultaneamente, já
que os processos podem ser divididos entre os dois core, demonstrando assim um
desempenho muito superior ao do Pentium 4.

Core 2 Duo

Em meados de 2006 (Q3), surge talvez o melhor processador do mundo, o


Core 2 Duo e o Core 2 Duo Extreme, a partir desse momento o Pentium 4, se torna
parte do passado. Dando lugar aos processadores com 2 ou 4 núcleos unificados
trabalhando em apenas 10 ciclos contra os 14 do Pentium D.
O Core 2 Duo, passa a trabalhar com as Instruções MMX, SSE, SSE2, SSE3,
SSE4 e EM64T. Através de diversas técnicas de miniaturização, o Core 2 Duo,
passa a trabalhar com 65 nm. Além de possuir barramentos superiores a 800 Mhz,
alguns chegam até 1066 MHz o que possibilita até 4 transferências de 266 Mhz po
7

ciclo). O cache L1 do Core 2 Duo ou Conroe nome genérico usado pela Intel,
trabalha com 8 linhas de associação, contra apenas 2 do seu concorrente direto.
Isso possibilita um cache mais eficiente, aumentando a probabilidade da informação
ser encontrada. O cache L2 que pode chegar até 4 Mb, é acessado através de um
barramento de dados de 256 bits. E uma das novidades mais significativas do Core
2 Duo é o Macro-Fusion, que permite diversos pares de instruções comuns
combinados em uma única instrução, ao invés de serem processados
individualmente. Isso gera um efeito benéfico ao processador que economiza
espaço nos buffers de memória, economiza processamento no agendador de
instruções ou scheduler e assim por diante, causando até 11% de ganho bruto a
nível de desempenho se comparado a um de seus antecessores o Pentium 4.
O grande forte do Core 2 Duo está na decodificação das instruções pois,
processa as instruções SSE de 128 bits em apenas um ciclo o que causa grande
agilidade.

Quad Core

Com o lançamento da mais nova plataforma de sistema operacional da


Microsoft o Windows Visa no final de 2006 (Q4 para a Intel), a Intel lançou um
processador que seria o melhor para tal sistema. Assim surge no mercado o Intel
Quad Core, que possui as mesmas características que o Core 2 Duo, porém possui
ao invés de 2 núcleos, 4 e somente em versões com 4 Mb de cache L2, o que o
torna o mais rápido do mercado ao lado do Core 2 Duo Extreme.

Quad 2 Duo e tendências futuras

Já em Janeiro de 2007 (Q1), a Intel fez o lançamento do Core 2 Quad com


cerca de 45 nm, a nova geração de processadores dessa linha, terá um consumo de
energia ainda menor, onde a Intel busca viabilizar o lançamento de versões ainda
mais velozes e com maior poder de processamento. Para o final de 2007 (Q4), a
8

Intel, faz uma previsão de estar trabalhando com uma técnica de miniaturização
ainda melhor, vislumbrando alcançar 35 nm.

AMD

Athlon 64 X2

A AMD foi a primeira empresa a lançar processadores de núcleo duplo com


arquitetura de 64 bits, baseado na arquitetura IBM PC x86. Ela utiliza tecnologia
própria para a comunicação entre o processador e os outros dispositivos de entrada
e saída de memória o “Direct Connect Arquitecture” que permite conexão
independente para cada núcleo.
Com dois núcleos o computador trabalha como se houvesse dois
processadores independentes. Apenas sistemas operacionais com suporte a SMP
(Suporte ao Multiprocessamento Simétrico) são capazes de utilizar e perceber o
aumento do poder de processamento proporcionado por esta arquitetura.
Uma das principais características dos processadores de núcleo duplo da AMD é a
comunicação entre os núcleos que se dá através de um barramento embutido no
processador, chamado de HyperTransport, permitindo-o atingir velocidades maiores
nesta comunicação. Outros fabricantes utilizam a ponte norte que esta fora do
processador para esta comunicação, o que em teoria diminuiria a velocidade de
comunicação entre os núcleos.
A tecnologia de núcleo duplo do processador Athlon 64 X2 tem por base a
utilização de um processador com dois núcleos, cada núcleo idêntico ao Athlon 64,
ou seja, cada núcleo tem sua arquitetura baseada em um Athlon 64.

Plataforma Quad FX

A AMD lançou a plataforma Quad FX que utiliza dois soquetes na mesma


placa mãe trazendo para o pc o que já era comum nos servidores. Através da
arquitetura de Conexão Direta de Soquete Duplo (DSDC) que se dá a comunicação
9

dos dois processadores de duplo núcleo, facilitando o trabalho em paralelo. O


barramento HyperTransport coerente conecta os dois processadores desta
plataforma. Esta plataforma exige que o processador possua dois barramentos
HyperTransport, como já foi dito um conecta os dois processadores enquanto o
outro barramento cuida da conexão com o chipset, vale ressaltar que há dois chip
sets, um para cada soquete.
Esta plataforma utiliza dois processadores Athlon 64 FX de soquete F (1.027
pinos) este suporta as instruções MMX, 3Dnow!, SSE e SSE2. Alem disto nota-se
também que o controle da memória é embutido no processador e a memória é
acessada por um barramento exclusivo facilitando a transferência de dados entre os
dois.
Como podemos perceber a AMD utilizou tal recurso, pois ainda não dispõe de
tecnologia para implementação de quatro núcleos em uma única pastilha, mas tendo
em vista tal objetivo, esta plataforma poderá estar sendo condicionada a utilização
de processadores com tal capacidade, que transporia a esta plataforma ao trabalho
de oito núcleos trabalhando em paralelo.

Processador sun Niagara

Objetivo da empresa sun, é transformar processadores com maior


performance e menos custo de energia. Utilizando uma postura agressiva multi
cores, cada um capaz de executar quatro theadrs aplicando uma tecnologia CMT,
também adotar arquitetura UltraSPARC que economiza recursos menos necessários
compartilhando apenas uma unidade de ponto flutuantes entre todos as cores e
enfatiza fatores importantes para gerar um alto throughtup,como 4 unidades de
controle de memória DDR2 integrado.
O processador Sun Niagara ou UltraSPARC T1,é um processador que visa
atuar em servidores workload, como webservers e datacenters. Este tipo de
processador possui 8 tipos de cores de processamento que (são comercializado
versões de 4 a 6 cores). Onde cada um executa quatro theadrsde hardware
utilizando 32 theadrs.
10

A idéia do professor Kule Olukotun foi desenvolver processadores hydra CMP


(Multiprocessing). Pois a empresa afara websystems não pode continuar com seu
projeto por quer faltou caixa para manter, daí foi vendida em 2002 para SUM
MICROSYSTEMS onde o projeto foi na base Niagara.
A empresa Niagara tem objetivo de fazer processadores com altos valores de
performance em quanto mantem valores de energia razoáveis. A media de consumo
é 72W chegando até o pico de 79W. Tendo a sua arquitetura simples, com várias
cores de baixa freqüência, mas alto throughtup é o principal fator disso.
Entretanto o Niagara tem a suas limitações também, a sua limitação mais seria é o
fator de possuir apenas uma unidade de ponto flutuante (FPU) apenas 8 cores, e
assim é incapaz de processar mais que 1- 3% do ponto flutuantes.

CMT

Chipe-level multithreading é uma combinação de chip-level


multiprocessing(CMT) que processa diversas cores em um chip só. A vertical
multithreading (VMT) apenas umas das theadrs de cada cores para executar
instruções em um ciclo, trocando para outro thead quanto a thead ativa buscar
dados da memoria. Este tipo de técnica é utilizada pela sun, para minimizar a
eficiência de cada cores.
Todas as cores possui papiline de seis estágios, com instruções da cache L1,
uma data cache L1 é uma unidade de gerenciamento de memória que são
compartilhado pela 4 theadrs e todas as cores são ligada pela cache L2 , que é
compartilhado por todos. assim o sistema operacional enxergar 32 processamentos
virtuais.

Formatos de dados

A arquitetura UltraSPARC reconhece os seguintes tipos de dados inteiros,


com sinal ( 8,16,32 e 64 bits),SIMD (UNIT 8 de 32bits, int 16 de 64 bits,int 32 de 64
bits) e ponto flutuantes (32,64,e 128 bits). Acompanha esse tipo de dados os
11

seguintes comprimentos de palavras Byte(8 bits), meia – palavra (16 bits), a palavra
marcada ( valor de 30 bits e 2 bits de marcação), palavra dupla ex tendida(64bits) e
palavra quádrupla (128 bits).
Os inteiros com sinal são sinal completamente de dois, enquanto os inteiros sem
sinal são escritos usando – se toda sua extensão. Palavra Marcada Têm a marcação
de dois bits menos significativos Flutuantes tem sua representação normal (IEEE std
754 - 1985), alterando apenas expoente ({7;0}, {10;0} e {14;0}) e frações
({22;0},{52;32} + {31;0} e {111;96} + {95;64}
+ {63;32} + {31;0}), respectivamente para 32 ,64 , 128 bits de representação, cm
todas um bit sinal.

Memória

Com capacidade par executar theads simultaneamente, uma interface rápida de


acesso a memoria é extremamente importante para Niagara. Para suprir a alta
demanda de dados, o processador conta com quatro controladores de memoria
DDR2 integrado. A integrar o controlador de memoria com o processador, fazemos
com que ele funcione na mesma frequência do processador. Recebendo
informações da memoria muito mais rápida.

Cache

Um dos principais limitadores a velocidade de processamento é o tempo de


latência das memórias, que é o tempo despendido desde a solicitação de dados pelo
processador até o recebimento dos mesmos. Para diminuir os efeitos deste
problema existem os cache: memória pequena e rápida, em um nível mais próximo
ao processador, que servem para armazenar os dados e instruções com maior
probabilidade de serem solicitados pelo processador.
Cada core do processador Sun Niagara possui um L1 de 24KB, dividido em um
cache de instruções de 16 KB, com bloco de 32 B e um cache de dados de 8 KB,
12

com blocos de 16B, ambos four-way set associativa, com bloco de 64B, que é
compartilhado entre os 8 cores. Para manter a coerência de cache, é utilizada a
técnica de write – through.

Tendências evolutivas dos processadores: o que as empresas


planejam?

O aumento de velocidade na freqüência de execuções atribuídas ao


processador medida em gigahertz, esta se tornando defasada, dando lugar à
multiplicação dos núcleos de processamento. Obter dois núcleos não significa ter o
dobro de poder de processamento, mas permite utilizar várias tarefas ao mesmo
tempo com grande desempenho. Buscar um maior poder de processamento,
estabelecendo técnicas de aumento da freqüência e de números de transistores são
técnicas usadas nos processadores de único núcleo. Daí surge um problema, o
aquecimento do processador e o gerenciamento de energia.
A Intel utilizou em seu processador Dual Core uma tecnologia que são usadas
cinco portas de envio, pela qual são enviadas três microinstruções para unidade de
execução por pulso de clock, uma nova tendência da Intel é o uso real de 128 bits
no caminho de dados, nos processadores anteriores era de 64 bits, isto significa um
maior poder de processamento para manipulação de dados de 128 bits.
A AMD criou uma tecnologia chamada de HyperTranport que é uma
arquitetura de conexão direta com a memória principal, tendo um controlador de
memória DDR integrado facilitando o acesso rápido pelo processador. A arquitetura
de 64 bits interage com qualquer software, facilitando as aplicações de 64 bits, tanto
as aplicações de 32 quanto os de 64 bits são executadas de forma simultânea na
mesma plataforma.
O processador da AMD de duplo núcleo é diferente da arquitetura da Intel, os
processadores Athlon 64 e Opteron a ponte norte do chipset esta integrada dentro
do próprio processador, permitindo ao processador a troca de informações entre si
de forma paralela. Na arquitetura da Intel se um dos núcleos precisa enviar dados
para outro núcleo inicia-se um processo em que, ele tem que pedir permissão à
13

ponte norte, que esta localizada fora do processador, tendo como conseqüência o
acesso a uma velocidade menor.

Recursos e benefícios

A partir dos detalhes evidenciados acerca dos processadores de duplo-


núcleo, faz-se necessário um benchmark (comparação) entre essas CPU,
destacando algumas vantagens (e desvantagens) de um processador de dois ou
mais núcleos. Então, temos que o multiprocessamento é uma idéia antiga - afinal,
diz um velho ditado que "duas cabeças pensam melhor do que uma" -, mas a
criação de chips com múltiplos núcleos reflete a dificuldade de se aumentar ainda
mais a velocidade do processador sem implementar rebuscados (e caros) artifícios
para controlar o superaquecimento.
Em vista disso, a Intel cancelou o lançamento do Pentium 4 de 4GHz
(“Prescott”) e partiu para a linha Pentium D - e, mais adiante, para o Core2Duo. Em
linhas gerais, essa solução consiste em obter mais poder de processamento sem
elevar a freqüência de operação, investindo na distribuição das tarefas por dois
núcleos encapsulados numa mesma pastilha de silício.
Chips com dois ou mais núcleos (porque os quad-core não tardam a chegar)
apresentam algumas diferenças em relação aos da tecnologia anterior, sendo a
primeira delas nominal: a indicação de velocidade baseada em GHz deixa de fazer
sentido, porque os dois núcleos operam geralmente na mesma velocidade - mas seu
trabalho conjunto, combinado com o cache compartilhado, os torna mais eficientes
(enquanto um núcleo grava um CD, por exemplo, o outro pode rodar um game, com
comunicação total entre eles, ou edição de um vídeo, etc.). Isso sem mencionar que
o ganho não se limita apenas ao processamento: a interação entre os núcleos
consome menos energia, diminui a quantidade de calor dissipado e abre um leque
de soluções para os problemas que impediam o avanço dos microprocessadores: o
superaquecimento. Ao dividir tarefas com os dois núcleos, o processador produz o
calor padrão do seu clock (2,16 GHz, por exemplo) sem avançar na sua curva
geométrica de aquecimento.
14

Tudo indica que esse tipo de CPU deverá integrar a maioria dos desktops e
servidores a ser fabricado ao longo dos próximos anos. Nesse aspecto, um fator que
pode ser encarado como uma desvantagem é o custo alto para o consumidor final
destes produtos, que ainda estão em fase de desenvolvimento e disseminação no
mercado. E como deverá se tornar padrão (tanto para Intel quanto para AMD), essa
inovação acabará forçando os fabricantes a queimar seus estoques de chips
convencionais, visando preparar o mercado para a popularização das novas linhas
Core 2 Duo e Athlon X2.
Vale lembrar que o pleno aproveitamento dos chips de múltiplos núcleos
requer adequações em nível de software - a menos que os sistemas e aplicativos
sejam reescritos, os benefícios não são tão representativos assim. Se por exemplo,
tratarmos de um usuário que utiliza softwares “comuns” como um editor de textos,
uma planilha de dados, etc., o desempenho pode não ser tão evidenciado quanto
para outro usuário que trabalhe com edição de imagens ou jogos.

Outros fabricantes para montagem de servidores

Power6

A IBM lançou o processador Power6 para ser utilizado em servidores, é um


processador com 2 a 16 núcleos nas velocidades 3,50, 4,20 ou 4,70GHz. Essa
freqüência de clock é mais que o dobro da do Power5, o antecessor do novo chip. É,
também, mil vezes a freqüência de clock do primeiro IBM PC, lançado em 1981.
Aquele PC pioneiro rodava a 4,77 MHz. Além do clock mais rápido, o Power6 tem
cache interno de 8 MB, quatro vezes o do Power5. O Power6 possui um barramento
de dados ultra-rápido, o processador troca dados com a placa-mãe a uma
velocidade de até 300 GB/s.
Um servidor System p570 construído com esse chip já bateu 25 recordes de
desempenho. A empresa diz, ainda, que o novo processador, mesmo rodando a 4,7
GHz, consome a mesma quantidade de energia que o Power5 a 2,2 GHz.
Adicionalmente, o chip permite desacelerar o clock para poupar energia. O Power6
compete com os processadores da Sun e da Intel. Os concorrentes, porém,
15

concentraram-se em aumentar o número de núcleos. A Sun tem processadores


UltraSPARC T1 de 8 núcleos; e a Intel deve lançar o seu Xeon de 8 núcleos no
segundo semestre. A IBM, ao contrário, acelerou o clock e a transferência de dados,
mas manteve apenas dois núcleos no chip.

Anda mungkin juga menyukai