com
Procesadores multi-ncleo
Edgar Miraya Anamara (edmiraya@yahoo.com)
1.
2.
3.
4.
5.
6.
7.
8.
Introduccin
Panorama Actual
Descripcin inicial
Antecedentes de los procesadores multincleo
Ejemplos de procesadores multincleo
Futuro de los procesadores multincleo
Conclusiones
Glosario
1.
Introduccin
La presente monografa trata el tema de los procesadores multincleo, dando un panorama de
porque se decidi fabricarlos, sus antecedentes, como trabajan. Adems se muestra algunos
procesadores multi-ncleos actuales, de Intel, de AMD. Se ha puesto nfasis en el procesador
Cell, por su potencial y su capacidad.
Este trabajo pretende dar una vista amplia de los procesadores multincleo. Para mayores
detalles se puede consultar la bibliografa.
2.
Panorama Actual
La fuerte competencia en el mundo de los procesadores, especialmente entre Intel y AMD, ha
producido que la tecnologa actual de fabricacin de procesadores esta llegando a sus lmites.
Cada vez la miniaturizacin de los componentes del procesador es ms difcil (el lmite de
construccin del silicio ronda los 15-20nm, donde el silicio empieza a ceder por falta de
consistencia, ya se ha llegado a los 65nm), el problema de la generacin de calor a aumentado,
produciendo que sea ms difcil aumentar la frecuencia principal del procesador. Todos estos
problemas dificultan el aumento de rendimiento de los procesadores.
Los procesadores actuales no sobrepasan los 3.8 GHz (obtenido por el Pentium 4 Prescott),
necesitan grandes disipadores y ventiladores porque generan mucho calor. No se poda continuar
fabricando procesadores de la misma manera, se estaba llegando a un estancamiento; era
necesario tomar otro camino, utilizar otra variable que hiciera que el rendimiento del procesador
aumentar. Entonces, basndose en el procesamiento en paralelo, se empezaron a construir los
procesadores multi-ncleo.
3.
Descripcin inicial
Los procesadores multi-ncleo son un procesador que contiene dentro de su empaque a varios
ncleos o cerebros. La mayora de los procesadores son mono-ncleo, o sea tienen un solo
cerebro. Mientras un procesador mono-ncleo tiene un solo cerebro para ejecutar procesos, un
procesador multi-ncleo puede repartir los procesos entre sus varios cerebros para su posterior
ejecucin.
Es como cuando a una persona le dan muchos trabajos por hacer, si otro lo ayuda entre los dos
pueden dividirse el trabajo y terminar ms rpido. Si los dos les toca hacer un solo trabajo, si este
es divisible, entonces los dos lo tambin lo harn mas rpido. Pero si el trabajo no es divisible,
entonces en ese caso uno solo lo hara.
Por eso las aplicaciones que sacan ms provecho de estos procesadores multincleo son
aquellas que pueden generar muchos hilos de ejecucin (thread) como las aplicaciones de
audio/video, clculo cientfico, juegos, tratamiento de grficos en 3D, etc.
Pero de todas maneras siempre hay aplicaciones que no se dividen en hilos de ejecucin, que no
aprovechan por completo estos procesadores. Pero estos procesadores pueden ejecutar varias
de estas aplicaciones al mismo tiempo.
Solo cuando uno ejecute una sola aplicacin que no sea paralelizable (no se pueda descomponer
en hilos) es cuando no se aprovecha el potencial de procesamiento que tienen estos
procesadores.
Actualmente muchos programas son poco paralelizables (excepto en los sectores donde se usan
supercomputadoras, sistemas distribuidos y paralelos, etc.), pero se pueden ejecutar muchos de
ellos a la vez. Con el auge de estos procesadores, saldrn aplicaciones ms paralelizables.
Como historia se puede decir que el primer procesador multincleo en el mercado fue el IBM
Power 4 en el ao 2000. Una alternativa a los procesadores multincleo son los sistemas
multiprocesadores, que consisten en una placa madre que poda soportar desde 2 a ms
procesadores. El rendimiento es bastante bueno, pero tambin es bastante caro.
4.
Los dos procesadores lgicos, que posee el procesador hyperthreading, tienen su propio estado
de la arquitectura: registros de control, registros de datos, registros de depuracin, etc. y el APIC
(controlador avanzado de interrupcin programable). Los dos procesadores lgicos comparten la
memoria cach, la interfaz del bus del sistema, etc.
5.
Para Servidores, AMD sac el procesador Opteron X2, que se basaba tambin en el Opteron de
un solo ncleo, el hermano mayor de los Athlon 64.
Para Porttiles AMD ha sacado el Turion X2, que lleva el poder de los procesadores de doble
ncleo al campo de los mviles.
AMD fue el primero en sacar la tecnologa de 64 bits, y tambin fue la primera en sacar los
procesadores de doble ncleo para servidores, porttiles y computadoras de escritorio. Han
tenido un gran xito, pero con la aparicin de los Core 2 Duo de Intel, basados en su exitoso
Pentium M Centrino, la iniciativa vuelve a las manos de Intel en todos los frentes. Hay que
esperar a que AMD saque sus nuevos procesadores K8L, de 4 ncleos y con tecnologas
mejoradas, como el HyperTransport 3 y una cach L3.
Procesador CELL
El procesador Cell, es un procesador multi-ncleo diseado por las empresas IBM, Sony y
Toshiba desde el marzo del 2001. Este procesador va a ser usado inicialmente por la PlayStation
3, pero se tiene previsto usarlo tambin en los productos electrnicos que fabrican estas
empresas, que van desde televisores de alta definicin hasta ordenadores.
Los componentes del procesador son:
1 Power Processor Element (PPE).
8 Synergistic Processor Elements (SPEs).
Bus de Interconexin de los Elementos (EIB).
Controlador de Acceso Directo a Memoria (DMAC).
2 Controladores de Memoria Rambus XDR.
Una interfaz Rambus FlexIO (Input / Output).
El PPE es el ncleo principal, este se encarga de coordinar el trabajo de todos los dems ncleos
(SPEs), mediante la tecnologa SMT (Simoultaneous Multi-Threading). El PPC toma el control del
sistema operativo y deja a los SPEs el trabajo de los dems procesos.
EL PPE esta basado en la arquitectura PowerPC de 64 bits, tiene 32 KB de cach L1 y 512 KB
de cach L2, tiene tambin tecnologa de doble hilo y puede ejecutar dos instrucciones por hilo.
Este procesador esta hecho como los RISC clsicos, o sea no es como los PowerPC
tradicionales, por eso no tiene implementado la prediccin de saltos, y la ejecucin de
instrucciones es en orden; lo que ahorra una cantidad considerable de transistores, pasando todo
ese trabajo al compilador.
Los SPE son los procesadores auxiliares, son unidades de clculo vectorial. Pueden ejecutar
hasta dos instrucciones por ciclo. Cada SPE tiene 128 registros de 128 bits cada uno, 4 unidades
de coma flotante, 4 unidades aritmticas enteras y una memoria local de 256 KB (esta memoria
es SRAM como las memorias cach, pero no es una de ellas). Al no utilizar memoria cach, se
simplifica el diseo del SPE. Los SPEs tienen memoria local para tomar los datos que requieren
ms rpidamente.
El bus de interconexin de elementos, EIB, esta compuesto por 4 canales de datos de 128 bits,
permite la comunicacin entre todos los elementos del procesador, permite tambin cargar y
mover 16GB de datos por segundo hacia y fuera del Cell respectivamente. Para mantener lleno
este ancho de banda, el procesador Cell utiliza en sus controladores de I/O y la memoria las
tecnologas diseadas por la empresa Rambus (conocida por haber fabricado las veloces
memorias RAM para Pentium 4, las RIMM, que no tuvieron aceptacin en el mercado). La
memoria XDR de Rambus es bastante rpida, llegando a velocidades 12 veces superiores a las
memorias convencionales de 533Mhz actuales.
La velocidad a la que llega es de 4.8Ghz. La tecnologa FlexIO, tambin de Rambus, es una
interface de entrada y salida bastante rpida. Esta constituido por 12 conexiones punto a punto
unidireccionales de 1byte, 7 de estas conexiones son de salida y 5 son de entrada. El FlexIO
puede tener una velocidad desde 400Mhz hasta 8GHz.
El chip Cell ha ahorrado muchos transistores al no implementar cach para los SPEs, ejecucin
fuera de orden, prediccin de saltos, etc., dejando todo ese trabajo al compilador; con el fin de
poner mas procesadores (SPEs) lo que aumenta el poder de procesamiento, y adems para que
el chip sea ms sencillo y gaste menos energa. Este chip es un monstruo con sus 234 millones
de transistores, la mayora dedicados al poder de procesamiento por lo anteriormente expuesto, y
como utiliza muchos cerebros, la generacin de calor se disemina por todo el procesador.
Otras caractersticas de este procesador son:
Fabricacin en 90nm (nanmetros).
Frecuencia de trabajo desde 3.2 GHz.
1,3 Voltios.
7.
-
Conclusiones
Los procesadores AMD e Intel multincleo seguirn mejorando, pues llevan compatibilidad
con las instrucciones x86. Las empresas de desarrollo de software se vern obligadas, por
motivos competitivos, a desarrollar software que aproveche el procesamiento paralelo que
tienen estos procesadores. Estos les generar gastos de desarrollo mayores de los
normales.
En cambio el procesador Cell tiene ms problemas, porque no es compatible con el software
existente. Es difcil que las empresas de software hagan programas para el Cell, por el
enorme costo de desarrollo que implica. Pero fue una buena idea ponerlo en la consola
PlayStation 3, porque ello generar una enorme cantidad de programadores, provenientes
de las industrias de juegos, que quieran aprovechar todo el potencial que tiene.
El rendimiento de los procesadores ha tomado nuevo aliento, despus de dejar de avanzar
en MHz. Con esta tecnologa se puede seguir mejorando el rendimiento durante un buen
tiempo.
Dentro de poco, las personas normales tendremos el poder de cmputo que tenan los
supercomputadores hace algunos aos. (Se dice que 4 procesadores Cell tienen el poder
equivalente a la supercomputadora ms poderosa de EEUU de hace solo 10 aos).
8.
Glosario
Procesador CELL
http://www.idg.es/pcworld/conocimiento/pdfs/PCWORLD_NT219.pdf
http://www.faq-mac.com/mt/archives/011150.php
http://www.faq-mac.com/mt/archives/011228.php
http://barrapunto.com/journal.pl?op=display&uid=19560&id=15379
http://www.blachford.info/computer/Cell/Cell1_v2.html
http://www.pcwla.com/pcwla2.nsf/articulos/0AB6B09F7369E0A500257060004D9E08
http://www.help400.es/asp/scripts/nwart.asp?Num=159&Pag=24&Tip=M
http://www.computeridea.net/Actualidad/An%C3%A1lisis/Inform
%C3%A1tica_personal/Hardware/20050413015/1
http://sanatox.f2o.org/?cat=9
http://www.rambus.com
Procesadores y Tecnologa INTEL
http://www.intel.com
http://www.intel.com/support/sp/processors/pentium4/pentium4_ht.htm
http://www.active-hardware.com/spanish/reviews/processor/3Ghz.htm
http://www.canal-ar.com.ar/Noticias/NoticiaMuestra.asp?Id=3396
http://www.fayerwayer.com/archivo/2006/07/que_tal_es_el_intel_core_duo_2.php
http://es.wikipedia.org/wiki/Intel_Pentium_M
Procesadores AMD
http://www.amd.com/
es.wikipedia.org/wiki/AMD64
http://www.meristation.com/v3/des_noticia.php?pic=HRD&id=cw4471c55c7e8db
Informacin General
http://www.atc.uniovi.es/inf_med_oviedo/3iccrp/Transparencias/1-Hardware%20del%20PC.pdf
http://www.lcc.uma.es/~pedre/Trabajos_MP/29_Nuevos_Microprocesadores.pdf
http://www.fdi.ucm.es/profesor/sdelpino/ETC/historia.pdf
http://www.jeuazarru.com/docs/procesadores_dual_core.pdf
http://arstechnica.com/news.ars/post/20060407-6556.html
http://www.macuarium.com/foro/lofiversion/index.php/t108847-0.html
http://cum.unex.es/Profes/profes/jlguisado/materiales_ec_teoria/Trabajos%20monograficos
%202005-2006/Paralelismo%20a%20nivel%20de%20thread%20-%20grupo%202.ppt
http://www.arcos.inf.uc3m.es/~jdaniel/seminarios/ssooa06/tendencias-proc.ppt