Anda di halaman 1dari 7

Sistemas de alto rendimiento

Introduccin a Windows Compute Cluster Server


John Kelbley and Doug Lindsey

Resumen:

Usar clsteres para resolver problemas complejos


Requisitos generales para clsteres de clculo
Configurar un clster de clculo basado en Windows
Ejecutar comandos de forma remota

Los sistemas de alto rendimiento HPC, High Performance Computing hacen referencia a una rama de la computacin aplicada que se centra
fundamentalmente en la solucin de problemas que hacen un uso intensivo del clculo. Hace unos aos, los sistemas de alto rendimiento a
los que se haca referencia habitualmente como "supercomputacin" estaban dominados por
sistemas grandes y especializados costosos que se encontraban principalmente en centros de investigacin. No obstante, a medida que la
capacidad de clculo de los sistemas pequeos ha aumentado, ha cambiado la relacin costorendimiento y las cargas de clculo se han
desplazado a los sistemas de PC.
Muchos problemas de clculo intensivo se pueden solucionar mediante la realizacin de clculos en paralelo, es decir, un clculo o proceso
concreto no puede depender del resultado de otro para completarse. En casos como ste, los problemas grandes pueden sacar partido de
mltiples sistemas de menor tamao nodos agrupados en clsteres de clculo. A continuacin se indican algunos ejemplos de los tipos de
aplicaciones que aprovechan los clsteres de clculo:

Modelos financieros: un algoritmo o una frmula se ejecutan miles de veces cada una de ella con datos distintos.
Ingeniera: simulacin de los efectos en piezas individuales, aplicacin de texturas a modelos.
Animacin informtica: aplicacin de efectos de textura e iluminacin a cada fotograma de una pelcula.

Los clsteres de clculo proporcionan una forma econmica de solucionar problemas complejos en un breve perodo de tiempo. Como ver,
Microsoft proporciona funcionalidad y asistencia claves para los clsteres de clculo con Windows Compute Cluster Server 2003.
Es importante entender que un clster de clculo es distinto de un clster de disponibilidad conmutacin por error. Puede que ya est
familiarizado con los clsteres de disponibilidad para Exchange, SQL Server u otras aplicaciones en Windows Server 2003. Normalmente
aprovechan el almacenamiento compartido para maximizar el tiempo de actividad de las aplicaciones. La finalidad de los clsteres de clculo
no es reanudar el trabajo de otro sistema si se produce una interrupcin, sino permitir que todos los nodos funcionen de un modo
coordinado.

Requisitos generales para un clster de clculo


Recursos de HPC

Comunidad de HPC de Windows


Sistemas de alto rendimiento con WCCS 2003
Introduccin a la informtica de 64 bits de Microsoft
Inicio de servidores de Microsoft
Compute Cluster Server TechCenter
Gua paso a paso para instalar, configurar y optimizar una implementacin de clsteres de clculo de alto rendimiento

Los sistemas modernos de HPC comparten algunos elementos clave que facilitan el procesamiento de cargas de trabajo. Para comenzar, se
necesitan varios sistemas. Tambin se necesita un programador que coordine las asignaciones de trabajo en los nodos. El programador se
ejecuta en el nodo encargado el nodo principal e identifica los recursos disponibles, asigna y distribuye tareas y realiza el seguimiento del
estado general de los trabajos. Es el coordinador de recursos en el clster de sistemas as como el punto al que los usuarios y administradores
envan los trabajos para su procesamiento.
Los clsteres requieren un medio de comunicacin entre los nodos. Segn el tipo del trabajo, los nodos pueden necesitar interconexiones de
alta velocidad y latencia baja para pasarse mensajes entre s con el fin de coordinar el procesamiento. Como mnimo, cada nodo de clculo y
el nodo principal deben estar conectados a una red comn.
Una gran cantidad de sistemas interconectados que trabajan juntos para solucionar problemas complejos tambin necesita atencin. Se
necesitan procesos y herramientas dirigidos al aprovisionamiento, la supervisin, la administracin y el mantenimiento de decenas a
centenares o miles de sistemas para garantizar un entorno coherente y estable.
Finalmente, y ms importante, se debe disponer de aplicaciones que puedan aprovechar las capacidades de procesamiento en paralelo de un
clster de clculo. Sin aplicaciones que puedan dividir los trabajos para que se puedan procesar en varios equipos o herramientas de
desarrollo que incluyan compatibilidad con un "depurador en paralelo", poco puede hacer un clster aparte de calentar la sala de equipos.
Agrupacin en clsteres basada en Windows Server
En 2006, Microsoft present Windows Server 2003 Compute Cluster Edition CCE y Windows Compute Cluster Server 2003 WCCS para
satisfacer las necesidades de una amplia gama de aplicaciones HPC. CCE y WCCS se basan en el mismo Windows Server 2003 con que el que
ya est familiarizado. CCE es una versin de Windows Server 2003 con licencia para su uso con aplicaciones HPC. WCCS es idntico a CCE con
la adicin de Microsoft Compute Cluster Pack CCP. Esto significa que puede implementar, administrar, supervisar y mantener un clster
basado en Windows Server con las mismas herramientas que ya usa para administrar sistemas Windows Server 2003 existentes.
Un punto clave que se debe tener en cuenta es que CCE y WCCS slo estn disponibles en versin x64. No hay versin de 32bits x86 de
estos productos. Los requisitos de hardware para CCE y WCCS son idnticos a los de Windows Server 2003 Standard x64 Edition. Adems de
admitir hardware de alto rendimiento arquitectura de 64bits, los productos incluyen compatibilidad con el acceso remoto directo a memoria
RDMA, Remote Direct Memory Access para las interconexiones de alto rendimiento Gigabit Ethernet, InfiniBand, Myrinet y otros.

Compute Cluster Pack


Tal como se ha mencionado anteriormente, los clsteres de clculo tienen algunos requisitos bsicos que se pueden cumplir con la instalacin
de Compute Cluster Pack. CCP es un paquete independiente de instalacin que incluye:

Programador de trabajos integrado


Compatibilidad con Interfaz de transferencia de mensajes MPI, Messaging Passing Interface para el estndar MPICH2
Administracin de recursos de clster y herramientas de usuario

CCP es el diferenciador clave entre CCE y WCCS. Tal vez se pregunte el motivo de que, si los clsteres de clculo necesitan estos componentes,
slo estn incluidos en WCCS y no en CCE. La respuesta es que algunas soluciones HPC aprovechan distintos programadores de trabajos o
MIP especializadas o no requieren compatibilidad con MPI y simplemente requieren una plataforma excepcional en la que se puedan
ejecutar, como Windows Server 2003. Como CCP es un paquete estndar, se puede instalar en otras versiones x64 de Windows Server 2003
CCE, Standard, Standard R2, Enterprise y Enterprise R2.

Datos bsicos
WCCS aprovecha los elementos fundamentales y clave de Windows para simplificar la administracin y el funcionamiento de los clsteres
basados en Windows, incluido Active Directory y Servicios de instalacin remota RIS, Remote Installation Services. Compute Cluster Server
usa Active Directory para administrar la seguridad de un modo transparente. Con Active Directory, un usuario puede enviar un trabajo al nodo
principal con un nico conjunto de credenciales que se puede ejecutar en centenares de nodos de servidor. Cuando los trabajos se ejecutan
en uno o varios nodos de clculo, se ejecutan en el contexto de las credenciales de usuario proporcionadas al enviar el trabajo y, en lo
sucesivo, se almacenan en cach de forma segura. WCCS se basa en Active Directory para proporcionar esta funcionalidad de "punto nico de
inicio de sesin". Una ventaja adicional de que Active Directory se encuentre en el entorno reside en el hecho de que la directiva de servidor y
configuracin se puede administrar de forma centralizada mediante la directiva de grupo.
Si su organizacin de TI ya tiene Active Directory implementado, puede ahorrar un tiempo considerable y esfuerzos administrativos si crea el
clster en el dominio existente. Es el escenario recomendado.
Si necesita implementar un clster de clculo en un entorno donde no existe Active Directory, una prctica recomendada es implementar uno
o varios controladores de dominio dedicados para hospedar Active Directory para el clster. Es muy habitual convertir el nodo principal en un
controlador de dominio de Active Directory, ya que todos los nodos ya tienen conectividad de red al sistema, independientemente de la
topologa de red. No obstante, no se recomienda convertir el nodo principal en controlador de dominio para clsteres a gran escala debido a
la mayor carga en dicho nodo. Se deben seguir las prcticas habituales para la implementacin y la administracin de Active Directory
instalacin de controladores de dominio redundantes, copias de seguridad adecuadas, buenas prcticas de seguridad, etc..

Servicio de instalacin remota


WCCS proporciona un frontend integrado para la plataforma de implementacin de imgenes del servicio de instalacin remota de
Microsoft. RIS se usa para implementar imgenes de sistema operativo desde el nodo principal a cada uno de los nodos de clculo, lo que
significa que puede usar RIS para instalar nuevos nodos de clster rpidamente. No tiene que hacerlo de esta forma, ya que, por comodidad,
RIS est integrado en WCSS. Tambin se pueden usar otras tecnologas de implementacin de Windows Server habituales, como Windows
Server 2003 Automated Deployment Services ADS o una instalacin manual de Windows Server 2003.
Si desea usar RIS, antes de instalar CCP en el nodo principal, asegrese de que tiene definidos dos discos lgicos como mnimo. RIS requiere
un disco independiente del sistema operativo para el almacenamiento de las imgenes de servidor. La particin de RIS debe disponer de
suficiente espacio libre en disco para almacenar una o varias copias completas de una imagen de Windows Server.
El hardware de servidor ms reciente, en concreto el destinado a redes y almacenamiento, puede requerir controladores Plug and Play que no
se incluyen en las imgenes de Windows Server 2003 predeterminadas. En este caso, necesitar agregar estos controladores a la imagen
manualmente. El procedimiento para hacerlo est documentado en lnea en support.microsoft.com/kb/254078.

Instalacin del clster


El primer paso es configurar el cerebro del clster: el nodo principal. Empiece con la instalacin de una de las versiones x64 de Windows
Server 2003 indicadas anteriormente. Durante la instalacin del sistema operativo, elija si unir el servidor a un dominio existente
recomendado o si instalar Active Directory en el servidor no recomendado para clsteres a gran escala.
Despus instalar el sistema operativo, asegrese de que tambin ha descargado e instalado todas las correcciones recomendadas desde
Microsoft Update. Si planea usar RIS para la creacin de imgenes de nodo de clculo, deber usar la herramienta administrativa
Administracin de equipos | Administracin de discos para asegurarse de que tiene definidos dos discos lgicos como mnimo. Por cuestiones
de espacio, no trataremos la instalacin basada en RIS en este artculo.
Despus de haber iniciado la sesin correctamente y haber actualizado el servidor, se ejecuta el programa de instalacin de CCP. El programa
de instalacin de CCP instalar o le guiar por la descarga e instalacin de los siguientes archivos y actualizaciones de requisitos previos:

Revisin de RIS consulte go.microsoft.com/fwlink/?linkid=55167


Microsoft Management Console MMC 3.0 consulte go.microsoft.com/fwlink/?linkid=62400
SQL Server Desktop Edition, que se instala como parte del proceso de instalacin del nodo principal de Compute Cluster Server 2003
Microsoft .NET Framework 2.0

El programa de instalacin de CCP lleva a cabo un trabajo excepcional al evaluar la preparacin del sistema para la instalacin. Le indicar los
componentes que son necesarios y que se instalan como parte del proceso, y los instalar, tal como se muestra en la Figura1.

Figura 1Componentes requeridos para la instalacin de CCPHacer clic en la imagen para ampliarla

Lista de tareas pendientes


Cuando termina la instalacin de CCP, se iniciar la consola del administrador, con el enfoque en la lista de tareas pendientes. Tal como se
muestra en la Figura2, la lista de tareas pendientes incluye varios paneles, cada uno para un rea distinta y en el que se enumeran las tareas
para completar la configuracin del clster.
Figura 2La lista de tareas pendientes muestra lo que se debe hacer para configurar el clsterHacer clic en la imagen para ampliarla
La lista de tareas pendientes permite implementar fcilmente la arquitectura de clster que ha diseado, incluida la seleccin y configuracin
de la topologa de red, el proceso de instalacin de nodos y el modelo de administracin de usuarios. Las tareas de cada uno de los paneles
se enumeran en la parte derecha y cada tarea inicia un asistente. Complete cada tarea en secuencia para configurar totalmente un nodo
principal que est preparado para implementar imgenes RIS en un conjunto conocido de nodos de clculo y que un conjunto definido de
usuarios pueda administrarlo y tener acceso a l.
Topologa de red WCCS es compatible con las cinco topologas de red ms habituales que se usan en HPC. Como mnimo, todos los nodos de
clculo y el nodo principal deben compartir una red comn. Las topologas incluyen compatibilidad con varios tipos de interconexiones entre
los nodos y tienen distintas ventajas y costos.
La topologa de red depender de los requisitos de rendimiento, seguridad e implementacin para el clster. Por ejemplo, puede que la
aplicacin requiera una interconexin de alta velocidad para la transmisin de mensajes que no desea exponer en la red corporativa. Tal vez
desea aprovechar las capacidades de implementacin integrada, basada en RIS y automatizada. Quizs el software que ha elegido slo puede
aceptar una sola NIC o, posiblemente, desea que el nodo principal ejecute Conexin compartida a Internet ICS, Internet Connection Sharing
para administrar la resolucin de nombres y el direccionamiento de los nodos de clculo. El asistente "Configurar la topologa de red de
clster" invocado desde la lista de tareas pendientes presentar las cinco topologas normalmente compatibles con las implementaciones de
HPC y le ayudar a configurar las conexiones de red, incluidas las configuraciones de Firewall de Windows en el nodo principal y en los nodos
de clculo. En la Figura3 se muestra una de las topologas de red admitidas.
Figura 3Una de las topologas de red WCCS admitidasHacer clic en la imagen para ampliarla
Servicio de instalacin remota Tal como se ha indicado anteriormente, RIS permite la implementacin automtica de los nodos de clster.
Administracin de nodos Tiene la capacidad de especificar los nombres de equipo de los servidores que sern nodos de clculo en este
clster. Cuando CCP se ejecuta en un nodo, en este momento se especifica el nodo principal del clster al que se unir dicho nodo.
Administracin de usuarios Aqu puede especificar las cuentas de usuario o grupos de Active Directory que se designarn como usuarios del
clster.

Instalacin de nodos
La implementacin de nodos de clculo se puede realizar automticamente mediante la utilidad de administracin RIS u otros mtodos de
implementacin admitidos. Al igual que sucede con el nodo principal, el CCP se debe instalar en cada nodo de clculo. Tal como muestra la
Figura4, las opciones de configuracin de la instalacin de CCP son mucho ms simples para un nodo de clculo y son las siguientes:

Figura 4Instalacin de Compute Cluster PackHacer clic en la imagen para ampliarla

Especificacin de que el servidor debe ser un nodo de clculo y no un nodo principal.


Especificacin del nombre del nodo principal del clster al que debe unirse el servidor.
Especificacin de si se instalarn las herramientas administrativas y de usuario en el nodo de clculo.

Consola de administrador
Despus de que los nodos estn en comunicacin con el nodo principal, la mayora de las tareas de administracin de todos los sistemas se
pueden llevar a cabo mediante la consola del administrador, que se muestra en la Figura5. La consola proporciona una vista central del
clster entero, incluida una lista de todos los nodos asociados, acceso a acciones administrativas clave y otros detalles. El panel situado ms a
la izquierda proporciona navegacin de alto nivel por la consola, incluido el acceso al "Administrador de clsteres" que, cuando est
resaltado, proporciona una pgina de resumen que muestra el estado de clster y las estadsticas de trabajo. El acceso a todas las sesiones de
escritorio remoto y de monitor de sistema se puede administrar desde aqu, pero la mayor parte del tiempo de administracin del clster se
realizar con "Administracin de nodos".
Figura 5La consola del administrador ofrece una vista de todo el clsterHacer clic en la imagen para ampliarla
Debe explorar la consola del administrador por su cuenta, ya que proporciona acceso a herramientas y funciones clave necesarias para
administrar Windows y los nodos de clster de forma centralizada. Al hacer clic una vez en un nodo de clster del panel central superior se
rellenarn otras ventanas y podr empezar a explorar las funciones especficas del nodo.
Las funciones admitidas del men contextual permiten administrar fcilmente nodos de clculo de forma centralizada desde Administracin
de nodos. Puede usar Administracin de nodos para pausar y reanudar nodos, aprobar nodos para el clster o quitarlos de l, iniciar
escritorios remotos, el monitor de sistema o el visor de eventos, o bien expulsar la bandeja del CD lo que puede resultar muy til cuando se
intenta identificar fsicamente un equipo individual en un clster grande.

ClusRun, una herramienta interesante


La caracterstica ms interesante de esta lista es "Comando Ejecutar", es decir, la capacidad de ejecutar un comando arbitrario de forma
remota, como si se estuviera delante del smbolo del sistema del equipo de destino. WCCS incluye una versin de la lnea de comandos de la
caracterstica Comando Ejecutar denominada Clusrun.exe y "ClusRun" se usa para describir tanto la versin GUI como la de la lnea de
comandos.
No se puede poner demasiado nfasis en las ventajas de la utilidad ClusRun, en concreto en un clster grande. Ahorra mucho tiempo al
ejecutar tareas repetitivas de la lnea de comandos y normalmente puede eliminar la necesidad de escribir scripts administrativos complejos.
Para usar esta caracterstica, resalte una lista de equipos en los que desee ejecutar un comando, haga clic con el botn secundario del mouse
y seleccione Comando Ejecutar. Se muestra el cuadro de dilogo de la Figura6. Ahora escriba el comando que desee, haga clic en Ejecutar y
espere a que el resultado se muestre en la ventana de resultados. Se le pedirn las credenciales la primera vez que use ClusRun, pero puede
optar por almacenarlas en cach para su uso posterior.

Figura 6Puede ejecutar un comando en mltiples nodosHacer clic en la imagen para ampliarla
Una forma habitual de aplicar revisiones a los clsteres o de instalar programas que incluyan rutinas de instalacin automatizadas consiste en
colocarlos en un recurso compartido de red y, a continuacin, usar ClusRun para que todos los nodos de clculo invoquen el comando. El
reinicio de todos los nodos de clculo del clster entero se puede realizar mediante un solo comando:

CLUSRUNSHUTDOWNRFT0

Paquete de herramientas
En mayo de 2007, el equipo de HPC lanz Compute Cluster Pack Tool Pack se puede obtener en lnea en
windowshpc.net/resources/Pages/default.aspx. El paquete de herramientas incluye compatibilidad con Windows PowerShellTM, una
herramienta MPIPingPong para diagnosticar el estado de conectividad y un monitor de clster grfico muy simple pero muy til.
Tal como se muestra en la Figura7, Simple Cluster Monitor puede mostrar en una pantalla cada uno de los nodos del clster, el nmero de
ncleos que tiene cada uno, el uso de cada CPU verde brillante, el uso de memoria amarillo, el porcentaje de tiempo de disco rojo y el uso
del ancho de banda naranja. Es una excepcional herramienta rpida que los administradores pueden ejecutar para ver el funcionamiento del
clster.

Figura 7Supervisin de varios nodos con Simple Cluster MonitorHacer clic en la imagen para ampliarla
El monitor de clster tambin incluye la funcionalidad de "uso remoto". Debe ejecutar la primera instancia del monitor de clster en el nodo
principal. No obstante, si ejecuta una instancia del monitor de clster en una sesin de consola en el nodo principal, tendr la oportunidad de
iniciar instancias del monitor de clster desde una estacin de trabajo, dirigirlas al nodo principal y obtener la misma presentacin.

A qu est esperando?
Ahora ya dispone de conocimientos de HPC y Windows Server 2003 Compute Cluster Server. Sabe cmo instalar CCP, ha visto la excepcional
consola integral y dispone de nuevos comandos y herramientas grficas con los que puede impresionar a sus colegas y usuarios. Encontrar
fuentes de informacin adicional acerca de los sistemas de alto rendimiento en la barra lateral "Recursos de HPC".

John Kelbley es director de productos tcnicos de Microsoft en el equipo de tecnologa de soluciones globales en el noroeste de EE.UU.
Puede ponerse en contacto con John en la direccin Johnkel@microsoft.com
Doug Lindsey es director de programas en el equipo de Microsoft HPC. Tambin es administrador de clsteres de clculo de produccin
incluido en el nmero 116 de la lista de noviembre de 2007 en www.top500.org. Puede ponerse en contacto con Doug en la direccin
Dougli@microsoft.com.
2008 Microsoft Corporation and CMP Media, LLC. Reservados todos los derechos; queda prohibida la reproduccin parcial o total sin previa
autorizacin.

2017 Microsoft