GPU: la tendencia de los datacenters del siglo 21

Servidores de GPU

Servidores de GPU

El aumento de la popularidad de la informática con GPU ha dado lugar a una nueva generación de plataformas de servidor. 

El movimiento tiene dos locomotoras: NVIDIA y AMD

Las unidades de procesamiento de gráficos (GPU) modernas están reemplazando a las unidades de procesamiento central (CPU) típicas de la computación en paralelo.

El aprendizaje automático, las redes neuronales, el reconocimiento de voz e imágenes, el modelado matemático, la visualización en juegos y el diseño son tareas para los servidores GPU.

La gama de opciones es enorme: mientras que la “Premier League” está dominando el NVIDIA DGX A100 de gama alta  con un  rendimiento de 5 petaflops y un costo de $ 200K, los usuarios comunes se las arreglan con plataformas democráticas basadas en NVIDIA A10 / A30 / A40 y aceleradores A4000 / A5000 / A6000.

Los procesadores AMD EPYC son ideales para servidores GPU . 

Tienen hasta 64 núcleos y 128 carriles PCIe Gen4. 

No es una coincidencia que NVIDIA esté  transfiriendo sus servidores a AMD EPYC . 

Los Intel Xeon SP de segunda generación actuales tienen hasta 28 núcleos y 48 carriles PCIe Gen3. 

La tercera generación de Intel Xeon SP, que aparecerá en otoño, tendrá 64 carriles PCIe Gen 4.

Tanto en tecnológica como económicamente, AMD tiene una ventaja.

Cómo funcionan las plataformas gráficas

Hay muchas variaciones de plataformas de GPU en el mercado en uno y dos AMD EPYC para un número diferente de aceleradores de GPU. También hay dos Intel Xeon SP. 

La opción más productiva puede considerarse la proporción de cuatro GPU por una central.

Estos incluyen el servidor de un solo procesador ASUS ESC4000A-E10 basado en AMD EPYC. 

Tiene capacidad para cuatro GPU de doble ancho u ocho de ancho simple.

Servidores GPU desde el interior

La plataforma de 2U tiene un diseño de “compartimiento”.

Servidores GPU desde el interior

Los aceleradores de GPU para la instalación en servidores difieren de los domésticos: tienen doble ancho versus casi triple, soplado longitudinal (turbina) en lugar de ventiladores con eliminación de calor lateral.

Servidores GPU desde el interior

Antes de instalarse en un servidor, las GPU se montan en pares en casetes.

Servidores GPU desde el interior

La plataforma de 2U es lo suficientemente alta para acomodar cuatro Graphics Processing Unit horizontalmente.

El diagrama de bloques muestra el suministro de líneas de bus para conectar no solo GPU, sino también controladores periféricos y SSD NVMe.

Servidores GPU desde el interior

Interés de la prueba

Detengámonos en las tareas de visualización en diseño, producción de video, juegos, aplicaciones de realidad aumentada. 

Queremos comprobar cómo el escalado de GPU afecta el cálculo de escenas complejas, agregando GPU al sistema. 

Usemos los programas de renderizado estándar.

V-Ray

El renderizado de V-Ray funciona como un complemento para Autodesk 3ds Max, Cinema 4D, SketchUp, Rhino, Revit, ArchiCAD, Maya, Blender y muchos más. 

Diseñado y optimizado por los creadores para aprovechar al máximo todos los componentes de hardware: CPU, GPU, RAM, almacenamiento, redes y placa base.

La CPU y la GPU se pueden usar simultáneamente con V-Ray, por ejemplo, los núcleos de la CPU para renderizarse y la Graphics Processing Unit para la reducción de ruido y los efectos ópticos.

O viceversa, V-Ray se ejecuta en tarjetas gráficas, pero usa la CPU para calcular el GI de la caché de Light.

El renderizado híbrido de V-Ray Graphics Processing Unit es posible donde los componentes de Graphics Processing Unit y CPU pueden renderizarse al mismo tiempo.

El desarrollador ofrece un conjunto de pruebas V-Ray Benchmark  para evaluar las capacidades de una estación de trabajo bajo V-Ray.

Render de octano

Este es un renderizador en tiempo real que usa CUDA y se ejecuta en las Graphics Processing Unit nVidia. Construido sobre trazado de rayos. 

Admite y escala el rendimiento en varias configuraciones de Graphics Processing Unit. 

La aceleración es más notable en escenas difíciles. 

La utilidad RTX OctaneBench se utiliza para realizar pruebas .

Redshift

Redshift , un potente renderizador acelerado por Graphics Processing Unit, ofrece una variedad de funciones y se integra con aplicaciones CG estándar. La versión de demostración es funcionalmente idéntica a la comercial, es gratuita, contiene complementos para Maya, 3dsMax, Softimage, C4D, Houdini, Katana.

Banco de pruebas

En términos generales, las aplicaciones profesionales deben utilizar aceleradores de gráficos profesionales de NVidia. 

Por ejemplo, A6000 en lugar de RTX3090.

A los consumidores les encantan las tarjetas RTX 3090 Turbo: de doble ancho, con turbina, caben en servidores Graphics Processing Unit en pocas piezas.

Este no es el caso de las versiones para consumidores del RTX 3090.

NVidia no soportó la canibalización de las ventas de su propio “servidor verdadero” Graphics Processing Unit Аxxx durante mucho tiempo.

Han pasado seis meses y se “recomendó encarecidamente” a los fabricantes que dejen de lanzar versiones turbo del RTX 3090. De hecho, nuestras pruebas son un “acuerdo desmovilizado” del RTX 3090 Turbo. 

En un servidor con 4 Graphics Processing Unit, apagamos los aceleradores a su vez para evaluar la caída del rendimiento.

Pruebas

En un servidor con 4 Graphics Processing Unit, apagamos los aceleradores a su vez para evaluar la caída del rendimiento.

Graphics Processing Unit (GPU)

Servidores GPU

Servidores GPU

V-Ray y OctaneBench muestran una escala de rendimiento casi lineal basada en la cantidad de Graphics Processing Unit activas.

En RedShift, agregar una Graphics Processing Unit no da como resultado una reducción proporcional en los tiempos de renderizado, pero son evidentes ahorros de tiempo significativos. 

Al renderizar escenas complejas que requieren muchas horas de cálculos, cada hora cuenta.

Redoblando la apuesta

Si hablamos de una Graphics Processing Unit por servidor (estación de trabajo), no es difícil elegir una solución constructiva.

Pero para dos, y mucho menos para cuatro Graphics Processing Unit, se necesita una plataforma especializada.

Cuando las cuatro Graphics Processing Unit están funcionando a plena potencia, están a más de 80 ° C.

No solo las turbinas de las Graphics Processing Unit en sí, sino también los sistemas de refrigeración del servidor deben tener una “reserva de energía” para los ventiladores, dado el alto temperatura ambiente y calor generado por otros componentes. 

Estos servidores son ruidosos y consumen mucha energía. En nuestro caso, una fuente de alimentación de 1600 W fue suficiente de punta a punta. 

Tiene sentido elegir plataformas con fuentes de alimentación más potentes, por ejemplo, 2200 vatios.

Cargamos el servidor con renderizado. En otras áreas de la computación GPU, los efectos serán diferentes. 

La elección de aceleradores de la oferta NVIDIA A10 / A30 / A40 y A4000 / A5000 / A6000 dicta las tareas.

Una cosa está clara: las GPU se están volviendo más populares y la demanda de servidores GPU está creciendo de manera constante. 

El formato 2U / 1 x AMD EPYC / 2… 4 GPU es el más democrático y demandado de ellos.

 

Por Marcelo Lozano – General Publisher IT Connect Latam

95 / 100