Nvidia anuncia la supercomputadora DGX GH200 para los modelos gigantes de IA generativa y el procesamiento de datos
Nvidia ha anunciado la nueva supercomputadora DGX GH200, diseñada para el desarrollo de "modelos gigantes" que potencian la Inteligencia Artificial (IA) generativa, y enfocada a los sistemas de recomendación y las cargas de trabajo de análisis de datos, que estará disponible a finales de 2023.
La compañía tecnológica ha destacado que la IA generativa, los modelos de lenguaje extensos y los sistemas de recomendación "son los motores digitales de la economía moderna". En este sentido, han creado una supercomputadora capaz de llevar a cabo las funciones necesarias para desarrollar este tipo de tecnología.
Así, Nvidia ha presentado su nuevo modelo de supercomputadora DGX GH200, que cuenta con 256 superchips GH200 que combinan con las tecnología de interconexión NVLink y NVLink Switch System para funcionar como una sola GPU.
Gracias a ello, la supercomputadora es capaz de alcanzar un exaflop de rendimiento, es decir, un trillón de operaciones de punto flotante por segundo. Asimismo, consigue 144 terabytes de memoria compartida, esto es casi 500 veces más memoria que la generación anterior de Nvidia DGX A100, tal y como ha detallado la compañía en un comunicado en su web.
En concreto, Nvidia ha explicado que el uso de los superchips GH200 junto con la tecnología NVLink elimina la necesidad de una conexión tradicional de CPU a GPU. Esto se debe a que, con el chip Nvidia NVLink-C2C, se posibilita que cada superchip combine una CPU Nvidia Grace, basada en la arquitectura de 32 bits ARM, con una GPU Nvidia H100 Tensor Core en el mismo paquete.
De esta forma, con la tecnología NVLink se aumenta hasta siete veces el ancho de banda entre la GPU y la CPU, en comparación con la conexión tradicional de CPU a GPU. Asimismo, reduce el consumo de energía de interconexión en más de cinco veces y proporciona un bloque de construcción de GPU de arquitectura Hopper de 600 GB.
Además de todo ello, el modelo DGX GH200 es el primero que combina los superchips Grace Hopper (GH) con la NVLink Switch System, por lo que se trata de una nueva interconexión que posibilita que todas las GPU de los superchips funcionen juntas como una sola GPU. De hecho, esto permite que la nueva supercomputadora proporcione un ancho de banda NVLink 48 veces mayor que en la generación anterior.
Según Nvidia, con este diseño se permite "conseguir la potencia de una supercomputadora de IA masiva con la simplicidad de programar una sola GPU".
Igualmente, la compañía ha subrayado que algunas grandes tecnológicas se encuentran entre las primeras del sector que tendrán a la supercomputadora DGX GH200, como son Google Cloud, Meta y Microsoft, para explorar sus capacidades para cargas de trabajo de IA generativa.
Tal y como detalló el vicepresidente de Cómputo en Google Cloud, Mark Lohmeyer, "la nueva escala NVLink y la memoria compartida de los superchips Grace Hopper abordan los cuellos de botella clave en la IA a gran escala".
Asimismo, el vicepresidente corporativo de Azure Infrastructure en Microsoft, Girish Bablani, ha resaltado que el potencial de DGX GH200 para trabajar con conjuntos de datos del tamaño de un terabyte "permitiría a los desarrolladores realizar investigaciones avanzadas a mayor escala y velocidades aceleradas".
Siguiendo esta línea, Nvidia también se plantea proporcionar el diseño de este modelo para los proveedores de servicios en la nube y "otros hiperescaladores", de manera que puedan "personalizarlo aún más para su infraestructura". Y se espera que la supercomputadora DGX GH200 esté disponible a finales de este año 2023.
Supercomputadora helios
Por otra parte, la compañía tecnológica también ha anunciado que está fabricando su propia supercomputadora de IA basada en la tecnología de DGX GH200, Nvidia Helios, con el objetivo de potenciar el trabajo de sus propios investigadores.
Nvidia Helios cuenta con cuatro sistemas DGX GH200 e impulsará el rendimiento de datos de cara a entrenar a grandes modelos de IA. Para ello, se conectará cada sistema DGX GH200 con la red Nvidia Quantum-2 InfiniBand. Con todo ello, la supercomputadora Helios contará con 1.024 superchips Grace Hopper y también se espera que esté disponible a finales de año.