Meta ha dado a conocer la AI Research SuperCluster (RSC), una que de acuerdo con la compañía detrás de Facebook, es una de las supercomputadoras de IA más rápidas del mundo hasta hoy y que proyecta sea la más rápida una vez finalice su construcción a mediados de 2022.
Según detalla Meta, el estado actual de las IA actualmente es para tareas como la traducción de textos a distintos idiomas y para detectar contenido potencialmente dañino, pero las IAs de próxima generación requieren de supercomputadoras potentes, capaces de llevar a cabo hasta quintillones de operaciones por segundo.
Con esto los investigadores de IA en Meta buscan construir mejores modelos de IA que los existentes actualmente, que puedan aprender de trillones de ejemplos, capaces de trabajar en cientos de idiomas al mismo tiempo para traducciones de voz reales en simultáneo, analizar textos de forma eficiente, así como imágenes y videos al mismo tiempo, además de servir para desarrollar nuevas herramientas de realidad aumentada (RA) y más.
El trabajo también ayudará a facilitar la construcción de tecnologías enfocadas en el metaverso, donde las aplicaciones y productos impulsados por la IA serán un elemento principal.
Así es la supercomputadora de IA de Meta
El desarrollo de RSC comenzó aproximadamente hace un año y medio cuando se diseñaron los sistemas de refrigeración, energía, redes y cableado desde cero.
En específico la fase uno de RSC que ya se encuentra en funcionamiento cuenta con 760 NVIDIA DGX A100 cada uno con ocho GPU A100 y dos CPU AMD de 64 núcleos que dan un total de 6080 GPUs conectadas.
De acuerdo con la compañía ya está proporcionando un rendimiento de hasta 20 veces más rápido que su sistema anterior para ejecutar flujos de trabajo de visión artificial . En este caso la RSC se comunica con la estructura de red de alto rendimiento InfiniBand de NVIDIA Quantum-2, lo que ofrece 200 GB/s de ancho de banda.
En la parte del almacenamiento, va acompañada de 175 petabytes Pure Storage FlashArray, 46 petabytes de caché en sistemas Penguin Computing Altus y 10 petabytes de Pure Storage FlashBlade.
Se espera que antes de que termine 2022 se complete la fase dos de RSC con 16,000 GPUs, y que sea capaz de entrenar modelos de procesamiento de lenguaje natural con más de un trillón de parámetros al día en conjuntos de datos tan grandes como un exabyte, casi como 36,000 años de video de alta calidad y que reduzca estos tiempos a tres semanas en comparación con las nueve del sistema anterior.
En este momento la supercomputadora cuenta con una potencia de 1,895,000 teraflops (o 1.895 exaflops) y se estima alcanzar un potencial de casi 5 exaflops a mediados de 2022, con lo que tendrá una velocidad de más de 100,000 computadoras de escritorio.
De acuerdo con el sitio HPCwire, el sistema desarrollado por Meta, podría llegar a ocupar uno de los cinco primeros lugares en la lista Top500, la misma clasificación que pone a la supercomputadora Fugaku como la más poderosa hasta ahora, que en precisión de IA puede otorgar un rendimiento de un exaflop.
Hasta ahora , la supercomputadora de inteligencia artificial más rápida del mundo es la supercomputadora Perlmutter del Centro Nacional de Investigación Científica de la Energía (NERSC), con sede en el Laboratorio Nacional Lawrence Berkeley de California que puede dar hasta cuatro exaflops de rendimiento de IA.
Otros proyectos que están en desarrollo son el sistema Leonardo de EuroHPC que busca superar a la Perlmutter, y otros dos sistemas de E.U capaces de dar entre 1.5 y dos exaflops de rendimiento.
Datos reales de sus compañías, pero anónimos y encriptados
Meta también señala que este sistema está diseñado desde cero pensando en la privacidad y seguridad, y como para entrenarse requiere de datos del mundo real, utilizan la información generada por sus sistemas de producción que se encuentran encriptados.
RSC se encuentra aislado del Internet, sin conexiones directas de entrada o salida y el tráfico únicamente fluye por los servidores de producción de datos de Meta. También por cuestiones de seguridad, la compañía no ha revelado la ubicación de esta nueva instalación.
Además todos los datos pasan por un proceso de revisión de privacidad para confirmar que se han anonimizado correctamente, mientras que las claves de descifrado se van eliminando regularmente para garantizar que la información no es accesible.