20 de noviembre de 2024

AMD vuelve a potenciar la supercomputadora más veloz del mundo

Escucha este Artículo

AMD reafirmó su liderazgo en computación de alto rendimiento (HPC) durante el evento Supercomputing 2024, superando por sexta vez consecutiva con la supercomputadora más rápida del mundo según la lista Top500. La supercomputadora El Capitan, ubicada en el Laboratorio Nacional Lawrence Livermore (LLNL), funciona con APUs AMD Instinct™ MI300A y fue construida por Hewlett Packard Enterprise (HPE), alcanzando una puntuación de High-Performance Linpack (HPL) de 1,742 exaflops en la última lista Top500.

El Capitan y el sistema Frontier del Laboratorio Nacional de Oak Ridge se ubicaron en las posiciones 18 y 22, respectivamente, en la lista Green500. Esto destaca las notables capacidades de los procesadores AMD EPYC y las GPU AMD Instinct para ofrecer un rendimiento líder y eficiencia energética en cargas de trabajo de HPC.

“Estamos encantados de ver a El Capitan convertirse en el segundo superordenador con tecnología AMD en romper la barrera del exaflop y convertirse en el más rápido del mundo. Mostrando el increíble rendimiento y eficiencia de las APU AMD Instinct MI300, esta innovadora máquina es un testimonio del trabajo dedicado entre AMD, LLNL y HPE.” dijo Forrest Norrod, vicepresidente ejecutivo y gerente general de AMD. “En AMD, estamos impulsando el futuro de la informática con un rendimiento y unas capacidades líderes que seguirán definiendo la convergencia de la HPC y la IA en los próximos años.”

«El Capitan es crucial para la misión principal de la Administración Nacional de Seguridad Nuclear (NSA, por sus siglas en inglés) y refuerza significativamente nuestra capacidad para realizar grandes conjuntos de simulaciones 3D de alta fidelidad que abordan los intrincados desafíos científicos que enfrenta la misión,»

dijo Rob Neely, director del programa de Simulación y Computación Avanzada del LLNL.

Bronis R. de Supinski, director de tecnología de LLNL para Livermore Computing, comenta: «Con las APU AMD Instinct MI300A, hemos desarrollado un sistema que era inimaginable hasta ahora, empujando los límites del rendimiento computacional mientras mantenemos una eficiencia energética notable. A medida que la inteligencia artificial se vuelve más común en nuestro campo, El Capitan nos facilita la integración de la IA con nuestras tareas tradicionales de simulación y modelado, abriendo así nuevas oportunidades para descubrimientos en diversas áreas científicas.»

AMD: impulsando el HPC y la IA

Los motores de cómputo de AMD continúan impulsando las supercomputadoras más importantes y ofrecen un rendimiento excepcional para la computación técnica para empresas y laboratorios nacionales de todo el mundo.

Los últimos procesadores AMD EPYC™ Serie 9005 son las mejores CPU de servidor para empresas, IA y nube[i], ya que proporcionan hasta un 37% más de rendimiento de IPC generacional para cargas de trabajo de HPC e IA[ii]. Estos procesadores también proporcionan un tiempo de obtención de información hasta 3,9 veces más rápido en comparación con la competencia de las aplicaciones científicas y de HPC que resuelven los problemas más desafiantes del mundo[iii].

Los aceleradores AMD Instinct proporcionan un rendimiento líder para el centro de datos, a cualquier escala, desde soluciones de IA hasta supercomputadoras de clase Exascale. Los aceleradores AMD Instinct MI300X y MI325X permiten el rendimiento y las capacidades de memoria de la IA líderes, mientras que la APU AMD Instinct MI300A reúne los núcleos de CPU y GPU, así como la memoria apilada, en un solo paquete, lo que permite nuevos niveles de eficiencia y rendimiento para las cargas de trabajo de HPC e IA.

Además, los procesadores AMD EPYC y los aceleradores AMD Instinct se están utilizando para impulsar muchos proyectos e implementaciones nuevos de supercomputación e inteligencia artificial, entre los que se incluyen:

  • Eni, la compañía energética italiana, anunció recientemente la supercomputadora HPC 6 impulsada por CPU AMD EPYC y GPU AMD Instinct. HPC 6 es uno de los superordenadores más potentes del mundo dedicado a aplicaciones industriales y ahora es el quinto superordenador más rápido del mundo.
  • La Universidad de Paderborn está en proceso de recibir e instalar una nueva supercomputadora impulsada por las últimas CPU AMD EPYC de 5ª generación.
  • Sigma2 AS reemplazará dos de las tres supercomputadoras de propiedad nacional en Noruega con un sistema HPE Cray Supercomputing EX impulsado por CPU AMD EPYC de 5ª generación. Cuando esté completamente instalado, se espera que este superordenador sea el sistema más rápido de Noruega. 
  • IBM y AMD han anunciado una colaboración para desplegar los aceleradores AMD Instinct MI300X como servicio en IBM Cloud. Esta oferta, que se espera que esté disponible en la primera mitad de 2025, tiene como objetivo mejorar el rendimiento y la eficiencia energética de los modelos de IA Gen, como las aplicaciones informáticas de alto rendimiento para clientes empresariales. La colaboración también permitirá el soporte para los aceleradores AMD Instinct MI300X dentro de la plataforma de datos y IA watsonx de IBM, así como el soporte de inferencia de IA de Red Hat® Enterprise Linux®.
  • Las APU AMD Instinct MI300A también alimentarán un sistema de supercomputadora de próxima generación para los Institutos Nacionales de Ciencia y Tecnología Cuántica (QST) de Japón. El sistema, construido por NEC Corporation, utilizará 280 APU AMD Instinct MI300A para impulsar la IA y la investigación científica para los Institutos Nacionales de Ciencia y Tecnología Cuántica y el Instituto Nacional de Ciencia de Fusión.

Liderando la era de la exaescala

Como la única empresa que impulsa múltiples supercomputadoras a exaescala, AMD sigue liderando en rendimiento y eficiencia energética para instalaciones HPC globales.

El Capitan, la supercomputadora más potente del mundo y la primera de su clase para la Administración Nacional de Seguridad Nuclear (NNSA), se erige como el principal recurso informático para los Tri-Labs: LLNL, Los Álamos y Sandia National Laboratories. Su propósito es avanzar en el descubrimiento científico y la seguridad nacional, ofreciendo la potencia computacional necesaria para asegurar la seguridad y fiabilidad de la disuasión nuclear del país sin realizar pruebas. Este sistema de última generación representa un avance monumental en HPC, permitiendo capacidades sin precedentes de modelado y simulación esenciales para el Programa Stockpile Stewardship de la NNSA, que certifica el almacenamiento nuclear envejecido y otras misiones críticas como la no proliferación y la lucha contra el terrorismo.

El LLNL y los demás Tri-Labs también utilizan El Capitan y su sistema complementario, Tuolumne, para impulsar el análisis de datos asistido por IA y aprendizaje automático, avanzando los objetivos del LLNL de crear modelos científicos rápidos, precisos y capaces de cuantificar la incertidumbre en sus predicciones. El Capitan aplicará la IA a problemas de alta densidad energética, como la investigación de la fusión por confinamiento inercial, mientras que Tuolumne se destinará a aplicaciones de ciencia abierta no clasificadas, como el modelado climático, la bioseguridad/descubrimiento de fármacos y el modelado de terremotos.

Más allá de El Capitan, AMD y HPE también impulsan la primera supercomputadora a exaescala, Frontier. Ubicada en el Laboratorio Nacional de Oak Ridge y equipada con CPU AMD EPYC y GPU AMD Instinct, Frontier es la segunda computadora más rápida del mundo con 1,35 exaflops de rendimiento. Frontier sigue permitiendo a los investigadores enfrentar problemas científicos complejos, desde el modelado climático y la investigación biomédica hasta el entrenamiento de grandes modelos de lenguaje, demostrando su valiosa contribución al avance de los descubrimientos científicos e impulsando los avances en IA.

Estos sistemas líderes proporcionan una inmensa potencia computacional que contribuye significativamente a una amplia gama de investigaciones, incluyendo la ciencia de los materiales, el modelado climático y el desarrollo de modelos de IA. Al empoderar a los investigadores en diversos campos y avanzar en el desarrollo de modelos de IA, El Capitan y Frontier están moldeando el futuro de la ciencia y la tecnología, permitiendo soluciones para abordar problemas críticos globales, lo que subraya el compromiso de AMD de proporcionar recursos computacionales de alto rendimiento necesarios para impulsar la próxima generación de descubrimientos científicos e innovación.

Visita el stand #2731 de AMD en Supercomputing 2024 para obtener más información sobre las soluciones de AMD para HPC y conversar con los expertos de AMD.

Recursos de apoyo 

Acerca de AMD

Durante más de 50 años, AMD ha impulsado la innovación en tecnologías de computación, gráficos y visualización de alto rendimiento. Miles de millones de personas, empresas líderes de la lista Fortune 500 e instituciones de investigación científica de vanguardia de todo el mundo confían en la tecnología AMD a diario para mejorar la forma en que viven, trabajan y juegan. Los empleados de AMD se centran en crear productos de liderazgo, de alto rendimiento y adaptables que superen los límites de lo que es posible. Para obtener más información sobre cómo AMD está permitiendo el presente e inspirando el mañana, visita el sitio web, el blog,  LinkedIn y las páginas X de AMD (NASDAQ: AMD).  


[i] EPYC-029C: Comparación basada en la densidad de subprocesos, el rendimiento, las características, la tecnología de procesos y las características de seguridad integradas de los servidores que se envían actualmente a partir del 10/10/2024. Las CPU de la serie EPYC 9005 ofrecen la densidad de subprocesos más alta [EPYC-025B], lideran la industria con 500+ récords mundiales de rendimiento [EPYC-023F], con récord mundial de rendimiento, liderazgo empresarial, rendimiento de operaciones de Java®/seg [EPYCWR-20241010-260], liderazgo superior de HPC con rendimiento de rendimiento de punto flotante [EPYCWR-2024-1010-381], rendimiento de extremo a extremo de IA con rendimiento TPCx-AI [EPYCWR-2024-1010-525] y puntuaciones de eficiencia energética más altas [EPYCWR-20241010-326]. La serie EPYC de 5ª generación también tiene un 50 % más de canales de memoria DDR5 [EPYC-033C] con un 70 % más de ancho de banda de memoria [EPYC-032C] y admite un 70 % más de carriles PCIe® Gen5 para el rendimiento de E/S [EPYC-035C], tiene hasta 5 veces la caché/núcleo L3 [EPYC-043C] para un acceso más rápido a los datos, utiliza tecnología avanzada de 3-4 nm y ofrece funciones de seguridad de cifrado seguro + virtualización cifrada segura (SEV) + estado cifrado SEV + paginación anidada SEV-Secure. Consulta el informe técnico de la arquitectura AMD EPYC (https://library.amd.com/l/3f4587d147382e2/) para obtener más información.

 

[ii] 9xx5-001: Basado en pruebas internas de AMD a partir del 9/10/2024, mejora del rendimiento geomedio (IPC) a frecuencia fija.

– Aumento generacional del IPC de las cargas de trabajo de servidor empresarial y en la nube de EPYC EPYC de 5.170x (geomedia) utilizando un conjunto seleccionado de 36 cargas de trabajo y es la geomedia de las puntuaciones estimadas para el total y todos los subconjuntos de SPECrate®2017_int_base (geomedia), puntuaciones estimadas para el total y todos los subconjuntos de SPECrate®2017_fp_base (geomedia), puntuaciones para las operaciones máximas por segundo de Java Java del lado del servidor,  cargas de trabajo representativas del servidor en la nube (geomean) y cargas de trabajo representativas del servidor Enterprise (geomean).

Configuración «Genoa» (todos los NPS1): EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD en 12+1), FF 3GHz, 12x DDR5-4800 (2Rx4 64GB), 32Gbps xGMI;

Configuración «Turín» (todos los NPS1): EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD en 12+1), FF 3GHz, 12x DDR5-6000 (2Rx4 64GB), 32Gbps xGMI

Utilizando el determinismo de rendimiento y el regulador de rendimiento en Ubuntu® 22.04 con sistema operativo de kernel genérico 6.8.0-40 para todas las cargas de trabajo.

– Aumento de IPC de las cargas de trabajo de servidor ML/HPC generacionales de EPYC de 5.ª generación de 1,369x (geomedia) utilizando un conjunto selecto de 24 cargas de trabajo y es la geomedia de las cargas de trabajo representativas del servidor ML (geomedia) y las cargas de trabajo representativas del servidor HPC (geomedia).

Configuración «Génova» (todos los NPS1) Configuración «Génova»: EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD en 12+1), FF 3GHz, 12x DDR5-4800 (2Rx4 64GB), 32Gbps xGMI;

Configuración «Turín» (todos los NPS1): EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD en 12+1), FF 3GHz, 12x DDR5-6000 (2Rx4 64GB), 32Gbps xGMI

Utilizando el determinismo de rendimiento y el regulador de rendimiento en Ubuntu 22.04 con sistema operativo de kernel genérico 6.8.0-40 para todas las cargas de trabajo excepto LAMMPS, HPCG, NAMD, OpenFOAM, Gromacs que utilizan 24.04 con kernel genérico 6.8.0-40.

SPEC® y SPECrate® son marcas comerciales registradas de Standard Performance Evaluation Corporation. Más información en spec.org.

[iii] 9xx5-022: Fuente: https://www.amd.com/content/dam/amd/en/documents/epyc-technical-docs/performance-briefs/amd-epyc-9005-pb-gromacs.pdf