25 de noviembre de 2024

Lo que podemos aprender de la eficiencia energética de las supercomputadoras

Escucha este Artículo

Por: Juan Moscoso, Datacenter y Cloud Manager de AMD para Sudamérica de habla hispana

La supercomputación solía limitarse al ámbito de las tareas científicas intensivas de investigación, como el análisis de grandes cantidades de datos para resolver problemas médicos, del medio ambiente y de infraestructura. 

Sin embargo, debido a acontecimientos como la pandemia por COVID-19, y la evolución hacia tecnologías basadas en la nube, inteligencia artificial (IA), el aprendizaje automático (ML) y el cómputo de alto rendimiento (HPC), utilizado por supercomputadoras y clústers de computación para resolver problemas avanzados, estas han empezado a abrirse paso en su utilización en las empresas.

Al igual que el cómputo en la nube para las empresas creó nuevas formas de relacionarse con los clientes y permitió una forma de trabajo más flexible, la supercomputación está creando posibilidades de avances innovadores al acelerar la velocidad de R&D y el desarrollo de productos en orden de magnitud.

Naturalmente, algunas empresas siguen siendo escépticas al HPC y opinan que estas tecnologías no serán relevantes para las operaciones cotidianas en los próximos años. No obstante, al igual que la infraestructura hiperconvergente y la infraestructura de escritorio virtual (VDI), esta tecnología aparentemente futurista ya está dando forma al futuro de las empresas.

En última instancia, el HPC puede utilizarse como indicador de las tecnologías que se filtrarán en el espacio «civil» con el paso del tiempo.Por ejemplo, si determinadas CPU y GPU se implantan cada vez más en el espacio del HPC, es una buena señal de que pronto llegarán al sector empresarial y al mercado medio.

Prestar atención a estas tecnologías a tiempo puede ayudar a las organización a mantenerse a la vanguardia de la innovación, y a adelantarse a sus competidores. Después de todo, los usuarios de HPC pertenecen al grupo de clientes de adopción temprana y buscan utilizar las tecnologías más recientes y rápidas antes que las empresas, que están siendo más cautelosas, las adquieran.

Eficiencia energética

Podrías pensar que «eficiencia energética» y «supercomputación» son términos que no van de la mano. Después de todo, muchas de estas máquinas requieren más de un megavatio de electricidad para funcionar, y los costos anuales de electricidad pueden ascender fácilmente a millones de dólares.

Sin embargo, la nueva generación de supercomputadoras no sólo está ayudando a las organizaciones a ser más respetuosas con el planeta, ya que ofrecen un impresionante rendimiento por vatio, sino que también se están utilizando para desarrollar la próxima generación de productos y soluciones de bajo consumo energético, para ayudar a reducir el grado de cambio climático.

Tomemos como ejemplo a Frontier, una supercomputadora alimentada por CPUs AMD EPYC™ de 3a Generación y Aceleradores AMD Instinct™ , para ofrecer más de 1,5 exaflops de potencia máxima de procesamiento. Esta supercomputadora, no solo ocupa el primer puesto en la última entrega de la lista Top500, sino que también encabeza la lista más reciente de Green500, que mide la eficiencia energética de estas supercomputadoras.

Mientras que la anterior máquina más importante de Green500, MN-3 en Japón, ofrecía 39,38 gigaflops por vatio, Frontier, que fue fabricada por HPE para el Laboratorio Nacional Oak Ridge del Departamento de Energía de EE. UU, alcanza 62,68 gigaflops por vatio. Esto significa que los Procesadores AMD EPYC™ y los Aceleradores AMD Instinct alimentan ahora algunas de las supercomputadoras más eficientes del mundo.

Lumi, una máquina de pre-exaescala situada en el Centro de Tecnologías de la Información para la Ciencia (CSC) de Kajaani (Finlandia), también se sitúa como una de las supercomputadoras de mayor eficiencia energética del mundo, con una relación gigaflops/vatios de 51,6. Esta máquina utiliza una tecnología similar a la de Frontier, con su CPU AMD EPYC™ y cuatro Aceleradores AMD Instinct MI250X por nodo. Esto genera que Lumi tenga un rendimiento actual de 151 petaflops, según la lista Top500, y tiene un rendimiento máximo teórico de más de 550 petaflops por segundo.

Pero, lo que hace que estas máquinas sean especialmente interesantes, es la naturaleza de la memoria coherente de la CPU EPYC de tercera generación optimizada y la GPU MI250X. Al admitir la memoria coherente CPU-GPU, por la que una copia de los datos es procesada por la CPU y la GPU, se utiliza menos energía para leer/escribir los datos de la memoria del sistema, lo que ayuda a que las supercomputadoras superiores funcionen con mayor eficiencia.

Este es un excelente ejemplo de una tecnología innovadora que, dentro de unos años, probablemente empezará a aparecer en el mercado de los servidores. Además, esto significa que las CPUs y las GPUs no tendrán que malgastar energía trabajando con dos conjuntos de datos, sino que también facilita la vida a los desarrolladores de software, que podrán escribir código unificado para las CPUs y las GPUs. 

Además, Lumi cuenta con una innovadora «tecnología de refrigeración gratuita» que permite utilizar el calor residual en la red de calefacción urbana de Kajaani. Esta tecnología reducirá la huella de carbono anual de toda la ciudad en 12.400 toneladas[1].

La refrigeración de los centros de datos puede suponer hasta el 40% de su consumo total de energía[2], pero si se utilizan flujos de aire naturales en la refrigeración, y se evita la recirculación de aire caliente, como hace Lumi, los operadores de los centros de datos pueden reducir el uso de energía y ayudar a reducir las emisiones asociadas.   

¿Qué podemos aprender?

La creación de una empresa más sostenible se ha convertido en una prioridad clave para las organizaciones y, en la actualidad, cada vez son más las empresas que se fijan objetivos de eficiencia climática y/o energética. Para esas organizaciones, hay lecciones que aprender de las tecnologías innovadoras que emplean algunas de las supercomputadoras más rápidas del mundo, especialmente las que cuentan con tecnología de AMD. 

Por ejemplo, la propia investigación de AMD ha demostrado que para ofrecer 1200 VMS, se necesitan diez servidores AMD EPYC 7713 de doble socket frente a 15 servidores basados en Intel Xeon Platinum 8380 de doble socket, lo que se traduce en una reducción del uso de energía de aproximadamente un 32% y un ahorro estimado de 70 toneladas métricas de emisiones de gases de efecto invernadero. Además, con más núcleos por zócalo y más núcleos por servidor, es más fácil incluir más potencia de procesamiento en un servidor ágil de doble o un solo socket, lo que permite reducir aún más el número de servidores y las huellas.

AMD se encuentra en un punto donde no sólo está a la vanguardia de la innovación en HPC y la eficiencia energética, sino que además tiene ambiciones aún mayores para el futuro, con el objetivo de aumentar la eficiencia energética de los Procesadores AMD y los Aceleradores de GPU Instinct 30 veces, de 2020 a 2025. Esto representa una aceleración de 2,5 veces las tendencias de la industria de 2015 a 2020, y una reducción del 97% en el uso de energía por cálculo durante este período[3].

Tanto los líderes empresariales como los informáticos pueden beneficiarse de prestar atención a las últimas novedades en el mundo de las supercomputadoras actuales, que van más allá del alto rendimiento y la escala, y allanan el camino para los métodos de computación de próxima generación y las cargas de trabajo como la IA, impulsando una alta eficiencia energética para ayudar a la sostenibilidad del medio ambiente.

Aunque «supercomputación» todavía no sea un término que esté en la mente de las organizaciones, está claro que el HPC se está convirtiendo rápidamente en una herramienta para las empresas modernas que buscan mantenerse a la vanguardia en el mercado competitivo actual. Y las CPU de AMD que están detrás de esta tecnología podrían dar forma al futuro de su infraestructura de TI.

  1. https://lumi-supercomputer.eu/sustainable-future/

  2. https://ec.europa.eu/research-and-innovation/en/horizon-magazine/cooler-data-centres-help-take-heat-electric-bills#:~:text=3.2%25%20by%202030.-,Cooling%20data%20centres%20can%20take%20up%20to%2040%25%20of%20their,continuously%2C%27%20he%20said.

  3. EPYC-028A: A partir del 2/2/22, de los resultados de SPECpower_ssj® 2008 publicados en el sitio web de SPEC, las 55 publicaciones con los resultados más altos de eficiencia global estaban todas equipadas con Procesadores AMD EPYC. Consulte la lista en https://www.amd.com/en/claims/epyc3x#faq-EPYC-028. Más información sobre SPEC® en http://www.spec.org. SPEC y SPECpower son marcas registradas de Standard Performance Evaluation Corporation