¿Qué es una UNP o NPU? ¿Y por qué es clave para desbloquear la IA generativa en tus dispositivos?
La revolución de la inteligencia artificial generativa (IA) ha llegado. Con la creciente demanda de casos de uso de IA generativa en industrias con diversas necesidades y requisitos informáticos, existe una clara necesidad de arquitecturas informáticas modernizadas y diseñadas a medida para la IA.
Esto comienza con unidades de procesamiento neuronal (NPU) diseñadas desde cero para la IA generativa, utilizando una combinación heterogénea de procesadores, como unidades centrales de procesamiento (CPU) y unidades de procesamiento de gráficos (GPU). Al utilizar NPU y procesadores compatibles, la computación heterogénea mejora el rendimiento de las aplicaciones, la eficiencia térmica y la duración de la batería, lo que permite experiencias de IA generativa nuevas y avanzadas.
Figura 1: Elegir el procesador adecuado, como elegir la herramienta adecuada en una caja de herramientas, depende de muchos factores y mejora las experiencias generativas de IA
¿Por qué es importante la computación heterogénea?
Debido a los diversos requisitos y demandas computacionales de la IA generativa, se necesitan diferentes procesadores. Una arquitectura informática heterogénea con diversidad de procesamiento permite utilizar los puntos fuertes de cada procesador, una NPU diseñada a medida centrada en la IA, junto con la CPU y la GPU, cada una destacada en diferentes dominios de tareas. Por ejemplo, la CPU para control secuencial e inmediatez, la GPU para transmisión de datos paralelos y la NPU para cargas de trabajo centrales de IA con matemáticas escalares, vectoriales y tensoriales.
La computación heterogénea maximiza el rendimiento de las aplicaciones, la eficiencia térmica del dispositivo y la duración de la batería para maximizar las experiencias generativas del usuario final con IA.
Figura 2: Las NPU han evolucionado con los cambiantes casos de uso y modelos de IA para lograr un alto rendimiento con bajo consumo de energía
¿Qué es una NPU?
La NPU está construida desde cero para acelerar la inferencia de IA a baja potencia, y su arquitectura ha evolucionado junto con el desarrollo de nuevos algoritmos, modelos y casos de uso de IA. Las cargas de trabajo de IA consisten en calcular capas de redes neuronales de matemáticas escalares, vectoriales y tensoriales seguidas de una función de activación no lineal. Un diseño de NPU superior toma las decisiones de diseño correctas para manejar estas cargas de trabajo de IA y está estrechamente alineado con la dirección de la industria de la IA.
Figura 3: El motor de IA de Qualcomm consta de la NPU Qualcomm Hexagon, la GPU Qualcomm Adreno, la CPU Qualcomm Kryo o Qualcomm Oryon, Qualcomm Sensing Hub y el subsistema de memoria
Nuestra NPU líder y solución informática heterogénea
Qualcomm está permitiendo la computación inteligente en todas partes. Nuestra NPU Qualcomm Hexagon, líder en la industria, está diseñada para una inferencia de IA sostenida y de alto rendimiento a bajo consumo. Lo que diferencia a nuestra NPU es nuestro enfoque de sistema, diseño personalizado y rápida innovación. Al diseñar de forma personalizada la NPU y controlar la arquitectura del conjunto de instrucciones (ISA), podemos evolucionar y ampliar rápidamente el diseño para abordar los cuellos de botella y optimizar el rendimiento.
La NPU Hexagon es un procesador clave en nuestra arquitectura informática heterogénea, la mejor de su clase, Qualcomm AI Engine, que también incluye la GPU Qualcomm Adreno, la CPU Qualcomm Kryo o Qualcomm Oryon, Qualcomm Sensing Hub y el subsistema de memoria. Estos procesadores están diseñados para trabajar juntos y ejecutar aplicaciones de IA de manera rápida y eficiente en el dispositivo.
Nuestro desempeño líder en la industria en pruebas comparativas de IA y aplicaciones reales de IA generativa lo ejemplifica. Consulta el siguiente documento técnico para profundizar en nuestra NPU, nuestros otros procesadores heterogéneos y nuestro rendimiento de IA líder en la industria en Snapdragon 8 Gen 3 y Snapdragon X Elite.
Figura 4: Qualcomm AI Stack tiene como objetivo ayudar a los desarrolladores a escribir una vez y ejecutar en todas partes, logrando escala
Permitir a los desarrolladores acelerar las aplicaciones de IA generativa
Permitimos a los desarrolladores centrándonos en la facilidad de desarrollo e implementación en los miles de millones de dispositivos en todo el mundo impulsados por las plataformas Qualcomm y Snapdragon. Con Qualcomm AI Stack, los desarrolladores pueden crear, optimizar e implementar sus aplicaciones de IA en nuestro hardware, escribirlas una vez e implementarlas en diferentes productos y segmentos utilizando nuestras soluciones de chipset.
La combinación de liderazgo tecnológico, diseños de silicio personalizados, optimización de la IA de pila completa y habilitación del ecosistema distingue a Qualcomm Technologies para impulsar el desarrollo y la adopción de la IA generativa en el dispositivo. Qualcomm Technologies está permitiendo la IA generativa en el dispositivo a escala.
Consulta «El futuro de la IA es híbrido», parte 1
Consulta «El futuro de la IA es híbrido», parte 2
Consulta nuestro boletín para ver las novedades en inteligencia artificial y computación
Los productos de las marcas Snapdragon y Qualcomm son productos de Qualcomm Technologies, Inc. y/o sus subsidiarias
Durga Malladi, vicepresidente sénior y director general, planificación tecnológica y soluciones de vanguardia, Qualcomm Technologies, Inc.
Pat Lawlor, director de marketing técnico, Qualcomm Technologies, Inc.