El Amanecer de los Humanoides: NVIDIA Impulsa la Robótica Hacia Horizontes Inesperados

El futuro, ese que a menudo imaginamos en las pantallas de cine, parece estar un poco más cerca de lo que pensamos. Jensen Huang, el visionario fundador y CEO de NVIDIA, lo ha expresado con una claridad que nos invita a la reflexión:
«La IA física y la robótica provocarán la próxima revolución industrial». Es una afirmación que resuena, y si lo pensamos bien, esta no es solo una posibilidad lejana; es una realidad que se está construyendo ante nuestros ojos. NVIDIA, en su reciente presentación en COMPUTEX, ha revelado una serie de innovaciones que prometen acelerar el desarrollo de robots humanoides, ofreciendo, como ellos mismos señalan, «elementos de construcción para cada etapa del proceso de desarrollo de la robótica».
La inteligencia artificial ha entrado en una fase que, para muchos, resulta fascinante. Estamos viendo la integración de grandes modelos, sistemas multimodales y formas completamente nuevas de interacción, lo que, francamente, nos lleva a cuestionar los límites entre lo humano y lo máquina. En este contexto tan dinámico, NVIDIA ha anunciado NVIDIA Isaac GR00T N1.5, la primera actualización de su modelo básico abierto, generalizado y totalmente personalizable para el razonamiento y las habilidades de los humanoides. También llega NVIDIA Isaac GR00T-Dreams, un modelo diseñado para la generación de datos de movimiento sintético. Estos avances, junto con los potentes sistemas NVIDIA Blackwell, buscan desatar el verdadero potencial de la robótica.
Cerrando la Brecha de Datos con Movimiento Sintético
Desarrollar robots humanoides con un alto nivel de destrezas es, sin duda, una tarea monumental. Requiere una cantidad masiva de datos diversos, y capturar esos datos en el mundo real puede ser un proceso costoso y, a veces, arriesgado. Aquí es donde NVIDIA Isaac GR00T-Dreams entra en juego, presentado en la keynote de Huang en COMPUTEX. Este plan innovador ayuda a generar grandes cantidades de datos de movimiento sintético, también conocidos como trayectorias neuronales. Es un avance crucial. Los desarrolladores de IA física pueden utilizar estos datos para enseñar a los robots nuevos comportamientos, incluyendo cómo adaptarse a entornos cambiantes.

Piensen en esto: los desarrolladores pueden entrenar los modelos fundacionales del mundo (WFM) de Cosmos Predict para su robot. Luego, con una sola imagen como entrada, GR00T-Dreams genera videos del robot realizando nuevas tareas en nuevos entornos. Después, se extraen «tokens de acción», que son datos comprimidos y digeribles, utilizados para enseñar a los robots cómo ejecutar estas nuevas tareas. Este modelo complementa a Isaac GR00T-Mimic, que utiliza NVIDIA Omniverse™ y NVIDIA Cosmos™ para aumentar datos existentes, mientras que GR00T-Dreams usa Cosmos para generar datos completamente nuevos.
La eficiencia de este enfoque es notable. NVIDIA Research, por ejemplo, utilizó el modelo GR00T-Dreams para generar datos de entrenamiento sintético y desarrollar GR00T N1.5 (una actualización de GR00T N1) en solo 36 horas. Esto contrasta, de manera sorprendente, con los casi tres meses que habría tomado la recopilación manual de datos humanos. El GR00T N1.5 ahora puede adaptarse mejor a nuevos entornos y configuraciones de espacios de trabajo, además de reconocer objetos mediante instrucciones del usuario. Esta actualización mejora significativamente la tasa de éxito del modelo para tareas comunes de manejo de materiales y manufactura, como clasificar o guardar objetos.
Empresas como AeiRobot, Foxlink, Lightwheel y NEURA Robotics ya están adoptando estos modelos GR00T N para impulsar sus propios desarrollos. Esto incluye desde la capacidad de ALICE4 de AeiRobot para entender instrucciones en lenguaje natural y ejecutar flujos de trabajo complejos, hasta la mejora de flexibilidad en manipuladores robóticos por parte de Foxlink Group.
Marcos de Simulación y Generación de Datos: El Campo de Pruebas Virtual
El desarrollo de robots humanoides diestros es, sin duda, un desafío complejo. Necesitan una cantidad masiva de datos y pruebas en el mundo físico, lo que, como sabemos, puede generar costos y riesgos considerables. Para ayudar a cerrar la brecha entre los datos y las pruebas, NVIDIA ha presentado diversas tecnologías de simulación que resultan, francamente, muy interesantes:
- NVIDIA Cosmos Reason: Un nuevo WFM que utiliza el razonamiento en cadena para seleccionar datos sintéticos precisos y de mayor calidad para el entrenamiento de modelos físicos de IA. Ya está disponible en Hugging Face.
- Cosmos Predict 2: Llegará pronto a Hugging Face, con mejoras de desempeño para la generación de mundos de alta calidad y reducción de alucinaciones.
- NVIDIA Isaac GR00T-Mimic: Un blueprint para generar cantidades exponencialmente grandes de trayectorias de movimiento sintético para la manipulación de robots, usando solo unas pocas demostraciones humanas.
- Conjunto de Datos Abierto de IA Física: Ahora incluye 24,000 trayectorias de movimiento de robots humanoides de alta calidad utilizadas para desarrollar los modelos GR00T N.
- NVIDIA Isaac Sim™ 5.0: Un framework de simulación y generación de datos sintéticos, que pronto estará disponible abiertamente en GitHub.
- NVIDIA Isaac Lab 2.2: Un marco de aprendizaje de robots de código abierto, que admitirá nuevos entornos de evaluación para ayudar a los desarrolladores a probar los modelos GR00T N.
Empresas como Foxconn, Agility Robotics, Boston Dynamics, Fourier, Mentee Robotics, NEURA Robotics y XPENG Robotics ya están utilizando estos blueprints y frameworks de simulación para acelerar sus procesos de entrenamiento y desarrollo de robots humanoides.
Sistemas Blackwell Universales: El Corazón de la Revolución Robótica
Los fabricantes de sistemas globales están creando estaciones de trabajo y servidores NVIDIA RTX PRO™ 6000. Esto proporciona una arquitectura única para ejecutar fácilmente cada carga de trabajo de desarrollo de robots, incluyendo entrenamiento, generación de datos sintéticos, aprendizaje robótico y simulación. Empresas como Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro ya han anunciado servidores y estaciones de trabajo impulsados por NVIDIA RTX PRO.
Cuando se requiere aún más poder de cómputo para cargas de trabajo de entrenamiento o generación de datos a gran escala, los desarrolladores pueden aprovechar los sistemas NVIDIA Blackwell, como el GB200 NVL72. Estos sistemas, disponibles a través de NVIDIA DGX™ Cloud y sus socios, pueden ofrecer un desempeño hasta 18 veces mayor para el procesamiento de datos. Finalmente, los desarrolladores podrán implementar sus modelos fundacionales de robots en la plataforma NVIDIA Jetson Thor, lo que habilitará la inferencia acelerada y el desempeño en tiempo de ejecución directamente en el robot.
Marcio Aguiar, director de la división Enterprise de NVIDIA para Latinoamérica, lo expresa con una convicción que resuena: «NVIDIA siempre va un paso por delante en lo que se refiere a tecnología. Estamos allanando el camino hacia nuevas fronteras de innovación y eficiencia en el mundo de la IA y ahora con los robots». Sin duda, NVIDIA está proporcionando herramientas integrales que están impulsando la próxima revolución industrial, donde la IA física y la robótica transformarán industrias y, eventualmente, nuestra vida diaria. Es un panorama que invita tanto a la curiosidad como a la reflexión.