NVIDIA Cosmos 3 se lanza como modelo fundacional abierto para el razonamiento de IA física
NVIDIA ha presentado NVIDIA Cosmos 3, un modelo fundacional de mundo diseñado para unificar el razonamiento y la acción en sistemas de IA física. Anunciado en Computex 2026, esta plataforma de código abierto representa un cambio respecto a las arquitecturas robóticas tradicionales que dependen de módulos separados para la percepción y el control motor. Al integrar datos de texto, vídeo, audio y acciones robóticas en un único marco de trabajo Mixture-of-Transformers (MoT), el modelo permite que las máquinas autónomas predigan interacciones físicas y gestionen casos extremos complejos en tiempo real.
El lanzamiento incluye dos versiones principales: Cosmos 3 Nano, con 8 mil millones de parámetros para razonamiento y generación, y Cosmos 3 Super, un modelo más grande de 32 mil millones de parámetros. Estos modelos están optimizados para entornos de hardware específicos, con la variante Nano adaptada para estaciones de trabajo RTX PRO 6000, mientras que la variante Super está diseñada para clústeres de GPU Hopper y Blackwell. NVIDIA está distribuyendo la tecnología bajo la licencia OpenMDW 1.1 a través de Hugging Face y GitHub, señalando un compromiso con el desarrollo de código abierto en el sector de la robótica.
Arquitectura técnica de NVIDIA Cosmos 3
La arquitectura Mixture-of-Transformers es la innovación central dentro de NVIDIA Cosmos 3. Este diseño combina una subsecuencia de razonamiento autorregresiva con una subsecuencia de generación basada en difusión. El componente de razonamiento se encarga de la deducción lógica y la planificación, mientras que el componente de difusión genera resultados físicamente plausibles para los movimientos robóticos, como los ángulos de las articulaciones y las posiciones de las pinzas. Este enfoque unificado elimina la latencia y la pérdida de datos que suelen asociarse con la transferencia de información entre subsistemas de software dispares.
Para apoyar el entrenamiento de agentes autónomos, el lanzamiento incluye conjuntos de datos de generación de datos sintéticos (SDG). Estos recursos cubren dominios críticos como la seguridad en almacenes, la conducción autónoma y la robótica general. Al proporcionar simulaciones de alta fidelidad de escenarios físicos de "cola larga", los conjuntos de datos ayudan a los desarrolladores a entrenar modelos para manejar eventos raros pero peligrosos que son difíciles de capturar en el mundo real. Los puntos de referencia de rendimiento indican que el modelo ocupa actualmente el primer lugar tanto en VANTAGE-Bench como en Physics-IQ, validando su capacidad para comprender las leyes físicas.
Impacto estratégico en el desarrollo de la IA física
La decisión de lanzar NVIDIA Cosmos 3 bajo una licencia abierta a través de la biblioteca Hugging Face Diffusers tiene implicaciones significativas para el mercado competitivo de la IA. Al proporcionar una base pre-entrenada para el razonamiento físico, NVIDIA está reduciendo la barrera de entrada para startups e instituciones de investigación que desarrollan robots humanoides o vehículos autónomos. Este movimiento posiciona a la empresa como el principal proveedor de infraestructura para la próxima generación de IA incorporada (embodied AI), yendo más allá del puro hardware para proporcionar la lógica de software esencial que gobierna el movimiento físico.
Para los responsables de la toma de decisiones empresariales, la disponibilidad de NVIDIA Cosmos 3 ofrece un camino estandarizado para desplegar sistemas autónomos en entornos industriales. La integración de múltiples modalidades en un solo paso de procesamiento reduce la complejidad de la pila de IA, disminuyendo potencialmente la carga computacional requerida para tareas robóticas sofisticadas. A partir del 2026-06-01, la colaboración entre NVIDIA y Hugging Face garantiza que estas herramientas sean accesibles para su integración inmediata en los flujos de trabajo de desarrollo existentes, acelerando la transición de la IA digital a la automatización física.
Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.
Sources
How Cosmos 3 Helps Physical AI Think Before It Acts
Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action
Related Articles
- NVIDIA presenta Nemotron 3 Nano Omni para optimizar los flujos de trabajo de IA multimodal
- LG y NVIDIA profundizan su colaboración para impulsar la physical AI en robótica y manufactura
- NVIDIA lanza NemoClaw open-source stack para asegurar agentes de IA autónomos
✔Human Verified