Lancement de NVIDIA Cosmos 3 : un modèle de fondation ouvert pour le raisonnement de l'IA physique
NVIDIA a introduit NVIDIA Cosmos 3, un modèle de fondation mondial conçu pour unifier le raisonnement et l'action pour les systèmes d'IA physique. Annoncée au Computex 2026, cette plateforme open-source marque un tournant par rapport aux architectures robotiques traditionnelles qui reposent sur des modules séparés pour la perception et le contrôle moteur. En intégrant des données de texte, de vidéo, d'audio et d'actions robotiques dans un cadre unique de Mixture-of-Transformers (MoT), le modèle permet aux machines autonomes de prédire les interactions physiques et de gérer des cas limites complexes en temps réel.
La version comprend deux variantes principales : Cosmos 3 Nano, doté de 8 milliards de paramètres pour le raisonnement et la génération, et Cosmos 3 Super, un modèle plus large de 32 milliards de paramètres. Ces modèles sont optimisés pour des environnements matériels spécifiques, la variante Nano étant adaptée aux stations de travail RTX PRO 6000 tandis que la variante Super est conçue pour les clusters de GPU Hopper et Blackwell. NVIDIA distribue la technologie sous la licence OpenMDW 1.1 via Hugging Face et GitHub, signalant un engagement envers le développement open-source dans le secteur de la robotique.
Architecture technique de NVIDIA Cosmos 3
L'architecture Mixture-of-Transformers est l'innovation centrale au sein de NVIDIA Cosmos 3. Cette conception combine une sous-séquence de raisonnement autorégressive avec une sous-séquence de génération basée sur la diffusion. Le composant de raisonnement gère la déduction logique et la planification, tandis que le composant de diffusion génère des résultats physiquement plausibles pour les mouvements robotiques, tels que les angles d'articulation et les positions des pinces. Cette approche unifiée élimine la latence et la perte de données souvent associées au transfert d'informations entre des sous-systèmes logiciels disparates.
Pour soutenir l'entraînement d'agents autonomes, le lancement inclut des jeux de données de génération de données synthétiques (SDG). Ces ressources couvrent des domaines critiques tels que la sécurité en entrepôt, la conduite autonome et la robotique générale. En fournissant des simulations de haute fidélité de scénarios physiques rares, ces jeux de données aident les développeurs à entraîner des modèles pour gérer des événements peu fréquents mais dangereux, difficiles à capturer dans le monde réel. Les tests de performance indiquent que le modèle se classe actuellement au premier rang sur VANTAGE-Bench et Physics-IQ, validant sa capacité à comprendre les lois physiques.
Impact stratégique sur le développement de l'IA physique
La décision de publier NVIDIA Cosmos 3 sous une licence ouverte via la bibliothèque Hugging Face Diffusers a des implications significatives pour le marché concurrentiel de l'IA. En fournissant une base pré-entraînée pour le raisonnement physique, NVIDIA abaisse la barrière à l'entrée pour les startups et les institutions de recherche développant des robots humanoïdes ou des véhicules autonomes. Cette initiative positionne l'entreprise comme le principal fournisseur d'infrastructure pour la prochaine génération d'IA incarnée, allant au-delà du pur matériel pour fournir la logique logicielle essentielle qui régit le mouvement physique.
Pour les décideurs en entreprise, la disponibilité de NVIDIA Cosmos 3 offre une voie standardisée pour le déploiement de systèmes autonomes dans des environnements industriels. L'intégration de multiples modalités en une seule passe réduit la complexité de la pile IA, abaissant potentiellement la charge de calcul requise pour des tâches robotiques sophistiquées. Au 01-06-2026, la collaboration entre NVIDIA et Hugging Face garantit que ces outils sont accessibles pour une intégration immédiate dans les flux de travail des développeurs, accélérant la transition de l'IA numérique vers l'automatisation physique.
Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité pour les erreurs ou omissions.
Sources
How Cosmos 3 Helps Physical AI Think Before It Acts
Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action
Related Articles
- NVIDIA dévoile Nemotron 3 Nano Omni pour simplifier les workflows d'IA multimodale
- LG et NVIDIA renforcent leur collaboration pour faire progresser l'IA physique dans la robotique et l'industrie
- NVIDIA lance la NVIDIA NemoClaw open-source stack pour sécuriser les agents IA autonomes
✔Human Verified