bytevyte
bytevyte
Language
ai-beats-it

NVIDIA Cosmos 3 lanciato come Open Foundation Model per il Physical AI Reasoning

NVIDIA Cosmos 3

NVIDIA ha introdotto NVIDIA Cosmos 3, un world foundation model progettato per unificare ragionamento e azione per i sistemi di physical AI. Annunciata al Computex 2026, questa piattaforma open-source rappresenta un cambiamento rispetto alle architetture robotiche tradizionali che si affidano a moduli separati per la percezione e il controllo motorio. Integrando dati di testo, video, audio e azioni robotiche in un unico framework Mixture-of-Transformers (MoT), il modello consente alle macchine autonome di prevedere le interazioni fisiche e gestire casi limite complessi in tempo reale.

Il rilascio include due versioni principali: Cosmos 3 Nano, con 8 miliardi di parametri per il ragionamento e la generazione, e Cosmos 3 Super, un modello più grande da 32 miliardi di parametri. Questi modelli sono ottimizzati per specifici ambienti hardware, con la variante Nano su misura per le workstation RTX PRO 6000, mentre la variante Super è costruita per i cluster GPU Hopper e Blackwell. NVIDIA sta distribuendo la tecnologia sotto licenza OpenMDW 1.1 tramite Hugging Face e GitHub, segnalando un impegno verso lo sviluppo open-source nel settore della robotica.

Architettura Tecnica di NVIDIA Cosmos 3

L'architettura Mixture-of-Transformers è l'innovazione principale all'interno di NVIDIA Cosmos 3. Questo design combina una sottosequenza di ragionamento autoregressiva con una sottosequenza di generazione basata sulla diffusione. La componente di ragionamento gestisce la deduzione logica e la pianificazione, mentre la componente di diffusione genera risultati fisicamente plausibili per i movimenti robotici, come gli angoli dei giunti e le posizioni delle pinze. Questo approccio unificato elimina la latenza e la perdita di dati spesso associate al trasferimento di informazioni tra sottosistemi software disparati.

Per supportare l'addestramento di agenti autonomi, il lancio include dataset di synthetic data generation (SDG). Queste risorse coprono domini critici come la sicurezza nei magazzini, la guida autonoma e la robotica generale. Fornendo simulazioni ad alta fedeltà di scenari fisici "long-tail", i dataset aiutano gli sviluppatori ad addestrare modelli per gestire eventi rari ma pericolosi, difficili da catturare nel mondo reale. I benchmark di performance indicano che il modello si classifica attualmente al primo posto sia su VANTAGE-Bench che su Physics-IQ, convalidando la sua capacità di comprendere le leggi fisiche.

Impatto Strategico sullo Sviluppo della Physical AI

La decisione di rilasciare NVIDIA Cosmos 3 con una licenza aperta attraverso la libreria Hugging Face Diffusers ha implicazioni significative per il mercato competitivo dell'IA. Fornendo una base pre-addestrata per il ragionamento fisico, NVIDIA sta abbassando la barriera all'ingresso per le startup e le istituzioni di ricerca che sviluppano robot umanoidi o veicoli autonomi. Questa mossa posiziona l'azienda come il principale fornitore di infrastrutture per la prossima generazione di embodied AI, andando oltre l'hardware puro per fornire la logica software essenziale che governa il movimento fisico.

Per i decisori aziendali, la disponibilità di NVIDIA Cosmos 3 offre un percorso standardizzato per l'implementazione di sistemi autonomi in ambienti industriali. L'integrazione di molteplici modalità in un unico passaggio riduce la complessità dello stack IA, abbassando potenzialmente il sovraccarico computazionale richiesto per compiti robotici sofisticati. Al 01-06-2026, la collaborazione tra NVIDIA e Hugging Face garantisce che questi strumenti siano accessibili per l'integrazione immediata nei flussi di lavoro degli sviluppatori esistenti, accelerando la transizione dall'IA digitale all'automazione fisica.

Sebbene ci impegniamo per l'accuratezza, bytevyte può commettere errori. Si consiglia agli utenti di verificare tutte le informazioni in modo indipendente. Non accettiamo alcuna responsabilità per errori o omissioni.

Sources

How Cosmos 3 Helps Physical AI Think Before It Acts

Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action

✔Human Verified