NVIDIA Cosmos 3 startet als Open Foundation Model für Physical AI Reasoning
NVIDIA hat NVIDIA Cosmos 3 vorgestellt, ein World Foundation Model, das darauf ausgelegt ist, Reasoning und Action für Physical AI-Systeme zu vereinheitlichen. Die auf der Computex 2026 angekündigte Open-Source-Plattform markiert eine Abkehr von traditionellen Roboterarchitekturen, die auf separaten Modulen für Wahrnehmung und Motorsteuerung basieren. Durch die Integration von Text-, Video-, Audio- und Roboteraktionsdaten in ein einziges Mixture-of-Transformers (MoT) Framework ermöglicht das Modell autonomen Maschinen, physische Interaktionen vorherzusagen und komplexe Edge Cases in Echtzeit zu bewältigen.
Die Veröffentlichung umfasst zwei Hauptversionen: Cosmos 3 Nano mit 8 Milliarden Parametern für Reasoning und Generierung sowie Cosmos 3 Super, ein größeres Modell mit 32 Milliarden Parametern. Diese Modelle sind für spezifische Hardware-Umgebungen optimiert, wobei die Nano-Variante auf RTX PRO 6000 Workstations zugeschnitten ist, während die Super-Variante für Hopper- und Blackwell-GPU-Cluster entwickelt wurde. NVIDIA vertreibt die Technologie unter der OpenMDW 1.1-Lizenz via Hugging Face und GitHub, was ein Bekenntnis zur Open-Source-Entwicklung im Robotiksektor signalisiert.
Technische Architektur von NVIDIA Cosmos 3
Die Mixture-of-Transformers-Architektur ist die Kerninnovation innerhalb von NVIDIA Cosmos 3. Dieses Design kombiniert eine autoregressive Reasoning-Subsequenz mit einer diffusionsbasierten Generierungs-Subsequenz. Die Reasoning-Komponente übernimmt die logische Deduktion und Planung, während die Diffusions-Komponente physisch plausible Ergebnisse für Roboterbewegungen generiert, wie etwa Gelenkwinkel und Greiferpositionen. Dieser vereinheitlichte Ansatz eliminiert die Latenz und den Datenverlust, die oft mit dem Informationstransfer zwischen verschiedenen Software-Subsystemen einhergehen.
Um das Training autonomer Agenten zu unterstützen, umfasst der Launch Datensätze zur synthetischen Datengenerierung (SDG). Diese Ressourcen decken kritische Bereiche wie Lagersicherheit, autonomes Fahren und allgemeine Robotik ab. Durch die Bereitstellung hochpräziser Simulationen von Long-Tail-Physis-Szenarien helfen die Datensätze Entwicklern dabei, Modelle für seltene, aber gefährliche Ereignisse zu trainieren, die in der realen Welt schwer zu erfassen sind. Performance-Benchmarks zeigen, dass das Modell derzeit den ersten Platz sowohl beim VANTAGE-Bench als auch beim Physics-IQ belegt, was seine Fähigkeit zum Verständnis physikalischer Gesetze bestätigt.
Strategische Auswirkungen auf die Physical AI-Entwicklung
Die Entscheidung, NVIDIA Cosmos 3 unter einer offenen Lizenz über die Hugging Face Diffusers-Bibliothek zu veröffentlichen, hat erhebliche Auswirkungen auf den kompetitiven KI-Markt. Durch die Bereitstellung einer vortrainierten Basis für Physical Reasoning senkt NVIDIA die Eintrittsbarriere für Startups und Forschungseinrichtungen, die humanoide Roboter oder autonome Fahrzeuge entwickeln. Dieser Schritt positioniert das Unternehmen als primären Infrastrukturanbieter für die nächste Generation von Embodied AI und geht über reine Hardware hinaus, um die essenzielle Softwarelogik bereitzustellen, die physische Bewegungen steuert.
Für Entscheidungsträger in Unternehmen bietet die Verfügbarkeit von NVIDIA Cosmos 3 einen standardisierten Pfad für den Einsatz autonomer Systeme in industriellen Umgebungen. Die Integration mehrerer Modalitäten in einen einzigen Forward Pass reduziert die Komplexität des KI-Stacks und senkt potenziell den Rechenaufwand, der für anspruchsvolle Robotikaufgaben erforderlich ist. Seit dem 01.06.2026 stellt die Zusammenarbeit zwischen NVIDIA und Hugging Face sicher, dass diese Tools für die sofortige Integration in bestehende Entwickler-Workflows zugänglich sind und den Übergang von digitaler KI zu physischer Automatisierung beschleunigen.
Obwohl wir um Genauigkeit bemüht sind, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Sources
How Cosmos 3 Helps Physical AI Think Before It Acts
Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action
Related Articles
- NVIDIA enthüllt Nemotron 3 Nano Omni zur Optimierung multimodaler KI-Workflows
- Siemens setzt HMND 01 Alpha humanoid robots gemeinsam mit NVIDIA ein
- LG und NVIDIA vertiefen Zusammenarbeit zur Förderung von Physical AI in Robotik und Fertigung
✔Human Verified