NVIDIA stellt Vera Rubin Architektur vor, um AI Inference Kosten drastisch zu senken
NVIDIA hat die Vera Rubin architecture vorgestellt, eine Computing-Plattform der nächsten Generation, die für die anspruchsvollsten Artificial Intelligence Workloads entwickelt wurde. Das neue System, das im Vorfeld der COMPUTEX 2026 Konferenz in Taipeh angekündigt wurde, ist darauf ausgelegt, Modelle mit Billionen von Parametern zu verarbeiten und gleichzeitig die Betriebskosten für Large-Scale Inference erheblich zu senken.
Das Herzstück dieser Ankündigung ist die Vera Rubin NVL72, ein flüssigkeitsgekühltes Rack-System, das 36 Vera CPUs und 72 Rubin GPUs integriert. Diese Hardware-Konfiguration wurde entwickelt, um die massiven Compute-Anforderungen von Frontier AI Modellen zu erfüllen. NVIDIA gab an, dass die Architektur eine zehnfache Reduzierung der Inference-Kosten pro Token erreicht – eine Kennzahl, die sich direkt auf die kommerzielle Rentabilität der Skalierung massiver generativer AI-Systeme auswirkt.
Advanced Robotics und autonome Systeme
Über die Rechenzentrumsinfrastruktur hinaus erweiterte das Unternehmen seine Reichweite im Bereich der physischen AI mit dem Debüt von Jetson Thor. Diese neue Robotik-Plattform liefert 2.070 FP4 Teraflops an Performance und bietet die Hochgeschwindigkeitsverarbeitung, die für komplexe robotische Denkprozesse und Interaktionen erforderlich ist. Die Plattform soll die Lücke zwischen digitaler Intelligenz und physischer Bewegung in industriellen und kommerziellen Umgebungen schließen.
Das Unternehmen brachte außerdem Alpamayo auf den Markt, eine offene Plattform speziell für die Entwicklung autonomer Fahrzeuge. Alpamayo nutzt Vision-Language-Modelle mit 10 Milliarden Parametern, um die Reasoning-Fähigkeiten selbstfahrender Systeme zu verbessern. Durch die Bereitstellung eines offenen Frameworks zielt NVIDIA darauf ab, den Einsatz von Fahrzeugen zu beschleunigen, die komplexe Fahrumgebungen durch fortschrittlichen linguistischen und visuellen Kontext besser verstehen und darauf reagieren können.
Strategische Auswirkungen der Vera Rubin architecture
Die Einführung der Vera Rubin architecture signalisiert einen Wandel hin zu effizienterer, spezialisierter Hardware für die Post-Training-Ära der AI. Während Unternehmen vom initialen Modelltraining zum High-Volume-Deployment übergehen, bietet die durch das NVL72-System ermöglichte 10-fache Kostensenkung einen klaren Weg für die Skalierung von Diensten ohne proportionalen Anstieg des Energie- oder Hardwareaufwands. Der Fokus auf Flüssigkeitskühlung spiegelt zudem die wachsende Notwendigkeit eines fortschrittlichen Thermomanagements in High-Density-Rechenzentren wider.
NVIDIA-CEO Jensen Huang wird am 1. Juni 2026 eine Keynote halten, in der weitere Details zum Rollout dieser Technologien erwartet werden. Der gleichzeitige Vorstoß in die Bereiche Robotik und autonomes Fahren deutet auf eine Strategie hin, den gesamten AI-Lebenszyklus zu dominieren – von den Cloud-basierten Fabriken, in denen Modelle entstehen, bis hin zu den Edge-Geräten, auf denen sie mit der physischen Welt interagieren.
Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Sources
NVIDIA GTC Taipei at COMPUTEX: Live Updates on What’s Next in AI
Related Articles
- NVIDIA-Umsatz steigt auf 81,6 Mrd. USD, während die neue Vera Rubin NVL72-Architektur auf die Effizienz von Agentic AI abzielt
- NVIDIA Vera Rubin Plattform treibt neue Dell Server an, um KI-Kosten drastisch zu senken
- NVIDIA startet Massenproduktion von Rubin R100 GPUs und Vera CPUs für Next-Gen AI
✔Human Verified