NVIDIA stellt Vera Rubin Architektur vor, um AI Inference Ko

NVIDIA hat die Vera Rubin architecture vorgestellt, eine Computing-Plattform der nächsten Generation, die für die anspruchsvollsten Artificial Intelligence Workloads entwickelt wurde. Das neue System, das im Vorfeld der COMPUTEX 2026 Konferenz in Taipeh angekündigt wurde, ist darauf ausgelegt, Modelle mit Billionen von Parametern zu verarbeiten und gleichzeitig die Betriebskosten für Large-Scale Inference erheblich zu senken.

Das Herzstück dieser Ankündigung ist die Vera Rubin NVL72, ein flüssigkeitsgekühltes Rack-System, das 36 Vera CPUs und 72 Rubin GPUs integriert. Diese Hardware-Konfiguration wurde entwickelt, um die massiven Compute-Anforderungen von Frontier AI Modellen zu erfüllen. NVIDIA gab an, dass die Architektur eine zehnfache Reduzierung der Inference-Kosten pro Token erreicht – eine Kennzahl, die sich direkt auf die kommerzielle Rentabilität der Skalierung massiver generativer AI-Systeme auswirkt.

Advanced Robotics und autonome Systeme

Über die Rechenzentrumsinfrastruktur hinaus erweiterte das Unternehmen seine Reichweite im Bereich der physischen AI mit dem Debüt von Jetson Thor. Diese neue Robotik-Plattform liefert 2.070 FP4 Teraflops an Performance und bietet die Hochgeschwindigkeitsverarbeitung, die für komplexe robotische Denkprozesse und Interaktionen erforderlich ist. Die Plattform soll die Lücke zwischen digitaler Intelligenz und physischer Bewegung in industriellen und kommerziellen Umgebungen schließen.

Das Unternehmen brachte außerdem Alpamayo auf den Markt, eine offene Plattform speziell für die Entwicklung autonomer Fahrzeuge. Alpamayo nutzt Vision-Language-Modelle mit 10 Milliarden Parametern, um die Reasoning-Fähigkeiten selbstfahrender Systeme zu verbessern. Durch die Bereitstellung eines offenen Frameworks zielt NVIDIA darauf ab, den Einsatz von Fahrzeugen zu beschleunigen, die komplexe Fahrumgebungen durch fortschrittlichen linguistischen und visuellen Kontext besser verstehen und darauf reagieren können.

Strategische Auswirkungen der Vera Rubin architecture

Die Einführung der Vera Rubin architecture signalisiert einen Wandel hin zu effizienterer, spezialisierter Hardware für die Post-Training-Ära der AI. Während Unternehmen vom initialen Modelltraining zum High-Volume-Deployment übergehen, bietet die durch das NVL72-System ermöglichte 10-fache Kostensenkung einen klaren Weg für die Skalierung von Diensten ohne proportionalen Anstieg des Energie- oder Hardwareaufwands. Der Fokus auf Flüssigkeitskühlung spiegelt zudem die wachsende Notwendigkeit eines fortschrittlichen Thermomanagements in High-Density-Rechenzentren wider.

NVIDIA-CEO Jensen Huang wird am 1. Juni 2026 eine Keynote halten, in der weitere Details zum Rollout dieser Technologien erwartet werden. Der gleichzeitige Vorstoß in die Bereiche Robotik und autonomes Fahren deutet auf eine Strategie hin, den gesamten AI-Lebenszyklus zu dominieren – von den Cloud-basierten Fabriken, in denen Modelle entstehen, bis hin zu den Edge-Geräten, auf denen sie mit der physischen Welt interagieren.

Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.

Sources

NVIDIA GTC Taipei at COMPUTEX: Live Updates on What’s Next in AI

✔Human Verified

Advanced Robotics und autonome Systeme

Strategische Auswirkungen der Vera Rubin architecture

Sources

Related Articles