NVIDIA beginnt Massenproduktion der Vera Rubin AI platform für Auslieferung im Juli
NVIDIA hat die Produktion seiner nächsten Generation, der Vera Rubin AI platform, in den vollen Maßstab überführt, wobei die ersten Hardware-Lieferungen für Juli 2026 an große Cloud-Anbieter geplant sind. Dieser Schritt folgt auf den erfolgreichen Abschluss der Testfertigungsphasen und signalisiert einen rasanten Übergang in die nächste Ära des High-Performance-Computing. CEO Jensen Huang bestätigte, dass die Rubin GPU nun von Fertigungspartnern wie Foxconn, Quanta und Wistron in Systeme auf Rack-Ebene integriert wird.
Die Vera Rubin AI platform stellt einen bedeutenden Sprung in der Halbleitertechnik dar und nutzt die N3 (3nm)-Prozesstechnologie von TSMC. Jede Rubin GPU enthält 336 Milliarden Transistoren – eine Dichte, die darauf ausgelegt ist, die massiven Rechenanforderungen autonomer KI-Systeme zu bewältigen. Durch den Wechsel zum N3-Node zielt NVIDIA darauf ab, das Hardware-Fundament für das zu schaffen, was das Unternehmen als agentic AI beschreibt, bei der Modelle mit einem höheren Grad an Unabhängigkeit und Argumentationsfähigkeit agieren.
Technische Spezifikationen und Leistungssteigerungen
Im Kern der neuen Architektur steht das NVL72-Design auf Rack-Ebene, das die Vera CPU und die Rubin GPU kombiniert. Diese Konfiguration nutzt HBM4-Speicher, um einen hohen Datendurchsatz zu gewährleisten und die Speicherbandbreiten-Engpässe zu beheben, die oft die Leistung groß angelegter Modelle einschränken. Die Integration dieser Komponenten in ein einheitliches Rack ermöglicht eine nahtlose Skalierung innerhalb moderner Rechenzentren.
Die Leistungskennzahlen für die Vera Rubin AI platform deuten auf einen Fokus auf wirtschaftliche Effizienz bei großflächigen Implementierungen hin. NVIDIA erwartet eine zehnfache Reduzierung der Inferenz-Token-Kosten im Vergleich zur vorherigen Blackwell-Architektur. Die Plattform bietet zudem eine vierfache Verbesserung der Trainingseffizienz für Mixture-of-Experts (MoE)-Modelle, die von Entwicklern zunehmend bevorzugt werden, da sie eine Skalierung der Parameter ohne linearen Anstieg der Rechenkosten ermöglichen.
Strategische Marktauswirkung
Das Lieferfenster im Juli 2026 bringt NVIDIA in eine starke Position, um den Infrastrukturbedarf nordamerikanischer Hyperscaler zu decken. Unternehmen wie Microsoft, Google, Amazon und Meta gehören zu den Hauptempfängern der ersten Produktionsserie. Diese Organisationen befinden sich derzeit in einem Wettlauf um den Ausbau ihrer Kapazitäten für autonome Agenten und komplexe generative Aufgaben, was die Rubin-Plattform zu einem wichtigen Bestandteil ihrer Hardware-Portfolios macht.
Durch die Sicherung von Produktionskapazitäten bei Foxconn und Quanta stellt NVIDIA sicher, dass die Lieferkette die erwartete Nachfrage nach diesen hochdichten Systemen bedienen kann. Der Übergang zur Vera Rubin AI platform unterstreicht den anhaltenden Trend der Branche hin zu spezialisierter Hardware, die sowohl rohe Leistung als auch die Kosteneffizienz beim Betrieb fortschrittlicher KI in großem Maßstab priorisiert.
Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Related Articles
- NVIDIA startet Massenproduktion von Rubin R100 GPUs und Vera CPUs für Next-Gen AI
- NVIDIA und Ineffable Intelligence kooperieren beim Ausbau der Reinforcement Learning Infrastruktur
- NVIDIA bringt NemoClaw Open-Source Stack zur Absicherung autonomer KI-Agenten auf den Markt
✔Human Verified