NVIDIA liefert erste Vera CPUs an OpenAI und Anthropic für Agentic AI Workloads aus
NVIDIA hat mit der Auslieferung seiner ersten maßgeschneiderten CPU, Vera, an führende Labore für künstliche Intelligenz, darunter OpenAI und Anthropic, begonnen. Diese Hardware-Veröffentlichung markiert einen Wandel in der Rechenzentrumsarchitektur, weg von Allzweckprozessoren hin zu Silizium, das für agentic AI Workloads optimiert ist. Die Vera CPU wurde entwickelt, um die komplexe Orchestrierung, Tool-Calling und Reinforcement-Learning-Aufgaben zu bewältigen, die in herkömmlichen Computerumgebungen häufig Engpässe verursachen.
Der neue Prozessor verfügt über 88 speziell entwickelte Olympus-Kerne pro Sockel und bietet eine Speicherbandbreite von 1,2 TB/s. Laut NVIDIA liefert die Architektur die doppelte Energieeffizienz bestehender Infrastrukturen. Während er als eigenständige Einheit fungieren kann, ist der Prozessor primär als Host für Rubin GPUs über den NVLink-C2C-Interconnect gedacht. Zu den ersten Empfängern der Hardware gehören auch SpaceXAI und Oracle Cloud Infrastructure.
Optimierung der Infrastruktur für Agentic AI
Die Einführung der Vera CPU adressiert die spezifischen Rechenanforderungen autonomer Agenten. Diese Systeme erfordern schnelle Datenanalysen und häufige Interaktionen mit externen Software-Tools – Aufgaben, die sich erheblich von der massiven parallelen Verarbeitung durch GPUs unterscheiden. NVIDIA berichtet, dass Unternehmens-Datenabfragen auf Vera bis zu dreimal schneller laufen als auf Standard-Server-CPUs, während Agent-Sandboxes eine Leistungssteigerung von 50 % verzeichnen.
Der strategische Einsatz dieser Hardware wird bereits skaliert. Oracle Cloud Infrastructure hat Pläne angekündigt, ab 2026 Hunderttausende von Vera-Einheiten in seine Rechenzentren zu integrieren. Diese großflächige Einführung deutet auf einen Übergang zu spezialisierten Clustern hin, in denen die CPU keine sekundäre Komponente mehr ist, sondern eine spezialisierte Engine für Logik und Tool-Management.
Kosteneffizienz bleibt ein Haupttreiber für diesen Hardware-Wandel. In Kombination mit dem Vera Rubin NVL72-System gibt NVIDIA an, dass die Inferenzkosten für agentic AI auf ein Zehntel des Preises pro Token gesenkt werden können. Durch das Auslagern von Orchestrierungsaufgaben auf einen dedizierten Prozessor können KI-Entwickler die Auslastung ihrer GPU-Cluster maximieren und so potenziell die Trainings- und Bereitstellungszyklen für autonome Modelle der nächsten Generation verkürzen.
Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Sources
Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’
Related Articles
- NVIDIA startet Massenproduktion von Rubin R100 GPUs und Vera CPUs für Next-Gen AI
- NVIDIA Vera Rubin Plattform treibt neue Dell Server an, um KI-Kosten drastisch zu senken
- NVIDIA bringt NemoClaw Open-Source Stack zur Absicherung autonomer KI-Agenten auf den Markt
✔Human Verified