NVIDIA Vera Rubin Plattform treibt neue Dell Server an, um KI-Kosten drastisch zu senken
NVIDIA und Dell Technologies haben eine neue Zusammenarbeit im Bereich der KI-Infrastruktur vorgestellt, die darauf ausgelegt ist, die Betriebskosten für den Einsatz autonomer Agenten drastisch zu senken. Die Partnerschaft, die diese Woche auf der Dell Technologies World angekündigt wurde, konzentriert sich auf den Dell PowerEdge XE9812 Server, der die NVIDIA Vera Rubin NVL72 Plattform nutzt. Diese Hardware-Kombination zielt darauf ab, die Kosten pro Token für groß angelegtes KI-Inferencing im Vergleich zu früheren Architekturen um das bis zu Zehnfache zu reduzieren und damit eine der größten Hürden für die KI-Adoption in Unternehmen zu beseitigen.
Die NVIDIA Vera Rubin Architektur führt eine dedizierte CPU ein, die speziell für agentische KI-Workloads entwickelt wurde. Laut NVIDIA führt dieser Prozessor diese komplexen Aufgaben 50 % schneller aus als herkömmliche x86-basierte Systeme. Ein entscheidender technischer Vorteil ist die Speicherbandbreite von 1,2 TB/s, die dreimal höher ist als bei Konkurrenzlösungen. Diese hohe Bandbreite ermöglicht es dem System, die schnellen Datenbewegungen zu bewältigen, die erforderlich sind, damit autonome Agenten in Produktionsumgebungen effektiv funktionieren.
Strategische Auswirkungen der NVIDIA Vera Rubin Plattform
Der Übergang von experimentellen KI-Piloten zur vollständigen Produktion erfordert eine erhebliche Reduzierung der Rechenkosten. Dell und NVIDIA zielen auf diesen Übergang ab, indem sie On-Premises-Lösungen anbieten, die direkt mit Public-Cloud-Anbietern konkurrieren. Dell gab an, dass Unternehmen, die diese Systeme lokal einsetzen, bereits nach drei Monaten den Break-Even-Punkt gegenüber Cloud-API-Kosten erreichen können. Dieser finanzielle Anreiz wird durch die Einführung von PowerRack ergänzt, einem voll integrierten System, das Rechenleistung, Netzwerk und Speicher in einer einzigen Rack-Scale-Lösung vereint.
Um die enorme Hitzeentwicklung dieser Hochleistungssysteme zu bewältigen, stellte Dell die PowerCool CDU C7000 vor. Diese Rack-Kühleinheit bietet eine Kapazität von über 220 kW und ist die erste ihrer Art, die speziell für die NVIDIA Vera Rubin NVL72 entwickelt wurde. Diese Fortschritte im Wärmemanagement sind notwendig, um das Leistungsniveau aufrechtzuerhalten, das für Frontier-Modelle wie Gemini 3 und Grok erforderlich ist, welche die Unternehmen durch strategische Partnerschaften mit Google und SpaceXAI lokal verfügbar machen wollen.
Erste Auslieferungen der Vera-basierten Einheiten haben bereits bedeutende Branchenakteure erreicht, darunter OpenAI, Anthropic, Oracle und SpaceXAI. Für kleinere Anforderungen bringt Dell zudem Deskside Agentic AI Workstations auf den Markt. Diese ermöglichen es Unternehmen, autonome Agenten lokal zu betreiben, was die Datensouveränität gewährleistet und gleichzeitig die Leistungsvorteile der neuen Architektur beibehält. Da die Nachfrage nach KI-Rechenleistung weiter steigt, bietet dieser integrierte Hardware-Ansatz Organisationen einen klaren Weg, ihre KI-Operationen zu skalieren und gleichzeitig die langfristigen Kosten zu kontrollieren.
Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Sources
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’
Dell Technologies Closes the Gap Between AI Ambition and AI Outcomes
Related Articles
- NVIDIA und Ineffable Intelligence kooperieren beim Ausbau der Reinforcement Learning Infrastruktur
- NVIDIA startet Massenproduktion von Rubin R100 GPUs und Vera CPUs für Next-Gen AI
- Dell und Kioxia enthüllen 9,8 PB AI Flash Storage Server für massive Data Lakes
✔Human Verified