bytevyte
bytevyte
Language
ai-beats-de

Dell und NVIDIA starten AI Factory optimiert für Agentic AI Inference

Agentic AI Inference

Dell Technologies und NVIDIA haben ihre gemeinschaftliche KI-Infrastruktur mit der Einführung der Dell AI Factory erweitert, einer Plattform, die speziell für die Bereitstellung autonomer Agenten in großem Maßstab entwickelt wurde. Das Herzstück dieser Ankündigung ist der Dell PowerEdge XE9812 Server, der die neue NVIDIA Vera Rubin NVL72 Plattform integriert. Diese Hardware-Kombination ist darauf ausgelegt, die komplexe Orchestrierung und das Long-Context-Management zu bewältigen, die für agentic AI inference erforderlich sind – ein wachsendes Segment im Unternehmensmarkt.

Die Dell AI Factory zielt darauf ab, die finanziellen Hürden bei der Bereitstellung anspruchsvoller KI-Agenten zu senken. Laut Daten, die NVIDIA diese Woche veröffentlicht hat, bieten die neuen Systeme eine bis zu 10-fache Reduzierung der Kosten pro Token für agentic AI inference im Vergleich zu früheren Blackwell-basierten Architekturen. Dieser Effizienzgewinn geht mit signifikanten Leistungssteigerungen einher; Agent-Sandboxes arbeiten auf der Vera-Plattform 50 % schneller als auf herkömmlichen x86-CPUs, während Unternehmensdatenabfragen eine 3-fache Geschwindigkeitssteigerung verzeichnen. Diese Kennzahlen deuten auf einen Wandel hin zu Hardware hin, die für die spezifische Logik und die Tool-Calling-Muster autonomer Systeme optimiert ist.

Strategische Infrastruktur für Agentic AI Inference

Das Herzstück des neuen Servers ist die NVIDIA Vera CPU, die über 88 speziell entwickelte Olympus-Kerne verfügt. Dieser Prozessor ist die erste CPU von NVIDIA, die gezielt für die Orchestrierungsaufgaben entwickelt wurde, die agentenbasierten Workflows eigen sind. Mit einer Speicherbandbreite von 1,2 TB/s pro Sockel adressiert die Vera CPU die Datendurchsatz-Engpässe, die autonome Agenten oft behindern. Erste Einheiten der Vera CPU wurden bereits an führende KI-Labore geliefert, darunter OpenAI, Anthropic und SpaceXAI, sowie an Oracle Cloud Infrastructure.

Die Partnerschaft führt zudem flüssigkeitsgekühlte Rack-Systeme ein, die bis zu 144 GPUs pro Rack unterstützen können. Diese High-Density-Konfiguration nutzt NVIDIA Quantum-X800 InfiniBand und Spectrum-6 Ethernet Networking, um die für Echtzeit-Agenteninteraktionen erforderliche niedrige Latenz zu gewährleisten. Über die Hardware hinaus erstreckt sich die Zusammenarbeit auf Software- und Cloud-Integration. Dell und NVIDIA arbeiten mit Google zusammen, um Google Distributed Cloud (GDC) mit Gemini 3.0 auf Dell-Hardware zu bringen, was es Unternehmen ermöglicht, Frontier-Modelle in ihren eigenen sicheren On-Premises-Umgebungen bereitzustellen.

Die Akzeptanz dieser integrierten Lösungen in Unternehmen ist bereits beträchtlich: Über 5.000 Organisationen nutzen derzeit die Infrastruktur der Dell AI Factory. Unternehmen wie Eli Lilly und Samsung gehören zu den Early Adoptern, die diese Systeme für groß angelegte KI-Workloads nutzen. Durch die Bereitstellung eines vorintegrierten Stacks, der spezialisierte NVIDIA-Chips mit Dell-Unternehmenshardware kombiniert, positionieren sich die beiden Unternehmen als primäre Anbieter für die nächste Phase der KI-Einführung in Unternehmen, in der sich der Fokus von einfachen Chatbots hin zu autonomen Agenten verschiebt, die komplexe Geschäftsprozesse ausführen können.

Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.

Sources

NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic, Utterly Parabolic’

Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs

✔Human Verified

Share