Dell e NVIDIA lanciano la AI Factory ottimizzata per la agentic AI inference
Dell Technologies e NVIDIA hanno ampliato la loro infrastruttura AI collaborativa con il lancio della Dell AI Factory, una piattaforma specificamente progettata per supportare l'implementazione di agenti autonomi su scala. Il fulcro di questo annuncio è il server Dell PowerEdge XE9812, che integra la nuova piattaforma NVIDIA Vera Rubin NVL72. Questa combinazione hardware è progettata per gestire l'orchestrazione complessa e la gestione di contesti estesi richiesti dalla agentic AI inference, un segmento in crescita del mercato enterprise.
La Dell AI Factory mira a ridurre le barriere finanziarie per l'implementazione di agenti AI sofisticati. Secondo i dati rilasciati da NVIDIA questa settimana, i nuovi sistemi offrono una riduzione fino a 10 volte del costo per token per la agentic AI inference rispetto alle precedenti architetture basate su Blackwell. Questo guadagno di efficienza è accompagnato da significativi miglioramenti delle prestazioni; le sandbox degli agenti operano il 50% più velocemente sulla piattaforma Vera rispetto alle tradizionali CPU x86, mentre le query sui dati aziendali registrano un aumento di velocità di 3 volte. Questi parametri suggeriscono uno spostamento verso hardware ottimizzato per la logica specifica e i pattern di tool-calling dei sistemi autonomi.
Infrastruttura strategica per la agentic AI inference
Al cuore del nuovo server c'è la NVIDIA Vera CPU, che dispone di 88 core Olympus progettati su misura. Questo processore è la prima CPU di NVIDIA costruita specificamente per le attività di orchestrazione inerenti ai flussi di lavoro agentici. Con una larghezza di banda di memoria di 1,2 TB/s per socket, la Vera CPU affronta i colli di bottiglia nel throughput dei dati che spesso ostacolano gli agenti autonomi. Le prime unità della Vera CPU sono già state consegnate ai principali laboratori di AI, tra cui OpenAI, Anthropic e SpaceXAI, oltre a Oracle Cloud Infrastructure.
La partnership introduce anche sistemi rack-scale raffreddati a liquido in grado di supportare fino a 144 GPU per rack. Questa configurazione ad alta densità utilizza il networking NVIDIA Quantum-X800 InfiniBand e Spectrum-6 Ethernet per mantenere la bassa latenza richiesta per le interazioni degli agenti in tempo reale. Oltre all'hardware, la collaborazione si estende al software e all'integrazione cloud. Dell e NVIDIA stanno lavorando con Google per portare Google Distributed Cloud (GDC) con Gemini 3.0 sull'hardware Dell, consentendo alle aziende di implementare modelli di frontiera all'interno dei propri ambienti on-premises sicuri.
L'adozione aziendale di queste soluzioni integrate è già consistente, con oltre 5.000 organizzazioni che attualmente utilizzano l'infrastruttura Dell AI Factory. Aziende come Eli Lilly e Samsung sono tra i primi utilizzatori che sfruttano questi sistemi per carichi di lavoro AI su larga scala. Fornendo uno stack pre-integrato che combina il silicio specializzato di NVIDIA con l'hardware enterprise di Dell, le due società si stanno posizionando come i principali fornitori per la prossima fase di implementazione dell'AI aziendale, dove l'attenzione si sposta dai semplici chatbot agli agenti autonomi capaci di eseguire processi aziendali complessi.
Sebbene ci impegniamo per l'accuratezza, bytevyte può commettere errori. Si consiglia agli utenti di verificare tutte le informazioni in modo indipendente. Non accettiamo alcuna responsabilità per errori o omissioni.
Sources
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic, Utterly Parabolic’
Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs
Related Articles
- La piattaforma NVIDIA Vera Rubin potenzia i nuovi server Dell per abbattere i costi dell'IA
- NVIDIA avvia la produzione di massa delle GPU Rubin R100 e delle CPU Vera per l'AI di prossima generazione
- SUSE e NVIDIA collaborano per fornire un'infrastruttura AI sovrana per le imprese ad alta sicurezza
✔Human Verified