La piattaforma NVIDIA Vera Rubin potenzia i nuovi server Dell per abbattere i costi dell'IA
NVIDIA e Dell Technologies hanno svelato una nuova collaborazione per l'infrastruttura IA, progettata per ridurre drasticamente i costi operativi per l'esecuzione di agenti autonomi. Annunciata questa settimana al Dell Technologies World, la partnership si concentra sul server Dell PowerEdge XE9812, che utilizza la piattaforma NVIDIA Vera Rubin NVL72. Questa combinazione hardware mira a ridurre il costo-per-token per l'inferenza IA su larga scala fino a 10 volte rispetto alle architetture precedenti, affrontando una delle principali barriere all'adozione dell'IA aziendale.
L'architettura NVIDIA Vera Rubin introduce una CPU dedicata progettata specificamente per i carichi di lavoro di IA agentica. Secondo NVIDIA, questo processore esegue questi compiti complessi il 50% più velocemente rispetto ai sistemi tradizionali basati su x86. Un vantaggio tecnico chiave è la larghezza di banda della memoria di 1,2 TB/s, tre volte superiore rispetto alle soluzioni concorrenti. Questa elevata larghezza di banda consente al sistema di gestire il rapido movimento di dati necessario affinché gli agenti autonomi funzionino efficacemente in ambienti di produzione.
Impatto strategico della piattaforma NVIDIA Vera Rubin
Il passaggio dai progetti pilota sperimentali di IA alla produzione su vasta scala richiede una significativa riduzione delle spese di calcolo. Dell e NVIDIA puntano a questa transizione offrendo soluzioni on-premises che competono direttamente con i fornitori di cloud pubblico. Dell ha dichiarato che le aziende che implementano questi sistemi localmente possono raggiungere il punto di pareggio rispetto ai costi delle API cloud in soli tre mesi. Questo incentivo finanziario è abbinato al lancio di PowerRack, un sistema completamente integrato che combina calcolo, networking e storage in un'unica soluzione a livello di rack.
Per supportare l'intenso calore generato da questi sistemi ad alte prestazioni, Dell ha introdotto il PowerCool CDU C7000. Questa unità di raffreddamento montata su rack fornisce oltre 220kW di capacità ed è la prima del suo genere costruita specificamente per NVIDIA Vera Rubin NVL72. Questi progressi nella gestione termica sono necessari per mantenere i livelli di prestazioni richiesti per i modelli di frontiera come Gemini 3 e Grok, che le aziende stanno lavorando per portare on-premises attraverso partnership strategiche con Google e SpaceXAI.
Le spedizioni iniziali delle unità alimentate da Vera hanno già raggiunto i principali attori del settore, tra cui OpenAI, Anthropic, Oracle e SpaceXAI. Per esigenze su scala ridotta, Dell sta lanciando anche le workstation Deskside Agentic AI. Queste consentono alle aziende di eseguire agenti autonomi localmente, garantendo la sovranità dei dati e mantenendo i vantaggi prestazionali della nuova architettura. Mentre la domanda di calcolo IA continua a crescere, questo approccio hardware integrato fornisce un percorso chiaro alle organizzazioni per scalare le proprie operazioni IA controllando i costi a lungo termine.
Sebbene ci impegniamo per l'accuratezza, bytevyte può commettere errori. Si consiglia agli utenti di verificare tutte le informazioni in modo indipendente. Non accettiamo alcuna responsabilità per errori o omissioni.
Sources
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’
Dell Technologies Closes the Gap Between AI Ambition and AI Outcomes
Related Articles
- NVIDIA e Ineffable Intelligence collaborano per far progredire l'infrastruttura di Reinforcement Learning
- NVIDIA avvia la produzione di massa delle GPU Rubin R100 e delle CPU Vera per l'AI di prossima generazione
- Intel e Google Cloud potenziano le prestazioni AI con Xeon 6 e silicio personalizzato
✔Human Verified