NVIDIA consegna le prime CPU Vera a OpenAI e Anthropic per c

NVIDIA ha iniziato a spedire la sua prima CPU personalizzata, Vera, ai principali laboratori di intelligenza artificiale, tra cui OpenAI e Anthropic. Questo rilascio hardware rappresenta un cambiamento nell'architettura dei data center, passando da processori general-purpose a silicio ottimizzato per carichi di lavoro di agentic AI. La CPU Vera è progettata per gestire i complessi compiti di orchestrazione, tool-calling e reinforcement learning che spesso creano colli di bottiglia negli ambienti informatici tradizionali.

Il nuovo processore dispone di 88 core Olympus personalizzati per socket e fornisce 1,2 TB/s di larghezza di banda di memoria. Secondo NVIDIA, l'architettura offre il doppio dell'efficienza energetica rispetto alle infrastrutture esistenti. Sebbene possa funzionare come unità standalone, il processore è destinato principalmente a fungere da host per le Rubin GPUs tramite l'interconnessione NVLink-C2C. I destinatari iniziali dell'hardware includono anche SpaceXAI e Oracle Cloud Infrastructure.

Ottimizzazione dell'infrastruttura per l'Agentic AI

L'introduzione della Vera CPU risponde alle specifiche esigenze computazionali degli agenti autonomi. Questi sistemi richiedono analisi rapida dei dati e interazioni frequenti con strumenti software esterni, compiti che differiscono significativamente dall'elaborazione parallela massiva gestita dalle GPU. NVIDIA riferisce che le query di dati aziendali vengono eseguite fino a tre volte più velocemente su Vera rispetto alle CPU server standard, mentre le sandbox degli agenti vedono un aumento delle prestazioni del 50%.

La distribuzione strategica di questo hardware è già in fase di scalata. Oracle Cloud Infrastructure ha annunciato piani per integrare centinaia di migliaia di unità Vera nei suoi data center a partire dal 2026. Questa adozione su larga scala suggerisce una transizione verso cluster specializzati in cui la CPU non è più un componente secondario, ma un motore specializzato per la logica e la gestione degli strumenti.

L'efficienza dei costi rimane un fattore trainante primario per questo passaggio all'hardware dedicato. Se abbinato al sistema Vera Rubin NVL72, NVIDIA afferma che i costi di inferenza per l'agentic AI possono essere ridotti a un decimo del prezzo per token. Delegando i compiti di orchestrazione a un processore dedicato, gli sviluppatori di AI possono massimizzare l'utilizzo dei loro cluster GPU, accorciando potenzialmente i cicli di addestramento e distribuzione per i modelli autonomi di prossima generazione.

Sebbene ci sforziamo di garantire l'accuratezza, bytevyte può commettere errori. Si consiglia agli utenti di verificare tutte le informazioni in modo indipendente. Non accettiamo alcuna responsabilità per errori o omissioni.

Sources

Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs

NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’

✔Human Verified

Ottimizzazione dell'infrastruttura per l'Agentic AI

Sources

Related Articles