I benchmark della CPU NVIDIA Vera rivelano un salto prestazionale del 60% per i carichi di lavoro di AI agentica
NVIDIA ha svelato i primi dati pubblici sulle prestazioni della sua Vera CPU, un processore progettato per gestire le richieste specifiche dei carichi di lavoro di AI agentica all'interno dei moderni data center. Secondo i risultati dei benchmark rilasciati questa settimana, il nuovo chip offre un miglioramento delle prestazioni di 1,6 volte rispetto alla precedente generazione Grace CPU. Questo incremento di velocità è abbinato a un sottosistema di memoria che ha mantenuto il 90% della sua larghezza di banda di picco di 1,2 TB/s durante test intensivi, risolvendo un collo di bottiglia critico nella gestione dei cluster AI.
La Vera CPU è basata sull'architettura Armv9.2 e dispone di 88 core personalizzati Olympus. Con un thermal design power (TDP) di 450 watt, il processore è progettato per attività ad alta intensità che supportano l'infrastruttura AI, come la compilazione di codice e l'orchestrazione dei dati. NVIDIA ha dichiarato che il passaggio verso agenti AI autonomi richiede una nuova classe di CPU in grado di sostenere prestazioni elevate su tutti i core attivi, fornendo al contempo una larghezza di banda di memoria massiccia per alimentare i cluster GPU affamati di dati.
Impatto strategico sull'infrastruttura AI
L'introduzione della Vera CPU rappresenta un cambiamento nel modo in cui NVIDIA posiziona il proprio silicio per la "fabbrica dell'IA". Mentre le GPU si occupano del lavoro pesante di addestramento e inferenza dei modelli, la CPU rimane responsabile della logica complessa di orchestrazione dei flussi di dati e della gestione degli stack software che consentono agli agenti AI di funzionare. Raggiungendo 1,2 TB/s di larghezza di banda di memoria, la Vera CPU garantisce che il movimento dei dati non diventi un collo di bottiglia secondario con la crescita delle dimensioni dei modelli e della complessità agentica.
Per i decisori aziendali, le prestazioni della Vera CPU evidenziano la crescente specializzazione dello stack hardware. Il salto generazionale del 60% nelle prestazioni suggerisce che le organizzazioni che scalano le proprie operazioni di AI potrebbero dover valutare l'intero tessuto computazionale invece di concentrarsi esclusivamente sul numero di GPU. La capacità dei core Olympus di mantenere una larghezza di banda vicina al picco sotto pieno carico è particolarmente rilevante per l'orchestrazione dei dati in tempo reale, dove la latenza può degradare la reattività dei sistemi agentici.
Questa release hardware si allinea con una tendenza più ampia del settore in cui i chip per server general-purpose vengono sostituiti da silicio specializzato, su misura per i requisiti ad alta intensità di dati del machine learning. NVIDIA ha confermato che la Vera CPU è ottimizzata per il "plumbing" specifico dei cluster AI, assicurando che l'infrastruttura circostante possa tenere il passo con la rapida evoluzione dei modelli generativi e degli agenti software autonomi.
Sebbene ci impegniamo per l'accuratezza, bytevyte può commettere errori. Si consiglia agli utenti di verificare tutte le informazioni in modo indipendente. Non accettiamo alcuna responsabilità per errori o omissioni.
Sources
NVIDIA Vera CPU Is ‘Packing a Heavy-Hitting Punch’ Against Competition
Related Articles
- NVIDIA consegna le prime CPU Vera a OpenAI e Anthropic per carichi di lavoro di Agentic AI
- NVIDIA Vera CPU viene lanciata come prodotto standalone per alimentare l'infrastruttura degli agenti AI
- I ricavi di NVIDIA salgono a 81,6 miliardi di dollari mentre la nuova architettura Vera Rubin NVL72 punta all'efficienza dell'Agentic AI
✔Human Verified