NVIDIA presenta l'architettura Vera Rubin per abbattere i costi di inferenza AI
NVIDIA ha introdotto l'architettura Vera Rubin, una piattaforma di calcolo di prossima generazione progettata per alimentare i carichi di lavoro di intelligenza artificiale più esigenti. Annunciato in vista della conferenza COMPUTEX 2026 a Taipei, il nuovo sistema è progettato per gestire modelli con trilioni di parametri, riducendo significativamente i costi operativi associati all'inferenza su larga scala.
Il fulcro di questo annuncio è il Vera Rubin NVL72, un sistema rack raffreddato a liquido che integra 36 Vera CPUs e 72 Rubin GPUs. Questa configurazione hardware è costruita per rispondere ai massicci requisiti di calcolo dei modelli AI di frontiera. NVIDIA ha dichiarato che l'architettura ottiene una riduzione di dieci volte dei costi di inferenza per token, una metrica che influisce direttamente sulla fattibilità commerciale dell'implementazione di enormi sistemi di AI generativa su scala.
Robotica avanzata e sistemi autonomi
Oltre all'infrastruttura per i data center, l'azienda ha ampliato la sua portata nell'AI fisica con il debutto di Jetson Thor. Questa nuova piattaforma di robotica offre 2.070 teraflops FP4 di prestazioni, fornendo l'elaborazione ad alta velocità necessaria per il ragionamento e l'interazione robotica complessa. La piattaforma ha lo scopo di colmare il divario tra l'intelligenza digitale e il movimento fisico in contesti industriali e commerciali.
L'azienda ha inoltre lanciato Alpamayo, una piattaforma aperta specifica per lo sviluppo di veicoli autonomi. Alpamayo utilizza modelli vision-language con 10 miliardi di parametri per migliorare le capacità di ragionamento dei sistemi di guida autonoma. Fornendo un framework aperto, NVIDIA mira ad accelerare la diffusione di veicoli in grado di comprendere e reagire meglio a contesti di guida complessi attraverso un contesto linguistico e visivo avanzato.
Implicazioni strategiche dell'architettura Vera Rubin
L'introduzione dell'architettura Vera Rubin segna un passaggio verso un hardware più efficiente e specializzato per l'era post-addestramento dell'AI. Mentre le imprese passano dall'addestramento iniziale del modello alla distribuzione ad alto volume, la riduzione dei costi di 10 volte offerta dal sistema NVL72 fornisce un percorso chiaro per scalare i servizi senza aumenti proporzionali nel consumo energetico o nella spesa hardware. L'attenzione al raffreddamento a liquido riflette anche la crescente necessità di una gestione termica avanzata nei data center ad alta densità.
Il CEO di NVIDIA Jensen Huang terrà un keynote il 1° giugno 2026, dove sono attesi ulteriori dettagli sulla tabella di marcia di queste tecnologie. La spinta simultanea nella robotica e nella guida autonoma suggerisce una strategia volta a dominare l'intero ciclo di vita dell'AI, dalle fabbriche basate su cloud dove nascono i modelli fino ai dispositivi edge dove interagiscono con il mondo fisico.
Sebbene ci impegniamo per l'accuratezza, bytevyte può commettere errori. Si consiglia agli utenti di verificare tutte le informazioni in modo indipendente. Non accettiamo alcuna responsabilità per errori o omissioni.
Sources
NVIDIA GTC Taipei at COMPUTEX: Live Updates on What’s Next in AI
Related Articles
- I ricavi di NVIDIA salgono a 81,6 miliardi di dollari mentre la nuova architettura Vera Rubin NVL72 punta all'efficienza dell'Agentic AI
- La piattaforma NVIDIA Vera Rubin potenzia i nuovi server Dell per abbattere i costi dell'IA
- NVIDIA avvia la produzione di massa delle GPU Rubin R100 e delle CPU Vera per l'AI di prossima generazione
✔Human Verified