NVIDIA livre ses premiers CPU Vera à OpenAI et Anthropic pour les charges de travail d'IA agentique
NVIDIA a commencé à livrer son premier CPU personnalisé, Vera, aux principaux laboratoires d'intelligence artificielle, notamment OpenAI et Anthropic. Cette sortie matérielle marque un tournant dans l'architecture des centres de données, délaissant les processeurs polyvalents au profit de puces optimisées pour les charges de travail d'agentic AI. Le CPU Vera est conçu pour gérer l'orchestration complexe, l'appel d'outils et les tâches d'apprentissage par renforcement qui créent souvent des goulots d'étranglement dans les environnements informatiques traditionnels.
Le nouveau processeur dispose de 88 cœurs Olympus personnalisés par socket et offre une bande passante mémoire de 1,2 To/s. Selon NVIDIA, l'architecture offre une efficacité énergétique deux fois supérieure à celle des infrastructures existantes. Bien qu'il puisse fonctionner de manière autonome, le processeur est principalement destiné à servir d'hôte pour les Rubin GPUs via l'interconnexion NVLink-C2C. Les premiers destinataires du matériel incluent également SpaceXAI et Oracle Cloud Infrastructure.
Optimiser l'infrastructure pour l'IA agentique
L'introduction du Vera CPU répond aux demandes de calcul spécifiques des agents autonomes. Ces systèmes nécessitent une analyse de données rapide et une interaction fréquente avec des outils logiciels externes, des tâches qui diffèrent considérablement du traitement parallèle massif géré par les GPUs. NVIDIA rapporte que les requêtes de données d'entreprise s'exécutent jusqu'à trois fois plus vite sur Vera par rapport aux CPU de serveurs standard, tandis que les bacs à sable (sandboxes) d'agents voient une augmentation de performance de 50 %.
Le déploiement stratégique de ce matériel est déjà en cours de mise à l'échelle. Oracle Cloud Infrastructure a annoncé son intention d'intégrer des centaines de milliers d'unités Vera dans ses centres de données à partir de 2026. Cette adoption à grande échelle suggère une transition vers des clusters spécialisés où le CPU n'est plus un composant secondaire mais un moteur spécialisé pour la logique et la gestion des outils.
L'efficacité des coûts reste un moteur principal de ce changement matériel. Lorsqu'il est associé au système Vera Rubin NVL72, NVIDIA affirme que les coûts d'inférence de l'agentic AI peuvent être réduits à un dixième du prix par jeton. En déchargeant les tâches d'orchestration vers un processeur dédié, les développeurs d'IA peuvent maximiser l'utilisation de leurs clusters GPU, raccourcissant potentiellement les cycles d'entraînement et de déploiement des modèles autonomes de nouvelle génération.
Bien que nous nous efforcions d'être précis, bytevyte peut faire des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité pour les erreurs ou omissions.
Sources
Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’
Related Articles
- NVIDIA lance la production de masse des GPU Rubin R100 et des CPU Vera pour l'IA de nouvelle génération
- La plateforme NVIDIA Vera Rubin propulse les nouveaux serveurs Dell pour réduire les coûts de l'IA
- NVIDIA et Ineffable Intelligence s'associent pour faire progresser l'infrastructure de reinforcement learning
✔Human Verified