Les benchmarks du NVIDIA Vera CPU révèlent un bond de performance de 60 % pour les charges de travail de l'IA agentique
NVIDIA a révélé les premières données de performance publiques pour son Vera CPU, un processeur conçu pour répondre aux exigences spécifiques des charges de travail de l'IA agentique au sein du centre de données moderne. Selon les résultats des benchmarks publiés cette semaine, la nouvelle puce offre une amélioration de performance de 1,6x par rapport à la génération précédente Grace CPU. Cette augmentation de vitesse est associée à un sous-système de mémoire qui a maintenu 90 % de sa bande passante de pointe de 1,2 To/s lors de tests intensifs, s'attaquant ainsi à un goulot d'étranglement critique dans la gestion des clusters d'IA.
Le Vera CPU est basé sur l'architecture Armv9.2 et dispose de 88 cœurs Olympus personnalisés. Avec une enveloppe thermique (TDP) de 450 watts, le processeur est conçu pour des tâches de haute intensité qui soutiennent l'infrastructure d'IA, telles que la compilation de code et l'orchestration de données. NVIDIA a déclaré que le passage vers des agents d'IA autonomes nécessite une nouvelle classe de CPU capable de maintenir des performances élevées sur tous les cœurs actifs tout en fournissant une bande passante mémoire massive pour alimenter des clusters GPU gourmands.
Impact stratégique sur l'infrastructure d'IA
L'introduction du Vera CPU marque un tournant dans la manière dont NVIDIA positionne son silicium pour l'« usine à IA ». Alors que les GPU se chargent du gros du travail pour l'entraînement des modèles et l'inférence, le CPU reste responsable de la logique complexe d'orchestration des flux de données et de la gestion des piles logicielles qui permettent aux agents d'IA de fonctionner. En atteignant 1,2 To/s de bande passante mémoire, le Vera CPU garantit que le mouvement des données ne devienne pas un goulot d'étranglement secondaire à mesure que la taille des modèles et la complexité agentique augmentent.
Pour les décideurs en entreprise, la performance du Vera CPU souligne la spécialisation croissante de la pile matérielle. Le saut générationnel de 60 % en performance suggère que les organisations qui mettent à l'échelle leurs opérations d'IA pourraient devoir évaluer l'ensemble de leur infrastructure de calcul plutôt que de se concentrer uniquement sur le nombre de GPU. La capacité des cœurs Olympus à maintenir une bande passante proche du maximum sous pleine charge est particulièrement pertinente pour l'orchestration de données en temps réel, où la latence peut dégrader la réactivité des systèmes agentiques.
Cette sortie matérielle s'aligne sur une tendance plus large de l'industrie où les puces de serveurs polyvalentes sont remplacées par du silicium spécialisé, adapté aux exigences de données massives de l'apprentissage automatique. NVIDIA a confirmé que le Vera CPU est optimisé pour la « tuyauterie » spécifique des clusters d'IA, garantissant que l'infrastructure environnante puisse suivre le rythme de l'évolution rapide des modèles génératifs et des agents logiciels autonomes.
Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.
Sources
NVIDIA Vera CPU Is ‘Packing a Heavy-Hitting Punch’ Against Competition
Related Articles
- NVIDIA livre ses premiers CPU Vera à OpenAI et Anthropic pour les charges de travail d'IA agentique
- Le NVIDIA Vera CPU est lancé en tant que produit autonome pour alimenter l'infrastructure des agents IA
- Le chiffre d'affaires de NVIDIA grimpe à 81,6 milliards de dollars alors que la nouvelle architecture Vera Rubin NVL72 cible l'efficacité de l'IA agentique
✔Human Verified