La plateforme NVIDIA Vera Rubin propulse les nouveaux serveurs Dell pour réduire les coûts de l'IA
NVIDIA et Dell Technologies ont dévoilé une nouvelle collaboration en matière d'infrastructure d'IA conçue pour réduire considérablement les coûts opérationnels liés à l'exécution d'agents autonomes. Annoncé cette semaine lors du Dell Technologies World, ce partenariat s'articule autour du serveur Dell PowerEdge XE9812, qui utilise la plateforme NVIDIA Vera Rubin NVL72. Cette combinaison matérielle vise à réduire le coût par jeton pour l'inférence d'IA à grande échelle jusqu'à 10 fois par rapport aux architectures précédentes, levant ainsi un obstacle majeur à l'adoption de l'IA en entreprise.
\n\n
L'architecture NVIDIA Vera Rubin introduit un CPU dédié conçu spécifiquement pour les charges de travail d'IA agentique. Selon NVIDIA, ce processeur exécute ces tâches complexes 50 % plus rapidement que les systèmes traditionnels basés sur x86. Un avantage technique clé est la bande passante mémoire de 1,2 To/s, soit trois fois plus que les solutions concurrentes. Cette bande passante élevée permet au système de gérer les mouvements de données rapides nécessaires au bon fonctionnement des agents autonomes dans des environnements de production.
\n\n
Impact stratégique de la plateforme NVIDIA Vera Rubin
\n\n
Le passage des pilotes d'IA expérimentaux à une production à grande échelle nécessite une réduction significative des dépenses de calcul. Dell et NVIDIA ciblent cette transition en proposant des solutions sur site qui concurrencent directement les fournisseurs de cloud public. Dell a déclaré que les entreprises déployant ces systèmes localement peuvent atteindre un seuil de rentabilité par rapport aux coûts des API cloud en seulement trois mois. Cette incitation financière s'accompagne du lancement de PowerRack, un système entièrement intégré qui combine calcul, réseau et stockage dans une solution unique à l'échelle du rack.
\n\n
Pour supporter la chaleur intense générée par ces systèmes haute performance, Dell a introduit le PowerCool CDU C7000. Cette unité de refroidissement en rack offre une capacité de plus de 220 kW et est la première du genre conçue spécifiquement pour la NVIDIA Vera Rubin NVL72. Ces avancées en gestion thermique sont nécessaires pour maintenir les niveaux de performance requis pour les modèles de pointe tels que Gemini 3 et Grok, que les entreprises s'efforcent d'intégrer sur site grâce à des partenariats stratégiques avec Google et SpaceXAI.
\n\n
Les premières livraisons des unités propulsées par Vera ont déjà atteint des acteurs majeurs de l'industrie, notamment OpenAI, Anthropic, Oracle et SpaceXAI. Pour les besoins à plus petite échelle, Dell lance également les stations de travail Deskside Agentic AI. Celles-ci permettent aux entreprises de faire fonctionner des agents autonomes localement, garantissant la souveraineté des données tout en conservant les avantages de performance de la nouvelle architecture. Alors que la demande en calcul d'IA continue de croître, cette approche matérielle intégrée offre une voie claire aux organisations pour faire évoluer leurs opérations d'IA tout en maîtrisant les coûts à long terme.
\n\n
Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.
Sources
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’
Dell Technologies Closes the Gap Between AI Ambition and AI Outcomes
Related Articles
- NVIDIA et Ineffable Intelligence s'associent pour faire progresser l'infrastructure de reinforcement learning
- NVIDIA lance la production de masse des GPU Rubin R100 et des CPU Vera pour l'IA de nouvelle génération
- Dell et Kioxia dévoilent un serveur de stockage AI flash de 9,8 Po pour les lacs de données massifs
✔Human Verified