bytevyte
bytevyte
Language
ai-beats-fr

NVIDIA lance l'architecture Vera Rubin pour réduire drastiquement les coûts d'inférence de l'IA

architecture Vera Rubin

NVIDIA a présenté l'Vera Rubin architecture, une plateforme informatique de nouvelle génération conçue pour alimenter les charges de travail d'intelligence artificielle les plus exigeantes. Annoncé en amont de la conférence COMPUTEX 2026 à Taipei, le nouveau système est conçu pour gérer des modèles à mille milliards de paramètres tout en réduisant considérablement les coûts opérationnels associés à l'inférence à grande échelle.

La pièce maîtresse de cette annonce est le Vera Rubin NVL72, un système de rack refroidi par liquide qui intègre 36 Vera CPUs et 72 Rubin GPUs. Cette configuration matérielle est conçue pour répondre aux besoins massifs en calcul des modèles d'IA de pointe. NVIDIA a déclaré que l'architecture permet d'atteindre une réduction décuplée des coûts d'inférence par jeton, une mesure qui impacte directement la viabilité commerciale du déploiement de systèmes d'IA générative massifs à grande échelle.

Robotique avancée et systèmes autonomes

Au-delà de l'infrastructure des centres de données, l'entreprise a étendu sa portée dans l'IA physique avec le lancement de Jetson Thor. Cette nouvelle plateforme robotique délivre une performance de 2 070 téraflops FP4, fournissant le traitement haute vitesse nécessaire au raisonnement et à l'interaction robotiques complexes. La plateforme est destinée à combler le fossé entre l'intelligence numérique et le mouvement physique dans les environnements industriels et commerciaux.

L'entreprise a également lancé Alpamayo, une plateforme ouverte spécifiquement dédiée au développement de véhicules autonomes. Alpamayo utilise des modèles de vision-langage de 10 milliards de paramètres pour améliorer les capacités de raisonnement des systèmes de conduite autonome. En fournissant un cadre ouvert, NVIDIA vise à accélérer le déploiement de véhicules capables de mieux comprendre et de réagir à des environnements de conduite complexes grâce à un contexte linguistique et visuel avancé.

Implications stratégiques de l'architecture Vera Rubin

L'introduction de l'architecture Vera Rubin signale un virage vers un matériel plus efficace et spécialisé pour l'ère post-entraînement de l'IA. Alors que les entreprises passent de l'entraînement initial des modèles au déploiement à haut volume, la réduction des coûts par 10 offerte par le système NVL72 offre une voie claire pour la mise à l'échelle des services sans augmentation proportionnelle des dépenses énergétiques ou matérielles. L'accent mis sur le refroidissement liquide reflète également la nécessité croissante d'une gestion thermique avancée dans les centres de données à haute densité.

Le PDG de NVIDIA, Jensen Huang, doit prononcer un discours d'ouverture le 1er juin 2026, où de plus amples détails concernant le déploiement de ces technologies sont attendus. La poussée simultanée dans la robotique et la conduite autonome suggère une stratégie visant à dominer l'ensemble du cycle de vie de l'IA, des usines basées sur le cloud où les modèles voient le jour jusqu'aux appareils de bord où ils interagissent avec le monde physique.

Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.

Sources

NVIDIA GTC Taipei at COMPUTEX: Live Updates on What’s Next in AI

✔Human Verified

Share