AWS intègre les GPU NVIDIA Blackwell dans SageMaker avec les nouvelles instances G7e
Amazon Web Services (AWS) a annoncé la disponibilité générale de ses AWS G7e instances sur la plateforme SageMaker AI. Ces instances, devenues disponibles cette semaine, utilisent les NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs pour accélérer l'inférence de l'IA générative. En intégrant ce matériel de pointe, AWS offre un environnement haute performance pour le déploiement de modèles d'apprentissage automatique complexes à grande échelle.
Les spécifications techniques des AWS G7e instances marquent un saut substantiel par rapport à la génération précédente G6e. Chaque GPU dispose de 96 Go de mémoire GDDR7, doublant ainsi la capacité de mémoire de son prédécesseur. AWS a déclaré que ces améliorations offrent jusqu'à 2,3 fois plus de performance, permettant un traitement plus efficace des tâches d'IA complexes. Notamment, une instance ml.g7e.2xlarge à nœud unique peut désormais héberger un modèle de 120 milliards de paramètres.
Avantages stratégiques des AWS G7e instances
Pour les organisations gérant des modèles de fondation massifs, l'évolutivité du nouveau matériel est un facteur critique. La configuration la plus large, la variante ml.g7e.48xlarge à 8 GPU, prend en charge des modèles allant jusqu'à 300 milliards de paramètres. Cela permet aux entreprises d'exécuter des applications d'IA hautement sophistiquées sur un seul cluster, réduisant ainsi la complexité architecturale souvent associée à l'inférence distribuée.
L'intégration des NVIDIA Blackwell GPUs dans l'écosystème SageMaker offre une voie simplifiée pour le déploiement. En proposant ces AWS G7e instances, l'entreprise permet aux développeurs de tirer parti de puces haute performance sans quitter leurs flux de travail d'apprentissage automatique établis. Cette initiative renforce la position concurrentielle d'AWS sur le marché des infrastructures cloud, alors que les entreprises recherchent des moyens plus rentables de mettre à l'échelle les solutions d'IA générative.
Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.
Related Articles
- AWS réduit les coûts de l'IA avec Nova model distillation
- AWS et NEURA s'associent pour le déploiement de la robotique cognitive
- Anthropic lance Claude Opus 4.7 avec des capacités de raisonnement et de vision améliorées
✔Human Verified