Google DeepMind apporte les modèles ouverts Gemma 4 sur Amaz

Google DeepMind a élargi son portefeuille de modèles open-weight avec le lancement de la famille Gemma 4 sur Amazon Bedrock. Cette version, annoncée cette semaine, introduit trois variantes optimisées pour les instructions, conçues pour maximiser l'intelligence par paramètre pour les applications d'entreprise. Les modèles sont disponibles sous licence Apache 2.0, offrant aux développeurs des options de déploiement flexibles pour les tâches multimodales et l'analyse de contextes longs.

La gamme Gemma 4 comprend le Gemma 4 31B, le Gemma 4 26B-A4B et le Gemma 4 E2B. Ces modèles utilisent une conception d'attention hybride qui permet une fenêtre de contexte allant jusqu'à 256K tokens. Cette capacité est particulièrement pertinente pour la génération augmentée par récupération (RAG) et le traitement de jeux de documents volumineux. Chaque variante de la famille prend en charge l'appel de fonctions natif et les entrées multimodales, permettant aux modèles de traiter simultanément du texte et des images.

Efficacité architecturale et Mixture-of-Experts

Un point technique clé est le Gemma 4 26B-A4B, qui emploie une architecture Mixture-of-Experts (MoE). Ce modèle spécifique contient un total de 25,2 milliards de paramètres mais n'en active que 3,8 milliards lors de l'inférence. Cette conception vise à offrir les performances d'un modèle plus grand tout en maintenant la vitesse et les coûts de calcul réduits associés aux systèmes plus petits. En intégrant ces modèles dans Amazon Bedrock, AWS fournit un environnement géré où les entreprises peuvent mettre à l'échelle ces actifs open-weight sans gérer l'infrastructure sous-jacente.

La disponibilité de Gemma 4 sur AWS reflète une tendance croissante des fournisseurs de cloud à héberger des modèles ouverts haute performance aux côtés de modèles propriétaires. Pour les décideurs, cela offre une voie pour éviter la dépendance vis-à-vis d'un fournisseur tout en tirant parti de la recherche de Google via l'écosystème cloud d'Amazon. L'inclusion de l'appel de fonctions natif simplifie davantage l'intégration de ces modèles dans les flux de travail d'entreprise existants et les API externes.

Depuis le 2026-06-16, les développeurs peuvent accéder à ces modèles pour créer des applications nécessitant des capacités de raisonnement élevées avec un nombre de paramètres limité. La famille Gemma 4 est une initiative stratégique visant à combler le fossé entre les modèles légers adaptés aux mobiles et les systèmes frontières massifs, en se concentrant sur l'efficacité pour les déploiements d'IA en production.

Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.

Sources

Introducing Gemma 4 models on Amazon Bedrock

✔Human Verified

Efficacité architecturale et Mixture-of-Experts

Sources

Related Articles