Google DeepMind porta i modelli aperti Gemma 4 su Amazon Bed

Google DeepMind ha ampliato il suo portfolio di modelli open-weight con il lancio della famiglia Gemma 4 su Amazon Bedrock. Questa release, annunciata questa settimana, introduce tre varianti instruction-tuned progettate per massimizzare l'intelligenza per parametro per le applicazioni aziendali. I modelli sono disponibili sotto licenza Apache 2.0, offrendo agli sviluppatori opzioni di distribuzione flessibili per task multimodali e analisi di contesti estesi.

La gamma Gemma 4 include Gemma 4 31B, Gemma 4 26B-A4B e Gemma 4 E2B. Questi modelli utilizzano un design ad attenzione ibrida che consente una context window fino a 256K token. Questa capacità è particolarmente rilevante per la Retrieval-Augmented Generation (RAG) e l'elaborazione di set di documenti estesi. Ogni variante della famiglia supporta il function calling nativo e input multimodali, consentendo ai modelli di elaborare simultaneamente sia testo che immagini.

Efficienza Architetturale e Mixture-of-Experts

Un punto di forza tecnico fondamentale è il Gemma 4 26B-A4B, che impiega un'architettura Mixture-of-Experts (MoE). Questo specifico modello contiene un totale di 25,2 miliardi di parametri, ma ne attiva solo 3,8 miliardi durante l'inferenza. Questo design mira a fornire le prestazioni di un modello più grande mantenendo la velocità e i costi di calcolo ridotti associati a sistemi più piccoli. Integrando questi modelli in Amazon Bedrock, AWS fornisce un ambiente gestito in cui le aziende possono scalare questi asset open-weight senza dover gestire l'infrastruttura sottostante.

La disponibilità di Gemma 4 su AWS riflette una tendenza crescente dei cloud provider che ospitano modelli aperti ad alte prestazioni accanto a quelli proprietari. Per i decision-maker, ciò offre una via per evitare il vendor lock-in sfruttando al contempo la ricerca di Google attraverso l'ecosistema cloud di Amazon. L'inclusione del function calling nativo semplifica ulteriormente l'integrazione di questi modelli nei workflow aziendali esistenti e nelle API esterne.

A partire dal 16-06-2026, gli sviluppatori possono accedere a questi modelli per creare applicazioni che richiedono elevate capacità di ragionamento con un numero di parametri contenuto. La famiglia Gemma 4 rappresenta una mossa strategica per colmare il divario tra i modelli leggeri pronti per il mobile e i massicci sistemi di frontiera, concentrandosi sull'efficienza per le implementazioni IA di livello production.

Sebbene ci impegniamo per l'accuratezza, bytevyte può commettere errori. Si consiglia agli utenti di verificare tutte le informazioni in modo indipendente. Non accettiamo alcuna responsabilità per errori o omissioni.

Sources

Introducing Gemma 4 models on Amazon Bedrock

✔Human Verified

Efficienza Architetturale e Mixture-of-Experts

Sources

Related Articles