Google DeepMind lleva los modelos abiertos Gemma 4 a Amazon

Google DeepMind ha ampliado su cartera de modelos de pesos abiertos con el lanzamiento de la familia Gemma 4 en Amazon Bedrock. Este lanzamiento, anunciado esta semana, introduce tres variantes ajustadas por instrucciones diseñadas para maximizar la inteligencia por parámetro en aplicaciones empresariales. Los modelos están disponibles bajo la licencia Apache 2.0, lo que proporciona a los desarrolladores opciones de despliegue flexibles para tareas multimodales y análisis de contexto largo.

La línea Gemma 4 incluye el Gemma 4 31B, el Gemma 4 26B-A4B y el Gemma 4 E2B. Estos modelos utilizan un diseño de atención híbrido que permite una ventana de contexto de hasta 256K tokens. Esta capacidad es particularmente relevante para la Generación Aumentada por Recuperación (RAG) y el procesamiento de conjuntos de documentos extensos. Cada variante de la familia admite llamadas a funciones nativas y entradas multimodales, lo que permite a los modelos procesar tanto texto como imágenes simultáneamente.

Eficiencia arquitectónica y Mixture-of-Experts

Un aspecto técnico destacado es el Gemma 4 26B-A4B, que emplea una arquitectura de Mixture-of-Experts (MoE). Este modelo específico contiene un total de 25,2 mil millones de parámetros, pero solo activa 3,8 mil millones durante la inferencia. Este diseño tiene como objetivo proporcionar el rendimiento de un modelo más grande manteniendo la velocidad y los menores costes de computación asociados a los sistemas más pequeños. Al integrar estos modelos en Amazon Bedrock, AWS proporciona un entorno gestionado donde las empresas pueden escalar estos activos de pesos abiertos sin gestionar la infraestructura subyacente.

La disponibilidad de Gemma 4 en AWS refleja una tendencia creciente de proveedores de nube que alojan modelos abiertos de alto rendimiento junto a los propietarios. Para los responsables de la toma de decisiones, esto ofrece una vía para evitar el bloqueo del proveedor (vendor lock-in) mientras se aprovecha la investigación de Google a través del ecosistema de nube de Amazon. La inclusión de llamadas a funciones nativas simplifica aún más la integración de estos modelos en los flujos de trabajo empresariales existentes y APIs externas.

A partir del 2026-06-16, los desarrolladores pueden acceder a estos modelos para crear aplicaciones que requieran altas capacidades de razonamiento dentro de un recuento de parámetros limitado. La familia Gemma 4 es un movimiento estratégico para cerrar la brecha entre los modelos ligeros listos para dispositivos móviles y los sistemas de frontera masivos, centrándose en la eficiencia para despliegues de IA de grado de producción.

Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.

Sources

Introducing Gemma 4 models on Amazon Bedrock

✔Human Verified

Eficiencia arquitectónica y Mixture-of-Experts

Sources

Related Articles