Interactions API ahora es la puerta de enlace predeterminada para los agentes de Gemini
Google ha elevado su Interactions API a disponibilidad general, convirtiéndola en la interfaz principal de la empresa para construir aplicaciones con modelos y agentes de Gemini. La API, que entró en beta pública en diciembre de 2025, ahora cuenta con un esquema estable e introduce funciones que los desarrolladores han solicitado desde su lanzamiento inicial. El lanzamiento de la versión GA, anunciado el 22 de junio de 2026, marca una transición del acceso experimental a una plataforma de nivel de producción.
La versión GA consolida la inferencia de modelos y la orquestación de agentes en un único endpoint, eliminando la necesidad de realizar llamadas API separadas entre diferentes servicios de Google AI. Google ha actualizado toda su documentación para que la Interactions API sea la opción predeterminada y está trabajando con socios del ecosistema para que la adopten como la interfaz estándar en SDK y bibliotecas de terceros. Esta unificación simplifica significativamente la experiencia del desarrollador en comparación con el enfoque anterior, donde las llamadas a modelos y las herramientas de agentes residían en interfaces separadas.
Agentes gestionados y ejecución en segundo plano
Una adición clave con el lanzamiento de disponibilidad general son los Agentes Gestionados, que aprovisionan un sandbox Linux remoto con una sola llamada API. Dentro de este sandbox, un agente puede razonar, ejecutar código, navegar por la web y gestionar archivos de forma independiente. Google incluye el agente Antigravity como predeterminado, mientras que los desarrolladores pueden definir sus propios agentes personalizados para casos de uso específicos. El modelo de sandbox elimina la carga de infraestructura para los equipos de desarrollo que de otro modo tendrían que aprovisionar y asegurar sus propios entornos de ejecución.
La ejecución en segundo plano es otra capacidad significativa ahora disponible en la Interactions API. Permite que las tareas de agentes de larga duración continúen procesándose sin mantener una conexión de cliente abierta, lo cual es particularmente relevante para flujos de trabajo empresariales que implican procesamiento de datos, investigación en varios pasos o automatización programada. Esta característica por sí sola aborda un obstáculo operativo común: los equipos anteriormente tenían que construir sus propias capas de colas y gestión de estado para manejar cargas de trabajo asíncronas de agentes. Con la ejecución en segundo plano, Google maneja de forma nativa la gestión del ciclo de vida de estas tareas de larga duración.
La combinación de Agentes Gestionados y ejecución en segundo plano posiciona a la Interactions API como una plataforma para cargas de trabajo de agentes persistentes y autónomas, en lugar de simples llamadas de modelo de solicitud-respuesta. Esta distinción es importante para los equipos que construyen sistemas donde los agentes operan durante horas o días, no segundos.
Implicaciones empresariales
La consolidación de la inferencia de modelos y la gestión de agentes en una superficie API unificada reduce la complejidad de integración para los equipos que construyen sistemas de producción. Para los desarrolladores empresariales y CTOs que evalúan infraestructura de IA, la Interactions API elimina la necesidad de unir servicios separados para llamadas a modelos, orquestación de agentes y entornos de ejecución en sandbox. Esta es una reducción significativa en el área de superficie arquitectónica para las organizaciones que despliegan IA a escala.
Las implicaciones operativas van más allá del desarrollo inicial. Una superficie API unificada significa menos tokens de autenticación que gestionar, configuraciones de monitoreo y observabilidad más simples, y una superficie reducida para que los equipos de seguridad auditen. Para industrias reguladas donde cada integración de API externa requiere revisión de cumplimiento, consolidar múltiples interfaces en una sola agiliza los procesos de aprobación.
El movimiento de Google para hacer de la Interactions API la opción predeterminada en toda su documentación y SDK de socios señala una apuesta estratégica por el desarrollo de agentes basado en API. Este enfoque posiciona al ecosistema Gemini de Google de manera diferente a la de los competidores que separan el acceso a modelos de los entornos de ejecución de agentes. El próximo soporte de Gemini Omni, que Google ha declarado que llegará a la Interactions API pronto, sugiere que la empresa tiene la intención de que la API sea la puerta de enlace única para todas las cargas de trabajo multimodales y de agentes. Cuando llegue Gemini Omni, los desarrolladores accederán a capacidades de visión, audio y texto a través del mismo endpoint unificado, en lugar de tener que enrutar diferentes modalidades a través de diferentes superficies API.
Interactions API: de Beta a Disponibilidad General
La transición de beta pública a GA trae un esquema estable, lo que significa que no se esperan cambios disruptivos para las aplicaciones de producción. Los desarrolladores que construyeron sobre la versión beta deberán migrar a los endpoints estables, aunque Google no ha detallado un cronograma de desaprobación para las rutas de la API beta. La estabilidad del esquema es el factor más importante para los despliegues de producción, ya que permite a los equipos comprometerse con la API sin temor a rupturas inesperadas de integración.
La función de Agentes Gestionados y el modo de ejecución en segundo plano no estaban disponibles durante el período beta. Estas adiciones abordan dos de los puntos débiles más comunes que enfrentan los desarrolladores al desplegar agentes a escala: la falta de entornos sandbox persistentes y la incapacidad de ejecutar tareas de forma asíncrona. Para las organizaciones que han estado pilotando flujos de trabajo basados en agentes durante el período beta, la versión GA proporciona una base lista para producción para expandir esos pilotos a despliegues completos.
Posicionamiento competitivo
Con este lanzamiento, Google ofrece una alternativa más integrada a las cadenas de herramientas fragmentadas que actualmente caracterizan gran parte del desarrollo de agentes. Los competidores a menudo requieren servicios separados para inferencia de modelos, ejecución de código en sandbox y marcos de agentes, mientras que la Interactions API entrega todo esto en una sola llamada. Los ahorros en costos operativos derivados de la reducción del trabajo de integración podrían ser sustanciales para los equipos que gestionan múltiples despliegues de agentes, especialmente al considerar la carga de mantenimiento de mantener puntos de integración separados actualizados a través de cambios de versión de la API.
El agente Antigravity, que se envía como agente gestionado predeterminado, proporciona una capacidad de razonamiento y navegación lista para usar. Para los equipos que necesitan comportamientos de agente especializados, la ruta de definición de agente personalizado permite a las organizaciones desplegar agentes específicos del dominio que heredan la misma infraestructura de sandbox y ejecución. Este enfoque doble brinda a los equipos tanto un punto de partida para la creación rápida de prototipos como una ruta de migración hacia la personalización de producción, reduciendo el tiempo desde el concepto hasta el despliegue.
Análisis estratégico
Para los tomadores de decisiones técnicas que evalúan plataformas de IA, la versión GA de la Interactions API es un cambio en cómo Google enmarca su oferta para desarrolladores. En lugar de exponer Gemini como una API de modelo independiente con herramientas de agente opcionales, Google ahora presenta una superficie de desarrollo unificada donde la distinción entre llamar a un modelo y ejecutar un agente se difumina deliberadamente. Este modelo integrado se alinea con la dirección en la que se mueve la industria en general hacia arquitecturas centradas en agentes, donde la unidad de despliegue cambia de una llamada de modelo a una tarea autónoma.
La adopción de la Interactions API como predeterminada en toda la documentación de Google y los SDK de socios significa que el ecosistema se estandarizará en torno a esta interfaz. Los equipos que ya utilizan bibliotecas de terceros para el acceso a Gemini pueden esperar que esas bibliotecas transiten a la Interactions API como su backend predeterminado. Para las organizaciones con inversiones existentes en Google AI, esta estandarización reduce el riesgo de fragmentación de la plataforma y simplifica la capacitación del equipo, ya que los desarrolladores aprenden una superficie API en lugar de manejar múltiples interfaces.
El anuncio de Google esta semana confirma que la Interactions API es ahora la ruta recomendada para todos los nuevos proyectos de Gemini. Para los proyectos existentes construidos sobre APIs anteriores, la empresa no ha anunciado un cronograma de migración forzada, pero la configuración predeterminada de la documentación y los SDK sugiere que las interfaces más antiguas eventualmente serán desaprobadas. Los equipos que actualmente utilizan la API Gemini anterior deberían comenzar a planificar su migración a la Interactions API para evitar interrupciones, particularmente si planean adoptar Agentes Gestionados o capacidades de ejecución en segundo plano.
Los desarrolladores pueden comenzar a usar la versión GA de inmediato a través de AI Studio de Google y los endpoints estables de la API. La función de Agentes Gestionados y la ejecución en segundo plano están disponibles en el lanzamiento, y se espera el soporte de Gemini Omni en una actualización futura. El hito de GA señala que Google considera la API lista para producción para cargas de trabajo empresariales, y la empresa apuesta a que la interfaz unificada impulsará una adopción más profunda de Gemini entre los equipos de desarrolladores. Para los equipos de plataforma que evalúan su pila de IA, la versión GA de la Interactions API reduce una fuente de incertidumbre arquitectónica: la interfaz principal de Google AI ahora es estable y está definida para el futuro previsible.
Sources
Interactions API: our primary interface for Gemini models and agents
Related Articles
- Google presenta Gemini Omni Flash y Managed Agents para la automatización empresarial
- La aplicación Google Gemini añade simulaciones 3D interactivas y modelos de física
- Ask Ad Manager ofrece a los editores un agente conversacional basado en Gemini
✔Human Verified
Investigado y contrastado con fuentes primarias por el equipo editorial de Bytevyte. Este artículo se generó con la asistencia de inteligencia artificial y fue revisado por el equipo editorial de Bytevyte.