Google lanza Gemini 3.1 Flash TTS para audio con IA
Google anunció el lanzamiento de Gemini 3.1 Flash TTS el 15 de abril de 2026. Según un comunicado de prensa de la empresa, este modelo de texto a voz de próxima generación proporciona audio de alta fidelidad con matices emocionales. El modelo utiliza "audio tags" para permitir el control de la locución vocal mediante comandos de lenguaje natural como [susurra] o [grita]. Actualmente es compatible con más de 70 idiomas y está integrado en Google Vids, la Gemini API y Vertex AI.
Control de lenguaje natural y matices emocionales
La innovación principal de Gemini 3.1 Flash TTS es su capacidad para interpretar el contexto emocional del texto. Según las especificaciones técnicas de Google, los creadores pueden dictar el tono y el estilo insertando etiquetas específicas dentro de la entrada. Esta funcionalidad elimina la necesidad de una edición manual compleja. El modelo tiene como objetivo cerrar la brecha entre las voces sintéticas y la narración de estilo humano para uso empresarial.
Integración empresarial y medidas de seguridad
Google ha integrado el modelo en Google Vids, su herramienta de creación de video impulsada por IA. Para abordar las preocupaciones sobre los deepfakes, el modelo incorpora la marca de agua SynthID. Según Google, esta herramienta forense digital inserta marcadores imperceptibles en el audio. Estos marcadores garantizan que el contenido generado por IA sea identificable para fines de seguridad y cumplimiento.
Disponibilidad global y acceso para desarrolladores
A partir del 16 de abril de 2026, Gemini 3.1 Flash TTS está disponible a través de Vertex AI. La compatibilidad con más de 70 idiomas en su lanzamiento permite la creación de contenido localizado. Esta disponibilidad puede reducir los costes asociados con los servicios profesionales de locución para formación corporativa y marketing.
Conclusión
El lanzamiento de Gemini 3.1 Flash TTS representa un cambio hacia una síntesis de voz más accesible y de alta calidad. Al combinar el control de lenguaje natural con funciones de seguridad como SynthID, Google proporciona una herramienta integral para aplicaciones empresariales globales.
Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.
✔Human Verified