bytevyte
bytevyte
Language
ai-beats-fr

Google lance Gemini 3.5 Live Translate pour une traduction vocale continue en temps réel

Gemini 3.5 Live Translate

Google a lancé Gemini 3.5 Live Translate, un nouveau modèle audio conçu pour fournir une traduction vocale continue en temps réel. Annoncé le 9 juin 2026, le système marque une rupture avec les modèles de traduction traditionnels par tours de parole, qui exigent généralement que l'interlocuteur marque une pause avant que le logiciel ne génère une réponse. Au lieu de cela, ce nouveau modèle traite les flux audio en continu, maintenant un délai de seulement quelques secondes tout en préservant la hauteur de voix, le rythme et l'intonation du locuteur original.

La plateforme Gemini 3.5 Live Translate prend en charge plus de 70 langues et inclut la détection automatique de la langue, éliminant ainsi la nécessité pour les utilisateurs de configurer manuellement les paramètres d'entrée lors de conversations multilingues. Google déploie initialement la technologie via une version préliminaire privée pour les entreprises sur Google Meet et une version préliminaire publique de l'Gemini Live API. L'accès pour le grand public est également disponible via l'application Google Translate sur les appareils Android et iOS.

Capacités techniques et intégration en entreprise

L'innovation majeure de Gemini 3.5 Live Translate réside dans sa capacité à gérer les tâches de traduction vocale sans les pauses gênantes courantes dans les générations précédentes de logiciels de traduction. En générant un flux audio traduit de manière fluide, le modèle permet des interactions plus naturelles dans les contextes professionnels et personnels. La préservation des caractéristiques vocales telles que l'intonation garantit que le résultat traduit véhicule le contexte émotionnel et l'accentuation du locuteur original, ce qui constitue un facteur critique pour une communication efficace dans des environnements commerciaux à enjeux élevés.

Pour les utilisateurs en entreprise, l'intégration dans Google Meet suggère une focalisation sur la collaboration mondiale. Les entreprises opérant dans plusieurs régions peuvent utiliser l'outil pour faciliter des réunions où les participants parlent différentes langues en temps réel. La version préliminaire publique de l'Gemini Live API étend davantage ces capacités aux développeurs, permettant l'intégration d'une traduction à faible latence et au son naturel dans des applications et services tiers.

Impact sur le marché et positionnement stratégique

Le lancement de Gemini 3.5 Live Translate positionne Google pour rivaliser plus agressivement sur le marché de la communication en temps réel. En réduisant la latence de la traduction vocale à un niveau quasi instantané, l'entreprise s'attaque à l'un des principaux points de friction des opérations commerciales transfrontalières. La capacité de détecter automatiquement 70 langues rend l'outil polyvalent pour des équipes diversifiées qui peuvent passer d'une langue à l'autre au milieu d'une conversation.

À compter de juin 2026, la stratégie de déploiement met l'accent à la fois sur la croissance de l'écosystème des développeurs et sur l'utilité directe pour les consommateurs. Tandis que la version préliminaire pour entreprises se concentre sur les environnements de réunion structurés, la disponibilité sur les plateformes mobiles garantit que la technologie est accessible pour un usage occasionnel et les voyages. Cette approche à double voie permet à Google de recueillir des données de performance dans divers environnements acoustiques tout en établissant la marque Gemini comme leader des applications d'IA multimodales.

Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.

Sources

Fluid, natural voice translation with Gemini 3.5 Live Translate

✔Human Verified