bytevyte
bytevyte
Language
ai-beats-fr

Utilisation informatique native de Gemini 3.5 Flash : Google cible l'automatisation des agents en entreprise

utilisation informatique native de Gemini 3.5 Flash

Google a introduit l'utilisation informatique native de Gemini 3.5 Flash comme outil intégré au modèle, marquant un changement par rapport à l'offre d'utilisation informatique en tant que service séparé pour l'intégrer directement dans le modèle Flash principal. Cette capacité, disponible depuis le 24 juin 2026, permet aux développeurs de créer des agents personnalisés capables de voir, raisonner et agir dans des environnements navigateur, mobile et bureau sans avoir besoin d'un modèle d'utilisation informatique dédié.

L'utilisation informatique était auparavant proposée comme un modèle Gemini 2.5 autonome. En l'intégrant comme outil natif dans Gemini 3.5 Flash, Google simplifie la voie de développement pour les workflows d'agents en entreprise. Le modèle prend déjà en charge l'appel de fonctions et des outils intégrés comme la recherche et les cartes. L'ajout de l'utilisation informatique native signifie que les développeurs peuvent désormais appeler un seul modèle pour le raisonnement et l'interaction avec l'environnement, réduisant la complexité architecturale dans les déploiements d'agents.

Ce que l'utilisation informatique native de Gemini 3.5 Flash change pour les développeurs

L'effet pratique pour les développeurs est que Gemini 3.5 Flash peut désormais observer un écran, interpréter ce qu'il voit et exécuter des actions comme cliquer, taper ou naviguer, le tout au sein d'un même pipeline d'inférence. Cela compte pour les tâches d'automatisation à long terme où un agent doit maintenir le contexte sur des dizaines ou des centaines d'étapes. Les tests logiciels continus bénéficient d'un agent capable de parcourir une application web, de détecter des régressions et de consigner des problèmes sans changer de modèle.

Google décrit cette nouvelle capacité comme offrant sa meilleure performance à ce jour pour l'utilisation informatique agentique. L'intégration cible l'automatisation en entreprise, les tests logiciels continus et le travail de connaissance dans les applications professionnelles. Ce sont les catégories où une utilisation informatique fiable offre le meilleur retour sur investissement pour les entreprises déployant des agents IA à grande échelle.

Les entreprises peuvent accéder à l'utilisation informatique native de Gemini 3.5 Flash via l'API Gemini et la plateforme Gemini Enterprise Agent. La disponibilité directe via les points de terminaison API existants signifie que les équipes travaillant déjà avec l'infrastructure IA de Google peuvent activer la fonctionnalité sans provisionner de ressources supplémentaires ni gérer des déploiements de modèles séparés. Pour les organisations construisant des pipelines d'agents, cela se traduit par moins de pièces mobiles et un modèle de déploiement plus simple.

Architecture de sécurité pour les agents autonomes

Les agents opérant dans des environnements réels sont confrontés à des risques de sécurité spécifiques, en particulier les attaques par injection de prompts où une page ou une entrée malveillante détourne les instructions de l'agent. Google a répondu à cela par un entraînement adversarial ciblé pour l'utilisation informatique de Gemini 3.5 Flash. Le modèle a été délibérément exposé à des attaques de type injection pendant l'entraînement pour développer une résistance au niveau du modèle plutôt que de se fier uniquement à des filtres externes.

Au-delà de l'entraînement au niveau du modèle, Google publie deux systèmes de sauvegarde optionnels pour les entreprises. Le premier exige une confirmation explicite de l'utilisateur avant que l'agent n'exécute des actions sensibles ou irréversibles, comme soumettre un bon de commande ou supprimer des données. Le second arrête automatiquement les tâches si le système détecte une tentative d'injection indirecte de prompt.

Ces sauvegardes complètent une approche de défense en profondeur qui inclut le sandboxing de l'environnement de l'agent et le maintien d'une vérification humaine dans la boucle. Pour les entreprises déployant des agents dans des secteurs réglementés ou des scénarios orientés client, ces contrôles répondent aux préoccupations de conformité concernant la prise d'actions autonomes. La combinaison du renforcement au niveau du modèle et de l'application des politiques au moment de l'exécution offre aux entreprises plusieurs couches de protection.

La stratégie d'atténuation des injections de prompts est particulièrement pertinente car l'utilisation informatique native de Gemini 3.5 Flash fonctionne sur navigateur, mobile et bureau. Cela élargit la surface d'attaque par rapport aux appels API textuels. L'entraînement adversarial réduit le risque au niveau du modèle, tandis que les systèmes de sauvegarde fournissent une application des politiques au moment de l'exécution que les entreprises peuvent configurer par déploiement.

Implications stratégiques pour le marché de l'IA en entreprise

La décision de Google d'intégrer l'utilisation informatique dans le modèle Flash principal plutôt que de maintenir une offre séparée signale une stratégie produit claire. Les modèles d'utilisation informatique autonomes obligent les développeurs à gérer deux points de terminaison et à gérer le passage de contexte entre modèles. L'intégration native simplifie la pile et abaisse la barrière à la création d'agents interagissant avec des interfaces graphiques, rendant le développement d'agents en entreprise plus accessible à un plus large éventail d'équipes.

Cette décision positionne Gemini 3.5 Flash plus directement face aux plateformes concurrentes de construction d'agents. D'autres fournisseurs proposent l'utilisation informatique via des agents séparés ou des cadres d'outils externes que les développeurs doivent connecter. Avoir la capacité intégrée dans un seul appel API donne à Google un avantage structurel en termes de facilité de déploiement. Pour les acheteurs en entreprise comparant les plateformes, le coût total de possession change lorsqu'un fournisseur gère l'ensemble du pipeline d'agents sous un seul point de terminaison.

Le marché de l'automatisation en entreprise est l'opportunité immédiate adressable. Les tests logiciels continus à eux seuls représentent un segment de plusieurs milliards de dollars où les agents IA peuvent remplacer ou augmenter les workflows de QA manuels. L'automatisation du travail de connaissance, y compris des tâches comme l'extraction de données dans les applications d'entreprise, le remplissage de formulaires et la recherche multi-étapes dans des outils professionnels, est un autre cas d'usage à forte valeur où l'utilisation informatique native élimine les frictions d'intégration. L'élimination du passage de contexte entre modèles séparés améliore directement la fiabilité pour ces tâches de longue durée.

Pour les entreprises évaluant les plateformes d'agents IA, le choix entre une approche native et une alternative assemblée a des implications en termes de coût et de fiabilité. Une intégration native signifie un seul accord de niveau de service, une relation de facturation et une posture de sécurité à gérer. Assembler un modèle de raisonnement, un modèle de vision et un modèle d'utilisation informatique introduit plus de points de défaillance et une latence plus élevée, en particulier pour les tâches nécessitant un contexte soutenu sur de nombreuses étapes.

Les sauvegardes en entreprise en pratique

L'approche de sécurité à deux couches reflète les exigences que les acheteurs en entreprise apportent aux déploiements d'agents. Un modèle capable d'agir sur écran est intrinsèquement plus risqué qu'un modèle qui ne génère que du texte. La stratégie de Google consistant à offrir des garde-fous configurables plutôt que des restrictions codées en dur donne aux entreprises la flexibilité d'adapter les contrôles de sécurité à leur tolérance au risque spécifique.

La sauvegarde optionnelle de confirmation utilisateur correspond naturellement aux workflows avec des étapes de révision, comme les approbations d'achat ou la publication de contenu. La fonction d'arrêt automatique pour l'injection indirecte de prompts est plus pertinente pour les agents autonomes opérant dans des environnements non fiables, comme la navigation sur le web ouvert ou le traitement de contenu soumis par l'utilisateur. Les deux sauvegardes peuvent être activées indépendamment, permettant aux entreprises de calibrer l'autonomie de leurs agents par cas d'usage.

Les organisations adoptant l'utilisation informatique native de Gemini 3.5 Flash doivent évaluer quelle configuration de sauvegarde correspond à leur contexte de déploiement. Pour les agents totalement autonomes fonctionnant dans des sandbox contrôlés, l'entraînement au niveau du modèle peut fournir une protection suffisante. Pour les agents manipulant des transactions financières ou des données personnelles, les deux couches de sauvegarde ainsi qu'une vérification humaine seraient la configuration prudente. La présence de ces contrôles de qualité entreprise réduit la charge de diligence raisonnable pour les industries réglementées envisageant l'automatisation par agents.

Contexte plus large du marché

Cette sortie s'inscrit dans une tendance plus large où les fournisseurs de modèles fondamentaux absorbent directement les capacités d'agent dans leurs modèles de base. À mesure que l'utilisation informatique, l'utilisation d'outils et le raisonnement à long terme passent de services séparés à des fonctionnalités natives du modèle, la dynamique concurrentielle du marché de l'IA en entreprise évoluera vers l'exhaustivité de la plateforme plutôt que la performance de solution ponctuelle. Les fournisseurs capables de proposer des capacités de raisonnement, de vision et d'action sous une seule API ont un avantage de coût structurel par rapport à ceux nécessitant une orchestration multi-modèles.

Pour les responsables technologiques évaluant leur stratégie d'infrastructure IA, l'émergence de l'utilisation informatique native dans Gemini 3.5 Flash suggère une fenêtre qui se rétrécit pour construire des systèmes d'agents sur des piles multi-modèles. Le coût d'assembler des modèles séparés pour le raisonnement, la vision et l'utilisation informatique pourrait bientôt dépasser les avantages de qualité de chaque modèle à mesure que les intégrations natives mûrissent. Les entreprises qui normalisent tôt sur une plateforme avec utilisation informatique native peuvent éviter les coûts de migration futurs à mesure que le marché se consolide autour d'offres intégrées.

Sources

Introducing computer use in Gemini 3.5 Flash

✔Human Verified


Recherché et recoupé avec des sources primaires par la rédaction de Bytevyte.