Stability AI lance Stable Audio 3.0 avec la génération de musique de six minutes
Stability AI a publié Stable Audio 3.0, une mise à jour majeure de sa plateforme de musique générative qui permet désormais aux utilisateurs de créer des morceaux complets allant jusqu'à six minutes. Cette version double la limite précédente de trois minutes de la version 2.0, permettant la génération de chansons entières avec des éléments structurels distincts tels que des intros, des couplets et des refrains.
Le nouveau modèle repose sur une architecture de diffusion latente améliorée, conçue pour gérer des arrangements musicaux complexes. Au-delà de la durée prolongée, Stable Audio 3.0 introduit une reconnaissance native de la structure des morceaux, ce qui aide l'IA à maintenir une cohérence musicale sur des durées plus longues. Ce développement est particulièrement utile pour les créateurs ayant besoin de musiques d'ambiance ou de partitions thématiques ne nécessitant pas de bouclage manuel ou de montage approfondi.
Pour les utilisateurs disposant d'un matériel performant, la mise à jour apporte la prise en charge de l'inférence locale. Stability AI a confirmé que le modèle est optimisé pour les PC équipés de NPU, permettant un traitement plus rapide directement sur l'appareil de l'utilisateur plutôt que de dépendre uniquement des serveurs cloud. Ce passage vers l'IA sur l'appareil reflète une tendance plus large de l'industrie visant à réduire la latence et à améliorer la confidentialité pour les créateurs de contenu.
La disponibilité commerciale évolue également avec cette version. Stability AI fournit les poids ouverts (open weights) de Stable Audio 3.0 aux membres de son niveau commercial Pro. Cela permet aux utilisateurs professionnels d'intégrer la technologie dans leurs propres flux de travail ou d'héberger le modèle sur leur infrastructure privée. Depuis le 21 mai 2026, l'outil est disponible pour test via le site officiel de Stable Audio, où les utilisateurs peuvent expérimenter les nouvelles capacités de génération de six minutes.
Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.
Sources
Stable Audio 3.0: Full-Length Music Generation
Related Articles
- Google lance Gemini 3.1 Flash TTS pour l'audio par IA
- Google étend l'écosystème Gemini avec une application macOS native et les outils musicaux Lyria
✔Human Verified