Stability AI stellt Stable Audio 3.0 mit sechsminütiger Musikgenerierung vor
Stability AI hat Stable Audio 3.0 veröffentlicht, ein bedeutendes Update für seine generative Musikplattform, das es Nutzern nun ermöglicht, Tracks in voller Länge von bis zu sechs Minuten zu erstellen. Diese Version verdoppelt das bisherige Limit von drei Minuten aus Version 2.0 und ermöglicht die Generierung kompletter Songs mit ausgeprägten strukturellen Elementen wie Intros, Strophen und Refrains.
Das neue Modell basiert auf einer verbesserten Latent-Diffusion-Architektur, die für die Handhabung komplexer musikalischer Arrangements konzipiert wurde. Über die verlängerte Dauer hinaus führt Stable Audio 3.0 ein natives Bewusstsein für Songstrukturen ein, was der KI hilft, die musikalische Konsistenz über längere Laufzeiten hinweg beizubehalten. Diese Entwicklung ist besonders nützlich für Creator, die Hintergrundmusik oder thematische Partituren benötigen, die kein manuelles Looping oder umfangreiche Bearbeitung erfordern.
Für Nutzer mit leistungsstarker Hardware bringt das Update Unterstützung für lokale Inferenz. Stability AI bestätigte, dass das Modell für NPU-ausgestattete PCs optimiert ist, was eine schnellere Verarbeitung direkt auf dem Gerät des Nutzers ermöglicht, anstatt sich ausschließlich auf Cloud-Server zu verlassen. Dieser Trend hin zu On-Device-KI spiegelt eine breitere Branchenentwicklung wider, um Latenzzeiten zu verringern und den Datenschutz für Content Creator zu verbessern.
Auch die kommerzielle Verfügbarkeit ändert sich mit dieser Veröffentlichung. Stability AI stellt Mitgliedern seines kommerziellen Pro-Tiers offene Gewichte für Stable Audio 3.0 zur Verfügung. Dies ermöglicht es professionellen Anwendern, die Technologie in ihre eigenen Workflows zu integrieren oder das Modell auf ihrer privaten Infrastruktur zu hosten. Seit dem 21. Mai 2026 steht das Tool über die offizielle Stable Audio-Website zum Testen bereit, wo Nutzer mit den neuen sechsminütigen Generierungsfunktionen experimentieren können.
Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Nutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Sources
Stable Audio 3.0: Full-Length Music Generation
Related Articles
- Google veröffentlicht Gemini 3.1 Flash TTS für AI Audio
- Google erweitert Gemini-Ökosystem mit nativer macOS-App und Lyria-Musik-Tools
- DeepSeek V4 Launch führt Billionen-Parameter Pro- und High-Speed Flash-Modelle ein
✔Human Verified