Stability AI est l'un des leaders du monde de l'IA générative, avec notamment son entrée dans la musique en septembre dernier avec Stable Audio. Ce modèle a été mis à jour en avril de cette année pour créer des morceaux de musique complets, mais il dispose désormais d'un outil frère axé sur des échantillons et des effets sonores plus courts. Il s'appelle Stable Audio Open et peut générer jusqu'à 47 secondes de sons, des battements de tambour aux riffs d'instruments en passant par le chant des oiseaux.
La partie « Open » de son nom fait référence au modèle open source, ce qui signifie que « les utilisateurs peuvent affiner le modèle sur leurs propres données audio personnalisées ». Stability AI a cité l'exemple d'un batteur capable de « peaufiner des échantillons de ses propres enregistrements de batterie pour générer de nouveaux rythmes ».
Stability AI a peut-être perdu son responsable audio l'année dernière en raison d'un désaccord sur la question de savoir si la formation des IA sur du matériel protégé par le droit d'auteur est une utilisation équitable ou non, mais dans ce cas, elle a été franche sur son processus.
« Le nouveau modèle a été formé sur les données audio de FreeSound et de Free Music Archive », a expliqué la société. « Cela nous a permis de créer un modèle audio ouvert tout en respectant les droits des créateurs. »