Google ajoute le modèle musical IA Lyria 3 à son application Gemini

Gemini est devenu le service phare des outils GenAI de Google : un assistant d'IA « multimodal » qui peut répondre aux questions, effectuer des recherches, automatiser des tâches et créer des images et des clips vidéo, entre autres tâches.

Désormais, il peut aussi générer de la musique. Cet après-midi, Google a ajouté à Gemini la dernière version du modèle de musique générative Lyria de son équipe DeepMind, le mettant ainsi à la portée de beaucoup plus d'utilisateurs.

Combien? Lors du récent appel aux résultats de la société mère Alphabet, le PDG Sundar Pichai a déclaré que l'application Gemini comptait plus de 750 millions d'utilisateurs actifs par mois. Un article de blog a annoncé aujourd'hui comment ces personnes pourront utiliser Lyria 3 pour créer de la musique.

« Décrivez simplement une idée ou téléchargez une photo, comme 'un slow jam R&B comique sur une chaussette trouvant son match' et en quelques secondes, Gemini la traduira en un morceau accrocheur de haute qualité », explique le message.

Les utilisateurs peuvent également télécharger une photo ou une vidéo et demander à Gemini de générer une piste avec des paroles qui correspondent à leur humeur. Attention, il y a des limites. Pour l'instant, Gemini ne peut créer que des pistes de 30 secondes avec Lyria 3, en exploitant l'IA Nano Banana de Google pour générer des pochettes.

« Le but de ces morceaux n'est pas de créer un chef-d'œuvre musical, mais plutôt de vous offrir une façon amusante et unique de vous exprimer », explique le billet de blog.

Parallèlement à l'actualité Gemini, Google a également annoncé que l'intégration de Lyria 3 avec l'outil Dream Track de YouTube s'étendait au-delà des États-Unis. Il permet aux YouTubers de générer des bandes sonores IA pour leurs vidéos Shorts.

Comme pour toute annonce de musique IA émanant d’une entreprise technologique géante, nous nous posons quelques questions sur la formation, ainsi que sur le respect des artistes et des droits d’auteur.

Le billet de blog présente Lyria comme quelque chose où « nous avons cherché à développer cette technologie de manière responsable en collaboration avec la communauté musicale », ajoutant que Google a « été très attentif aux droits d'auteur et aux accords de partenariat lorsque nous avons formé Lyria 3 ».

Qu’est-ce que cela signifie en pratique ? Music Ally comprend que la politique appliquée ici est que la formation de Lyria est conçue pour utiliser de la musique que YouTube et Google ont le droit d'utiliser en vertu de leurs conditions de service, de leurs accords de partenariat et de la « loi applicable ». C’est une expression que les avocats doivent discuter…

Début 2024, Billboard a rapporté que lorsque Google DeepMind travaillait pour la première fois sur la musique, il « avait formé son modèle sur un large éventail de musiques – y compris des enregistrements de grands labels protégés par le droit d’auteur – et était ensuite allé le montrer aux titulaires de droits, plutôt que de demander d’abord la permission ».

Cependant, YouTube s'est associé à des ayants droit et des artistes sur diverses expériences GenAI, gagnant en 2023 les éloges du PDG de Warner Music Group, Robert Kyncl, pour son approche – contexte obligatoire : il a passé 12 ans chez YouTube avant de passer chez WMG.

L'intégration Gemini de Lyria 3 comporte quelques garde-fous supplémentaires qui seront bien accueillis par les titulaires de droits musicaux, comme indiqué dans l'annonce d'aujourd'hui.

« La génération musicale avec Lyria 3 est conçue pour une expression originale, pas pour imiter des artistes existants. Si votre invite nomme un artiste spécifique, Gemini le prendra comme une large inspiration créative et créera un morceau partageant un style ou une ambiance similaire », a-t-il expliqué.

(Cela soulève des questions sur ce sur quoi le modèle a été formé afin de comprendre quels styles ou ambiances sont similaires à des artistes spécifiques. Cependant, il s'agit d'informations qui pourraient être glanées à partir de diverses sources, pas seulement de la musique originale.)

« Nous avons également mis en place des filtres pour vérifier les résultats par rapport au contenu existant », a ajouté Google, tout en signalant la possibilité pour les gens de signaler « un contenu susceptible de violer vos droits ou ceux d'autrui ».

Enfin, toutes les pistes générées dans Gemini auront le filigrane SynthID de Google intégré dans leurs fichiers. Il existe également une fonctionnalité qui permettra à Gemini de reconnaître ces traces, tout comme il peut déjà identifier les images et vidéos réalisées à l'aide des outils GenAI de Google.

« Téléchargez simplement un fichier et demandez s'il a été généré à l'aide de Google AI, et Gemini vérifiera SynthID et utilisera son propre raisonnement pour renvoyer une réponse », explique le billet de blog.