Licence de musique AI: l'industrie se concentre sur le mauvais problème

Colonne invitée: Music Ally publie des colonnes d'invités qui expriment l'opinion des auteurs notables qui font progresser des perspectives spécifiques sur des questions importantes. Ceux-ci sont choisis à la discrétion de l'équipe éditoriale et ne sont pas payés pour. Vous pouvez explorer les archives de la colonne d'invité ici.

Ceci est un article invité de Veteran Tech and Music Exécutif Virginie Berger. C'est le dernier d'une courte série de messages (voici le premier et le second) de Berger sur un niveau de haut niveau aux développements et comment elle pense qu'ils peuvent avoir un impact sur l'industrie de la musique.


Overvew:

  • Les licences de sortie manquent le point; Le vrai problème est la formation, qui utilise de grandes quantités de matériel protégé par le droit d'auteur sans autorisation.
  • La compensation doit être basée sur la quantité de contenu ingérée – et licence – pendant la formation, et non sur les similitudes de sortie; Aime le prélèvement de copie privée.
  • Les plates-formes doivent être responsables d'étiqueter le contenu d'IA et de développer des outils de traçabilité; L'échec à agir les risques sapant l'industrie musicale.

La mauvaise couche du problème

Virginie Berger

L'industrie musicale se concentre sur la mauvaise couche du problème. Le débat central autour de l'IA génératrice est encadré en termes de sorties, qui a une chanson, qui est créditée si une mélodie semble similaire. Génératif mais au niveau ne fonctionne pas comme l'inspiration humaine. Ces systèmes ne sont pas inspirés par des chansons individuelles; Ils sont formés sur des données massives, en clouant des milliers ou des millions de pistes pour apprendre les modèles musicaux, les strouses et le style.

Cela signifie que chaque sortie est le reflet de Tout Le modèle a été formé, pas une copie directe d'une entrée, mais un remix statistique de toutes les ingestion antérieures. La licence d'une chanson ici et là après la construction du modèle manque entièrement le point. Les dégâts se produisent Pendant la formationpas lorsqu'une sortie est publiée.

Et voici la réalité: le grattage de millions de pistes n'est pas techniquement nécessaire. Selon David Hughes (ancien CTO de la RIAA et stratège en chef de l'initiative AI: OK), à qui il a parlé lors de l'écriture de ces articles, l'expérience avec les systèmes musicaux de Genai a montré qu'ils ont effectué un impact sur les styles et les genres utilisent moins de 100 000 pistes à haute charie. Ces tests, effectués avec un modèle développé pour créer des antécédents et de la musique ambiante pour une utilisation dans des sites publics ont démontré qu'un échantillon représentatif de musique, et non de grattage exhaustif, est suffisant pour de fortes performances.

Comme Hughes m'a également rappelé, Pandora n'avait autrefois que 1,6 million de pistes dans son catalogue, et moins de la moitié de celles généraient plus de 90% des revenus de la plate-forme. La réalité est qu'un petit pourcentage de musique commerciale explique la grande majorité de l'écoute et des revenus, et génératif des modèles n'a pas besoin d'accès à tout cela. En fait, une petite fration bien organisée et bien étiquetée d'un perct de musique liée à des marchandises pourrait être Singe pour former des systèmes capables.

Est-ce que je sais comment générer pour les entreprises à gratter l'ensemble de l'Internet? Non pour améliorer les performances du modèle, mais pour construire un bouclier juridique. S'ils ont admis qu'ils n'avaient besoin que d'une frottement de musique de valeur marchande, ils seraient la force de démarrer des objectifs pour ce sous-ensemble. Au lieu de cela, ils affirment qu'ils « ont besoin de tout » pour justifier le grattage de masse et éviter de payer pour ce qu'ils utilisent. C'est une défense stratégique, pas une exigence technique.

« Une fration d'un perct de musique liée à Merchially pourrait être célibataire pour former un modèle d'IA »

Virginie Berger


Pourquoi l'octroi de licences est une impasse

Les modèles génératifs n'oublient pas. Une fois formés, ils réutilisent les modèles absorbés à l'infini, générant des sorties à des échelles qui rivalisent directement avec la musique créée par l'homme. Licensing Sorties après l'entraînement est trop tard, les dégâts sont causés.

Même si les titulaires de droits recouvrent 50 millions de dollars en frais de licence, ils pourraient perdre 500 millions de dollars en revenus futurs, en streaming, en transactions de synchronisation ou en fangour. Deezer est déjà devenu une étude de cas: ils ont révélé que 18% de toutes les musiques téléchargées en streaming sont entièrement générées par l'AI, cannibalisent des ruisseaux d'artistes et réduisant la musique à un contenu de fond désesposible.


Pourquoi la valeur de la musique s'effondre

La musique est traitée non pas comme de l'art mais comme une source de données. Une fois que le modèle est formé, les articles sont confrontés à une compétition synthétique infinie. Et maintenant, avec le développement rapide d'outils de séparation des sources, les systèmes n'ont plus besoin de tiges isolées pour apprendre ou générer. Ils peuvent extraire des éléments individuels, des voix, des tambours, des mélodies, à partir de pistes entièrement mixtes et les utiliser pour créer de nouvelles œuvres.

Ce processus se produit silencieusement, sans détection et sans consentement. Une ligne vocale ou un rythme peut être tiré d'un single à succès, intégré à l'entraînement, puis recombiné en sorties sans origine traçable. Cela rend l'idée traditionnelle de licence des enregistrements individuels ou des tiges entièrement obsolètes. La séparation des sources fait de chaque chanson mixte un ensemble de données potentiels, disponible pour la réutilisation, le remixage et la déconstruction silencieux. Et l'industrie, pour la partie Monste, agit comme si cela ne voit pas cela arriver.

« L'idée traditionnelle de licence des enregistrements individuels ou des tiges (peut être) entièrement obsolète »

Virginie Berger


Le vrai problème est au stade de la formation

Nous sommes toujours coincés dans le mauvais cadre. L'industrie musicale Keepps parle de paternité, de résultats, de similitude mélodique, comme si c'était là que le transfert de valeur se produit. Mais le vrai transfert se produit pendant la formation.

Ces systèmes sont formés sur des milliards de takens. Dans l'IA, un jeton est l'unité jetable de sens, comme une syllabe en audio ou un fragment de notation. Si 15% de ces jetons proviennent de la musique protégé par le droit d'auteur, ces œuvres ont façonné la capacité du modèle. Cette influence est mesuble et elle est précieuse.

La compensation ne doit pas être basée sur l'endroit où sa sortie semble similaire à une chanson particulière ou a utilisé une chanson particulière. Il devrait être basé sur la quantité de travaux donnés que contribués au processus de formation. Il ne s'agit pas du traçage dans la mélodie, il s'agit de reconnaître l'ingézon de la main-d'œuvre créative à l'échelle industrielle.

Une fois au système a absorbé ce travail, il peut générer des sorties sans fin, qu'elles ressemblent ou non à l'original. C'est pourquoi les modèles d'attribut (fonctions d'influence, intégres, batermarchage) échouent: ils poursuivent la similitude ou la propriété au lieu d'une contribution de reconnaissance.


Un meilleur modèle: compensation par ingnesstion, pas ressemblance

Nous devons traiter les données de formation comme une ressource, pas comme gratuitement. Cela signifie construire des cadres qui reflètent le fonctionnement actuel de Genai, et non la façon dont nous le souhaitons dans le monde. Les licences doivent se produire au moment de l'ingestion, avant que les modèles ne soient formés. La comptabilité basée sur les jetons devrait suivre la quantité de contenu protégé utilisée, et les micropaiements devraient refléter la valeur et l'influence extraites pendant la formation, pas seulement les sorties.

Nous avons un précédent pour ceci: le prélèvement de copie privé. Lorsque la copie individuelle ne coulait pas, les détenteurs de droits ont créé un système de rémunération basé sur le volume et le comportement, comme lorsque les gens ont copié la musique sur des bandes ou des CD. Au lieu de chasser chaque copie, un tarif forfaitaire est collecté en fonction du comportement ou des ventes d'appareils et redistribué aux créateurs.

La même logique doit maintenant s'appliquer à l'IA. Si nous savons que les modèles sont formés sur du contenu protégé, nous n'avons pas besoin de retracer chaque mélodie, ils devraient payer en fonction de ce qu'ils ont ingéré. Et une part des revenus liés à l'IA devrait être redirigée en fonds culturels qui soutiennent de vrais créateurs humains, pas seulement les plus grands détenteurs de droits.

Mais même si nous créons un système de licence pour la ingitation, un nouveau défi actuars: quelles garanties avons-nous que les modèles formés sur les travaux de licence n'auront pas leur capacité à intégrer tranquillement dans les modèles? La réutilisation post-entraînement est un problème réel et non résolu. Une fois formés, les connaissances du modèle peuvent être exportées, fines ou utilisées comme couches fondées pour de nouveaux systèmes, sans avoir besoin de repenser les données d'origine. Ainsi, à moins que de solides normes d'audit et de transparence ne soient appliquées, même les risques d'ingnésser se mentent devenant un paiement ponctuel pour une exploitation infinie en aval.

« Si nous savons que les modèles sont formés sur du contenu protégé, nous n'avons pas besoin de retracer chaque mélodie, ils devraient payer en fonction de ce qu'ils ont ingéré »

Virginie Berger


Nous avons besoin de la responsabilité de la plate-forme et de la réforme des statutaires

Cela signifie que les plates-formes doivent étiqueter clairement le contenu généré par l'IA. Audiencs désert pour savoir wheter qu'ils écoutent de la musique fabriquée par une personne ou générée par une machine. Nous devons également utiliser des outils existants comme ISCC (Code de contenu standard international) pour créer une traçabilité et une transparence. L'ISCC est une empreinte digitale numérique unique qui identifie un contenu, comme une chanson, une vidéo ou une image, basée sur ses données réelles, pas son titre ou son créateur. Cela fonctionne comme un ID intelligent qui peut suivre et faire correspondre le contenu à travers les platoformes, même il a été légèrement modifié ou renommé.

Cette recherche actuelle sur la similitude du contenu est principalement effectuée par les développeurs sur une base volontaire, et il est étonnant que les détenteurs de droits ne se comportent pas dans ces normes de manière plus proactive. Idem avec des outils comme HarmonyCloak, développés par des chercheurs du Mosis Lab à l'Université du Tennessee, Knoxville et conçu pour rendre les fichiers musicaux essentiellement non créables à des modèles génératifs. L'industrie musicale devrait investir fortement dans ces développements.

Le système juridique américain commence également à se réveiller. Dans une action en droit d'auteur impliquant Meta, le juge de district américain Vince Chharia déclare que Meta était « destinée à échouer » si les plaignants pouvaient montrer que des outils d'IA formés aux travaux copyés produisaient des résultats qui ont sapé le marché de ces travaux. Comme il l'a dit: « Vous avez des entreprises utilisant du matériel protégé par le droit d'auteur à créer sur un produit capable de produire un nombre AMB de produits à compatissement. » Et il a directement contesté la défense de Half de «Utilisation équitable», disant, « Je ne comprends tout simplement pas comment cela peut être une utilisation équitable. »

L'implication est claire: les tribunaux commencent à reconnaître que le préjudice de base se produit pendant la formation, pas seulement dans les sorties. Mais l'industrie elle-même doit agir plus rapidement.


Protéger les intrants ou perdre l'industrie

Il ne s'agit pas d'influence ou d'inspiration au sens humain. Il s'agit de réutilisation industrielle du travail créatif à grande échelle, sans consentement, compensation ou visibilité. Si nous conservons des licences de licence après coup, nous ne régulons pas Genai, nous l'appurtenons. Un peu comme approuver la formation sans consentement avec le retrait.

L'industrie musicale doit maintenant déplacer la concentration vers la régulation des informations, l'étiquetage du contenu d'IA et l'investissement et la création de systèmes de paiement qui réfléchissent, pas seulement la similitude au niveau de la surface.

Si nous ne protégeons pas le stage de formation, chaque artiste rivalisera peut-être avec un système formé sur son propre travail. Et aucune économie créative, aussi forte, ne peut survivre à cela.