Qui a besoin du soutien de célébrités alors que vous pouvez simplement demander à votre nouvelle IA de créer une vidéo de l'hippopotame pygmée Moo Deng, en vogue sur Internet ? C'est ce qu'a fait Meta pour le dévoilement de Meta Movie Gen, qu'il a décrit comme « notre recherche révolutionnaire sur l'IA générative pour les médias, qui inclut des modalités telles que l'image, la vidéo et l'audio ».
Poussée par des invites textuelles, l'annonce était accompagnée de la mise en garde désormais obligatoire selon laquelle, bien sûr, Meta n'essaie pas de détruire les moyens de subsistance des humains. « L'IA générative ne remplace pas le travail des artistes et des animateurs. Nous partageons cette recherche parce que nous croyons au pouvoir de cette technologie pour aider les gens à s'exprimer de nouvelles manières et à offrir des opportunités à des personnes qui ne les auraient pas autrement », affirme-t-il.
Le modèle de génération audio de Movie Gen peut produire de l'audio d'une durée allant jusqu'à 45 secondes « y compris le son ambiant, les effets sonores (Foley) et la musique de fond instrumentale, le tout synchronisé avec le contenu vidéo ».
Nous savons ce que vous vous demandez : sur quoi cette formation a-t-elle été formée ? Le document de recherche de Meta indique environ 1 million d'heures d'audio, mais d'autres détails se concentrent sur la mécanique du processus de pré-formation et de réglage, plutôt que sur le matériel lui-même.