This Startup Wants YouTube Creators to Get Paid for AI Training Data
Jusqu'à présent, quand Les entreprises d’IA se sont formées sur la précieuse réserve de vidéos, de sous-titres et d’autres contenus de YouTube, et ce, sans autorisation. Calliope Networks, une startup de licences de contenu axée sur l'IA, espère changer cela avec sa nouvelle « Licence to Scrape », un programme destiné directement aux stars de YouTube.
« Il existe une demande évidente de la part des sociétés d'IA pour supprimer le contenu YouTube. Nous le voyons à travers leurs actions. Donc, ce que nous essayons de faire, c'est de créer un outil qui rende la tâche légale et simple pour eux », déclare Dave Davis, PDG de Calliope Networks. Contrairement à d’autres grandes plateformes sociales, comme Reddit, YouTube n’a pas conclu d’accords avec les gros bonnets de l’IA pour supprimer ses vidéos. L'attrait de la License to Scrape est qu'elle évite que l'entreprise elle-même fournisse un grand volume de contenu YouTube en une seule fois en rassemblant un groupe de créateurs et en négociant une licence globale.
Davis a une expérience dans le domaine des licences de médias traditionnels ; il a quitté un poste à la Motion Picture Licensing Corporation pour lancer Calliope, pariant que l'industrie de l'IA finirait par s'éloigner du scraping sans autorisation et se tournerait vers l'octroi de licences comme norme. Il n'est pas le seul à croire ainsi ; c'est une période de boom pour les startups de licences de données IA. Calliope Networks est membre fondateur de la Datasets Providers Alliance, un groupe professionnel qui oblige tous les créateurs et titulaires de droits à opter pour le scraping.
Voici comment Davis espère que cela fonctionnera : les créateurs YouTube qui souhaitent concéder sous licence leurs données concluront un contrat avec Calliope, qui accordera ensuite une sous-licence à leur travail pour former des modèles fondamentaux d'IA générative. Il faudra d'abord une masse critique de contenu pour rendre l'accord suffisamment attractif pour les acteurs de l'IA, le programme devra donc intégrer les YouTubers avant de pouvoir être correctement opérationnel. Calliope prendrait un pourcentage des frais de licence payés par les sociétés d'IA.
Bien que ce type de licence soit rare dans le monde de l'IA, Davis a modelé le format de licence de suppression sur d'autres secteurs de l'industrie du divertissement, comme Broadcast Music Inc. (BMI) et l'American Society of Composers, Authors, and Publishers (ASCAP), qui tous deux utilisent des licences générales pour la musique.
« Le processus de recrutement n'en est qu'à ses débuts », explique Davis. Il estime que Calliope devra proposer au minimum 25 000 à 50 000 heures de contenu YouTube avant que celui-ci ne soit pris au sérieux par l'industrie de l'IA. Le fait que ce volume de séquences constitue le seuil probable pour l'octroi de licences générales démontre pourquoi le regroupement pourrait être le meilleur moyen pour certains créateurs de gagner de l'argent pour la formation en IA : dans ce secteur, le volume compte et les générateurs vidéo sont alimentés par une grande quantité de données.
Il n'y a pas encore de noms de renom approuvant la licence, mais Calliope a déjà recruté quelques agences de marketing d'influence comme Viral Nation pour attirer les clients. “J'ai reçu de très bons retours de la part des créateurs”, déclare Bianca Serafini, responsable des licences de contenu chez Viral Nation. Elle est convaincue qu'un grand nombre de clients de l'entreprise, soit près de 900 YouTubers, y participeront. “Personne ne nous a présenté quelque chose comme ça auparavant.”