Apple, Nvidia, Anthropic Used Thousands of Swiped YouTube Videos to Train AI
En réponse aux poursuites, des défendeurs tels que Méta, Openaiet Bloomberg ont soutenu que leurs actions constituent une utilisation équitable. Une affaire contre Eleutherai, qui a initialement gratté les livres et les a rendues publiques, a été volontairement rejeté par les plaignants.
Le litige dans les cas restants reste dans les premiers stades, laissant les questions entourant l'autorisation et le paiement non résolus. La pile a depuis été supprimée de son site de téléchargement officiel, mais il est toujours disponible sur les services de partage de fichiers.
«Les sociétés technologiques ont dirigé Roughshod», a déclaré Amy Keller, avocate et associée de la protection des consommateurs de la firme Dicello Levitt qui a intenté des poursuites au nom des créatifs dont le travail aurait été ramassé par les entreprises de l'IA sans leur consentement.
“Les gens sont préoccupés par le fait qu'ils n'avaient pas le choix en la matière”, a déclaré Keller. «Je pense que c'est ce qui est vraiment problématique.»
Perroquet
De nombreux créateurs se sentent incertains de la voie à venir.
Les Youtubers à plein temps patrouillent pour l'utilisation non autorisée de leur travail, le dépôt régulièrement de notifications de retrait, et certains craignent que ce ne soit qu'une question de temps avant que l'IA ne puisse générer un contenu similaire à ce qu'ils font – si cela ne produit pas de copycés.
Pakman, le créateur de The David Pakman Showa récemment vu la puissance de l'IA tout en faisant défiler Tiktok. Il est tombé sur une vidéo étiquetée comme un clip Tucker Carlson, mais quand Pakman l'a regardé, il a été surpris. Cela ressemblait à Carlson mais était, mot pour mot, ce que Pakman avait dit sur son émission YouTube, jusqu'à la cadence. Il a été également alarmé que un seul des commentateurs de la vidéo semblait reconnaître qu'il était faux – un clone vocal de Carlson lisant le script de Pakman.
“Cela va être un problème”, a déclaré Pakman dans un Vidéo youtube Il a fait à propos du faux. “Vous pouvez le faire essentiellement avec n'importe qui.”
Cofondateur eleutherai Sid Black a écrit Sur GitHub, il a créé des sous-titres YouTube en utilisant un script. Ce script télécharge les sous-titres de l'API de YouTube de la même manière que le navigateur d'une visionneuse YouTube les télécharge lorsque vous regardez une vidéo. Selon la documentation sur Github, Black a utilisé 495 termes de recherche pour éliminer les vidéos, notamment des «vloggers drôles», «Einstein», «Protestant noir», «Services sociaux protecteurs», «Infowars», «Chromodynamique quantique», «Ben Shapiro», »,», «Oughurs», «Fruitarian», «Gâteau de gâteau», «Lignes Nazca» et «Terre plate».
Bien que les conditions d'utilisation de YouTube interdire accéder à ses vidéos par «moyens automatisés», plus que 2 000 utilisateurs de GitHub ont mis en signet ou approuvé le code.
“Il existe de nombreuses façons dont YouTube pourrait empêcher ce module de fonctionner si c'était ce qu'ils recherchent”, a écrit l'ingénieur d'apprentissage automatique Jonas Depoix dans un discussion Sur GitHub, où il a publié le code que Black a utilisé pour accéder aux sous-titres YouTube. “Cela ne s'est pas produit jusqu'à présent.”
Dans un e-mail à Proof News, DePoix a déclaré qu'il n'avait pas utilisé le code depuis qu'il l'a écrit comme étudiant universitaire pour un projet il y a plusieurs années et a été surpris que les gens l'ont trouvé utile. Il a refusé de répondre aux questions sur les règles de YouTube.
Le porte-parole de Google, Jack Malon, a déclaré dans une réponse par e-mail à une demande de commentaire que la société avait pris “des mesures au fil des ans pour empêcher le grattage abusif et non autorisé”. Il n'a pas répondu aux questions sur l'utilisation par les autres entreprises du matériel comme données de formation.
Parmi les vidéos utilisées par les sociétés d'IA figurent 146 Perroquet d'Einsteinun canal avec près de 150 000 abonnés. Le gardien africain Gray, Marcia, qui ne voulait pas utiliser son nom de famille par peur de mettre en danger la sécurité du célèbre oiseau, a déclaré au début qu'elle pensait que c'était drôle d'apprendre que les modèles d'IA avaient des paroles ingérées d'un perroquet imitant.
«Qui voudrait utiliser la voix d'un perroquet?» Dit Marcia. «Mais alors, je sais qu'il parle très bien. Il parle dans ma voix. Il me fait donc percer, puis l'IA est perroché le perroquet. »
Une fois ingérés par l'IA, les données ne peuvent pas être non apprises. Marcia était troublée par toutes les manières inconnues dont les informations de son oiseau pouvaient être utilisées, notamment en créant un perroquet en double numérique et, elle s'inquiète, en faisant la maudire.
“Nous marchons sur un territoire inexploré”, a déclaré Marcia.