The Generative AI Copyright Fight Is Just Getting Started

Le plus grand combat de la révolution générative de l'IA est dirigée vers la salle d'audience – et non, il ne s'agit pas du dernier drame de salle de conférence à Openai. Les auteurs de livres, les artistes et les codeurs contestent la pratique de l'enseignement des modèles d'IA pour reproduire leurs compétences en utilisant leur propre travail comme manuel de formation.

Le débat se concentre sur les milliards d'œuvres qui sous-tendent l'impressionnante formule de mots d'outils comme Chatgpt, les prouesses de codage du copilote de Github et le flair artistique de générateurs d'images comme celui de Startup MidJourney. La plupart des travaux utilisés pour former les algorithmes sous-jacents ont été créés par des personnes, et beaucoup d'entre eux sont protégés par le droit d'auteur.

Les constructeurs d'IA ont en grande partie supposé que l'utilisation du matériel protégé par le droit d'auteur comme données de formation est parfaitement légale sous l'égide de «l'utilisation équitable» – après tout, ils empruntent le travail pour en extraire des signaux statistiques, n'essayant pas de le faire passer comme les leurs. Mais comme les générateurs d'images et autres outils se sont révélés capables d'imiter de manière impressionnante les œuvres dans leurs données de formation, et l'échelle et la valeur des données de formation sont devenues claires, les créateurs pleurent de plus en plus.

Chez Livewired à San Francisco, l'événement du 30e anniversaire du magazine Wired, deux dirigeants de cette résistance naissants se sont affrontés avec un défenseur des droits des entreprises d'IA pour développer la technologie sans encombre. Ont-ils cru que la formation sur l'IA est une utilisation équitable? “La réponse est non, je ne le fais pas”, a déclaré Mary Rasenberger, PDG de la Guilde des auteurs, qui représente les auteurs de livres et poursuit à la fois Openai et son principal support, Microsoft, pour violation du droit d'auteur de ses membres.

Quatre personnes posant pour un portrait dans une toile de fond bleue

De gauche à droite: l'écrivain senior câblé Kate Knibbs a discuté des droits des créateurs et de l'IA avec Mike Masnick, Mary Rasenberger et Matthew Butterick chez Livewired à San Francisco,.

Photographie: Aldo Chacon

Risque existentiel

Au cœur de la plainte de la Guilde des auteurs, c'est que l'utilisation d'Openai et d'autres de leur matériel produit finalement des travaux concurrents lorsque les utilisateurs demandent à un chatbot de cracher un poème ou une image. “Il s'agit d'une utilisation très commerciale, et le mal est très clair”, a déclaré Rasenberger. «Cela pourrait vraiment détruire la profession d'écriture. C'est pourquoi nous sommes dans ce cas. La Guilde des auteurs, qui construit un outil qui aidera les entreprises génératrices sur les entreprises d'IA pour obtenir des licences sur les travaux de ses membres, estime qu'il peut y avoir des moyens parfaitement éthiques de former l'IA. «C'est très simple: obtenez la permission», a-t-elle déclaré. Dans la plupart des cas, l'autorisation viendra moyennant des frais.

Mike Masnick, PDG du Blog TechDirt et également du Copia Institute, un groupe de réflexion sur la politique technologique, a une vision différente. “Je vais dire le contraire de tout ce que Mary vient de dire”, a-t-il dit. L'IA générative est une utilisation équitable, a-t-il soutenu, notant les similitudes des récents différends juridiques avec les poursuites antérieures, certaines impliquant la guilde de l'auteur, dans laquelle indexer les travaux créatifs afin que les moteurs de recherche puissent les trouver efficacement survivre aux défis.

Une victoire pour les groupes d'artistes ne serait pas nécessairement très utile aux écrivains individuels, a ajouté Masnick, qualifiant le concept même de droit d'auteur un programme qui était destiné à enrichir les éditeurs, plutôt que de protéger les artistes. Il a fait référence à ce qu'il a appelé un système de licence de musique «corrompu» qui envoie peu de valeur à ses créateurs.

Bien que tous les futurs verdicts de la salle d'audience dépendent probablement des arguments juridiques concernant une utilisation équitable, Matthew Butterick, un avocat qui a déposé un certain nombre de poursuites contre les sociétés d'IA génératrices, a déclaré que le débat concerne vraiment les sociétés technologiques qui tentent d'accumuler plus de pouvoir et de le conserver. «Ils ne sont plus en compétition pour voir qui peut être le plus riche; Ils sont en compétition pour être les plus puissants », a-t-il déclaré. “Ce qu'ils ne veulent pas, c'est que les personnes avec des droits d'auteur ont un veto sur ce qu'ils veulent faire.”

Masnick a répondu qu'il était également préoccupé par qui gagne le pouvoir de l'IA, faisant valoir que l'obligation de sociétés technologiques à payer des artistes renforcerait davantage les plus grands joueurs de l'IA en rendant trop cher pour les insurgés de former leurs systèmes.

Rasenberger s'est moquée de la suggestion d'un équilibre de pouvoir entre les joueurs technologiques et les auteurs qu'elle représente, en comparant les bénéfices moyens de 20 000 $ par an pour les auteurs à temps plein à la récente évaluation de 90 milliards de dollars d'OpenAI. «Ils ont l'argent. La communauté des artistes ne le fait pas », a-t-elle déclaré.