Congress Wants Tech Companies to Pay Up for AI Training Data

Faire des entreprises d'IA Besoin de payer les données de formation qui alimentent leurs systèmes d'IA génératifs? La question est vivement contestée dans la Silicon Valley et dans une vague de poursuites intentées contre des géants technologiques comme Meta, Google et Openai. À Washington, DC, cependant, il semble y avoir un consensus croissant que les géants de la technologie doivent tousser.

Aujourd'hui, lors d'une audience au Sénat sur l'impact de l'IA sur le journalisme, les législateurs des deux côtés de l'allée ont convenu qu'Openai et d'autres devraient payer des médias pour utiliser leur travail dans des projets d'IA. “Ce n'est pas seulement moralement raison”, a déclaré Richard Blumenthal, le démocrate qui préside le sous-comité judiciaire de la vie privée, de la technologie et de la loi qui a tenu l'audience. «C'est légalement nécessaire.»

Josh Hawley, un républicain travaillant avec Blumenthal sur la législation sur l'IA, a accepté. “Il ne devrait pas être que simplement parce que les plus grandes entreprises du monde veulent engloutir vos données, elles devraient être en mesure de le faire”, a-t-il déclaré.

Les dirigeants de l'industrie des médias à l'audience ont décrit aujourd'hui comment les entreprises de l'IA mettent en péril leur industrie en utilisant leur travail sans compensation. Curtis Legeyt, PDG de la National Association of Broadcasters, Danielle Coffey, PDG de la News Media Alliance, et Roger Lynch, PDG de Condé Nast, ont tous pris la parole en faveur de la licence. (Wired appartient à Condé Nast.)

Coffey a affirmé que les sociétés d'IA «éviscéraient le contenu de qualité sur lequel elles se nourrissent» et Lynch caractérisé les données de formation grattées sans autorisation comme des «marchandises volées». Coffey et Lynch ont également tous deux déclaré qu'ils pensaient que les entreprises de l'IA enfreignent le droit d'auteur en vertu de la loi actuelle. Lynch a exhorté les législateurs à clarifier que l'utilisation du contenu journalistique sans d'abord de négociation de licences n'est pas protégé par une utilisation équitable, une doctrine juridique qui permet les violations du droit d'auteur dans certaines conditions.

Terrain d'entente

Les audiences du Sénat peuvent être contradictoires, mais l'ambiance aujourd'hui était largement sympathique. Les législateurs et les initiés de l'industrie des médias ont souvent applaudi les déclarations des autres. “Si le Congrès pouvait clarifier que l'utilisation de notre contenu ou d'un autre contenu d'éditeur, pour la formation et la production de modèles d'IA n'est pas une utilisation équitable, alors le marché libre s'occupera du reste”, a déclaré Lynch à un moment donné. “Cela me semble éminemment raisonnable”, a répondu Hawley.

Le professeur de journalisme Jeff Jarvis était la seule voix discordante de l'audience. Il a affirmé que la formation sur les données obtenues sans paiement est, en effet, une utilisation équitable et s'est prononcée contre les licences obligatoires, faisant valoir qu'elle endommageait l'écosystème de l'information plutôt que de la sauvegarder. “Je dois dire que je suis offensé de voir des éditeurs à faire pression pour une législation protectionniste, négociant sur le capital politique gagné par le journalisme”, a-t-il déclaré, en se précipitant sur ses collègues orateurs. (Jarvis a également été soumis à la seule ligne de questionnement contentieuse de l'audience, de la républicaine Marsha Blackburn, qui a aigaté Jarvis pour savoir si l'IA est biaisée contre les conservateurs et a récité un poème généré par l'IA louant le président Biden comme preuve.)

En dehors de la salle du comité, il y a moins d'accord que des licences obligatoires sont nécessaires. OpenAI et d'autres sociétés d'IA ont fait valoir qu'il n'est pas viable de licencier toutes les données de formation, et certains experts indépendants de l'IA sont d'accord.