New York Times Says OpenAI Erased Potential Lawsuit Evidence
Les poursuites ne sont jamais exactement une fête de l'amour, mais la lutte pour les droits d'auteur entre le New York Times, OpenAI et Microsoft devient particulièrement controversée. Cette semaine, le Times a affirmé que les ingénieurs d'OpenAI avaient effacé par inadvertance des données que l'équipe du journal avait passé plus de 150 heures à extraire comme preuve potentielle.
OpenAI a pu récupérer une grande partie des données, mais l'équipe juridique du Times affirme qu'il manque toujours les noms de fichiers et la structure des dossiers d'origine. Selon un déclaration déposé au tribunal mercredi par Jennifer B. Maisel, avocate du journal, cela signifie que les informations « ne peuvent pas être utilisées pour déterminer où les articles copiés des plaignants » ont pu être incorporés dans les modèles d'intelligence artificielle d'OpenAI.
“Nous ne sommes pas d'accord avec les caractérisations faites et déposerons bientôt notre réponse”, a déclaré le porte-parole d'OpenAI, Jason Deutrom, à WIRED dans un communiqué. Le New York Times a refusé de commenter.
Le Times a déposé une plainte pour atteinte aux droits d'auteur contre OpenAI et Microsoft l'année dernière, alléguant que les sociétés avaient illégalement utilisé ses articles pour former des outils d'intelligence artificielle comme ChatGPT. Cette affaire est l’une des nombreuses batailles juridiques en cours entre les sociétés d’IA et les éditeurs, y compris une poursuite similaire intentée par le Daily News et traitée par certains des mêmes avocats.
L'affaire du Times est actuellement en cours d'enquête, ce qui signifie que les deux parties sont en train de fournir les documents et informations demandés qui pourraient devenir des preuves. Dans le cadre de ce processus, le tribunal a demandé à OpenAI de montrer au Times ses données de formation, ce qui est un gros problème : OpenAI n'a jamais révélé publiquement exactement quelles informations ont été utilisées pour construire ses modèles d'IA. Pour le divulguer, OpenAI a créé ce que le tribunal appelle un « bac à sable » composé de deux « machines virtuelles » que les avocats du Times pourraient examiner. Dans sa déclaration, Maisel a déclaré que les ingénieurs d'OpenAI avaient « effacé » les données organisées par l'équipe du Times sur l'une de ces machines.
Selon le dossier de Maisel, OpenAI a reconnu que les informations avaient été supprimées et a tenté de résoudre le problème peu de temps après en avoir été alerté au début du mois. Mais lorsque les avocats du journal ont examiné les données « restaurées », elles étaient trop désorganisées, les obligeant « à recréer leur travail à partir de zéro, en utilisant d'importantes heures de travail et un temps de traitement informatique », ont déclaré plusieurs autres avocats du Times dans une lettre déposé au juge le même jour que la déclaration de Maisel.
Les avocats ont souligné qu’ils n’avaient « aucune raison de croire » que la suppression était « intentionnelle ». Dans les e-mails soumis en pièce jointe avec la lettre de Maisel, le conseiller d'OpenAI, Tom Gorman référé à l’effacement des données comme un « problème ».
Ce n’est pas le premier litige de ce type dans le cadre du procès. Au cours de l’année écoulée, le Times et les entreprises technologiques se sont battus pour savoir quelle partie serait chargée de trier les données de formation. Dans leur lettre la plus récente, les avocats du journal ont réaffirmé qu'OpenAI était le mieux placé pour le faire. “Le processus ne s'est pas déroulé sans heurts”, a déclaré Steven Lieberman, un autre avocat du Times. a écrit dans un dossier déposé plus tôt ce mois-ci, dans lequel il affirmait que « des problèmes techniques graves et répétés ont rendu impossible une recherche efficace et efficiente dans les ensembles de données de formation d'OpenAI afin de déterminer toute l'étendue de l'infraction d'OpenAI ».