A New Group Is Trying to Make AI Data Licensing Ethical
La première vague Des principaux outils d'IA génératifs ont largement été formés sur «accessible au public»Données – en grande partie, tout et tout ce qui pourrait être gratté d'Internet. Désormais, les sources de données de formation restreignent de plus en plus l'accès et poussent les accords de licence. Avec la chasse à des sources de données supplémentaires s'intensifiant, de nouvelles startups de licence ont émergé pour maintenir le matériau source.
Le Alliance des fournisseurs de donnéesun groupe commercial formé cet été, veut rendre l'industrie de l'IA plus standardisée et plus équitable. À cette fin, il vient de publier un Poster le papier décrivant ses positions sur les principaux problèmes liés à l'IA. L'Alliance est composée de sept sociétés de licence d'IA, y compris une entreprise de gestion de la musique-coffre DroitsMarché japonais boursier Pixtaet startup génératrice-AI Copyright-Licence Réseaux calliopes. (Au moins cinq nouveaux membres seront annoncés à l'automne.)
La DPA préconise un système d'opt-in, ce qui signifie que les données ne peuvent être utilisées qu'après le consentement sont explicitement données par les créateurs et les détenteurs de droits. Cela représente un écart important par rapport à la façon dont les grandes sociétés d'IA principales opèrent. Certains ont développé leurs propres systèmes d'opt-out, ce qui a mis le fardeau sur les propriétaires de données pour tirer leur travail au cas par cas. D'autres n'offrent aucun désactivation.
Le DPA, qui s'attend à ce que les membres adhèrent à sa règle d'opt-in, considère cette voie comme une route beaucoup plus éthique. «Les artistes et les créateurs devraient être à bord», explique Alex Bestall, PDG de RightIfy et de la société de licence de data musicale Échange mondial du droit d'auteurqui a dirigé l'effort. Bestall considère l'opt-in comme une approche pragmatique ainsi que comme une approche morale: «Vendre des ensembles de données accessibles au public est un moyen de se poursuivre et de ne pas avoir de crédibilité.»
Ed Newton-Rex, un ancien dirigeant de l'IA qui dirige maintenant l'organisme à but non lucratif éthique à but non lucratif, appelle les Opt-outs «fondamentalement injustes aux créateurs», ajoutant que certains ne savent même pas quand les opt-outs sont offerts. «C'est particulièrement bien de voir la DPA appeler des opt-ins», dit-il.
Shayne Longpre, la tête du Initiative de provenance des donnéesun collectif bénévole qui vérifie les ensembles de données d'IA, considère les efforts de la DPA pour s'établir éthiquement les données comme admirables, bien qu'il soupçonne que la norme d'opt-in pourrait être une vente difficile, en raison du volume de données dont les modèles d'IA que les modèles d'IA modernes ont besoin. «Sous ce régime, vous allez soit être affamé de données, soit vous allez payer beaucoup», dit-il. «Il se pourrait que seuls quelques acteurs, de grandes entreprises technologiques, puissent se permettre de licencier toutes ces données.»
Dans le document, la DPA s'oppose à l'octroi de licences imposées par le gouvernement, plaidant plutôt pour une approche de «marché libre» dans lequel les originaux de données et les sociétés d'IA négocient directement. D'autres directives sont plus granulaires. Par exemple, l'alliance suggère cinq structures de rémunération potentielles pour s'assurer que les créateurs et les détenteurs de droits sont payés de manière appropriée pour leurs données. Il s'agit notamment d'un modèle basé sur l'abonnement, de la «licence basée sur l'utilisation» (dans laquelle les frais sont payés par utilisation) et des licences «basées sur les résultats», dans lesquelles les redevances sont liées au profit. “Ceux-ci pourraient fonctionner pour tout, de la musique aux images au cinéma et à la télévision ou aux livres”, explique Bestall.