Most Top News Sites Block AI Bots. Right-Wing Media Welcomes Them

«Un processus appelé apprentissage du renforcement de la rétroaction humaine est utilisé en ce moment dans chaque modèle de pointe», pour affiner ses réponses, explique Baum. La plupart des entreprises d'IA visent à créer des systèmes qui semblent neutres. Si les humains dirigeant l'IA voient une augmentation du contenu de droite mais jugent en danger ou mal, ils pourraient annuler toute tentative de nourrir la machine une certaine perspective.

La porte-parole d'OpenAI, Kayla Wood, a déclaré que dans la poursuite des modèles d'IA qui «représentent profondément toutes les cultures, industries, idéologies et langues», l'entreprise utilise de larges collections de données de formation. «Tout secteur – y compris les nouvelles – et tout site d'actualités est une petite tranche des données de formation globale et n'a pas d'effet mesurable sur l'apprentissage et la sortie prévus du modèle», dit-elle.

Rights Fights

La déconnexion dans laquelle les sites d'actualités bloquent les robots d'IA pourraient également refléter un fossé idéologique sur le droit d'auteur. Le New York Times est actuellement poursuite Openai pour la violation du droit d'auteur, faisant valoir que la collecte de données de l'IA Upstart est illégale. D'autres leaders des médias grand public considèrent également ce grattage comme un vol. Le PDG de Condé Nast, Roger Lynch, a récemment déclaré lors d'une audience au Sénat que de nombreux outils d'IA avaient été construits avec des «produits volés». (Wired appartient à Condé Nast.) Les patrons des médias de droite ont été largement absents du débat. Peut-être qu'ils permettent tranquillement le grattage des données car ils approuvent l'argument que le grattage des données pour créer des outils d'IA est protégé par la doctrine de l'utilisation équitable?

Pour quelques-uns des neuf points de droite contactés par Wired pour demander pourquoi ils ont autorisé les grattoirs en IA, leurs réponses ont souligné une raison différente et moins idéologique. Le Examinateur de Washington N'a pas répondu aux questions sur ses intentions, mais a commencé à bloquer le GPTBOT d'Openai dans les 48 heures suivant la demande de Wired, suggérant qu'il ne savait peut-être pas auparavant ou privilégié l'option de bloquer les robots Web.

Pendant ce temps, le quotidien a admis que sa permissivité envers les Crawlers de l'IA avait été une simple erreur. «Nous n'approuvons pas les robots de vol de notre propriété. Cela a dû être une supervision, mais il est réparé maintenant », explique le cofondateur et éditeur de l'appelant quotidien Neil Patel.

Les médias de droite sont influents, et notamment avertis à tirer parti des plateformes de médias sociaux comme Facebook pour partager des articles. Mais des points de vente comme le Examinateur de Washington Et le quotidien est petit et maigre par rapport aux gémités des médias comme Le New York Timesqui ont de vastes équipes techniques.

Le journaliste de données Ben Welsh conserve un décompte de sites Web d'actualités bloquant les robots d'IA d'Openai, Google et le projet de rampe commun à but non lucratif dont les données sont largement utilisées dans l'IA. Ses résultats ont révélé que environ 53% Sur les 1 156 éditeurs de médias interrogées en bloc un de ces trois robots. Sa taille d'échantillon est beaucoup plus grande que les IA d'originalité et comprend des sites d'information plus petits et moins populaires, suggérant que les points de vente avec un personnel plus important et un trafic plus élevé sont plus susceptibles de bloquer les robots d'IA, peut-être en raison de meilleures connaissances en ressources ou techniques.

Au moins un site d'information à droite envisage comment il pourrait exploiter la façon dont ses concurrents traditionnels tentent de projeter de Stonewall IA pour contrer les préjugés politiques perçus. «Nos termes juridiques interdisent le grattage et nous explorons de nouveaux outils pour protéger notre IP. Cela dit, nous explorons également les moyens d'aider à garantir que l'IA ne se retrouve pas avec tous les mêmes biais que la presse de l'establishment », a déclaré le porte-parole de Daily Wire, Jen Smith. À ce jour, GPTBOT et d'autres robots AI étaient toujours libres de gratter le contenu du fil quotidien.

Mis à jour à 10 h 20 HE, 24 janvier 2024, pour inclure le nombre spécifique de meilleurs sites d'information à partir desquels l'originalité a collecté des données.