Threads Is the Latest Move in the AI Arms Race

Quand Meta a fait ses débuts Ses nouveaux threads figurent plus tôt ce mois-ci, il a été rapidement surnommé «The Twitter Killer». Elon Musk, le propriétaire de X (anciennement Twitter), même menacé de poursuivre Meta pour ce qu'il a appelé un produit «Copycat».

Lancé à l'arrière d'Instagram, également détenu par Meta, les threads ressemblent très à X. Il est défilable, basé sur du texte et limité par le caractère. Mais pourquoi, quand x a été notoirement peu rentableMeta – qui nous a apporté le tristement célèbre «Pivot to Video» et a eu son objectif pour rivaliser avec Tiktok – pour affronter la plate-forme? La réponse peut avoir à voir avec l'intelligence artificielle.

Les derniers mois ont vu une véritable IA course aux armementsavec des outils comme Chatgpt, MidJourney, STABLE DIFFUSION, COPILOT, DALL-E et BARD de Google All Jockeying pour les utilisateurs. Comme plus d'entreprises investissent dans une IA générative, elles ont besoin beaucoup de données pour former leurs modèles. Et que les données doivent être générées par des humains réels pour que l'IA générative apparaisse, eh bien, humaine. Des plates-formes comme Reddit et X sont des mines d'or car elles hébergent des millions d'exemples de contenu généré par l'utilisateur. Les deux sociétés ont également historiquement rendu leurs données facilement disponibles, une aubaine pour les développeurs et les chercheurs tiers. Rien qu'en 2020, les données de X ont contribué à plus de 17 000 articles de recherche. Des modèles comme Chatgpt et Bard ont également été formés sur les données de ces plateformes. Mais cela a suscité de plus grandes questions sur la quantité de données générées par les utilisateurs et ce qu'il devrait coûter pour accéder. Maintenant, ces données peuvent ne pas être facilement disponibles pour longtemps, tout comme chaque entreprise, y compris Meta, se précipite pour développer ses propres modèles.

Plus tôt cette année, Musk a annoncé que X commencerait à facturer 42 000 $ par mois pour son API, évaluant presque tous ceux qui les utilisaient, en particulier les universitaires et les chercheurs, pour lesquels les données de X étaient cruciales pour la recherche sur des sujets comme la désinformation. Plus tard, la société a déclaré qu'elle offrirait des niveaux d'accès au prix de 125 000 $ et 210 000 $ par mois. Peu de temps après, Reddit a annoncé qu'il commencerait également à facturer son API. Dans une interview Le New York TimesLe PDG de Reddit, Reed Huffman, a reconnu que le «Reddit Corpus of Data était vraiment précieux» pour la formation des modèles d'IA, mais que l'entreprise n'a pas ressenti le «besoin de donner toute cette valeur à certaines des plus grandes entreprises du monde gratuitement».

Au cours des derniers mois, Musk a continué de réprimer l'accès aux données de X. En avril, il a tweeté que Microsoft avait “illégalement” a utilisé des données de X pour former ses modèles d'IA (Microsoft est un partenaire avec Meta et Openai, qui a créé Chatgpt). UN lettre De l'avocat de X a allégué que la société avait dépassé l'utilisation autorisée des données qu'elle a tirées de la plate-forme. Ensuite, le mois dernier, Twitter a annoncé qu'il limiter la possibilité de voir le contenu du site sans d'abord se connecter, et que pour voir plus que 600 tweets par jour, les utilisateurs devraient payer Twitter Bleu. Musk l'a qualifié de «mesure d'urgence temporaire» pour empêcher ce qu'il a appelé le «pillage de données». (Xcorp, qui possède x, a déposé un procès Peu de temps après, contre quatre défendeurs anonymes, demandant 1 million de dollars de dommages-intérêts pour le grattage des données). Comme Musk a un accès limité à la plate-forme, il a également lancé sa nouvelle startup XAI, qui sera formée sur les données de X.

Qu'est-ce que tout cela a à voir avec les fils? Meta, qui a joué son avenir – et son nom – sur le métaverse, a Se cacher dans son investissement dans l'IA. Mais la semaine dernière, l'entreprise annoncé Il ferait son modèle grand langage, LLAMA 2, Open Source, gratuit pour les chercheurs et les entreprises (cela signifie également, cependant, il n'aura pas certaines des garanties de Chatgpt, à savoir la possibilité de révoquer l'accès des utilisateurs qui violent les conditions d'utilisation pour générer, disons, la désinformation). Les threads pourraient renforcer ses efforts pour reprendre le jeu de l'IA, juste au moment où X n'est plus une option pour les entreprises qui cherchent à récolter des données.