This Chinese Startup Is Winning the Open Source AI Race
DeLange a déclaré que les modèles de langue open source s'améliorent rapidement et peuvent être meilleurs que le GPT-4 à la tête du marché d'OpenAI pour certaines tâches spécialisées. Mais il a noté que bon nombre des meilleurs modèles open source proviennent de l'extérieur des États-Unis, disant que 01.ai pourrait être positionné pour bénéficier d'innovations qui surgissent autour de son modèle. “Les entreprises américaines sont devenues un peu moins ouvertes et transparentes”, a-t-il déclaré lors du briefing. “Mais il y a cette dynamique intéressante avec l'IA où plus une entreprise libère l'open source, plus l'écosystème se développe, et plus il est fort à construire l'IA.”
Meta's Llama 2 est un rare exemple de modèle open source d'une entreprise américaine et est le défi du géant des médias sociaux à Openai, Microsoft, Google et à d'autres rivaux technologiques importants qui investissent massivement dans une IA générative. Meta a choisi de libérer son modèle de langue AI sous une licence qui permet une réutilisation commerciale, avec quelques mises en garde.
YI-34B et LLAMA 2 semblent avoir plus en commun que le simple fait d'être les principaux modèles d'IA open source. Peu de temps après la sortie du modèle chinois, certains développeurs remarqué Le code de 01.ai avait précédemment inclus des mentions du modèle de META qui ont ensuite été supprimées. Richard Lin, 01.ai Head of Open Source, plus tard dit que la société reviendrait les modifications et que la société a crédité Llama 2 pour une partie de l'architecture pour YI-34B. Comme tous les principaux modèles de langue, 01.ai est basé sur l'architecture «Transformer» développée pour la première fois par Google Researchers en 2017, et la société chinoise a dérivé ce composant de Llama 2. Anita Huang, une porte-parole de 01.ai, a déclaré qu'un expert juridique consulté par la société a déclaré que YI-34B n'était pas soumis à la licence de LLAMA 2. Meta n'a pas répondu à une demande de commentaires.
Quelle que soit la mesure dans laquelle YI-34B emprunte de LLAMA 2, le modèle chinois fonctionne très différemment en raison des données qu'elle a été alimentées. «Yi partage l'architecture de Llama mais sa formation est complètement différente – et nettement meilleure», explique Eric Hartford, chercheur de l'IA chez Abacus.ai qui suit les projets d'IA open source. «Ils sont complètement différents.»
Le lien avec le Llama 2 de Meta est un exemple de la façon dont malgré la confiance de Lee dans l'expertise de l'IA en Chine, il suit actuellement l'exemple de l'Amérique dans l'IA générative. Jeffrey Dingprofesseur adjoint à l'Université George Washington qui étudie la scène de l'IA de la Chine, dit que bien que les chercheurs chinois aient publié des dizaines de modèles de grandes langues, l'industrie dans son ensemble est toujours à la traîne des États-Unis.
«Les entreprises occidentales ont gagné un avantage significatif dans le développement de modèles de langues importants, car elles pouvaient tirer parti des versions publiques pour tester les problèmes, obtenir des commentaires des utilisateurs et susciter des intérêts autour de nouveaux modèles», dit-il. Ding et autres avoir fait valoir que les entreprises d'IA chinois sont confrontées à des vents contraires réglementaires et économiques plus forts que leurs homologues américains.
S'exprimant lors du Forum économique mondial de Davos la semaine dernière, Lee a soutenu – espérant peut-être que le message se retournerait chez lui – que l'approche ouverte serait cruciale pour tout pays de profiter pleinement de l'IA.
“L'un des problèmes avec une ou quelques entreprises ayant le plus de pouvoir et dominant les modèles est qu'il crée d'énormes inégalités, et pas seulement avec des personnes moins riches et moins riches, mais aussi des professeurs, des étudiants, des entrepreneurs, des amateurs”, a déclaré Lee. «S'il n'y avait pas d'open source, que feraient-ils pour apprendre; Parce qu'ils pourraient être le prochain créateur, inventeur ou développeur d'applications. »
S'il a raison, la technologie de 01.ai – et les applications construites en plus – mettra la technologie chinoise au cœur de la prochaine phase de l'industrie technologique.
Mis à jour 1-23-2024, 20:10 HNE: Le nom chinois de 01.ai est 010, pas 010 000.
Correction 1-24-2024, 11 h 21 HNE: Cette histoire indiquait précédemment que Sinovation Ventures avait investi dans Tusimple. Ce n'est pas le cas.