An ‘AI Scientist’ Is Inventing and Running Its Own Experiments

À première vue, Un récent lot de documents de recherche produits par un éminent laboratoire d'intelligence artificielle à l'Université de la Colombie-Britannique à Vancouver pourrait ne pas sembler si notable. Avec des améliorations supplémentaires sur les algorithmes et les idées existants, ils lisent comme le contenu d'une conférence ou d'un journal intermédiaire d'IA.

Mais la recherche est, en fait, remarquable. C'est parce que c'est entièrement le travail d'un «Scientifique d'IA»Développé à l'UBC Lab avec des chercheurs de l'Université d'Oxford et une startup appelée Saman.

Le projet Démontre une première étape vers ce qui pourrait s'avérer une astuce révolutionnaire: laisser l'IA apprendre en inventant et en explorant de nouvelles idées. Ils ne sont tout simplement pas super romains en ce moment. Plusieurs articles décrivent des ajustements pour améliorer une technique de génération d'image connue sous le nom de modélisation de diffusion; Un autre décrit une approche pour accélérer l'apprentissage dans des réseaux de neurones profonds.

«Ce ne sont pas des idées révolutionnaires. Ils ne sont pas extrêmement créatifs », admet Jeff Clunele professeur qui dirige le laboratoire UBC. “Mais ils semblent être des idées assez cool que quelqu'un pourrait essayer.”

Aussi étonnants que puissent être les programmes d'IA d'aujourd'hui, ils sont limités par leur besoin de consommer des données de formation générées par l'homme. Si les programmes d'IA peuvent plutôt apprendre de manière ouverte, en expérimentant et en explorant des idées «intéressantes», ils pourraient débloquer des capacités qui s'étendent au-delà de tout ce que les humains leur ont montré.

Le laboratoire de Clune avait déjà développé des programmes d'IA conçus pour apprendre de cette manière. Par exemple, Un programme appelé Omni J'ai essayé de générer le comportement des personnages virtuels dans plusieurs environnements de type vidéo, en déposant ceux qui semblaient intéressants, puis en itérant sur eux avec de nouvelles conceptions. Ces programmes avaient précédemment nécessité des instructions à codes manuelles afin de définir l'intérêt. Cependant, les modèles de grandes langues fournissent un moyen de permettre à ces programmes d'identifier ce qui est le plus intrigant en raison de leur capacité à imiter le raisonnement humain. Un autre projet récent De Clune's Lab a utilisé cette approche pour permettre aux programmes d'IA de rêver le code qui permet aux personnages virtuels de faire toutes sortes de choses dans un monde de type Roblox.

Le scientifique de l'IA est un exemple du laboratoire de Clune en riffant sur les possibilités. Le programme propose des expériences d'apprentissage automatique, décide ce qui semble le plus prometteur à l'aide d'un LLM, puis écrit et exécute le code nécessaire – à crier et à répéter. Malgré les résultats décevants, Clune affirme que les programmes d'apprentissage ouverts, comme pour les modèles de langue eux-mêmes, pourraient devenir beaucoup plus capables car les alimentations de l'alimentation par ordinateur s'accélèrent.

«C'est comme explorer un nouveau continent ou une nouvelle planète», explique Clune à propos des possibilités déverrouillées par les LLM. “Nous ne savons pas ce que nous allons découvrir, mais partout où nous nous tournons, il y a quelque chose de nouveau.”

Tom Hopeprofesseur adjoint à l'Université hébraïque de Jérusalem et chercheur à l'Institut Allen pour l'IA (AI2), dit que le scientifique de l'IA, comme les LLM, semble être très dérivé et ne peut pas être considéré comme fiable. «Aucun des composants n'est digne de confiance en ce moment», dit-il.

Hope souligne que les efforts pour automatiser les éléments de la découverte scientifique remontent des décennies au travail des pionniers de l'IA Allen Newell et Herbert Simon dans les années 1970 et, plus tard, le travail de Tapoter

Langley à l'Institut pour l'étude de l'apprentissage et de l'expertise. Il note également que plusieurs autres groupes de recherche, dont une équipe d'AI2, ont récemment exploité les LLM pour aider à générer des hypothèses, à rédiger des articles et à revoir la recherche. «Ils ont capturé le zeitgeist», explique Hope à propos de l'équipe de l'UBC. “La direction est, bien sûr, incroyablement précieuse, potentiellement.”