Google DeepMind’s Game-Playing AI Tackles a Chatbot Blind Spot
Plusieurs années avant Chatgpt a commencé à faire du jibber, google, Google a développé un type très différent de programme d'intelligence artificielle appelée Alphago qui a appris à jouer au jeu de société GO avec les compétences surhumaines grâce à une pratique infatigable.
Des chercheurs de l'entreprise ont désormais publié des recherches qui combinent les capacités d'un modèle de langue large (l'IA derrière les chatbots d'aujourd'hui) avec ceux d'Alphazero, un successeur d'Alphago, également capable de jouer aux échecs, pour résoudre des preuves mathématiques très délicates.
Leur nouvelle création frankensteinienne, surnommée Alphaproof, a démontré ses prouesses en s'attaquant à plusieurs problèmes de 2024 Olympiade de mathématiques internationales (OMI), une concurrence prestigieuse pour les élèves du secondaire.
Alphaproof utilise le modèle de grande langue Gemini pour convertir des questions mathématiques naturellement formulées en un langage de programmation appelé Maigre. Cela fournit le fourrage de formation pour un deuxième algorithme à apprendre, par essais et erreurs, comment trouver des preuves qui peuvent être confirmées comme correctes.
Plus tôt cette année, Google Deepmind révélé un autre algorithme mathématique Appelé alphageométrie qui combine également un modèle de langue avec une approche d'IA différente. L'alphageométrie utilise des Gémeaux pour convertir les problèmes de géométrie en une forme qui peut être manipulée et testée par un programme qui gère les éléments géométriques. Google Today a également annoncé une nouvelle version améliorée de l'alphageométrie.
Les chercheurs ont constaté que leurs deux programmes mathématiques pourraient fournir des preuves aux puzzles de l'OMI ainsi qu'à un médaillé d'argent. Sur six problèmes total, l'alphaproof a résolu deux problèmes d'algèbre et une théorie des nombres, tandis que l'alphageométrie a résolu un problème de géométrie. Les programmes ont eu un problème en quelques minutes, mais ont pris jusqu'à plusieurs jours pour en comprendre d'autres. Google Deepmind n'a pas révélé la quantité de puissance informatique qu'elle a lancé aux problèmes.
Google Deepmind appelle l'approche utilisée pour l'alphaproof et l'alphageométrie «neuro-symbolique» car ils combinent l'apprentissage de la machine pure d'un réseau neuronal artificiel, la technologie qui sous-tend la plupart des progrès dans l'IA récemment, avec le langage de la programmation conventionnelle.
“Ce que nous avons vu ici, c'est que vous pouvez combiner l'approche qui a été si réussie, et des choses comme Alphago, avec de grands modèles de langage et produire quelque chose qui est extrêmement capable”, explique David Silver, le chercheur Google Deepmind qui a dirigé le travail sur Alphazero . Silver dit que les techniques démontrées avec Alphaproof devraient, en théorie, s'étendre à d'autres domaines de mathématiques.
En effet, la recherche soulève la perspective de lutter contre les pires tendances des modèles de grandes langues en appliquant la logique et le raisonnement de manière plus fondée. Aussi miraculeux que les modèles de langue importants peuvent l'être, ils ont souvent du mal à saisir même les mathématiques de base ou pour raisonner par des problèmes logiquement.
À l'avenir, la méthode neurale-symbolique pourrait fournir aux systèmes d'IA de transformer des questions ou des tâches en une forme qui peut être raisonnée d'une manière qui produit des résultats fiables. Selon les rumeurs, Openai travaille sur un tel système, Coded «Strawberry».
Il y a cependant une limitation clé avec les systèmes révélés aujourd'hui, comme le reconnaît Silver. Les solutions mathématiques sont correctes ou incorrectes, permettant à l'alphaproof et à l'alphageométrie de se diriger vers la bonne réponse. De nombreux problèmes du monde réel – à venir avec l'itinéraire idéal pour un voyage, par exemple – ont de nombreuses solutions possibles, et laquelle est idéale peut être claire. Silver dit que la solution pour des questions plus ambiguës peut être pour un modèle de langue pour essayer de déterminer ce qui constitue une «bonne» réponse pendant la formation. «Il y a un éventail de choses différentes qui peuvent être essayées», dit-il.
L'argent prend également soin de noter que Google Deepmind ne metra pas les mathématiciens humains hors des emplois. «Nous visons à fournir un système qui peut prouver n'importe quoi, mais ce n'est pas la fin de ce que font les mathématiciens», dit-il. «Une grande partie des mathématiques est de poser des problèmes et de trouver quelles sont les questions intéressantes à poser. Vous pourriez considérer cela comme un autre outil dans les lignes d'une règle de diapositive ou d'une calculatrice ou des outils de calcul. »
Mise à jour du 25/07/24 13:25 PM ET: Cette histoire a été mise à jour pour clarifier le nombre de problèmes alphaproof et alphageométrie résolu, et de quel type.