Google DeepMind’s Latest AI Agent Learned to Play Goat Simulator 3

«Sima va plus loin et montre une généralisation plus forte aux nouveaux jeux», dit-il. «Le nombre d'environnements est encore très petit, mais je pense que Sima est sur la bonne voie.

Une nouvelle façon de jouer

Sima montre que DeepMind met une nouvelle tournure aux agents de jeu, une technologie d'IA que l'entreprise a été lancée dans le passé.

En 2013, avant que Deepmind ne soit acquis par Google, la startup basée à Londres a montré comment une technique Appelé l'apprentissage du renforcement, qui implique de former un algorithme avec une rétroaction positive et négative sur ses performances, pourrait aider les ordinateurs à jouer au classique Jeux vidéo atari. En 2016, dans le cadre de Google, DeepMind a développé Alphago, un programme qui a utilisé la même approche pour vaincre un champion du monde de GO, un ancien jeu de société qui nécessite une compétence subtile et instinctive.

Pour le projet SIMA, l'équipe Google Deepmind a collaboré avec plusieurs studios de jeu pour collecter les données de clavier et de souris chez les humains jouant 10 jeux différents avec des environnements 3D, notamment No Man's Sky, Démolir, Hydroneeret Satisfaisant. DeepMind a ensuite ajouté des étiquettes descriptives à ces données pour associer les clics et les robinets avec les actions que les utilisateurs ont pris, par exemple s'il s'agissait d'une chèvre à la recherche de son jetpack ou d'un caractère humain creusant pour l'or.

Les données TROVE des joueurs humains ont ensuite été introduites dans un modèle de langue du genre qui alimente les chatbots modernes, qui avaient ramassé la capacité de traiter la langue en digestant une énorme base de données de texte. Sima pourrait alors effectuer des actions en réponse aux commandes typées. Et enfin, les humains ont évalué les efforts de Sima dans différents jeux, générant des données utilisées pour affiner ses performances.

Le logiciel SIMA AI a été formé à l'aide de données d'humains jouant 10 jeux différents avec des environnements 3D.

Avec l'aimable autorisation de Google Deepmind

Après tout cette formation, Sima est capable d'effectuer des actions en réponse à des centaines de commandes données par un joueur humain, comme «tourner à gauche» ou «aller au vaisseau spatial» ou «passer par la porte» ou «couper un arbre. ” Le programme peut effectuer plus de 600 actions, allant de l'exploration au combat en passant par l'utilisation des outils. Les chercheurs ont évité des jeux qui présentent des actions violentes, conformément aux directives éthiques de Google sur l'IA.

«C'est toujours un projet de recherche», explique Tim Harley, un autre membre de l'équipe Google Deepmind. “Cependant, on pourrait imaginer un jour avoir des agents comme Sima jouant à vos côtés dans des jeux avec vous et avec vos amis.”

Les jeux vidéo fournissent un environnement relativement sûr aux agents d'IA pour faire des choses. Pour que les agents fassent des travaux utiles de bureau ou de quotidien, ils devront devenir plus fiables. Harley et Besse à Deepmind disent qu'ils travaillent sur des techniques pour rendre les agents plus fiables.

Mise à jour du 13/03/2024, 10 h 20 HE: commentaire ajouté du ventilateur Linxi “Jim”.