This New Breed of AI Assistant Wants to Do Your Boring Office Chores
Cette semaine, OpenAI a annoncé un service qui permet à presque quiconque de créer une version personnalisée de Chatgpt, aucune compétence de codage requise. La société suggère que les utilisateurs peuvent vouloir construire un bot qui connaît les règles de tous les jeux de société, enseigne aux enfants les mathématiques ou peut offrir des conseils culinaires. Ces GPT, comme Openai les appellent, peuvent également effectuer des actions simples en se connectant avec des services Internet, par exemple la recherche par e-mail ou la commande de produits dans une boutique en ligne.
Vous ne pouvez pas reprocher à Openai pour avoir essayé de s'appuyer sur le succès de son Smash Hit Chatgpt. Mais peut-être que plus de chatbots n'est pas ce dont nous avons besoin?
Vous a adaptéune startup à San Francisco fondée par des vétérans d'Openai, Google et Deepmind, lance aujourd'hui un agent d'IA expérimental Cela automatise les tâches courantes d'une manière plus sophistiquée et potentiellement puissante que les chatbots comme Chatgpt. Au lieu d'être limité à l'utilisation de services en ligne qui fournissent des API pour les rendre accessibles aux logiciels, l'ACT-2 tente d'utiliser un ordinateur plus comme un humain – en donnant un sens aux pixels sur un écran, puis en prenant des mesures pour contrôler un navigateur et des services en ligne.
Les démos d'Adept montrent comment l'acte-2 peut être utilisé pour faire des choses comme la collecte d'informations à partir de courriels et de documents pour remplir les réclamations d'assurance, saisir les informations des factures envoyées par e-mail dans des logiciels comptables et proposer une visite à pied pour une ville en interagissant avec Google Maps.
La façon dont ACT-2 tente d'utiliser les mêmes interfaces utilisateur que les humains promettent de le rendre beaucoup plus capable et vaste. En théorie, cette approche pourrait permettre à un chatbot de faire littéralement tout ce qu'une personne pourrait faire sur son téléphone ou son ordinateur. Mais opérer de cette façon est également plus difficile pour les algorithmes et rend pour l'instant l'agent plus sujet aux erreurs.
En vertu du capot, ACT-2 utilise un grand modèle de langue appelé Fuyu. Il est similaire à celui qui alimente de nombreux chatbots, mais comme Chatgpt, il peut gérer à la fois du texte et des images (ce qui en fait un «modèle multimodal»). Le modèle analyse ce qu'il voit sur un écran d'ordinateur et essaie de traduire la demande qu'un utilisateur a tapé en actions utiles que le bot devrait prendre. Adept utilise l'apprentissage du renforcement – une technique utilisée pour enseigner les tâches des ordinateurs, notamment jouer à des jeux de société et à des jeux vidéo – pour instruire son IA sur la façon d'effectuer différentes tâches. Cela implique de regarder beaucoup d'humains effectuer des tâches spécifiques et d'essayer de réaliser des performances similaires.
David Luanle fondateur et PDG d'Adept et précédemment vice-président de l'ingénierie à Openai, dit que si les chatbots ont séduit tout le monde avec leurs capacités, il s'est avéré difficile de faire fonctionner de manière fiable les agents de l'IA. Mais il croit qu'Adept et d'autres se rapprochent beaucoup de la résolution.
“Cette année, ils n'étaient pas là”, dit Luan à propos des agents d'aujourd'hui, y compris les siens. «Je pense que ce qui va se passer l'année prochaine, il y aura une guerre géante autour des agents qui fonctionnent réellement.» Adept conçoit initialement ses agents pour effectuer seulement un nombre limité de tâches de bureau simples mais courantes, et il dit qu'ils sont désormais à 95% fiables, ce qui est suffisant pour qu'ils soient déployés commercialement dans quelques entreprises.
Atteindre ce niveau de fiabilité uniquement pour les tâches initiales et limitées que la loi-2 est conçue est une percée majeure. Pendant des années, des outils existaient pour automatiser les tâches de bureau – ce qui est connu sous le nom d'automatisation des processus robotiques – mais ils sont capricieux à construire et à se mettre à la rupture. Si Adept et d'autres peuvent utiliser l'IA pour automatiser de manière fiable beaucoup plus de tâches, cela pourrait transformer le travail de bureau et augmenter la productivité.
Si Luan a raison, la bataille pour automatiser vos tâches les plus fastidieuses pourrait rendre les guerres de chatbot de 2023 relativement dociles.