Google’s AI Overviews Will Always Be Broken. That’s How AI Works

Une semaine après que ses algorithmes aient conseillé aux gens de manger des rochers et mettre Glue sur la pizzaGoogle a admis jeudi qu'il devait faire des ajustements à sa nouvelle fonctionnalité de recherche générative en gras. L'épisode met en évidence les risques de la volonté agressive de Google de commercialiser une IA générative – ainsi que les limites perfides et fondamentales de cette technologie.

La fonctionnalité des aperçus de l'IA de Google s'appuie sur Gemini, un modèle grand langage comme celui derrière le chatppt d'Openai, pour générer des réponses écrites à certaines requêtes de recherche en résumant les informations trouvées en ligne. Le boom de l'IA actuel est construit autour de la maîtrise impressionnante de LLMS avec du texte, mais le logiciel peut également utiliser cette installation pour mettre un brillant convaincant sur les contrevérités ou les erreurs. L'utilisation de la technologie pour résumer les promesses d'informations en ligne peut rendre les résultats de recherche plus faciles à digérer, mais il est dangereux lorsque les sources en ligne sont en contraction ou lorsque les gens peuvent utiliser les informations pour prendre des décisions importantes.

«Vous pouvez obtenir un prototype rapide rapide maintenant assez rapidement avec un LLM, mais pour faire en sorte que cela ne vous dise pas de manger des rochers demande beaucoup de travail», explique Richard Socher, qui a apporté des contributions clés à l'IA pour la langue En tant que chercheur et, fin 2021, a lancé un moteur de recherche centré sur l'IA appelé Vous.com.

Socher dit que Wrangling LLMS prend des efforts considérables parce que la technologie sous-jacente n'a pas de réelle compréhension du monde et parce que le Web est criblé d'informations indignes de confiance. “Dans certains cas, il vaut mieux ne pas vous donner une réponse ou vous montrer plusieurs points de vue différents”, dit-il.

Le responsable de la recherche de Google, Liz Reid, a déclaré dans la société Blog Blog Tard jeudi qu'il a effectué des tests approfondis avant le lancement des aperçus de l'IA. Mais elle a ajouté que des erreurs comme les exemples de pizza rocheuse et de colle – dans lesquels les algorithmes de Google ont tiré des informations d'un article satirique et d'un commentaire joculaire Reddit, respectivement – avait provoqué des changements supplémentaires. Ils incluent une meilleure détection des «requêtes absurdes», dit Google, et rendre le système qui s'appuie moins sur le contenu généré par l'utilisateur.

You.com évite régulièrement les types d'erreurs affichées par les aperçus de l'IA de Google, dit Socher, car son entreprise a développé une douzaine de trucs pour empêcher les LLM de mal se comporter lorsqu'ils sont utilisés pour la recherche.

«Nous sommes plus précis parce que nous mettons beaucoup de ressources pour être plus précis», explique Socher. Entre autres choses, You.com utilise un index Web sur mesure conçu pour aider les LLM à éviter les informations incorrectes. Il sélectionne également à partir de plusieurs LLM différents pour répondre à des requêtes spécifiques, et il utilise un mécanisme de citation qui peut expliquer lorsque les sources sont contradictoires. Pourtant, obtenir une recherche sur l'IA est difficile. Wired a trouvé vendredi que vous.com n'a pas répondu correctement à une requête connue pour trébucher d'autres systèmes d'IA, déclarant que «sur la base des informations disponibles, il n'y a pas de nations africaines dont les noms commencent par la lettre« K. »» Dans les tests précédents, il avait accédé à la requête.

La mise à niveau générative de l'IA de Google vers son produit le plus largement utilisé et lucrative fait partie d'un redémarrage de l'industrie technologique inspirée par la sortie d'Openai du chatbot Chatgpt en novembre 2022. Quelques mois après que Chatgpt a fait ses débuts, Microsoft, un partenaire clé d'Openai, quelques mois, Utilisé sa technologie pour mettre à niveau son moteur de recherche également Bing. Le Bing amélioré était assailli par des erreurs générées par l'AI et un comportement étrange, mais le PDG de la société, Satya Nadella, a déclaré que cette décision avait été conçue pour défier Google, adage «Je veux que les gens sachent que nous les avons fait danser.»

Certains experts estiment que Google a précipité sa mise à niveau de l'IA. «Je suis surpris qu'ils l'ont lancé comme c'est le cas pour autant de requêtes – des requêtes financières médicales – je pensais qu'ils seraient plus prudents», explique Barry Schwartzrédacteur en chef de Search Engine Land, une publication qui suit l'industrie de la recherche. L'entreprise aurait dû mieux s'attendre à ce que certaines personnes essaieraient intentionnellement de trébucher sur les aperçus de l'IA, ajoute-t-il. “Google doit être intelligent à ce sujet”, dit Schwartz, surtout lorsqu'ils montrent les résultats par défaut sur leur produit le plus précieux.

Lisun consultant d'optimisation des moteurs de recherche, a été pendant un an un testeur bêta du prototype qui a précédé les aperçus de l'IA, que Google a appelé l'expérience générative de recherche. Elle dit qu'elle n'était pas surpris de voir les erreurs qui sont apparues la semaine dernière compte tenu de la façon dont la version précédente avait tendance à mal tourner. «Je pense qu'il est pratiquement impossible de toujours faire tout bien», dit Ray. «C'est la nature de l'IA.»