Une semaine après que ses algorithmes ont conseillé aux gens de manger des cailloux et met coller sur une pizzaGoogle a admis jeudi qu'il nécessaire de faire des ajustements à son nouvelle recherche générative audacieuse par l'IA fonctionnalité. L'épisode met en lumière les risques liés à la volonté agressive de Google de commercialiser l'IA générative– et aussi les limites dangereuses et fondamentales de cette technologie.
La fonctionnalité AI Overviews de Google s'appuie sur Gemini, un grand modèle de langage comme celui derrière ChatGPT d'OpenAI, pour générer des réponses écrites à certaines requêtes de recherche en résumant les informations trouvées en ligne. Le boom actuel de l’IA repose sur La maîtrise impressionnante du texte des LLM, mais le logiciel peut également utiliser cette fonctionnalité pour donner une interprétation convaincante des contrevérités ou des erreurs. Utiliser la technologie pour résumer les promesses d’informations en ligne peut rendre les résultats de recherche plus faciles à digérer, mais cela est dangereux lorsque les sources en ligne sont restrictives ou lorsque les gens peuvent utiliser les informations pour prendre des décisions importantes.
« Vous pouvez maintenant obtenir un prototype rapide et rapide avec un LLM, mais faire en sorte qu'il ne vous dise pas de manger des pierres demande beaucoup de travail », explique Richard Socher, qui a apporté des contributions clés à l'IA pour le langage. en tant que chercheur et a lancé fin 2021 un moteur de recherche centré sur l'IA appelé Vous.com.
Socher affirme que lutter contre les LLM demande des efforts considérables, car la technologie sous-jacente n'a aucune véritable compréhension du monde et parce que le Web est criblé d'informations peu fiables. « Dans certains cas, il est préférable de ne pas se contenter de vous donner une réponse ou de vous montrer plusieurs points de vue différents », dit-il.
Liz Reid, responsable de la recherche chez Google, a déclaré dans le communiqué de l'entreprise article de blog jeudi soir qu'il a effectué des tests approfondis avant de lancer les aperçus de l'IA. Mais elle a ajouté que des erreurs telles que les exemples de consommation de roche et de pizza à la colle, dans lesquels les algorithmes de Google extrayaient respectivement des informations d'un article satirique et d'un commentaire plaisant de Reddit, avaient entraîné des changements supplémentaires. Ils incluent une meilleure détection des « requêtes absurdes », explique Google, et permettent au système de moins dépendre du contenu généré par les utilisateurs.
You.com évite régulièrement les types d'erreurs affichées par les aperçus de l'IA de Google, explique Socher, car son entreprise a développé une douzaine d'astuces pour empêcher les LLM de se comporter mal lorsqu'ils sont utilisés pour la recherche.
«Nous sommes plus précis parce que nous y consacrons beaucoup de ressources», explique Socher. Entre autres choses, You.com utilise un index Web personnalisé conçu pour aider les LLM à éviter les informations incorrectes. Il sélectionne également parmi plusieurs LLM différents pour répondre à des requêtes spécifiques et utilise un mécanisme de citation qui peut expliquer quand les sources sont contradictoires. Pourtant, il est difficile de réussir la recherche par l’IA. WIRED a découvert vendredi que You.com n'avait pas répondu correctement à une requête connue pour faire trébucher d'autres systèmes d'IA, déclarant que « sur la base des informations disponibles, il n'existe aucune nation africaine dont le nom commence par la lettre 'K' ». Lors de tests précédents, il avait répondu à la requête.
La mise à niveau de l'IA générative de Google vers son produit le plus utilisé et le plus lucratif fait partie d'un redémarrage à l'échelle de l'industrie technologique inspiré par la sortie du chatbot par OpenAI. ChatGPT en novembre 2022. Quelques mois après le lancement de ChatGPT, Microsoft, un partenaire clé d'OpenAI, a utilisé sa technologie pour mettre à niveau son moteur de recherche également géré, Bing. La version améliorée de Bing était en proie à des erreurs générées par l'IA et à des comportements étranges, mais le PDG de l'entreprise, Satya Nadella, a déclaré que cette décision visait à défier Google. en disant « Je veux que les gens sachent que nous les avons fait danser. »
Certains experts estiment que Google a précipité la mise à niveau de l’IA. « Je suis surpris qu'ils l'aient lancé car pour autant de requêtes (requêtes médicales et financières), je pensais qu'ils seraient plus prudents », déclare Barry Schwartz, rédacteur en chef de Search Engine Land, une publication qui suit l'industrie de la recherche. L'entreprise aurait dû mieux anticiper que certaines personnes tenteraient intentionnellement de faire trébucher les aperçus de l'IA, ajoute-t-il. « Google doit être intelligent à ce sujet », déclare Schwartz, en particulier lorsqu'il affiche les résultats par défaut sur son produit le plus précieux.
Lily Rayconsultant en optimisation pour les moteurs de recherche (SEO), a été pendant un an bêta-testeur du prototype qui a précédé AI Overviews, qui Google a appelé Search Generative Experience. Elle dit qu'elle n'a pas été surprise de voir les erreurs apparues la semaine dernière étant donné que la version précédente avait tendance à mal tourner. «Je pense qu'il est pratiquement impossible de toujours tout faire correctement», dit Ray. « C'est la nature de l'IA. »