On parle de plus en plus de l'intelligence artificielle se développe avec vitesse potentiellement dangereuse ne ralentit guère les choses. Un an après le lancement d'OpenAI ChatGPT et déclenché une nouvelle course au développement de la technologie de l'IA, Google a dévoilé aujourd'hui un projet d'IA destiné à rétablir le géant de la recherche en tant que leader mondial de l'IA.
Gemini, un nouveau type de modèle d'IA capable de fonctionner avec du texte, des images et des vidéos, pourrait être l'algorithme le plus important de l'histoire de Google après Classementqui a propulsé le moteur de recherche dans la psyché du public et créé une entreprise géante.
Une première version de Gemini commence à être déployée aujourd'hui dans le chatbot Bard de Google pour la langue anglaise. Il sera disponible dans plus de 170 pays et territoires. Google indique que Gemini sera mis à la disposition des développeurs via l'API de Google Cloud à partir du 13 décembre. Une version plus compacte du modèle alimentera à partir d'aujourd'hui les réponses aux messages suggérés à partir du clavier des smartphones Pixel 8. Gemini sera introduit dans d'autres produits Google, notamment la recherche générative, les publicités et Chrome, dans les « mois à venir », indique la société. La version Gemini la plus puissante de toutes fera ses débuts en 2024, dans l’attente de « contrôles approfondis de confiance et de sécurité », indique Google.
« C'est un grand moment pour nous », a déclaré Demis Hassabis, PDG de Google DeepMind, à WIRED avant l'annonce d'aujourd'hui. « Nous sommes vraiment enthousiasmés par ses performances, et nous sommes également impatients de voir ce que les gens vont faire en s'appuyant sur cela. »
Gemini est décrit par Google comme « nativement multimodal », car il a été formé sur des images, de la vidéo et de l'audio plutôt que sur du simple texte, comme le sont les grands modèles de langage au cœur du récent boom de l'IA générative. « C'est notre modèle le plus grand et le plus performant ; c'est aussi notre plus général », a déclaré Eli Collins, vice-président des produits pour Google DeepMind, lors d'un point de presse annonçant Gemini.
Google indique qu'il existe trois versions de Gemini : Ultra, la plus grande et la plus performante ; Nano, qui est nettement plus petit et plus efficace ; et Pro, de taille moyenne et de capacités moyennes.
À partir d'aujourd'hui, Google Bard, un chatbot similaire à ChatGPT, sera alimenté par Gemini Pro, un changement qui, selon la société, le rendra capable d'un raisonnement et d'une planification plus avancés. Aujourd'hui, une version spécialisée de Gemini Pro est intégrée dans une nouvelle version de AlphaCode, un outil génératif de « produit de recherche » pour le codage de Google DeepMind. La version la plus puissante de Gemini, Ultra, sera intégrée à Bard et rendue disponible via une API cloud en 2024.