Google continue d'innover dans le domaine de l'intelligence artificielle. Après avoir présenté récemment Gemini, son grand modèle de langage (LLM), le mastodonte du Web dévoile Imagen 2, son intelligence artificielle de génération d'images. Plus intelligente, cette nouvelle technologie s'accompagne de fonctionnalités avancées qui la distinguent de ses concurrents.
Images sur mesure et de qualité, logos… Imagen 2 à l'avance !
C'est Esprit profondla filiale spécialisée dans l'intelligence artificielle de Google, qui est à l'origine de la création d'Imagen 2. Cette IA permet de générer des images de qualité à partir d'un simple rapideune description textuelle de l'image souhaitée.
Lors de sa présentation par Google, Imagen 2 a impressionné par sa capacité à générer des images correspondantes exactement aux requêtes, même les plus précis, longs et détaillés. L'outil a été, par exemple, testé avec un prompt demandant une image d'un dentifrice avec le mot « CYMBAL » écrit dessus, placé sur un meuble de salle de bain, juste à côté d'un lavabo. L'IA a produit précisément la scène décrite. Le tube de dentifrice, le mot écrit, le mobilier ou encore le lavabo, tout y est.
Outre la précision avec laquelle Imagen 2 génère des images fidèles aux invitations fourni, la qualité du rendu visuel est également au rendez-vous. Les images produites présentent une définition et une résolution élevée.
De plus, l'IA offre des fonctionnalités inédites intéressantes. Par exemple, il est possible de lui demander de créer une image avec un texte superposé. L'image 2 peut aussi généré des logos abstraits. Ces créations graphiques peuvent par la suite être utilisées sur divers supports tels que des cartes de visite, des vêtements, etc. Autre atout majeur : cette IA de DeepMind a une compréhension multilinguece qui permet à l'utilisateur de générer des logos dans la langue de son choix.
La réponse de Google à DALL-E 3 de Bing
Le principal concurrent d'Imagen 2 reste sans conteste DALL-E 3 d'OpenAI, désormais intégré au moteur de recherche Bing de Microsoft. Ceci a probablement motivé Google à créer son propre outil générateur d'images IA. Meta a également lancé Imagine with Meta AI il y a plusieurs jours. Initialement restreint à ses logiciels de messagerie, cette IA est à présent accessible via un site web dédié. récemment, À mi-parcours s'est également affranchi de la plateforme de messagerie Discord, pour devenir une IA génératrice disponible sur le Web.
On assiste donc à une accélération significative dans la course à l'IA générative d'images. Néanmoins, en se référant à la présentation faite par Google, Imagen 2 semble surpasser ses concurrents. Ses jemages plus réalistes et précis ainsi que ses fonctionnalités innovantes en font un outil puissant et polyvalent.
Découvrez Imagen 2 : notre technologie de diffusion texte-image la plus avancée. ✨
Il propose des sorties photoréalistes de haute qualité et une cohérence plus forte avec vos invites. 🖼
Maintenant disponible pour utilisation via @GoogleCloudc'est #VertexAI plate-forme. → https://t.co/T1IIJMbIW9 pic.twitter.com/iWIzi2jgZH
– Google DeepMind (@GoogleDeepMind) 13 décembre 2023
Pour pouvoir répondre aux requêtes des utilisateurs, Imagen 2 a été formé sur un ensemble de données massif d'images et de textes. Toutefois, Esprit profond n'a pas communiqué sur les sources de données exactes utilisées pour le processus d'entraînement de son IA.
Cet outil est disponible sur Vertex AI, la plateforme dédiée à l'IA de Google Cloud. Ce qui permet aux développeurs et aux professionnels de l'utiliser facilement pour leurs projets. Google assure que son intelligence artificielle est équipé de filtres de sécurité efficaces qui empêche la génération de contenu inappropriée. La question reste de savoir si cette nouvelle technologie séduira un large public.