Entre À mi-parcours, Diffusion stable et DALL-E, il est difficile de faire le choix de l'IA générative d'image à utiliser. Chacune d'entre elles a ses forces et ses faiblesses. Mais seulement serait en mesure de porter la couronne. Laquelle ? C'est la question ! Et pourtant, nous ne sommes pas encore à la phase où l'IA générative d'image est à son apogée. Un startup décide alors d'entrer dans la course et lance Ideogram. Qui sait, ce sera elle, peut-être, qui va se siffler en tête de liste.
C'est tout à fait envisageable parce que derrière Ideogramm se trouvent des anciens ingénieurs de Google Esprit profond et d'autres membres de quelques instituts de renom. Notamment des experts de l'Université Carnegie Mellon, de l'UC Berkeley et de l'Université de Toronto. Selon leurs propositions, L'idéogramme représente l'IA générative la plus avancée. Le modèle permet même d'activer la fonction « Magic prompt », une particularité offrant la possibilité d'avoir les meilleurs prompts pour la génération d'une image. Quoi qu'il en soit, nous allons sans plus tarder décortiquer cette IA générative et voir ce qu'elle a vraiment dans le ventre. Après, on verra si elle est vraiment digne de porter la couronne et de rivaliser avec DALL-E 3.
Une polyvalence assez bluffante par rapport aux autres IA génératives d'images
Ideogram AI est une intelligence artificielle innovante qui vise à relever un défi majeur auquel sont confrontés les systèmes de génération d'images par texte descriptif. Notamment l'intégration cohérente de mots et de textes dans les images créées.
Contrairement à ses concurrents, dont DALL-E et Midjourney, qui peinent souvent à reproduire fidèlement des mots ou des marques connues, Ideogram a été spécialement conçu pour offrir une dimension textuelle pertinente aux visuels générés.
En tant qu'utilisateur, vous pourrez ainsi fournir une description détaillée de l'image souhaitée. Par exemple des mots ou des phrases spécifiques que vous souhaitez y voir apparaître. Ideogram AI interprète alors ces indications sémantiques et produit des créations visuelles tenant compte du sens réel des textes mentionnés. Bien que cette technologie soit encore récent et imparfaite, nos tests ont révélé des résultats étonnamment cohérents et visuellement apparents.
En somme, le vrai potentiel d'Ideogram réside dans sa capacité à intégrer des textes de manière naturelle dans divers styles, contextes et supports visuels. On peut ainsi créer des visuels 3D de prénoms ou encore incruster des logos sur des écrans. Cette IA générative permet également de reproduire des calligraphies lisibles dans des manuscrits, ou même fabriquer des pochettes d'albums ou des affiches de films fictifs incorporant du texte cohérent.
Bien que comportant encore des imperfections, notamment pour les sujets plus complexes que les portraits, Ideogram semble offrir une polyvalence et une fonctionnalité unique en matière d'intégration sémantique de textes dans les images générées par IA.
Les options et fonctionnalités disponibles sur Ideogram
Ideogram AI est un outil complet offrant diverses fonctionnalités pour la génération d'images basée sur des descriptions textuelles. Son utilisation principale réside dans la génération d'images à partir d'une invite rédigée par l'utilisateurqui se verra proposer quatre visuels correspondants.
Lors de la rédaction du prompt, plusieurs options permettent d'orienter le style visuel de la génération. À savoir les rendus cinématographiques, les illustrations, les photographies, les dessins animés ou encore les rendus 3D. Une option typographique dédiée vise également à faciliter l'intégration de texte lisible dans les images, bien que cette fonctionnalité reste encore à parfaire.
L'utilisateur peut également choisir le format d'image (carré, paysage ou portrait), ainsi qu'uploader une image existe en plus du prompt texte pour influencer davantage le résultat généré.
Au-delà de la création, Ideogram comprend aussi un volet communautaire avec une galerie permettant d'explorer les créations récentes, populaires ou des utilisateurs suivis. Les créations publiques peuvent alors être consultées, et leurs invites récupérées pour être remixées.
Avec ses nombreuses options de styles, formats et sa dimension participative, Ideogram se positionne comme un outil riche et polyvalent pour la génération d'images visuellement attrayantes intégrant du texte de manière cohérente.
Des portraits plus réalistes avec Ideogram, un point pour le bleu
Produire des images réalistes de personnes représente depuis un défi de taille pour les générateurs d'images basé sur l'intelligence artificielle. En raison de la complexité du corps humain et du phénomène connu sous le nom d'effet de vallée dérangeante, il est difficile pour ces systèmes automatisés de créer des représentations convaincantes.
Cependant, cet outil en particulier semble exceller dans ce domaine. Lors de nos premiers essais, nous avons été frappés par la qualité exceptionnelle du résultat obtenu.
Ideogram semble en effet avoir été conçu spécifiquement pour produire des portraits humains d'une grande fidélité. Donc des visuels exempte des défauts communément observés dans les images générées par l'intelligence artificielle. Notamment que les mains déformées, les visages froissés ou autres artefacts indésirables.
Moins performant dans la génération d'un groupe de personnes et d'animaux, quel dommage !
Bien que les performances d'Ideogram pour générer des portraits humains réalistes soient impressionnantes, cet outil n'est pas plus exempt de défauts. La technologie de génération d'images par intelligence artificielle étant encore à un stade précoce, les erreurs et imperfections demeurent monnaie courante. Ideogram, en tant que nouveau venu dans le domaine, n'échappe pas à cette tendance générale.
En effet, dès que l'on s'écarte des simples portraits pour aborder des sujets plus complexes comme les groupes de personnes ou les animaux, la qualité des images produites par Ideogram se dégrade considérablement. Les photos de groupe Présenter souvent des visages déformés de manière choquante. Quant aux représentations d'animaux, elles oscillent entre de légères imperfections et des résultats complètement irréalistes. Même les images de nourriture présentent une finition étrangement artificielle qui les rend peu appétissantes.
Cependant, en présentant les erreurs flagrantes commises par d'autres générateurs d'images IA, les défauts d'Ideogram apparaissent relativement mineurs. On ne peut donc pas lui en tenir rigueur outre mesure.
Gratuit ou payant ?
Ideogram est accessible via une version gratuite permettant de générer jusqu'à 25 invites par jour, avec téléchargement des images au format JPG sans restriction sur les droits d'utilisation.
Deux formules payantes sont également disponibles pour les utilisateurs souhaitant accéder à des fonctionnalités étendues :
- L'abonnement à 8 $ par mois offre une génération prioritaire jusqu'à 400 invites mensuelles (100/jour), un téléchargement en qualité d'origine au format PNG, ainsi qu'un accès à l'éditeur d'images.
- La formule premium à 20 $ par mois inclut toutes les fonctionnalités ci-dessus, avec 1000 invites prioritaires par mois, une génération illimitée en mode non prioritaire, ainsi que la possibilité de télécharger ses propres images pour influencer la génération et de créer des images en mode privé.
En tant qu'interface web, Ideogram permet de générer des images à partir de descriptions textuelles, sans nécessiter l'installation d'une application ou l'utilisation de Discord. Après une inscription rapide avec votre compte Google, vous accédez directement à une interface similaire à Pinterest. À la seule différence que les images proviennent de descriptions textuelles et non des artistes. Ces images, créées gratuitement et libres de droits, sont générées par l'IA en fonction de vos instructions.
Une particularité d'Ideogram est la possibilité de consulter les créations d'autres utilisateurs. Cependant, contrairement à d'autres plateformes, le filtrage semble moins strict, avec la présence potentielle de contenus choquants ou illégaux.
À l'instar de ChatGPT et de Midjourney, la qualité des résultats dépend de la précision de votre invite descriptif. Bien qu'Ideogram propose quelques boutons de styles graphiques, c'est à vous de décrire précisément la scène souhaitée. Mais aussi son style et les éventuels mots à intégrer. En ce qui concerne le rendu par défaut, c'est un carré de 1024 x 1024 pixels. Mais des formats 10h16 et 16h10 sont également disponibles.
Bien que fonctionnant en français, vous obtiendrez des résultats plus détaillés en anglais. Dans ce cas, nous recommande d'utiliser DeepLun traducteur basé sur l'IA, pour sa performance supérieure à Google Translate.
Peut-on, un jour, espérer une IA générative sans défaut ?
Pour les générateurs d'images par intelligence artificielle en phase de perfectionnement, dont Ideogram, il est toujours difficile de définir les invitations ou invites textuels. Mais à l'étape de toute nouvelle technologie, ces outils vont continuer à évoluer. Idéogramme fait d'ailleurs figure de pionnier en parvenant déjà à mieux gérer la génération de prises de vue humaines réalistes que de nombreuses solutions actuelles sur le marché.
Cependant, l'idée que ces générateurs d'IA pourraient un jour atteindre la perfection absolue reste difficile à envisager. Tout bien considéré, ils peinent encore avec de nombreux types d'images basiques, et reproduire un réalisme véritablement fidèle sera tout aussi ardu que dérangeant.
Pour tirer le meilleur parti de ces outils, la clé réside dans la formulation des invites. Pour ce faire, nous vous invitons à lire notre guide des meilleures invitations à utiliser avec les services d'intelligence artificielle génératrice d'images. Vous pourrez ainsi exploiter pleinement leur potentiel dès à présent.
- Partager l'article :
Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons percevoir une commission d'affiliation.