Recherche
Un nouvel outil permet de filigraner et d'identifier les images synthétiques créées par Imagen
Les images générées par l’IA deviennent chaque jour plus populaires. Mais comment mieux les identifier, surtout quand ils semblent si réalistes ?
Aujourd'hui, en partenariat avec Google Cloudnous lançons une version bêta de ID de synthétiseur, un outil de filigrane et d'identification des images générées par l'IA. Cette technologie intègre un filigrane numérique directement dans les pixels d'une image, la rendant imperceptible à l'œil humain, mais détectable pour l'identification.
SynthID est distribué à un nombre limité de Sommet AI clients utilisant Imagel'un de nos derniers modèles de conversion texte-image qui utilise le texte saisi pour créer des images photoréalistes.
Les technologies d'IA générative évoluent rapidement et les images générées par ordinateur, également appelées « images synthétiques », sont de plus en plus difficiles à distinguer de celles qui n'ont pas été créées par un système d'IA.
Si l’IA générative peut libérer un énorme potentiel créatif, elle présente également de nouveaux risques, comme permettre aux créateurs de diffuser de fausses informations, intentionnellement ou non. Être capable d'identifier le contenu généré par l'IA est essentiel pour permettre aux gens de savoir quand ils interagissent avec les médias générés et pour aider à prévenir la propagation de la désinformation.
Nous nous engageons à connecter les gens avec des informations de haute qualité et à maintenir la confiance entre les créateurs et les utilisateurs à travers la société. Une partie de cette responsabilité consiste à fournir aux utilisateurs des outils plus avancés pour identifier les images générées par l’IA afin que leurs images – et même certaines versions modifiées – puissent être identifiées ultérieurement.
Google Cloud est le premier fournisseur de cloud à proposer un outil permettant de créer de manière responsable des images générées par l'IA et de les identifier en toute confiance. Cette technologie s'inscrit dans notre approche du développement et du déploiement d'une IA responsable. Elle a été développée par Google DeepMind et affinée en partenariat avec Google Research.
SynthID n'est pas infaillible contre les manipulations extrêmes d'images, mais il fournit une approche technique prometteuse pour permettre aux personnes et aux organisations de travailler de manière responsable avec le contenu généré par l'IA. Cet outil pourrait également évoluer aux côtés d’autres modèles et modalités d’IA au-delà de l’imagerie, comme l’audio, la vidéo et le texte.
Nouveau type de filigrane pour les images AI
Les filigranes sont des motifs qui peuvent être superposés sur des images pour les identifier. Des empreintes physiques sur papier aux textes et symboles translucides que l'on voit aujourd'hui sur les photos numériques, ils ont évolué au fil de l'histoire.
Les filigranes traditionnels ne suffisent pas pour identifier les images générées par l'IA, car ils sont souvent appliqués comme un tampon sur une image et peuvent facilement être supprimés. Par exemple, les filigranes discrets trouvés dans le coin d’une image peuvent être rognés à l’aide de techniques d’édition de base.
Trouver le bon équilibre entre imperceptibilité et robustesse aux manipulations d’images est difficile. Les filigranes très visibles, souvent ajoutés sous forme de calque avec un nom ou un logo en haut d'une image, présentent également des défis esthétiques à des fins créatives ou commerciales. De même, certains filigranes imperceptibles développés précédemment peuvent être perdus grâce à des techniques d'édition simples comme le redimensionnement.
Nous avons conçu SynthID pour qu'il ne compromette pas la qualité de l'image et permette au filigrane de rester détectable, même après des modifications telles que l'ajout de filtres, le changement de couleurs et l'enregistrement avec divers systèmes de compression avec perte, le plus couramment utilisés pour les fichiers JPEG.
SynthID utilise deux modèles d'apprentissage profond (pour le filigrane et l'identification) qui ont été formés ensemble sur un ensemble diversifié d'images. Le modèle combiné est optimisé sur une série d'objectifs, notamment l'identification correcte du contenu filigrané et l'amélioration de l'imperceptibilité en alignant visuellement le filigrane sur le contenu original.
Approche robuste et évolutive
SynthID permet aux clients de Vertex AI de créer des images générées par l'IA de manière responsable et de les identifier en toute confiance. Bien que cette technologie ne soit pas parfaite, nos tests internes montrent qu'elle résiste à de nombreuses manipulations d'images courantes.
L'approche combinée de SynthID :
- Filigrane: SynthID peut ajouter un filigrane imperceptible aux images synthétiques produites par Imagen.
- Identification: En numérisant une image pour son filigrane numérique, SynthID peut évaluer la probabilité qu'une image soit créée par Imagen.
Cet outil fournit trois niveaux de confiance pour interpréter les résultats de l'identification du filigrane. Si un filigrane numérique est détecté, une partie de l'image est probablement générée par Imagen.
SynthID contribue à la vaste gamme d'approches permettant d'identifier le contenu numérique. L’une des méthodes les plus largement utilisées pour identifier un contenu consiste à utiliser les métadonnées, qui fournissent des informations telles que qui l’a créé et quand. Ces informations sont stockées avec le fichier image. Les signatures numériques ajoutées aux métadonnées peuvent alors indiquer si une image a été modifiée.
Lorsque les informations de métadonnées sont intactes, les utilisateurs peuvent facilement identifier une image. Cependant, les métadonnées peuvent être supprimées manuellement ou même perdues lorsque les fichiers sont modifiés. Étant donné que le filigrane de SynthID est intégré dans les pixels d'une image, il est compatible avec d'autres approches d'identification d'image basées sur des métadonnées et reste détectable même lorsque les métadonnées sont perdues.
Et après?
Pour créer de manière responsable du contenu généré par l’IA, nous nous engageons à développer des approches sûres, sécurisées et dignes de confiance à chaque étape du processus, de la génération et de l'identification d'images à l'éducation aux médias et à la sécurité de l'information.
Ces approches doivent être robustes et adaptables à mesure que les modèles génératifs progressent et s’étendent à d’autres supports. Nous espérons que notre technologie SynthID pourra fonctionner avec un large éventail de solutions pour les créateurs et les utilisateurs de toute la société, et nous continuons à faire évoluer SynthID en recueillant les commentaires des utilisateurs, en améliorant ses capacités et en explorant de nouvelles fonctionnalités.
SynthID pourrait être étendu pour être utilisé sur d'autres modèles d'IA et nous sommes enthousiasmés par la possibilité de l'intégrer dans davantage de produits Google et de le rendre disponible à des tiers dans un avenir proche, permettant ainsi aux personnes et aux organisations de travailler de manière responsable avec le contenu généré par l'IA.
Remarque : Le modèle utilisé pour produire des images synthétiques dans ce blog peut être différent du modèle utilisé sur Imagen et Vertex AI.