Une autre stratégie potentielle pour diversifier les résultats des modèles d’IA consiste pour les développeurs à ajouter des garde-fous et à modifier les invites des utilisateurs, poussant ainsi le logiciel vers l’inclusivité. OpenAI semble avoir adopté cette approche. Lorsque j'ai demandé à Dall-E 3 via ChatGPT de « dessiner un dessin animé d'un couple homosexuel profitant d'une soirée à Castro », il a étendu l'invite d'image, sans que je le demande, en un paragraphe entier incluant le sexe, la race et un contexte supplémentaire. détails. Voici l'invite complète créée par ChatGPT à partir de ma demande d'image initiale :
Illustration d'une caricature d'un couple queer profitant d'une soirée dans le quartier de Castro, à San Francisco. Ils marchent joyeusement main dans la main, sourient et discutent. Une personne est une femme de race blanche aux cheveux roux courts, portant une élégante veste en jean et un jean. L’autre personne est un homme noir aux cheveux noirs courts, portant un t-shirt vert décontracté et un pantalon noir. L’arrière-plan présente la vie de rue vibrante et colorée de Castro, avec des drapeaux arc-en-ciel, des cafés animés et des foules animées. L'atmosphère est joyeuse et accueillante, mettant en valeur la diversité et l'inclusivité de la région.
Bien qu'utile dans certains cas, la modification des invites peut également être frustrante pour les utilisateurs lorsqu'elle est mal mise en œuvre. PDG de Google s'est excusé lorsque Gemini, la plate-forme d'IA générative de Google, a modifié les invites des utilisateurs et généré des photos de nazis noirs ainsi que d'autres images anhistoriques. Y avait-il un complot secret au sein de l’entreprise visant à effacer les peuples caucasiens de l’histoire ? Il est plus plausible que les ingénieurs de Gemini aient découvert que l'outil surproduisait initialement des images d'hommes blancs, comme de nombreux outils d'IA le font actuellementet les développeurs de Google semblent avoir exagéré leurs ajustements correctifs au cours de la se précipiter pour lancer le chatbot d'abonnement de l'entreprise.
Même avec de meilleurs modèles de données et des garde-fous logiciels, la fluidité de l’existence humaine peut échapper à la rigidité de la catégorisation algorithmique. «Ils utilisent essentiellement le passé pour créer l'avenir», explique William Agnew, chercheur postdoctoral à Carnegie Mellon et organisateur de longue date de Queer in AI. « Cela semble être l'antithèse du potentiel infini de croissance et de changement qui caractérise une grande partie des communautés queer. » En amplifiant les stéréotypes, non seulement les outils d’IA courent le risque de donner une fausse représentation des groupes minoritaires au grand public, mais ces algorithmes ont également le potentiel de restreindre la façon dont les personnes queer se perçoivent et se comprennent.
Ça vaut la peine de faire une pause pour reconnaître un instant la vitesse vertigineuse à laquelle certains aspects de l’IA générative continuent de s’améliorer. En 2023, Internet s’est enflammé pour se moquer d’un monstrueux Vidéo IA de Will Smith manger des spaghettis. Un an plus tard, clips texte-vidéo de Sora inédit d'OpenAI les modèles sont encore imparfaits mais sont souvent étranges par leur photoréalisme.
L'outil vidéo IA est encore en phase de recherche et n'a pas été rendu public, mais je voulais mieux comprendre comment cela représente les personnes queer. J'ai donc contacté OpenAI et fourni trois invites à Sora : « un groupe diversifié d'amis célébrant le défilé de la fierté de San Francisco sur un char arc-en-ciel coloré » ; « deux femmes vêtues de superbes robes de mariée se marient dans une ferme du Kansas » ; et « un homme transgenre et son partenaire non binaire jouant à un jeu de société dans l’espace ». Une semaine plus tard, j'ai reçu trois clips vidéo exclusifs qui, selon la société, avaient été générés par son modèle texte-vidéo sans modification.
Les clips vidéo sont brouillons mais merveilleux. Les gens qui montent sur un char lors du défilé de la fierté de San Francisco brandissent des drapeaux arc-en-ciel qui défient les lois de la physique alors qu'ils se transforment en néant et réapparaissent de nulle part. Deux mariées en robes blanches se sourient debout devant l'autel, tandis que leurs mains se fondent en une touffe de doigts impies. Tandis qu'un couple queer joue à un jeu de société, ils semblent traverser des pièces de jeu, comme s'il s'agissait de fantômes.
Le clip censé montrer une personne non binaire jouant à des jeux dans l’espace se démarque parmi les trois vidéos. Les mèches lilas apparemment étranges reviennent, des tatouages en désordre se dispersent sur leur peau et une hyperpigmentation ressemblant à des écailles de reptile engloutit leur visage. Même pour un générateur vidéo d’IA impressionnant comme Sora, représenter des personnes non binaires semble être un défi.
Lorsque WIRED a montré ces clips aux membres de Queer in AI, ils ont remis en question la définition de Sora de la diversité concernant le groupe d'amis lors du défilé de la fierté. « Les modèles sont notre référence pour déterminer à quoi ressemble la diversité ? » demande Sabine Weber, une informaticienne allemande. En plus de souligner l'attractivité excessive des humains dans la vidéo, un Occurrence fréquente pour les visualisations de l'IA, Weber s'est demandé pourquoi il n'y avait pas plus de représentation des personnes queer qui sont plus âgées, de plus grande taille ou qui ont des handicaps visibles.
Vers la fin de notre conversation, Agnew a expliqué pourquoi les représentations algorithmiques peuvent être déconcertantes pour les personnes LGBTQ. « Il est trivial de les amener à combiner des choses qui, en elles-mêmes, sont bonnes mais qui, ensemble, sont profondément problématiques », disent-ils. « Je suis très inquiet à l'idée que les représentations de nous-mêmes, qui sont déjà un champ de bataille constant, nous soient soudainement retirées du contrôle. » Même si les outils d’IA incluent à l’avenir des représentations plus holistiques des personnes queer, les représentations synthétiques pourraient avoir des conséquences inattendues.