Here’s How Generative AI Depicts Queer People

Une autre stratégie potentielle pour diversifier la sortie des modèles d'IA est que les développeurs ajoutent des gardiens et modifient les invites utilisateur, en poussant le logiciel vers l'inclusivité. OpenAI semble avoir adopté cette approche. Quand j'ai demandé à Dall-E 3 via Chatgpt pour «dessiner un dessin animé d'un couple queer profitant d'une soirée dans le Castro», il a élargi l'invite d'image, sans ma demande, dans un paragraphe entier qui comprenait le genre, la race et un arrière-plan supplémentaire détails. Voici l'invite complète fabriquée par Chatgpt à partir de ma demande d'image initiale:

Une illustration de dessins animés d'un couple queer profitant d'une soirée dans le quartier de Castro, San Francisco. Ils marchent joyeusement main dans la main, souriant et discutent. Une personne est une femme de race blanche aux cheveux roux courts, portant une veste en jean élégante et un jean. L'autre personne est un homme noir aux cheveux noirs courts, arborant un t-shirt vert décontracté et un pantalon noir. Le fond présente la vie de rue vibrante et colorée du Castro, avec des drapeaux arc-en-ciel, des cafés animés et des foules vivantes. L'atmosphère est joyeuse et accueillante, soulignant la diversité et l'inclusivité de la région.

Bien que utile dans certains cas, la modification des invites peut également être frustrant pour les utilisateurs lorsqu'ils sont mal mis en œuvre. Le PDG de Google s'est excusé lorsque Gemini, la plate-forme générative de Google, a modifié les invites d'utilisateurs et généré des photos de nazis noirs ainsi que d'autres images anhistoriques. Y a-t-il eu une intrigue secrète à l'intérieur de l'entreprise pour effacer le peuple caucasien de l'histoire? Il est plus plausible que les ingénieurs de Gemini aient trouvé l'outil initialement surproduit des images d'hommes blancs, comme De nombreux outils d'IA font actuellementet les développeurs de Google semblent avoir exagéré leurs ajustements correctifs pendant le se précipiter pour lancer Le chatbot d'abonnement de l'entreprise.

Même avec de meilleures données du modèle et des garde-corps logiciels, la fluidité de l'existence humaine peut échapper à la rigidité de la catégorisation algorithmique. «Ils utilisent essentiellement le passé pour faire l'avenir», explique William Agnew, boursier postdoctoral chez Carnegie Mellon et queer de longue date dans l'organisateur de l'IA. «Cela semble être l'antithèse du potentiel infini de croissance et de changement qui est une grande partie des communautés queer.» En amplifiant les stéréotypes, non seulement les outils d'IA présentent le risque de dénicher des groupes minoritaires follement auprès du grand public, mais ces algorithmes ont également le potentiel de restreindre la façon dont les gens queer se voient et se comprennent.

Ça vaut la peine de faire une pause Pendant un instant, reconnaître la vitesse vertigineuse à laquelle certains aspects de l'IA générative continuent de s'améliorer. En 2023, Internet est allé en feu une vidéo monstrueuse de l'IA de Will Smith mangeant des spaghettis. Un an plus tard, les clips de texte à vidéo du modèle Sora inédit d'Openai sont toujours imparfaits mais sont souvent étranges avec leur photoréalisme.

L'outil vidéo de l'IA est toujours en phase de recherche et n'a pas été libéré au publicmais je voulais mieux comprendre comment il représente des personnes queer. J'ai donc contacté Openai et j'ai fourni trois invites à Sora: «Un groupe diversifié d'amis célébrant pendant le défilé de la fierté de San Francisco sur un flotteur arc-en-ciel coloré»; «Deux femmes dans de superbes robes de mariée se marient dans une ferme du Kansas»; et «un homme transgenre et son partenaire non binaire jouant à un jeu de société dans l'espace». Une semaine plus tard, j'ai reçu trois vidéoclips exclusifs que les affirmations de l'entreprise ont été générés par son modèle de texte à vidéo sans modification.

Cette vidéo générée par l'AI a été réalisée avec l'invite “un groupe diversifié d'amis célébrant lors du défilé de la fierté de San Francisco sur un flotteur arc-en-ciel coloré”. Alors que vous redressez le clip, concentrez-vous sur différentes personnes qui roulent sur le flotteur pour repérer les bizarreries de la génération, des drapeaux disparaissant aux pieds drôles.

Sora via Openai

Les vidéoclips sont désordonnés mais merveilleux. Les gens qui roulent dans un flotteur dans les drapeaux arc-en-ciel de la vague de parade de San Francisco qui défient les lois de la physique alors qu'ils se transforment en néant et réapparaissent de l'air mince. Deux épouses en robes blanches se sourit à l'autel, alors que leurs mains se mélangent dans une touffe de doigt impie. Alors qu'un couple queer joue un jeu de société, il semble passer à travers des morceaux de jeu, comme des fantômes.

Cette vidéo générée par l'AI a été réalisée avec l'invite «un homme transgenre et son partenaire non binaire jouant un jeu de société dans l'espace». C'est une bonne idée pour les vrais astronautes de mettre leurs casques tout en flottant dans l'espace.

Sora via Openai

Le clip qui est censé montrer une personne non binaire jouant à des jeux dans l'espace est visible parmi les trois vidéos. Les verrous lilas apparemment étranges reviennent, les tatouages ​​désordonnés se dispersent sur leur peau, et une hyperpigmentation ressemblant à des échelles de reptiles engloutit leur visage. Même pour un générateur de vidéos IA impressionnant comme Sora, la représentation des gens non binaires semble être difficile.

Cette vidéo générée par l'AI a été réalisée avec l'invite «Deux femmes dans des robes de mariée superbes se mariant dans une ferme du Kansas». Même si elle a l'air réaliste au début, jetez un coup d'œil à la façon dont les mains des mariées se fondent ensemble.

Sora via Openai

Lorsque Wired a montré ces clips aux membres de Queer dans l'IA, ils ont remis en question la définition de la diversité de Sora concernant le groupe d'amis lors du défilé de la fierté. «Les modèles sont notre référence pour à quoi ressemble la diversité?» demande Sabine Weber, un informaticien de l'Allemagne. En plus de souligner l'attractivité exagérée des humains dans la vidéo, un occurrence courante Pour les visualisations de l'IA, Weber a demandé pourquoi il n'y avait pas plus de représentation de personnes queer qui sont plus âgées, plus grosses ou qui ont des handicaps visibles.

Vers la fin de notre conversation, Agnew a expliqué pourquoi les représentations algorithmiques peuvent être troublantes pour les personnes LGBTQ. “Il est trivial de les amener à combiner des choses qui, seules, sont bien mais ensemble sont profondément problématiques”, disent-ils. «Je suis très inquiet que les représentations de nous-mêmes, qui sont déjà un champ de bataille constant, vont soudainement être retirées de nos mains.» Même si les outils d'IA incluent des représentations plus holistiques de personnes queer à l'avenir, les représentations synthétiques peuvent manifester des conséquences involontaires.