ChatGPT Is Cutting Non-English Languages Out of the AI Revolution
Dans une boîte de dialogue séparée, lorsqu'elle est interrogée en anglais, le chat Bing a correctement identifié la Thaïlande comme l'emplacement des rumeurs pour le prochain paramètre de l'émission télévisée Lotus blancmais a fourni «quelque part en Asie» lorsque la requête a été traduite en espagnol, explique Solis, qui dirige un conseil appelé Orainti qui aide les sites Web à augmenter les visites des moteurs de recherche.
Les dirigeants de Microsoft, OpenAI et Google travaillant sur des chatbots ont déclaré que les utilisateurs peuvent contrer les mauvaises réponses en ajoutant des instructions plus détaillées à leurs requêtes. Sans guide explicite, le biais des chatbots pour se rabattre sur la parole en anglais et les perspectives anglophones peut être forte. Il suffit de demander à Veruska Anconitano, un autre expert en optimisation des moteurs de recherche, qui divise son temps entre l'Italie et l'Irlande. Elle a trouvé que poser des questions de chat à Bing en italien a tiré des réponses en anglais à moins qu'elle ne spécifiait «répondez-moi en italien». Dans un chat différent, dit Anconitano, Bing a supposé qu'elle voulait l'invite japonaise 元気ですか («Comment allez-vous?») Rendu en anglais plutôt que de poursuivre la conversation en japonais.
Des documents de recherche récents ont validé les résultats anecdotiques des personnes qui courent dans les limites du chat de Bing et de ses frères. Zheng-Xin Yong, un doctorant à l'Université Brown, étudiant également des modèles de langues multilingues, dit que lui et ses collaborateurs ont trouvé dans une étude que générant de meilleures réponses pour les questions chinoises nécessitait de leur poser en anglais plutôt qu'en chinois.
Quand Fung à Hong Kong et ses collaborateurs essayé de demander le chatppt Pour traduire 30 phrases, il a correctement rendu 28 de l'Indonésien en anglais, mais seulement 19 dans l'autre sens, suggérant que les Américains monoglot qui se tournent vers le bot pour conclure des accords avec les marchands indonésiens. Il a été constaté que la même maîtrise unidirectionnelle se répétait dans au moins cinq autres langues.
Les problèmes linguistiques des modèles de grande langue les rendent difficiles à faire confiance pour quiconque s'aventurera l'anglais et peut-être le chinois. Lorsque j'ai cherché à traduire les anciens hymnes sanscrits via Chatgpt dans le cadre d'une expérience de l'utilisation de l'IA pour accélérer la planification de mariage, les résultats semblaient suffisamment plausibles pour ajouter un script de cérémonie. Mais je ne savais pas si je pouvais compter sur eux ou que je serais ri de la scène par des anciens.
Les chercheurs qui ont parlé à Wired voient certains signes d'amélioration. Lorsque Google a créé son Palmier 2 Modèle de langue, publié ce mois-ci, il a fait un effort pour augmenter les données de formation non anglophones pour plus de 100 langues. Le modèle reconnaît les idiomes en allemand et swahili, en plaisantant en japonais et nettoie la grammaire en Indonésien, dit Google, et il reconnaît mieux les variations régionales que les modèles antérieurs.
Mais dans les services de consommation, Google garde Palm 2 en cage. Son chatbot Bard est alimenté par Palm 2 mais ne fonctionne qu'en anglais, japonais et coréen. Un assistant d'écriture pour Gmail qui utilise Palm 2 ne prend en charge que l'anglais. Il faut du temps pour soutenir officiellement une langue en effectuant des tests et en appliquant des filtres pour s'assurer que le système ne génère pas de contenu toxique. Google n'a pas fait un investissement total pour lancer de nombreuses langues depuis le début, bien qu'il fonctionne pour en ajouter rapidement plus.