To Watermark AI, It Needs Its Own Alphabet
Seulement quelques-uns Il y a des mois, le contenu de l'IA était facile à repérer: les inflexions non naturelles dans le discours, les lobes d'oreille étranges sur les photos, le langage fade par écrit. Ce n'est plus le cas. En juin, les escrocs ont utilisé une IA pour imiter la voix d'une fille Et vole sa mère. Les candidats utilisent déjà DeepFakes comme propagande. Et Les LLM peuvent aider les spammeurs En automatisant les conversations en aller-retour autrement coûteuses nécessaires pour séparer une marque de leur argent. Nous avons besoin d'un moyen de distinguer les choses faites par les humains des choses faites par des algorithmes, et nous en avons besoin très bientôt.
Une façon universelle de dire le contenu généré par l'homme à partir de contenu généré par l'IA-atténuerait bon nombre des préoccupations que les gens ont concernant cette technologie en plein essor. Les consommateurs de texte génératif pouvaient «révéler l'IA» pour voir rapidement ce qui a été écrit par une machine. Les sociétés de logiciels pourraient ajouter une sensibilisation au balisage de l'IA à leurs produits, en modifiant la façon dont nous trouvons, remplacez, copiez, collez et partagez du contenu. Les gouvernements pourraient accepter d'acheter une IA générative uniquement auprès d'entreprises qui marquent leur production de cette manière, créant des incitations considérables sur le marché. Les enseignants pouvaient insister pour que les élèves laissent les marques intactes pour tirer parti du pouvoir de l'IA génératrice tout en montrant leur pensée originale. Et les marques qui veulent être «transparentes» pourraient promettre de ne pas supprimer le marqueur, faisant du non-GPT le nouveau non-OGM.
Heureusement, nous avons une solution en attente de la vue. Mais pour comprendre l'élégance de ce hack relativement simple, regardons d'abord les alternatives et pourquoi ils ne fonctionneront pas.
Les législateurs et les entreprises technologiques conviennent que la meilleure façon de distinguer le contenu généré par l'IA du contenu fabriqué par les humains est de le marquer au point d'origine, ce que sept entreprises technologiques se sont engagées à faire dans le cadre d'un accord que la Maison Blanche a annoncée la semaine dernière. Il existe trois grandes approches pour faire un filigrane du contenu numérique. La première consiste à ajouter des métadonnées, que les caméras font depuis des décennies. Les blocs de texte sont également souvent marqués. Lorsque vous tapez quelque chose audacieuxou définir la couleur d'une police sur un site Web, le traitement de texte ou le navigateur étiquette votre contenu avec des métadonnées. Mais c'est spécifique à l'application: collez un texte audacieux dans votre barre d'adresse, et le formatage a disparu.
Vous pouvez également filigraner des images numériques en utilisant stéganographiequi cache un message dans un autre cryptographiquement. Utilisé pour la première fois par les espions pour faire passer des secrets en contrebande, il existe maintenant de nombreux outils de conception qui Ajouter des marques cachées aux imagesensuite ramper sur le Web à la recherche de contrevenants au droit d'auteur. Et le chiffrement fonctionne également pour le filigrane. Vous pouvez signer numériquement un paragraphe de texte, puis dire quand il a été modifié, soit via un système centralisé (une autorité de certificat numérique), soit une autorité distribuée (une blockchain). C'est pourquoi ce film que vous avez acheté ne joue qu'à iTunes, et ce NFT que vous avez oublié vous appartient toujours.
Mais ces approches ont trois problèmes fondamentaux. Premièrement, ils nécessitent une immense coordination. En revanche, une bonne solution de balisage de l'IA devrait travailler de manière transparente sur des milliards d'appareils. Les marques devraient survivre à la copiation et à l'entrée d'une application, d'un système d'exploitation ou d'une plate-forme à une autre. Deuxièmement, toute solution devrait être accessible à tout humain avec une connexion Internet, sans aucune formation, immédiatement. Il devrait être déployable dans le monde entier avec une mise à jour logicielle.
Troisièmement, alors que les filigranes fonctionnent assez bien pour de grands objets comme les images, les chansons ou les chapitres de livre, ils ne fonctionnent pas pour des objets plus petits comme des mots ou des lettres individuels. Cela signifie que ces approches ne gèrent pas le contenu qui mélange bien l'homme et la machine. Si vous avez un document généré par une IA, puis édité par un humain, vous avez besoin d'un filigrane plus fin – l'équivalent numérique d'un surligneur.
Cela peut sembler un ordre incroyablement grand. Mais en fait, ce système existe déjà: Unicode.
Unicode est le système de numérotation universel pour le texte, et le texte est le bloc de construction fondamental d'Internet. Dans Unicode, chaque personnage a un nombre. La lettre de majuscules latine A, par exemple, est hexadécimal numéro 41. Mais il y a beaucoup d'autres A en Unicode: il y a la lettre de capital latin FullWidth A (a, numéro EF BC A1), Mathématique Bold Capital A (𝐀, numéro F0 9d 90 80), Mathématique Sans-Serif Capital A (𝖠, F0 9D 96 A0), et beaucoup de autres. Chacun a a son propre nom, sa propre valeur Unicode, et dans certains cas, sa propre forme de police. Pourquoi ne pas créer une lettre a juste pour l'IA?