Generative AI Systems Aren’t Just Open or Closed Source

Récemment, une fuite documentprétendument de Google, a affirmé que l'IA open-source dépasserait Google et Openai. La fuite a mis en évidence les conversations en cours dans la communauté de l'IA sur la façon dont un système d'IA et ses nombreux composants devraient être partagés avec les chercheurs et le public. Même avec la série de versions récentes du système d'IA génératives, ce problème reste non résolu.

Beaucoup de gens le considèrent comme une question binaire: les systèmes peuvent être open source ou fermés. Le développement ouvert décentralise le pouvoir afin que de nombreuses personnes puissent collectivement travailler sur des systèmes d'IA pour s'assurer qu'ils reflètent leurs besoins et leurs valeurs, comme on le voit avec La floraison de BigScience. Bien que l'ouverture permet à plus de personnes de contribuer à la recherche et au développement de l'IA, le potentiel de dommages et d'utilisation abusif, en particulier des acteurs malveillants, augmente avec plus d'accès. Des systèmes de source fermée, comme La version originale de Google LAMDAsont protégés contre les acteurs à l'extérieur de l'organisation des développeurs mais ne peuvent pas être vérifiés ou évalués par des chercheurs externes.

J'ai dirigé et fait des recherches sur les versions génératives du système d'IA, y compris GPT-2 d'Openaidepuis que ces systèmes ont commencé à être disponibles pour une utilisation généralisée, et je me concentre maintenant sur ouverture éthique Considérations à l'étreinte Face. En faisant ce travail, je suis venu à penser à l'open source et à la source fermée comme les deux extrémités d'un Gradient des options pour libérer les systèmes d'IA génératifsplutôt qu'une simple question / ou une question.

Graphique montrant divers logiciels générateurs d'IA et leur ouverture de niveau avec des considérations de risque correspondantes

Illustration: Irene Solaiman

À une extrémité extrême du gradient se trouvent des systèmes si fermés qu'ils ne sont pas connus du public. Il est difficile de citer des exemples concrètes de ceux-ci, pour des raisons évidentes. Mais à un pas sur le gradient, les systèmes fermés annoncés publiquement deviennent de plus en plus courants pour les nouvelles modalités, telles que la génération de vidéos. Étant donné que la génération vidéo est un développement relativement récent, il y a moins de recherches et d'informations sur les risques qu'il présente et comment les atténuer au mieux. Quand Meta a annoncé son Make-a-video Modèle en septembre 2022, il Cité des préoccupations Comme la facilité avec laquelle n'importe qui pourrait faire du contenu réaliste et trompeur comme des raisons de ne pas partager le modèle. Au lieu de cela, Meta a déclaré qu'elle permettra progressivement l'accès aux chercheurs.

Au milieu du gradient, les systèmes Les utilisateurs occasionnels sont le plus familiers. Chatgpt et MidJourney, par exemple, sont des systèmes hébergés accessibles au public où l'organisation du développeur, Openai et MidJourney respectivement, partage le modèle via une plate-forme afin que le public puisse inviter et générer des résultats. Avec leur large portée et une interface sans code, ces systèmes se sont révélés à la fois utiles et risqué. Bien qu'ils puissent permettre plus de commentaires qu'un système fermé, car les personnes en dehors de l'organisation hôte peuvent interagir avec le modèle, ces étrangers ont des informations limitées et ne peuvent pas rechercher de manière robuste le système par, par exemple, en évaluant les données de formation ou le modèle lui-même.

À l'autre extrémité du gradient, un système est entièrement ouvert lorsque tous les composants, des données de formation au code au modèle lui-même, sont entièrement ouverts et accessibles à tout le monde. L'IA générative est construite sur des recherches ouvertes et des leçons à partir de premiers systèmes comme Bert de Googlequi était complètement ouvert. Aujourd'hui, les systèmes les plus utilisés entièrement ouverts sont lancés par des organisations axées sur la démocratisation et la transparence. Initiatives organisées par un visage étreint (auquel je contribue) – comme Bigscience et Bigcodeco-dirigé avec ServiceNow – et par des collectifs décentralisés comme Eleutherai sont maintenant populaires études de cas pour la construction systèmes ouverts à inclure de nombreuses langues et peuples dans le monde.

Il n'y a pas de méthode de libération définitivement sûre ou d'ensemble standardisé de Normes de libération. Il n'y a pas non plus de corps établi pour établir des normes. Les premiers systèmes d'IA génératifs comme Elmo et Bert étaient largement ouverts jusqu'à la sortie de GPT-2 en 2019, ce qui a déclenché de nouveaux Discussions sur le déploiement de responsabilité des systèmes de plus en plus puissants, tels que ce que la version ou obligations de publication devrait être. Depuis lors, les systèmes à travers les modalités, en particulier de grandes organisations, se sont déplacés vers la fermeté, ce qui concerne les inquiétudes concernant la concentration de pouvoir dans les organisations de haut niveau capables de développer et de déployer ces systèmes.