AI Videos Are Freaky and Weird Now. But Where Are They Headed?
Les courtes vidéos Donnez l'impression d'un flipbook, sautant tremblant d'un cadre surréaliste à l'autre. Ils sont le résultat de fabricants de mèmes Internet jouant avec les premiers générateurs de texte IA de texte largement disponibles, et ils représentent des scénarios impossibles comme Dwayne “The Rock” Johnson Manger des rochers et un président français Emmanuel Macron tamiser et mâcher des ordures, ou des versions déformées du banal, comme Paris Hilton prendre un selfie.
Cette nouvelle vague de vidéos générées par l'AI a des échos précis de Dall-E, qui a balayé Internet l'été dernier lorsqu'il a effectué le même truc avec des images fixes. Moins d'un an plus tard, ces images bancales à Dall-E sont presque indiscernables de la réalité, soulevant deux questions: la vidéo générée par l'IA-AI avancera-t-elle aussi rapidement, et aura-t-elle une place à Hollywood?
Modelcopeun générateur de vidéos organisé par la société AI Hugging Face, permet aux gens de taper quelques mots et de recevoir une vidéo surprenante et bancale en retour. Runway, la société AI qui a copiré la diffusion stable du générateur d'images, annoncé Un générateur de texte à vidéo fin mars, mais il ne l'a pas largement mis à la disposition du public. Et Google et Méta Les deux ont annoncé qu'ils travaillaient sur la technologie de texte à vidéo à l'automne 2022.
En ce moment, ce sont des vidéos de célébrités choquées ou un ours en peluche peignant un autoportrait. Mais à l'avenir, le rôle de l'IA dans le film pourrait évoluer au-delà du mème viral, permettant à la technologie d'aider les films à lancer, de modéliser des scènes avant d'être tournées, et même d'échanger des acteurs dans et hors des scènes. La technologie progresse rapidement, et il faudra probablement des années avant que ces générateurs puissent, dire, produire un court métrage entier basé sur des invites, s'ils le font. Pourtant, le potentiel d'Ai dans le divertissement est massif.
«La façon dont Netflix a perturbé comment et où nous regardons le contenu, je pense que l'IA va avoir une perturbation encore plus importante sur la création réelle de ce contenu lui-même», explique Sinead Bovell, futuriste et fondateur de la société d'éducation technologique Waye.
Mais cela ne signifie pas que l'IA remplacera entièrement les écrivains, les réalisateurs et les acteurs de sitôt. Et quelques obstacles techniques importants demeurent. Les vidéos semblent nerveuses car les modèles d'IA ne peuvent pas encore maintenir une cohérence complète d'un cadre à l'autre, ce qui est nécessaire pour lisser les visuels. Faire du contenu qui dure plus longtemps que quelques secondes grotesques fascinantes et maintient sa cohérence nécessitera plus de puissance et de données informatiques, ce qui signifie de grands investissements dans le développement de la technologie. «Vous ne pouvez pas facilement augmenter ces modèles d'images», explique Bharath Hariharan, professeur d'informatique à l'Université Cornell.
Mais, même s'ils ont l'air rudimentaires, la progression de ces générateurs progresse «vraiment, très rapidement», explique Jiasen Lu, chercheuse à l'Institut Allen de l'intelligence artificielle, une organisation de recherche fondée par feu le cofondateur de Microsoft Paul Allen.
La vitesse du progrès est le résultat de nouveaux développements qui ont renforcé les générateurs. Modelcope est formé sur les données de texte et d'image, comme les générateurs d'images, puis ont également nourri des vidéos qui montrent le modèle comment le mouvement devrait Regardez, dit Apolinário Passos, un ingénieur artistique d'apprentissage automatique à Hugging Face. C'est la tactique également utilisée par Méta. Il supprime le fardeau de l'annoting des vidéos ou de les étiqueter avec des descripteurs de texte, ce qui simplifie le processus et a inauguré le développement rapide de la technologie.