An Avalanche of Generative AI Videos Is Coming to YouTube Shorts
Eli Collins, un vice-président de la gestion des produits chez Google DeepMind, a fait pour la première fois une démonstration d'outils vidéo d'IA générative pour le conseil d'administration de l'entreprise en 2022. Malgré la lenteur du modèle, son coût de fonctionnement élevé et ses résultats parfois décalés, il dit que c'était un coup d'œil. moment d’ouverture pour qu’ils puissent voir de nouveaux clips vidéo générés à partir d’une invite aléatoire.
Aujourd'hui, quelques années plus tard, Google a plans annoncés pour un outil intégré à l'application YouTube qui permettra à quiconque de générer des clips vidéo IA, en utilisant le modèle Veo de l'entrepriseet publiez-les directement dans le cadre de YouTube Shorts. “D'ici 2025, nous allons permettre aux utilisateurs de créer des clips vidéo et des courts métrages autonomes”, déclare Sarah Ali, directrice principale de la gestion des produits chez YouTube. “Ils pourront générer des vidéos de six secondes à partir d'une invite de texte ouverte.” Ali dit que la mise à jour pourrait aider les créateurs à la recherche de séquences pour compléter une vidéo ou à essayer d'imaginer quelque chose de fantastique. Elle insiste sur le fait que l’outil Veo AI n’est pas destiné à remplacer la créativité, mais à l’augmenter.
Ce n'est pas la première fois que Google introduit des outils génératifs pour YouTube, même si cette annonce constituera l'intégration vidéo IA la plus complète de l'entreprise à ce jour. Au cours de l'été, Google a lancé un outil expérimental, appelé Écran de rêvepour générer des arrière-plans IA pour les vidéos. Avant le déploiement complet des clips générés l'année prochaine, Google mettra à jour cet outil d'écran vert d'IA avec le modèle Veo au cours des prochains mois.
La société technologique tentaculaire a présenté plusieurs modèles vidéo d’IA ces dernières années, comme Image et Lumièremais tente de se regrouper autour d’une vision plus unifiée avec le modèle Veo. « Soit dit en passant, Veo sera notre modèle à l'avenir », déclare Collins. “Il ne faut pas s'attendre à cinq modèles supplémentaires de notre part.” Oui, Google publiera probablement un autre modèle vidéo à terme, mais il prévoit de se concentrer sur Veo dans un avenir proche.
Google est confronté à la concurrence de plusieurs startups développant leurs propres outils génératifs de synthèse texte-vidéo. Sora d'OpenAI est le concurrent le plus connu, mais le modèle vidéo d'IA, annoncé plus tôt en 2024, n'est pas encore accessible au public et est réservé à un petit nombre de testeurs. Quant aux outils largement disponibles, la startup d'IA Runway a publié plusieurs versions de son logiciel vidéo, y compris un outil récent permettant d'adapter des vidéos originales en versions de réalité alternative du clip.
L'annonce de YouTube intervient alors que les outils d'IA générative sont devenus encore plus controversés pour les créateurs, qui considèrent parfois la vague actuelle d'IA comme voler leur travail et en essayant de nuire au processus créatif. Ali ne voit pas les outils d'IA générative s'interposer entre les créateurs et l'authenticité de leur relation avec les téléspectateurs. « Il s'agit vraiment du public et de ce qui l'intéresse, pas nécessairement des outils », dit-elle. “Mais si votre public est intéressé par la façon dont vous l'avez réalisé, cela sera ouvert via la description.” Google prévoit de filigraner chaque vidéo IA générée pour YouTube Shorts avec ID de synthétiseurqui intègre une balise imperceptible pour aider à identifier la vidéo comme synthétique, ainsi qu'une clause de non-responsabilité « réalisé avec l'IA » dans la description.
Les influenceurs de la Hustle Culture essaient déjà de jouer avec l'algorithme en utilisant plusieurs outils tiers pour automatiser le processus de création et gagner de l'argent avec un minimum d'effort. L'intégration de Veo l'année prochaine entraînera-t-elle une nouvelle avalanche de courts métrages YouTube contenant du spam et de mauvaise qualité dominant les flux des utilisateurs ? « Je pense que notre expérience en matière de recommandation du bon contenu au bon spectateur fonctionne dans le monde de l'IA à grande échelle, car nous l'avons fait à une très grande échelle », explique Ali. Elle souligne également que Consignes standard de YouTube s'applique toujours, quel que soit l'outil utilisé pour créer la vidéo.
L'art de l'IA a souvent un esthétique distinctece qui pourrait être préoccupant pour les créateurs de vidéos qui valorisent l'individualité et souhaitent que leur contenu soit unique. Collins espère que les empreintes digitales de Google ne sont pas partout sur les sorties vidéo de l'IA. « Je ne veux pas que les gens regardent cela et disent : « Oh, c'est le modèle DeepMind » », dit-il. Obtenir l’invitation à produire une sortie d’IA alignée sur ce que le créateur a envisagé est un objectif principal, et éviter l’esthétique manifeste pour Veo est essentiel pour parvenir à une adaptabilité à grande échelle.
« Une grande partie du voyage consiste à créer quelque chose qui soit utile aux gens, évolutif et déployable », explique Collins. « Ce n'est pas seulement une démo. Il est utilisé dans un produit réel. Il pense que l’intégration d’outils d’IA générative directement dans l’application YouTube sera transformationnelle pour les créateurs, ainsi que pour DeepMind. « Nous n'avons jamais vraiment créé de produit créateur », dit-il. “Et nous ne l'avons certainement jamais fait à cette échelle.”