AI Can Clone Your Favorite Podcast Host’s Voice
“Vous devez demander à l'entreprise:” Comment ma voix d'IA va-t-elle être stockée? Vous stockez réellement mes enregistrements? Le stockez-vous crypté? Qui y a accès? “”, Dit Balasubramaniyan. «Cela fait partie de moi. C'est mon moi intime. Je dois le protéger tout aussi bien.»
Podcastle dit que les modèles vocaux sont cryptés de bout en bout et que l'entreprise ne conserve aucun enregistrement après avoir créé le modèle. Seul le titulaire du compte qui a enregistré les clips vocaux peut y accéder. Podcastle ne permet pas non plus que d'autres audio soient téléchargés ou analysés sur Revoice. En fait, la personne créant une copie de sa voix doit enregistrer les lignes de texte pré-écrit directement dans l'application de Revoice. Ils ne peuvent pas simplement télécharger un fichier préenregistré.
«Vous êtes celui qui donne la permission et créant le contenu», explique Yeritsyan de Podcastle. “Que ce soit artificiel ou original, si ce n'est pas une voix profonde, c'est la voix de cette personne et il l'a mis là-bas. Je ne vois pas de problèmes.”
Podcastle espère que pouvoir rendre l'audio uniquement dans la voix clonée d'une personne consentante dissuaderait les gens de se faire dire quelque chose de trop horrible. Actuellement, le service n'a aucune modération ou restriction de contenu sur des mots ou des phrases spécifiques. Yeritsyan dit que c'est à ce que le service ou le point de vente publie le son – comme Spotify, les podcasts Apple ou YouTube – pour contrôler le contenu qui est poussé sur leurs plateformes.
«Il y a d'énormes équipes de modération sur toutes les plateformes sociales ou toute plate-forme de streaming», explique Yeritsyan. “C'est donc leur travail de ne pas laisser quelqu'un d'autre utiliser la fausse voix et créer quelque chose de stupide ou quelque chose de non éthique et de le publier là-bas.”
Même si le problème très épineux de la voix Deepfakes et des clones d'IA non consensuels est abordé, il n'est toujours pas difficile de savoir si les gens accepteront un clone informatisé comme un remplaçant acceptable pour un humain.
Fin mars, le comédien Drew Carey a utilisé l'outil d'ElevenLabs pour publier un épisode entier d'une émission de radio qui a été lue par son clone Voice. Pour la plupart, les gens détesté. Le podcasting est un support intime, et la connexion humaine distincte que vous ressentez lorsque les gens ont une conversation ou raconter des histoires sont facilement perdus lorsque les robots passent au microphone.
Mais que se passe-t-il lorsque la technologie progresse au point que vous ne pouvez pas faire la différence? Est-ce important que ce ne soit pas vraiment votre podcaster préféré dans votre oreille? Le discours sur l'IA cloné a du chemin à parcourir avant qu'il ne soit indiscernable du discours humain, mais il rattrape sûrement rapidement. Il y a à peine un an, les images générées par l'AI avaient l'air caricaturales, et maintenant elles sont assez réalistes pour tromper des millions en pensant que le pape avait de nouveaux vêtements d'extérieur. Il est facile d'imaginer que l'audio généré par l'IA aura une trajectoire similaire.
Il y a aussi un autre trait très humain stimulant l'intérêt de ces outils alimentés par l'IA: la paresse. L'IA Voice Tech – en supposant qu'il arrive au point où il peut imiter avec précision les vraies voix – facilitera la facilité de modifications ou de reproches rapides sans avoir à ramener l'hôte dans un studio.
«En fin de compte, l'économie des créateurs va gagner», explique Balasubramaniyan. “Peu importe à quel point nous pensons aux implications éthiques, ça va gagner parce que vous venez de rendre la vie des gens simple.”
Mise à jour, 12 avril à 15h30 HAE: Peu de temps après la publication de cette histoire, nous avons eu accès à l'outil Voice AI d'ElevenLabs, que nous avons utilisé pour générer un troisième clip vocal. L'histoire a été mise à jour pour inclure les résultats.