La grande plateforme de streaming, Spotify, se lance dans l’expérimentation des technologies de l’intelligence artificielle. Après le DJ alimenté par ChatGPT, la société vient d’annoncer un programme de podcasts entièrement traduits grâce à l’IA.
L’objectif est de proposer une traduction complète du podcast en conservant la voix originale et les intonations de l’auteur. Selon Spotify, ce système permet de maintenir le style distinctif de l’auteur, offrant ainsi une expérience d’écoute plus authentique et naturelle que les doublages traditionnels. « Un épisode de podcast enregistré en anglais peut désormais être disponible dans d’autres langues, tout en conservant les caractéristiques vocales distinctives de l’orateur », précise l’entreprise.
Les avancées des technologies d’IA liées à la reproduction vocale sont particulièrement notables ces derniers mois. YouTube prévoit de proposer des doublages générés par l’IA, tandis que la startup HeyGen a fait sensation en offrant un système de doublage crédible pour n’importe quelle vidéo. De son côté, Apple travaille également sur le sujet, proposant aux utilisateurs d’iOS 17 d’enregistrer une copie de leur voix pour l’utiliser dans des conversations en face à face ou via FaceTime.
Ce nouveau programme de Spotify repose sur de nouveaux outils d’OpenAI annoncés récemment. Parmi eux, on trouve notamment « un nouveau modèle de synthèse vocale », capable de générer une voix « à partir d’un simple texte et de quelques secondes d’échantillon de parole ».
Cependant, la diffusion de cet outil sera limitée, OpenAI cherchant à éviter qu’il ne soit utilisé à mauvais escient.