La semaine dernière, OpenAI a révélé une nouvelle interface conversationnelle pour ChatGPT avec un voix synthétique expressive étonnamment similaire à celui de l'assistant IA joué par Scarlett Johansson dans le film de science-fiction Son-seulement pour désactiver soudainement la nouvelle voix ce week-end.
Lundi, Johansson a publié une déclaration affirmant avoir forcé ce renversement, après que ses avocats ont demandé à OpenAI de clarifier comment la nouvelle voix avait été créée.
Johansson déclaration, relayée à WIRED par son publiciste, affirme que le PDG d'OpenAI, Sam Altman, lui a demandé en septembre dernier de fournir la nouvelle voix de ChatGPT mais qu'elle a refusé. Elle décrit avoir été stupéfaite de voir la société présenter la semaine dernière une nouvelle voix pour ChatGPT qui lui ressemblait de toute façon.
« Quand j'ai entendu la démo, j'ai été choqué, en colère et incrédule que M. Altman puisse poursuivre une voix qui ressemblait si étrangement à la mienne que mes amis les plus proches et les médias ne pouvaient pas faire la différence », peut-on lire dans le communiqué. Il note qu'Altman a semblé encourager le monde à relier la démo à la performance de Johansson en tweetant « son», en référence au film.
La déclaration de Johansson indique que son agent a été contacté par Altman deux jours avant la démo de la semaine dernière pour lui demander de reconsidérer sa décision de ne pas travailler avec OpenAI. Après avoir vu la démo, elle dit avoir engagé un conseiller juridique pour écrire à OpenAI pour lui demander des détails sur la manière dont la nouvelle voix a été créée.
La déclaration affirme que cela a conduit à l'annonce d'OpenAI dans un poster sur X Dimanche, elle avait décidé de « suspendre l'utilisation de Sky », le nom donné par la société à la voix synthétique.
Sky est l'une des nombreuses voix synthétiques qu'OpenAI a données à ChatGPT en septembre dernier, mais lors de l'événement de la semaine dernière, elle a affiché une intonation beaucoup plus réaliste avec des signaux émotionnels. La démo a vu une version de ChatGPT alimentée par un nouveau modèle d'IA appelé GPT-4o apparaître flirter avec un ingénieur OpenAI d'une manière que de nombreux téléspectateurs ont trouvée rappelant la performance de Johansson dans Son.
Lorsqu'on lui a demandé pourquoi OpenAI avait décidé de désactiver Sky, Niko Felix, un porte-parole d'OpenAI a renvoyé WIRED à un article de blog également de dimanche décrivant le processus suivi par l'entreprise pour choisir sa voix. « La voix de Sky n'est pas une imitation de Scarlett Johansson mais appartient à une autre actrice professionnelle utilisant sa propre voix naturelle », indique le message.
« Pour l'instant, nous suspendons l'utilisation de la voix de Sky le temps de répondre à certaines questions, mais nous espérons la rétablir bientôt », a déclaré Felix.
Le conflit avec Johansson s'ajoute aux batailles existantes d'OpenAI avec les artistes, écrivains et autres créatifs. L'entreprise défend déjà un nombre de poursuites alléguant qu'il a utilisé de manière inappropriée du contenu protégé par le droit d'auteur pour entraîner ses algorithmes, y compris des poursuites du New York Times et des auteurs, dont George RR Martin.
L’IA générative a rendu beaucoup plus facile la création de voix synthétiques réalistes, créant ainsi de nouvelles opportunités et menaces. En janvier, les électeurs du New Hampshire ont été bombardés d'appels automatisés mettant en vedette un message vocal truqué de Joe Biden. En mars, OpenAI a déclaré avoir développé une technologie capable de cloner la voix de quelqu'un à partir d'un clip de 15 secondes, mais la société a déclaré qu'elle ne publierait pas la technologie à cause de la façon dont il pourrait être mal utilisé.