Tensions sur le marché ultra-concurrentiel de l'intelligence artificielle. La course à l'innovation bat son plein entre les entreprises technologiques pour dominer ce secteur d'avenir. Une rivalité sans pitié qui pousse certains à utiliser à des pratiques illégales pour ne pas se laisser distancer et pour accélérer le développement de leurs algorithmes. C'est précisément ce qui n'est pas accusé le chinois ByteDance, maison mère du célèbre plateforme sociale TikTok. L'entreprise aurait secrètement exploité l'API d'OpenAI pour entraîner son grand modèle de langage.
Violation des conditions de services d'OpenAI
OpenAI à établir une politique d'utilisation très stricte concernant sa technologie d'intelligence artificielle. La start-up derrière le chatbot populaire ChatGPT interdit formellement à ses clients l'exploitation de son IA pour développer des produits ou services concurrents.
Concrètement, les développeurs tiers n'ont pas le droit d'utiliser son API et d'extraire de données, pour créer leurs propres applications. Ces restrictions visent à ce que les clients d'OpenAI restent de simples consommateurs de ses API sans concurrencer ses innovations d'IA.
La société ByteDance est bien consciente de ces termes. Pourtant, d'après une enquête du média américain The Verge, l'entreprise chinoise a contourné ces règles à de multiples reprises. Elle a persisté à exploiter l'API d'OpenAI pour l'entraînement de son grand modèle de langage, appelé Graine de projet. Cette utilisation abusive de la technologie de pointe de la start-up américaine a couvert toutes les étapes de développement du modèle d'IA de ByteDance. De l'apprentissage initial aux phases d'évaluation, Project Seed a été déployé grâce à l'API d'OpenAI,
Alex Health du site d'informations américain annonce avoir pu à des documents internes de la société. Ces documents demandent aux employés de dissimuler les preuves de leur utilisation illégale de l'API d'OpenAI, en recourant à des techniques de désensibilisation des données. Ce processus implique la modification ou la suppression d'informations sensibles susceptibles de causer des ennuis juridiques à l'entreprise.
ByteDance ni les accusations
Face à ces accusations, le géant technologique chinois s'oppose à un démenti catégorique. L'entreprise argumente avoir établi un accord avec Microsoft, lui permettant de bénéficier d'un accès légal à l'API d'OpenAI. ByteDance affirme également avoir exploité l'IA de la société américaine exclusivement sur les marchés étrangers. Son chatbot Doubao, qui repose sur son LLM, est uniquement présent en Chine.
La société chinoise nie donc tout usage illicite de la technologie d'OpenAI. Par ailleurs, elle annonce avoir demandé à ses employés d'arrêter l'utilisation de l'API d'OpenAI pour Project Seed dès l'obtention d'une licence le fils chatbot IA Doubao sur le marché chinois.
Cependant, des enquêtes menées par The Verge réfutent ces déclarations. Selon leurs informations, ByteDance aurait continué à utiliser l'API d'OpenAI pour évaluer les performances de Project Seed.
OpenAI suspend le compte du géant chinois
Suite à ces accusations, OpenAI a rapidement réagi en suspendre de manière temporaire le compte de ByteDance, dans l'attente de clarifications. Dans un communiqué transmis à The Verge, un porte-parole de la start-up fondée par Sam Altman a confirmé cette mesure. Tout en concédant une utilisation a priori « minime » de son API par la société chinoise, OpenAI indique mener une enquête plus approfondie.
Si les résultats de cette enquête révèlent une violation des conditions d'utilisation de son API, OpenAI mettra en place des sanctions plus sévères et définitives. La start-up pourrait alors soit Résilier l'accès de ByteDance à sa technologie, soit exiger des changements de la part de l'entreprise chinoise.
Mise à jour : OpenAI m'informe qu'il a suspendu le compte de développement de ByteDance suite à mon rapport : « Tous les clients API doivent adhérer à nos politiques d'utilisation pour garantir que notre technologie est utilisée à bon escient. »
La plupart des utilisations abusives se produisaient via l’API Azure, et non directement via OAI. Pas clair…
-Alex Heath (@alexeheath) 15 décembre 2023