Les entreprises d’IA doivent-elles payer pour les données de formation qui alimentent leurs systèmes d’IA générative ? La question est vivement contestée dans la Silicon Valley et dans un vague de procès imposées aux géants de la technologie comme Meta, Google et OpenAI. À Washington, DC, cependant, il semble y avoir un consensus croissant selon lequel les géants de la technologie doivent cracher.
Aujourd'hui, lors d'une audition au Sénat sur l'impact de l'IA sur le journalisme, les législateurs des deux côtés ont convenu qu'OpenAI et d'autres devraient rémunérer les médias pour l'utilisation de leur travail dans des projets d'IA. « Ce n'est pas seulement moralement juste », a déclaré Richard Blumenthal, le démocrate qui préside la sous-commission judiciaire sur la vie privée, la technologie et le droit qui a tenu l'audience. « C'est légalement requis. »
Josh Hawley, un républicain travaillant avec Blumenthal sur la législation sur l'IA, est du même avis. « Il ne faut pas que ce soit parce que les plus grandes entreprises du monde veulent engloutir vos données qu'elles devraient pouvoir le faire », a-t-il déclaré.
Les dirigeants de l’industrie des médias présents à l’audience d’aujourd’hui ont décrit comment les sociétés d’IA mettaient leur industrie en péril en utilisant leur travail sans compensation. Curtis LeGeyt, PDG de la National Association of Broadcasters, Danielle Coffey, PDG de News Media Alliance, et Roger Lynch, PDG de Condé Nast, se sont tous prononcés en faveur d'une licence obligatoire. (WIRED appartient à Condé Nast.)
Coffey a affirmé que les sociétés d’IA « éviscèrent le contenu de qualité dont elles se nourrissent », et Lynch a qualifié les données de formation récupérées sans autorisation de « biens volés ». Coffey et Lynch ont également déclaré qu'ils pensaient que les sociétés d'IA enfreignaient le droit d'auteur en vertu de la loi actuelle. Ils ont exhorté les législateurs à préciser que l'utilisation de contenu journalistique sans avoir négocié au préalable des accords de licence n'est pas protégée par l'utilisation équitable, une doctrine juridique qui autorise les violations du droit d'auteur sous certaines conditions.
Terrain d'entente
Les audiences du Sénat peuvent être conflictuelles, mais l’ambiance d’aujourd’hui était largement agréable. Les législateurs et les acteurs du secteur des médias se sont souvent félicités des déclarations des uns et des autres. « Si le Congrès pouvait clarifier que l'utilisation de notre contenu, ou du contenu d'un autre éditeur, pour la formation et la production de modèles d'IA n'est pas un usage équitable, alors le marché libre s'occupera du reste », a déclaré Lynch à un moment donné. « Cela me semble tout à fait raisonnable », répondit Hawley.
Le professeur de journalisme Jeff Jarvis était la seule voix discordante lors de l'audience. Il a affirmé que la formation sur les données obtenues sans paiement constitue effectivement une utilisation équitable et s'est prononcé contre les licences obligatoires, arguant qu'elles nuiraient à l'écosystème de l'information au lieu de le protéger. « Je dois dire que je suis offensé de voir des éditeurs faire pression en faveur d'une législation protectionniste, en échangeant sur le capital politique gagné grâce au journalisme », a-t-il déclaré en s'en prenant à ses collègues orateurs. (Jarvis a également été soumis à la seule véritable série de questions litigieuses de l'audience, de la part de la républicaine Marsha Blackburn, qui a demandé à Jarvis si l'IA était partiale à l'égard des conservateurs et a récité un poème généré par l'IA faisant l'éloge du président Biden comme preuve.)
En dehors de la salle de comité, il y a moins d’accord sur la nécessité d’un permis obligatoire. OpenAI et d'autres sociétés d'IA ont fait valoir qu'il n'était pas viable de concéder sous licence toutes les données de formation, et certains experts indépendants en IA sont d'accord.