Le plus grand combat de la révolution de l’IA générative se dirige vers les tribunaux – et non, il ne s’agit pas du dernier drame du conseil d’administration d’OpenAI. Les auteurs de livres, les artistes et les codeurs remettent en question la pratique consistant à enseigner des modèles d’IA pour reproduire leurs compétences en utilisant leur propre travail comme manuel de formation.
Le débat se concentre sur les milliards d'œuvres qui soutiennent l'impressionnante création de mots d'outils comme ChatGPT, les prouesses de codage du Copilot de Github et le flair artistique des générateurs d'images comme celui de la startup Midjourney. La plupart des œuvres utilisées pour entraîner les algorithmes sous-jacents ont été créées par des personnes et nombre d’entre elles sont protégées par le droit d’auteur.
Les créateurs d’IA ont largement supposé que l’utilisation de matériel protégé par le droit d’auteur comme données de formation était parfaitement légale sous le couvert du « fair use » – après tout, ils empruntent le travail uniquement pour en extraire des signaux statistiques, sans essayer de le faire passer pour le leur. . Mais alors que les générateurs d’images et d’autres outils se sont révélés capables d’imiter de manière impressionnante les œuvres contenues dans leurs données d’entraînement, et que l’ampleur et la valeur des données d’entraînement sont devenues claires, les créateurs crient de plus en plus au scandale.
À En directFILAIRE À San Francisco, lors de l'événement du 30e anniversaire du magazine WIRED, deux dirigeants de cette résistance naissante se sont affrontés avec un défenseur des droits des sociétés d'IA à développer cette technologie sans entrave. Pensaient-ils que la formation à l’IA était un usage équitable ? « La réponse est non, je ne le fais pas », a déclaré Mary Rasenberger, PDG de la Authors Guild, qui représente les auteurs de livres et poursuit OpenAI et son principal bailleur de fonds, Microsoft, pour violation des droits d'auteur de ses membres.
Risque existentiel
Au cœur de la plainte de l'Auteurs Guild se trouve le fait que l'utilisation par OpenAI et d'autres de leur matériel produit finalement un travail concurrent lorsque les utilisateurs demandent à un chatbot de cracher un poème ou une image. « Il s'agit d'une utilisation hautement commerciale et les dommages sont très clairs », a déclaré Rasenberger. « Cela pourrait vraiment détruire le métier d’écrivain. C'est pourquoi nous sommes dans ce cas. L'Authors Guild, qui construit un outil qui aidera les entreprises d'IA générative à payer pour licencier les œuvres de ses membres, estime qu'il peut exister des moyens parfaitement éthiques de former l'IA. « C'est très simple : obtenez la permission », dit-elle. Dans la plupart des cas, l’autorisation sera payante.
Mike Masnick, PDG du blog Techdirt et également du Copia Institute, un groupe de réflexion sur la politique technologique, a un point de vue différent. « Je vais dire le contraire de tout ce que Mary vient de dire », a-t-il déclaré. L'IA générative est un usage équitable, a-t-il soutenu, soulignant les similitudes entre les récents litiges juridiques et les procès antérieurs, certains impliquant la Guilde des auteurs, dans lesquels l'indexation des œuvres créatives afin que les moteurs de recherche puissent les trouver efficacement a survécu aux défis.
Une victoire des groupes d'artistes ne serait pas nécessairement d'une grande aide pour les écrivains individuels, a ajouté Masnick, qualifiant le concept même de droit d'auteur de système destiné à enrichir les éditeurs plutôt qu'à protéger les artistes. Il a fait référence à ce qu’il a appelé un système de licences musicales « corrompu » qui n’apporte que peu de valeur à ses créateurs.
Même si les futurs verdicts des tribunaux dépendront probablement d'arguments juridiques concernant l'utilisation équitable, Matthieu Butterick, un avocat qui a intenté un certain nombre de poursuites contre des sociétés d’IA générative, affirme que le débat porte en réalité sur les entreprises technologiques qui tentent d’acquérir plus de pouvoir et de le conserver. « Ils ne rivalisent plus pour savoir qui peut être le plus riche ; ils rivalisent pour devenir les plus puissants », a-t-il déclaré. « Ce qu'ils ne veulent pas, c'est que les personnes ayant des droits d'auteur aient un droit de veto sur ce qu'elles veulent faire. »
Masnick a répondu qu'il s'inquiétait également de savoir qui obtiendrait le pouvoir de l'IA, arguant qu'exiger des entreprises technologiques qu'elles rémunèrent les artistes renforcerait encore davantage les plus grands acteurs de l'IA en rendant trop coûteux pour les insurgés la formation de leurs systèmes.
Rasenberger s'est moquée de la suggestion d'un équilibre des pouvoirs entre les acteurs de la technologie et les auteurs qu'elle représente, comparant le revenu moyen de 20 000 dollars par an pour les auteurs à temps plein à la récente valorisation de 90 milliards de dollars d'OpenAI. « Ils ont l'argent. Ce n’est pas le cas de la communauté des artistes », a-t-elle déclaré.