Écrivains contre Nvidia : Accusations de violation du droit d'auteur par l'IA

Écrivains contre Nvidia : Accusations de violation du droit d'auteur par l'IA

Trois écrivains sont montés au créneau contre Nvidia, la géante américaine de la tech, en l'accusant de se servir sans vergogne de leurs écrits pour alimenter son intelligence artificielle, NeMo Megatron. Ce trio d'auteurs veut voir l'affaire devant les tribunaux, reprochant à Nvidia de copier et de réutiliser leur travail sans leur dire merci, sans leur demander leur avis, et, pire encore, sans leur verser le moindre centime.

C'est une bataille judiciaire d'envergure qui se profile à l'horizon pour Nvidia, avec une potentielle action collective qui pend au nez de leur projet IA NeMo Megatron. Les trois romanciers ne mâchent pas leurs mots et accusent l'entreprise de piratage littéraire. Selon eux, Nvidia aurait fait main basse sur leurs œuvres pour entraîner son modèle et aurait ainsi foulé aux pieds la protection du droit d'auteur de leurs bouquins.

Ils soutiennent que le NeMo Megatron-GPT de Nvidia, dévoilé pour la première fois en septembre 2022, s'est allègrement servi de leurs livres "sans permission, sans reconnaissance et sans rémunération".

Leur plainte décrit un processus d'entraînement au cours duquel le modèle de langage avale chaque œuvre textuelle du dataset et en extrait l'expression protégée par le droit d'auteur.

Selon les détails de l'affaire, le modèle NeMo Megatron a été nourri grâce au dataset d'EleutherAI, surnommé "The Pile", un monstre de données de 800GB, dont 108GB de livres. Une partie de cette montagne d'informations, appelée "Books3", regrouperait plus de 196,000 bouquins disponibles sur "Bibliotik", une bibliothèque numérique à l'accès restreint, où figurent notamment les travaux des plaignants.

Shawn Presser, à l'origine de Books3, a d'ailleurs confirmé par le passé que la bibliothèque entière de Bibliotik avait été aspirée pour créer ce dataset. Face à des inquiétudes croissantes quant au respect du droit d'auteur, Books3 a été retiré du site de données IA Hugging Face en octobre 2023. Cependant, la plainte soutient que NeMo continue d'exploiter ces données.

Les plaignants, les romanciers Abdi Nazemian, Brian Keene et Stewart O'Nan, réclament des dommages et intérêts et souhaitent étendre leur combat en action collective, afin que tous les auteurs impactés par l'utilisation de Books3 puissent se joindre à eux contre Nvidia.

Interrogé, un porte-parole de Nvidia a confié à Geekit par email : "Nous respectons les droits de tous les créateurs de contenu et sommes convaincus d'avoir développé NeMo en totale conformité avec les lois sur le droit d'auteur."

Cette affaire intervient dans un contexte où les firmes technologiques spécialisées dans l'IA voient leurs actions grimper en flèche, tandis que de nombreux artistes expriment leur frustration de voir leur travail utilisé pour entraîner des modèles d'IA sans leur consentement et sans rémunération. Et Nvidia n'est pas la seule dans le viseur pour des questions de droit d'auteur, à l'instar de la bataille juridique en cours entre The New York Times, OpenAI et Microsoft concernant ChatGPT, sans oublier les artistes qui accusent l'outil d'IA générative d'image Midjourney d'exploiter leurs styles uniques sans permission, les qualifiant de démarche "déshumanisante" et irrespectueuse.

Anthony Rodier
A propos de l'auteur

Anthony Rodier

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.