IA et droit d'auteur, la décision Bartz c. Anthropic trace une ligne de partage historique entre usage transformateur et piratage
Le 23 juin 2025, le juge William Alsup a rendu une décision majeure dans l’affaire Bartz c. Anthropic PBC. Cette décision marque un tournant historique : c’est la première fois qu’un tribunal fédéral américain se prononce sur le fair use concernant l’entraînement des IA génératives.
Le juge a établi un cadre juridique équilibré. D’un côté, il protège l’entraînement des IA qu’il considère comme « extrêmement transformateur ». De l’autre, il condamne fermement l’utilisation de sources piratées pour cet entraînement.
Cette décision offre une victoire partielle aux deux camps. Les entreprises d’IA peuvent se réjouir : former Claude à partir de livres protégés par le droit d’auteur constitue un fair use. Mais Anthropic doit payer le prix de ses méthodes douteuses : créer une « bibliothèque centrale » à partir de contenus piratés viole bel et bien le droit d’auteur.
L’usage transformateur au cœur du débat
Cette affaire historique découle d’un recours collectif mené par trois auteurs : Andrea Bartz, Charles Graeber et Kirk Wallace Johnson. Ils ont poursuivi Anthropic pour avoir entraîné ses modèles d’IA sur l’ensemble de données Books3 — une collection de 196 640 livres piratés téléchargés depuis des bibliothèques parallèles.
Le raisonnement juridique du juge est sophistiqué. Il distingue clairement deux types d’utilisation : l’utilisation transformatrice (l’entraînement proprement dit) et l’utilisation non transformatrice (le simple stockage). Cette distinction crée le premier véritable cadre juridique pour analyser les questions de droit d’auteur dans le domaine de l’IA.
L’affaire n’est pas terminée pour autant. En décembre 2025, le tribunal se penchera sur les accusations de piratage de bibliothèques. Les dommages-intérêts pourraient atteindre des centaines de millions de dollars.
L’analyse de l’entraînement de l’IA comme fair use représente une extension importante de la doctrine de l’utilisation transformatrice. Le juge a conclu que l’entraînement de l’IA transforme fondamentalement les œuvres protégées plutôt que de simplement les copier.
Comme tout lecteur aspirant à devenir écrivain, les LLM d’Anthropic ont été formés sur des œuvres non pas pour les devancer et les reproduire ou les supplanter, mais pour franchir un cap difficile et créer quelque chose de différent. Si ce processus de formation nécessitait raisonnablement la réalisation de copies au sein du LLM ou autrement, ces copies étaient utilisées à des fins de transformation.
(Jugement, pp. 13-14, traduction libre)
Ce raisonnement s’inspire largement de la décision Authors Guild v. Google. À l’époque, Google avait gagné en montrant que numériser des livres pour la recherche était transformateur. Aujourd’hui, cette doctrine s’étend aux processus d’apprentissage automatique.
L’analyse classique du fair use en quatre facteurs a largement favorisé Anthropic concernant l’entraînement :
- L’objectif était hautement transformateur ;
- La nature des œuvres ne défavorisait pas le fair use ;
- Même si des œuvres entières avaient été copiées, l’objectif transformateur le justifiait ;
- Les « garde-fous » d’Anthropic contre la reproduction littérale limitaient les dommages au marché.
Cependant, le tribunal a tracé une ligne rouge claire. Il a qualifié le téléchargement et le stockage de livres piratés de « vol » et de « délit ». Pour la bibliothèque centrale, « tous les facteurs s’opposent au fair use ». Cette distinction protège l’utilisation transformatrice tout en condamnant l’acquisition illégale. Elle dessine un cadre que d’autres tribunaux suivront probablement.
Un paysage juridique en pleine mutation
La décision Bartz s’inscrit dans un contexte judiciaire qui évolue rapidement. Des dizaines d’affaires concernant le droit d’auteur et l’IA sont en cours dans plusieurs États américains. Cette décision constitue le premier précédent substantiel dans un domaine où l’incertitude juridique régnait en maître.
Cette affaire se distingue des autres litiges majeurs en matière de droit d’auteur et d’IA. Contrairement à l’affaire New York Times c. OpenAI, qui porte sur du contenu d’actualités extrait du web (voir ces articles : 1, 2, et 3), l’affaire Bartz traite spécifiquement de contenus piratés.
Elle diffère aussi de la décision Thomson Reuters c. Ross Intelligence, qui a rejeté le fair use pour l’entraînement de l’IA en février 2025. L’élément de piratage distingue également l’affaire Bartz de Authors Guild c. Google, où Google avait utilisé des livres légalement numérisés par des bibliothèques (j’avais parlé de cette affaire en 2012 ici).
D’autres affaires en cours feront probablement référence à ce nouveau cadre. Les affaires OpenAI regroupées dans le district sud de New York portent sur des revendications similaires concernant Books3. L’affaire Getty Images c. Stability AI concerne l’entraînement sur des contenus visuels. Les affaires Meta dans le district nord de Californie feront l’objet d’une analyse similaire.
Les appels sont inévitables, quelles que soient les issues. Le caractère inédit de ces questions et les implications pour un secteur pesant des centaines de milliards de dollars l’exigent. L’affaire Bartz sera probablement portée devant la Cour d’appel du neuvième circuit, voire devant la Cour suprême. Cela établirait un précédent national pour le droit d’auteur applicable à l’IA.
La technique éclaire le juridique
Le contexte technique de l’entraînement de l’IA explique pourquoi ces questions juridiques se sont révélées si complexes. Books3 ne représente qu’une partie des énormes ensembles de données utilisés pour former les systèmes d’IA modernes. Il contient 196 640 livres téléchargés depuis des serveurs BitTorrent et intégrés dans « The Pile », un corpus d’entraînement de 825 Go créé par EleutherAI.
Les grandes entreprises d’IA — Meta, Microsoft, Nvidia et d’autres — ont utilisé Books3 pour former divers modèles. Cela souligne la dépendance de tout le secteur à des ensembles de données à la provenance douteuse. Les déclarations publiques d’Anthropic sur l’utilisation exclusive de « données accessibles au public » contrastent avec les preuves d’accès à des bibliothèques piratées. Cette contradiction a nui à leur crédibilité devant le tribunal.
Le processus technique d’entraînement de l’IA suit plusieurs étapes. D’abord, on copie des œuvres complètes dans des ensembles de données. Ensuite, on « tokenise » le texte en unités plus petites. Enfin, on encode ces modèles dans les paramètres du LLM. Cette copie intermédiaire soulève de nouvelles questions juridiques. Les cadres traditionnels du droit d’auteur sont-ils adaptés aux processus d’apprentissage automatique ? Ces processus transforment le texte brut en modèles statistiques plutôt qu’ils ne stockent des copies récupérables.
Les pratiques de l’industrie varient énormément. Certaines entreprises développent des partenariats de licence avec des éditeurs et mettent en place des mécanismes de désengagement. Mais les incitations économiques restent mal alignées. Des études prévoient que les entreprises d’IA pourraient générer des milliards de dollars à partir de contenus créés par des humains. Pendant ce temps, les créateurs font face à des risques de déplacement importants, car les contenus générés par l’IA concurrencent directement les œuvres humaines.
Un consensus sur l’importance historique
La décision Bartz v. Anthropic marque un tournant dans le droit d’auteur applicable à l’IA. L’approche qui distingue les différents types de copie liés à l’IA fournit un cadre d’analyse utilisable. Les tribunaux, les entreprises et les créateurs peuvent s’en servir pour évaluer les affaires futures.
L’extension de la doctrine de l’utilisation transformatrice mérite d’être soulignée. Le raisonnement du juge Alsup compare l’apprentissage de l’IA aux processus de lecture et d’apprentissage humains. Cette approche anthropomorphique de l’analyse du fair use représente une évolution doctrinale importante. Elle pourrait influencer le droit d’auteur au-delà du contexte de l’IA.
Les entreprises d’IA se réjouissent évidemment que l’entraînement bénéficie de la protection du fair use. Mais la décision souligne aussi la nécessité de pratiques plus claires en matière d’acquisition de données. Les éditeurs et les organisations d’auteurs sont déçus par la décision concernant l’entraînement. Néanmoins, ils voient dans la responsabilité en matière de piratage une validation de leurs préoccupations générales sur l’utilisation non autorisée de contenus protégés.
Cette décision arrive à un moment crucial. Le US Copyright Office a récemment publié des orientations sur l’IA et le droit d’auteur. Ces orientations privilégient une analyse au cas par cas du fair use plutôt que des règles strictes (voir par exemple ce document). L’approche du juge Alsup s’aligne sur ces orientations tout en établissant un précédent concret sur l’analyse des plaintes relatives à l’entraînement des IA.
Les approches internationales révèlent une fragmentation
L’approche américaine dans l’affaire Bartz s’éloigne considérablement des cadres d’autres pays. Cette divergence crée des défis complexes de conformité pour les entreprises d’IA opérant dans différents États.
L’AI Act européen exige des entreprises qu’elles respectent le droit d’auteur, quel que soit le lieu d’entraînement. Il met aussi en place des mécanismes d’opt out qui privilégient le contrôle des ayants droit. Ainsi, l’article 4 de la directive sur le marché unique numérique autorise l’exploration commerciale de textes et de données, sauf opposition explicite des titulaires de droits par des moyens lisibles par machine.
Cette approche crée une tension directe avec le fair use américain. Selon ce dernier, l’utilisation transformatrice peut se poursuivre sans autorisation explicite. Une récente décision d’un tribunal allemand a accepté les clauses d’exclusion en langage naturel dans les conditions d’utilisation. Cela renforce le contrôle des titulaires de droits.
La Suisse ne dispose pas (encore) d’une législation spécifique sur le droit d’auteur dans le domaine de l’IA. Elle s’appuie sur des approches fondées sur des principes qui ne permettent pas de traiter adéquatement l’entraînement de l’IA.
Le Royaume-Uni envisage un mécanisme de refus à l’européenne après avoir rejeté des exceptions plus larges. Des pays comme le Japon et Singapour ont mis en place des cadres plus permissifs pour attirer les investissements dans l’IA.
Ces différences réglementaires créent des charges de conformité importantes pour les entreprises opérant à l’échelle mondiale. Cette fragmentation pourrait conduire à une harmonisation internationale ou à l’élaboration de cadres de conformité sophistiqués spécifiques à chaque région. Ce serait souhaitable pour la sécurité juridique et technologique.
Des implications qui redessinent le développement de l’IA
L’impact immédiat de la décision Bartz concerne principalement les pratiques d’acquisition de données. Les entreprises d’IA doivent désormais documenter soigneusement les sources légitimes des matériaux d’entraînement. La responsabilité claire en cas d’utilisation de contenus piratés élimine toute hypothèse selon laquelle une utilisation transformatrice pourrait « blanchir » les violations du droit d’auteur en amont.
Pour le secteur de l’IA, cela crée à la fois des opportunités et des contraintes. La protection du fair use pour l’entraînement offre une sécurité juridique qui permet de poursuivre le développement avec des contenus protégés. En même temps, la responsabilité en matière de piratage établit des limites claires aux méthodes acceptables d’acquisition de données. Les entreprises investiront probablement davantage dans les accords de licence et le suivi de la provenance des données.
Les industries de la création font face à une décision aux résultats mitigés qui pourrait remodeler leurs approches stratégiques. La décision relative à l’entraînement déçoit les éditeurs et auteurs qui souhaitent exercer un contrôle plus large sur l’utilisation de leurs œuvres par l’IA. Mais la responsabilité en matière de piratage crée de nouvelles possibilités d’application et de nouvelles sources de revenus potentielles grâce aux négociations de licences.
Les appels contre cette décision porteront probablement sur la portée de la doctrine de l’utilisation transformatrice et la relation entre les méthodes d’acquisition et l’utilisation finale. La Cour suprême devra peut-être finalement déterminer si l’analyse du fair use doit tenir compte de la légalité de la copie initiale ou se concentrer uniquement sur la nature transformatrice de l’utilisation finale.
Conclusion
La décision Bartz c. Anthropic représente une tentative judiciaire sophistiquée d’équilibrer l’innovation technologique et les droits de propriété intellectuelle à l’ère de l’IA. Le cadre établi par le juge Alsup distingue la formation transformatrice du stockage non transformateur. Il apporte de la clarté juridique tout en préservant le développement de l’IA et les droits des auteurs.
Ce précédent influencera probablement des dizaines d’affaires en cours et façonnera l’évolution future du droit d’auteur dans le domaine de l’IA. Les implications internationales de cette décision soulignent le besoin croissant d’une coordination réglementaire ou de cadres de conformité sophistiqués. Le développement de l’IA s’internationalise, et la résolution de ces tensions déterminera son avenir.
L’innovation en matière d’IA se poursuivra-t-elle au sein d’un marché mondial intégré ? Ou se fragmentera-t-elle en approches régionales avec des exigences juridiques distinctes ? La réponse à ces questions façonnera l’avenir technologique de nos sociétés.
Excursus : le fair use
Le fair use américain constitue l’une des doctrines les plus sophistiquées et débattues du droit de la propriété intellectuelle. On peut le considérer comme une « soupape de sécurité » intégrée au système de copyright américain. Elle empêche que la protection des œuvres ne devienne si rigide qu’elle étouffe la créativité, la critique, l’enseignement ou l’innovation.
Les fondements constitutionnels et législatifs
La doctrine du fair use trouve sa source dans l’Article I, Section 8, Clause 8 de la Constitution américaine. Cette clause autorise le Congrès à accorder des droits exclusifs aux auteurs « pour promouvoir le progrès des sciences et des arts utiles ».
Le fair use moderne est codifié à la Section 107 du Copyright Act de 1976 (17 U.S.C. § 107). Cette disposition ne crée pas véritablement le fair use — la doctrine existait déjà dans la jurisprudence depuis le 19e siècle. Elle la codifie et lui donne un cadre d’analyse structuré. Le législateur a consciemment choisi de ne pas définir exhaustivement ce qui constitue un fair use. Il préfère laisser aux tribunaux le soin de développer cette doctrine au cas par cas.
Le test à quatre facteurs : une analyse multidimensionnelle
La Section 107 établit quatre facteurs que les tribunaux doivent examiner, sans que cette liste soit exhaustive.
Le premier facteur examine « le but et le caractère de l’usage ». Ici, la question centrale est celle de la transformation : l’usage contesté ajoute-t-il quelque chose de nouveau, avec un but ou un caractère différent ? Ou se contente-t-il de supplanter l’œuvre originale ? La Cour suprême, dans l’arrêt Campbell v. Acuff-Rose Music (1994), a précisé que l’usage transformateur constitue le cœur de cette analyse. Une parodie qui commente l’œuvre originale sera plus facilement protégée qu’une simple copie à des fins commerciales. Ce facteur examine aussi si l’usage est commercial ou éducatif, mais cette distinction n’est pas déterminante en soi.
Le deuxième facteur porte sur « la nature de l’œuvre protégée ». Cette analyse reconnaît que toutes les œuvres ne méritent pas le même niveau de protection. Les œuvres factuelles bénéficient généralement d’une protection moindre que les œuvres créatives. Les œuvres publiées sont moins protégées que les œuvres inédites. Par exemple, citer un article de journal factuel sera plus facilement justifié que reproduire des extraits d’un roman inédit.
Le troisième facteur évalue « la quantité et la substantialité de la portion utilisée ». L’analyse ne se limite pas à une simple question de pourcentage. Prendre le « cœur » d’une œuvre, même en petite quantité, peut peser contre le fair use. Inversement, utiliser la totalité d’une œuvre peut parfois être justifié si l’usage est suffisamment transformateur. Dans l’affaire Perfect 10 v. Amazon, l’usage d’images complètes sous forme de vignettes était protégé, car il servait un but transformateur différent.
Le quatrième facteur examine « l’effet sur le marché ou la valeur de l’œuvre protégée ». Cette analyse prospective cherche à déterminer si l’usage contesté nuit au marché actuel de l’œuvre ou aux marchés dérivés que l’auteur pourrait raisonnablement développer. Il ne s’agit pas seulement de concurrence directe, mais aussi d’évaluer si l’usage pourrait, s’il était généralisé, porter atteinte aux incitations économiques à la création.
La logique systémique du fair use
Pour véritablement comprendre le fair use, il faut saisir sa fonction systémique dans l’économie de la création. Le système américain de copyright repose sur un contrat social implicite : la société accorde aux créateurs des droits exclusifs temporaires en échange de leur contribution au domaine public. Le fair use fonctionne comme un mécanisme d’ajustement qui empêche ce système de dysfonctionner quand l’application stricte du copyright entraverait des usages socialement bénéfiques.
Cette approche diffère fondamentalement des systèmes européens d’exceptions spécifiques. Là où les droits suisse, français ou allemand établissent des listes précises d’exceptions (citation, parodie, usage privé), le fair use américain adopte une approche de « standard » plutôt que de « règle ». Il établit des principes généraux d’évaluation plutôt que des catégories fixes.
L’application pratique : une analyse holistique
En pratique, l’analyse du fair use ressemble plus à une pesée d’intérêts qu’à un calcul mathématique. Les tribunaux examinent l’ensemble des circonstances pour déterminer si l’usage contesté sert les objectifs constitutionnels du copyright sans porter atteinte de manière disproportionnée aux intérêts des titulaires de droits.
Cette approche crée une incertitude inhérente qui constitue à la fois la force et la faiblesse du système. La flexibilité permet d’adapter la doctrine aux technologies émergentes et aux nouveaux usages créatifs. Mais elle rend difficile pour les utilisateurs de prédire avec certitude si leur usage sera protégé.
Les limites et zones grises
Le fair use connaît des limites importantes. Il ne protège pas la contrefaçon commerciale pure, même transformatrice. Il ne crée pas de droit général à accéder aux œuvres protégées, et il ne dispense pas de respecter les autres aspects du droit d’auteur, comme l’attribution. De plus, le fair use est une défense affirmative : celui qui invoque le fair use doit prouver que son usage y correspond.