En décembre dernier, le «New York Times» a intenté, aux Etats-Unis, une action en justice sollicitant la destruction des modèles et des données d’entrainement comprenant du matériel protégé par les droits de propriété intellectuelle du journal et soutenant également que OpenAI et Microsoft devraient être tenus responsable de dommages à hauteur de plusieurs milliards de dollars.
En cause: l’utilisation, sans droit selon la position défendue par le journal, de plusieurs millions de ses articles de presse. Et donc une violation alléguée du droit d’auteur (copyright). Cette plainte, déposée devant la Cour de district fédérale de Manhattan (Etat de New York), soutient que les articles de presse publiés par le «New York Times» auraient été utilisés à des fins d’entraînement de l’intelligence artificielle générative.
Une action qui préfigure d'autres combats
Cette action judiciaire mammouth préfigure de nombreuses autres combats similaires, l’utilisation d’une immense quantité de données à des fins d’entraînement des IA générative étant consubstantielle de ces dispositifs. Le plus souvent, ces données sont utilisées sans qu’aucun consentement ne soit ni obtenu, ni même sollicité. Le tribunal devra donc déterminer si l’utilisation de ces contenus protégés à des fins d’entrainement est – ou non – illicite.
En vérité et au-delà du cas particulier, la décision, si elle devait reconnaître une violation de droit, serait de nature à entraver de manière substantielle l’entraînement, et partant le développement, de ChatGPT et de ses concurrents.
OpenAI réagit à la plainte du «New York Times»
Or la bataille judiciaire en question vient de connaître un intéressant développement. Selon le document déposé récemment au tribunal par OpenAI, cette dernière soutient que le journal new-yorkais aurait en quelque sorte détourné ChatGPT de son fonctionnement normal, dans l’objectif de générer volontairement des violations.
Dans le jargon, on parle de «red teaming», soit d’une pratique consistant à essayer de tester la sécurité d’un système en le piratant. Dans le cas d’espèce, il ne s’agit pas de piratage au sens strict du terme mais, à ce que l’on comprend, de «prompts» (lignes de commande) inusuels, à tout le moins selon OpenAI, qui estime que les utilisateurs lambda de leur solution n’utilisent pas son produit phare de cette manière. Ainsi, selon OpenAI, ChatGPT ne saurait être conçu comme de nature à remplacer, pour les internautes, un abonnement au journal new-yorkais.
Difficile, en l’état, de trier le bon grain de l’ivraie, même si on peut imaginer qu’OpenAI se trouve, faute de précédents, dans une situation juridiquement complexe. Une affaire à suivre, donc.