Auf einen Blick
- OpenAI löscht versehentlich Beweisdaten im Rechtsstreit mit Zeitungen
- Daten sollten die Nutzung von Zeitungsartikeln fürs KI-Training belegen
- Über 150 Stunden Recherche der Kläger waren jetzt umsonst
Peinlicher Fehltritt beim Tech-Giganten OpenAI. Ausgerechnet während eines brisanten Rechtsstreits mit der «New York Times» und «Daily News» haben Ingenieure des ChatGPT-Entwicklers versehentlich wichtige Beweisdaten gelöscht.
Der Vorfall ereignete sich am 14. November, als OpenAI-Techniker eine virtuelle Festplatte säuberten – und dabei offenbar übers Ziel hinausschossen. Pikant: Die gelöschten Daten sollten belegen, ob OpenAI ohne Erlaubnis Artikel der Zeitungen für das Training seiner künstlichen Intelligenz (KI) genutzt hatte.
Teure Recherche kaputt
Zwar konnten die Daten teilweise wiederhergestellt werden, wie techcrunch.com schreibt. Da jedoch die Ordnerstruktur und die Dateinamen «unwiederbringlich» verloren gingen, können die Daten «nicht verwendet werden, um festzustellen, wo die kopierten Artikel zur Erstellung der KI-Modelle verwendet wurden», heisst es in einem Schreiben der Anwälte.
Die Kläger müssen ihre Arbeit komplett neu starten. Über 150 Stunden Recherche waren also für die Katz! Zwar gehen die Anwälte der Kläger nicht von Absicht aus, sie sagen aber, dass der Vorfall unterstreicht, dass OpenAI «am besten in der Lage ist, seine eigenen Datenbestände» mit seinen eigenen Werkzeugen nach potenziell rechtsverletzenden Inhalten zu durchsuchen.
Branchenkenner vermuten, dass es bei dem Rechtsstreit um viele Millionen geht. Andere Medienkonzerne wie Associated Press oder Axel Springer haben wiederum lukrative Deals mit OpenAI abgeschlossen. Allein der Verlag Dotdash soll jährlich mindestens 16 Millionen Dollar kassieren. OpenAI hat bisher weder bestätigt noch dementiert, dass sie ihre KI-Systeme ohne die Genehmigung mit urheberrechtlich geschützten Werken trainiert hat.