Update: OpenAI beschuldigt "New York Times", ChatGPT gehackt zu haben
Die "New York Times" hat Ende Dezember eine Klage gegen OpenAI und Microsoft eingereicht. Die Unternehmen sollen ihre Chatbots mit Millionen von Artikeln der Zeitung trainiert haben. OpenAI beschuldigt die Zeitung nun, den Chatbot gehackt zu haben, um irreführende Beweise zu erzeugen.
Das Hickhack zwischen OpenAI und der "New York Times" geht weiter. Das KI-Unternehmen bat einen US-Bundesrichter, Teile der Urheberrechtsklage der Zeitung abzuweisen - mit dem Argument, die "New York Times" habe ihren Chatbot ChatGPT und andere Systeme mit künstlicher Intelligenz "gehackt", um irreführende Beweise für den Fall zu generieren, wie "Reuters" berichtet.
OpenAI sagte in einer Einreichung vor dem Bundesgericht in Manhattan am Montag, dass die Times die Technologie veranlasst habe, ihr Material durch "trügerische Aufforderungen, die eklatant gegen die Nutzungsbedingungen von OpenAI verstossen", zu reproduzieren, wie es weiter heisst.
"Die Anschuldigungen in der Beschwerde der Times entsprechen nicht ihren bekanntlich strengen journalistischen Standards", zitiert "Reuters" OpenAI. "Die Wahrheit, die im Laufe dieses Falles ans Licht kommen wird, ist, dass die Times jemanden dafür bezahlt hat, die Produkte von OpenAI zu hacken."
"Was OpenAI bizarrerweise als 'Hacking' bezeichnet, ist einfach die Verwendung der Produkte von OpenAI, um nach Beweisen dafür zu suchen, dass sie das urheberrechtlich geschützte Werk der Times gestohlen und vervielfältigt haben", sagte Ian Crosby, der Anwalt der Zeitung, in einer Erklärung.
Update vom 9. Januar 2024:
OpenAI äussert sich zu Plagiatsvorwürfen
Update vom 9. Januar 2024: OpenAI hat zu den Plagiatsvorwürfen der "New York Times" Stellung bezogen. Die Zeitung soll ihre Prompts gezielt manipuliert haben, um ChatGPT Trainingsdaten zu entlocken, sagte Tom Rubin, zuständig für das Urheberrecht bei OpenAI, gegenüber der "Washington Post". Anfang Dezember 2023 hatte unter anderem eine Forschungsgruppe, an der auch die ETH Zürich beteilgt war, gezeigt, wie man den Chatbot dahingehend überlisten kann, dass er seine Trainingsdaten ausspuckt.
Die in der Klageschrift aufgeführten Beispiele würden "nicht die beabsichtigte Nutzung oder das normale Nutzerverhalten widerspiegeln" und gegen die Nutzungsbedingungen des Unternehmens verstossen, wird Rubin weiter zitiert. Viele der Beispiele seien heute nicht mehr reproduzierbar.
Der Ausgang der Klage der "Times" dürfte indes ungewiss sein, wie die "Washington Post" Rechtsprofessor und Urheberrechtsexperte Daniel Gervais von der Vanderbilt University zitiert. "Jeder, der das Ergebnis vorhersagt, geht hier ein grosses Risiko ein." Er nannte als mögliches Ergebnis aber ein Modell, bei dem die Tech-Firmen für die Nutzung der Daten bezahlen. Andere Medienhäuser verfolgen dieses Modell bereits.
Das deutsche Medienkonglomerat Axel Springer, zu dem unter anderem Bild, Welt und Business Insider gehören, ging bereits im Dezember 2023 eine globale Partnerschaft mit OpenAI ein. ChatGPT-User sollen damit weltweit Zusammenfassungen ausgewählter Inhalte von Springer-Marken erhalten, inklusive sonst kostenpflichtiger Inhalte. OpenAI dürfe im ausserdem Daten der Medienmarken nutzen, um seine LLMs zu trainieren, schreibt Springer in der Mitteilung zur Partnerschaft.
Originalmeldung vom 8. Januar 2024:
"New York Times" verklagt Microsoft und OpenAI wegen ChatGPT
Die "New York Times" hat Ende 2023 beim Federal District Court in Manhattan eine Urheberrechtsklage gegen OpenAI und Microsoft eingereicht. Die beiden Firmen, die hinter generativen KI-Tools wie ChatGPT und Bing stehen, sollen ihre Anwendungen millionenfach mit Artikeln der US-Tageszeitung gefüttert und trainiert haben - ohne deren Zustimmung, so der Vorwurf der Zeitung.
Die Klage beinhaltet keine konkrete Geldforderung, betont die "New York Times" in einem Artikel zur Klageschrift. Die Firmen sollen jedoch für "Milliarden von Dollar an gesetzlichem und tatsächlichem Schadenersatz" im Zusammenhang mit dem "unrechtmässigen Kopieren und Verwenden der einzigartig wertvollen Werke der Times" verantwortlich gemacht werden. Zudem sollen alle Chatbot-Modelle und Trainingsdaten auf Grundlage von Times-Material vernichtet werden.
Frühere Gespräche ohne Lösung
Die Times habe sich bereits im April 2023 an Microsoft und OpenAI gewandt, um ihre Bedenken bezüglich der Nutzung ihres geistigen Eigentums zu äussern und eine Einigung zu finden, heisst es weiter. Eine solche Einigung hätte etwa eine kommerzielle Vereinbarung sowie "technologische Leitplanken" für generative KI-Anwendungen beinhalten können. Die Gespräche hätten jedoch zu keiner Lösung geführt, schreibt die Times, weshalb man nun eben den Rechtsweg sucht.
Die Empfänger der Klageschrift zeigen sich von diesem Schritt überrascht, wie es weiter heisst. OpenAI-Sprecherin Lindsey Held sei etwa der Ansicht gewesen, in den Gesprächen "konstruktiv voranzukommen", zitiert die Times. "Wir respektieren die Rechte der Urheber und Eigentümer von Inhalten und sind bestrebt, mit ihnen zusammenzuarbeiten, um sicherzustellen, dass sie von der KI-Technologie und neuen Erlösmodellen profitieren", sagte die Sprecherin. "Wir sind zuversichtlich, dass wir einen für beide Seiten vorteilhaften Weg der Zusammenarbeit finden werden, so wie wir es mit vielen anderen Verlagen tun." Microsoft wollte auf Anfrage der "New York Times" keinen Kommentar zur Klage abgeben.
Auszüge aus Premium-Artikeln
"Die Beklagten versuchen, die massiven Investitionen der Times in ihren Journalismus auszunutzen", heisst es in der Klageschrift weiter. Die Konzerne werden beschuldigt, "die Inhalte der Times ohne Bezahlung zu nutzen, um Produkte zu entwickeln, die die Times ersetzen und ihr das Publikum wegnehmen".
In der Beschwerde ist von mehreren Beispielen die Rede, wo ein Chatbot fast wortwörtlich Auszüge aus Times-Artikeln lieferte, für die eigentlich ein kostenpflichtiges Abonnement der Zeitung nötig wäre. Die Klage beleuchte darüber hinaus den potenziellen Schaden durch sogenannte Halluzinationen der KI, schreibt die Times weiter. Dabei gibt ein Chatbot fehlerhafte Informationen aus und schreibt sie fälschlicherweise einer Quelle zu, von der sie gar nicht stammen. So habe Bing etwa aus einem Artikel der Times zu den "15 besten Lebensmitteln für die Herzgesundheit" zitiert, 12 der gelisteten Produkte seien jedoch gar nicht im Originalartikel vorgekommen.
In einem anderen Beispiel habe Browse with Bing von Microsoft fast wortwörtlich Ergebnisse von Wirecutter geliefert, der Produkt-Review-Plattform der Times. Das Tool verlinkte jedoch laut Times nicht zum Originalbeitrag und entfernte im Text die weiterführenden Links zu Verkaufswebsites der beschriebenen Produkte, mit denen Wirecutter Kommissionen einfährt.
"Wenn die Times und andere Nachrichtenorganisationen nicht in der Lage sind, unabhängigen Journalismus zu produzieren und zu schützen, wird ein Vakuum entstehen, das kein Computer oder keine künstliche Intelligenz füllen kann", heisst es in der Beschwerde. "Es wird weniger Journalismus produziert werden, und die Kosten für die Gesellschaft werden enorm sein."
Übrigens: ChatGPT wird in der Bezahlversion GPT-4 wohl auch immer denkfauler. Der Bot fordert Nutzerinnen und Nutzer häufiger zur Selbstarbeit auf, statt Antworten auf ihre Fragen zu liefern. Entwickler OpenAI kann sich dies nicht erklären.