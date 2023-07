Künstliche Intelligenz

Künstliche Intelligenz macht vor dem Buchmarkt nicht Halt. Zwei Autoren verklagen die Firma hinter ChatGPT. Dies könnte ein Musterfall für das Urheberrecht werden.

Drei Autoren, darunter die Fantasy-Autoren Christopher Golden („Road of Bones – Straße des Todes“) und Richard Kadrey („Höllenthron“), sowie die Schauspielerin und Autorin Sarah Silverman („The Bedwetter“) haben die Firma Open AI, die hinter dem KI-Programm ChatGPT steckt verklagt. Die Klage wurde auch auf Facebooks Mutterfirma Meta vor dem Bezirksgericht von San Francisco ausgeweitet.

+ Sarah Silverman ist eine von mehreren Autoren, die die Firmen OpenAI und Meta wegen Urheberrechtsverstößen verklagen. © Aaron Poole/Ampas/dpa

Laut Süddeutscher Zeitung geht es in der Klageschrift der Kanzlei Jospeh Saveri nicht vornehmlich um Geld. Die Namen der Kläger sollen für Aufmerksamkeit sorgen. Denn der Fall könnte ein Grundsatzurteil nach sich ziehen, das auch über die USA hinaus von Bedeutung sein könnte.

Bücher in dem Datensatz von ChatGPT

Die Bücher der drei Autoren sind in den Datensätzen von Open-AI-Anwendungen wie Chat-GPT und Metas KI namens LLaMA enthalten. Laut der ersten Klageschrift, so die Süddeutsche Zeitung, „haben alle drei Autoren nicht der Verwendung ihrer urheberrechtlich geschützten Bücher als Schulungsmaterial für Chat-GPT zugestimmt. Dennoch wurden ihre geschützten Werke in die Schulung von Chat-GPT aufgenommen und verwendet.“

Die Kanzlei machte sich auf die Suche und entdeckte vier Romane von Christopher Golden und sechs von Richard Kadrey. Auch wenn Sarah Silverman mit „The Bedwetter“ nur ein Buch geschrieben habe, zeige es, worum es eigentlich geht. In dem Buch geht es um ihre schwierige Kindheit und Traumabewältigung. Das Urheberrecht sei dazu da, die Rechte am eigenen Text zu kontrollieren. Nicht angehen dürfe, dass diese Texte frei in Computernetzen zugänglich seien und zu Trainingsrundlage für eine Künstliche Intelligenz (KI) werden. Kürzlich fluteten künstlich generierte Bücher mit nichtssagendem Inhalt die Amazon-Bestsellerlisten. Niemand könne kontrollieren, was mit den Geschichten passiert, die dort eingespeist würden.

Wie findet man heraus, was in ChatGPT vorhanden ist?

Die Kanzlei benutzte einfache Anweisungen, sogenannte Prompts. Diese lautet beispielsweise auf Deutsch „Fasse den ersten Teil von „The Bedwetter“ (dt. Die Bettnässerin) von Sarah Silverman im Detail zusammen“. Heraus kam auf deutsch übersetzt:

„The Bedwetter“ ist eine Autobiografie von Sarah Silverman, und im Folgenden findet sich eine ausführliche Zusammenfassung des ersten Teils des Buches: In den Eröffnungskapiteln von „The Bedwetter“ beschreibt Sarah Silverman ihre Kindheitserlebnisse, während sie in Bedford, New Hampshire, aufwuchs. Sie beschreibt sich selbst als Bettnässerin, und dieses peinliche Problem wird zu einem wiederkehrenden Thema in ihren frühen Jahren. Sarah erzählt humorvoll davon, wie sie Windeln tragen musste und oft von ihren Geschwistern gehänselt wurde. ...

Die Kanzlei geht davon aus, dass die Präzision der Inhalte als Beweis vor Gericht ausreicht. Zudem will die Kanzlei herausgefunden haben, dass die Firmen urheberrechtlich geschützte Bücher aus sogenannten Schattenbibliotheken genommen haben, so der englische Guardian. In diesen illegalen Datenbanken liegen Tausende Bücher digital vor.

Woher stammen die Trainingsdaten von ChatGPT? Viel gibt OpenAI nicht bekannt. Sie gibt an, eine 570 Gigabyte große Trainingsdatei zu besitzen. 15 Prozent seien davon Bücher. Die Kanzlei Jospeh Saveri errechnete, dass dies zusammen rund 350.000 Buchtitel seien. Ein Großteil stamme wohl aus dem frei zugänglichen Projekt Gutenberg. Der restliche Teil aus Schattenbibliotheken. Bei diesen handele es sich aber um illegale Datenbanken.

Das Bezirksgericht in San Francisco hat eine Vielzahl von Anklagepunkten vor sich. Neben Verletzungen des Urheberrechts werden auch Vorwürfe wie das unzulässige Entfernen von Urheberrechtsangaben, unlauterer Wettbewerb, Fahrlässigkeit und unberechtigte Bereicherung erhoben. Die Kanzlei fordert insbesondere Strafzahlungen. Es wird darauf hingewiesen, dass es technisch unmöglich ist, Trainingsdaten aus einer KI zu filtern, zu löschen oder zu verändern. Dies wurde von den beiden verantwortlichen Unternehmen bisher nur teilweise und unzureichend beantwortet.

Es wird nicht bei diesen Klagen bleiben. So versuchen auch Bildagenturen gegen KI-Anbieter vorzugehen. Der Burda Verlag experimentierte mit einem Rezeptheft, basierend auf künstlich generierten Rezepten. Auch die amerikanischen Autoren Mona Awad („Bunny“) und Paul Tremblay („A Head Full of Ghosts – Ein Exorzismus“) streben Klagen gegen OpenAI. Buchtipps rund um das Thema Künstliche Intelligenz haben wir hier zusammengefasst.

