GEMA gegen OpenAI: Wegweisendes Urteil zu KI-Sprachmodellen und Urheberrecht
Update IP, Media & Technology Nr. 130
Das LG München I hat mit Urteil v. 11.11.2025 (Az. 42 O 14139/24) entschieden, dass OpenAI mit seinen KI-Sprachmodellen und darauf basierenden Chatbots die Urheberrechte bekannter deutscher Künstler verletzt. Liedtexte bekannter deutscher Musiker wie etwa „Atemlos“ von Helene Fischer und Kristina Bach oder „Männer“ von Herbert Grönemeyer habe das KI-Sprachmodell memorisiert und der darauf basierende Chatbot könne sie in weiten Teilen originalgetreu ausgeben. Dadurch seien die Verwertungsinteressen der Künstler berührt, weshalb eine Nutzung der Liedtexte durch OpenAI wie bisher ohne Lizenz nicht zulässig sei.
Speicherung der Liedtexte
Als Erstes führte OpenAI technische Eigenschaften des Sprachmodells gegen eine Verletzung des Urheberrechts an. Trainingsdaten wie Liedtexte würden vom Sprachmodell nicht gespeichert oder kopiert. Vielmehr reflektiere das Sprachmodell nur und lerne basierend auf dem gesamten Trainingsdatensatz.
Dieses Argument ließ das LG München I nicht gelten. Denn aus der informationstechnischen Forschung sei bekannt, dass Trainingsdaten in Sprachmodellen enthalten sein können und sich als Outputs extrahieren lassen (sog. Memorisierung). Das sei der Fall, wenn Sprachmodelle nicht nur einzelne Informationen aus den Trainingsdaten entnehmen, sondern die Trainingsdaten komplett übernehmen. Die Liedtexte seien reproduzierbar in den Sprachmodellen festgestellt worden. Ein Zufall sei aufgrund der umfangreichen Texte nicht denkbar.
Chatbot als Hersteller des Outputs
OpenAI machte auch geltend, die Outputs seien gar nicht vom Chatbot selbst generiert, sondern vielmehr vom Nutzer, der den Befehl (sog. Prompt) zur Darstellung der Texte erteilt habe. Das Gericht argumentierte dagegen: Die Liedtexte seien mit einfach gehaltenen Prompts zu extrahieren. Die Anbieter seien für die Architektur und das Training ihrer Sprachmodelle verantwortlich.
Nicht von der Text- und Data-Mining-Schranke des Urheberrechts gedeckt
OpenAI brachte zudem vor, die Aktivitäten des Sprachmodells seien Text und Data Mining. Damit würden sie unter die Schrankenbestimmung des § 44b Urheberrechtsgesetz (UrhG) fallen und seien erlaubt. Ob Sprachmodelle mit ihrer Funktionsweise unter das Data Mining fallen, ist eine bislang ungeklärte und hoch umstrittene Rechtsfrage.
Das Gericht stellte zunächst fest, dass eine Vervielfältigung der Liedtexte beim Zusammenstellen des Datenkorpus für das Training vom Text und Data Mining abgedeckt sei. Diese (erste) Vervielfältigung geschehe zu Analysezwecken, wodurch die Verwertungsinteressen des Urhebers nicht beeinträchtigt würden.
Das Training selbst geschehe aber nicht nur zu Analysezwecken. Und da hierbei nicht nur einzelne Informationen extrahiert, sondern ganze Werke vervielfältigt würden, seien auch die Verwertungsinteressen der Urheber berührt. Auch der Output durch den Chatbot mit den Nutzern geschehe nicht allein zu Analysezwecken. Auch hierbei werde das ganze Werk vervielfältigt und würden die Verwertungsinteressen der Urheber berührt. Eine entsprechende oder vermeintlich innovationsfreundlichere Auslegung von § 44b UrhG lehnte das Gericht ab.
Kein unwesentliches Beiwerk
Das Gericht sah die Liedtexte auch nicht als unwesentliches Beiwerk (Schranke des § 57 UrhG) zum Rest der Trainingsdaten an. Denn das setze das Vorliegen eines urheberrechtlich geschützten Hauptwerks voraus. Die Trainingsdaten genössen als solche aber keinen urheberrechtlichen Schutz.
Keine Einwilligung
Das Gericht entschied außerdem, dass das Training von Sprachmodellen keine übliche und erwartbare Nutzungsart sei, mit der der Rechteinhaber rechnen musste. Deshalb lehnte es auch eine Einwilligung ab.
Folgen des Urteils
Das Urteil wird von den Klägern als Meilenstein für den Schutz von Musikern und anderen Kreativen vor der unlizenzierten Nutzung ihrer Werke durch Künstliche Intelligenz gelobt. Tatsächlich ist vorstellbar, dass das Urteil Auswirkungen weit über die Musikbranche hinaus hat. Es sollte allerdings bedacht werden, dass die Urheberrechtsverletzungen nur anerkannt wurden, weil die geschützten Liedtexte reproduzierbar und vollständig abgerufen werden konnten. Das ist nicht bei jedem Training einer KI mit urheberrechtlich geschütztem Material der Fall. Das Urteil ist außerdem noch nicht rechtskräftig. Es ist wahrscheinlich, dass die Parteien noch in Berufung gehen. Es wäre sicherlich hilfreich, wenn sich letztlich auch der BGH (und der EuGH) hierzu äußern könnte(n).