Zum Inhalt springen

ChatGPT und KI-Generatoren rechtssicher einsetzen

Ähnlich wie bei einem Chat kann der Nutzer bei ChatGPT (Chatbot Generative Pre-trained Transformer) über Texteingabe mit dem Chat-Bot kommunizieren, wobei das KI-gesteuerte System aus der Unterhaltung fortlaufend lernt (Maschinelles Lernen, ML) und mit riesigen Datenmengen zumeist aus dem Internet trainiert wird (Data Mining). ChatGPT ist aufgrund der immensen wirtschaftlichen Bedeutung durch potentielle Einsparung menschlicher Arbeitsleistung und der seit einiger Zeit erfolgenden intensiven Berichterstattung in aller Munde. Die breiten Einsatzmöglichkeiten von KI-gestützten Generatoren im Arbeitsalltag – von der Bild- und Texterzeugung, Vertragsgestaltung, Sprachwerke und Musik bis zur Software-Programmierung – werfen eine ganze Reihe von rechtlichen Fragen insbesondere aus dem Urheber- und Datenschutzrecht auf.

Urheberrechtlicher Schutz der erzeugten Inhalte

Ob die Arbeitsergebnisse von KI-Generatoren urheberrechtliche Schutzfähigkeit besitzen, richtet sich nach § 2 Abs. 2 UrhG, wonach Werke im Sinne des Urhebergesetzes nur „persönliche geistige“ Schöpfungen, also schöpferische Leistungen von Menschen sein können. Damit sind die Arbeitsergebnisse von KI-Werkzeugen aus dem Schutzumfang des Urheberrechts ausgenommen. In der Konsequenz wären z.B. durch ChatGPT erzeugte Texte von beliebigen Dritten frei verwendbar.

Allerdings kann ein urheberrechtlicher Schutz der erzeugten Texte oder Bilder entstehen, wenn der Nutzer den KI-Generator lediglich als technisches Hilfswerkzeug einsetzt, also durch Eingabe komplexer Vorgaben selbst eine dominierende werkschöpfende Eigentätigkeit entfaltet, die nicht nur einen marginalen, sondern bestimmenden Einfluss auf das Endergebnis hat. Die dafür notwendige Schöpfungshöhe wird aber wohl durch die banale Eingabe von Begriffen nicht erreicht, sondern erfordert mehr Komplexität.

Auch wenn der Nutzer das vom KI-Generator ausgeworfene Arbeitsergebnis so stark abändert, dass eine eigenständige Werkschöpfung entsteht, ist das neuentstandene Werk urheberrechtlich schutzfähig.

Urheberrechtsverstöße durch den KI-Generator

KI-Generatoren arbeiten zur Erstellung von Inhalten (Texte, Bilder usw.) mit Mustern und Vorlagen, die sie im Wege des Data Mining aus einer riesigen Menge an Trainingsdaten zumeist aus dem Internet gewinnen. Die Arbeitsergebnisse können folglich den ausgewerteten Werken ähnlich oder mit diesen (teilweise) identisch sein. Gemäß § 23 Abs. 1 UrhG spricht man bei solchen Übereinstimmungen von Bearbeitungen oder Umgestaltungen eines Werkes, deren Veröffentlichung oder Verwertung rechtswidrig ist, sofern sie ohne Zustimmung des Urhebers erfolgt.

Verantwortlich für den Urheberrechtsverstoß ist in erster Linie der Nutzer, also Unternehmen und Behörden, deren Mitarbeiter die KI-Generatoren einsetzen und denen die Rechtsverstöße ihrer Beschäftigten gemäß § 99 UrhG zugerechnet werden. Ob darüber hinaus auch eine Mitverantwortlichkeit der Anbieter der KI-Werkzeuge, (bei ChatGPT also OpenAI) in Betracht kommt, ist bislang rechtlich nicht geklärt. Auch OpenAI weist die Verantwortlichkeit allein dem Nutzer der Arbeitsergebnisse zu. Hierzu bestimmt Nr. 3a der Nutzungsbedingungen von OpenAI:

„You are responsible for Content, including for ensuring that it does not violate any applicable law or these Terms.” (Sie sind für den Inhalt verantwortlich, einschließlich der Sicherstellung, dass er nicht gegen geltendes Recht oder diese Bedingungen verstößt)

Abgrenzung: abhängige Bearbeitung zu freier Benutzung

Wahrt das durch die KI erstellte Arbeitsergebnis einen hinreichenden Abstand zum benutzten Werk, so liegt keine rechtswidrige Bearbeitung oder Umgestaltung, sondern eine auch ohne Lizenz des Urhebers zulässige sogenannte „freie Benutzung“ vor.

Verwendet man einen KI-Generator, um bereits bestehende Inhalte anzupassen, so ergibt sich die identische Problemstellung. Auch dann können die Arbeitsergebnisse den Ausgangswerken so ähnlich sein, dass eine lizenzpflichtige Bearbeitung oder Umgestaltung gemäß § 23 Abs. 1 UrhG vorliegt, sodass bei fehlender Erlaubnis Urheberrechtsverstöße begangen werden.

Folglich wird man zur Vermeidung von Urheberrechtsverstößen bezüglich der Arbeitsergebnisse der KI eine Abgrenzung gemäß § 23 Abs. 1 UrhG zwischen abhängigen und deshalb lizenzpflichtigen Bearbeitungen und den zulässigen freien Benutzungen, die den notwendigen Abstand zum Ausgangswerk wahren, vornehmen müssen. Die Abgrenzungsfrage war bereits vielfach Gegenstand der obergerichtlichen Rechtsprechung auch des BGH.

In ständiger Rechtsprechung stellt der BGH hierzu fest, dass nicht nur die konkrete Fassung oder die unmittelbare Formgebung eines Werkes urheberrechtlich schutzfähig sind, sondern auch eigenpersönlich geprägte Bestandteile und formbildende Elemente des Werks Urheberrechtsschutz genießen (siehe etwa BGH vom 17.07.2013, Az. I ZR 52/12, Randnr. 25). Eine freie Benutzung setzt voraus, dass angesichts der Eigenart des neuen Werks die entlehnten eigenpersönlichen Züge des geschützten älteren Werks verblassen und so zurücktreten, dass das ältere in dem neuen Werk nur noch schwach in urheberrechtlich nicht mehr relevanter Weise durchschimmert. Der für eine freie Benutzung erforderliche Abstand kann zudem auch dann gegeben sein, wenn das neue Werk zu den entlehnten eigenpersönlichen Zügen des älteren Werks einen so großen inneren Abstand hält, dass es seinem Wesen nach als selbständig anzusehen ist (aaO Randnr. 38, 39).

Für die Nutzer ergibt sich in der praktischen Arbeit mit KI-Generatoren das Problem, wie mögliche Ähnlichkeiten sicher und mit vertretbarem Aufwand erkannt werden können. Hierbei können Plagiatsscanner ein wichtiges Hilfswerkzeug sein.

Die Auswertung von Traniningsdaten (Data Mining)

KI-Generatoren benötigen für Ihre Arbeit zahlreiche Muster und Vorlagen, die sie aus großen Mengen von Trainingsdaten zumeist im Internet „schürfen“. Man spricht deshalb auch von Data Mining. Hier drängt sich naturgemäß schon bei der Entwicklung der für die KI notwendigen Software die Frage auf, ob mit der Gewinnung der Trainingsdaten Persönlichkeits-, Datenschutz- oder Urheberrechte verletzt werden.

Nach § 44b Abs. 1 UrhG ist Text und Data Mining die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster und Korrelationen zu gewinnen. Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining sind gemäß § 44b Abs. 2 UrhG auch ohne Lizenz oder Einwilligung des Urhebers zulässig, weshalb die Auswertung der Trainingsdaten durch KI-Software im ersten Schritt als zulässig eingestuft wird und keinen Urheberrechtsverstoß darstellen soll.

Allerdings sind die Vervielfältigungen gemäß § 44b Abs. 2 UrhG wieder zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind. Zudem ist die Nutzung der Trainingsdaten gemäß § 44b Abs. 3 UrhG nur zulässig, wenn der Urheber sich diese nicht vorbehalten hat. Urheber, die eine analytische Auswertung ihrer Inhalte durch die KI unterbinden wollen, können demnach ein entsprechendes Verbot ausdrücklich erklären oder durch eine Software-Lösung wie z.B. Glaze die Auswertung technisch verhindern.

§ 44b UrhG regelt aber nur die urheberrechtliche Seite der Medaille. Durch die Verwendung personenbezogener Trainingsdaten kann darüber hinaus gegen Persönlichkeitsrechte, insbesondere das Recht am Bild nach dem KUG oder Datenschutzbestimmungen nach der DSGVO verstoßen werden.

Gesetzliche Regelungen zur KI

Rechtliche Bewertungen oder gesetzliche Regelungen zu KI-Fragen oder zu KI-Generatoren wie ChatGPT stehen noch am Anfang und sind stark im Fluss. Auf der EU-Ebene hat die Europäische Kommission am 21.04.21 den Entwurf einer KI-Verordnung veröffentlicht, die

einen weiten räumlichen und sachlichen Anwendungsbereich bestimmt. Der Entwurf enthält eine umfassende KI-Definition sowie einen risikobasierten Ansatz, der ein Risiko-Management-System mit einer Differenzierung nach Risikogruppen regelt.

Inwieweit diese neuen gesetzlichen Bestimmungen bei der vorliegenden Problemstellung helfen können, wird sich noch herausstellen müssen und Gegenstand weiterer Beiträge zur KI-Problematik sein.

Der Datenschutzpodcast mit Horst Speichert und Simone Seidel – YouTube

Top