Gerade in dem Bereich der KI-Zusammenfassungen für die großen Suchmaschinen wie bspw. Google (Google AI-Overview), werden mittels sog. Webcrawler (Bots) die urheberrechtlich geschützten Inhalte auf Webseiten durchsucht und ausgewertet. Die für das sog. Text- und Data-Mining zentrale Norm aus dem Urheberrecht ist § 44b UrhG. Diese Norm ermöglicht es in Absatz 2 Vervielfältigungen von rechtmäßig zugänglichen Werken anzufertigen. Wer dies als Webseitenbetreiber nicht möchte, kann nach Absatz 3 einen Nutzungsvorbehalt erklären. Dabei schreibt § 44b Absatz 3 Satz 2 UrhG vor, dass ein solcher Vorbehalt in „maschinenlesbarer Form“ erfolgen muss. Wann diese Form gewahrt wurde und welche Anforderungen an die Maschinenlesbarkeit zu stellen sind, ist Gegenstand eines aktuellen Rechtsstreits vor dem OLG Hamburg (Urteil vom 10.12.2025 – 5 U 104/24).
Die diesbezüglich erstinstanzliche Entscheidung erfolge am LG Hamburg (Urteil vom 27.9.2024 – 310 O 227/23). Dabei wies das Landgericht die Klage eines Fotografen ab, der sich gegen die Vervielfältigung seines Fotos zur Erstellung von Datensätzen zur Wehr setzen wollte. Der Beklagte konnte sich als ehrenamtlicher Verein auf die Schranke für wissenschaftliche Forschung (§ 60d UrhG) berufen. Ein Rückgriff auf die allgemeine Text- und Data-Mining-Schranke des § 44b Abs. 2 UrhG war aufgrund eines (nach Ansicht des LG) wirksamen Nutzungsvorbehalts ausgeschlossen. Bemerkenswert ist dabei, dass die Kammer einen allein in natürlicher Sprache formulierten Nutzungsvorbehalt in den AGB für die „maschinenlesbare Form“ als ausreichend erachtete, da moderne KI-Modelle ja in der Lage seien, in natürlicher Sprache geschriebene Texte inhaltlich zu erfassen.
Das OLG Hamburg als Berufungsinstanz bestätigte zwar die Klageabweisung, gelangte jedoch zu einer grundlegend abweichenden Begründung hinsichtlich der Maschinenlesbarkeit. Das OLG stellte unter anderem fest, dass der Nutzungsvorbehalt in natürlicher Sprache nicht den Anforderungen an die maschinenlesbare Form genügt. Die bloße maschinelle Erfassbarkeit des Textes in natürlicher Sprache reiche nicht aus, erforderlich sei vielmehr die maschinelle Interpretierbarkeit. Den KI-Modellen die bereits im Jahr 2021 (das Jahr in dem sich der Sachverhalt ereignete) der Öffentlichkeit zur Verfügung standen sei es nicht ohne weiteres möglich gewesen, umfangreiche Nutzungsbedingungen auszuwerten. Es wird insofern auf unterschiedliche technische Formate und Verfahren zur Umsetzung der Maschinenlesbarkeit hingewiesen. Aufgrund der grundlegenden Bedeutung dieser Rechtsfragen, hat das OLG die Revision zum BGH zugelassen, welche bereits von der Literatur erwartet wird.
Die in der Praxis verbreitetsten technischen Formate und Verfahren, die in der Literatur diskutiert werden sind unter anderem: die Verwendung UTF-8-codierter robots.txt-Dateien, das TDM Reservation Protocol des World Wide Web Consortiums (als sog. W3C-Standard), das C2PA-Rechteprotokoll (Common Copyright Protocol Agreement) oder der IPTC RightsML Standard 2.0 (International Press Telecommunications Council (IPTC)).
Als anschauliches Beispiel diente mir im Vortrag die Verwendung der robots.txt-Dateien. Dabei handelt es sich um eine Textdatei in den Haupt-oder Unterverzeichnissen des Webservers, welche von den Webcrawlern (Bots) als erstes aufgerufen wird beim Besuch einer Webseite. In dieser Textdatei kann durch Anweisungen festgelegt werden, welche Bereiche einer Domain gecrawlt werden dürfen und welche nicht. Ein Kritikpunkt an dieser „Technik“ ist der hohe Aufwand für die Webseitenbetreiber. Diese müssen den Überblick behalten, welche Bots von den KI-Anbietern aktuell existieren und müssen alle relevanten Bots in der robots.txt-Datei einzeln adressieren.
Dieser Punkt wurde auch in der anschließenden Diskussion aufgegriffen und zurecht nach einer Möglichkeit gefragt, alle Bots durch einen generellen Ausschluss zu blockieren. Dies kann allerdings ein weiterführendes Problem auslösen. Indem man alle Bots blockiert, kann auch die Indexierung der Webseite bei den Suchmaschinen beeinträchtigt oder aufgehoben werden. Somit taucht die Webseite gar nicht mehr in den Ergebnissen der Suchmaschine auf, was zu einem Verlust der Sichtbarkeit (des Unternehmens) führt.
Quellen:
- Pesch, in: Spindler/Schuster/Kaesling, Recht der elektronischen Medien, 5. Auflage 2026, Urheberrecht, §44b Rn.40-44.
- Bomhard, in: BeckOK Urheberrecht, Götting/Lauber-Rönsberg/Rauer, 48. Edition, Stand: 01.09.2025, Urheberrecht, §44b Rn.32-40.
- Bäcker, Kerstin, Der Text und Data Mining Vorbehalt: Technische Umsetzung der Maschinenlesbarkeit, vom 22.07.2024, abrufbar unter: https://lausen.com/der-text-und-data-mining-vorbehalt-technische-umsetzung-der-maschinenlesbarkeit/
- Petersenn, Morten/Kühn, Vincent Maximilian, Rechtbank Amsterdam: Zur Maschinenlesbarkeit des Nutzungsvorbehalts beim Text-und Data-Mining, KIR 2025, 276 ff.
