Erhebung von Trainingsdaten für Künstliche Intelligenzen

Richtungsweisendes Urteil: LG Hamburg bestätigt Text- und Datamining für KI-Trainingsdaten

Ein Urteil des Landgerichts Hamburg vom 27.09.2024 (Az. 310 O 227/23) hat die Diskussion über die rechtliche Zulässigkeit von Text- und Datamining (TDM) für das Training von Künstlicher Intelligenz (KI) entscheidend gestärkt. Erstmals wurde die sogenannte Schrankenregelung des § 60d Urheberrechtsgesetz (UrhG) auf die Erstellung von Trainingsdatensätzen angewendet. Dies bringt insbesondere Klarheit für die Forschung und Open Source Community, wirft jedoch auch Fragen für kommerzielle Anwendungen auf.

Was besagt das Urteil des LG Hamburg?

Im zugrunde liegenden Fall hatte der gemeinnützige Verein LAION (Large-scale Artificial Intelligence Open Network) ein Bild des Klägers in einem Open-Source-Trainingsdatensatz verwendet. LAION argumentierte, dass die Nutzung des Bildes durch § 60d UrhG gedeckt sei, da das Bild ausschließlich zum Zwecke des Text- und Dataminings für wissenschaftliche Forschung vervielfältigt wurde. Der Datensatz war öffentlich zugänglich und explizit für die wissenschaftliche Forschung gedacht.

Das Gericht schloss sich dieser Argumentation an und stellte klar: Vervielfältigungen für TDM sind rechtlich zulässig, sofern sie keine kommerziellen Zwecke verfolgen und der Datensatz Forschenden zugänglich gemacht wird.

Eine ausführliche Besprechung des Urteils finden Sie bei Legal Tribune Online.

Open-Source-Trainingsdatensätze und § 60d UrhG

Das Urteil wirft eine wichtige Frage auf: Könnten Open-Source-Trainingsdatensätze generell unter die Schrankenregelung des § 60d UrhG fallen?

Wenn dies zutrifft, wäre die Nutzung solcher Datensätze für wissenschaftliche Zwecke weitgehend rechtlich abgesichert. Für kommerzielle Anwendungen – wie in der Industrie – könnte jedoch eine weitergehende Prüfung erforderlich sein, um Urheberrechtsverletzungen zu vermeiden.

Hier zeigt sich, dass Unternehmen, die KI-Modelle trainieren möchten, ihre Datenquellen sorgfältig auswählen müssen. Ein pauschaler Verweis auf die Schrankenregelung reicht im geschäftlichen Kontext derzeit nicht aus.

Die EU-KI-Verordnung: Zusätzliche Anforderungen an Datensätze

Parallel zu diesem Urteil schreitet die Einführung der EU-KI-Verordnung voran, die klare Anforderungen an die Qualität und Transparenz von Datensätzen für KI-Modelle stellt. Die Verordnung legt großen Wert auf:

  • Nachvollziehbarkeit und Transparenz: Unternehmen müssen dokumentieren, wie ihre Datensätze erstellt wurden.
  • Datenschutz und Fairness: Trainingsdaten dürfen keine Diskriminierung fördern und müssen DSGVO-konform erhoben werden.

Dies unterstreicht, wie wichtig es ist, sich bereits in der Datenerhebungsphase an die rechtlichen Rahmenbedingungen zu halten, um spätere Risiken zu vermeiden.

Was bedeutet das für die Praxis?

Für Unternehmen und Entwickler ist das Urteil des LG Hamburg eine Orientierungshilfe, da es wissenschaftliche KI-Projekte klar schützt. Gleichzeitig unterstreicht es, dass kommerzielle Datennutzung sorgfältig rechtlich geprüft werden muss. Insbesondere in Business-Kontexten ist sicherzustellen, dass Datensätze sowohl den Anforderungen des § 60d UrhG als auch der EU-KI-Verordnung gerecht werden.

Wie PREISmonitoring hilft: Professionelle Datenerhebung für KI-Training in Europa

Um rechtlich sichere, qualitativ hochwertige Datensätze zu erstellen, benötigen Unternehmen professionelle Unterstützung. PREISmonitoring bietet zuverlässige Online-Datenerhebungsdienste in Europa und garantiert dabei höchste Standards in Bezug auf Qualität und Transparenz.

Festlegung der Datenquellen:

Gemeinsam bestimmen wir, welche Websites, Märkte und Marktplätze zur Erhebung von Trainingsdaten genutzt werden sollen

Datenerhebung

Einmalig als Traningsgrundlage oder repititiv zur Aktualisierung

Datenexport

Erhalten Sie die Rohdaten in Formaten wie Excel, CSV, JSON oder via API. Alternativ erhalten Sie eine professionelle Visualisierung und Auswertung der Daten über Microsoft Power BI.

So profitieren Sie mit PREISmonitoring

Aktuelle und genaue Daten:

Unsere eigenentwickelte Crawling-Software garantiert Ihnen stets umfassende und aktuelle Informationen.

Individuelle Anpassung:

Wir bieten maßgeschneiderte Lösungen auch für komplexe Anforderungen.

Experten-Support:

Unser deutschsprachiger Support steht Ihnen seit 2006 mit Rat und Tat zur Seite, um Ihnen die bestmögliche Unterstützung zu bieten.

»Der Aufbau leistungsfähiger KI beginnt mit sauberen, rechtssicheren Trainingsdaten. PREISmonitoring unterstützt Sie dabei, valide Datenquellen zu erschließen, und liefert die nötige Datenqualität, um Innovation rechtlich sicher und technologisch überzeugend umzusetzen. Darüber hinaus begleiten wir Sie mit fundierter Beratung und individueller Betreuung – vom ersten Konzept bis zur Integration in Ihre KI-Entwicklungsprozesse.«

Andreas W. Ditze

Geschäftsführer

Anspruchsvolle Kunden verdienen passgenaue Lösungen

PREISmonitoring ist auf Individualität spezialisiert und kümmert sich um Ihre branchenspezifischen Bedürfnisse. Musterlösungen? Sicher nicht mit uns! Stellen Sie sich Ihr eigenes Angebot so zusammen, wie Sie es brauchen.

Oder kontaktieren Sie uns direkt

Videocall vereinbaren

Buchen Sie sich direkt einen Online-Termin mit unseren Beratern. Eine halbe Stunde für Ihren Erfolg.

kontakt@preismonitoring.de

Schreiben Sie Ihr Anliegen in aller Ruhe. Wir antworten werktags innerhalb von 48h.

Individualangebot






    Captcha
    captcha
    Reload

    So finden Sie uns

    Unseren Sitz haben wir in der malerischen Universitätsstadt Marburg an der Lahn, die eine knappe Stunde nördlich von Frankfurt am Main und südlich von Kassel entfernt ist. Sehr zentral, in der Mitte Deutschlands gelegen, sind wir gut zu erreichen und freuen uns über Besucheranfragen. Vereinbaren Sie gerne einen Termin mit uns!

    tripuls media innovations gmbh

    Zu den Sandbeeten 5 – 35043 Marburg

    Jetzt beraten lassen und mit PREISmonitoring durchstarten!