25 November 2024

KI-Verhaltenskodex: Erster Entwurf und erstes Copyright-Meeting

Am 1. August 2024 trat das EU-Gesetz über künstliche Intelligenz in Kraft. Diese Verordnung hat erhebliche Auswirkungen auf den Kultur- und Kreativsektor, da KI künstlerische Prozesse zunehmend verändert und kulturelle Daten nutzt. Das KI-Gesetz führt unter anderem Verpflichtungen für Anbieter von Allzweck-KI-Modellen (GPAI) ein, darunter Transparenz und Urheberrecht.

Um die technischen Maßnahmen und Richtlinien festzulegen, die GPAI-Anbieter umsetzen müssen, um diesen Verpflichtungen nachzukommen, unterstützt das KI-Büro der Europäischen Kommission die Ausarbeitung eines Verhaltenskodex. Bis Mai 2025 wird dieses Dokument bewährte Praktiken und Maßnahmen darlegen, die Anbieter bei der Einhaltung ihrer gesetzlichen Anforderungen unterstützen. Der Kodex wird in einem Multistakeholder-Prozess entwickelt, an dem fast 1000 Teilnehmer aus Industrie, Wissenschaft, Zivilgesellschaft und Rechteinhaberorganisationen. Culture Action Europe nimmt ebenfalls an dieser Arbeitsgruppe teil. Der Prozess wird von Vorsitzenden – renommierten Experten – geleitet, die die Beiträge der Interessengruppen konsolidieren, um sukzessive Versionen des Dokuments zu entwerfen.

Ein erster Entwurf

Letzte Woche veröffentlichte das AI Office der erste Entwurf des KodexNachfolgend finden Sie eine Übersicht über die wichtigsten Maßnahmen im Bereich Transparenz und Urheberrecht.

Maßnahme 3: Interne Copyright-Richtlinie

Anbieter von GPAI-Modellen müssen implementieren eine interne Richtlinie, die die Einhaltung der EU-Urheberrechtsgesetze sicherstellt über den gesamten Lebenszyklus ihrer Modelle hinweg. Sie sollten auch innerhalb ihrer Organisationen klare Verantwortlichkeiten für die Überwachung dieser Richtlinie festlegen.
Anbieter von GPAI-Modellen müssen Urheberrechtliche Sorgfaltspflicht gegenüber Upstream-Parteien bevor Sie sie beauftragen, und stellen Sie sicher, dass diese Unternehmen ihre Rechtevorbehalte respektiert haben. Im Kontext der Entwicklung von KI-Modellen bezieht sich „Upstream“ auf den Prozess des Sammelns und Vorbereitens der Datensätze, die zum Trainieren des Modells verwendet werden.
Anbieter von GPAI-Modellen sollten Maßnahmen ergreifen, um das Risiko zu verringern, dass nachgelagerte Systeme urheberrechtsverletzende Ergebnisse produzieren. „Downstream“ bezieht sich auf spätere Phasen, in denen das KI-Modell, das im Wesentlichen ein statistisches Modell ist, in Tools oder Anwendungen für den Einsatz in der realen Welt integriert wird. Anbieter werden dringend gebeten, Überanpassung vermeiden ihre Modelle (wenn das Modell die Trainingsdaten, einschließlich des Rauschens oder spezifischer Details, zu genau lernt) und sollten nachgelagerte Einheiten dazu verpflichten, die wiederholte Generierung von Ergebnissen zu verhindern, die mit geschützten Werken identisch oder erkennbar ähnlich sind. Diese Maßnahme gilt nicht für KMU.

Maßnahme 4: Anbieter sollten Rechtevorbehalte erkennen und einhalten

Anbieter sollten nur Crawler einsetzen, die das robots.txt-Protokoll.
Anbieter sollten sicherstellen, dass Rechtevorbehalte, die über robots.txt ausgedrückt werden, sich nicht negativ auf die Auffindbarkeit der Inhalte in ihrer Suchmaschine.
Anbieter sollten respektieren andere geeignete maschinenlesbare Mittel um einen Rechtevorbehalt auf Quellen- und/oder Werkebene gemäß weit verbreiteten Industriestandards auszudrücken.
Anbieter, mit Ausnahme von KMU, sollten zusammenarbeiten, um interoperable maschinenlesbare Standards zur Äußerung von Rechtevorbehalten.
Krabbelaktivitäten müssen Raubkopien ausschließen, wie sie auf der Website der Europäischen Kommission aufgeführt sind Beobachtungsliste für Produktfälschungen und Produktpiraterie oder nationale Äquivalente.

Maßnahme 5: Transparenz

Anbieter werden Informationen auf ihren Websites veröffentlichen über die Maßnahmen, die sie ergreifen, um Rechtsvorbehalte zu ermitteln und einzuhalten. Diese Informationen müssen in klarer und verständlicher Sprache verfasst sein.
Diese Informationen sollten Folgendes umfassen: Namen aller Crawler wird für das GPAI-Modelltraining und die entsprechenden Robots.txt-Funktionen verwendet.
Die Anbieter werden ermutigt, einen einziger Kontaktpunkt um Rechteinhabern eine direkte Kommunikation und die Möglichkeit zu geben, umgehend Beschwerden bezüglich der Verwendung geschützter Werke bei der Entwicklung des GPAI-Modells einzureichen.
Die Anbieter erstellen, aktualisieren und übermitteln dem AI-Büro auf Anfrage Informationen zu den für das Training verwendeten Datenquellen, Tests und Validierungen sowie über Berechtigungen für den Zugriff und die Verwendung geschützter Inhalte für die Entwicklung eines GPAI-Modells.

Transparenz und Urheberrecht

Am 21. November fand die erste Sitzung der Arbeitsgruppe für Transparenz und Urheberrecht unter dem gemeinsamen Vorsitz von Nuria Oliver und Alexander Peukert, fand statt. Vorab ausgewählte Teilnehmer, die sowohl Rechteinhaber als auch Technologieunternehmen vertraten, stellten kurz ihre Positionen zum ersten Entwurf des Verhaltenskodex vor. Culture Action Europe liefert allgemeines Feedback zum Treffen (gemäß der Chatham-House-Regel werden die Namen der Organisationen nicht bekannt gegeben).

Die Urheberrechtsrichtlinien der Anbieter sollten über die bloße Einhaltung von Opt-outs hinausgehen, obwohl dies ein entscheidender Aspekt ist. Sie sollten auch Maßnahmen zur Schaffung robuster Lizenzierungsrahmen umfassen und die Zusammenarbeit mit Verwertungsgesellschaften und wichtigen Rechteinhabern fördern.
Viele Rechteinhaber argumentierten, dass die alleinige Verweisung auf die Das robots.txt-Protokoll zum Opt-out ist unzureichend und es besteht das Risiko einer missbräuchlichen Anwendung von KI-Trainingsberechtigungen. Rechteinhaber sollten andere maschinenlesbare Mechanismen nutzen können, wie z. B. das Opt-out über Geschäftsbedingungen auf einer Website, öffentliche Repositorien von Rechtevorbehalten, öffentliche Erklärungen oder die Verwendung Automatisierte Inhaltserkennung (ACR)-Technologie zum Entfernen geschützter Inhalte aus Datensätzen.
Einige Teilnehmer schlugen vor, eine offizielles öffentliches Register zur expliziten Erfassung von Rechtevorbehalten. Dieses Register würde allen Beteiligten Rechtssicherheit bieten und die Verfolgung der Daten von Rechtevorbehalten ermöglichen, sodass geschützte Daten bei Bedarf leichter aus Datensätzen entfernt werden können. Ein Teilnehmer lehnte den Vorschlag jedoch mit der Begründung ab, dass er eine unangemessene Belastung für die Rechteinhaber darstellen könnte.
In Bezug auf die Einhaltung des Urheberrechts im Upstream-Bereich argumentieren Rechteinhaber, dass diese nicht auf eine einfache Vorabprüfung von Datensätzen beschränkt sein sollte – GPAI-Modellanbieter sollten von Dritten verlangen, vollständige Rückverfolgbarkeit der von ihnen bereitgestellten Daten und Einzelheiten zu ihren Erfassungsmethoden. Das Konzept der „angemessenen Sorgfaltspflicht“ bedarf einer weiteren Ausarbeitung.
Um die Einhaltung des Urheberrechts nach der Erstanmeldung sicherzustellen, ist GPAI-Modellanbieter geben detaillierte Informationen weiter über die für das Training verwendeten Daten mit dem KI-Büro und nachgelagerten Stellen. Nur so kann sichergestellt werden, dass KI-Ergebnisse nicht unter Verwendung illegaler oder rechtsverletzender Inhalte erzeugt werden.
Andere merkten jedoch an, dass nachgelagerte Anbieter oft die einzigen sind, die in der Lage sind, die Einhaltung des Urheberrechts in ihrem spezifischen Betriebskontext angemessen zu beurteilen und zu verwalten. Sie manipulieren möglicherweise ihre eigenen geschützten Inhalte oder verfügen über Lizenzen, die außerhalb der Kontrolle der GPAI-Anbieter liegen.
Autoren und Rechteinhaber müssen Entschädigung für die vorherige unerlaubte und illegale Nutzung urheberrechtlich geschützter Werke durch GPAI-Anbieter. Der Verhaltenskodex sollte eine Bestimmung enthalten, die KI-Anbieter dazu verpflichtet, sich im Rahmen ihrer Urheberrechtsrichtlinien zu verpflichten, für eine solche unbefugte Nutzung Entschädigungen zu zahlen. Der Kodex sollte auch einen Rahmen für Sanktionen und Maßnahmen zur Behandlung von Verstößen festlegen.
Gleichzeitig betonten Vertreter von Technologieunternehmen, dass man sich an den Geltungsbereich des AI Act halten und zusätzliche Verpflichtungen vermeiden müsse: „Wir sind hier, um die Regeln des AI Act fertigzustellen, nicht mehr und nicht weniger.“ Sie stellten die Rolle des AI Office infrage und argumentierten, dass es „keine Urheberrechtsbehörde“ sei und dass seine Verantwortung bei der Überprüfung der Einhaltung des Urheberrechts unklar sei.
Sie wiesen auch auf technische Herausforderungen hin, darunter die Undurchführbarkeit von Rechtevorbehalten auf Werkebene und die Schwierigkeit der Einhaltung durch nachgelagerte Anbieter. Die Vorhersage von rechtsverletzenden Ergebnissen, so argumentierten sie, sei mit der aktuellen Technologie nahezu unmöglich, und die Durchsetzung der Einhaltung des Urheberrechts durch nachgelagerte Anbieter liege außerhalb des Geltungsbereichs des AI Act.

Sowohl das nächste Treffen als auch die Veröffentlichung der zweiten Version des Verhaltenskodex werden voraussichtlich im Januar 2025 stattfinden.

Culture Action Europe hat gemeinsam mit der Michael Culture Association Überlegungen zur Umsetzung des KI-Gesetzes, entwickelt durch unsere Aktionsgruppe für KI und Digitales. Dieses Dokument bildet die Grundlage für das Feedback, das wir im Entwurfsprozess des Verhaltenskodex geben.

Cookie	Dauer	Beschreibung
connect.sid	1 Tag	Dieses Cookie wird zur Authentifizierung und zur sicheren Anmeldung verwendet. Es registriert die Anmeldeinformationen.
cookielawinfo-checkbox-werbung	1 Jahr	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt und wird verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie "Werbung" zu erfassen.
cookielawinfo-checkbox-analyse	1 Jahr	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt und wird verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie „Analytics“ aufzuzeichnen.
cookielawinfo-checkbox-funktional	1 Jahr	Das Cookie wird vom GDPR Cookie Consent Plugin gesetzt, um die Benutzereinwilligung für die Cookies in der Kategorie „Funktional“ aufzuzeichnen.
cookielawinfo-checkbox-notwendig	1 Jahr	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt und wird verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie "Notwendig" aufzuzeichnen.
cookielawinfo-checkbox-andere	1 Jahr	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt und dient dazu, die Benutzereinwilligung für Cookies in der Kategorie „Sonstiges“ zu speichern.
cookielawinfo-checkbox-leistung	1 Jahr	Dieses vom GDPR Cookie Consent Plugin gesetzte Cookie wird verwendet, um die Benutzereinwilligung für Cookies in der Kategorie "Leistung" zu speichern.
viewed_cookie_policy	1 Jahr	Das Cookie wird vom Plugin GDPR Cookie Consent gesetzt, um zu speichern, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es werden keine personenbezogenen Daten gespeichert.

Cookie	Dauer	Beschreibung
COMPASS	1 Stunden	Keine Beschreibung
foo	niemals	Keine Beschreibung verfügbar.
loglevel	niemals	Keine Beschreibung verfügbar.

Cookie	Dauer	Beschreibung
NID	6 Monate	Das von Google gesetzte NID-Cookie wird zu Werbezwecken verwendet; um zu begrenzen, wie oft der Nutzer eine Anzeige sieht, um unerwünschte Anzeigen stummzuschalten und um die Wirksamkeit von Anzeigen zu messen.
VISITOR_INFO1_LIVE	5 Monate 27 Tage	Ein von YouTube gesetztes Cookie zur Messung der Bandbreite, das bestimmt, ob der Benutzer die neue oder alte Player-Oberfläche erhält.
YSC	Session	YSC-Cookie wird von Youtube gesetzt und wird verwendet, um die Aufrufe von eingebetteten Videos auf Youtube-Seiten zu verfolgen.
yt-remote-verbundene-Geräte	niemals	YouTube setzt dieses Cookie, um die Videoeinstellungen des Benutzers zu speichern, der eingebettete YouTube-Videos verwendet.
yt-remote-geräte-id	niemals	YouTube setzt dieses Cookie, um die Videoeinstellungen des Benutzers zu speichern, der eingebettete YouTube-Videos verwendet.
yt.innertube :: nextId	niemals	Dieses von YouTube gesetzte Cookie registriert eine eindeutige ID, um Daten darüber zu speichern, welche Videos von YouTube der Benutzer gesehen hat.
yt.innertube :: Anfragen	niemals	Dieses von YouTube gesetzte Cookie registriert eine eindeutige ID, um Daten darüber zu speichern, welche Videos von YouTube der Benutzer gesehen hat.

Cookie	Dauer	Beschreibung
_ga	2 Jahre halten.	Das von Google Analytics installierte _ga-Cookie berechnet Besucher-, Sitzungs- und Kampagnendaten und verfolgt auch die Site-Nutzung für den Analysebericht der Site. Das Cookie speichert Informationen anonym und weist eine zufällig generierte Nummer zu, um eindeutige Besucher zu erkennen.
_ga_TTP6ES223J	2 Jahre halten.	Dieses Cookie wird von Google Analytics installiert.
_gid	1 Tag	Das von Google Analytics installierte _gid-Cookie speichert Informationen darüber, wie Besucher eine Website nutzen, und erstellt gleichzeitig einen Analysebericht über die Leistung der Website. Einige der gesammelten Daten umfassen die Anzahl der Besucher, ihre Quelle und die Seiten, die sie anonym besuchen.
ZUSTIMMUNG	2 Jahre halten.	YouTube setzt dieses Cookie über eingebettete Youtube-Videos und registriert anonyme statistische Daten.
vuid	2 Jahre halten.	Vimeo installiert dieses Cookie, um Tracking-Informationen zu sammeln, indem es eine eindeutige ID zum Einbetten von Videos auf der Website festlegt.

Cookie	Dauer	Beschreibung
__cf_bm	30 Мinuten	Dieses von Cloudflare gesetzte Cookie wird zur Unterstützung von Cloudflare Bot Management verwendet.
S	1 Stunden	Wird von Yahoo zur Bereitstellung von Anzeigen, Inhalten oder Analysen verwendet.
sp_landung	1 Tag	Das sp_landing wird von Spotify gesetzt, um Audioinhalte von Spotify auf der Website zu implementieren, und registriert auch Informationen zur Benutzerinteraktion in Bezug auf die Audioinhalte.
sp_t	1 Jahr	Das sp_t-Cookie wird von Spotify gesetzt, um Audioinhalte von Spotify auf der Website zu implementieren, und registriert auch Informationen zur Benutzerinteraktion in Bezug auf die Audioinhalte.

Ein erster Entwurf

Transparenz und Urheberrecht

Weitere Artikeln