TDM, prawo autorskie i AI – co oznacza decyzja ZAiKS-u?

Spis treści

W grudniu 2024 roku ZAiKS ogłosił, że dokonuje tzw. „opt-outu”, czyli zastrzega reprezentowane przez siebie prawa do utworów na potrzeby tzw. eksploracji tekstów i danych („TDM”, od ang. text and data mining), czyli zautomatyzowanej techniki analizy danych mającej na celu wygenerowanie wzorców, tendencji, korelacji i innych informacji. TDM wykorzystywana jest m.in. na potrzeby uczenia systemów AI na chronionych utworach w oparciu. Co to właściwie oznacza?

‍📌TDM – text and data mining

Termin „text and data mining” pochodzi z lat 90., kiedy internet składał się głównie z tekstu i pojedynczych danych innego rodzaju. TDM oznacza automatyczną eksplorację i przetwarzanie danych opublikowanych w sieci przez użytkowników.

W kontekście systemów sztucznej inteligencji zebrane dane stają się integralną częścią procesu trenowania tych systemów. Przykładowo, usługa AI generująca muzykę musiała „nauczyć się” na prawdziwych, stworzonych przez ludzi utworach muzycznych.

💡Dozwolony użytek TDM

Boty, czyli programy przeszukujące internet, mogą zbierać dane z sieci niemal bez ograniczeń. Aby ułatwić korzystanie z botów na potrzeby zautomatyzowanej analizy ogromnych zasobów danych w polskim prawie, na wzór rozwiązań europejskich wprowadzono wyjątek od prawa autorskiego, który pozwala na zwielokrotnianie utworów przez boty w ramach analizy TDMbez zgody autora. Nazywamy to dozwolonym użytkiem dla TDM.

  • Ustawa o prawie autorskim i prawach pokrewnych przewiduje dwa rodzaje dozwolonego użytku dla TDM:
  • Dozwolony użytek na potrzeby badawcze – mogą z niego korzystać wyłącznie organizacje badawcze i instytucje dziedzictwa kulturowego.
  • Dozwolony użytek dla pozostałych celów, w tym komercyjnych – dotyczy m.in. firm wykorzystujących zautomatyzowaną analizę danych do celów biznesowych. W tym przypadku można korzystać z chronionych prawem autorskim danych na potrzeby TDM pod warunkiem, że „właściciel” tych praw nie dokonał ich zastrzeżenia w odniesieniu do eksploracji tekstów i danych.

Prostymi słowami: jeśli po skutecznym zastrzeżeniu uprawniony z tytułu praw autorskich nie wyrazi zgody, to nie można używać uzyskanych w ramach TDM danych z jego utworów np. do trenowania modeli generatywnej AI. 

👉Opt-out

Wraz z rozwojem technologii generatywnej AI, uprawnieni z tytułu praw do utworów chronionych prawem autorskim, jak i organizacje ich reprezentujące, zaczęli oficjalnie zgłaszać zastrzeżenia od dozwolonego użytku dla celów TDM. Dokonanie takiego zastrzeżenia to właśnie opt-out.

Dlaczego dokonuje się opt-outów?

  • Bez dozwolonego użytku korzystanie z danych chronionych prawem autorskim bez zgody twórców narusza ich prawa. Dokonanie opt-outu jest krokiem, który ma na celu:
  • po pierwsze, wstrzymać bezumowne korzystanie z danych przez firmy AI,
  • po drugie, wypracować praktykę rynkową licencjonowania, czyli pobierania tantiem (wynagrodzeń) za korzystanie z utworów chronionych prawem autorskim, tak jak to z reguły ma miejsce przy każdej eksploatacji utworów.

Bez zgłoszenia opt-outu twórcy nie mają podstaw do dochodzenia wynagrodzenia od firm, które wykorzystały ich utwory do trenowania komercyjnych systemów AI w oparciu o techniki TDM. Jeśli nie chcemy, aby nasze utwory podlegały automatycznym technikom analizy i przetwarzania, musimy to wyraźnie zastrzec w sposób umożliwiający odczytanie tego przez programy dokonujące analizy TDM.

📝Dane jako paliwo dla sztucznej inteligencji

Systemy generatywnej sztucznej inteligencji nie mogą istnieć bez danych. Muzyczne AI nie istnieje bez muzyki. Większość treści, na których takie systemy zostały wytrenowane, pozyskano w oparciu o techniki eksploracji tekstów i danych. W obecnym stanie prawnym zastrzeżenie praw do celów TDM jest niezbędnym warunkiem ubiegania się o wynagrodzenie autorskie.

Więcej informacji o opt-oucie ZAiKS-u można znaleźć na stronie: www.zaiks.org.pl/ai

Zarejestruj utwór w ZAiKS-ie

Podsumowanie

TDM (Text and Data Mining) to zautomatyzowana technika analizy danych, wykorzystywana m.in. do trenowania systemów sztucznej inteligencji na dużych zbiorach danych, w tym utworach chronionych prawem autorskim.

W polskim prawie, podobnie jak w unijnym, istnieje wyjątek od prawa autorskiego, który pozwala na korzystanie z utworów do celów TDM bez zgody autora – tzw. dozwolony użytek TDM.

Wyróżniamy dwa rodzaje dozwolonego użytku TDM: na potrzeby badań naukowych (dla instytucji badawczych i dziedzictwa kulturowego) oraz na pozostałe cele, w tym komercyjne (np. przez firmy AI).

Dozwolony użytek komercyjny jest warunkowy – można z niego korzystać tylko wtedy, gdy właściciel praw autorskich nie zastrzegł swoich utworów przed TDM (czyli nie dokonał opt-outu).

Opt-out to formalne zastrzeżenie praw do utworu, które wyłącza możliwość jego wykorzystania w analizie TDM bez zgody twórcy lub organizacji go reprezentującej.

ZAiKS w grudniu 2024 r. ogłosił opt-out, czyli zakaz wykorzystania reprezentowanych przez siebie utworów w ramach TDM do celów komercyjnych, takich jak trenowanie AI.

Celem opt-outu jest ochrona interesów twórców oraz doprowadzenie do sytuacji, w której firmy komercyjne muszą zawierać licencje i płacić za wykorzystanie chronionych utworów.

Bez opt-outu twórcy nie mają podstaw prawnych do żądania wynagrodzenia od firm wykorzystujących ich dzieła w ramach TDM.

Skuteczne zastrzeżenie praw (opt-out) musi być technicznie możliwe do odczytania przez maszyny – np. poprzez metadane lub pliki robots.txt

Rozwój AI wymaga danych, ale też respektowania praw twórców – opt-out ZAiKS-u to ważny krok w kierunku równowagi między innowacją a ochroną własności intelektualnej.

Jerzy Łabuda
Brakuje odpowiedzi na twoje pytanie?
Zaproponuj temat kolejnego artykułu!

Przydatne dokumenty

Instrukcja zgłaszania utworów w zaiks.online
Statut stowarzyszenia Autorów ZAiKS
Ustawa o prawie autorskim i prawach pokrewnych
No items found.