W grudniu 2024 roku ZAiKS ogłosił, że dokonuje tzw. „opt-outu”, czyli zastrzega reprezentowane przez siebie prawa do utworów na potrzeby tzw. eksploracji tekstów i danych („TDM”, od ang. text and data mining), czyli zautomatyzowanej techniki analizy danych mającej na celu wygenerowanie wzorców, tendencji, korelacji i innych informacji. TDM wykorzystywana jest m.in. na potrzeby uczenia systemów AI na chronionych utworach w oparciu. Co to właściwie oznacza?
📌TDM – text and data mining
Termin „text and data mining” pochodzi z lat 90., kiedy internet składał się głównie z tekstu i pojedynczych danych innego rodzaju. TDM oznacza automatyczną eksplorację i przetwarzanie danych opublikowanych w sieci przez użytkowników.
W kontekście systemów sztucznej inteligencji zebrane dane stają się integralną częścią procesu trenowania tych systemów. Przykładowo, usługa AI generująca muzykę musiała „nauczyć się” na prawdziwych, stworzonych przez ludzi utworach muzycznych.
💡Dozwolony użytek TDM
Boty, czyli programy przeszukujące internet, mogą zbierać dane z sieci niemal bez ograniczeń. Aby ułatwić korzystanie z botów na potrzeby zautomatyzowanej analizy ogromnych zasobów danych w polskim prawie, na wzór rozwiązań europejskich wprowadzono wyjątek od prawa autorskiego, który pozwala na zwielokrotnianie utworów przez boty w ramach analizy TDMbez zgody autora. Nazywamy to dozwolonym użytkiem dla TDM.
- Ustawa o prawie autorskim i prawach pokrewnych przewiduje dwa rodzaje dozwolonego użytku dla TDM:
- Dozwolony użytek na potrzeby badawcze – mogą z niego korzystać wyłącznie organizacje badawcze i instytucje dziedzictwa kulturowego.
- Dozwolony użytek dla pozostałych celów, w tym komercyjnych – dotyczy m.in. firm wykorzystujących zautomatyzowaną analizę danych do celów biznesowych. W tym przypadku można korzystać z chronionych prawem autorskim danych na potrzeby TDM pod warunkiem, że „właściciel” tych praw nie dokonał ich zastrzeżenia w odniesieniu do eksploracji tekstów i danych.
Prostymi słowami: jeśli po skutecznym zastrzeżeniu uprawniony z tytułu praw autorskich nie wyrazi zgody, to nie można używać uzyskanych w ramach TDM danych z jego utworów np. do trenowania modeli generatywnej AI.
👉Opt-out
Wraz z rozwojem technologii generatywnej AI, uprawnieni z tytułu praw do utworów chronionych prawem autorskim, jak i organizacje ich reprezentujące, zaczęli oficjalnie zgłaszać zastrzeżenia od dozwolonego użytku dla celów TDM. Dokonanie takiego zastrzeżenia to właśnie opt-out.
Dlaczego dokonuje się opt-outów?
- Bez dozwolonego użytku korzystanie z danych chronionych prawem autorskim bez zgody twórców narusza ich prawa. Dokonanie opt-outu jest krokiem, który ma na celu:
- po pierwsze, wstrzymać bezumowne korzystanie z danych przez firmy AI,
- po drugie, wypracować praktykę rynkową licencjonowania, czyli pobierania tantiem (wynagrodzeń) za korzystanie z utworów chronionych prawem autorskim, tak jak to z reguły ma miejsce przy każdej eksploatacji utworów.
Bez zgłoszenia opt-outu twórcy nie mają podstaw do dochodzenia wynagrodzenia od firm, które wykorzystały ich utwory do trenowania komercyjnych systemów AI w oparciu o techniki TDM. Jeśli nie chcemy, aby nasze utwory podlegały automatycznym technikom analizy i przetwarzania, musimy to wyraźnie zastrzec w sposób umożliwiający odczytanie tego przez programy dokonujące analizy TDM.
📝Dane jako paliwo dla sztucznej inteligencji
Systemy generatywnej sztucznej inteligencji nie mogą istnieć bez danych. Muzyczne AI nie istnieje bez muzyki. Większość treści, na których takie systemy zostały wytrenowane, pozyskano w oparciu o techniki eksploracji tekstów i danych. W obecnym stanie prawnym zastrzeżenie praw do celów TDM jest niezbędnym warunkiem ubiegania się o wynagrodzenie autorskie.
Więcej informacji o opt-oucie ZAiKS-u można znaleźć na stronie: www.zaiks.org.pl/ai
Podsumowanie
TDM (Text and Data Mining) to zautomatyzowana technika analizy danych, wykorzystywana m.in. do trenowania systemów sztucznej inteligencji na dużych zbiorach danych, w tym utworach chronionych prawem autorskim.
W polskim prawie, podobnie jak w unijnym, istnieje wyjątek od prawa autorskiego, który pozwala na korzystanie z utworów do celów TDM bez zgody autora – tzw. dozwolony użytek TDM.
Wyróżniamy dwa rodzaje dozwolonego użytku TDM: na potrzeby badań naukowych (dla instytucji badawczych i dziedzictwa kulturowego) oraz na pozostałe cele, w tym komercyjne (np. przez firmy AI).
Dozwolony użytek komercyjny jest warunkowy – można z niego korzystać tylko wtedy, gdy właściciel praw autorskich nie zastrzegł swoich utworów przed TDM (czyli nie dokonał opt-outu).
Opt-out to formalne zastrzeżenie praw do utworu, które wyłącza możliwość jego wykorzystania w analizie TDM bez zgody twórcy lub organizacji go reprezentującej.
ZAiKS w grudniu 2024 r. ogłosił opt-out, czyli zakaz wykorzystania reprezentowanych przez siebie utworów w ramach TDM do celów komercyjnych, takich jak trenowanie AI.
Celem opt-outu jest ochrona interesów twórców oraz doprowadzenie do sytuacji, w której firmy komercyjne muszą zawierać licencje i płacić za wykorzystanie chronionych utworów.
Bez opt-outu twórcy nie mają podstaw prawnych do żądania wynagrodzenia od firm wykorzystujących ich dzieła w ramach TDM.
Skuteczne zastrzeżenie praw (opt-out) musi być technicznie możliwe do odczytania przez maszyny – np. poprzez metadane lub pliki robots.txt
Rozwój AI wymaga danych, ale też respektowania praw twórców – opt-out ZAiKS-u to ważny krok w kierunku równowagi między innowacją a ochroną własności intelektualnej.