Czy twórcy modeli AI naruszają własność intelektualną?
Rozwój sztucznej inteligencji (AI) budzi coraz większe wątpliwości dotyczące przestrzegania praw własności intelektualnej. Jak zauważa Jakub Witczak w artykule opublikowanym w Tygodniku Gospodarczym Polskiego Instytutu Ekonomicznego, kluczowym problemem jest sposób pozyskiwania danych do trenowania modeli AI.
Ogromne ilości informacji, niezbędne do rozwoju tych technologii, często pochodzą z zewnętrznych stron internetowych, baz danych czy mediów społecznościowych – nierzadko bez wiedzy i zgody ich właścicieli.
Rodzi to spory o legalność tych praktyk, zwłaszcza że zakres regulacji różni się między poszczególnymi krajami
– podkreśla Witczak.
Spadek transparentności i brak jasności
Niepewność prawna oraz obawy deweloperów AI związane z potencjalnymi konsekwencjami naruszenia praw własności intelektualnej skutkują coraz mniejszą przejrzystością w ujawnianiu źródeł danych. Jak podaje raport OECD, „między październikiem 2023 r. a majem 2024 r. poziom transparentności źródeł danych wykorzystywanych na potrzeby trenowania AI miał spaść z 20 proc. do zaledwie 7 proc.”. Taki brak otwartości budzi dodatkowe kontrowersje, zwłaszcza że w zbiorach danych mogą znajdować się treści chronione prawem autorskim.
Sytuacja ta szczególnie dotyka twórców, których prace są wykorzystywane bez ich zgody.
Celowy brak jasności ze strony deweloperów co do pochodzenia danych utrudnia ocenę, jakie prace zostały wykorzystane i tym samym dochodzenie praw przez właścicieli danych
– wskazuje Witczak.
Analiza CRFM, na którą powołuje się autor, ujawnia skalę problemu: „zaledwie 1 na 14 sprawdzonych modeli fundacyjnych ujawniał informacje dotyczące twórców danych, praw autorskich i licencji”.
Spory sądowe i giganci AI pod ostrzałem
Kontrowersje wokół nieuprawnionego wykorzystania danych znajdują odzwierciedlenie w licznych procesach sądowych. Lider rynku, OpenAI, został wielokrotnie pozwany, m.in. przez The New York Times, za rzekome naruszenie praw autorskich. Podobne zarzuty dotyczą Meta, która miała trenować swój model językowy na danych z portalu LibGen – platformy gromadzącej miliony książek i publikacji naukowych wbrew prawu ochrony własności intelektualnej.
Wśród wykorzystanych danych miały się potencjalnie znajdować prace pozywających
– zaznacza Witczak.
Amerykańskie firmy rozwijające AI bronią się, argumentując, że dane chronione są transformowane w procesie tworzenia modeli, a nie powielane, co czyni ich działania legalnymi. Jak relacjonuje Witczak, podmioty te wywierają presję na liberalizację regulacji, wskazując na konieczność utrzymania przewagi technologicznej USA, zwłaszcza w kontekście rywalizacji z Chinami.
Różnice w regulacjach między krajami, transgraniczny charakter pozyskiwania danych oraz brak jednolitych standardów dodatkowo komplikują ocenę legalności i etyczności tych praktyk.
Obecna niepewna sytuacja prawna zdaje się jeszcze silniej faworyzować największe podmioty z branży AI, które są w stanie skutecznie omijać bariery regulacyjne
– zauważa Witczak. W efekcie mniejsze firmy mają trudności z konkurowaniem w tych warunkach, co pogłębia nierównowagę na rynku.
Źródło: Tygodnik Gospodarczy Polskiego Instytutu Ekonomicznego