Война за миллиарды: проблема авторского права и ИИ вышла за рамки обычного плагиата

Игорь Пилипив, Андрей Матяш — 7 мая 2024, 09:15

getty images

Смогут ли медиа сохранить контроль над своими произведениями и как ИИ меняет представление о влиянии на авторское право и интеллектуальную собственность? (укр)

У світі, де можливості штучного інтелекту (ШІ) стрімко розвиваються, його використання в генеруванні контенту призвело до суперечок, подібних битві титанів у грецькій міфології. Однак на відміну від древніх часів це протистояння відбувається не на Олімпі, а в залах судових засідань.

Останнім часом кількість позовів щодо порушення компаніями, які розробляють генеративні моделі ШІ, авторського права збільшується в геометричній прогресії.

З одного боку, медіа, такі як The New York Times, кидають виклик OpenAI та Microsoft, звинувачуючи їх у незаконному використанні свого контенту для навчання генеративних моделей ШІ. З іншого – технологічні гіганти відстоюють своє право на інновації, стверджуючи, що ШІ відкриває нові горизонти для творчості.

Схожі суперечки виникають у музичній та кіноіндустрії, сфері стокових фото. За кожним таким позовом ховається й фінансова претензія на мільярди доларів. Усе це демонструє, що проблема авторського права та ШІ вийшла далеко за рамки звичайного плагіату в тексті і зачіпає інші сфери творчості.

Деякі компанії, такі як OpenAI, шукають альтернативні шляхи розв'язання проблеми, укладаючи угоди з медіа про доступ до їхнього контенту. Це може бути тимчасовим рішенням, але воно не вирішує головних проблем, пов'язаних з авторським правом та ШІ.

Наразі немає чітких правил, які б регулювали використання ШІ та захист інтелектуальної власності. Це призводить до різного трактування ситуації судами в різних країнах та невизначеності для учасників ринку.

Судові позови

Найчастішими позивачами проти компаній, які розробляють генеративні моделі ШІ, є медіа та журналісти, які стверджують, що при навчанні ШІ їхній контент використовувався без дозволу.

Генеративна модель ШІ – це штучний інтелект, який може створювати контент (зображення, музику, відео, код), ґрунтуючись на даних, на яких він був навчений.

Так, наприкінці 2023 року видання The New York Times (NYT) подало до суду на компанії Microsoft та OpenAI, стверджуючи, що вони порушили його авторські права. NYT стало першим великим американським медіа, яке звинуватило творців генеративних моделей ШІ в порушенні авторського права.

Times звинуватило технологічні компанії у використанні його контенту без дозволу для створення ШІ-продуктів, зокрема чат-бота ChatGPT від OpenAI та Copilot від Microsoft. Видання переконує, що ChatGPT подавав чималі частини з різних статей NYT слово в слово як відповіді на запити користувачів.

У позові газета не вимагає конкретної суми компенсації, але стверджує, що OpenAI та Microsoft завдали їй збитків на "мільярди доларів". Крім того, NYT хоче, щоб суд заборонив цим компаніям використовувати її контент і змусив знищити набори даних, які включають її роботи.

Справа досі в суді і наразі не вирішено, чи порушила OpenAI авторські права газети. Проте Times надала ґрунтовні докази копіювання свого контенту і відповідачу буде важко їх спростувати.

Видання The New York Times вирішило провести кордон для контролю використання ШІ

GETTY images

Недавно на OpenAI та Microsoft за порушення авторських прав подали до суду вісім великих американських медіа. Колективний позов від газет, що належать інвестиційному гіганту Alden Global Capital, направили в той же округ, що і NYT. Якщо для розгляду обох справ оберуть одного суддю, скарги можуть об’єднати.

Видання звинувачують компанії в масовому плагіаті: використанні мільйонів статей для тренування ШІ з метою комерціалізації своїх основних продуктів – ChatGPT та Copilot.

У 2023 році дохід OpenAI сягнув 2 млрд дол, хоча у 2022 році цей показник становив лише 28 млн дол. Для порівняння: Google та Meta десятиліття йшли до того, щоб досягти доходу 1 млрд дол. Іншими словами, представники медіа невдоволені тим, що, використавши їхні матеріали під час тренування ChatGPT, OpenAI отримує надприбутки, користуючись популярністю чат-бота.

Корифей Кремнієвої долини: історія "батька" ChatGPT Сема Альтмана

Однак ці претензії є лише частиною ширших вимог до технологічних компаній. Американські видання стверджують, що OpenAI та Microsoft видаляють дані про журналістів з відповідей, згенерованих чат-ботом. Крім того, газети звинувачують компанії в репутаційних втратах через "галюцинації" ШІ. У позові йдеться, що ChatGPT вигадав публікацію в Denver Post про дослідження, які нібито доводили, що куріння лікує від астми.

Судові процеси довкола авторського права та ШІ виходять за межі претензій медіа щодо використання їх контенту. У всіх сферах, де ШІ може генерувати контент, виникають претензії щодо плагіату та незаконного використання продукту. Це стосується зображень, музики, віршів, прозових творів та іншого контенту.

Серед них є справа фотоагенції Getty Images, що продає стокові зображення, та компанії Stability AI. Позивач стверджує, що відповідач під час навчання своєї моделі Stable Diffusion, здатної генерувати малюнки, без дозволу та оплати використав понад 12 млн авторських стокових зображень.

У позові Getty Images ідеться про шалену виплату – до 150 тис дол за кожне порушення, що акумулюється в 1,8 трлн дол. Суд ще триває і поки не вирішено, чи визнають Stability AI винною в порушенні авторських прав.

Змінюйся або помри. Як штучний інтелект став невідʼємною частиною світової економіки

У музичній індустрії компанії Concord Music Group, Universal Music Group та ABKCO Music подали позов проти Anthropic PBC, яка випустила ШІ-модель Claude. Позивачі звинувачують фірму в повторенні великих частин, а іноді повністю, авторських пісенних текстів для задоволення запитів користувачів. Вони вимагають 75 млн дол відшкодування за порушення авторських прав.

Ці судові процеси є тільки частиною загального тренду. Наразі у світі не існує законодавства, яке б регулювало такі спори, адже закони про авторське право та інтелектуальну власність у контексті ШІ лише пишуться.

Через це суди по-різному підходять до розв’язання справ, а кожне їх рішення може вплинути на індустрію. У випадку задоволення вимог медіа останні можуть отримати новий спосіб доходу. Проте не всі компанії обирають шлях судового протистояння за права на свою інтелектуальну власність.

Судяться не всі

Допоки у світі намагаються розв'язати питання довкола використання ШІ чужого контенту, компанії, такі як OpenAI та Google, пропонують укладати угоди з авторами певного контенту.

"Не маючи часу на очікування вироку суду, технологічні компанії шукають альтернативні шляхи доступу до даних. Зокрема, вони укладають угоди з медіа-компаніями", – розповідає юридичний консультант з розвитку правового регулювання ШІ при Мінцифри Олег Дубно.

Найчастіше фінансова сторона таких угод конфіденційна, а договір стосується не всього контенту. У квітні OpenAI та британське інформагентство Financial Times підписали угоду, за якою перша зможе використовувати контент другого для навчання своїх моделей ШІ. Для видання договір сприятиме залученню нових користувачів, бо ChatGPT буде посилатися на FT у відповідях, які базуються на його матеріалах.

Світ у кишені корпорацій. Як техногіганти стали впливовішими за держави

Подібні угоди OpenAI уклала з Associated Press, Axel Springer, Le Monde та Prisa Media. Підписання договорів з технологічними компаніями частково зумовлене складним бізнес-середовищем для медіавидавців. Хоча сторони зазвичай не розголошують фінансову сторону угод, відомо, що платформа Reddit за умовами подібного договору з Google щорічно отримуватиме близько 60 млн дол.

Авторське право і "творчість" ШІ

Коли в листопаді 2022 року OpenAI представила ChatGPT, його можливості створювати текстовий контент вразили багатьох. За менш ніж півтора року компанія представила нову систему ШІ Sora, яка може створювати реалістичне відео на основі текстових запитів користувачів.

Еволюція можливостей моделей OpenAI демонструє, наскільки суттєво за цей час змінилася індустрія. Десятки компаній долучилися до нової гонки в цій сфері. У результаті користувач отримав багато інструментів, які працюють на основі генеративного ШІ.

"Тепер людина може з мінімальними зусиллями згенерувати будь-який твір, зображення, відео, музику, а потім зареєструвати їх як об’єкт авторського права, хоча такий правовий статус має надаватися лише об’єкту, створеному людиною", – розповідає заступниця директора з правових питань Publicis Groupe Ukraine Олена Андрієнко.

Наразі судова практика в жодній державі не може дати однозначної відповіді щодо того, чи може продукт, створений ШІ, захищатися авторським правом. Здебільшого намагання трактувати такі випадки в різних країнах зводяться до того, що контент, створений лише ШІ, не може бути об’єктом авторського права.

"Для того, щоб інститут авторського права був ефективним, він повинен постійно розвивати нові правові режими об’єктів, згенерованих з різним ступенем залученості людини, і нові форми відповідальності. Він також повинен дедалі ширше використовувати технологічні засоби для визначення ступеня оригінальності творів та залученості систем ШІ до їх генерування", – пояснює Андрієнко.

У 2024 році понад 2 мільярди людей проголосують. Уже зараз всі хвилюються через ШІ. Що відбувається?

Уже навіть найбільш консервативні установи, серед яких Бюро авторських прав США (USCO), починають поступово змінювати свої рішення щодо творів, які створювалися за допомогою ШІ.

Недавно USCO погодилося зареєструвати роман 60-річної ветеранки США у відставці Елізи Шупе, яка для його написання активно використовувала ChatGPT. Її заявка була спробою змусити установу змінити свою політику щодо робіт, створених за допомогою ШІ. Зазвичай бюро вимагає від потенційних власників авторських прав виключити такі елементи.

USCO прийняло роман Шупе, але зробило це доволі специфічно. Воно не визнало її автором усього тексту, як заведено для письмових творів. Шупе вважається автором "відбору, координації та упорядкування тексту, згенерованого ШІ". Це означає, що ніхто не може копіювати книгу без її дозволу, але самі речення та абзаци не захищені авторським правом і можуть бути переставлені та перевидані як інша книга.

Український контекст

Попри відсутність гучних справ, в Україні питання ШІ не менш актуальне. "Наразі регулювання ШІ в Україні рухається еволюційним шляхом: від інструментів переважно м’якого права (саморегулювання та спільного регулювання) до права жорсткого на зразок ухвалення відповідних законів", – пояснює Андрієнко.

Саме такі принципи закладені в ідеології дорожньої карти з регулювання ШІ в Україні, яку восени 2023 року представило Мінцифри. Загалом важливо, аби кожна людина відповідально ставилася до наслідків використання ШІ і тим більше – до генерування з його допомогою контенту.

Імовірність захоплення людства штучним інтелектом і перспективи еволюції технології. Інтерв'ю з науковцем

Наразі роботу генеративних моделей частково регулює закон "Про авторське право і суміжні права", який сфокусований передусім на інтелектуальній діяльності людини. Проте в березні 2023 року в ньому зʼявилася ст. 33 (sui-generis або права особливого роду) щодо неоригінальних об’єктів, згенерованих комп’ютером.

"Україна одна з перших у світі ввела таку статтю. Вона встановлює, що субʼєктами права особливого роду на такі неоригінальні об’єкти є особи, яким належать майнові права на компʼютерні програми (ШІ), або особи, що мають ліцензійні права на такі програми", – пояснює Дубно.

Відповідно, права на контент, створений за допомогою ШІ, можуть належати розробникам мовних моделей або користувачам, які володіють підпискою чи ліцензією на користування системою.

Андрій Матяш, керівний партнер юридичної компанії 4В

Ігор Пилипів, журналіст ЕП

штучний інтелект суды