Імовірність захоплення людства штучним інтелектом і перспективи еволюції технології. Інтерв'ю з науковцем
У 2023 році найпопулярнішим словом за версією словника англійської мови Collins стала абревіатура ШІ (штучний інтелект). Популярність цього терміну пояснюється бумом генеративних моделей, які заполонили інформаційний простір.
Про ШІ говорять усі: ЗМІ намагаються розібратися з популярністю технології, економісти дискутують про нього як про чинник четвертої промислової революції, а політики пропонують закони для його регулювання.
Однак попри жваву дискусію для більшості людей ШІ залишається чорною скринькою. З холодним розумом за цим спостерігають лише науковці, адже те, що всі називають революцією, для них – еволюція.
"Я вже 20 років у сфері ШІ. Моя магістерська робота була в цьому напрямку. Як викладач, як дослідник і людина, дотична до написання політик, вважаю, що те, що ми зараз чуємо про експоненціальний вибух розвитку ШІ та технологічну сингулярність, є перебільшенням", – розповідає керівник магістерської програми з комп'ютерних наук за напрямом Data Science Українського католицького університету та очільник комітету з питань розвитку сфери ШІ при Мінцифри Олексій Молчановський.
Чим насправді є штучний інтелект поза гучними заголовками та маркетинговим впливом?
Про розвиток штучного інтелекту та його перспективи у 2024 році
— Якщо уявити шкалу розвитку технологій ШІ, де 0 – це поява перших обчислювальних машин, які здатні доводити теореми, а 10 – це система, яка може виконати завдання з будь-якої сфери подібно до людського інтелекту, то де ми перебуваємо зараз?
— При всій повазі до запитання воно намагається спростити багатовимірну історію розвитку ШІ до однієї шкали. Коли ми говоримо про загальний штучний інтелект (artificial general intelligence, AGI), яким лякають людей, то в експертному колі його появу очікують нескоро.
Натомість, якщо розкласти технології ШІ на окремі застосунки, які сфокусовані на конкретних завданнях, то побачимо, що все більше і більше завдань ці технології вирішують краще, ніж людина. Це як з калькулятором, який рахує набагато краще, ніж я, але це не означає що він інтелектуально мене переміг.
Ми бачимо, як ШІ добре пише та перекладає тексти, але до повністю автономного суб'єкта, який збудований з кремнію та працює на електроенергії, дуже далеко. За вашою шкалою ми перебуваємо на рівні 2, але якщо розкладемо на окремі завдання, тоді буде 9.
— Можна чути чимало дискусій про інтеграцію функціоналу різних ШІ в один агент. Чи можливий варіант, що цю ідею визнають нереалістичною?
— Воно так і буде. Потрібно розуміти, що розвиток цих технологій не має необмеженого фінансування. До прикладу, пік інвестицій у сфері ШІ був у 2021 році, останні два роки ми бачимо спад.
Для створення такого універсального агента потрібно багато коштів та зусиль, бізнесу це не вигідно. Це класний сюжет для фантастичних фільмів, але з точки зору економіки та функціонування суспільства я мало вірю в те, що ми будемо вкладати в це ресурси.
У 2024 році понад 2 мільярди людей проголосують. Уже зараз всі хвилюються через ШІ. Що відбувається?
— У 2022 році ми побачили LLM, які могли вдало генерувати текст, у 2023 році – генеративний ШІ, який непогано працює із зображеннями та аудіо. Які технології ШІ матимуть успіх у 2024 році?
— Зараз буде багато інвестуватися в те, щоб перейти від зображень до відео. Чому це важливо? Якщо читачі спробують за допомогою генеративного ШІ створити картинку, де будуть дві людини, які сидять за столом і спілкуються, і потім захочуть, щоб одна з них підняла праву руку, то система цього не зробить.
Річ у тім, що ШІ не розуміє того, що називається "модель світу". Система розпізнає взаємозв'язки між окремими пікселями, але не розуміє їх. Це означає, що створити відео, яке динамічно відображає різні способи спілкування людей, є складним завданням, яке потребує значних функціональних зусиль.
Це як з ChatGPT чи іншими чат-ботами на мовних моделях. У них є контекстне вікно, це певна кількість символів (токенів), яку ChatGPT тримає у своїй пам'яті, спілкуючись з вами. У разі виходу за межі цього вікна він забуває, про що була розмова на початку і починає галюцинувати чи навіть суперечити сам собі.
Крім того, у 2024 році ми побачимо використання генеративного ШІ в нових нішах, серед яких – журналістика, юриспруденція та генерація ліків. Остання ніша не нова, але зараз отримала додаткове підсилення.
Також ми побачимо певне розчарування в цій технології, оскільки те, що я спостерігаю, – штучно створена бульбашка надочікувань продуктивності цих систем. На тестових прикладах нейромережа показує хороші результати, що дозволяє створити стартапи та залучити перших клієнтів, але коли справа доходить до витривалішої роботи, коли вам треба на масштабі показувати результати, виникають проблеми.
Наприклад, якщо хтось з читачів закине це інтерв'ю в ChatGPT і попросить зробити коротке резюме, все буде ОК. Навіть якщо він упустить кілька деталей – це невелика ризикова історія. Натомість якщо юрист за допомогою ШІ спробує написати якийсь специфічний договір, ціна помилки одразу стає високою.
— В історії було кілька "зим ШІ" (період уповільнення або відсутності значного прогресу в дослідженнях та розробці – ЕП). Чи правильно вважати, що успіх останніх моделей та швидка інтеграція ШІ з економікою назавжди відкинула можливість повернення такого періоду?
— Треба розуміти, що сам термін "штучний інтелект" першочергово маркетинговий. Під ним розуміється дуже багато різних технологій. Деякі з них, як-от генеративний ШІ, можуть викликати розчарування.
Основним рушієм сучасного ШІ є машинне навчання, глибинне навчання, яке, скоріш за все, залишиться з нами. Тобто я думаю, що там "зими" не буде. Ми виходимо на те, що різні технології ШІ будуть з нами так само, як електрика, освітлення, інтернет, wi-fi чи мобільний зв'язок.
Про "повстання машин" та проблеми штучного інтелекту
— Роздуми про ШІ зводяться до теми повстання машин. Імовірно, це зумовлено кінематографом. Чи потрібно хвилюватися через те, що розвиток технологій призведе до такого повстання?
— Хвилюватися треба, але не з цієї причини. Імовірність сценарію, у якому ШІ захопить людство, я оцінюю менше за один відсоток.
— На цьогорічному ВЕФ у Давосі прозвучала теза, що даних в інтернеті недостатньо для навчання нових моделей. Чи може криза даних зупинити розвиток ШІ?
— Думаю, це призупинить такий стрімкий розвиток, як в останні два роки. Цю проблему намагаються розв'язувати за допомогою синтетичних даних (створені шляхом компʼютерної генерації, використовуються для тренування і тестування систем ШІ – ЕП). Статистика говорить, що для тренування нових моделей ШІ вже використовується більше синтетичних даних, ніж природних.
Окремою проблемою є навчання LLM, а саме брак якісних текстів. Щоб генерувати неякісні тексти, великого розуму не потрібно. А звідки взяти якісні? Уже бачимо, що тексти, згенеровані ШІ, потрапляють в інтернет і наступні покоління LLM вчаться на них. Таким чином створюється зворотний зв'язок, який підсилює, наприклад, упередження та помилки, які були в згенерованих текстах.
Людському ж інтелекту не потрібно читати весь інтернет, аби професійно розв'язувати задачі. Власне, науковці працюють над тим, щоб зменшити обсяги даних, необхідні для якісних моделей.
— Процес навчання ШІ дорогий і тривалий, а в результаті отримуємо моделі, здатні непропорційно якісно виконувати завдання. Наприклад, ШІ може створити прекрасний пейзаж, але досі виникають проблеми з людськими пальцями – їх іноді більше. Чому так відбувається?
— Як я вже казав, ці моделі не мають моделі світу. У нас з вами вона є, тому ми базово розуміємо, що в людини є голова, руки, ноги, п’ять пальців на кожній кінцівці. Крім того, ми маємо уявлення про інерцію. Якщо я опущу смартфон, то приблизно розумітиму, як він рухатиметься. Людина вивчає це, взаємодіючи зі світом.
Сучасний ШІ, заснований на машинному навчанні, позбавлений цього підходу. Він працює тільки на рівні спостережень. Щоб навчити його малювати, йому показали мільйони картинок, на яких він натренувався, що піксель такого кольору в такій позиції як правило поєднується з пікселем такого кольору в такій позиції. Тому коли ви просите намалювати руку, він малює набір пікселів, який людина розпізнає як руку.
Впевненість "білих комірців" тане на очах. Чому штучний інтелект став центральною темою Давоса?
— Ще однією проблемою генеративних ШІ, які працюють з текстом, є "галюцинації". Чому вони виникають і чи є розуміння, як можна розв'язувати цю проблему?
— Це та сама проблема з моделлю світу. Будь-яка LLM, генеруючи текст на конкретний запит, підбирає послідовно слова, статистично близько розташовані до цих слів у текстах, на яких вона навчалася. Це те, що англійською називається pattern recognition – розпізнавання образів.
Тому ШІ нічого не розуміє про контекст і справжність. Він оперує на рівні так званих токенів як набору символів, що такі слова, як правило, ішли з такою послідовністю слів.
Наприклад, слова "Київ" та "Україна" в текстах, які зустрічалися моделі, дуже часто були близькі між собою і тому вони мають поруч бути. Однак система не розуміє, що таке столиця чи що таке місто. Через це ШІ зможе обґрунтувати і пояснити будь-яке вигадане вами слово, бо він не вміє відмовляти.
Зараз цю проблему розв'язують. Один з варіантів – надати ШІ доступ до баз даних з реальними фактами. Для цього нам треба розуміти, як порівнювати ці факти, оскільки це не так просто, як може здатися.
Крім того, генеративний ШІ за своєю побудовою не здатний гарантувати логічну несуперечність того, що він виводить. Тому інженери працюють над тим, що подружити генеративний ШІ з ще одним напрямком у цій сфері – математичною логікою. Поєднання цих двох напрямків – це ключ до безпечного та ефективного використання ШІ в медицині та інших сферах високого ризику.
— Бум довкола ШІ зумовлений трьома факторами: даними, обчислювальними потужностями та алгоритмами. Останні ґрунтуються на алгоритмах 1960-1970-х років. Які фактори потрібні для якісної зміни?
— У чому привабливість науки? Ми не знаємо, що в нас за рогом. Так сталося, що у 2012 році ці три фактори зійшлися докупи, унаслідок чого кількість перейшла в якість. Зараз додатковим фактором можуть стати енергетичні ресурси.
Або приклад з вбудованим ШІ, який почне активно взаємодіяти зі світом. Це теж небезпечна історія, адже що означає взаємодіяти зі світом? Уже зараз компанії, які створюють чат-боти на основі ШІ, можуть таке зробити. Проте ми як користувачі цього не захочемо, бо тоді ШІ отримає певну агентність. Він ставитиме над нами експерименти, видаючи різні відповіді для перевірки власних гіпотез.
— Які ви бачите нові неочевидні сфери застосування ШІ?
— Тут відповідь проста. Ви можете застосовувати ШІ там, де у вас достатньо унікальних і цікавих даних. Інколи подібне запитання ставлять про Україну: у якій сфері тут розвивати ШІ? Потрібно дивитися, де наша нація та держава мають цікаві дані.
— Зараз це війна.
— Так, але не тільки. Це можуть бути агросектор, енергетика, логістика.
— Наскільки людство далеке від появи AGI (artificial general intelligence – загальний ШІ)?
— Дуже далеке. Я не вірю, що він взагалі досяжний. Щодо цього напрямку є багато запитань. Що ми розуміємо під загальним штучним інтелектом? Якщо він має бути подібним до людини, то до якої? До нас з вами, до школяра чи нобелівського лауреата? На кого ми орієнтуємося? Таких питань насправді дуже багато.
Про ризики штучного інтелекту та можливості для України
— Які ризики використання ШІ найбільш суттєві?
— Найбільший ризик – це використання ШІ для маніпуляцій людською свідомістю, поширення згенерованих моделлю фейків для руйнування демократичних інституцій. Розпізнавати діпфейки стає дедалі важче.
Друге – кібербезпека. Припускаю, що кібератака на "Київстар" або подібні випадки відбуваються за допомогою ШІ.
Третій – концентрація найпотужніших ШІ у руках корпорацій. Як наслідок, ШІ перестав бути демократичним. Уже зараз, щоб натренувати модель рівня GPT чи LLaMA, жодний університет у світі не має відповідних потужностей. Нам стає важче піддати сумніву і критикувати те, що створюють корпорації, оскільки ми банально не знаємо, що "під капотом" у моделей OpenAI.
— Чи настане момент, коли ми не зможемо втрутитися в роботу ШІ, щоб внести зміни?
— Це складне питання, оскільки немає одного ШІ, який захопив світ, і достатньо його просто вимкнути з розетки. Натомість можемо припустити, що ми почали використовувати систему, на якій завʼязано багато процесів. У випадку, коли ми побачимо помилки, їхнє виправлення суто економічно може бути більш вартісним, ніж просто перестати користуватися конкретним ШІ.
У 2015 році в Google стався цікавий випадок. Її сервіс "Google фото", куди завантажуються знімки із смартфонів, використовує ШІ для автоматичного сортування зображень. ШІ може визначити, де пейзаж, а де людина. Одного разу ШІ підписав фото з темношкірими людьми словом "горила". Це трапилося, бо в компанії не було достатньо якісних даних, щоб натренувати систему розпізнавати темношкірих людей.
Компанія не змогла це виправити, бо це "чорна скринька". Десь у системі є нейрон чи кілька нейронів, які активізувалися, коли побачили такий набір пікселів. У результаті компанії довелося заборонити маркувати фото підписом "горила".
"Війну виграють технології". Як штучний інтелект допоможе перемогти у війні з РФ?
— Ви також є головою комітету з питань розвитку сфери ШІ при Мінцифри. Який шлях у контексті сучасних дискусій про регулювання ШІ найбільш релевантний для України?
— Дискусії повʼязані з регулюванням ШІ, зокрема новим законодавством ЄС, яке вважають жорстким. Дискусії стосуються того, як це законодавство вплине на ринок і його конкурентоздатність.
Одна сторона переконує, що нові норми зроблять ринок ЄС менш привабливим, ніж ринок США. Інша сторона стверджує, що ринок Євросоюзу дуже привабливий через його розміри і компанії все одно захочуть туди зайти попри жорсткіші закони. Якщо ж вони не захочуть це робити, то в ЄС є свої компанії.
Україна рухається в ЄС. Коли ми станемо членами Євросоюзу, то будемо змушені адаптувати наше законодавство до AI Act. Тому бігти наввипередки, створюючи закон про ШІ, немає сенсу, у нас не такий розвинений ринок.
В основі впровадження регулювання ШІ лежить bottom-up-підхід. Він передбачає рух від меншого до більшого: спочатку надання бізнесу інструменту для підготовки до вимог, а після цього буде ухвалений закон.
— Яких ресурсів бракує Україні для створення потужних систем ШІ?
— Найменша спроможність – у технічних ресурсах, це основний gamechanger в індустрії. Ти можеш мати дані та алгоритми, але якщо в тебе немає 100 чи 1000 графічних карток ("відеокарт" – ЕП), ти не отримаєш цю модель, ти будеш тренувати її роками. В Україні немає таких ресурсів, обчислювальний кластер нашого університету має близько 15 таких карток. Ми можемо подвоїти це число, проте це все одно дуже мало.
Я б хотів побачити, щоб у нас з’явився обчислювальний центр, куди і науковці, і бізнес з демократичними принципами могли отримати доступ. Крім того, не менш важливо створити в Україні власний генеративний ШІ.
Багато хто з нас користується ChatGPT, але ми до кінця не знаємо, скільки там українських текстів, на яких він був натренований. Проте їх однозначно менше, ніж російських. Можливо, в десятки чи навіть у сотні разів. Це створює упередження, яке ми спостерігаємо у світі щодо України. Подібна ситуація спостерігається і в освіті, де школярі все частіше використовують генеративні ШІ для написання домашніх завдань та вивчення світу.
Якщо ми як нація не запропонуємо власний продукт, який не буде упередженим до українців, який буде відображати світогляд, закладений у нашому законодавстві, Конституції та історії, це може становити безпековий ризик для нації. Цей продукт ніхто не створить за нас. Його повинні розробити українці: чи то академія, чи то суспільство, чи то держава, чи то свідома корпорація. Це мають зробити саме українці.