До ворожки не ходи. Як штучний інтелект визначає ймовірність смерті?

П'ятниця, 9 лютого 2024, 07:30 - Олексій Павлиш

Чи хотіли б ви знати, коли помрете? Вчені з Данії та США заявляють, що з допомогою штучного інтелекту наука наближається до того, щоб дати відповідь на це запитання.

Активний розвиток і застосування штучного інтелекту (ШІ), здатного створювати тексти, зображення і копіювати голоси, активно впливає на різні сфери: від медіабізнесу і виборів до прогнозування смерті.

І в останньому, схоже, уже є революційний прогрес: вчені з Данії та США розробили ШІ-модель life2vec, яка, за їхніми словами, передбачила, чи помруть проаналізовані люди протягом 4 років із точністю майже у 80%. Алгоритм на 11% перевершив інші моделі прогнозування, в тому числі актуарні розрахунки, що використовуються в страховій індустрії.

Для розробки і навчання моделі дослідники з Технічного університету Данії, Університету Копенгагена та Північно-Східного університету в Бостоні (Northeastern University) використали величезний масив даних щодо більш ніж 6 мільйонів данців – інформація від місцевого статистичного управління за період з 2008 по 2016 рік містила, зокрема, місце проживання, професію, дохід, травми та історію вагітності.

Із цим алгоритмом, на думку вчених, кожна історія життя – це хроніка передбаченої смерті: ШІ-модель розраховує ймовірність смерті протягом певного періоду, а не точну дату.

Втім є один нюанс: те, що працює в Данії, може не працювати в інших країнах. Попри це, враховуючи потенціал life2vec для прогнозування ризиків, за впливом ШІ на страхову індустрію точно варто поспостерігати, пише FT.

Які дані для навчання ШІ-моделі використали вчені і як вона працює? Чому розробники не хочуть, щоб їхню розробку використовували страховики? І чому поки тримають свій алгоритм у таємниці?

Як працює life2vec

Про "калькулятор смерті" світові ЗМІ почали писати у грудні 2023 року, коли вчені із Данії та США опублікували статтю з деталями свого проєкту в онлайн-журналі Nature Computational Science.

Команда на чолі з професором Технічного університету Данії Суне Леманном розробила ШІ-модель під назвою life2vec, яка працює за принципом чат-бота ChatGPT. Ця модель проаналізувала конкретні дані Статистичного управління Данії щодо віку, стану здоров’я (зокрема, щодо травм та вагітностей), освіту, професію, дохід, місце проживання, життєві події понад 6 мільйонів данців.

Вчені звели соціально-економічні та медичні дані за період з 1 січня 2008 року по 31 грудня 2015 року в єдину хронологічно впорядковану життєву послідовність, зосередившись на віковій категорії 35-65.

Керівник проєкту life2vec Суне Леманн

TEDx Talk

Вони навчили ШІ-модель засвоювати інформацію про життя людей у реченнях на кшталт: "У вересні 2012 року Франциско отримав 20 тисяч крон як охоронець у замку в Ельсінорі", "На третьому курсі навчання він отримав 20 000 датських крон", або "Протягом третього року навчання в середній школі-інтернаті Герміона відвідувала п'ять факультативних занять".

Команда проєкту визначила різні маркери для кожного фрагмента інформації, і всі вони були нанесені на карту у взаємозв'язку один з одним.

"Багато з цих взаємозв'язків інтуїтивно зрозумілі, наприклад, професія і дохід – певні професії приносять більше грошей. Але life2vec, за словами розробників, мапує величезну кількість факторів, які наповнюють життя людини, що, у перспективі, дозволить будь-кому попросити його зробити прогноз на основі мільйонів інших людей і сотень факторів", – пише DailyMail.

У 2024 році понад 2 мільярди людей проголосують. Уже зараз всі хвилюються через ШІ. Що відбувається?

Навчаючись на даних 2008-2015 років, life2vec змогла будувати "індивідуальні життєві траєкторії людини", зазначають розробники.

"Всю історію людського життя, в певному сенсі, можна розглядати як гігантське довге речення про багато подій, які можуть трапитися з людиною. Розглядаючи кожну частину вашого життя так, ніби це слова у реченні, life2vec прогнозує, куди піде історія, виходячи з того, що було написано до цього.

Подібно до того, як користувачі ChatGPT просять його написати пісню, вірш або есе, ми можемо ставити life2vec прості запитання, такі як "смерть протягом чотирьох років?" для певної людини", – пояснив концепцію Леманн.

На основі вивчених даних модель передбачила, хто з досліджуваних помре до 2020 року. Потім вчені порівняли її результати із фактичними – виявилось, що у 79% випадків прогноз був правильним.

"Коли ми візуалізуємо простір, який модель використовує для прогнозування, він виглядає як довгий циліндр, який переносить вас від низької ймовірності смерті до високої. Так ми можемо показати, що в тому кінці, де ймовірність смерті висока, багато з цих людей дійсно померли, а в кінці, де ймовірність смерті низька, причинами смерті є те, що ми не могли передбачити, наприклад, автомобільні аварії", – додав керівник проєкту.

Масштаб набору даних дозволив побудувати прогноз на рівні послідовностей індивідуальних життєвих траєкторій людини, які детально описують, як кожна людина рухається в часі, пишуть вчені.

"Ми можемо спостерігати, як розвивається життя людини в просторі різноманітних типів подій – інформація про серцевий напад змішується з підвищенням заробітної плати або інформацією про переїзд з міста в село", – пояснили вони.

Корифей Кремнієвої долини: історія "батька" ChatGPT Сема Альтмана

При цьому Леманн запевнив, що жодному з учасників дослідження не повідомили про результати їхніх прогнозів – "це було б дуже безвідповідально".

За його словами, ШІ здатен робити прогнози й про особистість людини. Для цього команда навчила модель передбачати відповіді людей на запитання особистісного тесту. У ньому респондентів просили оцінити 10 тверджень на основі того, наскільки вони згодні з ними, наприклад, "перше, що я завжди роблю на новому місці, – це заводжу друзів" або "я рідко висловлюю свою думку на групових зустрічах".

"Ми спробували передбачити смерть, тому що це те, над чим люди працювали протягом багатьох років (зокрема, страхові компанії), тому ми добре розуміли, що це можливо. Ця модель з часом зможе передбачити майже все", – обіцяє Леманн.

Коли можна буде користуватись "калькулятором смерті"

Точно не найближчим часом. За словами керівника дослідження, щоб захистити особисту інформацію людей, чиї дані були використані для навчання ШІ-моделі, вона не є доступною для широкої громадськості або компаній.

"Ми активно працюємо над тим, аби поділитися деякими нашими результатами більш відкрито, але для цього необхідно провести подальші дослідження таким чином, щоб гарантувати конфіденційність його учасників", – пояснив вчений.

Професорка комп'ютерних наук в університеті Бостона Тіна Еліасі-Рад визнала, що "прогностична сила" моделі може не вийти за межі Данії. "Такий інструмент – це як обсерваторія суспільства, але не всіх суспільств. Це модель прогнозування на конкретному наборі даних про конкретну групу населення. Чи можна це зробити в Америці? Це вже інша історія", – заявила дослідниця.

Розробники це підтверджують – всі дані були отримані в Данії, тому прогнози можуть не відповідати дійсності для людей, які живуть в інших місцях.

Співавторка проєкту Тіна Еліасі-Рад

The Boston Globe

The New York Post зауважує, що навіть коли модель стане загальнодоступною, данські закони про конфіденційність забороняють використовувати life2vec для формування страхових полісів або ухвалення рішень про прийом на роботу.

На тлі ажіотажу у ЗМІ в мережі вже почали з’являтись сайти, які стверджують, що пропонують доступ до чат-боту life2vec, але розробники попередили, що такі ресурси є шахрайськими і не мають нічого спільного з їхнім проєктом.

Початок чогось більшого

Враховуючи перераховані застереження, Еліасі-Рад і Леманн розглядають свою прогностичну модель не стільки як кінцевий продукт, скільки як "початок розмови, старт чогось більшого".

Леманн каже, що великі технологічні компанії Meta, Google і Microsoft роками створювали подібні алгоритми прогнозування за закритими дверима з намірами передбачити (а іноді маніпулювати) людською поведінкою. Він сподівається, що його проєкт покладе початок більш відкритому, публічному розумінню того, як працюють ці інструменти, на що вони здатні, і як їх варто і не варто використовувати.

Вчені вважають, що life2vec матиме позитивний ефект в охороні здоров’я

Колаж NYT

А Еліасі-Рад, яка має експертизу у сфері етики ШІ, вважає, що такі інструменти дозволять по-іншому поглянути на суспільство: "на політику, яку ви проводите, на правила і норми, які ви маєте". "Ви можете думати про life2vec як про сканування того, що відбувається на Землі", – додала вона.

"Інше питання полягає в тому, щоб з’ясувати, що коли ми зможемо робити точні прогнози щодо всього. У мене немає на це відповіді, але настав час розпочати розмову, тому що детальне прогнозування людських життів вже відбувається, проте зараз про це не говорять", – каже Леманн.

"Злетіли за межі стратосфери". Як данський фармгігант Novo Nordisk захоплює світ ліками від ожиріння

Дослідники вже вважають, що life2vec може мати значний позитивний ефект в охороні здоров’я. "Я налаштований оптимістично і хочу витрачати більше часу в цьому напрямку, тому що я думаю, що ми могли б зробити щось дійсно хороше і дійсно допомогти людям.

Це не надсилання смс-повідомлення: "У вас буде рак, якщо ви це не зміните", але ви потенційно зможете попросити свого лікаря отримати цю інформацію, щоб він міг допомогти вам", – пояснив керівник проєкту.

У перспективі країни з потужним ШІ та багатими наборами даних, такі як Данія, можуть отримати значні переваги в ефективному управлінні бюджетом і керуванні соціальними послугами, прогнозує Financial Times.

Ризики

Хоча модель life2vec і називають "багатообіцяючою", самі ж вчені-розробники застерегли від її використання компаніями, які страхують життя.

"Цей проєкт ніколи не можна використовувати для страхування. Страхування базується на ідеї розподілу ризику між багатьма людьми. Якщо мільйон людей збирається разом, вони не знають, хто з них захворіє, і кожен може заплатити невелику суму у загальний фонд, а ті, кому не пощастило захворіти, можуть скористатися цим фондом для отримання допомоги. Оскільки ми не знаємо, хто захворіє, це хороша угода. Якби ми могли сказати, хто захворіє заздалегідь, це підірвало б саму ідею страхування", – пояснив Леманн.

"Попри те, що ми використовуємо прогнозування, щоб оцінити, наскільки хороші ці моделі, інструмент наразі не має використовуватися для прогнозування на реальних людях", – додала Еліассі-Рад.

Залучення ШІ до прогнозування смерті – це "початок дуже складного шляху", вважає засновник і керівник відділу біоетики в Медичній школі Гроссмана Нью-Йоркського університету Артур Каплан.

Імовірність захоплення людства штучним інтелектом і перспективи еволюції технології. Інтерв'ю з науковцем

Вчені вже не один рік працюють над дослідженням крові та інших фізичних і медичних характеристик для складання прогнозів щодо тривалості життя, а страховий бізнес взагалі побудований на прогнозуванні. Проте, за його словами, це дослідження унікальне, оскільки вчені використовують дані про соціальну зайнятість у поєднанні з інформацією про стан здоров'я, не контактуючи при цьому з людьми, дані щодо яких стали основою для проєкту.

Каплан вважає "неминучим", що споживачі, зрештою, зможуть отримувати інформацію про власні прогнози. "Буде багато суперечок навколо такого прогнозування смерті, і битв за доступ третіх сторін до цих прогнозів", – очікує він.

Професор біоетики Артур Каплан вважає публічний доступ до life2vec "неминучим"

Getty Images

За його словами, є й більша проблема – алгоритми починають збирати ті дані про людей, які ми зазвичай не знаємо. "Це має свої плюси і може потенційно запобігти смертям, але є реальна екзистенційна загроза того, що все невідоме може стати відомим, і це – не обов'язково добре", – резюмував Каплан.