Лучше Google Translate: как DeepL покоряет мировой рынок ИИ-переводов
Сочетание традиций лингвистики и нестандартный подход к работе с алгоритмами искусственного интеллекта позволили создать самый эффективный сервис онлайн-переводов. Как он работает? (укр)
Переклад – таке ж давнє мистецтво, як і сама цивілізація. Проте давнє коріння не є перешкодою для інновацій, а нейронні мережі та поява чат-ботів на основі штучного інтелекту (ШІ) спричинили стрімкий розвиток перекладацьких технологій.
Світ стає більш взаємопов'язаним, здатність спілкуватися різними мовами стає більш важливою, а попит на якісний переклад ще ніколи не був таким високим. Недавні опитування свідчать, що понад 70% перекладачів у Європі використовують у роботі машинний переклад.
Одним з лідерів на цьому ринку є німецька компанія DeepL, яка пропонує переклади з 32 мов, має понад 100 тис корпоративних клієнтів, мільярд користувачів через застосунки, розширення для браузерів та сайт.
У чому її унікальність? Компанія використовує власну модель нейронних мереж, спеціально навчену для точнішого перекладу бізнес-текстів. Базою для сервісу та навчання ШІ-моделі став її великий онлайн-словник Linguee, який допомагає легко конкурувати з Google Translate та Grammarly.
Як невеликий стартап з Кельна кинув виклик Google Translate і Grammarly? Чи боїться він конкуренції з Google, Meta і OpenAI і як планує розвиватися?
Ринок машинного перекладу
Світовий ринок перекладу на основі ШІ, за прогнозами Statista, зросте з 5 млрд дол у 2023 році до 12 млрд дол у 2030 році. Опитування американських бізнес-лідерів, яке провела KPMG, показує, що у 2024 році 97% компаній планують інвестувати в ШІ-проєкти щонайменше 250 млн дол, а 6% – удвічі більше.
Сприяє цьому те, що попит на ШІ-функції, зокрема в перекладі, зростає. Дослідження IBM показало, що 42% компаній активно впроваджують ШІ, а ще 40% – вивчають його потенціал.
Загалом лінгвістична індустрія оцінюється 68 млрд дол і до 2028 року ця цифра зросте до 100 млрд дол. Світовий ринок програмного забезпечення для перекладу у 2021 році становив 9,3 млрд дол і, як очікується, до 2031 року досягне 44,8 млрд дол.
За словами експертів, великий обсяг контенту свідчить, що попит на послуги онлайн-перекладачів буде високим. "Сектор машинних перекладів обслуговує всі сфери, бо перекладу потребують усі галузі", – пояснив виконавчий директор постачальника новин і досліджень у сфері мовного перекладу Slator Флоріан Фаес. Він упевнений, що DeepL – найуспішніша компанія в перекладацькій галузі за останні 15 років. Як їй це вдалося?
Від 20 людей до статусу "єдинорога"
Хоча стартап з штаб-квартирою в Кельні офіційно презентували у 2017 році, основоположний продукт та материнську компанію зареєстрували набагато раніше. У 2009 році колишній науковий співробітник Google Гереон Фралінг створив Linguee – один з найкращих багатомовних словників на ринку.
"Ми створили нейронну перекладацьку мережу. Вона увібрала в себе більшість останніх розробок, до яких ми додали власні ідеї. Величезна база даних з понад мільярдом перекладів і запитів, а також метод перевірки перекладу шляхом пошуку схожих фрагментів в інтернеті створили основу для навчання нової моделі. Усе це ми поєднали на суперкомп’ютері в Ісландії", – розповів Фралінг.
Намагаючись удосконалити Linguee, команда з 20 дослідників під керівництвом польського вченого-комп’ютерника Ярослава Кутиловського почала використовувати нейронні мережі, аби покращити процес верифікації різних перекладів. Для цього вони почали навчати нейронну мережу машинному перекладу на базі даних, які збирали протягом десяти років, і у 2017 році запустили онлайн-перекладач DeepL.
До ворожки не ходи. Як штучний інтелект визначає ймовірність смерті?
Згодом початкові дані Linguee доповнили іншими джерелами – сайтами компаній та соцмережами, які допомагають технології DeepL опановувати повсякденні ідіоми.
У чому особливість сервісу від DeepL? Її онлайн-перекладач використовує архітектуру глибокої нейронної мережі Transformer, яка розроблена для подолання обмежень попередніх нейронних моделей машинного перекладу (зокрема, RNN) і стала високоефективною в створенні якісних перекладів.
Річ у тім, що RNN обробляє вхідні послідовності по одному слову за раз, і вплив попередніх слів на наступні зменшується, коли послідовність стає довшою. А Transformer використовує механізм самоуваги, який дозволяє одночасно звертати увагу на всі слова в реченні, фіксуючи всі залежності.
"У той час як Google Translate часто робить дослівний переклад, який пропускає деякі нюанси та ідіоми, DeepL забезпечує природний переклад, наближений до перекладу досвідченого фахівця", – писав після запуску DeepL TechCrunch.
Стартап тоді заявляв, що під час тестування, проведеного компанією, професійні перекладачі віддали перевагу сервісу DeepL у співвідношенні 3:1 порівняно з інструментами Google, Microsoft та Facebook. Версія DeepL показала кращі результати, ніж її конкуренти, і в тесті на точність перекладу за системою BLEU.
"Нейронні мережі DeepL здатні вловлювати найменші нюанси та відтворювати їх у перекладі. Щоб оцінити якість наших моделей, ми регулярно проводимо сліпі тести, під час яких професійні перекладачі вибирають найточніший переклад, не знаючи, хто його зробив. DeepL перевершує конкурентів утричі", – кажуть у DeepL.
Компанія пропонує безкоштовні та платні послуги. Вона підтримує понад 30 мов, у тому числі українську (з вересня 2022 року). Безкоштовний рівень обмежує кількість символів, які користувач може перекласти за один раз, безпеку даних користувача та кількість документів, які він може перекладати на місяць. Рівень API DeepL дозволяє отримати доступ до більшої кількості глосаріїв та перекладів.
DeepL Pro призначений для корпоративного користування і має три рівні, які оплачуються за кожного користувача на рік: початковий – від 100 дол, розширений – від 300 дол, найкращий – майже 700 дол.
Фірма зробила ставку на перекладацькі послуги у сферах виробництва, юриспруденції, роздрібної торгівлі, технологій, охорони здоров’я. Cпеціалізована платформа допомагає вирішувати завдання з внутрішніх комунікацій, підтримки клієнтів, виходу на міжнародні ринки.
Ще одна перевага перекладача DeepL – можливість завантажувати і перекладати документи у форматах PDF, Word, HTML та PowerPoint із збереженням оригінального формату.
Платформа для бізнесу значно скорочує витрати і підвищує ефективність. Дослідження компанії Forrester, проведене у 2024 році, показало, що використання DeepL забезпечило 345% рентабельності інвестицій для глобальних компаній, скоротивши час перекладу на 90% і знизивши робоче навантаження на 50%.
Така ефективність дозволила компанії зібрати понад 100 тис корпоративних клієнтів, найвідоміші серед яких – японський медіахолдинг Nikkei, провайдер онлайн-курсів Coursera, німецький залізничний холдинг Deutsche Bahn та компанія Zendesk, яка розробляє програмне забезпечення.
"Ми переконалися, наскільки ефективно можна впроваджувати інструменти штучного інтелекту в клієнтський досвід, і найкращий у галузі переклад сайту DeepL є яскравим прикладом цього", – каже технічний директор Zendesk Адріан Макдермотт.
За словами представника Index Ventures Денні Рімера, який інвестував у DeepL, вимоги до точності, конфіденційності та безпеки перекладів у корпоративному світі набагато вищі, ніж у споживчому, і якість моделі стартапу дає йому перевагу.
Кутиловський визнає, що DeepL робить акцент на якісному бізнес-перекладі. "Коли ви перебуваєте у відпустці в Іспанії, очевидно, що перекласти меню в ресторані важливо, але якість перекладу не настільки важлива. І величезна різниця, коли ви хочете надіслати електронний лист клієнту", – каже він.
Інвестиції та розвиток
Широкі перспективи ШІ-перекладу дозволяють DeepL залучати інвесторів. Вагомим кроком для її розвитку стало отримання на початку 2023 року 100 млн дол від інвестфондів IVP, Bessemer Venture Partners, Atomico і WiL. Тоді стартап отримав статус "єдинорога" – його оцінка вперше перевищила 1 млрд дол.
Після цього компанія оголосила про запуск DeepL Write – інструменту на базі ШІ, який покращує письмову комунікацію, удосконалює граматику та надає поради щодо формулювання фраз, стилю та вибору слів. DeepL Write доступний у десктопних та мобільних браузерах і конкурує з Grammarly.
Стартап також дає змогу розробникам використовувати інтерфейс API на основі JSON для вбудовування технології машинного перекладу безпосередньо у свої продукти та платформи. Компанії можуть використовувати API для перекладу тексту в браузерах, чатах чи поштових розсилках.
Штучний інтелект шукає таланти. Як створений українцями стартап JobCannon змінить рекрутинг
Після отримання фінансування DeepL за останній рік удвічі збільшила штат – до 900 співробітників. Компанія має офіси в Німеччині, Нідерландах, Польщі, Великій Британії, Японії та США.
За останній рік DeepL суттєво розширила асортимент продукції для бізнесу. У квітні 2024 року компанія запустила DeepL Write Pro – оновленого помічника, розробленого для написання ділових документів, на основі власної мовної моделі (LLM). Сервіс також продовжує розширювати спектр мов, які підтримує платформа. Він додав арабську, корейську та норвезьку мови і довів загальну кількість мов до 32.
Наступним етапом розвитку DeepL, яка досі неприбуткова, стало залучення в травні 300 млн дол у рамках нового раунду фінансування, очолюваного Index Ventures. Інвестиція відображає зростання інтересу бізнесу до моделей ШІ, спрямованих на виконання конкретної функції – перекладу, пише WSJ.
У підсумку ринкова оцінка стартапу зросла до 2 млрд дол. Фонди Iconiq Growth і Teachers' Venture Growth стали новими інвесторами, чинні інвестори IVP, Atomico і WiL також долучилися до нового фінансування.
У DeepL кажуть, що після отримання цих коштів зосередяться на розширенні та зростанні на ключових ринках, насамперед США, а також на інвестиціях у дослідження та розвиток.
Компанія планує у 2025 році додати підтримку більшої кількості азійських мов. За словами Кутиловського, довгострокове бачення DeepL полягає в тому, щоб стати більш продуктивним інструментом для корпорацій, які прагнуть використовувати її ШІ-функції, і вилучити нудну ручну роботу з повсякденної комунікації.
"Ми розширюємо наш продукт, щоб мати можливість підтримувати великих корпоративних клієнтів. Ви побачите набагато більше від нас у цій галузі", – обіцяє він.
За його словами, 60% штату компанії – це розробники і в майбутньому сервіс найматиме більше нетехнічного персоналу для збільшення продажів та покращення маркетингової стратегії. Наступний крок розвитку полягатиме в тому, щоб зосередитися не на змісті тексту, а на "невловимих тонах і формулюваннях".
Конкуренція та ризики
"Технологічні гіганти Google, Microsoft і Facebook використовують машинне навчання для перекладу, але маленька компанія DeepL перевершила їх усіх і підняла планку в цій галузі. Її перекладацький інструмент такий же швидкий, як у величезних конкурентів, але більш точний і деталізований порівняно з іншими протестованими нами інструментами", – писав TechCrunch після запуску DeepL.
Стартап заявляє, що розробляє найкраще у світі програмне забезпечення для машинного перекладу. Це твердження ґрунтується на "сліпих" тестах, під час яких професійні перекладачі обирають найточніший варіант перекладу тексту, не знаючи, яка компанія його створила, пояснюють у DeepL.
"Усе зводиться до того, щоб мати найкращу технологію", – каже Кутиловський. Він запевняє, що нейронні мережі компанії можуть аналізувати величезні обсяги даних, зібраних з інтернету, щоб дізнатися найбільш вірогідний переклад для будь-якого речення.
Однак це роблять і конкуренти DeepL. Зокрема, материнська компанія Facebook Meta випустила програмне забезпечення на базі ШІ, яке може автоматично перекладати усне мовлення і текст близько 100 мовами. Компанія заявила, що її технологія SeamlessM4T є кроком до універсального перекладача.
Війна чат-ботів. Як ChatGPT похитнув гегемонію Google
Крім свого звичного перекладача, Google розвиває Google Cloud, який дає змогу компаніям динамічно перекладати тексти на своїх сайтах і в застосунках за допомогою програмного інтерфейсу API. Він використовує модель нейронного машинного перекладу, яку корпорація регулярно оновлює.
Microsoft Translator дозволяє підприємствам, розробникам додатків та постачальникам мовних послуг створювати індивідуальні системи нейронного машинного перекладу. Працює у секторі перекладу й Amazon: сервіс Amazon Translate наразі підтримує понад 70 мов.
Чи зможе амбітний стартап підтримувати нинішні темпи зростання в умовах жорсткої боротьби з великими компаніями? Кутиловський, схоже, не боїться конкуренції. За його словами, DeepL зосереджуватиметься на дослідженнях нейронних мереж для перекладу та отриманні найкращих даних для навчання.
"Ми конкуруємо з Google Translate, а отже, з усією Google, з моменту заснування компанії, тому для нас ландшафт не надто змінився", – каже засновник DeepL.
Проте він визнає, що останнім часом темп змін прискорився. "У сфері ШІ є багато розробок, а швидкість досліджень зросла. Це виклик для наших команд, адже їм потрібно трохи прискоритися", – каже він.
Компанія почала виходити за межі свого основного ринку, запустивши ШІ-інструмент DeepL Write для конкуренції з Grammarly. Стартап також хоче вийти за межі своєї європейської бази, особливо в Азії та США.
Попри все DeepL зберігає оптимізм щодо свого майбутнього. Там переконані, що зосередженість на якості перекладу відкриє для неї нові можливості. "Коли ви крок за кроком покращуєте якість перекладу, для машинного перекладу відкривається дедалі більше сфер застосування", – говорить Кутиловський.
Від кнопок для телевізорів до 70% усіх iPhone: як тайванська Foxconn підкорила світ
За словами аналітиків, ризик для DeepL полягає в тому, що бізнеси використовують один з хмарних сервісів Google, Microsoft або Amazon. Як тільки з розвитком ШІ-сервісів цих технологічних гігантів перевага DeepL у перекладах стане менш помітною, стартап може почати втрачати корпоративних клієнтів. Компаніям буде простіше скористатися пропозицією на платформі, на якій вони працюють.
Також може з'явитися ще один конкурент – OpenAI, який випускає низку гучних інструментів на основі ШІ.
Поки що незрозуміло, буде OpenAI створювати окремі перекладацькі сервіси чи об'єднається в цьому з Microsoft. Кутиловський каже, що наразі немає конкретних планів стосовно того, чи буде DeepL співпрацювати з OpenAI і в якій формі це може бути. Засновник стартапу визнає, що мовні моделі, які використовує DeepL, схожі на ті, що є в OpenAI, і що обидві компанії мають багато спільних клієнтів.
"Ми завжди перебуваємо в режимі перегонів з точки зору перекладу. Ми звикли до великих противників, і частина нашої культури полягає в тому, щоб просуватися вперед, незважаючи на це", – резюмував він.