Українська правда

Китайський DeepSeek не зміг навчити свою нову ШІ-модель на чипах Huawei

Артур Крижний — 14 серпня, 20:25
Китайський DeepSeek не зміг навчити свою нову ШІ-модель на чипах Huawei
Getty Images

Китайська компанія штучного інтелекту DeepSeek відклала випуск своєї нової моделі після того, як не змогла навчити її за допомогою чипів Huawei, що підкреслює обмеження китайської стратегії заміни американських технологій.

Про це повідомляє газета Financial Times.

За словами трьох осіб, знайомих з ситуацією, влада заохочувала DeepSeek використовувати процесор Huawei Ascend замість систем Nvidia після випуску моделі R1 у січні.

Проте китайський стартап зіткнувся з постійними технічними проблемами під час процесу навчання моделі R2 за допомогою чипів Ascend, що змусило компанію використовувати чипи Nvidia для навчання, а чипи Huawei — для прогнозування, розповіли джерела.

Ці проблеми стали основною причиною затримки запуску моделі з травня, що дозволило конкурентам випередити DeepSeek, додав один зі співрозмовників.

Навчання моделі полягає в тому, щоб вона вивчала великий набір даних, а інференс — це етап, коли тренована модель робить прогнози або генерує відповіді, як у випадку запиту чат-бота.

Труднощі DeepSeek свідчать про те, як китайські чипи все ще відстають від своїх американських конкурентів у важливих завданнях, підкреслюючи виклики, з якими стикається Китай у своєму прагненні до технологічної самодостатності.

The Financial Times цього тижня повідомила, що Пекін вимагає від китайських технологічних компаній обґрунтувати свої замовлення чипів Nvidia H20, щоб заохотити їх до використання альтернатив, вироблених Huawei та Cambricon.

Інсайдери галузі стверджують, що китайські чипи мають проблеми з стабільністю, повільніше з'єднання між чипами і гірше програмне забезпечення порівняно з продуктами Nvidia.

Нагадаємо:

Компанія DeepSeek, яка займається розробкою штучного інтелекту, допомагає військовим і розвідувальним операціям Китаю.