Китайский DeepSeek не смог обучить свою новую ИИ-модель на чипах Huawei

Артур Крыжный - 14 августа, 20:25

Китайская компания искусственного интеллекта DeepSeek отложила выпуск своей новой модели после того, как не смогла обучить ее с помощью чипов Huawei, что подчеркивает ограничения китайской стратегии замены американских технологий.

Об этом сообщает газета Financial Times.

По словам трех человек, знакомых с ситуацией, власти поощряли DeepSeek использовать процессор Huawei Ascend вместо систем Nvidia после выпуска модели R1 в январе.

Однако китайский стартап столкнулся с постоянными техническими проблемами во время процесса обучения модели R2 с помощью чипов Ascend, что заставило компанию использовать чипы Nvidia для обучения, а чипы Huawei - для прогнозирования, рассказали источники.

Эти проблемы стали основной причиной задержки запуска модели с мая, что позволило конкурентам опередить DeepSeek, добавил один из собеседников.

Обучение модели заключается в том, чтобы она изучала большой набор данных, а инференс - это этап, когда тренированная модель делает прогнозы или генерирует ответы, как в случае запроса чат-бота.

Трудности DeepSeek свидетельствуют о том, как китайские чипы все еще отстают от своих американских конкурентов в важных задачах, подчеркивая вызовы, с которыми сталкивается Китай в своем стремлении к технологической самодостаточности.

The Financial Times на этой неделе сообщила, что Пекин требует от китайских технологических компаний обосновать свои заказы чипов Nvidia H20, чтобы поощрить их к использованию альтернатив, произведенных Huawei и Cambricon.

Инсайдеры отрасли утверждают, что китайские чипы имеют проблемы со стабильностью, медленнее соединения между чипами и хуже программное обеспечение по сравнению с продуктами Nvidia.

Напомним:

Компания DeepSeek, которая занимается разработкой искусственного интеллекта, помогает военным и разведывательным операциям Китая.