
Запуск нового покоління штучного інтелекту DeepSeek R2 затримується через технічні проблеми, що виникли під час навчання моделі на чипах Huawei. Ситуація підкреслює складнощі, з якими стикається Китай у сфері напівпровідників, намагаючись зменшити залежність від американських технологій. Про це пише Android Headlines.
Спроба замінити NVIDIA на Huawei
Більшість сучасних AI-моделей тренуються на обладнанні NVIDIA, яке забезпечує необхідну обчислювальну потужність. Однак торговельне протистояння між США та Китаєм призвело до обмежень на експорт передових технологій, зокрема графічних процесорів останнього покоління. У результаті Китай отримує спрощені версії чипів або взагалі змушений шукати внутрішні альтернативи.
Прагнучи слідувати курсу уряду на використання локальних рішень, DeepSeek вирішила навчати модель R2 на процесорах Huawei. Проте під час тренування виникли стійкі технічні проблеми, які унеможливили завершення проєкту в заплановані терміни.
Компромісне рішення
Зрештою, компанія змінила підхід: навчання моделі здійснили на графічних прискорювачах NVIDIA, тоді як чипи Huawei вирішили використовувати лише для етапу інференсу (виконання вже натренованої моделі).
Запуск DeepSeek R2, який мав відбутися ще у травні 2025 року, довелося перенести на невизначений термін.