На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 637 подписчиков

Свежие комментарии

  • Николай Герасименко
    Если они так решили, прекратить закупки нашего газа, так может нам не стоит ждать конца 26 года и прекратить его пост...Минэнерго США: ЕС...
  • Людмила Харькова
    А главное бесплатно. Мечтатели, блин!Korea Economic TV...
  • Людмила Харькова
    Ну если не ответите, подставляйте "другую щеку, чтобы еще раз получить в прищуренный глаз"!Премьер Катара: Н...

FT: DeepSeek отложила выход нового ИИ из-за проблем с обучением на чипах Huawei

Китайская компания DeepSeek отложила выпуск своей новой флагманской языковой модели из-за значительных трудностей с обучением на ускорителях вычислений Huawei. Об этом, ссылаясь на собственные источники, сообщает Financial Times (FT).

Проблема возникла на фоне давления со стороны китайских властей, которые рекомендуют отечественным ИИ-разработчикам, включая DeepSeek, переходить на использование ускорителей Huawei Ascend вместо чипов Nvidia, поставки которых затруднены из-за санкций США.

Ранее, в январе этого года, DeepSeek успешно выпустила языковую модель R1, продемонстрировав способность эффективно использовать ограниченные вычислительные ресурсы.

Однако при попытке обучения новой модели R2 на платформах Huawei компания столкнулась с серьезными техническими сложностями. Это вынудило DeepSeek перенаправить имеющиеся ускорители Huawei на задачи инференса (формирование логических выводов), а обучение критически важной R2 продолжить на оборудовании Nvidia. Изначально анонсированный на май релиз R2 был отложен, что, по мнению экспертов, негативно сказывается на конкурентных позициях DeepSeek на быстроразвивающемся рынке ИИ.

Представители Huawei были осведомлены о возникших проблемах и направили в DeepSeek команду профильных специалистов. Тем не менее, их усилия не принесли желаемых результатов в обучении модели R2. Более того, даже процесс адаптации чипов Huawei к задачам инференса до сих пор не завершен. Руководство DeepSeek признает, что текущий прогресс в разработке R2 недостаточен и требует дополнительного времени для доработки, хотя некоторые источники выражают надежду на скорый выход модели.

На фоне этих трудностей конкуренты DeepSeek продолжают активно развиваться.

Например, Alibaba в своей модели Qwen3 заимствовала ключевые концепции у DeepSeek и добилась большей эффективности. Эксперты отрасли в целом ожидают, что со временем китайские разработчики смогут создавать успешные языковые модели, полностью обученные на чипах Huawei, несмотря на текущие вызовы.

 

Ссылка на первоисточник
наверх