На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 726 подписчиков

Свежие комментарии

  • Ольга Анатольевна
    9 апреля 2021 года ???? Вообще-то герцог Эдинбургский был убит в конце августа 1985 года. А королева умерла после инс...People: королева ...
  • Алекс Сэм
    Неужто прозрели?Депутат Мархаев р...
  • Александр Пятнистый
    Надо повторить операцию соединения Ковпака т"Сарнский крест", тем более, что она подробно описана в книге П.П. Вершиг...Рябков: кратчайши...

FT: DeepSeek отложила выход нового ИИ из-за проблем с обучением на чипах Huawei

Китайская компания DeepSeek отложила выпуск своей новой флагманской языковой модели из-за значительных трудностей с обучением на ускорителях вычислений Huawei. Об этом, ссылаясь на собственные источники, сообщает Financial Times (FT).

Проблема возникла на фоне давления со стороны китайских властей, которые рекомендуют отечественным ИИ-разработчикам, включая DeepSeek, переходить на использование ускорителей Huawei Ascend вместо чипов Nvidia, поставки которых затруднены из-за санкций США.

Ранее, в январе этого года, DeepSeek успешно выпустила языковую модель R1, продемонстрировав способность эффективно использовать ограниченные вычислительные ресурсы.

Однако при попытке обучения новой модели R2 на платформах Huawei компания столкнулась с серьезными техническими сложностями. Это вынудило DeepSeek перенаправить имеющиеся ускорители Huawei на задачи инференса (формирование логических выводов), а обучение критически важной R2 продолжить на оборудовании Nvidia. Изначально анонсированный на май релиз R2 был отложен, что, по мнению экспертов, негативно сказывается на конкурентных позициях DeepSeek на быстроразвивающемся рынке ИИ.

Представители Huawei были осведомлены о возникших проблемах и направили в DeepSeek команду профильных специалистов. Тем не менее, их усилия не принесли желаемых результатов в обучении модели R2. Более того, даже процесс адаптации чипов Huawei к задачам инференса до сих пор не завершен. Руководство DeepSeek признает, что текущий прогресс в разработке R2 недостаточен и требует дополнительного времени для доработки, хотя некоторые источники выражают надежду на скорый выход модели.

На фоне этих трудностей конкуренты DeepSeek продолжают активно развиваться.

Например, Alibaba в своей модели Qwen3 заимствовала ключевые концепции у DeepSeek и добилась большей эффективности. Эксперты отрасли в целом ожидают, что со временем китайские разработчики смогут создавать успешные языковые модели, полностью обученные на чипах Huawei, несмотря на текущие вызовы.

 

Ссылка на первоисточник
наверх