На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 495 подписчиков

Свежие комментарии

  • Сергей Храмов
    Зеленский - клоун с пустой головой фантанирует обвинениями о тех кто поддержал еврейско- фашисткицкий бандеровский ре...Дубинский: Зеленс...
  • Фаина Юсупова
    Слава героям Отечественной войны!!!Советская подводн...
  • Maxim
    В ГУЛАГ, в Заполярье..У экс-подполковни...

Эксперт Kaspersky Тушканов заявил, что DeepSeek-R1 креативнее, чем ChatGPT

За один день китайская языковая модель DeepSeek-R1 смогла стать одним из самых популярных приложений в мире, обвалить акции Nvidia на $600 млрд и стать конкурентом CHatGPT. "Газета.Ru" протестировала нейросеть, чтобы ответить, почему все заговорили о DeepSeek, что она умеет, чем удивляет и как ей пользоваться пользователям в России.

Что такое DeepSeek

В последние годы искусственный интеллект стал неотъемлемой частью глобального технологического ландшафта. Среди наиболее известных ИИ-моделей выделяются ChatGPT от OpenAI, Google Gemini, Anthropic Claude и многие другие. Однако неожиданно для всех на мировой арене появилась способная "рассуждать" китайская модель DeepSeek-R1 компании DeepSeek (в переводе "глубокий взгляд"), которая произвела фурор. R1, по версии самой нейросети, означает номер модели, в которой буква "R" идет от слова "Reasoning" — рассуждение.

На китайском рынке представлено множество локальных нейросетей, созданных компаниями с миллиардными бюджетам. Среди них Alibaba Cloud Qwen, Baidu Ernie Bot и ByteDance Doubao. Однако лишь DeepSeek удалось добиться признания на глобальном рынке за считанные часы.

Модель DeepSeek-R1 сильно выделяется на фоне других благодаря своей способности к рассуждению и решению сложных задач, что позволяет ей достигать высоких результатов в различных бенчмарках.

В конце января DeepSeek вызвала резкое падение акций таких технологических гигантов, как Nvidia, ASML и Siemens Energy, а также снижение капитализации криптовалют, связанных с ИИ. ~За сутки акции компании Nvidia упали на 17,8%, а рыночная стоимость крупнейшего производителя ИИ-чипов в мире снизилась почти на $600 млрд — до $2,89 трлн. Это рекордное падение в истории.~

Падение произошло из-за отчета, показывающего, что разработка DeepSeek значительно дешевле, чем аналогичные проекты. Обучение языковой модели V3, которая вышла до R1, обошлось компании в $5,58 млн, при использовании всего 2048 чипов Nvidia H800 и численности команды менее 200 человек (однако доказательств этим утверждениям нет). Например, в OpenAI трудится 4500 человек, а на обучение GPT-4 в свое время было затрачено $100 млн. Сколько именно чипов было использовано в процессе, неизвестно.

Еще одно ключевое преимущество DeepSeek — она работает быстрее и требует меньше ресурсов, что делает ее более доступной для компаний в сравнении с западными аналогами.

Что умеет DeepSeek

DeepSeek-R1 — это ориентированная на рассуждения модель, которая создана для задач, требующих логического мышления и самопроверки.

Чтобы воспользоваться этой моделью, достаточно нажать на кнопку "Глубокое мышление (R1)" рядом с полем пользовательского запроса. После этого вы сможете задать вопрос нейросети и наблюдать, как она анализирует запрос и размышляет над ответом, выстраивая его структуру. И наконец, вы получите развернутый ответ. Правда, база чат-бота ограничена знаниями от июля 2024 года.

В этом режиме модель решает математические и логические задачи, "рассуждая" пошагово. Процесс может легко занять больше минуты — зато можно наглядно следить за мыслительным алгоритмом, чтобы понять, как "думают" нейросети. Иногда это бывает даже забавно.

Аналогичный функционал уже имеется, например, в тестовой версии модели Gemini 2.0 Flash Thinking Experimental. Она доступна бесплатно для всех пользователей с базой знаний от августа 2024 года. Правда, ключевой недостаток этой модели заключается в том, что в России официально ИИ от Google не работает.

В ближайшее время рассуждающая модель o3 от OpenAI будет добавлена и в ChatGPT. В OpenAI обещают, что ограниченный доступ к ней будет представлен и для пользователей бесплатного тарифа. Актуальную o1 можно получить только по подписке, а в бесплатной версии пользователю предлагается очень ограниченное количество попыток.

~Китайский чат-бот может работать и в качестве поисковика, дополняя ответы ссылками на источник.~ Это может быть полезным, если ИИ выдает не очень актуальные данные из своей базы. Причем, что удобно, пользователь может комбинировать R1 и функцию "Поиск", нажав на обе кнопки — тогда ИИ выдаст развернутый и актуальный ответ, подкрепленный источниками.

Также в DeepSeek можно загрузить файлы общим объемом до 100 МБ, в том числе изображения, однако на них нейросеть может лишь распознать текст, если он есть на картинке. После загрузки документа нужно составить запрос, и через несколько секунд вы получите ответ. Например, так можно быстро проанализировать научную статью или законопроект и переписать его на понятный язык без сложных юридических формулировок.

~Когда корреспондент "Газеты.Ru" отправил чат-боту первый том "Войны и мира" Льва Толстого в формате PDF, ИИ отказался анализировать весь роман, изучив лишь 4% текста.~ При этом он так и не смог дать ответ — из-за ошибки в работе под высокой нагрузки на вычислительные мощности DeepSeek с большим потоком новых пользователей.

ChatGPT в свою очередь легко справился с задачей. Однако, если вы хотите использовать эту функцию в ИИ от OpenAI на постоянной основе, вам нужно будет оформить подписку. После нескольких попыток чат-бот предложит выбрать один из вариантов: Plus-подписка за $20 или Pro за $200. В первом случае возможностей будет больше, но ограничения все равно останутся.

С генерацией и обработкой текста DeepSeek справляется отлично, — будь-то написание сценариев, продумывание романа, рерайт текста, создание стихотворений или программирование. DeepSeek демонстрирует превосходную грамотность и логичность, давая полные ответы и генерируя оригинальные идеи.

Например, ИИ может составить письмо для руководителя с аккуратным намеком на повышение зарплаты, напишет за вас поздравительное письмо или сочинение по литературе, если вы школьник. ~Правда, не стоит доверять ИИ написание курсовых работ или даже школьных заданий и сочинений, поскольку нейросеть не только хорошо генерирует основную часть текста, но и может придумывать факты и цитаты.~ Если вы все же решите воспользоваться такой услугой, обязательно проверяйте каждое утверждение.

ChatGPT с этой задачей может справиться лучше, особенно, если вы активный пользователь этого приложения, так как нейросеть способна запоминать информацию о пользователе, в том числе его имя.

Тем не менее, многие пользователи используют нейросети не для работы, а для развлечений. В этом плане с китайским ИИ все в порядке. Несмотря на то, что речь идет об искусственном интеллекте, он ~способен выдавать забавные ответы и даже может понимать, когда пользователь пытается подшутить над самой нейросетью.~

DeepSeek в России

В отличие от ChatGPT, созданного OpenAI, Google Gemini и ряда других популярных чат-ботов, DeepSeek функционирует на территории России без каких-либо ограничений. Воспользоваться искусственным интеллектом можно как в веб-версии на сайте chat.deepseek.com, так и в приложениях для Android и iOS.

И что самое важное, все это доступно бесплатно и без обхода блокировок.

Чтобы начать пользоваться сервисом DeepSeek, необходимо зарегистрироваться на сайте или пройти быструю авторизацию, используя аккаунт Google.

При большом желании можно запустить автономную нейросеть, но для этого потребуется достаточно мощное оборудование. Для большинства пользователей будет достаточно более удобных веб-версии и приложений.

Какие проблемы возникают у пользователей DeepSeek

Когда о DeepSeek узнали многие люди по всему миру, это приложение за считанные часы стало самым загружаемым на Android и iOS. За один день у китайского ИИ появились миллионы новых пользователей. Очевидно, что разработчики не были готовы к такой популярности, из-за чего в конце января сервис столкнулся с проблемами в работе под высокой нагрузкой. Пользователи часто сталкиваются со сбоями, ошибками в обработке запросов, полным отказом ИИ или длительным ожиданием ответа. В первые дни, когда о DeepSeek знали лишь энтузиасты, чат-бот отвечал за считанные секунды, чем сильно отличался от ChatGPT и аналогов.

~Несмотря на то, что чат-бот идеально понимает и отвечает на русском, иногда DeepSeek все-таки переключается на английский.~ Например, если задать ему вопрос, он может ответить или подумать об ответе (R1) на английском. Проблема решается довольно просто: достаточно попросить ответить на русском, после чего новый ответ будет переписан на указанном языке.

Так как DeepSeek — китайская компания, ~в сети появлялись жалобы на цензуру и мемы на якобы запретную для ИИ тему про события на площади Тяньаньмэнь в 1989 году.~ Несмотря на подобные предубеждения, DeepSeek-R1 без каких-либо проблем обдумал тему и выдал сводку по этому событию, рассказывая все о военном подавлении протестующих и жертвах. Причем в конце ИИ все же отметил следующее: "Информация о данных событиях в Китае ограничена, а их обсуждение регулируется государством. Для углубленного изучения рекомендуется обращаться к независимым историческим исследованиям и свидетельствам очевидцев".

Особенности DeepSeek

Руководитель группы исследований и разработки технологий машинного обучения в "Лаборатории Касперского" Владислав Тушканов в беседе с "Газетой.Ru" объяснил внезапную популярность DeepSeek-R1 простотой и доступностью китайского ИИ.

"Если вспомнить историю с ChatGPT, то мощные большие языковые модели, типа text-davinci-003 от OpenAI, существовали к моменту релиза ChatGPT уже довольно давно. Ими можно было пользоваться для генерации текста и при определенном умении вести с ним диалог, но это требовало определенной технической грамотности и как минимум банального интереса. А ChatGPT дал эту возможность диалога за счет доступа широкой публики к инструктивной модели", — отметил он.

По словам Тушканова, размышляющие модели были доступны уже некоторое время, но QwQ от Qwen была известна лишь узкому кругу исследователей, а модели o1 и o1-mini от OpenAI до недавнего времени были доступны только по подписке. При этом самое мощное решение и вовсе предлагается в ChatGPT за $200 в месяц.

"Тем временем, благодаря DeepSeek с мощной размышляющей моделью, как в свое время с ChatGPT, смог познакомиться каждый. И эта модель оказалась достаточно впечатляющей. Благодаря внутреннему механизму мышления она способна решать сложные задачи, требующие декомпозиции на многие шаги. Например, ~она неплохо показала себя при анализе вредоносных скриптов, совершающих сразу несколько шагов, часть из которых призвана запутать аналитика. Другая ее впечатляющая способность — это поиск материалов в интернете~", — подчеркнул эксперт.

К тому же, поскольку DeepSeek-R1 — это открытая модель, некоторые компании, такие как Perplexity, интегрировали ее в свои продукты. Теперь пользователи могут осуществлять ИИ-поиск в интернете с помощью этой китайской модели. Она способна демонстрировать логическую цепочку рассуждений, предоставлять подробные структурированные ответы и создавать наглядные графики и таблицы. ~Однако стоит отметить, что в бесплатной версии доступно лишь три запроса в день, в то время как в фирменном приложении DeepSeek такого ограничения нет.~

"Наконец, субъективное наблюдение: у модели от DeepSeek гораздо ярче "личность". Модель от ~OpenAI блестяще решает сложные задачи, но ее ответы весьма сухие. Она не очень подходит, например, для креативных задач~. DeepSeek же не только хорошо справляется со сложными задачами на разработку, но и отлично ведет сложные философские дискуссии или помогает писать фантастические сценарии, при этом часто очень удачно шутит и играет со словами, — то есть объединяет сильные стороны "думающих" и обычных моделей", — отметил эксперт.

Тушканов напомнил, что ~DeepSeek, как и любой облачный провайдер, собирает данные о пользователях и их переписки для предотвращения злоупотреблений и улучшения своих моделей~. Он также подчеркнул, что китайская модель как и любая другая подвержена галлюцинациям, поэтому не стоит полагаться на такие модели в ситуациях, например, когда нужна юридическая и медицинская консультация или психологическая помощь.

 

Ссылка на первоисточник
наверх