На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 683 подписчика

Свежие комментарии

  • Ангелина Силаева
    Раньше такой крупной была, а сейчас постройнела, даже моложе выглядит после велгии. А голос-то какой!Юмористка Ангарск...
  • Александр Пятнистый
    а ему зачем? он-атеист, родного своего языка не знает и не хочет знать, впрочем, многие из нас старославянский тоже н...Илья Авербух пред...
  • Николай Герасименко
    "Мы молимся особенно за страдающий украинский народ"! Зашибись! Какая избирательная католическая позиция! А за народ ...Папа Римский Лев ...

Grok показал лучший результат по точности среди популярных чат-ботов

Модель искусственного интеллекта Grok компании xAI Илона Маска продемонстрировала наименьший уровень ошибок среди популярных чат-ботов. Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum, посвященный оценке надежности ИИ-сервисов.

Согласно исследованию, уровень так называемых "галлюцинаций" у Grok составил 8%, что почти в четыре раза ниже показателей ChatGPT и Google Gemini.

Для сравнения, у ChatGPT этот показатель достиг 35%, а у Gemini — 38%, что ставит под сомнение их использование в задачах, требующих высокой точности.

Оценка проводилась по нескольким критериям, включая частоту ошибок, стабильность работы, пользовательские рейтинги и время простоя. На основе совокупных данных каждому сервису присваивался балл по шкале от 0 до 99, где более высокое значение означает больший уровень ненадежности.

Grok получил итоговый балл 6 — один из лучших результатов в исследовании. Эксперты отметили высокую стабильность ответов, пользовательскую оценку на уровне 4,5 балла, а также минимальный простой, составивший всего 0,07%.

В то же время ChatGPT оказался в конце рейтинга с максимальным баллом 99. Следом за ним расположились Claude и Meta AI с показателями 75 и 70 соответственно. Китайский DeepSeek показал сопоставимые с Grok результаты: уровень "галлюцинаций" — 14% и 4 балла.

 

Ссылка на первоисточник
наверх