На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 717 подписчиков

Свежие комментарии

  • Виталий
    Опять "ОСТАВЛЯЕМ"? Охренеть...Захарова: РФ оста...
  • Алекс Сэм
    Да блин как бы он теперь жену не грохнул, так как в СИЗО его по-любому продырявили с такой то статьёйПетербуржец получ...
  • Александр Корякин
    Герой хренов.В Твери мужчина с...

Grok показал лучший результат по точности среди популярных чат-ботов

Модель искусственного интеллекта Grok компании xAI Илона Маска продемонстрировала наименьший уровень ошибок среди популярных чат-ботов. Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum, посвященный оценке надежности ИИ-сервисов.

Согласно исследованию, уровень так называемых "галлюцинаций" у Grok составил 8%, что почти в четыре раза ниже показателей ChatGPT и Google Gemini.

Для сравнения, у ChatGPT этот показатель достиг 35%, а у Gemini — 38%, что ставит под сомнение их использование в задачах, требующих высокой точности.

Оценка проводилась по нескольким критериям, включая частоту ошибок, стабильность работы, пользовательские рейтинги и время простоя. На основе совокупных данных каждому сервису присваивался балл по шкале от 0 до 99, где более высокое значение означает больший уровень ненадежности.

Grok получил итоговый балл 6 — один из лучших результатов в исследовании. Эксперты отметили высокую стабильность ответов, пользовательскую оценку на уровне 4,5 балла, а также минимальный простой, составивший всего 0,07%.

В то же время ChatGPT оказался в конце рейтинга с максимальным баллом 99. Следом за ним расположились Claude и Meta AI с показателями 75 и 70 соответственно. Китайский DeepSeek показал сопоставимые с Grok результаты: уровень "галлюцинаций" — 14% и 4 балла.

 

Ссылка на первоисточник
наверх