Спорт

Grok показал лучший результат по точности среди популярных чат-ботов

Модель искусственного интеллекта Grok компании xAI Илона Маска продемонстрировала наименьший уровень ошибок среди популярных чат-ботов. Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum, посвященный оценке надежности ИИ-сервисов.

Согласно исследованию, уровень так называемых "галлюцинаций" у Grok составил 8%, что почти в четыре раза ниже показателей ChatGPT и Google Gemini.

Для сравнения, у ChatGPT этот показатель достиг 35%, а у Gemini — 38%, что ставит под сомнение их использование в задачах, требующих высокой точности.

Оценка проводилась по нескольким критериям, включая частоту ошибок, стабильность работы, пользовательские рейтинги и время простоя. На основе совокупных данных каждому сервису присваивался балл по шкале от 0 до 99, где более высокое значение означает больший уровень ненадежности.

Grok получил итоговый балл 6 — один из лучших результатов в исследовании. Эксперты отметили высокую стабильность ответов, пользовательскую оценку на уровне 4,5 балла, а также минимальный простой, составивший всего 0,07%.

В то же время ChatGPT оказался в конце рейтинга с максимальным баллом 99. Следом за ним расположились Claude и Meta AI с показателями 75 и 70 соответственно. Китайский DeepSeek показал сопоставимые с Grok результаты: уровень "галлюцинаций" — 14% и 4 балла.

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

Газета.ру

Популярные статьи

Свежие комментарии

Спорт

Grok показал лучший результат по точности среди популярных чат-ботов