На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 479 подписчиков

Свежие комментарии

  • Часовщик
    Одни уже укрепили связи с пиндосами,так что уже больше миллиона друзей пиндосов,закопали.Давайте не тормозите.Глава МИД Армении...
  • Андрей Зарубкин
    Что достигли арабы?КСИР Ирана назвал...
  • Андрей Зарубкин
    Белоруссы! Берегите Лукашенко! Ваши соросята могут разворовать вашу страну.Совбез Белоруссии...

NYT: ИИ столкнулся с ограничением в виде нехватки открытых данных для обучения

Задача развития искусственного интеллекта сталкивается с проблемой ограничения доступа к данным. Согласно исследованию MIT, проведенному в рамках проекта Data Provenance Initiative, многие важные источники интернета начали ограничивать использование их данных. Это может отрицательно повлиять на обучение мощных систем ИИ.

Об этом сообщает издание New York Times (NYT).

В ходе анализа более 14 тыс. доменов, использующихся в трех основных базах данных для обучения ИИ, была выявлена существенная тенденция к "кризису согласия". Оказалось, что около 5% всех данных и 25% самых ценных данных уже ограничены протоколом "исключения роботов" (Robots Exclusion Protocol), который позволяет владельцам сайтов блокировать автоматизированную сборку данных.

Кроме того, почти 45% данных из набора данных C4 теперь ограничены условиями обслуживания веб-сайтов. Новая политика ограничений будет касаться не только тех компаний, которые разрабатывают ИИ, но и ученых, исследователей и некоммерческих организаций, использующих веб-данные.

 

Ссылка на первоисточник

Картина дня

наверх