Российский объем рынка данных, по прогнозам экспертов, к 2030 году должен достигнуть 800 миллиардов рублей. Основным драйвером такого роста могут стать платформы искусственного интеллекта. Они вполне способны опередить другие технологические решения. Поэтому требования к данным, которые предъявляются со стороны больших языковых моделей (LLM), повышаются.
Меняется технологический стек, трансформируются подходы к политике управления данными. Старший вице-президент, руководитель блока "Технологии" Сбербанка Кирилл Меньшов рассказал, какие тренды определяют будущее развитие больших данных.AI-ассистенты возьмут на себя рутину
Сегодня на первый план выходит автоматизация задач. Возможности генеративного искусственного интеллекта позволяют внедрять новые решения, которые упрощают и автоматизируют рутинные действия. Многие компании уже внедряют решения, основанные на технологии speech2SQL и text2SQL. По сути это AI-ассистент, которому можно поставить задачу на естественном языке. Он воспримет ее и преобразует в готовый SQL-код, который затем отправит на исполнение и предоставит пользователю результат в виде графика, выборки данных или таблицы.
Инфраструктура для GenAI
Следующий тренд — изменение технологического стека (AI-native data stack). Можно говорить об инфраструктуре нового поколения, которая поддерживает развитие AI-платформ. Огромное количество продуктов и решений, которые заточены под потребности GenAI, сейчас выходит на рынок. Во всем мире растет сегмент нереляционных баз данных. Мы видим тренд на применении векторных баз данных и видим большой потенциал в развитии графовых.
Такие инструменты адаптированы для GenAI и отличаются высокой производительностью.Не менее важное требование — поставка и обмен большими массивами данных в реальном времени (real time data). Все сервисы компании должны поддерживать поставку данных в моменте. Это большой вызов с точки зрения инфраструктуры и технологий, но другого пути нет.
Интернет вещей и не только
Всем участникам рынка уже скоро придется работать с новыми типами данных. Постепенно они становятся основным источником информации для алгоритмов AI и решения бизнес-задач. Большой потенциал есть в применении и синтетических данных. Они используются в широком спектре задач, включая обучение алгоритмов искусственного интеллекта. При этом синтетические данные сами по себе являются продуктом, создаваемым искусственным интеллектом.
К 2035 году данные интернета вещей (IoT) составят 40% всех доступных данных. Работа с ними потребует значительных инвестиций в технологии и инфраструктуру обработки. Думая о данных будущего, мы в Сбере много вкладываем в повышение качества и полезности имеющихся данных. Занимаемся их описанием, разметкой и структурированием. Благодаря инструментам генеративного AI удается эффективно справляться с обработкой огромных объемов данных, которые ранее казались неподъемными.
К примеру, на основе искусственного интеллекта Сбера GigaChat разработали сервис, который восстанавливает описания атрибутов в наших базах данных. GenAI-технологии позволили решить задачу описания физической модели семи тысяч баз данных и примерно 67,5 млн атрибутов. AI справляется с этой работой в 290 раз быстрее человека, восстанавливает 99,6% описаний полей базы данных и генерирует 89% точных и качественных смысловых описаний.
AI-агенты — клиенты дата-платформ
Четвертый тренд — автономизация и внедрение AI-агентов. Он идет прямой дорогой к тому, что основными пользователями дата-платформ будут не аналитики, дата-инженеры и исследователи, а AI-агенты. Они решают поставленную задачу "под ключ", заменяя типовые "ручные" рутинные операции.
По нашим расчетам, AI-агенты увеличат нагрузку на инфраструктуру примерно в пять раз больше других пользователей. Поэтому нужно оптимизировать инфраструктуру и технологический стек, автоматизировать типовые задачи и подготовить платформу к работе с новыми типами данных.
Главное, без чего революция на этом рынке не произойдет, — изменение культуры работы с данными и пользовательского опыта. Сегодня AI-агенты помогают инженерам и аналитикам быстрее написать код, найти данные, проверить качество, построить графики. А уже завтра по запросу бизнес-пользователей они смогут находить тренды, делать выборки, проверять гипотезы, искать инсайты и строить модели.
Такую трансформацию пользовательского опыта нам всем еще предстоит осознать и найти ответ на вызовы, которые ставят перед нами агентные системы. Как изменится роль аналитиков и инженеров? Какие задачи они будут решать? Ответы на эти еще предстоит найти.
Автор - старший вице-президент, руководитель блока "Технологии" Сбербанка Кирилл Меньшов.
Автор выражает личное мнение, которое может не совпадать с позицией редакции.
Свежие комментарии