Специалисты Института искусственного интеллекта AIRI совместно с коллегами из МФТИ разработали архитектуру RMT – Recurrent Memory Transformer – для ранее разработанной в России нейросети GENA. Об этом "Газете.Ru" рассказала биоинформатик, научный сотрудник и руководитель группы "Биоинформатика" AIRI Ольга Кардымон.
Нейросеть GENA может анализировать последовательности ДНК и искать в них закономерности. Ее можно использовать для определения влияния мутаций на работу генов, поиска различных участков генома, классификации живых организмов на основе данных секвенирования и прочих задач.
"Первый вариант GENA работает с длиной приблизительно в 3000 нуклеотидов, вторая архитектура модели позволяет на вход подавать 24000 нуклеотидов. Обе модели уже выложены в открытый доступ и доступны мировому сообществу. У нас есть своя новая собственная архитектура, разработанная в AIRI совместно с коллегами из МФТИ, называется RMT – Recurrent Memory Transformer. Она потенциально может работать с неограниченной длиной последовательности текста, на ряде задач успешно справляется с длинами в 1-2 миллиона букв", – объяснила Кардымон.
По словам специалиста, увеличение длины анализируемой нейросетью последовательности ДНК — крайне важная для ученых задача.
"Потому что нужно понимать контекст, в котором есть мутации. Чем длиннее мы даем последовательность, тем больше нейросеть может в ней увидеть и выучить какие-то закономерности. Наша задача и состоит в том, чтобы увеличить последовательность, которую может анализировать нейросеть", – добавила биоинформатик.
Подробнее о том, как нейросети ищут мутации в геноме человека, создают не существовавшие ранее в природе белки и предсказывают эффективность вакцин и лекарств – в материале "Газеты.Ru".
Свежие комментарии