Биоинформатики из Сколтеха разработали нейросеть, которая умеет предсказывать, насколько точно подобрана «направляющая» РНК, используемая при редактирования генома по технологии CRISPR/CAS. Рассказываем, как эта технология работает в селекции растений и в чём ценность вклада российских учёных.
Обычно для выведения новых сортов растений селекционеры либо скрещивают между собой особи, обладающие желаемыми характеристиками, либо отбирают из популяции для дальнейшего размножения те особи, чьи характеристики они хотят сохранить и развить в дальнейшем. В обоих случаях селекционеры имеют дело с геномом — он либо создаётся, либо стабилизируется.
Однако в наш век технологий наука о селекции бурно развивается благодаря новым открытиям и разработкам в области искусственного редактирования генома. Если селекционеры обладают информацией о том, какие гены за что отвечают, и имеют возможность их убирать или вставлять, их возможности увеличиваются многократно. Они могут не просто ускорять процесс выведения новых сортов растений и пород животных, но и создавать такие, которые природа не смогла бы сделать никогда.
Молекулярные ножницы
Одной из популярных технологий генной инженерии является CRISPR/CAS, также известную как «молекулярные ножницы». Её позаимствовали у иммунной системы бактерий. Последним она нужна для того, чтобы защищать себя от бактериофагов (вирусов, уничтожающих бактериальные клетки).
Если объяснять простыми словами, ДНК бактерий содержат CRISPR-массивы — то есть короткие зеркальные повторы нуклеотидов, регулярно расположенные группами. Особенность массивов CRISPR заключается в том, что в них встречаются небольшие фрагменты ДНК бактериофагов.
Рядом с CRISPR-массивами расположена группа генов, кодирующих белки CAS, одним из которых является удивительный CAS9. Именно он занимается тем, что ищет чужеродные ДНК и вырезает из них занесённый в CRISPR фрагмент ДНК (если, конечно, находит его). В процессе создания белка CAS9 геном бактерии формирует направляющую РНК — она объёдиняется с белком и помогает найти тот самый фрагмент.
Бактериофаги после вырезания фрагментов в своей ДНК погибают, так как они не умеют «лечить» эти изменения. Однако на это способны живые организмы, в том числе растения и животные. После того, как белок CAS9 вырежет фрагмент, организм может либо сшить кусочки ДНК, либо вставить в это место любой другой фрагмент (на этом этапе ему можно подсунуть нужный).
Благодаря молекулярным ножницам на рынке США в 2016 году одобрили к продаже шампиньоны, которые не темнеют на воздухе. А в 2017 году японские учёные вывели сорт томатов, которые не нуждаются в опылении. В этом году японская компания Sanatech Seed начала продавать другой сорт томатов, у которого в 4-5 раз больше ГАМК, чем у обычных.
И этот список далеко не полный — число растений, полученных с помощью CRISPR/CAS, исчисляется сотнями.
CRISPR/CAS + Искусственный Интеллект
Однако технология молекулярных ножниц не обошлась без минусов.
«Основная проблема технологии — это биоинформатическое предсказание мишеней для направляющих РНК при редактировании тех или иных генов человека, животных и растений», — говорил в 2016 году Константин Северинов, доктор биологических наук и профессор Сколтеха.
В дальнейшем Северинов и его коллеги занялись поиском решений, которые помогли бы решить проблемы более точного выбора направляющих РНК, и даже заручились поддержкой Российского научного фонда — он выделил учёным грант на исследования.
По итогу их искания привели к созданию набора нейросетей, которые дают оценку вероятности разрезания фрагментов ДНК в правильном месте для заданных направляющих РНК. Набор представляет собой гибрид капсульных сетей и гауссовых процессов, он также способен к обучению благодаря наличию памяти, определённым образом изменяемой каждый раз, когда система считает что-либо в режиме тренировки.
Научную работу, посвящённую этой нейросети, учёные опубликовали в журнале Nucleic Acids Research. В ней авторы предложили заранее рассчитанный их нейросетью набор последовательностей РНК, позволяющих точно изменять гены 22-й хромосомы человека.
«Результаты нашей работы могут быть применимы в любом приложении технологий, которые основаны на CRISPR/CAS, будь то терапия генетических заболеваний, агротехнологии, или эксперименты в фундаментальных научных исследованиях», — сказал Богдан Кириллов, один из создателей набор нейросетей.