Science: Создана революционная технология, которая переписывает ДНК
Брайан Хи руководит Лабораторией эволюционного дизайна в Стэнфорде, где он работает на стыке искусственного интеллекта и биологии. Не так давно Хи задумался над провокационным вопросом: если такой инструмент, как ChatGPT, может составлять оригинальные предложения на основе паттернов, найденных в массивных коллекциях ранее написанных слов, то что произойдет, если заменить написанные слова генетическим кодом?
Ответом на этот, казалось бы, простой вопрос стала Evo, генеративная модель ИИ, которая пишет генетический код. Хи и его коллеги из Института Арк и Калифорнийского университета в Беркли представили Evo в статье, опубликованной в журнале Science. По словам Хи, с помощью Evo исследователи смогут понять, как работают геномы микробов и вирусов, создать новые белки (то есть лекарства), которых раньше не существовало, и перепрограммировать микробы на выполнение удивительных задач — от улучшения фотосинтеза для связывания углерода и повышения урожайности до поглощения микропластика в океанах.
Вместо того чтобы использовать грубую силу или выискивать перспективные последовательности в природе, что весьма непредсказуемо, у нас теперь есть модель искусственного интеллекта для создания интересующих нас систем, позволяющая исследователям сосредоточиться только на самых перспективных возможностях, — говорит Хи, доцент кафедры химического машиностроения.
Evo делает доступными геномы целых форм жизни и ускоряет процесс биоинженерного проектирования.
Evo может даже привести к более глубокому пониманию самой эволюции, новому пониманию генетических заболеваний и новым методам лечения — и все это на компьютере, а не в лаборатории.
Естественное понимание
Вдохновение исходит от самой природы. Инструкции всего живого закодированы в ДНК. Лучшее понимание сложного взаимодействия ДНК, РНК и биопротеинов — и того, как они эволюционировали с течением времени, — приведет к углублению знаний и возможности перепрограммировать микробы в полезные технологии.
Но все не так просто, как кажется. Даже простые микробы имеют сложные геномы, состоящие из миллионов пар оснований. Два ключевых достижения Evo по сравнению с аналогичными существующими инструментами — это увеличение длины последовательностей, которые модели могут обрабатывать одновременно, с примерно 8 000 пар оснований до более чем 131 000 пар оснований — так называемое «контекстное окно» — и улучшение разрешения до масштабов отдельных нуклеотидов, строительных блоков ДНК.
Программа Evo была обучена на геномах 80 000 микробов и 2,7 миллиона геномов прокариот и фагов, охватывающих 300 миллиардов нуклеотидов, а также на небольших петлях ДНК, известных как плазмиды. Однако, чтобы исключить возможность использования Evo для разработки биооружия, команде пришлось исключить геномы вирусов, которые, как известно, заражают людей и некоторые другие организмы.
Evo способен изучать, как небольшие изменения в нуклеотидных последовательностях влияют на эволюционную пригодность целых организмов, и генерировать последовательности ДНК длиной более 1 миллиона пар оснований — более чем в семь раз больше контекстного окна в 131 000 пар оснований, добавил Хи. Для сравнения, длина самых маленьких «минимальных» бактериальных геномов составляет около 580 000 пар оснований, отмечают исследователи.
Доказательство концепции
В качестве доказательства концептуальности конструкторских возможностей Evo Хи и его коллеги использовали Evo для создания новых синтетических молекулярных комплексов и систем CRISPR-Cas. Системы CRISPR-Cas похожи на крошечные молекулярные машины, которые используют белки и РНК в тандеме для редактирования ДНК. В ответ на эту просьбу Эво создал полностью функциональную, ранее неизвестную CRISPR-систему, которая была проверена после тестирования 11 возможных конструкций. Исследование CRISPR в Evo — это первый пример одновременного кодирования белка и РНК с помощью языковой модели, отметил Хи.
В дальнейшем Хи уже работает над расширением возможностей Evo по обработке больших геномных последовательностей и достижению большего контроля над результатами, а также над расширением своих исследований за пределы микробного мира до геномов человека и других организмов.
Evo открывает множество очень интересных исследований на стыке машинного обучения и биологии, — говорит Хи.
Он создает возможности для невообразимых ранее открытий и ускоряет нашу способность к инженерии самой жизни.
Ранее американские ученые встали на защиту CRISPR.