NatComm: Формы белков помогут глубже понять эволюционные связи
Трехмерная форма белка может быть использована для выявления глубоких и древних эволюционных связей на древе жизни.
Об этом говорится в исследовании, опубликованном в журнале Nature Communications.
Впервые исследователи используют данные о форме белков и объединяют их с данными о геномных последовательностях, чтобы повысить надежность эволюционных деревьев — важнейшего ресурса, используемого научным сообществом для понимания истории жизни, мониторинга распространения патогенов или создания новых методов лечения заболеваний.
Важно, что этот подход работает даже с предсказанными структурами белков, которые никогда не были экспериментально определены. Это повлияет на огромный объем структурных данных, генерируемых такими инструментами, как AlphaFold 2, и поможет открыть новые окна в древнюю историю жизни на Земле.
В мире существует 210 тысяч экспериментально определенных структур белков, но при этом известно 250 миллионов белковых последовательностей. Такие инициативы, как проект EarthBioGenome, в ближайшие несколько лет позволят получить еще миллиарды белковых последовательностей. Обилие данных открывает возможности для применения этого подхода в беспрецедентных масштабах.
На протяжении многих десятилетий биологи занимались реконструкцией эволюции, прослеживая, как виды и гены расходятся от общих предков. Эти филогенетические или эволюционные деревья традиционно строятся путем сравнения последовательностей ДНК или белков и подсчета сходств и различий, чтобы сделать вывод о родстве.
Однако исследователи сталкиваются с серьезным препятствием — проблемой, известной как перенасыщение. За огромное количество времени геномные последовательности могут измениться настолько, что перестанут напоминать своих предков, стирая сигналы об общем наследии.
Проблема насыщения доминирует в филогении и представляет собой главное препятствие для реконструкции древних отношений, — говорит доктор Седрик Нотредам, научный сотрудник Центра регулирования генома (CRG) и ведущий автор исследования.
Это похоже на эрозию древнего текста. Буквы становятся неразличимыми, и смысл теряется.
Чтобы решить эту проблему, исследовательская группа обратилась к физическим структурам белков. Белки складываются в сложные формы, которые определяют функции клетки. Эти формы более консервативны в ходе эволюции, чем сами последовательности, то есть они меняются медленнее и дольше сохраняют особенности предков.
Форма белка определяется его аминокислотной последовательностью. Хотя последовательности могут мутировать, общая структура часто остается схожей, чтобы сохранить функцию. Исследователи предположили, что они могут определить, насколько сильно расходятся структуры со временем, измеряя расстояние между парами аминокислот в белке, также известное как внутримолекулярные расстояния (IMD).
В ходе исследования был собран массивный набор данных белков с известной структурой, охватывающий широкий спектр видов. Они рассчитали IMD для каждого белка и использовали эти измерения для построения филогенетических деревьев.
Оказалось, что деревья, построенные на основе структурных данных, близко совпадают с деревьями, полученными на основе генетических последовательностей, но с важным преимуществом: структурные деревья меньше страдают от насыщения. Это означает, что они сохраняли надежные сигналы даже при значительном расхождении генетических последовательностей.
Понимая, что и последовательности, и структуры дают ценные сведения, команда разработала комбинированный подход, который не только повысил надежность ветвей дерева, но и помог отличить правильные связи от неправильных.
Это похоже на то, как если бы два свидетеля описывали событие с разных сторон, — объясняет доктор Лейла Мансури, соавтор исследования.
Каждый из них сообщает уникальные подробности, но вместе они дают более полный и точный отчет.
Одним из практических примеров, когда комбинированный подход может оказать значительное влияние, является понимание взаимосвязей между киназами в геноме человека. Киназы — это белки, участвующие во множестве различных важных клеточных функций.
В геноме большинства млекопитающих, включая человека, содержится около 500 белковых киназ, которые регулируют большинство аспектов нашей биологии, — говорит доктор Нотредам.
Эти киназы являются основными мишенями для лечения рака, например, такие препараты, как иматиниб для людей или тоцераниб для собак.
Человеческие киназы возникли в результате дупликаций, происходивших на протяжении последнего миллиарда лет.
В человеческом геноме самые дальние родственники киназ находятся на расстоянии около миллиарда лет друг от друга, — говорит доктор Нотредам.
Они дублировались у общего предка нашего общего предка.
Такая огромная временная шкала делает невероятно сложным построение точных генных деревьев, показывающих, как все эти киназы связаны между собой.
Тем не менее, каким бы несовершенным оно ни было, эволюционное дерево киназ широко используется для понимания взаимодействия с другими лекарствами. Улучшение этого дерева или деревьев других важных семейств белков стало бы важным шагом вперед для здоровья человека, — добавляет доктор Нотредаме.
Потенциальное применение этой работы выходит за рамки рака. Использование этого подхода для создания более точных эволюционных деревьев может также улучшить наше понимание того, как развиваются болезни в целом, что поможет в разработке вакцин и методов лечения. Они также могут пролить свет на происхождение сложных признаков, помочь в открытии новых ферментов для биотехнологий и даже отследить распространение видов в ответ на изменение климата.
Ранее ученые выяснили, как белки связаны с делением клеток.
Фото: нейросеть