Исследователи инновационно объединили данные о структуре белка с генетическими последовательностями для построения эволюционных деревьев, выявляя глубоко укоренившиеся связи между видами с повышенной точностью. Этот новый подход использует как экспериментально определенные, так и предполагаемые структуры белков, потенциально революционизируя наше понимание истории жизни и развитие наук о здоровье путем уточнения мишеней для лечения рака.
Структуры белка в эволюционных исследованиях
Согласно исследованию, опубликованному сегодня (15 января) в Nature Communications, трехмерная форма белков раскрывает давние эволюционные связи в дереве жизни. В первый раз исследователи объединили данные о форме белка с геномными последовательностями, чтоб выстроить более надежные эволюционные деревья. Эти деревья представляют собой жизненно важные инструменты для ученых, которые помогают им исследовать историю жизни, отслеживать распространение патогенов и разрабатывать новые методы лечения болезней.
Преодоление насыщения данных с помощью белковых структур
Примечательно, что этот метод работает даже с предполагаемыми белковыми структурами, не экспериментально проверенными. Благодаря таким инструментам как AlphaFold 2, генерирующим огромное количество структурных данных, этот подход может дать новое понимание глубокой истории жизни на Земле. Существует 210 250 экспериментально определенных белковых структур, но XNUMX миллионов известных белковых последовательностей. Такие инициативы, как проект EarthBioGenome, могут создать еще миллиарды последовательностей белка в течение следующих нескольких лет. Большое количество данных открывает двери для применения этого подхода в беспрецедентных масштабах.
Традиционные и структурно-филогенетические подходы
В течение многих десятилетий биологи реконструировали эволюцию, отслеживая, как виды и гены отличаются от общих предков. Эти филогенетические или эволюционные деревья традиционно строятся путем сравнения последовательностей ДНК или белка и подсчета сходств и отличий для вывода о связях. Однако исследователи сталкиваются со значительным препятствием – проблемой, известной как насыщение. В течение длительного периода геномные последовательности могут изменяться настолько, что перестанут походить на свои предковые формы, стирая сигналы общего наследия.
«Вопрос насыщения доминирует в филогенезе и является основным препятствием для реконструкции древних связей», — говорит доктор Седрик Нотредам, исследователь Центра геномной регуляции (CRG) и ведущий автор исследования. «Это сродни размыванию древнего текста. Буквы становятся нечеткими, и сообщение теряется».
Преимущества использования структурных данных в филогенетике
Чтобы преодолеть эту проблему, исследовательская группа обратилась к физической структуре белков. Белки складываются в сложные формы, определяющие функцию клетки. его аминокислот. Хотя последовательности могут видоизменяться, общая структура часто остается. подобной функции сохранения. Исследователи предположили, что они могут оценить, насколько структуры расходятся со временем, измерив расстояние между парами аминокислот в белке, также известное как внутримолекулярное расстояние (IMD).
Методология и влияние структурной филогенетики
Исследование собрало огромный набор данных белков с известной структурой, охватывающей широкий спектр видов. Они рассчитали IMD для каждого белка и использовали эти измерения для построения филогенетических деревьев. из генетических последовательностей, но с важным преимуществом: на структурные деревья меньше влияет насыщение. сохраняли надежные сигналы, даже когда генетические последовательности значительно расходились.
Практические последствия и будущие применения
Признавая, что и последовательности, и структуры предлагают ценную информацию, команда разработала комбинированный подход, не только улучшивший надежность ветвей дерева, но и помогший различить правильные и неправильные связи.
«Это сродни тому, что два свидетеля описывают событие с разных точек зрения», — объясняет доктор Лейла Мансури, соавтор исследования. «Каждая дает уникальные детали, но вместе они дают более полную и более точную информацию».
Одним из практических примеров, когда комбинированный подход может оказать значительное влияние, является понимание взаимосвязей между киназами в геноме человека. Киназы – это белки, участвующие во многих различных важных клеточных функциях.
"Геном большинства млекопитающих, в том числе человека, содержит около 500 протеинкиназ, регулирующих большинство аспектов нашей биологии", - говорит д-р Нотредам. «Эти киназы являются основными мишенями для лечения рака, например таких препаратов, как иматиниб для людей или тоцераниб для собак».
Человеческие киназы возникли путем дублирования, которое происходило в течение последнего миллиарда лет.
Этот огромный временной масштаб невероятно усложняет построение точных генных деревьев, показывающих, как все эти киназы связаны. «Однако, как бы несовершенно оно ни было, эволюционное дерево киназы широко используется для понимания того, как оно взаимодействует с другими лекарствами. Усовершенствование этого дерева или улучшение деревьев других важных семейств белков было бы важным прогрессом для здоровья человека», – добавляет д-р Нотредам.
Расширение полезности эволюционных деревьев
Потенциальное применение работы выходит за рамки рака. Использование подхода к созданию более точных эволюционных деревьев может также улучшить наше понимание того, как развиваются болезни в более общем плане, способствуя разработке вакцин и методов лечения. Они могут помочь пролить свет на происхождение сложных признаков, управлять открытием новых ферментов для биотехнологии и даже помочь отследить распространение видов в ответ на изменение климата.