Сравнение разных способов оценки эволюционных расстояний между 2-мя генами

 

На главную страницу четвертого семестра

  В качестве модели для изучения эволюционных расстояний был взят набор последовательностей, полученный из гена frc из генома E. coli K12 с помощью программы msbar пакета EMBOSS. Эта программма предназначена для моделирования эволюции последовательностей исходя из предположения, что происходят только замены, причем конкретный нуклеотид может с равной вероятностью замениться на любой из 4 нуклеотидов (т.е. может, вообще говоря остаться неизменным). Сверх исходной было задано получение 6 последовательностей, каждая следующая - путем 10 случайных замен на каждые 100 нуклеотидов (125 замен на всю последовательность). Таким образом, каждая следующая последовательность отличается от предыдущей на 7-8 условных единиц из-за того, что примерно в четверти случаев необходимые замены не происходили. Это и есть "истинные эволюционные расстояния". На первом листе книги Excel в качестве истинных расстояний приведены расстояния с шагом в 7,5, среди которых есть и дробные. Это означает, что на каждые 10 нуклеотидов в среднем приходится 7,5 замен. Далее для получения матриц расстояний была использована программа distmat. Она позволяет получать как матрицу попарных различий (Uncorrected distances, D), так и матрицу Джукс-Канторовских расстояний (JC). На первом листе приведенной книги Excel можно сравнить полученные матрицы между собой. Бросается в глаза то, что шагом эволюционных различий является отнюдь не 10, а около 7 в первом случае, около 8 - во втором. Объяснение этого факта см. выше. При этом с увеличением номеров мутантных последовательностей убывает расстояние между ними - не очень заметно, но все же. Это связано с тем, что при итерациях msbar повышается вероятность попадания замены на уже измененную позицию, а все замены мы в обоих случаях считаем равновероятными.

На следующем листе можно наблюдать расстояния между исходной последовательностью и всеми мутантными, полученные разными способами, а также истинные расстояния. Также на этом листе можно сравнить графики зависимости D от T и JC от T. Из этих графиков мы видим, что Джукс-Канторовские расстояния с ростом истинных расстояний изменяются практически по линейному закону, в то время как приращение несовпадений, т.е. попарных различий, уменьшается с ростом аргумента, и зависимость становится похожей на логарифмическую. Таким образом, Джукс-Канторовские расстояния лучшее коррелируют с истинными расстояниями, поэтому, видимо, это более удачный метод оценки.

Ссылка на книгу Excel.


©Петрова Ирина