Моделирование эволюции белка TolB из E.coli.
В исследовании необходимо было произвести моделирование эволюции гена,
кодирующего белок TolB из E.coli (длина гена без учёта старт- и стопкадона
составляет 1290 нуклеотидов, что соответствует 430 амнокислотным остаткам
белка). Для исследования была предоставлена скобочная структура дерева,
согласно которой необходимо произвести "эволюционные" события:
(
A:90,
(B:80,
((C:60,D:60):10,
(E:60,F:60):10):10):10
);
, где числа обозначают эволюционные расстояния как колличество замен на сто нуклеотидов,
которые необходимо будет смоделировать.
Для моделирования расстояния удобно перевести в абсолютное колличество мутаций для гена данной длины.
Соответственно для пересчёта расстояние из скобочной структуры умножаем на длину гена и делим на сто:
S = ( L * 1290 ) / 100 = L * 12.9.
В результате скобочная для гена данной длины структура примет вид:
(
A:1161,
(B:1032,
((C:774,D:774):129,
(E:774,F:774):129):129):129
);
Таким образом, сценарий эволюции можно проиллюстрировать следующим деревом:
На дереве узел с нулевым номером обозначает реальную последовательность TolB.
Моделирование проводилось при помощи программы msbar биоинформатического пакета
EMBOSS . Был составлен скрипт, производящий все необходимые действия из командной
строки Unix на сервере pvm .
Скрипт имеет следующее содержание:
msbar s0.fasta A.fasta -point 4 -count 1161 -auto
msbar s0.fasta s1.fasta -point 4 -count 129 -auto
msbar s1.fasta B.fasta -point 4 -count 1032 -auto
msbar s1.fasta s2.fasta -point 4 -count 129 -auto
msbar s2.fasta s3.fasta -point 4 -count 129 -auto
msbar s2.fasta s4.fasta -point 4 -count 129 -auto
msbar s3.fasta C.fasta -point 4 -count 774 -auto
msbar s3.fasta D.fasta -point 4 -count 774 -auto
msbar s4.fasta E.fasta -point 4 -count 774 -auto
msbar s4.fasta F.fasta -point 4 -count 774 -auto
Анализ модели
Переход на главную страничку здесь.