Мной было выбрано 7 бактерий, чьи полные названия и сокращения приведены в следующей таблице:
Название | Мнемоника |
Bradyrhizobium japonicum | BRAJA |
Haemophilus influenzae | HAEIN |
Neisseria meningitidis | NEIMA |
Pasteurella multocida | PASMU |
Ralstonia pickettii | RALPJ |
Vibrio cholerae | VIBCH |
Yersinia pseudotuberculosis | YERPS |
Руководствуясь филогенетическим деревом, приведённым в задании, была составлена скобочная формула:
(BRAJA,((RALPJ,NEIMA),(VIBCH,((PASMU,HAEIN),YERPS))))
Изображение дерева:
Дерево содержит 4 нетривиальные ветви:
С помощью сервиса NCBI (http://www.ncbi.nlm.nih.gov/taxonomy/) определим, к каким таксонам принадлежат выбранные бактерии. Результат приведён в таблице:
Название | Таксон |
Bradyrhizobium japonicum | Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Bradyrhizobiaceae; Bradyrhizobium |
Haemophilus influenzae | Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Haemophilus |
Neisseria meningitidis | Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria |
Pasteurella multocida | Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Pasteurella |
Ralstonia pickettii | Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Ralstonia |
Vibrio cholerae | Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Vibrio |
Yersinia pseudotuberculosis | Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia |
Будем реконструировать дерево по семейству белков энолаз (ENO). Из базы данных Swiss-Prot были
взяты последовательности энолаз для всех 7 бактерий: eno.txt.
Выравнивание полученных последовательностей получим, применив программу muscle. Файл с результатом выравнивания:
eno_aligned.fasta.
На основе выравнивания реконструируем дерево программой fprotpars пакета EMBOSS (команда: fprotpars -sequence eno_aligned.fasta). Получено 2 файла с неукоренённым деревом и скобочной формулой:
+--ENO_RALPJ +-----------6 ! +--ENO_NEIMA ! +--5 +--ENO_YERPS ! ! +-----4 ! ! ! +--ENO_VIBCH ! +-----3 1 ! +--ENO_PASMU ! +-----2 ! +--ENO_HAEIN ! +-----------------ENO_BRAJA
Укореним дерево в точке 5. От правильного оно отличается взаимоположением ветвей (PASMU, HAEIN) и (YERPS, VIBCH). В правильном дереве YERPS является более близким родственником организмам PASMU и HAEIN, чем VIBCH. На предложенном программой дереве они являются родственниками одного уровня. Таким образом, в правильном дереве присутствуют клады ((HAEIN, PASMU), YERPS) и (((HAEIN, PASMU), YERPS), VIBCH), а на построенном - ((YERPS,VIBCH),(PASMU,HAEIN)).
С помощью программы fprotdist получим матрицу расстояний между последовательностями энолаз.
ENO_BRAJA ENO_HAEIN ENO_PASMU ENO_VIBCH ENO_YERPS ENO_NEIMA ENO_RALPJ ENO_BRAJA 0.000000 0.545152 0.538743 0.568102 0.546644 0.490374 0.440661 ENO_HAEIN 0.545152 0.000000 0.044043 0.174488 0.145718 0.482506 0.424484 ENO_PASMU 0.538743 0.044043 0.000000 0.167376 0.137104 0.503496 0.446629 ENO_VIBCH 0.568102 0.174488 0.167376 0.000000 0.124539 0.513484 0.459277 ENO_YERPS 0.546644 0.145718 0.137104 0.124539 0.000000 0.494206 0.426479 ENO_NEIMA 0.490374 0.482506 0.503496 0.513484 0.494206 0.000000 0.318335 ENO_RALPJ 0.440661 0.424484 0.446629 0.459277 0.426479 0.318335 0.000000
A = ENO_PASMU, B = ENO_VIBCH, c = ENO_RALPJ.
d(A,B) = 0.167376
d(A,C) = 0.446629
d(B,C) = 0.459277
Свойство ультраметричности выполняется.
Однако, если выбрать немного другую тройку:
A = ENO_VIBCH, B = ENO_BRAJA, c = ENO_RALPJ,
то свойство ультраметричности выполняться не будет (считаем различие в 0.1 значительным):
d(A,B) = 0.568102
d(A,C) = 0.459277
d(B,C) = 0.440661
Теперь исследуем свойство аддитивности, заключающееся в следующем:
A,B,C,D - современные объекты, и из сумм
d(A,B)+d(C,D); d(A,D)+d(B,C); d(A,C)+d(B,D) две равны и больше третьей.
Пусть A = ENO_HAEIN, B = ENO_PASMU, C = ENO_YERPS, D = ENO_RALPJ.
Получим ещё две реконструкции дерева программой fneighbor с использованием алгоритмов
UPGMA и Neighbor-Joining.
Neighbor-joining method, неукоренённое дерево, не предполагает молекулярных часов:
+----------ENO_NEIMA +-1 ! +-------ENO_RALPJ ! ! +ENO_HAEIN ! +--3 ! ! +ENO_PASMU 2-----------4 ! ! +----ENO_VIBCH ! +-5 ! +--ENO_YERPS ! +---------------ENO_BRAJAСкобочная формула:
UPGMA method, укоренённое дерево, подразумеваются молекулярные часы
+-------------ENO_BRAJA +-5 ! ! +---------ENO_NEIMA ! +---4 ! +---------ENO_RALPJ --6 ! +ENO_HAEIN ! +---1 ! ! +ENO_PASMU +---------3 ! +---ENO_VIBCH +-2 +---ENO_YERPSСкобочная формула: