Учебный сайт Люды Андреевой


Задание 1

Мной было выбрано 7 бактерий, чьи полные названия и сокращения приведены в следующей таблице:

Название Мнемоника
Bradyrhizobium japonicum BRAJA
Haemophilus influenzae HAEIN
Neisseria meningitidis NEIMA
Pasteurella multocida PASMU
Ralstonia pickettii RALPJ
Vibrio cholerae VIBCH
Yersinia pseudotuberculosis YERPS

Руководствуясь филогенетическим деревом, приведённым в задании, была составлена скобочная формула:

(BRAJA,((RALPJ,NEIMA),(VIBCH,((PASMU,HAEIN),YERPS))))

Изображение дерева:

Дерево содержит 4 нетривиальные ветви:

Задание 2

С помощью сервиса NCBI (http://www.ncbi.nlm.nih.gov/taxonomy/) определим, к каким таксонам принадлежат выбранные бактерии. Результат приведён в таблице:

Название Таксон
Bradyrhizobium japonicum Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Bradyrhizobiaceae; Bradyrhizobium
Haemophilus influenzae Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Haemophilus
Neisseria meningitidis Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria
Pasteurella multocida Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Pasteurella
Ralstonia pickettii Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Ralstonia
Vibrio cholerae Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Vibrio
Yersinia pseudotuberculosis Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia

На рисунке в рамки взяты клады, выделяющие таксоны. Это клада (((PASMU, HAEIN),YERPS),VIBCH) - гаммапротеобактерии, и ветвь (NEIMA, RALPJ) - бетапротеобактерии:

Будем реконструировать дерево по семейству белков энолаз (ENO). Из базы данных Swiss-Prot были взяты последовательности энолаз для всех 7 бактерий: eno.txt.
Выравнивание полученных последовательностей получим, применив программу muscle. Файл с результатом выравнивания: eno_aligned.fasta.

fprotpars

На основе выравнивания реконструируем дерево программой fprotpars пакета EMBOSS (команда: fprotpars -sequence eno_aligned.fasta). Получено 2 файла с неукоренённым деревом и скобочной формулой:


                 +--ENO_RALPJ
     +-----------6
     !           +--ENO_NEIMA
     !
  +--5           +--ENO_YERPS
  !  !     +-----4
  !  !     !     +--ENO_VIBCH
  !  +-----3
  1        !     +--ENO_PASMU
  !        +-----2
  !              +--ENO_HAEIN
  !
  +-----------------ENO_BRAJA


(((ENO_RALPJ,ENO_NEIMA),((ENO_YERPS,ENO_VIBCH),(ENO_PASMU,ENO_HAEIN)))

Укореним дерево в точке 5. От правильного оно отличается взаимоположением ветвей (PASMU, HAEIN) и (YERPS, VIBCH). В правильном дереве YERPS является более близким родственником организмам PASMU и HAEIN, чем VIBCH. На предложенном программой дереве они являются родственниками одного уровня. Таким образом, в правильном дереве присутствуют клады ((HAEIN, PASMU), YERPS) и (((HAEIN, PASMU), YERPS), VIBCH), а на построенном - ((YERPS,VIBCH),(PASMU,HAEIN)).

fprotdist

С помощью программы fprotdist получим матрицу расстояний между последовательностями энолаз.

            ENO_BRAJA ENO_HAEIN ENO_PASMU ENO_VIBCH ENO_YERPS ENO_NEIMA ENO_RALPJ

ENO_BRAJA   0.000000  0.545152  0.538743  0.568102  0.546644  0.490374  0.440661
  
ENO_HAEIN   0.545152  0.000000  0.044043  0.174488  0.145718  0.482506  0.424484
  
ENO_PASMU   0.538743  0.044043  0.000000  0.167376  0.137104  0.503496  0.446629
  
ENO_VIBCH   0.568102  0.174488  0.167376  0.000000  0.124539  0.513484  0.459277
  
ENO_YERPS   0.546644  0.145718  0.137104  0.124539  0.000000  0.494206  0.426479
  
ENO_NEIMA   0.490374  0.482506  0.503496  0.513484  0.494206  0.000000  0.318335
  
ENO_RALPJ   0.440661  0.424484  0.446629  0.459277  0.426479  0.318335  0.000000

В ультраметрическом пространстве выполняется:
d(A,B) <= max(d(A,C), d(B,C))

A = ENO_PASMU, B = ENO_VIBCH, c = ENO_RALPJ. d(A,B) = 0.167376
d(A,C) = 0.446629
d(B,C) = 0.459277
Свойство ультраметричности выполняется.
Однако, если выбрать немного другую тройку:
A = ENO_VIBCH, B = ENO_BRAJA, c = ENO_RALPJ,
то свойство ультраметричности выполняться не будет (считаем различие в 0.1 значительным):
d(A,B) = 0.568102
d(A,C) = 0.459277
d(B,C) = 0.440661

Теперь исследуем свойство аддитивности, заключающееся в следующем:
A,B,C,D - современные объекты, и из сумм d(A,B)+d(C,D); d(A,D)+d(B,C); d(A,C)+d(B,D) две равны и больше третьей.

Пусть A = ENO_HAEIN, B = ENO_PASMU, C = ENO_YERPS, D = ENO_RALPJ.

Если считать незначительной разницу 0.030809 между суммами d(A,C)+d(B,D) и d(A,D)+d(B,C), то свойство аддитивности выполняется.

fneighbor

Получим ещё две реконструкции дерева программой fneighbor с использованием алгоритмов UPGMA и Neighbor-Joining.
Neighbor-joining method, неукоренённое дерево, не предполагает молекулярных часов:

    +----------ENO_NEIMA
  +-1
  ! +-------ENO_RALPJ
  !
  !              +ENO_HAEIN
  !           +--3
  !           !  +ENO_PASMU
  2-----------4
  !           ! +----ENO_VIBCH
  !           +-5
  !             +--ENO_YERPS
  !
  +---------------ENO_BRAJA
Скобочная формула:
((ENO_NEIMA:0.18782,ENO_RALPJ:0.13051):0.03317,((ENO_HAEIN:0.02338, ENO_PASMU:0.02066):0.04994,(ENO_VIBCH:0.07559,ENO_YERPS:0.04895):0.02194):0.1984 0,ENO_BRAJA:0.27318);

UPGMA method, укоренённое дерево, подразумеваются молекулярные часы

    +-------------ENO_BRAJA
  +-5
  ! !   +---------ENO_NEIMA
  ! +---4
  !     +---------ENO_RALPJ
--6
  !             +ENO_HAEIN
  !         +---1
  !         !   +ENO_PASMU 
  +---------3
            ! +---ENO_VIBCH
            +-2
              +---ENO_YERPS

Скобочная формула:
((ENO_BRAJA:0.23276,(ENO_NEIMA:0.15917,ENO_RALPJ:0.15917):0.07359):0.01512, ((ENO_HAEIN:0.02202,ENO_PASMU:0.02202):0.05606,(ENO_VIBCH:0.06227, ENO_YERPS:0.06227):0.01582):0.16980);
Нетривиальные ветви обоих деревьев, построенных fneighbor, совпадают, и если укоренить неукоренённое дерево (Neighbor-joining method), то оно станет идентичным UPGMA method дереву.
Те же нетривиальные ветви имеют и дерево, построенное fprotpars, и правильное. Однако, не смотря на то, что все реконструированные деревья могут быть приведены к одному виду, они не будут совпадать с правильным из-за присутствия в них клады ((YERPS,VIBCH),(PASMU,HAEIN)) вместо (((HAEIN, PASMU), YERPS), VIBCH).

©Andreeva_2010