Московский Государственный Университет имени М.В.Ломоносова

Факультет Биоинженерии и Биоинформатики

Учебный сайт Сеферяна Мелика

Главная

I Семестр

II Семестр

III Семестр

IV Семестр

Проекты

Официальный сайт ФББ

Официальный сайт МГУ

Полезные ссылки

Реконструкция и сравнение деревьев.

Занятие 1

Отобранные бактерии:

Название Мнемоника
Burkholderia cenocepaciaBURCA
Neisseria meningitidis NEIMA
Bradyrhizobium japonicumBRAJA
Escherichia coliECOLI
Rhodobacter sphaeroides RHOS4
Vibrio choleraeVIBCH
Pseudomonas aeruginosa PSEAE
Salmonella typhimuriumSALTY

Скобочная формула дерева

(((((ECOLI, SALTY), VIBCH), PSEAE), (NEIMA, BURCA)), (PHOS4, BRAJA));
  

Изображение дерева


Ветви дерева

Дерево содержит 5 нетривиальных ветвей:

1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
3) {SALTY, ECOLI, VIBCH, PSEAE} против {NEIMA, BURCA, RHOS4, BRAJA}
4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA}
5) {SALTY, ECOLI, VIBCH, PSEAE, RHOS4, BRAJA} против {NEIMA, BURCA}

Занятие 2

1) Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, можно определить, к каким таксонам относятся отобранные бактерии:
Название Мнемоника Таксономия
Burkholderia cenocepaciaBURCABacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia; Burkholderia cepacia complex
Neisseria meningitidisNEIMABacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria
Pseudomonas aeruginosaPSEAEBacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Pseudomonas; Pseudomonas aeruginosa group
Escherichia coliECOLIBacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia
Salmonella typhimuriumSALTYBacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella; Salmonella enterica; Salmonella enterica subsp. enterica
Vibrio choleraeVIBCHBacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Vibrio
Rhodobacter sphaeroidesRHOS4Bacteria; Proteobacteria; Alphaproteobacteria; Rhodobacterales; Rhodobacteraceae; Rhodobacter
Bradyrhizobium japonicumBRAJABacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Bradyrhizobiaceae; Bradyrhizobium

На рисунке определенные ветви подписаны соответствующими названиями таксонов:

2) Для реконструкции этого дерева в качестве функции была выбрана омега-субъединица ДНК-зависимой РНК-полимеразы. последовательности сохранены в файле 4tree_seqs.fasta.

3) Программой muscle было построено множественное выравнивание этих последовательностей. Кроме того названия белков были заменены на мнемонику организмов для более удобной дальнейшей работы с деревьями.
Выравнивание в fasta-формате: 4tree_aln.fasta.
В формате msf (для просмотра в GeneDoc): 4tree_aln.msf.

5) Используя это выравнивание реконструируем филогенетическое дерево с помощью программы fprotpars:
Программа построила единственное, "максимально бережливое" дерево.

Скобочная формула:
(((((BRAJA,RHOS4),((BURCA,NEIMA),PSEAE)),VIBCH),SALTY),ECOLI);

Изображение:

                    +--BRAJA     
           +--------7  
           !        +--RHOS4     
        +--6  
        !  !        +--BURCA     
        !  !     +--5  
     +--3  +-----4  +--NEIMA     
     !  !        !  
     !  !        +-----PSEAE     
  +--2  !  
  !  !  +--------------VIBCH     
  1  !  
  !  +-----------------SALTY     
  !  
  +--------------------ECOLI     
Данное дерево также содержит 5 нетривиальных ветвей:

1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
3) {SALTY, ECOLI, VIBCH, RHOS4, BRAJA} против {NEIMA, BURCA, PSEAE}
4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA}
5) {SALTY, ECOLI, VIBCH, PSEAE, RHOS4, BRAJA} против {NEIMA, BURCA}

Жирным шрифтом отмечена ветвь которой нет в "правильном" дереве.
Вместо нее там была ветвь:
{SALTY, ECOLI, VIBCH, PSEAE} против {NEIMA, BURCA, RHOS4, BRAJA}

6) Оценим эволюционные расстояния между последовательностями с помощью программы fprotdist.
Матрица расстояний:
              ECOLI     SALTY     VIBCH     RHOS4     BRAJA     NEIMA     BURCA     PSEAE
  ECOLI       0.000000  0.000010  0.172863  1.067151  1.195937  0.693086  0.923107  0.920843
  SALTY       0.000010  0.000000  0.172863  1.067151  1.195937  0.693086  0.923107  0.920843
  VIBCH       0.172863  0.172863  0.000000  1.096424  1.206144  0.670077  0.911574  0.901334
  RHOS4       1.067151  1.067151  1.096424  0.000000  0.579830  0.893611  0.797429  0.949981
  BRAJA       1.195937  1.195937  1.206144  0.579830  0.000000  0.892055  0.922853  0.976538
  NEIMA       0.693086  0.693086  0.670077  0.893611  0.892055  0.000000  0.622256  0.844143
  BURCA       0.923107  0.923107  0.911574  0.797429  0.922853  0.622256  0.000000  0.644093
  PSEAE       0.920843  0.920843  0.901334  0.949981  0.976538  0.844143  0.644093  0.000000
Отклонение от ультраметричности:

1.Выберем 3 объекта: ECOLI, NEIMA, BRAJA
d (ECOLI, NEIMA) = 0.693086
d (ECOLI, BRAJA) = 1.195937
d (NEIMA, BRAJA) = 0.892055
Условие ультраметричности:
Если d (ECOLI, BRAJA) > d (ECOLI, NEIMA), то d (ECOLI, BRAJA) = d (NEIMA, BRAJA)
Видно, что эти расстояния не равны между собой, а разница между ними составляет 0,303882

2. Теперь рассмотрим 3 более близких организма: ECOLI, VIBCH, NEIMA
d (ECOLI, VIBCH) = 0.172863
d (ECOLI, NEIMA) = 0.693086
d (VIBCH, NEIMA) = 0.670077
Условие ультраметричности:
Если d (ECOLI, NEIMA) > d (ECOLI, VIBCH), то d (ECOLI, NEIMA) = d (VIBCH, NEIMA)
Равенство все так же не выполняется, но разница стала намного меньше: 0,023009

Отклонение от аддитивности:

Выберем 3 объекта: ECOLI, VIBCH, BRAJA, RHOS4:
d(ECOLI, VIBCH) + d (BRAJA, RHOS4) = 0.752693
d(ECOLI, BRAJA) + d (VIBCH, RHOS4) = 2.292361
d(ECOLI, RHOS4) + d (VIBCH, BRAJA) = 2.273295
Условие аддитивности: из 3 перечисленных сумм 2 равны между собой и больше третьей.
Видим, что d(ECOLI, RHOS4) + d (VIBCH, BRAJA) ~ d(ECOLI, BRAJA) + d (VIBCH, RHOS4)
и больше d(ECOLI, VIBCH) + d (BRAJA, RHOS4)
Условие аддитивности не выполняется вточности, но отклонение составляет всего 0,019066

7) Теперь реконструируем дерево с помощью программы fneighbor, используя алгоритмы UPGMA и Neighbor-Joining.

Результаты: NJ.treefile, NJ.fneighbor, UPGMA.treefile, UPGMA.fneighbor

1. UPGMA
                                 +ECOLI     
                           +-----1 
       +-------------------2     +SALTY     
       !                   ! 
       !                   +-----VIBCH     
  +----6 
  !    !      +------------------NEIMA     
  !    !  +---4 
  !    +--5   +------------------BURCA     
--7       ! 
  !       +----------------------PSEAE     
  ! 
  !            +-----------------RHOS4     
  +------------3 
               +-----------------BRAJA     
Нетривиальные ветви:
1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
3) {SALTY, ECOLI, VIBCH, RHOS4, BRAJA} против {NEIMA, BURCA, PSEAE}
4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA}
5) {SALTY, ECOLI, VIBCH, PSEAE, RHOS4, BRAJA} против {NEIMA, BURCA}

2. Neighbor-Joining
  +SALTY     
  ! 
  !  +--VIBCH     
  !  ! 
  1--2          +------NEIMA     
  !  !          ! 
  !  +----------4           +-------RHOS4     
  !             !   +-------3 
  !             !   !       +---------BRAJA     
  !             +---5 
  !                 ! +-------BURCA     
  !                 +-6 
  !                   +-----------PSEAE     
  ! 
  +ECOLI     
Нетривиальные ветви:
1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA}
3) {SALTY, ECOLI, VIBCH, NEIMA} против {RHOS4, BRAJA, BURCA, PSEAE}
4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA}
5) {SALTY, ECOLI, VIBCH, NEIMA, RHOS4, BRAJA} против {BURCA, PSEAE}

Жирным шрифтом отмечены ветви которых нет в "правильном" дереве.

Таким образом, ни одному из алгоритмов не удалось реконструировать "правильное" дерево. Результаты программ fprotpars и fneighbor (UPGMA) совпали и отличались от правильного одной ветвью. Хуже всех показал себя алгоритм Neighbor-Joining, результат отличался от правильного двумя ветвями.

© Сеферян Мелик, 2008 seferyan_m@mail.ru