ЧЕТВЕРТЫЙ СЕМЕСТР

на главную страницу


:НАВИГАЦИОННОЕ МЕНЮ





ДОПОЛНИТЕЛЬНЫЕ ЗАДАНИЯ ПЕРВОГО БЛОКА


1. Повторение обязательного упражнение 1 задания 3 ( jackknife вместо bootstrap (опция "-test j" программы fseqboot). Сравнение результатов.

Итак начинаем наш эксперимент. В обязательном задании смысл был в том, что мы создавали 100 реплик, затем делали консенсусный файл с одной конс. скобочной формулой и смотрели на топологию и прочее. делали выводы.

Теперь используем fseqboot ali.fasta -auto -test j

Затем аналогично предыдущему заданию выполняем
fdnaml ali.fseqboot -ttratio 1 -auto

ждем несколько минут... в файле "ali.fdnaml" видим деревья, в "ali.treefile" есть скобочные формулы. идем дальше
команда
fconsense

 

contradiction@kodomo-count:restore$  fconsense
Majority-rule and strict consensus tree
Phylip tree file: ali.treefile
Phylip consense program output file [ali.fconsense]: dop.fconsense

Consensus tree written to file "ali.treefile"

Output written to file "dop.fconsense"

Done.

Сравниваем получившиеся результаты с предыдущей работой
*
ярко-зеленым помечены все различия

результаты из dop.fconsense

результаты из ali.fconsense

 

Consensus tree program, version 3.6b

Species in order: 

  1. EMBOSS C
  2. EMBOSS D
  3. EMBOSS F
  4. EMBOSS E
  5. EMBOSS B
  6. EMBOSS A


Sets included in the consensus tree

Set (species in order)     How many times out of  100.00

..**..                     100.00
....**                     96.00
.***..                     78.00


Sets NOT included in consensus tree:

Set (species in order)     How many times out of  100.00

..****                     21.00
..**.*                      4.00
.*..**                      1.00


Extended majority rule consensus tree

CONSENSUS TREE:
the numbers on the branches indicate the number
of times the partition of the species into the two sets
which are separated by that branch occurred
among the trees, out of 100.00 trees

  +---------------------------EMBOSS C
  |
  |                    +------EMBOSS F
  |             +100.0-|
  |      +-78.0-|      +------EMBOSS E
  |      |      |
  +------|      +-------------EMBOSS D
         |
         |             +------EMBOSS B
         +--------96.0-|
                       +------EMBOSS A


  remember: this is an unrooted tree!


Consensus tree program, version 3.6b

Species in order: 

  1. EMBOSS C
  2. EMBOSS D
  3. EMBOSS F
  4. EMBOSS E
  5. EMBOSS B
  6. EMBOSS A


Sets included in the consensus tree

Set (species in order)     How many times out of  100.00

..**..                     100.00
....**                     88.00
.***..                     58.00


Sets NOT included in consensus tree:

Set (species in order)     How many times out of  100.00

..****                     42.00
..**.*                     12.00


Extended majority rule consensus tree

CONSENSUS TREE:
the numbers on the branches indicate the number
of times the partition of the species into the two sets
which are separated by that branch occurred
among the trees, out of 100.00 trees

  +---------------------------EMBOSS C
  |
  |                    +------EMBOSS F
  |             +100.0-|
  |      +-58.0-|      +------EMBOSS E
  |      |      |
  +------|      +-------------EMBOSS D
         |
         |             +------EMBOSS B
         +--------88.0-|
                       +------EMBOSS A


  remember: this is an unrooted tree!
далее для упрощения будем выдачу из файла dop.fconsense (метод jackknife) называть зеленой, а  из ali.fconsense (метод bootstrap)- серой.

в зеленой выдаче разбиения, вошедшие в консенсусный файл, имеют явно большую частоту встречаемости, нежели в серой, в частности .***..  разбиение в зеленой выдаче встречается в 78 случаях из 100, а то же самое разбиение серой выдачи только в 58-ми. ....** разбиение в зеленой встречается аж в 98 случаях из 100, а в серой только в 88. Это естественно отражается и на количестве сетов (разбиений), которые не вошли в консенсусное дерево. интересный момент. в зеленой выдаче заметен сет, вообще отсутствующий в серой, он выделен желтым. конечно, он встретился только в одном случае, но все равно, это результат . .*..** - в порядке CDFEBA в нативном порядке ABCDEF выглядит **.*.. , и по сути не играет большой роли. Конечно же изменилились цифры на ветках дерева (которые на самом деле обозначают то, сколько раз в 100 встретилась эта ветка) Создалось впечатление, что jackknife дал нам более "чистое" консенсусное дерево, хотя суть самого дерева не поменялась - это видно даже визуально. под "чистым" консенсусом я понимаю то, что между сетами, вошедшими и не вошедшими в консенсус разница частоты встречаемости существенно больше, но, в то же время, был найден желтый сет - но значит ли это, что jackknife работает более качественно? Думаю некорректно рассуждать в эту сторону, так как методы отличаются - промежуточные данные тоже, но в итоге общий вид деревьев не отличается. Вообще на будущее надо будет по возможности пользоваться обеими программами для точности и проверки результатов.

 

© Бирюков