Занятие 4 (Дополнительные задания)

Использование jackknife анализа:

Проводится аналогично bootstrap анализу, но при получении реплик используют опцию "-test j":

fseqboot mut1.fasta -test j

fdnaml mut1.fseqboot -ttratio 0.5 -auto

fconsense mut1.treefile

В результате было получено следующее дерево:
```
+---------------------------C
  |
  |                    +------A
  |      +-------100.0-|
  |      |             +------B
  +------|
         |             +------F
         |      +-69.0-|
         +-83.0-|      +------D
                |
                +-------------E
```
Как мы видим дерево совпадает с тем, что было получено при использовании бутстреп-анализа, однако поменялись числа, заметим, что те ветви, которые считались программой достоверными, для них значения достоверности повысились, а для недостоверных ветвей значения снизились
```
Species in order: 

  1. C
  2. F
  3. D
  4. E
  5. B
  6. A


Sets included in the consensus tree

Set (species in order)     How many times out of  100.00

....**                     100.00
.***..                     83.00
.**...                     69.00


Sets NOT included in consensus tree:

Set (species in order)     How many times out of  100.00

..**..                     22.00
..****                     16.00
...***                      6.00
.*.*..                      4.00
```
Посмотрим на значения для альтернативных (менее вероятных) расположений ветвей, мы видим, что ветвь, которая есть в нашем реальном дереве, при данном анализе еще менее вероятна - 4 случая из 100.
Укоренение дерева, реконструированного методом Neighbor-joining:

Для выполнения этого задания использовалась команда:

fretree 6 NJ.treefile

Где NJ.treefile - файл,содержащий скобочную структуру для дерева, реконструированного методом Neighbor-joining. Кроме того предлагается ввести однобуквенную команду, в нашем случае использовалась команда М, которая укореняет дерево в среднюю точку, в результате, мы получили укорененное дерево, которое приводится ниже:
```
  ,-------------------------------------------------------------------------5:F
  !
  !                                   ,---------------------------6:A
  !                   ,---------------7
-11         ,---------8               `---------------1:B
  !         !         !
  !      ,--9         `-------------------------------2:C
  !      !  !
  `-----10  `---------------------------------------------------------------3:E
         !
         `----------------------------------4:D
```
Несмотря на то что само дерево несколько отличается, корень программа разместила в правильном месте. Это вполне ожидаемый результат, если вспомнить, что корень разместился правильно и при использовании алгоритма UPGMA, а деревья составлялись на основании полученной матрицы эволюционных расстояний, общей для обоих.
Создание изображения переукоренённого дерева, с помощью программы fdarawtree: В результате редыдущего упражнения, мы получили файл NJ1.treefile содержащий скобочную структуру для изображения укорененного дерева, для того чтобы визуализировать полученный результат, можно использовать программу fdrawgram. Разобравшись с необходимыми опциями для того чтобы получить филограмму, ориентированную вправо, была выполнена следующая команда:

drawgram -style p NJ1.treefile

Ниже приведено полученное изображение:
Восстановление предковой последовательности для мутированных последовательностей по методу максимального правдоподобия.

Для получения последовательности была использована следующая команда с использованием программы fdnamlk:

fdnamlk mut1.fasta -hypstate -ttratio 0.5

Опция -hypstate заставляет программу восстанавливать последовательности во всех узлах, -ttratio - соотношение частот транзиций к числу трансверсий. В итоге мы получили файл содержащий последовательность предполагаемого предка (исходя из расположения корня), но не только, программа так же посчитала предполагаемые эволюционные расстояния и привела дерево (надо сказать, что дерево совпадаетс реальным деревом). Затем мы сделали выравнивание полученной последовательности с последовательностью исходного гена. Выравнивание вы можете найти в файле Выравнивание, пришлось положить его как рисунок, так как в виде msf файл не открывался. Как мы можем наблюдать идентичность и сходство практически совпадают и стремятся к значению 33 (31 и 35 соответственно), что неудивительно, так как производящиеся замены делались случайно. В выравнивании нет гэпов (так как производились только замены, при этом нуклеотиды менялись на любые другие - модель Джукса-Кантора). Скорее всего, такие же результаты при получении предковой последовательности мы бы получили и в других случаях, вряд ли этот механизм предназначен для получения реальных предковых последовательностей. Если же сравнить исходную последовательность с последовательностями полученых при искусственном мутировании, то мы увидим, что они совпадают даже лучше, от 37 процентов до 42 процентов. То есть предковая последовательность восстановлена очень не точно.