Занятие 4 (Дополнительные задания)

  1. Использование jackknife анализа:

    Проводится аналогично bootstrap анализу, но при получении реплик используют опцию "-test j":

    fseqboot mut1.fasta -test j

    fdnaml mut1.fseqboot -ttratio 0.5 -auto

    fconsense mut1.treefile

    В результате было получено следующее дерево:
    
    +---------------------------C
      |
      |                    +------A
      |      +-------100.0-|
      |      |             +------B
      +------|
             |             +------F
             |      +-69.0-|
             +-83.0-|      +------D
                    |
                    +-------------E
    
    
    Как мы видим дерево совпадает с тем, что было получено при использовании бутстреп-анализа, однако поменялись числа, заметим, что те ветви, которые считались программой достоверными, для них значения достоверности повысились, а для недостоверных ветвей значения снизились
    
    Species in order: 
    
      1. C
      2. F
      3. D
      4. E
      5. B
      6. A
    
    
    Sets included in the consensus tree
    
    Set (species in order)     How many times out of  100.00
    
    ....**                     100.00
    .***..                     83.00
    .**...                     69.00
    
    
    Sets NOT included in consensus tree:
    
    Set (species in order)     How many times out of  100.00
    
    ..**..                     22.00
    ..****                     16.00
    ...***                      6.00
    .*.*..                      4.00
    
    
    Посмотрим на значения для альтернативных (менее вероятных) расположений ветвей, мы видим, что ветвь, которая есть в нашем реальном дереве, при данном анализе еще менее вероятна - 4 случая из 100.

  2. Укоренение дерева, реконструированного методом Neighbor-joining:

    Для выполнения этого задания использовалась команда:

    fretree 6 NJ.treefile

    Где NJ.treefile - файл,содержащий скобочную структуру для дерева, реконструированного методом Neighbor-joining. Кроме того предлагается ввести однобуквенную команду, в нашем случае использовалась команда М, которая укореняет дерево в среднюю точку, в результате, мы получили укорененное дерево, которое приводится ниже:
      ,-------------------------------------------------------------------------5:F
      !
      !                                   ,---------------------------6:A
      !                   ,---------------7
    -11         ,---------8               `---------------1:B
      !         !         !
      !      ,--9         `-------------------------------2:C
      !      !  !
      `-----10  `---------------------------------------------------------------3:E
             !
             `----------------------------------4:D
    
    
    
    Несмотря на то что само дерево несколько отличается, корень программа разместила в правильном месте. Это вполне ожидаемый результат, если вспомнить, что корень разместился правильно и при использовании алгоритма UPGMA, а деревья составлялись на основании полученной матрицы эволюционных расстояний, общей для обоих.

  3. Создание изображения переукоренённого дерева, с помощью программы fdarawtree: В результате редыдущего упражнения, мы получили файл NJ1.treefile содержащий скобочную структуру для изображения укорененного дерева, для того чтобы визуализировать полученный результат, можно использовать программу fdrawgram. Разобравшись с необходимыми опциями для того чтобы получить филограмму, ориентированную вправо, была выполнена следующая команда:

    drawgram -style p NJ1.treefile

    Ниже приведено полученное изображение:



  4. Восстановление предковой последовательности для мутированных последовательностей по методу максимального правдоподобия.

    Для получения последовательности была использована следующая команда с использованием программы fdnamlk:

    fdnamlk mut1.fasta -hypstate -ttratio 0.5

    Опция -hypstate заставляет программу восстанавливать последовательности во всех узлах, -ttratio - соотношение частот транзиций к числу трансверсий. В итоге мы получили файл содержащий последовательность предполагаемого предка (исходя из расположения корня), но не только, программа так же посчитала предполагаемые эволюционные расстояния и привела дерево (надо сказать, что дерево совпадаетс реальным деревом). Затем мы сделали выравнивание полученной последовательности с последовательностью исходного гена. Выравнивание вы можете найти в файле Выравнивание, пришлось положить его как рисунок, так как в виде msf файл не открывался. Как мы можем наблюдать идентичность и сходство практически совпадают и стремятся к значению 33 (31 и 35 соответственно), что неудивительно, так как производящиеся замены делались случайно. В выравнивании нет гэпов (так как производились только замены, при этом нуклеотиды менялись на любые другие - модель Джукса-Кантора). Скорее всего, такие же результаты при получении предковой последовательности мы бы получили и в других случаях, вряд ли этот механизм предназначен для получения реальных предковых последовательностей. Если же сравнить исходную последовательность с последовательностями полученых при искусственном мутировании, то мы увидим, что они совпадают даже лучше, от 37 процентов до 42 процентов. То есть предковая последовательность восстановлена очень не точно.


©Метелев Михаил