Моделирование и реконструкция эволюции гена

 
     

 


  1. Создание дерева


    Модель судьбы гена описана в виде скобочной формулы: (((А:40,B:40):10,(C:90,D:90):20):5,(E:90,F:90):4);
    По заданной формуле было построено дерево, иллюстрирующее возможный путь эволюции данного гена. На изображении подписаны листья и длины ветвей.


  2. Описание ветвей дерева как разбиения множества листьев

    Описание оформляется в виде таблицы, столбцы которой соответствуют листьям дерева, а строки - внутренним ветвям дерева.
     
    A B C D E F 
    * * . . . .
    . . * * . .
    . . . . * *
    
  3. Получение искусственных мутантных последовательностей


    Cчитая, что в корне находится последовательность гена белка HSLU_ECOLI, с помощью программы msbar пакета EMBOSS были созданы мутантные последовательности и названы по имени общего предка листьев. Для получения понадобился расчет мутаций для каждой из последовательностей. Число нуклеотидов гена составляет 1332. Поскольку длины ветвей были даны как число мутаций на 100 нуклеотидных остатков, то для окончательного расчета нужно умножить число нуклеотидов гена на длину ветви и разделить это произведение на 100.
    Текст скрипта:
    msbar gene_ecoli.fasta EF.fasta -point 4 -count 53 -auto
    msbar gene_ecoli.fasta ABCD.fasta -point 4 -count 67 -auto
    msbar EF.fasta E.fasta -point 4 -count 1199 -auto
    msbar EF.fasta F.fasta -point 4 -count 1199 -auto
    msbar ABCD.fasta AB.fasta -point 4 -count 133 -auto
    msbar AB.fasta A.fasta -point 4 -count 533 -auto
    msbar AB.fasta B.fasta -point 4 -count 533 -auto
    msbar ABCD.fasta CD.fasta -point 4 -count 266 -auto
    msbar CD.fasta C.fasta -point 4 -count 1199 -auto
    msbar CD.fasta D.fasta -point 4 -count 1199 -auto
    
  4. Реконструирование деревьев различными алгоритмами


    На основе различных алгоритмов были реконструированы деревья.
    1. Maximum Likelihood method (Метод максимального правдоподобия).
    
      +---------Bm        
      |  
      |      +--------------------Fm        
      |   +--4  
      |   |  +--------------------Em        
      1---3  
      |   |    +---------------------Dm        
      |   +----2  
      |        +-------------------Cm        
      |  
      +--------Am        
    
    
    Команда:
     fdnaml aligned.fasta -ttratio 1 -auto
    
    2. Neighbor-Joining method (Основан на расчете попарных расстояний между последовательностями).
    
      +---------Bm        
      ! 
      !         +-------------------Cm        
      !   +-----1 
      !   !     +---------------------Dm        
      2---3 
      !   !  +-------------------Em        
      !   +--4 
      !      +---------------------Fm        
      ! 
      +--------Am        
    
    
    Команды:
      
    fdnadist aligned.fasta -ttratio 1 -auto (расчет попарных расстояний)
    fneighbor aligned.fdnadist -auto 
    
    3. UPGMA method.
    
    
                                 +------------------Am        
              +------------------1 
            +-2                  +------------------Bm        
            ! ! 
      +-----3 +-------------------------------------Fm        
      !     ! 
    --5     +---------------------------------------Em        
      ! 
      !  +------------------------------------------Cm        
      +--4 
         +------------------------------------------Dm        
    
    
    
    Команда:
     fneighbor aligned.fdnadist -treetype u -auto
    A B C D E F Исходное дерево Maximum Likelihood Neighbor-joining UPGMA
    * * . . . . + + + +
    . . * * . . + + + +
    . . . . * * + + + -
    * * . . . * - - - +

    Мы видим, что метод наибольшего правдоподобия и NJ метод реконструируют неукорененные деревья с ветвями как у исходного дерева. Метод UPGMA построил укорененное дерево с другими ветвями и другим корнем. Это объясняется тем, что алгоритм строит ультраметрическое дерево, а это означает, что скорость эволюции предполагается одинаковой для всех ветвей дерева. Иными словами, этот алгоритм имеет смысл использовать только в случае ультраметрических данных (справедливости гипотезы "молекулярных часов"), чего в нашем исходном дереве не наблюдается.

| на главную
| назад


© Smirnova Alexandra