Занятие 4

  1. Построение дерева по нуклеотидным последовательностям
  2. Необходимо построить филогенетическое дерево тех же бактерий, что в предыдущих
    заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).

    Этапы работы

    1. Из записей EMBL, соответствующих геномам отобранных ранее бактерий,
      для каждой из них я извлекла последовательность одной из 16S рибосомальной РНК.

    2. Положила все последовательности в единый файл в fasta-формате,
      с названиями, отвечающими организмам,
      и выровняла их программой muscle. Получила выравнивание: файл

    3. Воспользовалась программами пакета PHYLIP.
      Сначала выполнила команду:

      fdnaml -sequence allrna_aligned.fasta

      Полученное дерево:

           +---NEIMA     
        +--5  
        |  +---BURCA     
        |  
        |       +-SALTY     
        |    +--3  
        |    |  +--PROMH     
        4----2  
        |    |  +--VIBFM     
        |    +--1  
        |       +-VIBCH     
        |  
        +--------BRAJA  
      

      Следующая команда:

      fdnapars -sequence allrna_aligned.fasta

      Полученное дерево:

           +-----NEIMA     
        +--5  
        |  +---BURCA     
        |  
        |    +-SALTY     
        1----4  
        |    |  +--VIBFM     
        |    +--2  
        |       |  +---PROMH     
        |       +--3  
        |          +--VIBCH     
        |  
        +--------BRAJA      
      
      После этого с помощью программы fprotdist была получена матрица расстояний для этих последовательностей:

      fdnadist -sequence allrna_aligned.fasta

                                                                               
      BRAJA      0.000000 0.250685 0.231866 0.281160 0.248816 0.235309 0.249741
      VIBCH      0.250685 0.000000 0.077319 0.117962 0.102240 0.204395 0.208537
      VIBFM      0.231866 0.077319 0.000000 0.122570 0.099293 0.216862 0.226273
      PROMH      0.281160 0.117962 0.122570 0.000000 0.090872 0.227955 0.224762
      SALTY      0.248816 0.102240 0.099293 0.090872 0.000000 0.212844 0.207766
      BURCA      0.235309 0.204395 0.216862 0.227955 0.212844 0.000000 0.126245
      NEIMA      0.249741 0.208537 0.226273 0.224762 0.207766 0.126245 0.000000
      
      Затем эту матрицу расстояний подала на вход программе ffitch:

      ffitch allrna_aligned.fdnadist

      Полученное дерево выглядит следующим образом:

          +---NEIMA     
        +-5 
        ! +---BURCA     
        ! 
        !    +-SALTY     
        !  +-3 
        !  ! +---PROMH     
        4--1 
        !  ! +-VIBCH     
        !  +-2 
        !    +--VIBFM     
        ! 
        +-------BRAJA  
      

      Сравним это дерево с правильным:


      Топология дерева с правильным не совпадает, отличие в том, что NEIMA и BURCA объединили в одну ветвь.
      Реконструкция дерева ни по белкам, ни по нуклеотидной последовательности не дала 100% результата.


  3. Построение и анализ дерева, содержащего паралоги
  4. Необходимо найти в своих бактериях достоверные гомологи белка FTSH_ECOLI и построить дерево этих гомологов.

    Чтобы найти гомологов в заданных организмах, я воспользовалась файлом proteo.fasta (на диске P), там лежат записи банка UniProt,
    относящиеся к протеобактериям, перечисленным в таблице к заданию 1.

    Мне необходимо провести поиск программой BLASTP гомологов (с разумным порогом на E-value, скажем, 0,0001)
    и отобрать по мнемонике видов только те находки, которые относятся к отобранным вами бактериям.

    Сначала я создала индексные файлы пакета BLAST для поиска по набору белков:

    formatdb -i proteo.fasta -p T -n prot

    Затем создала отдельный файл с последовательностью FTSH_ECOLI ftsh.fasta

    Потом запустила программу BLASTP с пороговым значением E-value 0,0001:

    blastall -p blastp -d prot -i ft.fasta -o out.txt -e 0.0001 Программа выдала следующий результат.

    Я отобрала по мнемонике видов только те находки, которые относятся к отобранным мной бактериям.:

     
    FTSH_SALTY;B4F2B3_PROMH;Q9KU86_VIBCH;B5FA73_VIBFM;A1IR46_NEIMA;Q9XBG5_BRAJA;Q1BXC9_BURCA;
    Q1BNJ2_BURCA;Q89BR3_BRAJA;B5FCR8_VIBFM;HSLU_BRAJA;Q89KG3_BRAJA;HSLU_SALTY;HSLU_VIBFM;HSLU_PROMH.                                                                                                                         

    Далее было проведено выравнивание последовательностей гомологов программой muscle.

    Затем полученный файл я предоставила программе fprotpars, использовав команду

    fprotpars -sequence gomolog_aligned.fasta
    

    Полученное дерево:

    
                                             +--HSLU_SALTY
                                          +-14  
                                       +-13  +--HSLU_PROMH
                                       !  !  
                                    +-12  +-----HSLU_VIBFM
                                    !  !  
         +-------------------------11  +--------HSLU_BRAJA
         !                          !  
         !                          +-----------Q89KG3_BRA
         !  
         !                    +-----------------Q1BXC9_BUR
         !                    !  
         !                 +--8  +--------------A1IR46_NEI
         !                 !  !  !  
      +-10                 !  !  !           +--Q9KU86_VIB
      !  !                 !  +--9     +-----7  
      !  !                 !     !     !     +--B5FA73_VIB
      !  !                 !     !  +--6  
      !  !              +--3     !  !  !     +--B4F2B3_PRO
      !  !              !  !     +--4  +-----5  
      !  !              !  !        !        +--FTSH_SALTY
      1  !              !  !        !  
      !  +--------------2  !        +-----------Q9XBG5_BRA
      !                 !  !  
      !                 !  +--------------------Q1BNJ2_BUR
      !                 !  
      !                 +-----------------------Q89BR3_BRA
      !  
      +-----------------------------------------B5FCR8_VIB
    
    
    

    Можно выделить примеры пар ортологов: 14ая ветвь - HSLU_SALTY и HSLU_PROMH; 13ая-12ая ветви - HSLU_VIBFM и HSLU_BRAJA.

    Пример пары паралогов: 7ая ветвь - Q9KU86_VIB и B5FA73_VIB.

    Примечание. Два гомологичных белка будем называть ортологами, если они
    а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования.
    Два гомологичных белка из одного организма будем называть паралогами.


 


<<Обратно на четвертый семестр

<<Обратно на главную страницу

©Лелекова Мария,2009