Занятие 4.

1. Построение дерева по нуклеотидным последовательностям

Необходимо построить филогенетическое дерево бактерий, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).
Нужные РНК-последовательности были извлечены из записей EMBL и сохранены в файле rnaseqs.fasta. Затем они были выровнены при помощи программы muscle. Файл с выравниванием: rnaseqs_al.fasta.
Для построения филогенетического дерева воспользуемся программами пакета PHYLIP (fdnaml, fdnapars, fdnadist; матрица расстояний подавалась на вход программам fneighbor, ffitch и fkitsch.)
Все деревья, построенные этими программами, совпали между собой и с правильным. Приведем пример дерева, полученного fdnapars:
         +-----NEIMA
      +--6
      |  +---BURCA
  +---5
  |   |     +---RHIEC
  |   +-----4
  |         +---BRAJA
  |
  |     +YERPS
  |  +--3
  1--2  +YERPE
  |  |
  |  +-ECOLI
  |
  +---VIBFM 
В отличие от дерева, построенного по выравниванию белковых последовательностей программой fprotpars, это дерево совпадает с правильным. Таким образом, в этом случае качество реконструкции по ДНК выше, чем по белкам.
Программа fkitsch выдала укорененное дерево:
       +---NEIMA
    +--7
    !  +---BURCA
    !
  +-6       +YERPS
  ! !     +-3
  ! !   +-2 +YERPE
  ! !   ! !
--4 +---1 +ECOLI
  !     !
  !     +--VIBFM
  !
  !   +--RHIEC
  +---5
      +--BRAJA
Это укоренение (в нетривиальную ветвь {RHIEC,BRAJA} против {BURCA,NEIMA,VIBFM,ECOLI,YERPS,YERPE} совпадает с укоренениями, сделанными ранее.

2. Построение и анализ дерева, содержащего паралоги

Необходимо найти в исследуемых бактериях достоверные гомологи белка FTSH_ECOLI. Для этого нужно получить последовательность этого белка:
seqret sw:ftsh_ecoli
Затем по файлу proteo.fasta создаем базу данных для поиска гомологов программой blastp:
formatdb -i proteo.fasta -n db_proteo -p T
и осуществляем поиск гомологов:
blastall -p blastp -d db_proteo -i ftsh_ecoli.fasta -e 0.0001 -o homologs.out -m 8
Файл с выдачей: homologs.out;
файл с последовательностями белков нужных бактерий: homologs_m.fasta.
Теперь выровняем белки программой muscle, полученное выравнивание подадим на вход программе fprotdist, чтобы получить матрицу расстояний. По ней при помощи fneighbor получаем дерево:
    +--HSLU_VIBFM
  +-3 
  ! ! +-HSLU_ECOLI
  ! +-2 
  !   ! +HSLU_YERPE
  !   +-1 
  !     +HSLU_YERPS
  ! 
  !                  +----------------------------Q89KG3_BRAJA
  !                  ! 
  !                  !            +---------------------------Q89BR3_BRAJA
  !                  !         +--7 
  4------------------6         !  !          +---------------B5FCR8_VIBFM
  !                  !         !  +----------5 
  !                  !         !             +----------Q8KKT3_RHIEC
  !                  !         ! 
  !                  +---------8      +-----------Q1BNJ2_BURCA
  !                            !      !  
  !                            !      !        +-----A1IR46_NEIMA
  !                            !      !     +-13  
  !                            !      !     !  +-----Q1BXC9_BURCA
  !                            +-----14  +-15  
  !                                   !  !  !  +--B5FA73_VIBFM
  !                                   !  !  +-11  
  !                                   !  !     !  +FTSH_ECOLI
  !                                   !  !     +-10  
  !                                   +-16        ! +Q0WBE7_YERPE
  !                                      !        +-9 
  !                                      !          +Q66F66_YERPS
  !                                      !  
  !                                      !  +---Q2K4M2_RHIEC
  !                                      +-12  
  !                                         +---Q9XBG5_BRAJA
  ! 
  +------HSLU_BRAJA
Дерево считаем реконструированным верно.

Ортологи - гомологичные белки, возникшие в результате видообразования.
Примеры ортологов: HSLU_VIBFM, HSLU_ECOLI, HSLU_YERPE и HSLU_YERPS (узел 3), A1IR46_NEIMA и Q1BXC9_BURCA (узел 13).

Паралоги - гомоличные белки в одном организме.
Примеры паралогов: Q89KG3_BRAJA и Q89BR3_BRAJA, Q1BNJ2_BURCA и Q1BXC9_BURCA. Заметим, что в данном случае нет ни одной пары паралогов, составляющих узел из двух листьев.

Назад