На главную

Четвертый семестр

Моделирование и реконструкция эволюции гена

Дерево

Дана скобочная формула: (((А:80,B:80):40,(C:50,D:50):10):25,(E:60,F:60):4).

По ней построено дерево:

Дерево не ультраметрично. Если мы считаем, что у него есть корень - достаточно близкий родственник все 6 организмов, то ближе всего к нему находятся организмы E и F, а самые далекие - A и B.

Опиcание ветвей деревьев как разбиения множества листьев (считая дерево бескорневым).

A B C D E F
+ + - - - -
+ + + + - -
- - + + - -

Получение искуственных мутантных последовательностей.

(считаем, что в корне находится последовательность гена белка SYH_ECOLI).

Длина гена 1275 нуклеотидов.

Формула для пересчета (где N – требуемое количество мутаций на 100 нуклеотидов): (1275*N)/100,

Скрипт:

используется следующая команда (здесь n – количество мутаций на всю последовательность)

msbar infile outfile -point 4 -count n –auto

msbar syh_ecoli.fasta ABCD.fasta -point 4 -count 318 -auto

msbar ABCD.fasta CD.fasta -point 4 -count 127 -auto

msbar ABCD.fasta AB.fasta -point 4 -count 510 -auto

msbar CD.fasta C.fasta -point 4 -count 637 -auto

msbar CD.fasta D.fasta -point 4 -count 637 -auto

msbar AB.fasta A.fasta -point 4 -count 1020 -auto

msbar AB.fasta B.fasta -point 4 -count 1020 -auto

msbar syh_ecoli.fasta EF.fasta -point 4 -count 51 -auto

msbar EF.fasta E.fasta -point 4 -count 765 -auto

msbar EF.fasta F.fasta -point 4 -count 765 –auto

Реконструкция деревьев с помощью различных алгоритмов.

Алгоритм максимального правдоподобия.

 
  +------------------B
  |
  |           +---------D
  |           |
  1-----------2           +------------F
  |           |  +--------4
  |           +--3        +--------------E
  |              |
  |              +------------C
  |
  +-----------------A


Скобочная формула: (B:0.61992,(D:0.33320,((F:0.42395,E:0.49428):0.28544, C:0.40714):0.04978):0.40610,A:0.59717).

Алгоритм UPGMA.

 UPGMA method

 Negative branch lengths allowed


              +------------------------------------A
  +-----------4
  !           +------------------------------------B
  !
--5                        +-----------------------C
  !            +-----------1
  !            !           +-----------------------D
  +------------3
               !       +---------------------------E
               +-------2
                       +---------------------------F

Скобочная формула: ((A:0.61301,B:0.61301):0.19982,((C:0.39626,D:0.39626):0.19460, (E:0.46443,F:0.46443):0.12643):0.22197).

Алгоритм Neighbor-joining.

 Neighbor-joining method

 Negative branch lengths allowed


  +-----------------B
  !
  !            +----------D
  1------------3
  !            ! +------------C
  !            +-4
  !              !        +---------------E
  !              +--------2
  !                       +-----------F
  !
  +-------------------A

Скобочная формула: (B:0.57514,(D:0.34825,(C:0.43559,(E:0.52284,F:0.40602):0.29343):0.03627):0.41745,A:0.65088)
ABCDEF Исходная последовательнось Алгоритм максимального правдоподобия Алгоритм UPGMA Алгоритм Neighbor-Joining
**.... + + + +
****.. + + + +
..**.. + - + -
....** + + + +

Как можно заметить, алгоритмы максимального правдоподобия и Neighbor-Joining построили одинаковые деревья, причем они оба не выделили отдельного предка для C и D. Алгоритм UPGMA построил дерево, идентичное по топологии исходному, если считать исходное дерево бескорневым. Таким образом, вновь созданные деревья оказались похожими на исходное, но все же с некоторыми отличиями. Это подтверждает то, что с помощью деревьев можно делать предположения о родстве и ходе эволюции лишь с некоторой вероятностью. При попытках описать эволюцию и происхождение таксонов опираются на различные деревья, построенные для многих генов, и консенсусное дерево дает более достоверную информацию о происходении и родстве организмов.

На главную


© Даниленко Светлана