Московский Государственный Университет имени М.В.Ломоносова Факультет Биоинженерии и Биоинформатики Учебный сайт Сеферяна Мелика |
---|
Полезные ссылки |
Реконструкция и сравнение деревьев.Занятие 1Отобранные бактерии:
Скобочная формула дерева(((((ECOLI, SALTY), VIBCH), PSEAE), (NEIMA, BURCA)), (PHOS4, BRAJA)); Изображение дереваВетви дереваДерево содержит 5 нетривиальных ветвей:1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 3) {SALTY, ECOLI, VIBCH, PSEAE} против {NEIMA, BURCA, RHOS4, BRAJA} 4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA} 5) {SALTY, ECOLI, VIBCH, PSEAE, RHOS4, BRAJA} против {NEIMA, BURCA} Занятие 21) Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, можно определить, к каким таксонам относятся отобранные бактерии:
На рисунке определенные ветви подписаны соответствующими названиями таксонов: 2) Для реконструкции этого дерева в качестве функции была выбрана омега-субъединица ДНК-зависимой РНК-полимеразы. последовательности сохранены в файле 4tree_seqs.fasta. 3) Программой muscle было построено множественное выравнивание этих последовательностей. Кроме того названия белков были заменены на мнемонику организмов для более удобной дальнейшей работы с деревьями. Выравнивание в fasta-формате: 4tree_aln.fasta. В формате msf (для просмотра в GeneDoc): 4tree_aln.msf. 5) Используя это выравнивание реконструируем филогенетическое дерево с помощью программы fprotpars: Программа построила единственное, "максимально бережливое" дерево. Скобочная формула: (((((BRAJA,RHOS4),((BURCA,NEIMA),PSEAE)),VIBCH),SALTY),ECOLI); Изображение: +--BRAJA +--------7 ! +--RHOS4 +--6 ! ! +--BURCA ! ! +--5 +--3 +-----4 +--NEIMA ! ! ! ! ! +-----PSEAE +--2 ! ! ! +--------------VIBCH 1 ! ! +-----------------SALTY ! +--------------------ECOLIДанное дерево также содержит 5 нетривиальных ветвей: 1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 3) {SALTY, ECOLI, VIBCH, RHOS4, BRAJA} против {NEIMA, BURCA, PSEAE} 4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA} 5) {SALTY, ECOLI, VIBCH, PSEAE, RHOS4, BRAJA} против {NEIMA, BURCA} Жирным шрифтом отмечена ветвь которой нет в "правильном" дереве. Вместо нее там была ветвь: {SALTY, ECOLI, VIBCH, PSEAE} против {NEIMA, BURCA, RHOS4, BRAJA} 6) Оценим эволюционные расстояния между последовательностями с помощью программы fprotdist. Матрица расстояний: ECOLI SALTY VIBCH RHOS4 BRAJA NEIMA BURCA PSEAE ECOLI 0.000000 0.000010 0.172863 1.067151 1.195937 0.693086 0.923107 0.920843 SALTY 0.000010 0.000000 0.172863 1.067151 1.195937 0.693086 0.923107 0.920843 VIBCH 0.172863 0.172863 0.000000 1.096424 1.206144 0.670077 0.911574 0.901334 RHOS4 1.067151 1.067151 1.096424 0.000000 0.579830 0.893611 0.797429 0.949981 BRAJA 1.195937 1.195937 1.206144 0.579830 0.000000 0.892055 0.922853 0.976538 NEIMA 0.693086 0.693086 0.670077 0.893611 0.892055 0.000000 0.622256 0.844143 BURCA 0.923107 0.923107 0.911574 0.797429 0.922853 0.622256 0.000000 0.644093 PSEAE 0.920843 0.920843 0.901334 0.949981 0.976538 0.844143 0.644093 0.000000Отклонение от ультраметричности: 1.Выберем 3 объекта: ECOLI, NEIMA, BRAJA d (ECOLI, NEIMA) = 0.693086 d (ECOLI, BRAJA) = 1.195937 d (NEIMA, BRAJA) = 0.892055 Условие ультраметричности: Если d (ECOLI, BRAJA) > d (ECOLI, NEIMA), то d (ECOLI, BRAJA) = d (NEIMA, BRAJA) Видно, что эти расстояния не равны между собой, а разница между ними составляет 0,303882 2. Теперь рассмотрим 3 более близких организма: ECOLI, VIBCH, NEIMA d (ECOLI, VIBCH) = 0.172863 d (ECOLI, NEIMA) = 0.693086 d (VIBCH, NEIMA) = 0.670077 Условие ультраметричности: Если d (ECOLI, NEIMA) > d (ECOLI, VIBCH), то d (ECOLI, NEIMA) = d (VIBCH, NEIMA) Равенство все так же не выполняется, но разница стала намного меньше: 0,023009 Отклонение от аддитивности: Выберем 3 объекта: ECOLI, VIBCH, BRAJA, RHOS4: d(ECOLI, VIBCH) + d (BRAJA, RHOS4) = 0.752693 d(ECOLI, BRAJA) + d (VIBCH, RHOS4) = 2.292361 d(ECOLI, RHOS4) + d (VIBCH, BRAJA) = 2.273295 Условие аддитивности: из 3 перечисленных сумм 2 равны между собой и больше третьей. Видим, что d(ECOLI, RHOS4) + d (VIBCH, BRAJA) ~ d(ECOLI, BRAJA) + d (VIBCH, RHOS4) и больше d(ECOLI, VIBCH) + d (BRAJA, RHOS4) Условие аддитивности не выполняется вточности, но отклонение составляет всего 0,019066 7) Теперь реконструируем дерево с помощью программы fneighbor, используя алгоритмы UPGMA и Neighbor-Joining. Результаты: NJ.treefile, NJ.fneighbor, UPGMA.treefile, UPGMA.fneighbor 1. UPGMA +ECOLI +-----1 +-------------------2 +SALTY ! ! ! +-----VIBCH +----6 ! ! +------------------NEIMA ! ! +---4 ! +--5 +------------------BURCA --7 ! ! +----------------------PSEAE ! ! +-----------------RHOS4 +------------3 +-----------------BRAJAНетривиальные ветви: 1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 3) {SALTY, ECOLI, VIBCH, RHOS4, BRAJA} против {NEIMA, BURCA, PSEAE} 4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA} 5) {SALTY, ECOLI, VIBCH, PSEAE, RHOS4, BRAJA} против {NEIMA, BURCA} 2. Neighbor-Joining +SALTY ! ! +--VIBCH ! ! 1--2 +------NEIMA ! ! ! ! +----------4 +-------RHOS4 ! ! +-------3 ! ! ! +---------BRAJA ! +---5 ! ! +-------BURCA ! +-6 ! +-----------PSEAE ! +ECOLIНетривиальные ветви: 1) {SALTY, ECOLI} против {VIBCH, PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 2) {SALTY, ECOLI, VIBCH} против {PSEAE, NEIMA, BURCA, RHOS4, BRAJA} 3) {SALTY, ECOLI, VIBCH, NEIMA} против {RHOS4, BRAJA, BURCA, PSEAE} 4) {SALTY, ECOLI, VIBCH, PSEAE, NEIMA, BURCA} против {RHOS4, BRAJA} 5) {SALTY, ECOLI, VIBCH, NEIMA, RHOS4, BRAJA} против {BURCA, PSEAE} Жирным шрифтом отмечены ветви которых нет в "правильном" дереве. Таким образом, ни одному из алгоритмов не удалось реконструировать "правильное" дерево. Результаты программ fprotpars и fneighbor (UPGMA) совпали и отличались от правильного одной ветвью. Хуже всех показал себя алгоритм Neighbor-Joining, результат отличался от правильного двумя ветвями. |