Kodomo

Пользователь

На главную

Назад

Практикум 8

Взял выравнивание align_04.fasta.

Ссылка на проект

Задание 1

По данному выравниванию построил дерево с помощью Neighbour Joining Using BLOSUM62 (рис 1.1). Далее раскрасил с помощью ClustalX (рис 1.2) и Blosum 62 (рис 1.3). Везде порог консервативности 30.

Рис 1.1. Дерево родства последовательностей

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/tree.png

Рис 1.2. Раскраска ClustaalX

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/clustalx.png

Рис 1.3. Раскраска Blosum 62

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/blosum.png

Задание 2

Нашел участки, на которых можно ожидать гомологию аминокислотных остатков из всех последовательностей: вертикальные блоки (а), кластеры (b), а также были выделены участок, не входящий в блоки и кластеры (с) и невертикальный блок (d).

a) Критерии выделения вертикального блока:

• Он найден на участке множественного выравнивания не менее 5 последовательностей.

• Не содержит гэпов.

• Длина - не менее 4 колонок.

• Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.

• Не содержит более 3 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.

• Не может быть расширен без нарушения предыдущих свойств.

Свойства аминокислот, позволяющие судить о функциональной консервативности позиции:

• все гидрофобные

• все гидрофильные

• все ароматические

• все положительно заряженные

• все отрицательно заряженные

• сходные по структуре доноры или акцепторы водородных связей

В соответствии с изложенными критериями выделил 6 блоков (На Рис. 2.1 в строке разметки Рarts отмечены буквой "B").

b) Кластер блоков - участок выравнивания, на котором можно ожидать гомологию между любыми двумя аминокислотами, расположенными в одной колонке. Критерий выделения кластера: два блока объединяются в кластер вместе с участком между ними, если все гэпы между этими блоками имеют длину, равную длине участка между ними (то есть кластер, в отличие от блока, может содержать гэпы). исходя из этого выделил 5 кластера, причем четыре из них состоят из 1 блока и один из двух (На Рис. 2.1 в строке разметки Рarts отмечены буквой "С").

c) Также было выделено два самых длинных участка, не входящих ни в блоки, ни в кластеры (оба по 10 колонок) (На Рис. 2.1 в строке разметки Рarts отмечены буквой "Х").

Рис. 2.1. Изображение блоков (В), кластеров блоков (С) и самого длинного участка, не входящего в блоки и кластеры (Х) (раскраска ClustalX).

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/parts.png

d) На Рис. 2.2 черной рамкой выделена группа из двух последовательностей: STAAC и MACCJ. Причины выбора именно этих двух последовательностей:

• Они имеют одинаковую длину, отличную от длин остальных последовательностей (81 колонка).

• Они составляют отдельную эволюционную группу на дереве, по которому можно судить о родстве последовательностей (Рис. 1.1).

• На самом длинном участке выравнивания, не имеющем блоков и кластеров (Рис. 2.1 – “C”) эти последовательности сильно отличаются от остальных: они имеют одинаковые остатки в этих позициях, тогда как 3 другие последовательности содержат длинный гэп в этом месте, а в еще 1 последовательности в данных позициях содержатся совершенно функционально несхожие остатки (см. Рис. 2.2).

В ходе сравнения выделенной группы с остальными последовательностями были найдены участки, на которых можно судить о гомологии между остатками выделенных в группу последовательностей, а остатки остальных последовательностей им, предположительно, негомологичны. Такие участки на Рис. 2.2 в строке разметки Group обозначены буквой H.

Рис. 2.2. Группа последовательностей STAAC и MACCJ на фоне выравнивания (раскраска BLOSUM62). Участки, на которых остатки выбранных последовательностей, предположительно, гомологичны, а остатки остальных - скорее негомологичны им, в строке разметки Group обозначены символом H.

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/group.png

Задание 3

Для первого блока (см. Рис. 2.1 - обозначен в строке разметки буквой В, 4 - 22 колонки) были определены число и процент абсолютно консервативных и функционально консервативных (согласно раскраске ClustalX), а также консервативных и функционально консервативных на 70%

Тип позиции

Число позиций

Процент

Абсолютно консервативные

4

21,05%

Абсолютно функционально консервативные

7

36,84%

Консервативные на 70%

5

26,31%

Функционально консервативные на 70%

5

26,31%

Для одного из самоых длинного (30-40 колонки) участка выравнивания, не входящего в состав блоков и кластеров (Рис. 2.1 - обозначен в строке разметки буквой Х) были посчитаны:

• Число позиций с гэпами: 5

• Процент позиций с гэпами: 50%

Задание 4

В данном задании было необходимо вписать последовательность sequence_04.fasta в выравнивание с наибольшим числом значимых позиции (см. результат на Рис. 3).

Рис. 3. Изображение выравнивания с дополнительно вписанной последовательностью из файла sequence_04.fasta (Раскраска ClustalX).

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/task_04.png

Задание 5

В данном задании я попытался вписать в выравнивание заведомо негомологичную последовательность – последовательность моего белка – гипотетического белка у организма Vulcanisaeta moutnovskia 768-28 (идентификатор в БД RefSeq YP_004243986.1), так как белок слишком большой, я взял участок длиной 80 остатков из середины последовательности (см. результат на Рис. 4).

Разрешалось вносить гэпы в те участки, где уже были гэпы в исходном выравнивании, чтобы найти найбольшее количество совпадений со значимыми позициями в исходном выравнивании.

Удалось получить:

• 1 абсолютно консервативная позиция

• 22 функционально консервативных позиций (и абсолютных, и консервативных на 70)

• 5 позиций, консервативных на 70%

• Общий процент совпадений: 22,22%

Такой маленький процент совпадений позволяет судить о негомологичности участка последовательности моего белка остальным последовательностям.

Рис. 4. Изображение выравнивания с дополнительно вписанной последовательностью участка белка YP_004243986.1 (Раскраска ClustalX).

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/task_05.png

Задание 6

В этом задании было необходимо построить множественное выравнивание заведомо негомологичных последовательностей (Рис. 5), например, последовательностей, с которыми работают другие студенты моего курса. Я выбрал 5 последовательностей (идентификаторы AC в базе данных Uniprot): H6Q874, F0QTE2, F4BY60, I0I273, Q6L1N7. Выравнивание было построено с помощью опции "Muscle with Default" (см. Рис. 5).

Рис. 5. Изображение множественного выравнивания заведомо негомологичных последовательностей (Раскраска BLOSUM62).

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/task_06.png

В данном выравнивании был найден всего один блок (на Рис. 6 – обозначен символом «В» в строке разметки Blocks).

Рис. 6. Изображение наилучшего (и единственного) блока.

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/pr8/block.png

Можно сделать вывод, что данные последовательности однозначно негомологичны, так как они содержат настолько мало значимых позиций, что даже крайне трудно выделить блоки.