- Задание 1.
первая часть:
Вводимый белок-гомолог HSLV_HAEIN.
Итог:
HSLV_HAEIN: порядковый номер-1,score- 354, e-value - 9e-98
HSLV_ECOLI: порядковый номер-13,score- 280, e-value -2e-75.
Последний белок - HSLV_CAMJR (score-217, e-value - 2e-56), он является последним,так как стоит порог по количеству.
Для измения выдачи результатов нужно поменять параметры: на начальной странице есть поле "Algorithm parameters" ,в котором есть подполя: max target sequences( количество выданных на странице выравниваемых последовательностей), expect threshold - максимум e-value, word size- шрифт букв.
Часть 2(использование pdb):
Pdb- код первой последовательности - 1G3I,идентификаторы цепей - G,Score -352, E-value -3e-98,
Итог выравнивания:
Query 2 TTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLFELF 61
TTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLFELF
Sbjct 1 TTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLFELF 60
Query 62 ERKLEMHQGHLLKSAVELAKDWRTDRALRKLEAMLIVADEKESLIITGIGDVVQPEEDQI 121
ERKLEMHQGHLLKSAVELAKDWRTDRALRKLEAMLIVADEKESLIITGIGDVVQPEEDQI
Sbjct 61 ERKLEMHQGHLLKSAVELAKDWRTDRALRKLEAMLIVADEKESLIITGIGDVVQPEEDQI 120
Query 122 LAIGSGGNYALSAARALVENTELSAHEIVEKSLRIAGDICVFTNTNFTIEELPN 175
LAIGSGGNYALSAARALVENTELSAHEIVEKSLRIAGDICVFTNTNFTIEELPN
Sbjct 121 LAIGSGGNYALSAARALVENTELSAHEIVEKSLRIAGDICVFTNTNFTIEELPN 174
Начало и конец для первого выравнивания во входной последовательности(2-61) и в находке (1-60),начало и конец для первого выравнивания во входной последовательности(62-121) и в находке (61-120),
начало и конец для первого выравнивания во входной последовательности(122-175) и в находке (121-174)
процент совпадений-100% (Identities = 174/174 (100%))
- Задание 2.Поиск белка по части его последовательности
В задание предлагалось выравнивать треть последовательности белка HSLV_HAEIN(>MTTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLF -ее первая треть).
Исходнаяпоследовательность не является первой,она третяя по счету,однако если учитываь,что Score(117) и E_value(2е-26) всех первых четырех последовательностей равны между собой,
то можно считать,что исходная последовательность не является первой,потому что последовательности даны вначале в алфавитном порядке.
- Задание 3.Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
Исходное выравнивание белка HSLV_Haein с белком HSLV_AERS4.
Score = 274 bits (701), Expect = 1e-73, Method: Compositional matrix adjust.
Identities = 139/173 (80%), Positives = 153/173 (88%), Gaps = 1/173 (0%)
Полное глобальное выравнивание.
Aligned_sequences: 2
1: HSLV_HAEIN
2: HSLV_AERS4
Matrix: EBLOSUM62
Gap_penalty: 11.0
Extend_penalty: 1.0
Length: 178, Identity:139/178 (78.1%), Similarity:153/178 (86.0%), Gaps: 4/178 ( 2.2%), Score: 677.0.
Cравнение результатов выравнивания.
На участке от 1 до 173 аминокислотного остатка первой и 1-172 второй последовательности результаты выравнивания совпадают,гепы( всего один геп) и штрафы совпадают.(Соответственно,"+" - это ".." , " " - это "."). Далее наблюдаются отличие,существенно влияющее на результат выравнивания:в blaste на этом выравнивание заканчивается,тогда как в needle продолжается д
Можно сделать определенный вывод о несовпадении результатов выравнивания:проценты identity и positives/similarity соответствующих последовательностей не совпадают,так как используются различные длины сравниваемых участков(173 и 178 соответственно),результаты же самих выравниваний одинаковы.
Аналогично не совпадает процент гепов,так как в выравнивании с помощью blast используется участок длиной 173 аминокислотных остатка,в который входит только один геп, тогда как в выравнивание needle входит участок длиной 178,где уже на 3 гепа больше.
Частичное выравнивание с помощью программы water.
Aligned_sequences: 2
1: HSLV_HAEIN
2: HSLV_AERS4
Matrix: EBLOSUM62
Gap_penalty: 11.0
Extend_penalty: 1.0
Length: 173
Identity: 139/173 (80.3%)
Similarity: 153/173 (88.4%)
Gaps: 1/173 ( 0.6%)
Score: 680.0
Cравнение результатов выравнивания.
Оба выравнивания практически полностью совпадают,так же как и процентные результаты по identity, similarity (отличие в десятые доли процента,которые не отбражаются в blast).
- Дополнительное задание 1.Изменение параметров сравнения.
Исходная матрица сравнения - PAM70.
При использовании этой матрицы в процессе сравнения для белка HSLV_HAEIN результаты: Score = 374 bits (844), Expect = 2e-103, Identities = 175/175 (100%), Positives = 175/175 (100%), Gaps = 0/175 (0%).
HSLV_ECOLI(13 по счету): Score = 298 bits (671), Expect = 2e-80, Identities = 140/174 (80%), Positives = 152/174 (87%), Gaps = 1/174 (0%).
Для HSLV_AERS4: Score = 287 bits (646), Expect = 4e-77, Identities = 140/173 (80%), Positives = 152/173 (87%), Gaps = 1/173 (0%).
Для последнего результата HSLV_NITWN: Score = 226 bits (507), Expect = 1e-58, Identities = 108/173 (62%), Positives = 138/173 (79%), Gaps = 2/173 (1%).
Отличие этого сравнения от сравнения по матрице BLOSUM62 в значения score(значения выше).
Исходная матрица Blosum62.Existence 9, extension 2.
Также поменялись значения score, e-value,значение score возросло,а e-value упало.
HSLV_HAEIN: Score = 369 bits (909), Expect = 3e-102, Identities = 175/175 (100%), Positives = 175/175 (100%), Gaps = 0/175 (0%)
HSLV_ECOLI:Score = 293 bits (718), Expect = 5e-79,Identities = 139/173 (80%), Positives = 153/173 (88%), Gaps = 1/173 (0%)
HSLV_AERS4:Score = 286 bits (702), Expect = 4e-77,Identities = 139/173 (80%), Positives = 153/173 (88%), Gaps = 1/173 (0%)
Последний результат(для стандартного параметра 11,1):HSLV_CAMJR ,HSLV_CAMJE :Score = 217 bits (552), Expect = 2e-56, Identities = 102/174 (58%), Positives = 138/174 (79%), Gaps = 3/174 (1%)
Последний результат(для параметра 9,2):HSLV_RHILO:Score = 226 bits (552), Expect = 6e-59, Identities = 108/173 (62%), Positives = 136/173 (78%), Gaps = 3/173 (1%)
- Задание 2.Интерфейс к BLAST на сайте EBI.
Достаточно приятный сайт на вид,здесь на первый взгляд значительно больше полей и возможностей для сравнения последовательностей,нежели на сервере NCBI.Здесь можно выбирать вариант
отображения результата:есть возможность определить score, длину последовательности сравнения, определенное e-value.На сайте дан более расширенный набор матриц сравнения.В процессе сравнения выдается по умолчанию 50 схожих последовательностей
,причем в исходной таблице отображаются не только Score, e-value,но также длина сравниваемой последовательности, Identity, Positives, а названия схожих белков даются сразу со ссылкой на информацию в банке Uniprot, что весьма удобно.Есть возможность просмотреть отдельно каждое выравнивание отдельно,можно скачать результат выравнивания.
Главная страница
Первый семестр.
Второй семестр.
©Александра Литвинчук,2008