- Создание паттернов аминокислотных последовательностей
В данном задании требовалось выбрать фрагмент из выравнивания белка Maf_Bacsu и его гомологов, и создать по этому фрагменту три паттерна. Первый
в точности соответствует исходной последовательности исследуемого белка, является среди трёх самым строгим и поиск по
нему по данным в Prosite дает наименьший результат.В выбранном фрагменте выравнивания имеет место повышенная консервативность,
поэтому выдаваемые программой белки являются также наиболее близкородственными для Maf_Bacsu.Если посмотреть на данные, выдаваемые BLAST,
то найденные нами белки из Prosite будут отражены как гомологи, только 3 из них относятся к MAF_***, группа которая имеет наиболее сходные последовательности с Maf_Bacsu
остальные 5 имеют меньше сходства согласно Blast , однако находятся по паттерну, в то же время множество представителей из группы MAF_*** этим паттерном не находятся.
Второй паттерн составлен с учётом всех выровненных последовательностей,
что вообще говоря гарантирует их нахождение.В третьем случае целью было ослабить паттерн, на основе свойств аминокислот, соответственно расширить
количество находок.Приведена таблица, содержащая результаты поиска.
Таблица.Поиск по паттернам в Prosite
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot
найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности |
L-I-L-A-S-Q-S-P-R-R |
9 |
Только сам Maf_Bacsu |
Сильный |
[LI]-[IV]-L-A-S-[QAGS]-S-P-[AR]-R |
135 |
Находятся все последовательности выровненных белков.Y2348_TREDE, Y360_SYNJA, Y3335_STRAW, Y1711_DESPS, Y1422_FLAPJ, MAF_BACSU |
Слабый |
[LIMV]-[ILMV]-L-A-S-X-S-P-[RA]-R |
181 |
Также все. |
- Все описанные в PROSITE мотивы в заданном белке Maf_BACSU.
Идентификатор документа PROSITE (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (регулярное выражение) |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
PS00005 |
PKC_PHOSPHO_SITE |
Сайт фосфорилирования белком C киназа |
паттерн |
[ST] - x - [RK] |
неспецифична |
3 |
PS00006 |
CK2_PHOSPHO_SITE |
Сайт фосфорилирования казеин киназой II |
паттерн |
[ST] - x(2) - [DE] |
неспецифична |
6 |
PS00004 |
CAMP_PHOSPHO_SITE |
cAMP- и cGMP-зависимой киназы сайты фосфорилирования. |
паттерн |
[RK](2) - x - [ST] |
неспецифична |
1 |
PS00001 |
ASN_GLYCOSYLATION |
Сайт N-гликозилирования |
паттерн |
N - {P} - [ST] - {P} |
неспецифична |
1 |
PS00007 |
TYR_PHOSPHO_SITE |
Сайт фосфорилирования тирозин киназой. |
паттерн |
[RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y |
неспецифична |
1 |
PS00008 |
MYRISTYL |
Сайт N-миристоилирования |
G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} |
паттерн |
неспецифична |
1 |
|