Создание паттернов аминокислотных последовательностей
Выравнивание белка CISY_ECOLI с гомологами
Возьмем фрагмент выравнивания 245-259 (соответсвует 189-204 а.о.белка CISY_ECOLI)
- Первый паттерн в точности является фрагментом последовательности
белка CISY_ECOLI
- Второй ("сильный") паттерн
распознает все белки выборки.
- Третий ("слабый") паттерн создан на основе второго,
требования к последовательности более мягкие.
Поиск белков по паттерну, постороенному на основании выравнивания
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot
найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности |
R-N-D-L-S-Y-A-G-N-F-L-N-M-M-F-S |
В 3 (P0ABH8, P0ABH7, O68883), во всех найденных белках мотив имеет координаты 189-204 а.о, белки относятся к одному семейству CISY |
найден только мой белок |
Сильный |
X-[NDR]-[SPDN]-[DNKS]-[LAK]-[DS]-[WY]-[AGS]-[AKHSG]-N-[FL]-[AVSTL]-[KNSHYR]-[ML]-[MILC]-X(2) |
в 37 ( файл с результатами ) |
найдены все 9 белков выравнивания |
Слабый |
X-[NDREQ]-[SPDNT]-[DNKSTE]-[LAKIRV]-[DSET]-[WYF]-[AGSVTLI]-[AKHSG]-[NQ]-[FLIVA]-[AVSTLI]-{AGVPM}-[MLI]-[MILCVA]-X(2) |
в 40 ( файл с результатами ) |
найдены все 9 белков выравнивания |
Самый сильный паттерн - последовательность белка, поскольку аминокислоты заданы однозначно, по нему найдены родственные CISY_ECOLI белки.
Сильный паттерн включает по каждой позиции соответсвующие аминокислоты белков выравнивания, по нему найдены белки из семейства CISY.
При создании слабого паттерна я добавил к аминокислотам сильного паттерна похожие по свойствам аминокислоты, так во второй позиции паттерна к аспарагиновой кислоте добавил глутаминовую, в пятой позиции - к лейцину - близкий по свойствам изолейцин.
Кроме белков семейства CISY найден белок из семейства CARB.
Мотивы белка CISY_ECOLI (по данным БД
PROSITE)
Все описанные в PROSITE мотивы в заданном белке PURT_ECOLI ( P33221 )
Идентификатор документа PROSITE (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (регулярное выражение) |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
координаты мотива |
PS00480 |
CITRATE_SYNTHASE |
Цитрат-синтетаза |
паттерн |
GFGHrVy.KnyDPR |
специфична |
1 |
303 - 315 |
PS00006 |
CK2_PHOSPHO_SITE |
Сайт фосфорилирования (присоединения фосфата) казеин киназой 2 |
паттерн |
[ST] - x(2) - [DE] (фосфорилируются S или T) |
неспецифична |
6 |
14 - 17, 58 - 61, 205 - 208, 322 - 325, 332 - 335, 414 - 417 |
PS00004 |
CAMP_PHOSPHO_SITE |
Сайт фосфорилирования цАМФ- и цГМФ-зависимой протеинкиназой |
паттерн |
[RK](2) - x - [ST] (фосфорилируются S или T) |
неспецифична |
1 |
126-129 |
PS00008 |
MYRISTYL |
сайт N-миристилирования (миристилирование - присоединения остатка миристиновой кислоты - насыщенной жирной кислоты (С14)) |
паттерн |
G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} (миристат присоеденяется к G) |
неспецифична |
7 |
137 - 142, 140 - 145, 196 - 201, 243 - 248, 267 - 272, 374 - 379, 403 - 408 |
PS00001 |
ASN_GLYCOSYLATION |
сайт N-гликозилирования |
паттерн |
N - {P} - [ST] - {P} (гликозилируется N] (P в фигурных скобках, т.к его присутсвтие в этих позициях ингибирует гликозилирование) ) |
неспецифична |
2 |
233 - 236, 296 - 299 |
PS00005 |
PKC_PHOSPHO_SITE |
сайт фосфорилирования протеинкиназой C |
паттерн |
[ST] - x - [RK] (фосфорилируется ОН-группа S или T) |
неспецифична |
3 |
238 - 240, 281 - 283, 298 - 300 |
|