Создание паттернов аминокислотных последовательностей

Выравнивание белка CISY_ECOLI с гомологами

Возьмем фрагмент выравнивания 245-259 (соответсвует 189-204 а.о.белка CISY_ECOLI)

  1. Первый паттерн в точности является фрагментом последовательности белка CISY_ECOLI
  2. Второй ("сильный") паттерн распознает все белки выборки.
  3. Третий ("слабый") паттерн создан на основе второго, требования к последовательности более мягкие.

Поиск белков по паттерну, постороенному на основании выравнивания
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности R-N-D-L-S-Y-A-G-N-F-L-N-M-M-F-S В 3 (P0ABH8, P0ABH7, O68883), во всех найденных белках мотив имеет координаты 189-204 а.о, белки относятся к одному семейству CISY найден только мой белок
Сильный X-[NDR]-[SPDN]-[DNKS]-[LAK]-[DS]-[WY]-[AGS]-[AKHSG]-N-[FL]-[AVSTL]-[KNSHYR]-[ML]-[MILC]-X(2) в 37 ( файл с результатами ) найдены все 9 белков выравнивания
Слабый X-[NDREQ]-[SPDNT]-[DNKSTE]-[LAKIRV]-[DSET]-[WYF]-[AGSVTLI]-[AKHSG]-[NQ]-[FLIVA]-[AVSTLI]-{AGVPM}-[MLI]-[MILCVA]-X(2) в 40 ( файл с результатами ) найдены все 9 белков выравнивания

Самый сильный паттерн - последовательность белка, поскольку аминокислоты заданы однозначно, по нему найдены родственные CISY_ECOLI белки.

Сильный паттерн включает по каждой позиции соответсвующие аминокислоты белков выравнивания, по нему найдены белки из семейства CISY.

При создании слабого паттерна я добавил к аминокислотам сильного паттерна похожие по свойствам аминокислоты, так во второй позиции паттерна к аспарагиновой кислоте добавил глутаминовую, в пятой позиции - к лейцину - близкий по свойствам изолейцин. Кроме белков семейства CISY найден белок из семейства CARB.

Мотивы белка CISY_ECOLI (по данным БД PROSITE)

Все описанные в PROSITE мотивы в заданном белке PURT_ECOLI ( P33221 )
Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке? координаты мотива
PS00480 CITRATE_SYNTHASE Цитрат-синтетаза паттерн GFGHrVy.KnyDPR специфична 1 303 - 315
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования (присоединения фосфата) казеин киназой 2 паттерн [ST] - x(2) - [DE] (фосфорилируются S или T) неспецифична 6 14 - 17, 58 - 61, 205 - 208, 322 - 325, 332 - 335, 414 - 417
PS00004 CAMP_PHOSPHO_SITE Сайт фосфорилирования цАМФ- и цГМФ-зависимой протеинкиназой паттерн [RK](2) - x - [ST] (фосфорилируются S или T) неспецифична 1 126-129
PS00008 MYRISTYL сайт N-миристилирования (миристилирование - присоединения остатка миристиновой кислоты - насыщенной жирной кислоты (С14)) паттерн G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} (миристат присоеденяется к G) неспецифична 7 137 - 142, 140 - 145, 196 - 201, 243 - 248, 267 - 272, 374 - 379, 403 - 408
PS00001 ASN_GLYCOSYLATION сайт N-гликозилирования паттерн N - {P} - [ST] - {P} (гликозилируется N] (P в фигурных скобках, т.к его присутсвтие в этих позициях ингибирует гликозилирование) ) неспецифична 2 233 - 236, 296 - 299
PS00005 PKC_PHOSPHO_SITE сайт фосфорилирования протеинкиназой C паттерн [ST] - x - [RK] (фосфорилируется ОН-группа S или T) неспецифична 3 238 - 240, 281 - 283, 298 - 300