Выбранный фрагмент выравнивания, по
которому строились паттерны
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности | KDKPTNVLSFPFEVPPG | 14 | из выбранных белков нашелся только один, из которого, собственно и брали кусок. кроме него нашлись белки из разных штамов E.coli,что неудивительно если учесть что они получены by similarity, как было выяснено на одном из прошлых занятий. Кроме этого нашлось несколько белков из разных шигелл и один из Vibrio harveyi |
Сильный | K-[DN]-[KCYR]-[PA]-T-N-[VI]-L-S-F-[PS]- [FAY]-[ITDE]-[NPVAC]-[PD]-[KLDPAE] - [MGE] |
68 | Да, все. |
Слабый | K-[DN]-{GPAWFH}-[PA]-T-N-[VI]-L-S-F- [PS]-X -{AGWFH}-X-[PD]-X(2,3) |
87 | Да, все |
Комментарии: Для того, чтобы найти последовательности с близкими к данному фрагментами лучше использовать сильный паттерн. Если надо найти большое количество белков с относительно похожими структурами, например все ферменты с похожими активными центрами, лучше использовать слабый паттерн.
Идентификатор документа PROSITE (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (регулярное выражение) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
PS01306 | UPF0054 | Подпись неохарактеризованного семейства белков UPF0054 | паттерн | H - [GSA] - x - [LVCYT] - H - [LAI] - [LIMSANQVF] - G - [FYWMH] - x - [HD] | специфична | 1 |
PS00005 | PKC_PHOSPHO_SITE | сайт фосфорилирования протеинкиназы С | паттерн | [ST] - x - [RK] | неспецифична | 2 |
PS00001 | ASN_GLYCOSYLATION | сайт N-гликозилирования (N-glycosylation) | паттерн | N - {P} - [ST] - {P} | неспецифична | 1 |
PS00008 | MYRISTYL | сайт N-миристоилирования (N-myristoylation) | паттерн | G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} | неспецифична | 1 |
part2.txt файл с фрагментом выравнивания