Создание паттернов для поиска и распознавания аминокислотных последовательностей




В таблице вы видите данные, которые я получил с помощью PROSITE, когда искал мотивы в белке DAPB_ECOLI

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
Данные:
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 7
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования Казеин киназы II паттерн [ST]-x(2)-[DE] неспецифична 5
PS00001 ASN_GLYCOSYLATION Сайт N-гликолизирования паттерн N-{P}-[ST]-{P} неспецифична 1
PS00007 TYR_PHOSPHO_SITE Сайт фосфорилирования Тирозин киназы паттерн [RK]-x(2)-[DE]-x(3)-Y
или
[RK]-x(3)-[DE]-x(2)-Y
неспецифична 1
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилации Протеин киназы С паттерн [ST]-х-[RK] неспецифична 4
PS01298 PKC_PHOSPHO_SITE Подпись дигидродипиколинат редуктазы паттерн [ERND]-[IVL]-x-[ED]-x-H-x(3)-K-x-[DE]-x(2)-S-[GA]-[TAS]-[ALCGS] специфична 1