Учебный сайт
Главная Семестры Проекты Обо мне

Создание паттернов аминокислотных последовательностей
Из множественного выравнивания нескольких потенциально гомологичных белков ( в том числе и BCCP_ECOLI) был выбран участок из 14 аминокислотных остатков: в нем в одной из последовательностей (GCDC_ACIFE) содержится гэп, процент консервативных позиций составляет около 50%. Вот этот участок:

По этому участку было составлено 3 паттерна (сильный, слабый и один, представляющий собой копию последовательности BCCP_ECOLI). По этим паттернам был произведен поиск в базе данных prosite в банке SwissProt на наличие белков с мотивами, соответствующими составленным паттернам. Результаты представлены в таблице.

Сравнение результатов поиска по разным паттернам последовательности
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности GHIVRSPMVGTFYR 4 нет, была найдена только последовательность BCCP_ECOLI
Сильный [GLV][DATHN]X(0,1)[VI][TVEASR][AS]P[ML][QVPA]G[TVKN][FIAV][YWLV][KRGLSA] 17 да
Слабый [VI]X[AS]P[ML][QVPA]G[TVKN]{DERKH}[YWLV] 43 да
По данным таблицы видно, что по паттерну - копии последовательности из BCCP_ECOLI было найдено всего 4 белка, 3 из которых относятся к родственным организмам (первые 3 буквы во второй части идентификаторов совпадают: ECO57, ECOL6, ECOLI). Такой паттерн является очень строгим, так как не подразумевает вариаций в позициях выравнивания.
При поиске по сильному паттерну было найдено больше результатов. Паттерн был построен с целью возможности найти по нему только белки из множественного выравнивания. Полностью этого сделать не удалось, так как вместо 11 было найдено 17 белков. "Лишние" белки не из множественного выравнивания являются родственными к белкам из выравнивания.
При поиске по слабому паттерну было обнаружено 43 белка. В этом паттерне были отброшены 3 первых колонки выравнивания (в одной из этих колонок содержался гэп, в другая, по-видимому, была неконсервативна (содержала очень малое число схожиз остатков), также была отброшена последняя колонка, в которой было 6 различных аминокислотных остатков. В 12 колонке сильного паттерна содержались неполярные аминокислотные остатки. В слабом паттерне в этой колонке было поставлено условие - отсутствие заряженных остатков.
Если в поиске по сильным паттернам находились преимущественно белки BCCP - biotin carboxyl carrier protein, то при поиске по слабому паттерну были также найдены белки ACSF2 - Acyl-CoA synthetase family member 2, mitochondrial из организмов мыши, крысы, приматов и человека; PYRE - Orotate phosphoribosyltransferase из гаммапротеобактерий.

Все описанные в PROSITE мотивы в заданном белке BCCP_ECOLI
Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS50968 BIOTINYL_LIPOYL профиль биотинил/липоил домена профиль нет специфична 1
PS00188 BIOTIN сайт прикрепления белков, нуждающихся в биотине паттерн [GDN]-[DEQTR]-x-[LIVMFY]-x(2)-[LIVM]-x-[AIV]-M-K-[LVMAT]-x(3)-[LIVM]-x-[SAV]
K - сайт прикрепления биотина
специфична 1
PS00006 CK2_PHOSPHO_SITE сайт фосфорилирования казеинкиназыII паттерн [ST]-x(2)-[DE]
[S или T - сайт фосфорилирования]
неспецифична 2
PS00005 PKC_PHOSPHO_SITE сайт фосфорилирования протеинкиназыC паттерн [ST]-x-[RK]
[S или T - сайт фосфорилирования]
неспецифична 2
PS00008 MYRISTYL сайт N-миристилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}
[G - сайт N-миристилирования]
неспецифична 2

© Яшина 2009