Создание паттернов аминокислотных последовательностей

1

Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-Prot
Из выравнивания, полученного на прошлом занятии, выберем фрагмент с 257-й позиции по 269-ю:



Для этого фрагмента создадим три паттерна:
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности VNSKMMQLTGNPE 9 только исходная
Сильный [VI]-[NT]-[MRS]-[EDRKQ]-[LVM]-[LIM]-[DKAQ]-[LKQ]-[ATS]-[AG]-x(0,1)-[PE]-[DNHQE] 16 все
Слабый [MRS]-x-[LVM]-[LIM]-[DKAQ]-[LKQ]-[AT]-[AG]-x(0,1)-[PE] 169 все
Естественно, что в первом случае нашлась только исходная последовательность - ведь в выравнивании все последовательности отличаются.
Во втором случае, кроме последовательностей из выравнивания, нашлись еще 10 других последовательностей. Все они - близкие к исходным и являются частями белков из семества ОТС-аз, как и белки в выравнивании. Интересно, что там, где в паттерне стоит х(0,1) - то есть где могло бы быть все что угодно: гэп либо любой а.о. - у всех последовательностей, кроме одной, стоит остаток аланина (единственная отличающаяся по этому признаку последовательность - это OTC_PSEPK, которая была и в выравнивании), что указывает на консервативность структуры.
В третьем случае паттерн был "ослаблен" (уменьшена его длина, в позиции с 5 возможными вариантами а.о. были разрешены все а.о.), и результат поиска заметно отличается от предыдущего. Среди найденных белков большинство относится к другим семействам и довольно далеки от исходных.


2

Все описанные в PROSITE мотивы в заданном белке ОТС1_Ecoli
Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00097 CARBAMOYL
TRANSFERASE
Отличительная особенность аспартат- и орнитинкарбамоил-
трансфераз
паттерн F-x-[EK]-x-S-[GT]-R-T специфична для аспартат- и орнитин-
карбамоил-
трансфераз
1
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеинкиназы (II) паттерн [ST]-x(2)-[DE] неспецифична 9
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилирования протеинкиназы С паттерн [ST]-x-[RK] неспецифична 6
PS00007 TYR_PHOSPHO_SITE Сайт фосфорилирования тирозинкиназы паттерн [RK]-x(2,3)-[DE]-x(2,3)-Y неспецифична 2
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 6
PS00001 ASN_GLYCOSYLATION Сайт N-гликозилирования паттерн N-{P}-[ST]-{P} неспецифична 1
PS00009 AMIDATION Сайт амидирования паттерн x-G-[RK]-[RK] неспецифична 1

к проектам

на главную