Второй семестр

Мотивы, профили и паттерны.


1. Создание паттернов аминокислотных последовательностей


Выбранный фрагмент выравнивания находится в файле choosen.html

Паттерны, созданные по множественному выравниваю.

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности G-V-G-N-D-G-H-I-A-F-N-E-P-A-S-S-L-A-S-R 22 Ни одной, кроме моего белка
Сильный G-[IV]-G-[TEVPANI]-[DN]-G-H-I-[AG]-F-N-E-P-[GDA]-[SI]-[SN]-[LF]-[AEKTG]-[SA]-[RK] 46 все
Слабый G-x-[DN]-G-H-I-[AG]-F-N-E-P-x-[SI]-[SN]-[LF]-x-[SA] 82 все

Таким образом, в зависимости от того, что нужно найти можно использовать разные паттерны. Самый строгий паттерн хорош для поиска конкретного белка. А более слабые находят и другие белки, так как возможны варианты расположения аминокислотных остатков в паттерне. Самый слабый вариант нашел больше всего последовательностей, удовлетворяющих данному паттерну, но не все они могут быть родственными, так как условия паттерна очень "лояльные", и совпадение аминокислотных остатков может быть просто совпадением букв паттерна и никак не быть обоснованно биологически.

2. Все описанные в PROSITE мотивы в заданном белке NAGB_Ecoli


Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-[LTGS]-x-x-[GTNA]-[GTDL] неспецифична 3
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеинкиназы 2 паттерн [TS]-x-x-[ED] неспецифична 4
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилирования белка киназы С паттерн [TS]-x-[KR] неспецифична 4
PS00007 TYR_PHOSPHO_SITE Сайт фосфорилирования тирозинкиназы паттерн K-x-x-x-E-x-x неспецифична 1
PS01161 GLC_GALNAC_ISOMERASE "Подпись" глюкозамин\галактозамин-6-фосфатизомеразы паттерн I-r-s-y-G-k-I-h-L-f-M-g-G-V-C-n-D-G-H специфична 1

3.Построение PSSM и определение веса последовательности по полученной матрице


Матрица PSSM построена с помощью программы prophecy пакета EMBOSS на сервере kodomo-count.На вход подан файл с выравниванием фрагмента part2.txt, созданный при выполнении упр.1. По умолчанию выбран тип профиля 'F'.(Возможные варианты работы программы:F(frequency), G(Gribskov), H-(Henikoff)) Результат находится в файле part2.prophecy Запрос программы "Enter threshold reporting percentage" задает процентное значение, которое может быть получено от максимального результата.
Запущена программа profit пакета EMBOSS на сервере kodomo-count. Она определяет вес последовательности на основе матрицы PSSM. Profit получает вес выравнивания на основе prophecy для каждой последовательности, сравнивает его с пороговым значением, которое было задано команодой "Enter threshold reporting percentage", и сообщает о значении выше порогового. В качестве профиля на вход подан файл, полученный с помощью prophecy, а в качестве последовательностей - part2.txt. Результат находится в файле part2.profit
©MARIA KUZNETSOVA,2007