Главная

Паттерны и профили

Результаты упражнений

  1. Создание паттернов аминокислотных последовательностей

  2. Выбранный фрагмент выравнивания, по которому строились паттерны

    Созданные паттерны:

    Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
    Фрагмент последовательности KDKPTNVLSFPFEVPPG 14 из выбранных белков нашелся только один, из которого, собственно и брали кусок. кроме него нашлись белки из разных штамов E.coli,что неудивительно если учесть что они получены by similarity, как было выяснено на одном из прошлых занятий. Кроме этого нашлось несколько белков из разных шигелл и один из Vibrio harveyi
    Сильный K-[DN]-[KCYR]-[PA]-T-N-[VI]-L-S-F-[PS]-
    [FAY]-[ITDE]-[NPVAC]-[PD]-[KLDPAE]
    - [MGE]
    68 Да, все.
    Слабый K-[DN]-{GPAWFH}-[PA]-T-N-[VI]-L-S-F-
    [PS]-X -{AGWFH}-X-[PD]-X(2,3)
    87 Да, все

    Комментарии: Для того, чтобы найти последовательности с близкими к данному фрагментами лучше использовать сильный паттерн. Если надо найти большое количество белков с относительно похожими структурами, например все ферменты с похожими активными центрами, лучше использовать слабый паттерн.

  3. Создание паттернов аминокислотных последовательностей

  4. Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
    PS01306 UPF0054 Подпись неохарактеризованного семейства белков UPF0054 паттерн H - [GSA] - x - [LVCYT] - H - [LAI] - [LIMSANQVF] - G - [FYWMH] - x - [HD] специфична 1
    PS00005 PKC_PHOSPHO_SITE сайт фосфорилирования протеинкиназы С паттерн [ST] - x - [RK] неспецифична 2
    PS00001 ASN_GLYCOSYLATION сайт N-гликозилирования (N-glycosylation) паттерн N - {P} - [ST] - {P} неспецифична 1
    PS00008 MYRISTYL сайт N-миристоилирования (N-myristoylation) паттерн G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} неспецифична 1

  5. Построение PSSM и определение веса последовательности по полученной матрице

  6. part2.txt файл с фрагментом выравнивания

    выходные файлы использованных программ


    part2.prophecy - выходной файл программы prophecy
    part2.profit - выходной файл программы profit

    Комментарии
    Для программы prophesy:
    На вход подали файл part2.txt, параметры, такие как тип профиля 'F'и пороговое значение сходства последовательностей для отчёта 75% ("Enter threshold reporting percentage"), оставили по умолчанию.
    В построенной матрице строки соответствуют позициям выравнивания, в столбцах - соответствующие аминокислотам буквы по алфавиту. Числа показывают сколько раз соответствующей позиции встретилась данная аминокислота. В графе Consensus указана последовательность, состоящая из наиболее часто встречающихся аминокислот (по каждой позиции выравнивания) - KDKPTNVLSFPFEAPPGL.

    Для программы profit:
    На вход программе подали профиль part2.prophecy (полученный с помошью prophecy) и последовательности - part2.txt. В выходном файле указан процент сходства последовательностей с консенсусной последовательностью из файла part2.prophecy. Така как установлен предел сходства - не менее 75%, то програма выводит только строку одного белка:
    5434_PSEF5 1 Percentage: 79
    Сооответственно, остальные белки из списка совпадают с консесусной последовательностью менее чем на 75%, что, вероятно, говорит о том что выбранные куски принадлежат достаточно далеким (в том смысле, что не близко родственным) белкам.


©Шалаева Дарья 2007