Самый простой способ создать отчет в формате HTML — это скопировать страничку задания, а затем ее отредактировать!

Занятие 10. Мотивы, паттерны и профили

Упражнение 1. Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-Prot

Импортируйте в Genedoc множественное выравнивание, полученное на прошлом занятии с помощью muscle.
Выберите фрагмент выравнивания длиной 8-20 а.о. для дальнейшего исследования. Желательно, чтобы от трети до половины колонок фрагмента были консервативны на 70-100%, будет поучительно, если попадется гэп ближе к одному из концов фрагмента.
Экспортируйте выбранный фрагмент в HTML-файл, который затем прикрепите к отчету.
Самый длинный участок выбранного фрагмента, не содержащий гэпов, экспортируйте в формате FASTA в текстовой файл part2.txt, который пригодится для выполнения упр.3

Рассмотрите выбранный Вами фрагмент множественного выравнивания. Создайте 3 паттерна, запишите их в таблицу, см. ниже.

  1. Первый паттерн в точности является фрагментом последовательности Вашего белка.
  2. Второй ("сильный") паттерн надо постараться построить так, чтобы он распознавал все белки Вашей выборки, и только их (другой вопрос, что паттерн будет находить в действительности:)
  3. Третий ("слабый") паттерн надо создать на основе второго, сделав требования к последовательности более мягкими.
В этом упражнении надо показать умение использовать три основные элемента синтаксиса паттернов:
[ALK] — в данной позиции разрешены только остатки в квадратных скобках;
Х(3) — интервал в 3 любых остатка;
{WY} — запрет на остатки в фигурных скобках,
подробнее о правилах написания патернов см. Pattern syntax rules
Как "усилить" или "ослабить" паттерн см. в подсказке.

Проведите поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов, см. подсказку.

По результатам упражнения заполните табличку следующего вида:

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности      
Сильный      
Слабый      

Упражнение 2. Найти и описать все мотивы в Вашем белке (по данным БД PROSITE)

Найдите в последовательности вашего белка все мотивы, описанные в PROSITE, в том числе неспецифичные (часто встречающиеся). По результатам поиска составьте следующую таблицу.

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
Например,
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 12
             
             

Упражнение 3. Создать позиционно-специфичную матрицу частот аминокислотных остатков (PSSM), получить вес последовательности по этой матрице

Постройте PSSM с помощью программы prophecy пакета EMBOSS на сервере kodomo-count.
На вход подайте файл с выравниванием фрагмента part2.txt, созданный при выполнении упр.1.
Проверьте, что по умолчанию выбран тип профиля 'F'.
*Что означает запрос программы "Enter threshold reporting percentage" ??
Запустите программу profit пакета EMBOSS на сервере kodomo-count. В качестве профиля на вход подайте файл, полученный с помощью prophecy, а в качестве последовательностей - part2.txt.
Файлы с выдачей обеих программ прикрепите к отчету, а в нем поясните, что произошло.

Формат отчета

Формат — HTML-страничка, названная "Паттерны и профили".

  1. Заголовок "Создание паттернов аминокислотных последовательностей"
    • Ссылка на HTML-файл с выбранным фрагментом выравнивания, по которому строились паттерны (названия последовательностей должны представлять собой ID белков!)
    • Таблица к упр. 1 (таблица должна иметь заголовок)
    • Краткий комментарий к таблице, в котором объясняется, что и зачем делалось, а также описаны возможные наблюдения. Например, указано, нашлись ли последовательности с названием, явно отличающимся от названия Вашего белка; если да, то с каким? Любые другие интересные наблюдения будут оценены по достоинству.
  2. Заголовок "Все описанные в PROSITE мотивы в заданном белке XXXX_Ecoli"
    • Таблица к упр. 2
  3. Заголовок "Построение PSSM и определение веса последовательности по полученной матрице"
    • Гиперссылка на файл с фрагментом выравнинвания,
    • Гиперссылки на выходные файлы использованных программ
    • Краткий комментарий: что делали, что получили, наблюдения...