Занятие 8. Программы пакета BLAST для работы с нуклеотидными последовательностями

Создайте директорию BLAST для работы на этом и следующем занятиях. Выходные файлы программ пакета BLAST должны находиться в этой директории. Отчёт должен появиться на вашем веб-сайте к вечеру дня следующего занятия.

На компьютере kodomo (и kodomo-count) в директории /home/export/samba/public/y07/Term3/EMBL лежат 3 файла:

  1. Поиск в геноме участков, кодирующих белки, похожие на заданный
  2. Вы знаете аминокислотную последовательность Вашего белка из Escherichia coli K-12. Ваша задача — определить, закодированы ли похожие белки в геноме другого организма, не пользуясь аннотацией генома.

    Создайте в своей рабочей директории индексные файлы пакета BLAST для поиска по заданному геному.

    Выберите подходящую для решения данной задачи программу из пакета BLAST (cм. материалы) и проведите с ее помощью поиск с порогом на E-value 0,001.

    По результатам поиска заполните таблицу.

    Поиск гомологов белка <...> в геноме <такой-то бактерии>

    Число находок с Е-value<0,001         
    Характеристика лучшей находки:  
       E-value находки  
    AC соответствующей записи EMBL  
    Координаты выравнивания(-ий) в записи EMBL  
    Координаты CDS в записи EMBL (если есть)  
    AC UniProt для этого CDS (если есть)  

  3. Аналогичный поиск сразу в нескольких геномах
  4. Создайте в своей директории индексные файлы BLAST для поиска по всем трем геномам сразу. С помощью выбранной ранее программы проведите поиск по трем геномам. Отметьте в отчете, как изменился (если изменился) E-value той находки, которая была лучшей по результатам предыдущего упражнения, а также общее число находок с E-value < 0,001.

  5. Поиск гомологов с помощью программы BLASTN
  6. Создайте в своей рабочей директории fasta-файл с последовательностью из генома E.coli, кодирующей ваш белок (для этого надо взять одну из записей EMBL, на которую ссылается ваша запись Swiss-Prot, найти в ней координаты соответствующей CDS и вырезать последнюю программой seqret в отдельный файл).

    Поищите гомологов этого гена в трёх геномах программой BLASTN. Опишите результаты в отчёте: укажите E-value лучшей находки, приведите соответствующее выравнивание и аннотацию соответствующего фрагмента генома (если она, конечно, есть в записи EMBL). Сравните результаты с результатами предыдущего упражнения, ваши наблюдения изложите в отчёте.

См. подсказки.