Материалы к практикуму 8

  1. Если просто набрать в командной строке fasta34, то программа сама задаст необходимые вопросы, а именно: об имени файла с пробной последовательностью, имени файла с банком для поиска, параметре ktup (оставьте его по умолчанию равным 6), затем об имени выходного файла, количестве находок для вывода, и для скольких из них выдать также выравнивание (будьте внимательны, читайте вопросы, некоторые из них задаются "в два приема").

    При наборе длинного полного имени файла легко ошибиться (если Вы ошиблись и ввели какой-нибудь параметр неверно, то лучше прервать выполнение программы, нажав <Ctrl+C>). Ответ на вопрос программы fasta34 — это не командная строка, тут не действует подсказка клавишей <Tab>, нельзя подставлять переменные и пользоваться в именах файлов символом *; набранное Вами при ответе на вопрос нигде, кроме самой программы, не сохраняется, поэтому при повторном запуске придется не исправлять опечатку, а набирать все заново.

    В связи со всем этим рекомендуется воспользоваться предоставляемой программой fasta34 возможностью набрать часть параметров в командной строке, а именно:

     fasta34 query.fasta db.fasta 6
    
    (где вместо query.fasta должно стоять имя файла с пробной последовательностью, а вместо db.fasta — имя файла с банком). На остальные вопросы придется все же ответить. (Впрочем, почитав manual пакета Fasta, можно выяснить, как задать все параметры в командной строке так, чтобы программа не задавала вопросов). Если Вы допускаете ошибку, можно вызвать клавишей <↑> предыдущую командную строку и отредактировать её.

    Постарайтесь добиться, чтобы программа выдала краткую информацию обо всех находках с E-value < 0,01 (и, возможно, нескольких ещё), а также одно (лучшее) выравнивание.
     

  2. Лучше всего взять в качестве фрагмента часть гена гомолога своего белка (соответствующую запись EMBL Вы уже добывали при выполнении задания 2 предыдущего занятия). Необходимый участок проще всего вырезать посредством seqret -sask.

    Запустите megablast без параметров, чтобы получить подсказку — список параметров программы. Вам понадобятся параметры: -d (базовое имя индексных файлов), -i (входной файл), -o (выходной файл), возможно также -e, -F, -D; а также знание значения параметра -W по умолчанию.

    Если Вы стерли индексные файлы, то для быстрого их восстановления можно воспользоваться журналом команд. Журнал команд вызывается командой history. Команду номер 217 из журнала можно вызвать, набрав в командной строке !217 и нажав <Enter>.
     

  3. Megablast'у можно давать в качестве пробы не одну последовательность, а много (в одном fasta-файле). Помимо упомянутых, понадобятся параметры -t, -W, -N. Интерпретацию выходного файла при значениях -D, отличных от 2, читайте в "README for standalone MEGABLAST".