Упражнения по работе в пакете EMBOSS

Все команды выполняйте в специальной поддиректории на pvm. Не забывайте вести протокол. По окончании работы скопируйте все полученные файлы в соответствующую директорию на диске H.

  1. Сохраните последовательность из записи банка EMBL с номером доступа (AC) M32293 в форматах: fasta, embl, genbank, gcg, pir, ncbi. Файлы назовите m32293.fasta, m32293.embl и т.д.

    Подсказка: программа "seqret". Работа значительно ускорится, если сначала программой "entret" скопировать полную запись в файл m32293.entret, а уже затем применять "seqret" к полученному файлу.

  2. Определите, в каких форматах присутствует информация о таксономии организма. Воспользуйтесь командой "grep" и спецсимволом *. Сохраните результат выполнения "grep" в файле; приведите в протоколе командную строку (и, разумеется, ответ на вопрос вместе с его обоснованием).

    Подсказка: первый параметр команды "grep" — последовательность символов, которую вы ищете;
    второй параметр (а также, если надо, третий, четвёртый и т.д. параметры) — файл(ы), в которых вы ищете.

    Методическое указание: не бойтесь выполнить "grep" несколько раз, пока не получите устраивающий вас результат; чтобы не плодить ненужные файлы, выполняйте команду сначала без перенаправления, и только получив на терминале желаемый результат, выполните последнюю команду еще раз, добавив перенаправление вывода. Не забывайте, что последнюю из выполненных команд можно снова вызвать в командную строку клавишей "стрелка вверх" (и редактировать после этого).

  3. Выясните, какой программой EMBOSS можно посчитать нуклеотидный состав последовательности. Сохраните help к этой программе в файле <имя программы>.help

    Подсказка: воспользуйтесь программой "wossname"; "состав" по-английски — "composition".

  4. Программа "shuffleseq" предназначена для случайного перемешивания последовательностей. Напишите командную строку, которая позволит получить 5 случайных перемешиваний последовательности embl:m32293