Подсказки к заданию 12.

  1. Как построить выравнивание без гэпов?

    1-й способ.
    Используйте программу emma. Для того, чтобы получить выравнивание без гэпов, задайте параметры, практически запрещающие гэпы, например, -gapopen 100.0.
    Файлы с последовательностями можно задать, используя маску (например, *.fasta, если в вашей рабочей директории нет других файлов с такими названиями). Программе можно также задать список файлов, который нетрудно создать с помощью команды ls > listfile (при подаче лист-файла на вход программе не забудьте символ @ ).
    Проверьте, чтобы в выравнивании действительно не было гэпов.

    2-й способ. Выравнивание без гэпов в формате fasta можно получить, просто записав все последовательности в один файл — программами EMBOSS это будет воспринято как выравнивание.
     

  2. Как переделать матрицу попарных расстояний в данные для построения графика, т.е. в таблицу вида имя пары - расстояние ?

    1. Скопируйте таблицу с транспонированием на отдельный лист книги, назовите лист "ххх_tmp", где ххх - имя матрицы.

    2. Справа создайте такую же таблицу , в непустых ячейках которой значения расстояний будут заменены на имена пар, например, (Seq1Seq2). Для этого сначала создайте вторую копию таблицы, а затем используйте текстовую функцию сцепления подстрок (concatenate). Придется использовать как относительные (например, А1), так и абсолютные ссылки (например, $А$1).
      Проверьте соответствие таблиц!

    3. В каждой таблице выделите непустые ячейки второго столбца с расстояниями (или именами пар) и копируйте в конец первого столбца с расстояниями (или именами пар). Затем в конец получившихся столбиков скопируйте непустые ячейки третьих столбцов и т. д.
      Внимание, ячейки с именами пар надо копировать, сохраняя только значение!

    4. Соберите вместе получившиеся 2 столбца и просортируйте их вместе по именам пар.

    Должна получиться таблица вида

    Имя пары последовательностей Seq1Seq2 ….
    Расстояние 250 ….