Работа в командной строке Linux. Программы выравнивания
последовательностей пакета EMBOSS.
На главную
Назад
1. Работа в командной строке Linux
- Команда "ls" отображает содержимое директории, в которой на данный момент находится пользователь, при этом файлы и папки выделены разными цветами.
- При выполнении команды "ls .." отбразилось содержание родительской директории относительно моей рабочей директории (конкретно в моём случае: отобразились директории,
содержащие рабочие файлы других студентов).
- команда "cd .." возращает нас в родительскую директорию, а последующая команда "ls"
отображает её содержимое, иными словами "ls .." = "cd ..", "ls").
- Выполнение команды "ls .." ("cd ..", "ls") до тех пор пока картинка перестанет меняться, приводит нас в родительскую директорию.
- Команда pwd пишет полный адрес директории в командной строке.
- Команда "seqret: swp05020 -auto" создаёт файл pyrc_ecoli.fasta с последовательностью белка в fasta-формате.
просмотреть его можно использовав команду "more pyrc_ecoli.fasta".
- Команда "entret sw:p05020 - auto" создает файл pyrc_ecoli.entret с записью в PDB формате. Просматривается аналогично.
- Нажатие стрелок "вверх" и "вниз" позволяет нам увидеть какие команды были введены в командной строке раньше. Команда "history" выводит нам список всех
команд, в том порядке, в котором они были введены раньше.
- Если первая буква названия нужного нам файла отличается от первых букв названий остальных файлов, то можно быстро вызвать его
введя more, затем пробел, первую букву и клавишу tab (это также работает если начало названий файлов совпадает, но дальше только название нашего файла содержит определенную букву).
2.
В этом задании, я проводил выравнивания, используя программы needle (глобальное выравнивание) и water
(локальное выравнивание), при этом для выравниваний я задавал разные параметры. Здесь и даллее
я использовал следующие обозначения:
- Выравнивание с параметрами взятыми по умолчанию - штраф за открытие гэпа равен 10.0, штраф взятый за продолжение гэпа - 0.5.
- Выравнивание с параметрами в два раза больше - штраф за открытие гэпа равен 20.0, штраф взятый за продолжение гэпа - 1.0.
- Выравнивание с параметрами в два раза меньше - штраф за открытие гэпа равен 5.0, штраф взятый за продолжение гэпа - 0.25.
Построить и сравнить оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей.
Спомощью программы needle я построил несколько выравниваний для моего белка PYRC_ECOLI и данного мне Q0AFI1 (PYRC_NITEC):
- Выравнивание, параметры которого были взяты по умолчанию находится в файле aln1aut.needle.
- Выравнивание, параметры которого были взяты вдвое меньше, чем по умолчанию находится в файле aln1small.needle.
- Выравнивание, параметры которого были взяты вдвое больше, чем по умолчанию находится в файле aln1big.needle
Сравнивая количественные параметры полученных спомощью needle выравниваний можно заметить, что у выравнивания с параметрами заданными в два раза ниже стандартных
выше процент идъентичности, процент сходства, длина выравнивания, но и больше количество пропусков, что, впрочем, не
мешает ему иметь самый высокий вес выравнивания (хотя эти параметры отличаются друг от друга незначительно).
Для наглядности я составил таблицу:
Параметры выравнивания |
% идентичности |
% сходства |
Пропуски |
Вес |
По умолчанию |
51,6% (181/351) |
63,5% (223/351) |
9/351 |
905.0 |
В 2 раза меньше |
52,3% (185/354) |
63,8% (226/354) |
15/354 |
923.0 |
В 2 раза больше |
51,4% (180/350) |
63,4% (222/350) |
7/350 |
894.0 |
Спомощью программы water я построил несколько локальных выравниваний тех же последовательностей.
- Выравнивание, параметры которого были взяты по умолчанию находится в файле aln2aut.water.
- Выравнивание, параметры которого были взяты вдвое меньше, чем по умолчанию находится в файле aln2small.water.
- Выравнивание, параметры которого были взяты вдвое больше, чем по умолчанию находится в файле aln2big.water
Напротив, у выравнивания, полученного спомощью water, у которого параметры взяты в два раза меньше,
количественные параметры (кроме веса) оказались ниже остальных.
Параметры выравнивания |
% идентичности |
% сходства |
Пропуски |
Вес |
По умолчанию |
53,2% (181/340) |
65,0% (221/340) |
4/340 |
908.0 |
В 2 раза меньше |
52,9% (185/350) |
64,3% (225/350) |
13/350 |
923.0 |
В 2 раза больше |
53,1% (180/339) |
64,9% (220/339) |
2/339 |
897,0 |
3. Сравнение полученных выравниваний.
- "есть ли хотя бы один пример того, что одной и той же позиции
первой последовательности в разных глобальных выравниваниях сопоставлены
разные позиции второй последовательности?"
Да есть, приведу один пример:
Позициям 69-70 белка PYRC_ECOLI в выравнивании с параметрами, взятыми по умолчанию (верхний рисунок)
соответствуют позиции 66-67 белка PYRC_ECOLI, а в выравнивании с параметрами взятыми в два раза больше,
той же позиции белка PYRC_ECOLI соответствует позиция 66-67 белка PYRC_NITEC.
- "есть ли хотя бы один пример того, что одной и той же позиции первой последовательности
в разных локальных выравниваниях сопоставлены разные позиции второй последовательности?"
Да, подобный случай встречается: позициям 69-70 последовательности PYRC_ECOLI выравнивания с параметрами, взятыми по умолчанию(верхний рисунок),
соответствуют 66-67 позиции белка PYRC_NITEC, а в выравнивании с параметрами взятыми в два раза больше тем же позициям
из PYRC_ECOLI соответствуют позиции 69-70 белка PYRC_NITEC.
- "есть ли хотя бы один пример того, что в одном глобальном выравнивании какой-либо позиции
первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против той
же позиции оказался пропуск?"
Позиция 71 белка PYRC_ECOLI в выравнивании с параметрами, взятыми по умолчанию (верхний рисунок)
соответствуют позиции 70 (G глицин) белка PYRC_NITEC, а в выравнивании с параметрами взятыми в два раза меньше,
той же позиции белка PYRC_ECOLI соответствует пропуск.
- "есть ли хотя бы один пример того, что в одном локальном выравнивании какой-либо позиции
первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против
той же позиции оказался пропуск?"
Да есть: для позиций 71 белка PYRC_ECOLI в выравнивании с параметрами в зятыми по умолчанию (рисунок сверху) соответствует 70 позицияв белке PYRC_NITEC,
а в выравнии с параметрами взятыми в два раза меньше (рисунок снизу) против той же позиции белка PYRC_ECOLI ставится пропуск.
- "соответствуют ли оптимальные локальные выравнивания, построенными с использованием разных параметров, одним и тем же фрагментам последовательностей?"
Нет, так как выровненные учатки имеют разную длину (в выравнивании с параметрами в 2 раза ниже сравнивались участки с 1 по 344 а.о белка PYRC_ECOLI, у PYRC_NITEC 1-343,
в остальных же выравниваниях сравнивались участки с 8 по 344 а.о. у PURC_ECOLI и 5-243 у PYRC_NITEC).
- "совпадают ли локальные выравнивания с соответствующими частями глобальных выравниваний?"
Локальные выравнивания совпадают с соответствующими частями глобального выравнивания (для выравниваний с одинаковыми параметрами).
©Базылев Сергей, 2007