|
-
Работа с командной строкой Linux
- команда "ls" показывает все содержимое рабочей папки
- “ls ..” показывает содержимое папки выше уровнем
- "cd .." сделала папку уровнем выше рабочей, что стало видно после использования команды ls
- применим предыдущую команду многократно, поднимаясь всё ближе и ближе к корню. Оказываемся над папкой home. Поскольку дальше команда cd .. не работает, видимо, подниматься выше этого уровня некуда и это и есть корневой каталог.
- команда pwd, по-видимому, показывает адрес рабочей директории
- команда cd без параметров возвращает пользователя в домашнюю директорию.
- команда "cd Term_2/Practices/Pr_5" делает рабочей директорию Pr_5, имеющую данный адрес
-
Создание и просмотр файлов.
- команда "seqret sw:p00000 -auto" создает файл с последовательностью заданного белка в fasta-формате.
- команда " entret sw:p00000 -auto"создает файл с информацией о белке из UniProt
- команда "more" показывает содержимое файла
- Команда "history" показывает всю историю команд с моей самой первой сессии в Putty
- Команда more H + клавиша Tab позволили мне выбрать файл, начинающийся на эту букву, не вводя полностью название.
Также я попробовала этот способ еще в нескольких ситуациях: если на выбранную букву есть 2 файла, причём имеющие одинаковое название, но разнное расширение, то клавиша Tab выведет название, и пользователю останется ввести расширение. А если есть несколько разных файлов на выбранную букву, то выведет названия всех этих файлов.
Построение оптимального глобального и оптимального локального выравнивания 2-х последовательностей
- используя программу needle построим оптимальное глобальное выравнивание для наших белков и сохраним в файл al1.needle, используя команду " needle IHFA_ECOLI.fasta dbh_strgn.fasta al1.needle -auto" (посмотреть файл)
IHFA_ECOLI 1 MALTKAEMSEYLFDKLGLSKRDAKELVELFFEEIRRALENGEQVKLSGFG 50
|| .|.::...:.....|:|:|:...|:..|..:...|..||:|:|.|||
DBH_STRGN 1 MA-NKQDLIAKVAAATELTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFG 49
IHFA_ECOLI 51 NFDLRDKNQRPGRNPKTGEDIPITARRVVTFRPGQKLKSRVENASPKDE 99
||::|::..|.||||:||::..|.|.:|..|:.|:.||..|:
DBH_STRGN 50 NFEVRERAARKGRNPQTGKETKIAASKVPAFKAGKALKDAVK------- 91
- Файл типа needle содержит в себе информацию о количестве выравниваемых последовательностей, их названии, имени файла, размерах штрафа за открытие гэпа и продолжение его(добавление позиции), длине полученного выравнивания, процент идентичности, процент сходства, процент длины гэпов от длины выравнивания, длину выравнивания, его вес и собственно выравнивание.
- При увеличении штрафов за гэп в два раза, выравнивание изменилось, но не особо. практически все выравнивание сохранилось кроме ситуации с тремя первыми позициями. Если раньше гэп стоял на третей позиции первого белка, позвояя получить 2 совпадения, то теперь гэп стоит на первой позиции второго белка, уменьшая количество совпадений до 0 на этом участке, но позволяя избежать громадного штрафа. Вес выравнивания уменьшился на 1 (посмотреть файл c измененными штрафами)
IHFA_ECOLI 1 MALTKAEMSEYLFDKLGLSKRDAKELVELFFEEIRRALENGEQVKLSGFG 50
...|.::...:.....|:|:|:...|:..|..:...|..||:|:|.|||
DBH_STRGN 1 -MANKQDLIAKVAAATELTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFG 49
IHFA_ECOLI 51 NFDLRDKNQRPGRNPKTGEDIPITARRVVTFRPGQKLKSRVENASPKDE 99
||::|::..|.||||:||::..|.|.:|..|:.|:.||..|:
DBH_STRGN 50 NFEVRERAARKGRNPQTGKETKIAASKVPAFKAGKALKDAVK------- 91
- аналогичным образом воспользуемся программой water (файл с автонастройками)
IHFA_ECOLI 18 LSKRDAKELVELFFEEIRRALENGEQVKLSGFGNFDLRDKNQRPGRNPKT 67
|:|:|:...|:..|..:...|..||:|:|.|||||::|::..|.||||:|
DBH_STRGN 17 LTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFGNFEVRERAARKGRNPQT 66
IHFA_ECOLI 68 GEDIPITARRVVTFRPGQKLKSRVE 92
|::..|.|.:|..|:.|:.||..|:
DBH_STRGN 67 GKETKIAASKVPAFKAGKALKDAVK 91
- при увеличении штрафа для локального выравнивания картина не изменяется (файл с удвоением штрафов)
IHFA_ECOLI 18 LSKRDAKELVELFFEEIRRALENGEQVKLSGFGNFDLRDKNQRPGRNPKT 67
|:|:|:...|:..|..:...|..||:|:|.|||||::|::..|.||||:|
DBH_STRGN 17 LTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFGNFEVRERAARKGRNPQT 66
IHFA_ECOLI 68 GEDIPITARRVVTFRPGQKLKSRVE 92
|::..|.|.:|..|:.|:.||..|:
DBH_STRGN 67 GKETKIAASKVPAFKAGKALKDAVK 91
- при уменьшении штрафа для локального выравнивания помимо по прежнему полностью совпадающего с предыдущими случами выравнивания, появляются еще 17 позиций в начале, которые не входили в прдедыдущие случаи, видимо, из-за наличия в предложенном для них оптимальном выравнивании 3х гэпов. (файл с уменьшенными штрафами)
IHFA_ECOLI 1 MALTKAEMSEYLFDKLG----LSKRDAKELVELFFEEIRRALENGEQVKL 46
|| .|.: |..|:. |:|:|:...|:..|..:...|..||:|:|
DBH_STRGN 1 MA-NKQD----LIAKVAAATELTKKDSAAAVDAVFAAVTEYLSKGEKVQL 45
IHFA_ECOLI 47 SGFGNFDLRDKNQRPGRNPKTGEDIPITARRVVTFRPGQKLKSRVE 92
.|||||::|::..|.||||:||::..|.|.:|..|:.|:.||..|:
DBH_STRGN 46 IGFGNFEVRERAARKGRNPQTGKETKIAASKVPAFKAGKALKDAVK 91
Сравнение оптимального глобального и оптимального локального выравнивания 2-х последовательностей
Для сравнения полученных выравниваний ответим на некоторые вопросы:
- есть ли хотя бы один пример того, что одной и той же позиции первой последовательности в разных глобальных выравниваниях сопоставлены разные позиции второй последовательности? такой случай единственный. 2 позиции IHFA_ECOLI соответствует 2 позиция другого белка в выравнивании с автонастройками и 1 позиция в выравнивании с удвоенными штрафами.
- то же при локальном выарвнивании? Отсутствует.
- есть ли хотя бы один пример того, что в одном глобальном выравнивании какой-либо позиции первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против той же позиции оказался пропуск?Такой случай также единственный: при автонастройках первой позиции IHFA_ECOLI соответствует 1 позиция второго белка, а в измененных настройках – пропуск.
- ТО же при локальном? Отсутствует.
- соответствуют ли оптимальные локальные выравнивания, построенными с использованием разных параметров, одним и тем же фрагментам последовательностей? Да, определенно. учитывая полное совпадение первого и второго выраввнивания и части третьего. Однако участок с первого по 17 остаток IHFA_ECOLI и соответствующий кусок второго белка рассмотрены только в третьем выравнивании.
- вообще глобальное и локальное выравние идентичны на участке от 18 до 92 остатка IHFA_ECOLI, а отличаются только распределением гэпов
Дополнительные задания:
-
|