учебный сайт Вероники Владыкиной

Проекты. Работа в командной строке Linux.
Программы выравнивания последовательностей пакета EMBOSS

на главную
1 семестр
2 семестр
проекты
официальный сайт ФББ
  1. Работа с командной строкой Linux

    • команда "ls" показывает все содержимое рабочей папки
    • “ls ..” показывает содержимое папки выше уровнем
    • "cd .." сделала папку уровнем выше рабочей, что стало видно после использования команды ls
    • применим предыдущую команду многократно, поднимаясь всё ближе и ближе к корню. Оказываемся над папкой home. Поскольку дальше команда cd .. не работает, видимо, подниматься выше этого уровня некуда и это и есть корневой каталог.
    • команда pwd, по-видимому, показывает адрес рабочей директории
    • команда cd без параметров возвращает пользователя в домашнюю директорию.
    • команда "cd Term_2/Practices/Pr_5" делает рабочей директорию Pr_5, имеющую данный адрес
  2. Создание и просмотр файлов.

    • команда "seqret sw:p00000 -auto" создает файл с последовательностью заданного белка в fasta-формате.
    • команда " entret sw:p00000 -auto"создает файл с информацией о белке из UniProt
    • команда "more" показывает содержимое файла
    • Команда "history" показывает всю историю команд с моей самой первой сессии в Putty
    • Команда more H + клавиша Tab позволили мне выбрать файл, начинающийся на эту букву, не вводя полностью название.
      Также я попробовала этот способ еще в нескольких ситуациях: если на выбранную букву есть 2 файла, причём имеющие одинаковое название, но разнное расширение, то клавиша Tab выведет название, и пользователю останется ввести расширение. А если есть несколько разных файлов на выбранную букву, то выведет названия всех этих файлов.
  3. Построение оптимального глобального и оптимального локального выравнивания 2-х последовательностей

    • используя программу needle построим оптимальное глобальное выравнивание для наших белков и сохраним в файл al1.needle, используя команду " needle IHFA_ECOLI.fasta dbh_strgn.fasta al1.needle -auto" (посмотреть файл)
      IHFA_ECOLI   1 MALTKAEMSEYLFDKLGLSKRDAKELVELFFEEIRRALENGEQVKLSGFG     50
                     || .|.::...:.....|:|:|:...|:..|..:...|..||:|:|.|||
      DBH_STRGN    1 MA-NKQDLIAKVAAATELTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFG     49
      
      IHFA_ECOLI  51 NFDLRDKNQRPGRNPKTGEDIPITARRVVTFRPGQKLKSRVENASPKDE     99
                           ||::|::..|.||||:||::..|.|.:|..|:.|:.||..|:       
      DBH_STRGN   50 NFEVRERAARKGRNPQTGKETKIAASKVPAFKAGKALKDAVK-------     91
      
    • Файл типа needle содержит в себе информацию о количестве выравниваемых последовательностей, их названии, имени файла, размерах штрафа за открытие гэпа и продолжение его(добавление позиции), длине полученного выравнивания, процент идентичности, процент сходства, процент длины гэпов от длины выравнивания, длину выравнивания, его вес и собственно выравнивание.
    • При увеличении штрафов за гэп в два раза, выравнивание изменилось, но не особо. практически все выравнивание сохранилось кроме ситуации с тремя первыми позициями. Если раньше гэп стоял на третей позиции первого белка, позвояя получить 2 совпадения, то теперь гэп стоит на первой позиции второго белка, уменьшая количество совпадений до 0 на этом участке, но позволяя избежать громадного штрафа. Вес выравнивания уменьшился на 1 (посмотреть файл c измененными штрафами)
       
      IHFA_ECOLI         1 MALTKAEMSEYLFDKLGLSKRDAKELVELFFEEIRRALENGEQVKLSGFG     50
                            ...|.::...:.....|:|:|:...|:..|..:...|..||:|:|.|||
      DBH_STRGN          1 -MANKQDLIAKVAAATELTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFG     49
      
      IHFA_ECOLI        51 NFDLRDKNQRPGRNPKTGEDIPITARRVVTFRPGQKLKSRVENASPKDE     99
                           ||::|::..|.||||:||::..|.|.:|..|:.|:.||..|:       
      DBH_STRGN         50 NFEVRERAARKGRNPQTGKETKIAASKVPAFKAGKALKDAVK-------     91
      
    • аналогичным образом воспользуемся программой water (файл с автонастройками)
       
      IHFA_ECOLI        18 LSKRDAKELVELFFEEIRRALENGEQVKLSGFGNFDLRDKNQRPGRNPKT     67
                           |:|:|:...|:..|..:...|..||:|:|.|||||::|::..|.||||:|
      DBH_STRGN         17 LTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFGNFEVRERAARKGRNPQT     66
      
      IHFA_ECOLI        68 GEDIPITARRVVTFRPGQKLKSRVE     92
                           |::..|.|.:|..|:.|:.||..|:
      DBH_STRGN         67 GKETKIAASKVPAFKAGKALKDAVK     91
      
      									
    • при увеличении штрафа для локального выравнивания картина не изменяется (файл с удвоением штрафов)
       
      IHFA_ECOLI        18 LSKRDAKELVELFFEEIRRALENGEQVKLSGFGNFDLRDKNQRPGRNPKT     67
                           |:|:|:...|:..|..:...|..||:|:|.|||||::|::..|.||||:|
      DBH_STRGN         17 LTKKDSAAAVDAVFAAVTEYLSKGEKVQLIGFGNFEVRERAARKGRNPQT     66
      
      IHFA_ECOLI        68 GEDIPITARRVVTFRPGQKLKSRVE     92
                           |::..|.|.:|..|:.|:.||..|:
      DBH_STRGN         67 GKETKIAASKVPAFKAGKALKDAVK     91
      									
      									
    • при уменьшении штрафа для локального выравнивания помимо по прежнему полностью совпадающего с предыдущими случами выравнивания, появляются еще 17 позиций в начале, которые не входили в прдедыдущие случаи, видимо, из-за наличия в предложенном для них оптимальном выравнивании 3х гэпов. (файл с уменьшенными штрафами)
       
      
      IHFA_ECOLI         1 MALTKAEMSEYLFDKLG----LSKRDAKELVELFFEEIRRALENGEQVKL     46
                           || .|.:    |..|:.    |:|:|:...|:..|..:...|..||:|:|
      DBH_STRGN          1 MA-NKQD----LIAKVAAATELTKKDSAAAVDAVFAAVTEYLSKGEKVQL     45
      
      IHFA_ECOLI        47 SGFGNFDLRDKNQRPGRNPKTGEDIPITARRVVTFRPGQKLKSRVE     92
                           .|||||::|::..|.||||:||::..|.|.:|..|:.|:.||..|:
      DBH_STRGN         46 IGFGNFEVRERAARKGRNPQTGKETKIAASKVPAFKAGKALKDAVK     91
      
      									
  4. Сравнение оптимального глобального и оптимального локального выравнивания 2-х последовательностей


    Для сравнения полученных выравниваний ответим на некоторые вопросы:
    • есть ли хотя бы один пример того, что одной и той же позиции первой последовательности в разных глобальных выравниваниях сопоставлены разные позиции второй последовательности? такой случай единственный. 2 позиции IHFA_ECOLI соответствует 2 позиция другого белка в выравнивании с автонастройками и 1 позиция в выравнивании с удвоенными штрафами.
    • то же при локальном выарвнивании? Отсутствует.
    • есть ли хотя бы один пример того, что в одном глобальном выравнивании какой-либо позиции первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против той же позиции оказался пропуск?Такой случай также единственный: при автонастройках первой позиции IHFA_ECOLI соответствует 1 позиция второго белка, а в измененных настройках – пропуск.
    • ТО же при локальном? Отсутствует.
    • соответствуют ли оптимальные локальные выравнивания, построенными с использованием разных параметров, одним и тем же фрагментам последовательностей? Да, определенно. учитывая полное совпадение первого и второго выраввнивания и части третьего. Однако участок с первого по 17 остаток IHFA_ECOLI и соответствующий кусок второго белка рассмотрены только в третьем выравнивании.
    • вообще глобальное и локальное выравние идентичны на участке от 18 до 92 остатка IHFA_ECOLI, а отличаются только распределением гэпов

Дополнительные задания:

Владыкина 2008