Пробные выравнивания.





  1. Определить положение фрагмента в полной последовательности
  2.   В файле fullANDpart.fasta мной сохранены в формате FASTA небольшой фрагмент, а также полная последовательность заданного мне белка RECQ_Ecoli. Затем движением фрагмента относительно полной последовательности, с использованием программы GeneDoc я добилась полного совпадения букв. Заданный фрагмент соответствует позициям 91-115 в полной последовательности белка Recq_Ecoli. Данное выравнивание сохранено в файле alignment1.msf, а картинка с данным выравниванием - aln1.gif



  3. Построить "наилучшее" выравнивание вручную
  4.   Скопировав обе короткие последовательности в файл shortseqs.fasta, я импортировала этот в файл в GeneDoc. Нужно выровнять вручную последовательности так, чтобы было сопоставлено максимальное число одинаковых букв при минимальном числе пропусков. С этой целью необходимо оценить вес выравнивания, для этого используем формулу: W = M - nG , где где M - число совпавших букв, G - штраф за пропуск, равен 2, n - общее число пропусков. Итак, число а.о. в первом фрагменте равно 25, во втором - 26; длина выравнивания - 28; вес выравнивания: W= 12 - 2*3=6; процент идентичности двух выравненных последовательностей (отношение числа колонок, в которых стоят одинаковые буквы, к общему числу колонок, включая "гэповые", умноженное на 100): (12/28)*100%=42,86%. Затем я получила картинку с этим выравниванием aln2.gif в рабочей директории).



  5. Найти первую с N-конца выравнивания "близкородственную" замену а.о
  6.   Рассмотрим, как устроена наиболее популярная матрица весов замен аминокислотных остатков BLOSUM62. Будем считать близкородственными заменами те, для которых значение элемента матрицы положительно. Позиции выравнивания в данном фрагменте, в которых я обнаружила близкородственную замену аминокислотных остатков:

    1. № первой позиции выравнивания, в которой мы наблюдаем близкородственную замену а.о:9
    2. полные названия и однобуквенные обозначения поменявшихся а.о: Threonine, Thr, T заменяется на Serine, Ser, S.
    3. вес такой замены в соответствии с использованной матрицей:1
    4. комментарий: треонин - маленькая, гидрофобная, полярная аминокислота; серин - маленькая, полярная аминокислота; обе аминокислоты маленькие, полярные, поэтому вес замены положителен.





    5. Дополнительные задания.





      1. Определить % сходства выровненных фрагментов.
      2.   Процентом сходства будем считать отношение числа колонок со сходными буквами к общему числу, умноженное на 100%. Сходными буквами будем считать такие, для которых значение элемента матрицы BLOSUM62 положительно. Итак, обратимся к полученному ранее выравниванию:



          Из 28 колонок совпало 12 пар, а среди оставшихся 16 колонок сходными являются только 3, так как их замены, согласно таблице, положительны:
        1. T --> S ( треонин заменяется на серин), из предыдущего задания мы знаем, что вес этой замены равен +1.
        2. E --> Q (глутаминовая кислота заменяется на глутамин), вес замены равен +2, что можно объяснить тем, что заменяется кислота на свой же амид.
        3. T --> S (+1)


        Так получается, что процент сходства можно вычислить по формуле: (12+3)/28*100%=53,57%.


      3. Построить иное выравнивание 2-х заданных фрагментов с весом не хуже, чем получилось в обязательном упр.2


      4. Получилось несколько иное выравнивание с таким же весом, процентом идентичности и процентом сходства. Выравнивание представлено на рисунке aln2_2.gif:



      5. Придумать, как с помощью функций Excel из матрицы BLOSUM можно получить список замен вида "W-Y вес=...".


      6. Для начала экспортируем табллицу Blosum62 в Excel. В той же книге созданим лист, на котором в 1-м и во 2-м столбцах расположим аминокислоты из всех колонок моего выравнивания, включая гэповые. Затем в 3-м столбце воспользуемся формулой (ВПР и ПОИСКПО). Таким образом, мы получили вес для каждой замены. Полученную таблицу можно просмотреть здесь: Weight.xls