Глобальное и локальное выравнивание аминокислотных последовательностей


Работа с прoграммами:

  1. FAR manager
  2. Microsoft Excel
  3. GeneDoc
  4. Пакет программ EMBOSS:
    • needle - программа глобального выравнивания
    • water - программа локального выравнивания
    • matcher - программа локального выравнивания




Матрицы переходов

Матрица переходов для глобального выравнивания

Последовательности, для которых строилась матрица переходов: EQGKG и QGK.


Параметры, использовавшиеся при построении матрицы:

вес совпадения = 2
вес замены = -1
штраф за делецию = -2

Матрица переходов

Выравнивание, соответсвующее оптимальному пути:

seq1: EQGKG			  
       |||
seq2: -QGK-
       QGK 

Вес оптимального пути:    2




Матрица переходов для локального выравнивания

Последовательности, для которых строилась матрица переходов: FTINAEVRK и TIVRK.


Параметры, использовавшиеся при построении матрицы:

вес совпадения = 2
вес замены = -1
штраф за делецию = -2

Матрица переходов

Выравнивания, соответсвующие оптимальному и субоптимальному пути:

seq1: TI
      ||
seq2: TI
      TI

и

seq1: VRK
      |||
seq2: VRK
      VRK

Вес оптимального пути:    6

Вес субоптимального пути:    4




Поиск участков локальной гомологии

Матрица переходов для глобального выравнивания

Последовательности, для которых строились локальные выравнивания:

MFTINAEVRKEQGKGASRRLRAANKFPAIIYGGKEAPLAIELDHDKVMNM
QAKAEFYSEVLTIVVDGKEIKVKAQDVQRHPYKPKLQHIDFVRA

и

AEVRKEQGKGVQRHPYKPKL


Вторая последовательность построена из двух участков первой.
Первый участок: остатки 6 - 15.
Второй участок: остатки 77 - 86.


Выравнивания matcher, подтверждающие это предположение.

Первый участок

					       6       15   
					  seq1 AEVRKEQGKGASR
					       ::::::::::..:
					  seq3 AEVRKEQGKGVQR
					       1       10   
			

Второй участок

					             77      86  
					  seq1 KVKAQDVQRHPYKPKL
					       : ... ::::::::::
					  seq3 KEQGKGVQRHPYKPKL
			        		    11       20
			


Влияние параметров на глобальное выравнивание


Параметры двух выравниваний одних и тех же последовательностей

Номер выравнивания

Название матрицы замен

Штраф за открытие делеции

Штраф за продолжение делеции

1

EBLOSUM62

10

1

2

EBLOSUM80

1

1



Сами выравнивания

Первое выравнивание
(Score: 58.0; Similarity: 15.8%)


seq1               1 MFTINAEVRKEQGKGASRRLRAANKFPAIIYGGKEAPLAIELDHDKVMNM     50
                                                                       
seq3               1                                                         0

seq1              51 QAKAEFYSEVLTIVVDGKEI-KVKAQDVQRHPYKPKLQHIDFVRA     94     
		          .|: |.:.:.||||||||||        
seq3               1                  AEVRKEQGKGVQRHPYKPKL             20     

			

Второе выравнивание
(Score: 126.0; Similarity: 18.9%)


	   seq1               1 MFTINAEVRKEQGKGASRRLRAANKFPAIIYGGKEAP-LAIELDHDKVMN     49
	                             ||||||||||.  : |  :  |   |  |  | |           
	   seq3               1      AEVRKEQGKGV--Q-R--H--P---Y--K--PKL                20
	
	   seq1              50 MQAKAEFYSEVLTIVVDGKEIKVKAQDVQRHPYKPKLQHIDFVRA     94
	                                                                  
	   seq3              20                                                   20
			






Различия между выравниваниями и их причины

Изменение параметра штрафа за первый пропуск напрямую влияет на общий
вид выравнивания, а именно на установление взаимного соответствия
между аминокислотами двух последовательностей:

- первое выравнивание сделано таким образом, что число гэпов минимально,
пусть даже в ущерб числу совпадений аминокислот

- второе выравнивание включает в себя большее число гэпов, причем сильно рассредоточенных
по длине последовательностей, за счет чего достигается более высокое число совпадений.


Изменение матрицы замен ведет к сохранению общего вида выравнивания, но к изменению оценки
программой качества выравнивания (в баллах) и близости сравниваемых последовательностей (в процентах):

- при использовании матриц, построенных на выравниваниях последовательностей разной
степени сходства, каждому из пар совпадений (или сходств) в оцениваемом
выравнивании придается различный вес.

Главная страница