Глобальное и локальное выравнивание аминокислотных последовательностей


Работа с прoграммами:

  1. FAR manager
  2. Microsoft Excel
  3. GeneDoc
  4. Пакет программ EMBOSS:
    • needle - программа глобального выравнивания
    • water - программа локального выравнивания
    • matcher - программа локального выравнивания




Матрицы переходов

Матрица переходов для глобального выравнивания

Последовательности, для которых строилась матрица переходов: FLILW и LIL.


Параметры, использовавшиеся при построении матрицы:

вес совпадения = 2
вес замены = -1
штраф за делецию = -2

Матрица переходов

Выравнивание, соответсвующее оптимальному пути:

seq1: FLILW			  
       |||
seq2: -LIL-
       LIL 

Вес оптимального пути:    2




Матрица переходов для локального выравнивания

Последовательности, для которых строилась матрица переходов: KQALRVAFG и QAAFG.


Параметры, использовавшиеся при построении матрицы:

вес совпадения = 2
вес замены = -1
штраф за делецию = -2

Матрица переходов

Выравнивания, соответсвующие оптимальному и субоптимальному пути:

seq1: QA
      ||
seq2: QA
      TI

и

seq1: AFG
      |||
seq2: AFG
      AFG

Вес оптимального пути:    6

Вес субоптимального пути:    4




Поиск участков локальной гомологии

Матрица переходов для глобального выравнивания

Последовательности, для которых строились локальные выравнивания:

MKQALRVAFGFLILWASVLHAEVRIVIDSGVDSGRPIGVVPFQWAGPGAAPEDIGGIVAA DLRNSGKFNPLDRARLPQQPGSAQEVQPAAWSALGIDAVVVGQVTPNPDGSYNVAYQLVD
TGGAPGTVLAQNSYKVNKQWLRYAGHTASDEVFEKLTGIKGAFRTRIAYVVQTNGGQFPY
ELRVSDYDGYNQFVVHRSPQPLMSPAWSPDGSKLAYVTFESGRSALVIQTLANGAVRQVA
SFPRHNGAPAFSPDGSKLAFALSKTGSLNLYVMDLASGQIRQVTDGRSNNTEPTWFPDSQ
NLAFTSDQAGRPQVYKVNINGGAPQRITWEGSQNQDADVSSDGKFMVMVSSNGGQQHIAK
QDLATGGVQVLSSTFLDETPSLAPNGTMVIYSSSQGMGSVLNLVSTDGRFKARLPATDGQ
VKFPAWSPYL

и

RVAFGFLILWRLPATDGQVK


Выравнивания matcher, показывают, что третья последовательность состоит из двух участков первой.

Первый участок

					
        10     
TolB RVAFGFLILW
     ::::::::::
seq3 RVAFGFLILW
	     10
	      



			

Второй участок


					            420  
					  TolB RLPATDGQVK
					       ::::::::::
					  seq3 RLPATDGQVK
			               	       20




			

Третий участок

					                 410 
					       TolB LVSTDGRFK
					            : .:::. :
					       seq3 LPATDGQVK
					              20

			


Влияние параметров на глобальное выравнивание


Параметры двух выравниваний одних и тех же последовательностей

Номер выравнивания

Название матрицы замен

Штраф за открытие делеции

Штраф за продолжение делеции

1

EBLOSUM62

10

1

2

EBLOSUM40

1

1



Сами выравнивания

Первое выравнивание
(Score: 48.0; Similarity: 3.0%)


TolB               1 MKQALRVAFGFLILW-ASVLHAEVRIVIDSGVDSGRPIGVVPFQWAGPGA     49
                   |||||||||| ......:|:                         
seq3               1      RVAFGFLILWRLPATDGQVK                              20

TolB              50 APEDIGGIVAADLRNSGKFNPLDRARLPQQPGSAQEVQPAAWSALGIDAV     99
                                                                       
seq3              21                                                        20

TolB             100 VVGQVTPNPDGSYNVAYQLVDTGGAPGTVLAQNSYKVNKQWLRYAGHTAS    149
                                                                       
seq3              21                                                        20

TolB             150 DEVFEKLTGIKGAFRTRIAYVVQTNGGQFPYELRVSDYDGYNQFVVHRSP    199
                                                                       
seq3              21                                                        20

TolB             200 QPLMSPAWSPDGSKLAYVTFESGRSALVIQTLANGAVRQVASFPRHNGAP    249
                                                                       
seq3              21                                                        20

TolB             250 AFSPDGSKLAFALSKTGSLNLYVMDLASGQIRQVTDGRSNNTEPTWFPDS    299
                                                                       
seq3              21                                                        20

TolB             300 QNLAFTSDQAGRPQVYKVNINGGAPQRITWEGSQNQDADVSSDGKFMVMV    349
                                                                       
seq3              21                                                        20

TolB             350 SSNGGQQHIAKQDLATGGVQVLSSTFLDETPSLAPNGTMVIYSSSQGMGS    399
                                                                       
seq3              21                                                        20
TolB             400 VLNLVSTDGRFKARLPATDGQVKFPAWSPYL    430
                                                    
seq3              21                                     20


			

Второе выравнивание
(Score: 111.0; Similarity: 3.7%)


	TolB               1 MKQALRVAFGFLILWASVLHAEVRI--VIDSG-VDSGRPIGVVPFQWAGP     47
	                          ||||||||||        |:  . | | |   :            
	seq3               1      RVAFGFLILW--------RLPAT-D-GQV---K                 20

	TolB              48 GAAPEDIGGIVAADLRNSGKFNPLDRARLPQQPGSAQEVQPAAWSALGID     97
                                                                       
	seq3              21                                                        20

	TolB              98 AVVVGQVTPNPDGSYNVAYQLVDTGGAPGTVLAQNSYKVNKQWLRYAGHT    147
                                                                       
	seq3              21                                                        20

	TolB             148 ASDEVFEKLTGIKGAFRTRIAYVVQTNGGQFPYELRVSDYDGYNQFVVHR    197
                                                                       
	seq3              21                                                        20

	TolB             198 SPQPLMSPAWSPDGSKLAYVTFESGRSALVIQTLANGAVRQVASFPRHNG    247
                                                                       
	seq3              21                                                        20

	TolB             248 APAFSPDGSKLAFALSKTGSLNLYVMDLASGQIRQVTDGRSNNTEPTWFP    297
                                                                       
	seq3              21                                                        20

	TolB             298 DSQNLAFTSDQAGRPQVYKVNINGGAPQRITWEGSQNQDADVSSDGKFMV    347
                                                                       
	seq3              21                                                        20

	TolB             348 MVSSNGGQQHIAKQDLATGGVQVLSSTFLDETPSLAPNGTMVIYSSSQGM    397
                                                                       
	seq3              21                                                        20

	TolB             398 GSVLNLVSTDGRFKARLPATDGQVKFPAWSPYL    430
                                                      
	seq3              21                                       20

			




Различия между выравниваниями и их причины

Изменение штрафа за гэп оказывает сильное влияние на соответствие остатков в выравнивании.
вид выравнивания, а именно на установление взаимного соответствия
между остатками двух последовательностей:

- в первом выравнивании число гэпов минимально,
однако число совпадений мало

- второе же выравнивание включает в себя большее число рассредоточенных гэпов,
но достигается более высокое число совпадений.






Переход на главную страничку здесь.