Программы выравнивания последовательностей пакета EMBOSS.

 

  • Построить и сравнить оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей
    1. Построить полное (глобальное) оптимальное выравнивание с помощью программы needle пакета EMBOSS
    2. Даны два белка: изучаемый MOEB_ECOLI и родственный ему MOCS3_HUMAN.

      С помощью программы needle пакета EMBOSS построил глобальное выравнивание последовательностей этих двух белков:

      Глобальное выравнивание со стандартными штрафами за гэпы (10 - открытие, 0,5 - продолжение) (.needle), (.msf)
      Глобальное выравнивание со штрафами за гэпы, увеличенными в два раза (20 - 1) (.needle), (.msf)

    3. Построить локальное (частичное) оптимальное выравнивание тех же последовательностей с помощью программы water пакета EMBOSS
    4. Даны два белка: изучаемый MOEB_ECOLI и родственный ему MOCS3_HUMAN.

      С помощью программы water пакета EMBOSS построил локальное выравнивание последовательностей этих двух белков:

      Локальное выравнивание со стандартными штрафами за гэпы (10 - открытие, 0,5 - продолжение) (.water), (.msf)
      Локальное выравнивание со штрафами за гэпы, увеличенными в два раза (20 - 1)(.water), (.msf)
      Локальное выравнивание со штрафами за гэпы, уменьшенными в два раза (5 - 0,25)(.water), (.msf)

    5. Сравнить полученные выравнивания
    6. Глобальное выравнивание со стандартными штрафами за гэпы:

      MOEB_ECOLI         0 --------------------------------------------------      0
                       
      MOCS3_HUMAN        1 MASREEVLALQAEVAQREEELNSLKQKLASALLAEQEPQPERLVPVSPLP     50
      
                    
      MOEB_ECOLI         1 -MAELSDQEMLRYNRQIILRGFDFDGQEALKDSRVLIVGLGGLGCAASQY     49
                            .|.||..|:|||:||::|......||..|..:.|||||.|||||..:||
      MOCS3_HUMAN       51 PKAALSRDEILRYSRQLVLPELGVHGQLRLGTACVLIVGCGGLGCPLAQY    100
      
                    
      MOEB_ECOLI        50 LASAGVGNLTLLDFDTVSLSNLQRQTLHSDATVGQPKVESARDALTRINP     99
                           ||:||||.|.|:|:|.|.:|||.||.||.:|..||.|..||..:|.|:|.
      MOCS3_HUMAN      101 LAAAGVGRLGLVDYDVVEMSNLARQVLHGEALAGQAKAFSAAASLRRLNS    150
      
                    
      MOEB_ECOLI       100 HIAITPVNALLDDAELAALIAEHDLVLDCTDNVAVRNQLNAGCFAAKVPL    149
                           .:...|....|..|....|:..:|:|.||:|||..|..:|..|..|..||
      MOCS3_HUMAN      151 AVECVPYTQALTPATALDLVRRYDVVADCSDNVPTRYLVNDACVLAGRPL    200
      
                    
      MOEB_ECOLI       150 VSGAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVEAGVMA    194
                           ||.:|:|.||||||:.| ||.|||||   :|     .|....|.:.||:.
      MOCS3_HUMAN      201 VSASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCADGGVLG    246
      
                    
      MOEB_ECOLI       195 PLIGVIGSLQAMEAIKMLAGYGKPASGKIVMYDAMTCQFREMKL-MRNPG    243
                           .:.||:|.|||:|.:|:.||.|...||.::::||:...||.::| .|...
      MOCS3_HUMAN      247 VVTGVLGCLQALEVLKIAAGLGPSYSGSLLLFDALRGHFRSIRLRSRRLD    296
      
                    
      MOEB_ECOLI       244 CEVCGQ--------------------------------------------    249
                           |..||: 
      MOCS3_HUMAN      297 CAACGERPTVTDLLDYEAFCGSSATDKCRSLQLLSPEERVSVTDYKRLLD    346
      
                    
      MOEB_ECOLI       249 --------------------------------------------------    249
                         
      MOCS3_HUMAN      347 SGAFHLLLDVRPQVEVDICRLPHALHIPLKHLERRDAESLKLLKEAIWEE    396
      
                    
      MOEB_ECOLI       249 --------------------------------------------------    249
                         
      MOCS3_HUMAN      397 KQGTQEGAAVPIYVICKLGNDSQKAVKILQSLSAAQELDPLTVRDVVGGL    446
      
                    
      MOEB_ECOLI       249 --------------    249
                         
      MOCS3_HUMAN      447 MAWAAKIDGTFPQY    460

       

      Глобальное выравнивание с в два раза большими штрафами за гэпы:

      MOEB_ECOLI         0 --------------------------------------------------      0
                       
      MOCS3_HUMAN        1 MASREEVLALQAEVAQREEELNSLKQKLASALLAEQEPQPERLVPVSPLP     50
      
                    
      MOEB_ECOLI         1 -MAELSDQEMLRYNRQIILRGFDFDGQEALKDSRVLIVGLGGLGCAASQY     49
                            .|.||..|:|||:||::|......||..|..:.|||||.|||||..:||
      MOCS3_HUMAN       51 PKAALSRDEILRYSRQLVLPELGVHGQLRLGTACVLIVGCGGLGCPLAQY    100
      
                    
      MOEB_ECOLI        50 LASAGVGNLTLLDFDTVSLSNLQRQTLHSDATVGQPKVESARDALTRINP     99
                           ||:||||.|.|:|:|.|.:|||.||.||.:|..||.|..||..:|.|:|.
      MOCS3_HUMAN      101 LAAAGVGRLGLVDYDVVEMSNLARQVLHGEALAGQAKAFSAAASLRRLNS    150
      
                    
      MOEB_ECOLI       100 HIAITPVNALLDDAELAALIAEHDLVLDCTDNVAVRNQLNAGCFAAKVPL    149
                           .:...|....|..|....|:..:|:|.||:|||..|..:|..|..|..||
      MOCS3_HUMAN      151 AVECVPYTQALTPATALDLVRRYDVVADCSDNVPTRYLVNDACVLAGRPL    200
      
                    
      MOEB_ECOLI       150 VSGAAIRMEGQITVFTYQDGEPCYRCL--SRLFGENALTCVEAGVMAPLI    197
                           ||.:|:|.||||||:.| ||.|||||:  .....|....|.:.||:..:.
      MOCS3_HUMAN      201 VSASALRFEGQITVYHY-DGGPCYRCIFPQPPPAETVTNCADGGVLGVVT    249
      
                    
      MOEB_ECOLI       198 GVIGSLQAMEAIKMLAGYGKPASGKIVMYDAMTCQFREMKL-MRNPGCEV    246
                           ||:|.|||:|.:|:.||.|...||.::::||:...||.::| .|...|..
      MOCS3_HUMAN      250 GVLGCLQALEVLKIAAGLGPSYSGSLLLFDALRGHFRSIRLRSRRLDCAA    299
      
                    
      MOEB_ECOLI       247 CGQ-----------------------------------------------    249
                           ||: 
      MOCS3_HUMAN      300 CGERPTVTDLLDYEAFCGSSATDKCRSLQLLSPEERVSVTDYKRLLDSGA    349
      
                    
      MOEB_ECOLI       249 --------------------------------------------------    249
                         
      MOCS3_HUMAN      350 FHLLLDVRPQVEVDICRLPHALHIPLKHLERRDAESLKLLKEAIWEEKQG    399
      
                    
      MOEB_ECOLI       249 --------------------------------------------------    249
                         
      MOCS3_HUMAN      400 TQEGAAVPIYVICKLGNDSQKAVKILQSLSAAQELDPLTVRDVVGGLMAW    449
      
                    
      MOEB_ECOLI       249 -----------    249
                         
      MOCS3_HUMAN      450 AAKIDGTFPQY    460

       

      Локальное выравнивание со стандартными штрафами за гэпы:

      MOEB_ECOLI         2 AELSDQEMLRYNRQIILRGFDFDGQEALKDSRVLIVGLGGLGCAASQYLA     51
                           |.||..|:|||:||::|......||..|..:.|||||.|||||..:||||
      MOCS3_HUMAN       53 AALSRDEILRYSRQLVLPELGVHGQLRLGTACVLIVGCGGLGCPLAQYLA    102
      
                    
      MOEB_ECOLI        52 SAGVGNLTLLDFDTVSLSNLQRQTLHSDATVGQPKVESARDALTRINPHI    101
                           :||||.|.|:|:|.|.:|||.||.||.:|..||.|..||..:|.|:|..:
      MOCS3_HUMAN      103 AAGVGRLGLVDYDVVEMSNLARQVLHGEALAGQAKAFSAAASLRRLNSAV    152
      
                    
      MOEB_ECOLI       102 AITPVNALLDDAELAALIAEHDLVLDCTDNVAVRNQLNAGCFAAKVPLVS    151
                           ...|....|..|....|:..:|:|.||:|||..|..:|..|..|..||||
      MOCS3_HUMAN      153 ECVPYTQALTPATALDLVRRYDVVADCSDNVPTRYLVNDACVLAGRPLVS    202
      
                    
      MOEB_ECOLI       152 GAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVEAGVMAPL    196
                           .:|:|.||||||:.| ||.|||||   :|     .|....|.:.||:..:
      MOCS3_HUMAN      203 ASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCADGGVLGVV    248
      
                    
      MOEB_ECOLI       197 IGVIGSLQAMEAIKMLAGYGKPASGKIVMYDAMTCQFREMKL-MRNPGCE    245
                           .||:|.|||:|.:|:.||.|...||.::::||:...||.::| .|...|.
      MOCS3_HUMAN      249 TGVLGCLQALEVLKIAAGLGPSYSGSLLLFDALRGHFRSIRLRSRRLDCA    298
      
                    
      MOEB_ECOLI       246 VCGQ    249
                           .||:
      MOCS3_HUMAN      299 ACGE    302

       

      Локальное выравнивание с в два раза большими штрафами за гэпы:

      MOEB_ECOLI         2 AELSDQEMLRYNRQIILRGFDFDGQEALKDSRVLIVGLGGLGCAASQYLA     51
                           |.||..|:|||:||::|......||..|..:.|||||.|||||..:||||
      MOCS3_HUMAN       53 AALSRDEILRYSRQLVLPELGVHGQLRLGTACVLIVGCGGLGCPLAQYLA    102
      
                    
      MOEB_ECOLI        52 SAGVGNLTLLDFDTVSLSNLQRQTLHSDATVGQPKVESARDALTRINPHI    101
                           :||||.|.|:|:|.|.:|||.||.||.:|..||.|..||..:|.|:|..:
      MOCS3_HUMAN      103 AAGVGRLGLVDYDVVEMSNLARQVLHGEALAGQAKAFSAAASLRRLNSAV    152
      
                    
      MOEB_ECOLI       102 AITPVNALLDDAELAALIAEHDLVLDCTDNVAVRNQLNAGCFAAKVPLVS    151
                           ...|....|..|....|:..:|:|.||:|||..|..:|..|..|..||||
      MOCS3_HUMAN      153 ECVPYTQALTPATALDLVRRYDVVADCSDNVPTRYLVNDACVLAGRPLVS    202
      
                    
      MOEB_ECOLI       152 GAAIRMEGQITVFTYQDGEPCYRCL--SRLFGENALTCVEAGVMAPLIGV    199
                           .:|:|.||||||:.| ||.|||||:  .....|....|.:.||:..:.||
      MOCS3_HUMAN      203 ASALRFEGQITVYHY-DGGPCYRCIFPQPPPAETVTNCADGGVLGVVTGV    251
      
                    
      MOEB_ECOLI       200 IGSLQAMEAIKMLAGYGKPASGKIVMYDAMTCQFREMKL-MRNPGCEVCG    248
                           :|.|||:|.:|:.||.|...||.::::||:...||.::| .|...|..||
      MOCS3_HUMAN      252 LGCLQALEVLKIAAGLGPSYSGSLLLFDALRGHFRSIRLRSRRLDCAACG    301
      
                    
      MOEB_ECOLI       249 Q    249
                           :
      MOCS3_HUMAN      302 E    302

       

      Локальное выравнивание с в два раза меньшими штрафами за гэпы:

      MOEB_ECOLI         2 AELSDQEMLRYNRQIILRGFDFDGQEALKDSRVLIVGLGGLGCAASQYLA     51
                           |.||..|:|||:||::|......||..|..:.|||||.|||||..:||||
      MOCS3_HUMAN       53 AALSRDEILRYSRQLVLPELGVHGQLRLGTACVLIVGCGGLGCPLAQYLA    102
      
                    
      MOEB_ECOLI        52 SAGVGNLTLLDFDTVSLSNLQRQTLHSDATVGQPKVESARDALTRIN---     98
                           :||||.|.|:|:|.|.:|||.||.||.:|..||.|..||..:|.|:| 
      MOCS3_HUMAN      103 AAGVGRLGLVDYDVVEMSNLARQVLHGEALAGQAKAFSAAASLRRLNSAV    152
      
                    
      MOEB_ECOLI        99 ---PHI-AITPVNALLDDAELAALIAEHDLVLDCTDNVAVRNQLNAGCFA    144
                              |:. |:||..||  |     |:..:|:|.||:|||..|..:|..|..
      MOCS3_HUMAN      153 ECVPYTQALTPATAL--D-----LVRRYDVVADCSDNVPTRYLVNDACVL    195
      
                    
      MOEB_ECOLI       145 AKVPLVSGAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVE    189
                           |..||||.:|:|.||||||:.| ||.|||||   :|     .|....|.:
      MOCS3_HUMAN      196 AGRPLVSASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCAD    241
      
                    
      MOEB_ECOLI       190 AGVMAPLIGVIGSLQAMEAIKMLAGYGKPA-SGKIVMYDAMTCQFREMKL    238
                           .||:..:.||:|.|||:|.:|:.||.| |: ||.::::||:...||.::|
      MOCS3_HUMAN      242 GGVLGVVTGVLGCLQALEVLKIAAGLG-PSYSGSLLLFDALRGHFRSIRL    290
      
                    
      MOEB_ECOLI       239 -MRNPGCEVCGQ    249
                            .|...|..||:
      MOCS3_HUMAN      291 RSRRLDCAACGE    302

      • есть ли хотя бы один пример того, что одной и той же позиции первой последовательности в разных глобальных выравниваниях сопоставлены разные позиции второй последовательности?

      Такие примеры есть. Например, в выравнивании со стандартными штрафами за гэпы 180-й позиции в последовательности MOEB_ECOLI соответствует 227 позиция в последовательности MOCS3_HUMAN (F-F), а в выравнивании с удвоенными штрафами за гэпы той же 180-й позиции в MOEB_ECOLI соответствует 232 позиция в MOCS3_HUMAN (F-P). Это обусловлено тем, что во втором выравнивании штафы за гэпы удвоены, поэтому для достижения большего веса количество гэпов пришлось уменьшить, и напротив 180-го а.о. в MOEB_ECOLI вместо 227-го а.о. в MOCS3_HUMAN оказался уже 232-й.

      Со стандартными штрафами за гэпы:

      MOEB_ECOLI       150 VSGAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVEAGVMA    194
                           ||.:|:|.||||||:.| ||.|||||   :|     .|....|.:.||:.
      MOCS3_HUMAN      201 VSASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCADGGVLG    246

      С в два раза большими штрафами за гэпы:

      MOEB_ECOLI       150 VSGAAIRMEGQITVFTYQDGEPCYRCL--SRLFGENALTCVEAGVMAPLI    197
                           ||.:|:|.||||||:.| ||.|||||:  .....|....|.:.||:..:.
      MOCS3_HUMAN      201 VSASALRFEGQITVYHY-DGGPCYRCIFPQPPPAETVTNCADGGVLGVVT    249
      • есть ли хотя бы один пример того, что одной и той же позиции первой последовательности в разных локальных выравниваниях сопоставлены разные позиции второй последовательности?

      Есть. В локальном выравнивании со стандартными штрафами за гэпы 180-й позиции в MOEB_ECOLI соответствует 227-я позиция в MOCS3_HUMAN. В локальном выравнивании с в два раза большими штрафами за гэпы для получения большего веса количество гэпов пришлось ученьшить, и напротив 180-го а.о. в MOEB_ECOLI оказался 232-й а.о. в MOCS3_HUMAN. В локальном выравнивании с в два раза меньшими штрафами за гэпы длина выравнивания, конечно же, увеличилась, так как увеличилось и количество гэпов, но это не помешало 227-му а.о. в MOCS3_HUMAN оказаться напротив 180-го а.о. в MOEB_ECOLI, как и в выравнивании со стандартными штрафами за гэпы.

      Со стандартными штрафами за гэпы:

      MOEB_ECOLI       152 GAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVEAGVMAPL    196
                           .:|:|.||||||:.| ||.|||||   :|     .|....|.:.||:..:
      MOCS3_HUMAN      203 ASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCADGGVLGVV    248

      С в два раза большими штрафами за гэпы:

      MOEB_ECOLI       152 GAAIRMEGQITVFTYQDGEPCYRCL--SRLFGENALTCVEAGVMAPLIGV    199
                           .:|:|.||||||:.| ||.|||||:  .....|....|.:.||:..:.||
      MOCS3_HUMAN      203 ASALRFEGQITVYHY-DGGPCYRCIFPQPPPAETVTNCADGGVLGVVTGV    251

      С в два раза меньшими штрафами за гэпы:

      MOEB_ECOLI       145 AKVPLVSGAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVE    189
                           |..||||.:|:|.||||||:.| ||.|||||   :|     .|....|.:
      MOCS3_HUMAN      196 AGRPLVSASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCAD    241
      • есть ли хотя бы один пример того, что в одном глобальном выравнивании какой-либо позиции первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против той же позиции оказался пропуск?

      Есть. В глобальном выравнивании со стандартными штрафами за гэпы напротив 176-го а.о. в MOEB_ECOLI стоит гэп, а в глобальном выравнивании с удвоенными штрафами за гэпы из-за того, что число гэпов пришлось уменьшить для достижения большего веса, 176-й позиции в MOEB_ECOLI сопоставлена 226-я позиция в MOCS3_HUMAN.

      Со стандартными штрафами за гэпы:

      MOEB_ECOLI       150 VSGAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVEAGVMA    194
                           ||.:|:|.||||||:.| ||.|||||   :|     .|....|.:.||:.
      MOCS3_HUMAN      201 VSASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCADGGVLG    246

      С в два раза большими штрафами за гэпы:

      MOEB_ECOLI       150 VSGAAIRMEGQITVFTYQDGEPCYRCL--SRLFGENALTCVEAGVMAPLI    197
                           ||.:|:|.||||||:.| ||.|||||:  .....|....|.:.||:..:.
      MOCS3_HUMAN      201 VSASALRFEGQITVYHY-DGGPCYRCIFPQPPPAETVTNCADGGVLGVVT    249
      • есть ли хотя бы один пример того, что в одном локальном выравнивании какой-либо позиции первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против той же позиции оказался пропуск?

      Есть. В локальном выравнивании со стандартными штрафами штрафами за гэпы напротив 176-го а.о. в MOEB_ECOLI стоит гэп. В локальном выравнивании с в два раза большими штрафами за гэпы для достижения большего веса количество гэпов стало меньше, и напротив 176-й позиции в MOEB_ECOLI оказалась 226 позиция в MOCS3_HUMAN. В локальном выравнивании с в два раза меньшими штрафами за гэпы число гэпов увеличилось, и напротив 176-го а.о. в MOEB_ECOLI оказалася гэп, как и в выравнивании сос стандартными штрафами.

      Со стандартными штрафами за гэпы:
      MOEB_ECOLI       152 GAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVEAGVMAPL    196
      .:|:|.||||||:.| ||.||||| :| .|....|.:.||:..:
      MOCS3_HUMAN 203 ASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCADGGVLGVV 248


      С в два раза большими штрафами за гэпы:

      MOEB_ECOLI       152 GAAIRMEGQITVFTYQDGEPCYRCL--SRLFGENALTCVEAGVMAPLIGV    199
      .:|:|.||||||:.| ||.|||||: .....|....|.:.||:..:.||
      MOCS3_HUMAN 203 ASALRFEGQITVYHY-DGGPCYRCIFPQPPPAETVTNCADGGVLGVVTGV 251

      С в два раза меньшими штрафами за гэпы:

      MOEB_ECOLI       145 AKVPLVSGAAIRMEGQITVFTYQDGEPCYRCLSRLF-----GENALTCVE    189
                           |..||||.:|:|.||||||:.| ||.|||||   :|     .|....|.:
      MOCS3_HUMAN      196 AGRPLVSASALRFEGQITVYHY-DGGPCYRC---IFPQPPPAETVTNCAD    241
      • соответствуют ли оптимальные локальные выравнивания, построенными с использованием разных параметров, одним и тем же фрагментам последовательностей?

      Как видно из локальных выравниваний, построенных с использованием разных параметров (смотреть выше), все они соответствуют одним и тем же фрагментам последовательностей: 2-240 в MOEB_ECOLI и 53-302 в MOCS3_HUMAN.

      • совпадают ли локальные выравнивания с соответствующими частями глобальных выравниваний?

      Локальное выравнивание со стандартными штрафами за гэпы совпадает с соответствующей частью глобального выравнивания со стандартными штрафами за гэпы. Локальное выравнивание с в два раза большими штрафами за гэпы тоже совпадает с соответствующей частью глобального выравнивания с в два раза большими штрафами за гэпы.

     

    Дополнительные задания

    1. Построить карту локального сходства заданных последовательностей с помощью программы dotmatcher пакета EMBOSS

    С помощью программы dotmatcher построил карту локального сходства последовательностей MOEB_ECOLI и MOCS3_HUMAN. Линия показывает нам сходные фрагменты двух последовательностей. Видно, что длина последовательности MOCS3_HUMAN больше длины последовательности MOEB_ECOLI.

     

     

    ©2008 Михальченко Алексей