Множественное выравнивание последовательностей

    1. Ознакомление с программой Muscle.

    Получу выравнивание вирусных белков, называемых "дельта-антигенами". Для этого найду последовательности этих белков в банке Swiss-Prot и сохраню их в формате fasta (delta.fasta). C помощью программы muscle, выполнив команду:

    muscle -in delta.fasta -out delta_aligned.fasta

    получу выравнивание данных последовательностей (delta_aligned.fasta). Импортирую его в GeneDoc:

    Из выравнивания видно, что последовательности почти полностью совпадают, за исключением концевого участка выравнивания. Отсюда напрашивается вывод: данные белки являются гомологами.


    2. Выравнивание набора гомологов своего белка.

    С помощью BLAST в банкеSwiss-Prot были найдены гомологи белка MOEB_ECOLI. Ограничения на выдачу следующие: таксон Bacteria, порог на E-value 0.001 (тем самым эти белки являются достоверными гомологами), выравнивания имеют процент идентичности не более 90 (то есть белки не слишком близки к MOEB_ECOLI).

    Список идентификаторов отобранных гомологов (включая MOEB_ECOLI):

    sw:moeb_ecoli
    sw:moeb_salty
    sw:moeb_haein
    sw:thif_ecoli
    sw:hesa_plebo
    sw:hesa_anasp
    sw:ygdl_ecoli
    sw:y118_haein
    sw:y40a_rhisn

    С помощь программы seqret был получен файл с последовательностями этих белков в fasta-формате (myproteins.fasta), после чего с помощью программы muscle был получен файл с их выравниванием (myproteins_aligned.fasta).

    Импортирую его в GeneDoc:

    Есть участки с повышенной долей консервативных позиций:

    36-43 по столбцам выравнивания, 36-43 а.о. белка MOEB_ECOLI,
    54-56 по столбцам выравнивания, 54-56 а.о. белка MOEB_ECOLI,
    97-99 по столбцам выравнивания, 97-99 а.о. белка MOEB_ECOLI.

    Первый а.о. каждого белка - метионин, но в YGDL_ECOLI, HESA_ANASP и THIF_ECOLI первый метионин стоит не в первой колонке с первыми метионинами остальных белков, а в других колонках, тем самым увеличивая вес выравнивания (т.к. в перечисленных трех белках имеем гэпы в начале выравнивания, то есть штраф за них получился меньше, чем если бы они стояли после первого метионина). Поэтому участок 1-16 выравнивания (1-16 в MOEB_ECOLI) скорее всего не имеет биологического смысла.

    Есть повод считать, что участок 258-289 выравнивания скорее всего также не имеет биологического смысла, так как консервативных (и даже сходных) одновременно для всех белков колонок на данном участке нет.

©2008 Михальченко Алексей