Матрицы весов аминокислотных замен

Второй семестр

Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку CYOB_ECOLI

 

Веса аминокислотных замен

Вычисление весов аминокислотных замен на основе множественного выравнивания блока PR01165A из базы данных BLOCKS

Пара аминокислот nαβ Pαβ qα qβ sαβ
Glu-Glu 0 0 2,75*10-3 2,75*10-3 -∞
Glu-Gln 20 9,97*10-5 2,75*10-3 2,8*10-3 5,389326
Glu-Leu 33 1.65*10-4 2,75*10-3 0,10548 -3,62787


Условные обозначения:
N — общее число пар;
nαβ — общее количество пар в выравнивании;
pαβ — частота пары;
qα — частота аминокислоты α в паре;
qβ — частота аминокислоты β в паре;
sαβ — вес аминокислотной замены.

Формулы для вычисления весов замен:
N = 200512;
pαβ = nαβ/N;
qα = pαα + Σ(pαβ/2) — сумма берётся по остальным 19 остаткам;
sαα = 2*log2(pαα/qα2);
sαβ = 2*log2(pαβ/2*qα*qβ).

Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS

Пара аминокислот nαβ Pαβ qα qβ sαβ
Glu-Glu 3394413 1,48*10-2 5,67*10-2 5,67*10-2 4,405512
Glu-Gln 1729724 7,55*10-3 5,67*10-2 4,23*10-2 1,308797
Glu-Leu 1337169 5,83*10-3 5,67*10-2 8,15*10-2 -1,32945

  • N=229168446.

     

    Сравнение весов аминокислотных замен

    Пара аминокислот Блок PR01165A 200 блоков BLOSUM62
    Glu-Glu -∞ 4,405512 5
    Glu-Gln 5,389326 1,308797 2
    Glu-Leu -3,62787 -1,32945 -3

  • Как видно из приведенных таблиц некоторые результаты являются сходящимися, но некоторые довольно значительно различаются. При этом стоит отметить, что веса аминокислотных замен при использовании 200 блоков более близки к таковым в BLOSUM62. Данную закономерность можно объяснить просто, если учесть, что общее число пар составляет астрономическое число. Очень странным кажется полное отсутствие пар Glu-Glu в блоке PR01165A, хотя можно показать, что Glu довольно редкая аминокислота, но тем и ценнее вес замены Glu-Glu, равный 5. Вес замены пары Glu-Gln в блоке PR01165A превысил аналогичные замены в BLOSUM62 более, чем два раза, а среди 200 блоков так и во все 4. Это можно объяснить как раз предыдущим пунктом. Возможно в PR01165A произошла мутация, в результате которой некоторые глутаминовые кислоты были заменины близким глутамином. Что касается пары Glu-Leu, то здесь итак всё ясно, если сравнить структурные формулы этих аминокислот. Об этом свидетельствуют и полученные отрицательные значения весов замен в паре Glu-Leu, причем, что интересно, в блоке PR01165A оно оказалось даже ближе к данным BLOSUM62.

    Второй семестр


    ©Снегирёв Александр, 2005