Матрицы весов аминокислотных замен
Второй семестр
Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку CYOB_ECOLI
- Идентификатор блока PR01165A
- Cytochrome c oxidase subunit I signature
- Ширина блока 26
- Количество последовательностей 179
- Веб-страница блока
- Выравнивание блока выполнено с помощью программы GeneDoc. Цветом отображена степень консервативности колонок в соответствии с 4 уровнями консервативности: более 80% идентичности красным, более 60% идентичности синим, более 40% идентичности зелёным, ниже 40% идентичности жёлтым.
Веса аминокислотных замен
Вычисление весов аминокислотных замен на основе множественного выравнивания блока PR01165A из базы данных BLOCKS
Пара аминокислот |
nαβ |
Pαβ |
qα |
qβ |
sαβ |
Glu-Glu |
0 |
0 |
2,75*10-3 |
2,75*10-3 |
-∞ |
Glu-Gln |
20 |
9,97*10-5 |
2,75*10-3 |
2,8*10-3 |
5,389326 |
Glu-Leu |
33 |
1.65*10-4 |
2,75*10-3 |
0,10548 |
-3,62787 |
|
Условные обозначения:
N общее число пар;
nαβ общее количество пар в выравнивании;
pαβ частота пары;
qα частота аминокислоты α в паре;
qβ частота аминокислоты β в паре;
sαβ вес аминокислотной замены.
Формулы для вычисления весов замен:
N = 200512;
pαβ = nαβ/N;
qα = pαα + Σ(pαβ/2) сумма берётся по остальным 19 остаткам;
sαα = 2*log2(pαα/qα2);
sαβ = 2*log2(pαβ/2*qα*qβ).
Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS
Пара аминокислот |
nαβ |
Pαβ |
qα |
qβ |
sαβ |
Glu-Glu |
3394413 |
1,48*10-2 |
5,67*10-2 |
5,67*10-2 |
4,405512 |
Glu-Gln |
1729724 |
7,55*10-3 |
5,67*10-2 |
4,23*10-2 |
1,308797 |
Glu-Leu |
1337169 |
5,83*10-3 |
5,67*10-2 |
8,15*10-2 |
-1,32945 |
|
- N=229168446.
Сравнение весов аминокислотных замен
Пара аминокислот |
Блок PR01165A |
200 блоков |
BLOSUM62 |
Glu-Glu |
-∞ |
4,405512 |
5 |
Glu-Gln |
5,389326 |
1,308797 |
2 |
Glu-Leu |
-3,62787 |
-1,32945 |
-3 |
|
- Как видно из приведенных таблиц некоторые результаты являются сходящимися, но некоторые довольно значительно различаются. При этом стоит отметить,
что веса аминокислотных замен при использовании 200 блоков более близки к таковым в BLOSUM62. Данную закономерность можно объяснить просто, если учесть,
что общее число пар составляет астрономическое число. Очень странным кажется полное отсутствие пар Glu-Glu в блоке PR01165A, хотя можно показать,
что Glu довольно редкая аминокислота, но тем и ценнее вес замены Glu-Glu, равный 5. Вес замены пары Glu-Gln в блоке PR01165A превысил аналогичные
замены в BLOSUM62 более, чем два раза, а среди 200 блоков так и во все 4. Это можно объяснить как раз предыдущим пунктом. Возможно в PR01165A
произошла мутация, в результате которой некоторые глутаминовые кислоты были заменины близким глутамином. Что касается пары Glu-Leu, то здесь итак
всё ясно, если сравнить структурные формулы этих аминокислот. Об этом свидетельствуют и полученные отрицательные значения весов замен в паре Glu-Leu,
причем, что интересно, в блоке PR01165A оно оказалось даже ближе к данным BLOSUM62.
Второй семестр
©Снегирёв Александр, 2005