Средний вес замен между: | |
---|---|
а.о. желтой группы | 0,83 |
а.о. синей группы | 2 |
а.о. желтой и синей группы | -2,75 |
qxy = Qxy/ΣQij
Если аминокислотные замены (пары аминокислот в последовательностях, стоящие в одинаковых позициях) случайные и независимые, то вероятность найти а/к X против Y есть: qxy = qx*qy (1), где qx - частота встречаемости а/к, qy - частота встречаемости а/к Y (данные о частотах встречаемости аминокислот в первом случае взяты из файла aafreq.txt, содержимое которого для удобства сохранено в книге Practice_4.xls на странице aafreq, а во втором случае - рассчитаны по данным блока - результаты и используемые формулы приведены в книге blocks.xls, а результаты использования этих частот оформлены в книге Practice_4.xls на странице Block second edition. Если встречаемость замены XY не случайно, то вероятность замены XY есть собственно величина qxy (2). Тогда отношение величины (2) на (1) и есть то, что мы называем весом а/к замены (формула представлена ниже).
В таблице "Веса а/к замен" рассчитан вес аминокислотных замен E, G, K в данном блоке; расчет по формуле: "частота аминокислотной пары (замены) XY [qxy]"/("частота встречаемости а.о. Х [qx]"*"частота встречаемости а.о. Y [qy]").
qxy/(qx*qy)
В таблице "Собственно веса а/к замен." представлены результаты использования формулы: 2*log2("вес замены") и округления до целого.
2*LOG2[qxy/(qx*qy)]
Сравнение "Собственно веса а/к замен." с матрицей Blosum62 показывает, что по некоторым заменам аминокислот получены вполне коррелируемые результаты, например замены EE, GG, KK в Blosum62 составляют 5, 6, 5, а в таблице "Собственно веса а/к замен.": 7; 5; 7 соответственно, что хотя бы совпадает по знаку замены, в других случаях, например замены EK, KG в Blosum62 составляют 1, -2, а в таблице "Собственно веса а/к замен.": 0; 1 соответственно, что совершенно не коррелирует даже по знаку замены друг с другом. На мой взгляд, это связано с тем, что выборка белков в моем блоке мала по размерам, отчего возможно некоторое несовпадение весов замен из-за, например, попадания в эту выборку высоко родственных белков: тогда точно будет завышен вес одноименных замен (типа ХХ) особенно в области консервативных последовательностей активного центра. Но в целом, вероятно, результаты можно считать удовлетворительно коррелирующими с матрицей Blosum62. Результаты сравнения:
Тип замены |
EE |
EK |
EG |
GG |
GK |
KK |
Blosum62 |
5 |
1 |
-2 |
6 |
-2 |
5 |
"Собственно веса а/к замен." |
7 |
0 |
-4 |
5 |
1 |
7 |
Тип замены |
EE |
EK |
EG |
GG |
GK |
KK |
Blosum62 |
5 |
1 |
-2 |
6 |
-2 |
5 |
"Собственно веса а/к замен." |
4 |
-3 |
-6 |
6 |
0 |
5 |
Тип замены |
EE |
EK |
EG |
GG |
GK |
KK |
Blosum62 |
5 |
1 |
-2 |
6 |
-2 |
5 |
"Собственно веса а/к замен." |
4 |
1 |
0 |
4 |
0 |
3 |