На главную страницу второго семестра
Матрицы замен.
Средний вес замен в группе KRH 3,17
Средний вес замен в группе NDEQ 2,7
Средний вес замен между группами 0
Примечание: при подсчете среднего веса замен внутри группы нельзя
находить среднее значение в квадрате (матрице) замен, а необходимо удвоить
значения диагоналей или считать среднее значение в треугольной матрице.
Замена аминокислот внутри группы имеет больший вес, чем замена между
группами; замена очень близких аминокислот внутри группы (например, K на R)
имеет больший вес, чем замена менее похожих (K на H). Вес замены аминокислоты
на саму себя всегда положителен.
Расчеты и результаты можно посмотреть
здесь (в файле несколько листов).
При подсчете значений в матрице аминокислотных замен я подобрал
основание логарифма так, чтобы вес замены A-A был равен весу замены A-A в
blosum62, а остальные веса округлил. Частоты аминокислот в первом случае взяты
из файла AAfreq.txt, в другом - посчитал сам. В результате некоторые замены
имеют близкие к blosum62 значения (например, A-A, A-M, A-S - табл.1;
A-A, A-D, A-I в табл. 2), другие же очень отличаются. Таблица 2 кажется мне
более удачной, так как в ней меньше отрицательных значений на главной диагонали.
При подсчете по 200 блокам
(см. здесь)
в матрице полностью совпало 7 весов(в
т.ч. и повторяющиеся), с различием на 1 - 71 вес, на 2 - 171 (~60%). Красота!
©Хайруллин Альберт