На главную страницу второго семестра

Матрицы замен.

  Средний вес замен в группе KRH 3,17
  Средний вес замен в группе NDEQ 2,7
  Средний вес замен между группами 0
  Примечание: при подсчете среднего веса замен внутри группы нельзя находить среднее значение в квадрате (матрице) замен, а необходимо удвоить значения диагоналей или считать среднее значение в треугольной матрице.
  Замена аминокислот внутри группы имеет больший вес, чем замена между группами; замена очень близких аминокислот внутри группы (например, K на R) имеет больший вес, чем замена менее похожих (K на H). Вес замены аминокислоты на саму себя всегда положителен.

  Расчеты и результаты можно посмотреть здесь (в файле несколько листов).
  При подсчете значений в матрице аминокислотных замен я подобрал основание логарифма так, чтобы вес замены A-A был равен весу замены A-A в blosum62, а остальные веса округлил. Частоты аминокислот в первом случае взяты из файла AAfreq.txt, в другом - посчитал сам. В результате некоторые замены имеют близкие к blosum62 значения (например, A-A, A-M, A-S - табл.1; A-A, A-D, A-I в табл. 2), другие же очень отличаются. Таблица 2 кажется мне более удачной, так как в ней меньше отрицательных значений на главной диагонали.   При подсчете по 200 блокам (см. здесь) в матрице полностью совпало 7 весов(в т.ч. и повторяющиеся), с различием на 1 - 71 вес, на 2 - 171 (~60%). Красота!


©Хайруллин Альберт