Четвёртый семестр

Предсказание топологии мембранного белка MIP_CAVPO

Предсказание топологии почти вручную.

Профиль гидрофобности построен с помощью программы pepwindow (-graph data, -length 19). Программа просматривает всю аминокислотную последовательность и для каждого окна вычисляет среднее значение гидрофобности. Полученные данные обработаны в Excel; был построен график профиля гидрофобности profile.xls. На графике: гидропатичность - средняя гидрофобность для окна с центром в данной позиции.

Используя данный график, было произведено предсказание трансмембранных сегментов; это предсказание было сопоставлено с предсказанием программы TMHMM, а также с данными ресурса OPM о топологии прототипа заданного белка — MIP_SHEEP (аминокислотные координаты по обоим белкам совпадают). Последовательности найдены в базе данных Swiss-Prot по ID. Вес выравнивания, полученного с помощью программы needle — 1284, процент идентичности последовательностей — 94.7 (что неплохо).

Помимо этого, в соответствии с правилом фон Хейне, гласящем, что немембранные участки белка, лежащие в цитоплазме, содержат больше положительно заряженных остатков (K и R), чем те, что лежат на внешней стороне мембраны, были предсказаны внешние и внутренние петли. Это предсказание было сделано с помощью программы TMHMM, а также после анализа координат трансмембранных сегментов, содержащихся в базе данных OPM. Результаты работы представлены в виде двух новых последовательностей, присоединённых к выравниванию белков MIP_CAVPO и MIP_SHEEP; их названия — TMHMM и OPM. Трансмембранные спирали обозначены буквами H, участки белка, находящиеся на внутренней стороне мембраны — буквой I, а участки с внешней стороны — буквой O.
Выравнивания находятся в файле marking.msf.

Предсказание топологии с помощью TMHMM.

Выходной файл программы ТМНММ.
Полученные результаты в графической форме:


Данный график показывает вероятности принадлежности аминокислотного остатка к одной из категорий ( красные столбцы - принадлежность к трансмембранному участку, синяя линия - внутриклеточному, малиновая линия - внеклеточный участок ).Это позволяет знать вероятность пропустить трансмембранный фрагмент.

Сравнение предсказанных топологий и положения белка MIP в мембране

  По профилю гидрофобности TMHMM
Всего предсказано остатков в спиралях(N) 114 138
Из них
А. По данным ОРМ находятся внутри мембраны 109 121
В. Из них — "торчащие" из мембраны остатки на концах спиралей (по данным PDB-структуры) 5 17
С. Вообще не имеют никакого отношения к трансмембранным спиралям 1 1
D. Число непредсказанных остатков, которые по данным ОРМ находятся в мембране. 47 30
Точность предсказания, A/N 0.96 0.88
Сверхпредсказание, C/N 0.009 0.007
Недопредсказание, D/(L-N), где L-длина последовательности (263 а.о.) 0.32 0.24

При определении остатков, "торчащих" из мембраны на концах спиралей был использован PDB-файл структуры белка-прототипа — 1sor.pdb и WebMol на сайте ОРМ. "Торчащие" концы определялись следующим образом: определялись остатки, по данным OPM выходящие из мембраны, но предсказанные соответствующим методом, и относятся ли они к спиралям по pdb.

Согласно таблице, оба метода (определение трансмембранных участков вручную и с помощью программы TMHMM) дают погрешность. Как ни странно, но, судя по таблице, метод "почти вручную" в данном случае оказался чуть получше. Оба метода предсказали одинаковое число трансмембранных сегментов, которые более-менее прекрывались по остаткам. В сумме TMHMM было предсказано больше остатков в спиралях. При методе "вручную" только один пик дотянул до отметки 1.8, но при этом он не оказался ближе к данным PDB-структуры или OPM. При этом очень большим оказался процент недопредсказания: оба метода не нашли участки 69-78 и 185-194 по OPM.

Четвёртый семестр


© Снегирёв Александр, 2006