Транспортные белки.

1.Построение парного выравнивания исследуемого белка и заданного прототипа

AC исследуемого белка из uniprot -Q65R38
AC белка прототипа -P60844( идентификатор PDB-1RC2)

Выравнивание строилось при помощи алгоритда ClustalX2. Штраф за открытие гэпа-10 Штраф за продление гепа-5

  • Выравнивание в формате .msf

    2.Разметка мембранных сегментов на выравнивании.

    По идентификатору PDB белка-прототипа ,было найдено описание ориентации белка в мембране в БД OPM. В меню Localization на панели слева.

    Разметка проводилась смедующим образом : В файл marking.msf была добавлена последовательность "OPM", на которой позиции мембранных сегментов отмечены буквой "Н", позиции цитоплазматических петель знаком "*", остальные — знаком "-".

    3.Предсказание топологии заданного белка с помощью наиболее популярной программы TMHMM

  • Исходными данными для предсказания являются последовательность в фаста формате. Предсказание проводилось с параметрами по умолчанию. Результат предсказания такой.

    В файл marking.msf добавила еще одну искусственную последовательность-"TMHMM", отражающую результаты данного предсказания.

    Результат сравнения.
    В каждой группе красным выделены консервативные остатки. Таки образом,с одной стороны, видно на сколько похожи исследуемый белок и белок прототип, а с другой, на сколько совпадают предсказание при помощи OPM и TMHMM.
    Результат,сохраненный в виде текстового файла формата Clustal .

    Оценка качества предсказания

    Результаты предсказания топологии мембранного белка Q65R38

      Число а.к. остатков
    Всего а.к. остатков  230
    Остатки, предсказанные как локализованные в мембране (всего)  6*23=138
    Правильно предсказали (true positives, TP)  109
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)  19
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)  62
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)  40
    Чувствительность (sensivity) = TP / (TP+FN)  109/(109+40)=0,73
    Специфичность (specificity) =  TN / (TN+FP)   62/(62+19)=0,76
    Точность (precision) = TP / (TP+FP)                         109/(109+19)=0,85
    Сверхпредсказание = FP/ (FP+TP)       19/(19+109)=0,14
    Недопредсказание = FN / (TN+FN)                                             40/(62+40)=0,39
    Вывод:В общем,ТHMM предсказывает структуру транспортного белка довольно не плохо. Программа не предсказала 2 наиболее которкие спирали (по 10 аминок-т) и не совсем точно предсказала границы остальных. Очень часто они были "сдвинуты"(наприемер 3 не предсказанных и при этом 3 перепредсказанных ам-ты).Но границы - проблема для все предсказывающих программ. При этом следует помпить ,что в белках побобной структуры,смезение границ спиралей (или их не предсказание) ведет к смещению границ ципотплазматических и вшеншних петель. В целом,предсказание отличается хорошей точночтью,чувствительностью и спецефичностью.