Занятие 9. Транспортные белки.

  • Построение парного выравнивания исследуемого белка и заданного прототипа
  • Последовательности белка-прототипа из PDB И Uniprot были получены по идентификатору 1VF5 и P83791 соответственно.
    Для сравнения использовалась программа stretcher, которая определила что эти последовательности одинаковы (100% identity). Выдачу программы можно посмотреть здесь.

    Заданный белок (ID A0ZZ65) был выравнен с последовательностью прототипа из PDB так же программой stretcher. Получены следующие результаты:

    #=======================================
    #
    # Aligned_sequences: 2
    # 1: SEQUENCE
    # 2: CYB6_GOSBA
    # Matrix: EBLOSUM62
    # Gap_penalty: 12
    # Extend_penalty: 2
    #
    # Length: 215
    # Identity:     179/215 (83.3%)
    # Similarity:   201/215 (93.5%)
    # Gaps:           0/215 ( 0.0%)
    # Score: 984
    # 
    #
    #=======================================
    

  • Разметка мембранных сегментов на выравнивании
  • По идентификатору PDB белка-прототипа найдено описание ориентации белка в мембране в БД OPM, и в файл marking.msf ниже последовательности прототипа добавлена последовательность с названием "OPM" и разметкой ТМ сегментов.

  • Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)
  • Результат предсказания топологии заданного белка с помощью сервера TMHMM. (опции по умолчанию).

    К последовательностям в файле marking.msf добавлена еще одна искусственная последовательность, отражающая результаты данного предсказания. Это последовательность "TMHMM".

    Готовое выравнивание в виде HTML и Clustal

  • Оценка качества предсказания
  • Результаты предсказания топологии мембранного белка....

      Число а.к. остатков
    Всего а.к. остатков 215
    Остатки, предсказанные как локализованные в мембране (всего) 103
    Правильно предсказали (true positives, TP) 95
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 8
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 110
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 4
    Чувствительность (sensivity) = TP / (TP+FN) 0.96
    Специфичность (specificity) =  TN / (TN+FP)  0.93
    Точность (precision) = TP / (TP+FP)                        0,92
    Сверхпредсказание = FP/ (FP+TP)      0,07
    Недопредсказание = FN / (TN+FN)                                            0,035

    Эти данные свидетельствуют о высоком качестве предсказания-высокой точности наряду с малым количеством ошибок. Большей точности ожидать трудно,учитывая что живые системы нельзя полностью описать математической моделью,и предсказать абсолютно точно все детали.