Занятие 9. Транспортные белки.

Необходимые ссылки: OPM (Orientations of Proteins in Membranes database) http://opm.phar.umich.edu
Банк pdb http://www.rcsb.org/pdb
Сервер TMHMM http://www.cbs.dtu.dk/services/TMHMM-2.0/
Поисковая система SRS

Построение парного выравнивания исследуемого белка и заданного прототипа

  1. Получение и сравниние последовательностей белка-прототипа из PDB и UniProt.
  2. А) На сайте банка PDB по ID 1LDF был найден нужный белок. Его последовательность была скачана по ссылке FASTA Sequence.
    Б) Запись базы данных Uniprot была получена запросом в системе поиска SRS:Library Page -> UniProtKB/Swiss-Prot -> Query Form -> AC P0AER0.

  3. Построение парного выравнивания этой последовательности и последовательности белка-прототипа из PDB.
  4. Выравние строилось при помощи сервиса BLAST. При сравнении был сделан вывод,что последовательности белка-прототипа, полученные из разных БД, отличаются по одной (200) позиции.

  5. Выравнивание заданного белка (UniProt) и белка-прототипа (PDB).
  6. Глобальное парное выравнивание было получено при помощи программы needle сервера kodomo.
    Его основные характеристики:
    #=======================================
    #
    # Aligned_sequences: 2
    # 1: A0W1Y5
    # 2: 1LDF
    # Matrix: EBLOSUM62
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 281
    # Identity:     247/281 (87.9%)
    # Similarity:   264/281 (94.0%)
    # Gaps:           0/281 ( 0.0%)
    # Score: 1309.0
    

Разметка мембранных сегментов на выравнивании

По ID 1LDF PDB белка-прототипа было найдено описание ориентации белка в мембране в базе данных OPM (Orientations of Proteins in Membranes database). В соответствии с этим в программе GeneDoc к парному выравниванию заданного белка и прототипа была добавлена еще одна строка OPH (данные взяты из OPM), где символами "H" обозначили позиции аминокислот мембранных сегментов, "+" - позиции цитоплазматических петель (и хвостов), "-" - остальные.

Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)

Предсказание c сервера.
В программе GeneDoc к выравниванию была добавлена строка выравнивания, где на основании предсказания TMHMM символами "H" обозначили позиции аминокислот мембранных сегментов, "+" - позиции цитоплазматических петель (и хвостов), "-" - все остальные позиции. В результате получили следующие данные, где коричневым цветом обозначили абсолютно консервативные оствтки, а оранжевым - те участки столбцов OPH и TMHMM, которые предсказаны как с помощью программы TMHMM, так и на основании выравнивания с последовательностью, для который уже определены аминокислоты трансмембранных частей белка.
Файл в формате .clustal.

Оценка качества предсказания

Табл.1.Результаты предсказания топологии мембранного белка с AC A0W1Y5.

  Число а.к. остатков
Всего а.к. остатков 281
Остатки, предсказанные как локализованные в мембране (всего) 136
Правильно предсказали (true positives, TP) 115
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 21
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 99
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 46
Чувствительность (sensivity) = TP / (TP+FN)  0,71
Специфичность (specificity) =  TN / (TN+FP)   0,825
Точность (precision) = TP / (TP+FP)                         0,84
Сверхпредсказание = FP/ (FP+TP)       0,16
Недопредсказание = FN / (TN+FN)                                             0,176
Выводы: полученные значения точности,специфичности и чувствительности говорят нам о том, что результаты, предсказанные TMHMM, достаточно высокие. Не предсказанных вообще участков только 1. Значения же параметров сверхпредсказание и недопредсказание также подтверждают хороший результат работы программы TMHMM.