Занятие 9. Мембранные белки, транспортные белки.

1. Построение выравнивания заданного белка и белка-прототипа с разметкой трансмембранных сегментов

1. Сравнение нумерации остатков белка-прототипа FIEF_ECOLI в UniProt и PDB

Из БД PDBsum получим выравнивание последовательности из PDB с идентификатором 3H90 и соответствующей последовательности UniProt. Для этого нужно щелкнуть изображение выравнивания последовательности в структуре, скопировать полученное выравнивание, сохранить его в fasta-формате и импортировать в GeneDoc:

Нумерцаия аминоксилотных остатков в UniProt и PDB совпадает, но в PDB представлен лишь фрагмент последовательности из UniProt с 8 по 290 а.о., т.е. обрезанный как с С, так и с N-конца.
Файл с выравниванием в формате msf: algn1.msf.

2. Построение полного глобального выравнивания заданного белка FIEF_ERWCT и белка-прототипа FIEF_ECOLI

С помощью seqret получим последовательности белков FIEF_ERWCT и FIEF_ECOLI в fasta-формате: fief_erwct.fasta, fief_ecoli.fasta. Затем выровняем их при помощи программы needle пакета EMBOSS, при этом штрафы за гэпы оставим стандартные (10.0 за открытие гэпа, 5.0 за его продление). Получили выравнивание algn2.needle. Импортируем его в GeneDoc для выполнения следующих заданий: algn2.msf.
Выравнивание характеризуется малым числом гэпов (2/301), процент идентичности составляет 69,8% (210/301).

3. Создание разметки трансмембранных сегментов в белке-прототипе FIEF_ECOLI по данным БД ОРМ

В БД ОРМ по PDB ID найдем описание ТМ-сегментов в белке-прототипе (PDB ID 3h90). Этот белок представляет собой насос, который осуществляет выведение двухвалентного железа из клетки (ferrous-iron efflux pump fieF). Описание этого белка на сайте БД ОРМ таково:

Тип: 1. Трансмембранные белки (transmembrane)
Класс: 1.1. Альфа-спиральные трансмембранные белки (alpha-helical transmembrane)
Надсемейство: 1.1.43. Белки, осуществляющие перенос катионов (cation diffusion facilitator)
Семейство: 1.1.43.01. Бактериальные цинковые переносчики (bacterial zinc transporters)

На изображении, полученном в Jmol, представлены две субъединицы белка (идентичные цепи):

К полученному в упр.1.2 выравниванию algn2.msf добавим строчку с разметкой трансмембранных сегментов и сохраним в формате *.msf: mark.msf. В этом файле позиции мембранных сегментов отмечены буквой "H", цитоплазматических петель - "+", остальные (внеклеточные сегменты, а также С- и N-концы, отсутствующие в последовательности PDB) отмечены знаком "-".
Из выравнивания и изображения Jmol видно, что белок имеет довольно объемную (С-концевую) цитоплазматическую часть, N-конец также находится в цитоплазме. Мембранные сегменты представляют собой 6 альфа-спиралей, расположенных практически перпендикулярно поверхности мембраны. А вот надмембранных участков мало и они небольшого размера.

4. Предсказание топологии заданного белка FIEF_ERWCT с помощью TMHMM

С помощью сервера TMHMM получено предсказание топологии белка FIEF_ERWCT. Результаты этого предсказания также прикреплены к файлу mark.msf в виде искусственной последовательности "ТМНММ" с разметкой трансмембранных спиралей в соответствии с предсказанием.

2. Сравнение полученного предсказания с данными ОРМ

Для сравнения результатов предсказания с данными ОРМ был написан скрипт Perl: count.pl. На вход программе подавались файлы с данными, полученными из OPM, и результатами предсказания TМНММ: opm.txt, tmhmm.txt.
Поскольку последовательности FIEF_ERWCT и FIEF_ECOLI выровнялись без гэпов практически до конца (все мембранные участки, как предсказанные, так и по данным ОРМ, входят в этот промежуток), можно не менять координаты последовательностей для подсчета.
По результатам работы скрипта составим таблицу:

Результаты предсказания топологии мембранного белка FIEF_ERWCT

  Число а.к. остатков
Всего а.к. остатков 300
Остатки, предсказанные как локализованные в мембране (всего) 129
Правильно предсказали (true positives, TP) 90
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 39
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 161
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 10
Чувствительность (sensitivity) = TP / (TP+FN) 0,9
Специфичность (specificity) =  TN / (TN+FP)  0,805
Точность(precision) = TP /(TP+FP) 0,698
Сверхпредсказание = FP/ (FP+TP) 0,302
Недопредсказание = FN / (TN+FN) 0,058

Чувствительность предсказания в данном случае оказалась довольно высокой (90%), то есть были предсказаны практически все мембранные остатки из существующих. Специфичность оказалась чуть ниже, но также на достаточном уровне (около 80%) - большая часть остатков, не погруженных в мембрану, тоже определилась правильно. Точность предсказания была еще ниже - среди остатков, предсказанных как мембранные, правильно угаданы были только ~70%.
Недопредсказание в данном случае оказалось совсем незначительным (5,8%), а сверхпредсказание довольно значительным (порядка 30%) - за счет этого не очень велика точность предсказания.

ТМНММ предсказала все 6 трансмембранных участков, причем 5 из них (первые четыре и последний по порядку их расположения в последовательности) предсказаны более-менее верно. ТМНММ в основном указывала более широкие границы для этих участков, но все действительно находящиеся в мембране остатки захватывала. Пятый участок (149-158) единственный оказался предсказанным неверно (158-175).

Назад