Построение выравнивания белка TTGB_PSEPU и белка-прототипа с разметкой трансмембранных сегментов

Сравние нумерации остатков белка-прототипа в UniProt (MEXB_PSEAE) и PDB (2V50)

Для получения выравнивания последовательности белка из Uniprot и PDB использовал БД PDBsum.
(выравнивание в формате fasta)
(выравнивание в формате msf)

Нумерация в двух БД одинаковая, но в последовательности из PDB отсутствуют некоторые участки.

Построение полного глобального выравнивания белка TTGB_PSEPU и белка-прототипа MEXB_PSEAE

Для выравнивания последовательностей белков использовалась программа needle со стандартными параметрами.
(выравнивание в формате fasta)
(выравнивание в формате msf)
(выравнивание в формате needle)

Создание разметки трансмембранных сегментов в белке-прототипе (MEXB_PSEAE) по данным БД ОРМ

Описание трансмембранных сегментов в белке-прототипе (MEXB_PSEAE) было получено по PDB ID (2V50). Использовалось описание для цепи A. Трансмембранные сегменты были отмечены на выравнивании последовательностей белка из Uniprot и PDB с помощью программы GenDoc (последовательность с именем OPM).
(выравнивание в формате msf)

"H" - трансмембранный сегмент;
"+" - цитоплазмотическая петля;
"-" - петля снаружи от мембраны;
"?" - неизвестно расположение остатков, т.к. они отсутствуют в последовательности из PDB.

Предсказание топологии заданного белка с помощью программы TMHMM

Предсказанные трансмембранные сегменты были отмечены на выравнивании последовательностей белка из Uniprot и PDB с помощью программы GenDoc (последовательность с именем TMHMM).
(выходной файл программы TMHMM)
(выравнивание в формате msf)

TMHMM предсказал 11 из 12 трансмембранных сегментов.

Сравнение предсказания TMHMM с данными ОРМ.

Результаты предсказания топологии мембранного белка.

  Значение
Всего а.к. остатков 1050
Остатки, предсказанные как локализованные в мембране 237
Правильно предсказали (TP) 194
Предсказали не то, что нужно (FP) 43
Правильно не предсказали (TN) 778
Не предсказали то, что нужно (FN) 35
Чувствительность = TP/(TP+FN) 0.847
Специфичность = TN/(TN+FP) 0.948
Точность = TP/(TP+FP) 0.819
Сверхпредсказание = FP/(FP+TP) 0.181
Недопредсказание = FN/(TN+FN) 0.043

Для заполнения таблицы использовался PERL script. В качестве входных данных описание из OPM и выходной файл программы TMHMM.

Учитывая, что у программы TMHMM была только последовательность белка, предсказание можно считать удовлетворительным, однако достаточно много сверхпредсказанных остатков. TMHMM предсказал 11 из 12 трансмембранных сегментов, что вероятно связано с близким расположением двух сегментов, которые были предсказаны, как один. Из-за этого для нескольких петель в начале последовательности было неправильно предсказано расположение (хотя, судя по графику, вероятности расположения этих петель по обе стороны от мембраны были приблизительно равны).


Назад

2010 ©