1.Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.
- Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
На домашней страничке БД PDBsum
был найден документ с заданным идентификатором PDB 2WCD. На страничке было найдено
выравниванием последовательности из UniProt и последовательности из PDB и импортированно в GeneDoc.
Файл с выравниванием: algn1.msf.
Нумерация остатков в этих банках совпадает. Но в последовательности из банка PDB недостаёт некоторое количество отстаков на концах.
- Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
Последовательности заданных белка HLYE_SALPA и белка-прототипа HLYE_ECOLI в файле:
hlye.fasta.
Последовательности были выравнены с помощью программы muscle: hlye.msf. - Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе.
На домашней страничке БД ОРМ,
по PDB 2WCD было найдено описание ТМ-сегментов в белке-прототипе HLYE_ECOLI.
В созданном в упр.1.2 выравнивании под строчкой с выровненной последовательностью белка-прототипа помещена строчка с разметкой трансмембранных сегментов, она названа OPM. Сохранено в файле: mark.msf. - Предсказать топологию заданного белка с помощью наиболее популярной программы (TMHMM)
Страничка с результатом предсказания (опции по умолчанию): предсказание.
К последовательностям в файле mark.msf была добавлена еще одна искусственная последовательность с разметкой трансмембранных спиралей в соответствии с результатами предсказания. Эта последовательность названа "TMHMM".
2.Сравните полученное предсказание с данными ОРМ.
По полученному выравниванию была заполнена следующая таблица c помощью программы, написанной на языке Perl.Программа: mark_count.pl.
Выходной файл программы: mark_count.txt. Этот файл содержит строки, соответствующие строкам таблицы.
Результаты предсказания топологии мембранного белка HLYE_SALPA
Число а.к. остатков | |
Всего а.к. остатков | 303 |
Остатки, предсказанные как локализованные в мембране (всего) | 23 |
Правильно предсказали (true positives, TP) | 23 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 0 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 249 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 31 |
Чувствительность (sensivity) = TP / (TP+FN) | 0.4259 |
Специфичность (specificity) = TN / (TN+FP) | 1 |
Точность(precision) = TP /(TP+FP) | 1 |
Сверхпредсказание = FP/ (FP+TP) | 0 |
Недопредсказание = FN / (TN+FN) | 0.1107 |
Предсказана только одна из двух трансмембранных спиралей. В результате этого ориентация белка в мембране предсказана неправильно. На самом деле, белок лишь заякорен в мембране, и основная его часть обращена в пространство вне клетки. Но из-за пропуска трансмембранной спирали предсказано, что белок находится по обе стороны от мембраны, "держась" одной спиралью в мембране.