Функции, продолжение.
Мембранные белки, транспортные белки

1.Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.

  1. Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
  2. На домашней страничке БД PDBsum был найден документ с заданным идентификатором PDB 2WCD. На страничке было найдено выравниванием последовательности из UniProt и последовательности из PDB и импортированно в GeneDoc.

    Файл с выравниванием: algn1.msf.

    Нумерация остатков в этих банках совпадает. Но в последовательности из банка PDB недостаёт некоторое количество отстаков на концах.

  3. Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
  4. Последовательности заданных белка HLYE_SALPA и белка-прототипа HLYE_ECOLI в файле: hlye.fasta.
    Последовательности были выравнены с помощью программы muscle: hlye.msf.

  5. Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе.
  6. На домашней страничке БД ОРМ, по PDB 2WCD было найдено описание ТМ-сегментов в белке-прототипе HLYE_ECOLI.
    В созданном в упр.1.2 выравнивании под строчкой с выровненной последовательностью белка-прототипа помещена строчка с разметкой трансмембранных сегментов, она названа OPM. Сохранено в файле: mark.msf.

  7. Предсказать топологию заданного белка с помощью наиболее популярной программы (TMHMM)
  8. Страничка с результатом предсказания (опции по умолчанию): предсказание.

    К последовательностям в файле mark.msf была добавлена еще одна искусственная последовательность с разметкой трансмембранных спиралей в соответствии с результатами предсказания. Эта последовательность названа "TMHMM".

2.Сравните полученное предсказание с данными ОРМ.

По полученному выравниванию была заполнена следующая таблица c помощью программы, написанной на языке Perl.
Программа: mark_count.pl.
Выходной файл программы: mark_count.txt. Этот файл содержит строки, соответствующие строкам таблицы.

Результаты предсказания топологии мембранного белка HLYE_SALPA

  Число а.к. остатков
Всего а.к. остатков 303
Остатки, предсказанные как локализованные в мембране (всего) 23
Правильно предсказали (true positives, TP) 23
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 0
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 249
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 31
Чувствительность (sensivity) = TP / (TP+FN) 0.4259
Специфичность (specificity) =  TN / (TN+FP)  1
Точность(precision) = TP /(TP+FP) 1
Сверхпредсказание = FP/ (FP+TP) 0
Недопредсказание = FN / (TN+FN) 0.1107

Предсказана только одна из двух трансмембранных спиралей. В результате этого ориентация белка в мембране предсказана неправильно. На самом деле, белок лишь заякорен в мембране, и основная его часть обращена в пространство вне клетки. Но из-за пропуска трансмембранной спирали предсказано, что белок находится по обе стороны от мембраны, "держась" одной спиралью в мембране.



© Айдарханов Руслан 2008