1.Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.
1)Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
Сначала познакомимся немного с белком-прототипом.
PDB ID белка-прототипа - 2QTS.
Зайдём на домашнюю страничку БД PDBsum и откроем страницу с описанием белка 2QTS.
Мы сразу увидим его изображение:
Информация,содержащаяся в PDBsum:
Кислотно-чувствительный ионный канал (ASICs) - потенциал-независимый,протон-активируемый рецептор,который принадлежит
семейству эпителиальных натриевых каналов,и вовлечн в процессы восприятия боли,ишемические приступы,
отвечает за механочувствительность,способность к обучению и запоминанию.
1) Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
Щёлкнув по выравниванию в структуре,получим окно с информацией о выравнивании последовательностей белков
ACCN2_CHICK (UniProt) и 2QTS (PDB). Переведя выравнивание в фаста-формат,импортируем его в GeneDoc.
Выравнивание сохранено в файл algn.msf .
Нумерация этих баз данных совпадает,но в данном случае 42ому из PDB соответствует 1ый из UniProt.
2) Постройте полное глобальное выравнивание заданного белка и белка-прототипа
Введя ACCN2_CHICK и ACCN2_HUMAN в UniProt, получили последовательности заданных белков:
ACCN2_HUMAN иACCN2_CHICK в фаста-формате.
Для проведения глобального выравнивания, используем программу needle. Оставим параметры по умолчанию.
Т.о., проводим команду : needle ACCN2_HUMAN.fasta ACCN2_CHICK.fasta needleACCN2.needle -auto
Получаем файл ACCN2.needle.
3) Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе
Откроем домашнюю страничку БД ОРМ и введём ID PDB :2QTS.
Красивый белочек:
Красным обозначена наружняя мембрана клетки,а синим-внутренняя.
Описание белка 2QTS:
Белок ACCN2_HUMAN имеет код 1.1.42.01.
Тип белка: 1. трансмембранный
Класс: 1.1.альфа-спиральный трансмембранный
Суперсемейство: 1.1.42. эпителиальный натриевый канал
Семейство: 1.1.42.01. кислотно-чувствительный ионный канал
Локализация: плазматическая мембрана эукариот
Комментарии о 2QTS: ассиметричный тример
Для того,чтобы создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе, сначала переведём
глобальное выравнивание в msf-формат
(Для этого прописали команду: needle ACCN2_HUMAN.fasta ACCN2_CHICK.fasta needleACCN2.msf -aformat msf )
Далее на странице БД OPM находим трансмембранные сегменты :
Отмечаем их в GeneDoc символом "H".
Затем через картинку Jmol определяем координаты цитоплазматических петель и их отмечаем символом "+".
Координаты: 42-44 (цепь А),453-458 (цепь А) .
Остальные позиции в строке OPM отмечаем "-" .
Сохраняем разметку в файле mark.msf .
4) Предсказать топологию заданного белка ACCN2_HUMAN с помощью наиболее популярной программы (TMHMM)
На вход программе подаём fasta-последовательность ACCN2_HUMAN. Страничка с предсказанием.
Как видно из предсказания,TMHMM вообще не предсказал ни цитоплазматических петель,ни трансмембранных сегментов!
Для получения ещё одного предсказания воспользуемся другой программой : TMPred ,хотя она была менее рекомендована.
На вход программе подаём fasta-последовательность ACCN2_HUMAN. Страничка с предсказанием.
Предложенные трансмембранные сегменты были отмечены в выравнивании mark++.msf
Подведём итоги: Картина печальна.Сложно предсказывать топологию белка,если по всем трём запросам была получена
информация,не имеющая общих точек соприкосновения.
Ни один из запросов не совпал со сведениями OPM.
2. Сравнение полученных предсказаний с данными ОРМ
Так как в ходе получения предсказаний были получены сведения, в корне отличающиеся от данных OPM, то я решила посмотреть
на документ из Uniprot об этом белке (ACCN2_HUMAN).
Оказалось,что в Uniprot указаны следующие трансмембранные сегменты : 45-65 ; 428-448.
Что ж,отметим их на выравнивании с данными выравнивания последовательностей ACCN2_CHICK и ACCN2_HUMAN,
Сохраним такое выравнивание в файле markUni.msf.
Зелёным цветом в этом выравнивании окрашены участки совпадения трансмембранных сегментов OPM и UniProt. markUni1
А теперь для полученных данных заполним таблицу: (будем сравнивать данные UniProt относительно данных OPM,то есть будем
считать предсказанными данные из UniProt)
Число а.к. остатков | |
Всего а.к. остатков | 527 |
Остатки, предсказанные как локализованные в мембране (всего) | 42 |
Правильно предсказали (true positives, TP) | 42 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 0 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 475 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 9 |
Чувствительность (sensivity) = TP / (TP+FN) | 0,8235 |
Специфичность (specificity) = TN / (TN+FP) | 1 |
Точность(precision) = TP /(TP+FP) | 1 |
Сверхпредсказание = FP/ (FP+TP) | 0 |
Недопредсказание = FN / (TN+FN) | 0,0185 |
Даа,конечно,если бы это были результаты предсказания,то такую программу предсказания можно было бы назвать очень
хорошей, обеспечивающей высококачественные предсказания на мой взгляд.
"Предсказаны" оба трансмембранных сегмента,но не настолько полно,насколько они отмечены в OPM, по этой причине
чувствительность предсказания не максимальна.
Как недо-, так и сверхпредсказание говорят о хорошем качестве предсказания.
Ориентация
Если составлять подобную таблицу относительно "нулевых" предсказаний TMHMM,то лишь несколько параметров будут
иметь ненулевые значения:
Результаты предсказания топологии мембранного белка....
Число а.к. остатков | |
Всего а.к. остатков | 527 |
Остатки, предсказанные как локализованные в мембране (всего) | 0 |
Правильно предсказали (true positives, TP) | 0 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 0 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 475 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 52 |
Чувствительность (sensivity) = TP / (TP+FN) | 0 |
Специфичность (specificity) = TN / (TN+FP) | 1 |
Точность(precision) = TP /(TP+FP) | 0 |
Сверхпредсказание = FP/ (FP+TP) | 0 |
Недопредсказание = FN / (TN+FN) | 0,0987 |
Конечно, такое предсказание с нулевой точностью никого не заинтересует. Тем более,что это предсказание относится
к белку - натриевому каналу.
©Терешкова Алеся,2010e