Мембранные белки.Транспортные белки.

Задача — предсказать топологию мембранного белка и сравнить результаты предсказания с описанием 3D-структуры близкого гомолога (белка-прототипа), ориентированной в мембране.

1.Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.

1)Сравнить нумерацию остатков белка-прототипа в UniProt и PDB

Сначала познакомимся немного с белком-прототипом.

PDB ID белка-прототипа - 2QTS.

Зайдём на домашнюю страничку БД PDBsum и откроем страницу с описанием белка 2QTS.

Мы сразу увидим его изображение:

Информация,содержащаяся в PDBsum:

Кислотно-чувствительный ионный канал (ASICs) - потенциал-независимый,протон-активируемый рецептор,который принадлежит

семейству эпителиальных натриевых каналов,и вовлечн в процессы восприятия боли,ишемические приступы,

отвечает за механочувствительность,способность к обучению и запоминанию.

1) Сравнить нумерацию остатков белка-прототипа в UniProt и PDB

Щёлкнув по выравниванию в структуре,получим окно с информацией о выравнивании последовательностей белков

ACCN2_CHICK (UniProt) и 2QTS (PDB). Переведя выравнивание в фаста-формат,импортируем его в GeneDoc.

Выравнивание сохранено в файл algn.msf .

Нумерация этих баз данных совпадает,но в данном случае 42ому из PDB соответствует 1ый из UniProt.

2) Постройте полное глобальное выравнивание заданного белка и белка-прототипа

Введя ACCN2_CHICK и ACCN2_HUMAN в UniProt, получили последовательности заданных белков:

ACCN2_HUMAN иACCN2_CHICK в фаста-формате.

Для проведения глобального выравнивания, используем программу needle. Оставим параметры по умолчанию.

Т.о., проводим команду : needle ACCN2_HUMAN.fasta ACCN2_CHICK.fasta needleACCN2.needle -auto

Получаем файл ACCN2.needle.

3) Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе

Откроем домашнюю страничку БД ОРМ и введём ID PDB :2QTS.

Красивый белочек:

Красным обозначена наружняя мембрана клетки,а синим-внутренняя.

Описание белка 2QTS:

Белок ACCN2_HUMAN имеет код 1.1.42.01.

Тип белка: 1. трансмембранный

Класс: 1.1.альфа-спиральный трансмембранный

Суперсемейство: 1.1.42. эпителиальный натриевый канал

Семейство: 1.1.42.01. кислотно-чувствительный ионный канал

Локализация: плазматическая мембрана эукариот

Комментарии о 2QTS: ассиметричный тример

Для того,чтобы создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе, сначала переведём

глобальное выравнивание в msf-формат

(Для этого прописали команду: needle ACCN2_HUMAN.fasta ACCN2_CHICK.fasta needleACCN2.msf -aformat msf )

Далее на странице БД OPM находим трансмембранные сегменты :

Отмечаем их в GeneDoc символом "H".

Затем через картинку Jmol определяем координаты цитоплазматических петель и их отмечаем символом "+".

Координаты: 42-44 (цепь А),453-458 (цепь А) .

Остальные позиции в строке OPM отмечаем "-" .

Сохраняем разметку в файле mark.msf .

4) Предсказать топологию заданного белка ACCN2_HUMAN с помощью наиболее популярной программы (TMHMM)

На вход программе подаём fasta-последовательность ACCN2_HUMAN. Страничка с предсказанием.

Как видно из предсказания,TMHMM вообще не предсказал ни цитоплазматических петель,ни трансмембранных сегментов!

Для получения ещё одного предсказания воспользуемся другой программой : TMPred ,хотя она была менее рекомендована.

На вход программе подаём fasta-последовательность ACCN2_HUMAN. Страничка с предсказанием.

Предложенные трансмембранные сегменты были отмечены в выравнивании mark++.msf

Подведём итоги: Картина печальна.Сложно предсказывать топологию белка,если по всем трём запросам была получена

информация,не имеющая общих точек соприкосновения.

Ни один из запросов не совпал со сведениями OPM.

2. Сравнение полученных предсказаний с данными ОРМ

Так как в ходе получения предсказаний были получены сведения, в корне отличающиеся от данных OPM, то я решила посмотреть

на документ из Uniprot об этом белке (ACCN2_HUMAN).

Оказалось,что в Uniprot указаны следующие трансмембранные сегменты : 45-65 ; 428-448.

Что ж,отметим их на выравнивании с данными выравнивания последовательностей ACCN2_CHICK и ACCN2_HUMAN,

Сохраним такое выравнивание в файле markUni.msf.

Зелёным цветом в этом выравнивании окрашены участки совпадения трансмембранных сегментов OPM и UniProt. markUni1

А теперь для полученных данных заполним таблицу: (будем сравнивать данные UniProt относительно данных OPM,то есть будем

считать предсказанными данные из UniProt)

      Число а.к. остатков
    Всего а.к. остатков
     527
    Остатки, предсказанные как локализованные в мембране (всего)
     42
    Правильно предсказали (true positives, TP)
     42
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)
     0
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)
     475
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)
     9
    Чувствительность (sensivity) = TP / (TP+FN)
     0,8235
    Специфичность (specificity) =  TN / (TN+FP) 
     1
    Точность(precision) = TP /(TP+FP)
     1
    Сверхпредсказание = FP/ (FP+TP)
     0
    Недопредсказание = FN / (TN+FN)
     0,0185

    Даа,конечно,если бы это были результаты предсказания,то такую программу предсказания можно было бы назвать очень

    хорошей, обеспечивающей высококачественные предсказания на мой взгляд.

    "Предсказаны" оба трансмембранных сегмента,но не настолько полно,насколько они отмечены в OPM, по этой причине

    чувствительность предсказания не максимальна.

    Как недо-, так и сверхпредсказание говорят о хорошем качестве предсказания.

    Ориентация

    Если составлять подобную таблицу относительно "нулевых" предсказаний TMHMM,то лишь несколько параметров будут

    иметь ненулевые значения:

    Результаты предсказания топологии мембранного белка....

      Число а.к. остатков
    Всего а.к. остатков
     527
    Остатки, предсказанные как локализованные в мембране (всего)
     0
    Правильно предсказали (true positives, TP)
     0
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)
     0
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)
     475
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)
     52
    Чувствительность (sensivity) = TP / (TP+FN)
     0
    Специфичность (specificity) =  TN / (TN+FP) 
     1
    Точность(precision) = TP /(TP+FP)
     0
    Сверхпредсказание = FP/ (FP+TP)
     0
    Недопредсказание = FN / (TN+FN)
     0,0987

    Конечно, такое предсказание с нулевой точностью никого не заинтересует. Тем более,что это предсказание относится

    к белку - натриевому каналу.

     


     

     


 

 

©Терешкова Алеся,2010e