Главная страница четвертого семестра

Предсказание топологии мембранного белка AT2A1_RABIT.

Исходные данные

1. Идентификатор последовательности исследуемого белка - AT2A2_CHICK

2. AC исследуемого белка - Q03669

3. Идентификатор последовательности белка-прототипа - AT2A1_RABIT

4. AC белка-прототипа - P04191

5. PDB-код прототипа - 1SU4

Построение выравнивания белков AT2A2_CHICK и AT2A1_RABIT

С помощью системы SRS по ID белков были получены их fasta-последовательности. Далее было произведено выравнивание программой Needle:
needle AT2A2_CHICK.fasta AT2A1_RABIT.fasta
Все параметры задавались по умолчанию. Это выравнивание было импортировано в GeneDoc - файл marking.msf.

Результаты

Предсказание топологии белка

   С помощью программы pepwindow были получены данные для построения профиля гидрофобности белка AT2A2_CHICK. На этом графике по оси X отложен номер аминокислотного остатка в последовательности, по оси Y - средняя гидрофобность для окна длиной 19 аминокислотных остатков с центром в данной позиции.

   Были рассмотрены 5 пиков со средним значением гидропатичности выше 1,8 и один пик со значением гидропатичности 1,78. Для этих пяти пиков была построена таблица:

Предсказание ТМ сегментов почти вручную
№ трансмембранного сегмента Начало Конец
1 60 78
2 88 106
3 260 278
4 298 316
5 771 789
6 930 948

   В файле marking.msf приведена разметка внутрених (обозначены знаком "+") и внешних (обозначены знаком "-") петель (исходя из предположения, что внутрение цепи содержат больше положительно заряженных остатков - лизина и аргинина), трансмембранные остатки обозначены буквой - "H". Строка "Manual" в выравнивании.

Предсказание топологии с помощью сервера TMHMM

   С помощью сервера TMHMM были получены координаты начал и концов трансмембранных, внутренних и внешних участков. Ниже приведены результаты в графической форме.

   На графике изображены три непрерывные кривые (область под красной кривой закрашена), красным изображены трансмембранные участки, синим - внешние, ф иолетовым - внутренние. По оси Х откладывается позиция остатка в последовательности. По оси У откладывается вероятность того, что указанный аминокислотный остаток принадлежит внешниму, внутреннему и трансмембранному участку. Над графиком показана конечная структура белка. Можно заметить, что шесть пиков (сответствующих трансмембранным участкам) предсказаны с вероятностью, близкой к 100 %, один пик - с вероятностью более 90%, еще один пик с вероятностью около 90%, один пик с вероятностью около 60%. В общем, вероятность того, что белок имеет именно такую структуру, довольно велика (за исключением предпоследнего трансмембранного участка).

   Эти данные занесены в выравнивание marking.msf. Можно заметить, что предсказания этих двух способов в основном совпадают, однако, ближе к N-концу программа TMHMM находит большее количество трансмембранных участков.

Сравнительная таблица двух методов

№ трансмембранного сегмента Предсказание ТМ сегментов почти вручную TMHMM
. Начало Конец Начало Конец
1 60 78 60 79
2 88 106 84 106
3 260 278 260 279
4 298 316 299 321
5 771 789 759 781
6     836 858
7 930 948 930 952
8     962 979
9     1013 1032

Выделение трансмембранных сегментов в 3D-структуре белка-прототипа AT2A1_RABIT

   В банке данных OPM по идентификатору ID PDB белка-прототипа (1SU4) была получена информация о трансмембранных сегментах этого белка. Эта информация была внесена в выравнивание marking_rev.msf (строка OPM). Поскольку база данных OPM основывается на реально существующих конформациях белков (т.е. эти данные являются экспериментально доказанными), то истинность приводимых здесь фактов не подлежит сомнению. Вышеиспользованные методы основываются лишь на статистических данных аминокислотных последовательностей, что не очень надежно.
Ниже голубой линии распологается внутренняя (цитоплазматическая) часть, выше красной - та часть, которая находится внутри ЭПР. Таким способом было обнаружено 10 трансмембранных участков.

Сравнительная таблица трех методов

№ трансмембранного сегмента Предсказание ТМ сегментов почти вручную TMHMM OPM
  Начало Конец Начало Конец Начало Конец
1 60 78 60 79 57 76
2 88 106 84 106 90 105
3 260 278 260 279 260 274
4 298 316 299 321 288 306
5 771 789 759 781 762 780
6         789 807
7     836 858 834 853
8         897 915
9 930 948 930 952 932 949
10     962 979 966 987
11     1013 1032    

   Таким образом, уже из этой таблицы можно видеть, что предсказание ТМ-участков при помощи программы TMHMM больше похоже на правду, чем предсказание по профилю экспрессии.

Сравнение предсказанных топологий с описанием трансмембранных сегментов в 3D-структуре прототипа

Сравнение 2-х предсказанных топологий и положения белка в мембране

  По профилю гидрофобности TMHMM
Всего предсказано 114 193
Из них      
  А. По данным ОРМ находятся внутри мембраны 83 156
  В. Из них - "торчащие" из мембраны остатки на концах спиралей 14 16
  С. Вообще не имеют никакого отношения к трансмембранным спиралям 17 21
D. Число непредсказанных остатков, которые по данным ОРМ находятся в мембране. 93 62
Точность предсказания, A/N 0,73 0,81
Сверхпредсказание, C/N 0,149 0,108
Недопредсказание, D/(L-N), где L-длина последовательности(1041) 0,104 0,073
Как видно, точность TMHMM и метода расчета почти вручную не очень велика, при этом их показатели примерно одинаковы. Оценка сегментов по профилю гидрофобности дает большее сверпредсказание, а TMHMM - большее недосказание.
     




© Низамутдинов Игорь, 2004