1. Идентификатор последовательности исследуемого белка - AT2A2_CHICK
2. AC исследуемого белка - Q03669
3. Идентификатор последовательности белка-прототипа - AT2A1_RABIT
4. AC белка-прототипа - P04191
5. PDB-код прототипа - 1SU4
Результаты
С помощью программы pepwindow были получены данные
для построения профиля гидрофобности белка AT2A2_CHICK. На этом графике
по оси X отложен
номер аминокислотного остатка в последовательности, по оси Y - средняя
гидрофобность для окна длиной 19 аминокислотных остатков с центром в
данной позиции.
Были рассмотрены 5 пиков со средним значением
гидропатичности выше 1,8 и один пик со значением гидропатичности 1,78.
Для этих пяти пиков была построена таблица:
В файле marking.msf приведена разметка внутрених
(обозначены знаком "+") и внешних (обозначены знаком "-") петель (исходя
из предположения, что внутрение цепи содержат больше положительно заряженных
остатков - лизина и аргинина), трансмембранные остатки обозначены буквой - "H".
Строка "Manual" в выравнивании.
С помощью сервера TMHMM были получены координаты начал и концов трансмембранных, внутренних и внешних участков.
Ниже приведены результаты в графической форме.
На графике изображены три непрерывные кривые (область под красной
кривой закрашена), красным изображены трансмембранные участки, синим - внешние, ф
иолетовым - внутренние. По оси Х откладывается позиция остатка в
последовательности. По оси У откладывается вероятность того, что
указанный аминокислотный остаток принадлежит внешниму, внутреннему и
трансмембранному участку. Над графиком показана конечная структура белка.
Можно заметить, что шесть пиков (сответствующих трансмембранным
участкам) предсказаны с вероятностью, близкой к 100 %, один пик -
с вероятностью более 90%, еще один пик с вероятностью около 90%, один
пик с вероятностью около 60%. В общем, вероятность того, что белок имеет именно
такую структуру, довольно велика (за исключением предпоследнего
трансмембранного участка).
Эти данные занесены в выравнивание marking.msf.
Можно заметить, что предсказания этих двух способов в основном совпадают,
однако, ближе к N-концу программа TMHMM находит большее количество трансмембранных
участков.
В банке данных OPM
по идентификатору ID PDB белка-прототипа (1SU4) была получена информация
о трансмембранных сегментах этого белка. Эта информация была внесена в
выравнивание marking_rev.msf (строка OPM).
Поскольку база данных OPM основывается на реально существующих конформациях белков
(т.е. эти данные являются экспериментально доказанными), то истинность
приводимых здесь фактов не подлежит сомнению. Вышеиспользованные методы
основываются лишь на статистических данных аминокислотных последовательностей,
что не очень надежно.
Таким образом, уже из этой таблицы можно видеть, что
предсказание ТМ-участков при помощи программы TMHMM больше похоже
на правду, чем предсказание по профилю экспрессии.
Сравнение 2-х предсказанных топологий и положения белка в мембране Построение выравнивания белков AT2A2_CHICK и AT2A1_RABIT
С помощью системы SRS по ID белков были получены их fasta-последовательности.
Далее было произведено выравнивание программой Needle:
needle AT2A2_CHICK.fasta AT2A1_RABIT.fasta
Все параметры задавались по умолчанию. Это выравнивание было импортировано в GeneDoc - файл marking.msf.
Предсказание топологии белка
Предсказание ТМ сегментов почти вручную
№ трансмембранного сегмента
Начало
Конец
1
60
78
2
88
106
3
260
278
4
298
316
5
771
789
6
930
948
Предсказание топологии с помощью сервера TMHMM
Сравнительная таблица двух методов
№ трансмембранного сегмента
Предсказание ТМ сегментов почти вручную
TMHMM
.
Начало
Конец
Начало
Конец
1
60
78
60
79
2
88
106
84
106
3
260
278
260
279
4
298
316
299
321
5
771
789
759
781
6
836
858
7
930
948
930
952
8
962
979
9
1013
1032
Выделение трансмембранных сегментов в 3D-структуре белка-прототипа
AT2A1_RABIT
Ниже голубой линии распологается внутренняя (цитоплазматическая) часть, выше красной - та часть, которая находится
внутри ЭПР. Таким способом было обнаружено 10 трансмембранных участков.
Сравнительная таблица трех методов
№ трансмембранного сегмента
Предсказание ТМ сегментов почти вручную
TMHMM
OPM
Начало
Конец
Начало
Конец
Начало
Конец
1
60
78
60
79
57
76
2
88
106
84
106
90
105
3
260
278
260
279
260
274
4
298
316
299
321
288
306
5
771
789
759
781
762
780
6
789
807
7
836
858
834
853
8
897
915
9
930
948
930
952
932
949
10
962
979
966
987
11
1013
1032
Сравнение предсказанных топологий с описанием трансмембранных сегментов в 3D-структуре прототипа
Как видно, точность TMHMM и метода расчета почти вручную не очень велика, при этом их показатели примерно одинаковы. Оценка сегментов по профилю гидрофобности дает большее сверпредсказание, а TMHMM - большее недосказание.
По профилю гидрофобности
TMHMM
Всего предсказано
114
193
Из них
А. По данным ОРМ находятся внутри мембраны
83
156
В. Из них - "торчащие" из мембраны остатки на концах спиралей
14
16
С. Вообще не имеют никакого отношения к трансмембранным
спиралям
17
21
D. Число непредсказанных остатков, которые по данным ОРМ
находятся в мембране.
93
62
Точность предсказания, A/N
0,73
0,81
Сверхпредсказание, C/N
0,149
0,108
Недопредсказание, D/(L-N), где L-длина последовательности(1041)
0,104
0,073
© Низамутдинов Игорь, 2004