Мембранные белки

Четвертый семестр На главную
Функции генов и их продуктов. Онтологии, GO. Коды ферментов Метаболические пути. KEGG. Мембранные белки

Построение парного выравнивания исследуемого белка и заданного прототипа

Для начала были исследованы записи PDB и UniProt белка-прототипа на расхождения.
Было построено выравнивание этих двух аминокислотных последовательностей с помощью программы ClustalW. Если не считать удлиненной записи из PDB (которая нам не помешает), можно считать их идентичными.

После была получена через UniProt последовательность исследуемого белка.
Программой ClustalW она была выровнена с последовательность белка-прототипа, взятой из ресурса PDB.
В формате msf:
                                                                                                                                                                                                           
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                  
2 B 5 F _ A | P D B   :   M S K E V S E E A Q A H Q H G - K D Y V D P P P A P F F D L G E L K L W S F W R A A I A E F I A T L L F L Y I T V A T V I G H S K E T V V C G S V G L L G I A W A F G   :     8 2
u n i p r o t | O 6   :   M A K E G S K E V E Q Q G F A A K D Y K D P P P A A L F D V S E F K L W A F Y R A I I A E F I A T L L F L Y I T V A T V I G H K R N Q A A C G S V G L L G I A W A F G   :     8 3
                                                                                                                                                                                                           
                                                                                                                                                                                                           
                                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                        
2 B 5 F _ A | P D B   :   G M I F V L V Y C T A G I S G G H I N P A V T F G L F L A R K V S L L R A L V Y M I A Q C L G A I C G V G L V K A F M K G P Y N Q F G G G A N S V A L G Y N K G T A L   :   1 6 5
u n i p r o t | O 6   :   G M I F V L V Y C T A G I S G G H I N P A V T F G L F L A R K V S L P R A V L Y M V A Q C L G A I C G C G L V K A F Q K S Y Y D Q Y G G G A N S V A H G Y T K G V G L   :   1 6 6
                                                                                                                                                                                                           
                                                                                                                                                                                                           
                                *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                              
2 B 5 F _ A | P D B   :   G A E I I G T F V L V Y T V F S A T D P K R S A R D S H V P I L A P L P I G F A V F M V H L A T I P I T G T G I N P A R S F G A A V I F N S N K V W D D Q W I F W V G   :   2 4 8
u n i p r o t | O 6   :   S A E I I G T F V L V Y T V F S A T D P K R N A R D S H V P V L A P L P I G F A V F M V H L A T I P I T G T G I N P A R S F G A A V I Y G H Q K I W D E H W I F W V G   :   2 4 9
                                                                                                                                                                                                           
                                                                                                                                                   
                          *               2 6 0                   *               2 8 0                   *               3 0 0                    
2 B 5 F _ A | P D B   :   P F I G A A V A A A Y H Q Y V L R A A A I K A L G S F R S N P T N L E Q K L I S E E D L N S A V D H H H H H H   :   3 0 3
u n i p r o t | O 6   :   P F L G A A G A A A Y H Q Y I L R A G A I K A L G S F R S N P H V - - - - - - - - - - - - - - - - - - - - - -   :   2 8 2
                                                                                                                                                   

Разметка мембранных сегментов на выравнивании

В БД OPM было найдено описание ориентации белка-прототипа:
4 transmembrane subunits 
A - Tilt: 9° - Segments: 1(37-58), 2(75-93), 3(102-111), 4(116-137), 5(164-182), 6(199-214), 7(223-232), 8(242-261) 
B - Tilt: 10° - Segments: 1(37-58), 2(75-93), 3(102-111), 4(116-137), 5(164-182), 6(199-214), 7(223-232), 8(242-261) 
C - Tilt: 9° - Segments: 1(37-58), 2(75-93), 3(102-111), 4(116-137), 5(164-182), 6(199-214), 7(223-232), 8(242-261) 
D - Tilt: 10° - Segments: 1(37-58), 2(75-93), 3(102-111), 4(116-137), 5(164-182), 6(199-214), 7(223-232), 8(242-261) 
Условная строчка изображающая эти координаты была вставлена в выравнивание.

Предсказание топологии заданного белка с помощью программы TMHMM

                                                                                                                                                                                                           
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                  
2 B 5 F _ A | P D B   :   M S K E V S E E A Q A H Q H G - K D Y V D P P P A P F F D L G E L K L W S F W R A A I A E F I A T L L F L Y I T V A T V I G H S K E T V V C G S V G L L G I A W A F G   :     8 2
u n i p r o t | O 6   :   M A K E G S K E V E Q Q G F A A K D Y K D P P P A A L F D V S E F K L W A F Y R A I I A E F I A T L L F L Y I T V A T V I G H K R N Q A A C G S V G L L G I A W A F G   :     8 3
O P M                 :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - H H H H H H H H   :     3 0
T M H M M             :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + H H H H H   :     2 8
                                                                                                                                                                                                           
                                                                                                                                                                                                           
                                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                        
2 B 5 F _ A | P D B   :   G M I F V L V Y C T A G I S G G H I N P A V T F G L F L A R K V S L L R A L V Y M I A Q C L G A I C G V G L V K A F M K G P Y N Q F G G G A N S V A L G Y N K G T A L   :   1 6 5
u n i p r o t | O 6   :   G M I F V L V Y C T A G I S G G H I N P A V T F G L F L A R K V S L P R A V L Y M V A Q C L G A I C G C G L V K A F Q K S Y Y D Q Y G G G A N S V A H G Y T K G V G L   :   1 6 6
O P M                 :   H H H H H H H H H H H - - - - - - - - H H H H H H H H H H - - - - H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - H H   :     7 5
T M H M M             :   H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + H H H H H H H H   :     7 7
                                                                                                                                                                                                           
                                                                                                                                                                                                           
                                *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                              
2 B 5 F _ A | P D B   :   G A E I I G T F V L V Y T V F S A T D P K R S A R D S H V P I L A P L P I G F A V F M V H L A T I P I T G T G I N P A R S F G A A V I F N S N K V W D D Q W I F W V G   :   2 4 8
u n i p r o t | O 6   :   S A E I I G T F V L V Y T V F S A T D P K R N A R D S H V P V L A P L P I G F A V F M V H L A T I P I T G T G I N P A R S F G A A V I Y G H Q K I W D E H W I F W V G   :   2 4 9
O P M                 :   H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H - - - - - - - - H H H H H H H H H H - - - - - - - - - H H H H H H H   :   1 2 5
T M H M M             :   H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + H H H H H H H   :   1 2 2
                                                                                                                                                                                                           
                                                                                                                                                   
                          *               2 6 0                   *               2 8 0                   *               3 0 0                    
2 B 5 F _ A | P D B   :   P F I G A A V A A A Y H Q Y V L R A A A I K A L G S F R S N P T N L E Q K L I S E E D L N S A V D H H H H H H   :   3 0 3
u n i p r o t | O 6   :   P F L G A A G A A A Y H Q Y I L R A G A I K A L G S F R S N P H V - - - - - - - - - - - - - - - - - - - - - -   :   2 8 2
O P M                 :   H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :   1 3 8
T M H M M             :   H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :   1 3 8
                                                                                                                                                   
  • В формате Clustal
  • В формате msf
  • Вопросами отмечены участки, которые на мой взгляд прексказаны были неправильно. Не может быть такой делеции в мембранном участке.

    Оценка качества предсказания

      Число а.к. остатков
    Всего а.к. остатков 282
    Остатки, предсказанные как локализованные в мембране (всего) 138
    Правильно предсказали (true positives, TP) 111
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 27
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 117
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 27
    Чувствительность (sensivity) = TP / (TP+FN) 0.8
    Специфичность (specificity) =  TN / (TN+FP)  0.8
    Точность (precision) = TP / (TP+FP)                        0.79
    Сверхпредсказание = FP/ (FP+TP)      0.2
    Недопредсказание = FN / (TN+FN)                                            0.18
    Предсказание оказалось плохим - не были предсказаны 2 трансмембранных участка.
    ©Виктор Соколов