Эволюция белков митохондриальных рибосом

  1. Поиск бактериальных гомологов среди альфа- и гаммапротеобактерий по нормированному профилю белков S7 митохондриальных рибосом
  2. Общая характеристика обучающей выборки
  3. Запрос в SRS по БД Uniprot:
    Taxonomy: Eukaryota
    Keywords: Mitochondrion & Ribosomal
    Description: 28S & S7
    По данному запросу найденно 10 белков. С помощью БД Pfam определим доменную структуру найденных нами белков.

    На картинке серым цветом схематично изображена полная последовательность белка, а зелёным цветом выделен домен, показано его положение в последовательности. Для последовательности RT07_HUMAN длина домена - 94 а.к., Pfam ID - PF00177.
    Получим выравнивание всех последовательностей, содержащих данный домен, отберём только нужные нам (из 10 останется 9, т.к. домен последовательности RT07_XENLA "разорван". Сравним полученное выравнивание со взвешенным выравниванием muscle для полных последовательностей всех 10 белков. Поскольку выравнивание muscle строилось для меньшей выборки, оно имеет меньшее число гэпов, и представляется более правильным, тем более, что в области домена выравнивания совпадают на 95%, а выравнивание Pfam содержит много гэпов за счёт сильного различия длин доменных структур.

  4. Краткое описание и сравнение простого и нормированного профилей.
  5. С помощью программы pfmake по взвешенному выравниванию посмтроим обычный профиль, а затем нормируем его относительно случайной базы. Заметим, что пофили отличаются по полям CUT_OFF, где для простого профиля величина порога поиска примерно на 200 единиц больше, чем для нормированного, и NORmALIZATION, где в простом профиле коэффициенты нормирования равны 0 и 0,1, а для нормированного - 1,5167 и 0,01049434.

  6. Обоснование выбора порога
  7. При поиске гомологов белков среди альфа- и гаммапротеобактерий устанавливались разные пороги: 5.0, 10.0 и 30.0. Сведения о найденных гомологах находятся в Табл.1.

    Порог 5.0   10.0   30.0  
      alpha gamma alpha gamma alpha gamma
    Общее число находок 153 333 76 142 30 0
    Количество находок с GO идентификатором "структурная единица рибосомы" 82 162 76 142 30 0
    Табл. 1. Результаты поиска по двум группам бактерий с разными значениями порога

    Для того, чтобы определить, какой порог будем использовать при поиске, проанализаруем полученные данные. Видно, что порог в 10.0 позволяет найти все интересующие нас белки среди обеих групп (в отличие от порога в 30.0) и не захватить лишние (в отличие от порога в 5.0). Фильтр найденных последовательностей производился с помощью алгоритма, реализованного на языке программирования perl, поиск осуществлялся по идентификатору GO:0003735 (structural constituent of ribosome). Табличные данные позволяют определить порог, не расширяя поиск на все клеточные элементы.

  • Анализ данных
    1. Распределение нормированных весов находок в протеомах двух групп бактерий

    2. На приведённых гистограммах можно увидеть распределение весов найденных белков среди альфа- и гаммапротеобактерий. При сравнении гистограмм заметно, что веса находок среди альфапротеобактерий больше, чем среди гаммапротеобактерий; при том, что число находок среди гаммапротеобактерий почти в 2 раза больше, диапазон распределения весов среди альфапротеобактерий больше.
      Рабочие файлы:

    3. Тест Вилкоксона
    4. Для сравнения выборок полученных весов был проведён тест Вилкоксона. Результаты теста представлены ниже:

      Вилкоксон=1.06E4, Z=-5.123, Значимость=0, степ.своб = 76,142
      Гипотеза 1: <Есть различия между медианами выборок>

      Сравним медианы каждой из выборок с помощью описательной статистики:

      Alpha:                                                                  Gamma:                                                              
                                                                                                                                        
      Размер  <---Диапазон--->  Среднее---Ошибка  Дисперс  Ст.откл   Сумма    Размер  <---Диапазон--->  Среднее---Ошибка  Дисперс  Ст.откл   Сумма
         76    19.86       33    28.42   0.3606    9.884    3.144     2160      142    16.88    29.64    27.89   0.1289     2.36    1.536     3960
                                                                                                                                                  
      Медиана   <--Квартили-->  ДовИнтСр. <-ДовИнтДисп->  Ош.СтОткл           Медиана   <--Квартили-->  ДовИнтСр. <-ДовИнтДисп->  Ош.СтОткл       
       29.45    26.73    30.27    0.709    8.254    9.884   0.8976             28.16    27.58    28.56   0.2515    1.377    1.377   0.3747        
                                                                                                                                                  
      Асимметр. Значим  Эксцесс   Значим                                      Асимметр. Значим  Эксцесс   Значим                                  
       -1.253        0    3.658   0.0742                                       -4.808        0    33.65        0                                  
      
      Различия, замеченные нами при построении гистограмм подтвердил тест Вилкоксона. Проанализировав данные описательной статистики о различии между средним значением и медианой, можно заключить, что выборка из альфапротеобактерий ближе к изучаемой выборке.

    5. Филогенетический анализ рибосомальных белков S7 из эукариотических митохондрий и 3-х групп бактерий
    6. Получим fasta-последовательности белков по выбранным нами идентификаторам для альфа- и гаммапротеобактерий. С помощью поиска SRS получим также последовательности белков из рибосом фирмикут. Объединив все полученные последовательности с исходными митохондриальными построим множественное выравнивание с помощью muscle .

      Описание выборки в виде таблицы:
       
      Группа источников рибосом    Число последовательностей    
      
      альфапротеобактерии                    76                    
      
      гаммапротеобактерии                   142                      
      
      фирмикуты                               7
      
      митохондрии                            10
      
      На основе построенного выравнивания методом максимального правдоподобия построим филогенетическое дерево для всех белков:

      На представленном дереве последовательности из митохондрий эукариот обозначены буквой "m", белки из альфа- и гаммапротеобактерий - буквами "a" и "g" соответсвтенно, из фирмикут - "f". Длина ветвей сохранена, расстояния не отображаются.
      За исключением двух веток с гаммапротеобактериями, все последовательности из этой группы сосредоточены на одном конце дерева, группа из фирмикут находится на отдельной ветке, а группа митохондриальных белков ближе к группе альфапротеобактерий, что подтверждает существующее мнение о том, что митохондриальные белки произошли от белков альфапротеобактерий.
      Определим попарные эволюционнные расстояния между группой митохондриальных белков и группами белков из протеомов альфа- и гаммапротеобактерий с помощью программы protdist пакета phylip.
      Ниже приведены гистограммы распределений этих расстояний:


      Можно заметить, что медианы распределений для альфа- и гаммапротеобактерий лежат в одном интервале, лишь для гаммапротеобактерий существует хвост нормального распределения, что достаточно любопытно, возмозжно, это объясняется тем, что гаммапротеобактерии удалены от остальных групп сильнее всего, поэтому расстояние в районе 1,5 столь "популярно". Рабочий файл:

    7. Вывод
    8. Таким образом, по результатам проделанной работы, можно заключить, что наши исследования подтверждают мнение о том, что митохондриальные белки эукариот ближе к альфапротеобактериям, чем к гаммапротеобактериям. На это указывают результаты описательной статистики, построенное дерево и гистограмма попарных расстояний, на которой заметно, что гаммапротеобактерии удалены от эукариотических белков сильнее, чем альфапротеобактерии. При этом, нельзя считать полученные нами результаты абсолютно правильными, в силу малой выборки эукариотических белков, большой разницы между выборками, например, из гаммапротеобактерий и митохондрий эукариот.

    Назад

    На главную


    ©Степанова Вита