Главная страница Первый семестр Второй семестр Третий семестр Четвертый семестр

Занятие 10. Эволюция белков митохондриальных рибосом.

Создание обучающей выборки, построение выравнивания и профиля

  1. С помощью SRS из UniProt были получены 9 последовательностей заданного рибосомального белка L22 из митохондрий разных эукариот. Запрос:
    Description - ribosomal protein L22
    Description - 39S
    Taxonomy - eukaryota

    Все найденные последовательности сохранены в файле в формате FASTA. В двух отдельных файлах сохранены коды доступа и идентификаторы.

  2. В каждой найденной записи банка UniProt есть ссылка на базу Pfam, причем на один и тот же домен PF00237. Доменная структура белка из митохондрий человека:



    Было получено выравнивание всех доменов данного типа(1282 последовательности). Результат. Из этого выравнивания при помощи скрипта было извлечено выравнивание доменов для пяти найденных эукариотических рибосомальных белков L22 из митохондрий (п.1). Результат. При помощи программы GeneDoc в выравнивании были удалены колонки, состоящие только из гэпов.Результат.

  3. Построено выравнивание полных последовательностей найденных белков (п. 1) с помощью программы muscle на kodomo-count. Результат. Веса последовательностей выборки рассчитаны c помощью программы pfm пакета PFTOOLS.Результат.
    Полученное выравнивание в Genedoc.

  4. Выравнивание полных последовательностей в области домена полностью совпадает с выравниванием доменов, сгенерированному Pfam. Не наблюдается сдвигов последовательностей в выравнивании друг относительно друга.

  5. По взвешенному выравниванию при помощи pfmake был построен профиль, который нормировался относительно случайной базы программой autoscale. Точнее нормировался не сам профиль, а веса.
    Простой и нормированный профили отличаются значением SCORE в поле МА (СUT_OFF) и коэффициентами R1 и R2 линейной функции нормирования в поле МА (NORMALIZATION). Коэффициент R1 в нормированном профиле большой, так как найденные последовательности одинаковы.

Поиск гомологов по профилю, выбор порогового значения веса

Файлы со всеми аминокислотными последовательностями из альфа- и гаммапротеобактерий (Alphaproteobacteria.fasta, Gammaproteobacteria.fasta)можно найти в директории P:/y07/Term4/Block3.
  1. C помощью программы pfsearch пакета PFTOOLS проведен поиск гомологичных белков в обеих заданных группах бактерий. Использован нормированный вариант профиля. Каждый поиск повторен 3 раза с разными значениями порога (5.0, 10.0, 30.0). Выходные файлы сохранены (alpha5.search, alpha10.search, alpha30.search, gamma5.search, gamma10.search, gamma30.search).

  2. Для трех порогов (5,10,30) определялось количество находок с GO идентификаторами "клеточный компонент" и "рибосома", так как поиск по GO-идентификатору "large ribosomal subunit" и "small ribosomal subunit" дал очень мало находок.
    Числа занести в таблицу:

    Альфапротеобактреии Гаммапротеобактерии
    Порог 5 10 30 5 10 30
    Общее количество находок 179 64 23 549 139 1
    GO "cellular component(С)" 147 64 23 440 139 1
    GO "structural constituent of ribosome(GO:0003735)" 100 64 23 177 139 1


    С пороговым значением 30 был найден всего 1 гомолог в группе гаммапротеобактерий. С порогом 10 нашлись 64 гомолога среди альфапротеобактерий и 139 среди гаммапротеобактерий. Для порогового значения 5 обнаружено 179 гомологичных белков альфапротеобактерий и 549 - гаммапротеобактерий.
    Я провела дополнительный поиск для порогового значения 15, нашлось 64 гомолога среди альфапротеобактерий и 139 среди гаммапротеобактерий, так же как и при пороге 10.
    С пороговым значением 5 получается не очень точная выборка - число записей у гаммапротеобактерий с GO "structural constituent of ribosome" почти в 4 раза меньше от общего числа, а у гаммапротеобактерий почти наполовину меньше. При пороге 10 все найденные гомологи имеют необходимое описания GO. На основании полученных данных выбрано оптимальное значение порога - 10.

Анализ результатов

  1. По нормированному профилю был проведен поиск с пороговым значением 10. По весам находок для альфапротеобактерий и гаммапротеобактерий с помощью средств Excel была построена гистограмма, приведенная ниже. По оси абсцисс отложен вес находки, а по оси ординат - количество находок.

    Распределение нормированных весов находок в протеомах двух групп бактерий.



    Количество находок среди гаммапротеобактерий более чем в 3 раза превосходит количество находок среди альфапротеобактерий. Так как находок в целом было немного, форма распределений далека от нормального распределения, хотя у гаммапротеобактерий можно сказать, что распределение нормальное, несмотря на небольшую "волнистость". Визуально медиана распределения весов находок у гаммапротеобактерий (~22) находится левее медианы для альфапротеобактерий(~24).
    То есть, рибосомальные белки альфапротеобактерий больше удовлетворяют паттерну, а следоватьно ближе к белкам из эукариот, чем рибосомальные белки гаммапротеобактерий. Это можно проверить при помощи программы STADIA.

  2. По распределениям весов находок в двух группах бактерий в программе STADIA был выполнен тест Вилкоксона. Для дополнительной информации воспользовались функцией "Описательная статистика" (переменная х1 - альфапротеобактерии, переменная х2 - гаммапротеобактерии). Результат.
    Согласно этому анализу медиана и среднее для весов последовательностей из альфапротеобактерий выше, чем для гаммапротеобактерий; полученный результат подтверждает полученную ранее гистограмму. Таким образом, последовательности из альфапротеобактерий ближе к последовательностям рибосомальных белков L22 эукариот чем рибосомальные белки гаммапротеобактерий.

Филогенетический анализ

  1. При помощи сервера SRS было получено 6 последовательностей рибосомальных белков из Firmicutes, имеющих то же название, что и заданный белок,но разных родов. Из них была составлена внешняя группа.
    Вид запроса:
    Description - L24
    Taxonomy - Firmicutes
    Был получен файл с последовательностями из альфапротеобактерий, гаммапротеобактерий, эукариот и фирмикут.
    Выборка:
    Группа источников рибосомЧисло последовательностей
    Альфапротеобактерии64
    Гаммапротеобактерии139
    Фирмикуты6
    Митохондрии9

    Объединенное выравнивание митохондриальных белков, белков из рибосом альфа-, гаммапротеобактерий и фирмикут находится в файле.

  2. Филогенетическое дерево было построено методом максимального правдоподобия программой proml из пакета PHYLIP.

    Изображение дерева (из TreeView):


    На дереве довольно четко разделяются 4 группы: митохондриальные белки(начинаются и "eu", обведены серым цветом), белки из рибосом альфапротеобактерий (начинаются с "а", обведены зеленым), гаммапротеобактерий (начинаются с "g", обведены оранжевым) и out-группа фирмикут(начало с "fu", обведены фиолетовым).
    Если считать фирмикут корнем дерева, то видно, что сначала произошло разделение на альфапротеобактерий и гаммапротеобактерий, а потом от альфапротеобактерий отделилась группа митохондриальных белков эукариот. То есть, митохондриальные белки эукариот эволюционно ближе к альфапротеобактериям. Это подтверждает результаты 8 и 9 заданий.

  3. Определение попарных эволюционных расстояний. При помощи программы protdist пакета EMBOSS по алгоритму JTT была получена матрица попарных эволюционных расстояний для 218 исследуемых последовательностей.
    С помощью Excel была построена гистограмма распределения попарных расстояний между митохондриальными белками и белками из альфа- и гаммапротеобактерий:


    По гистограмме видно, что медиана распределения последовательностей для альфапротеобактерий лежит правее, чем для гаммапротеобактерий. То есть в среднем попарное эволюционное расстояние между митохондриями и гаммапротеобактериями меньше, чем между митохондриями и альфапротеобактериями. А это говорит о том, что эволюционно митохондрии ближе гаммапротеобактериям, что странно, так как не согласуется с ранее полученными результатами.

  4. Резюме

    Используя различные критерии, сравнивались последовательности митохондриального рибосомального белка эукариот L22 и последовательности рибосомальных белков альфапротеобактерий и гаммапротеобактерий.
    Распределение нормированных весов находок в протеомах альфапротеобактерий и гаммапротеобактерий, тест Вилкоксона и филогенетический анализ(дерево) показали, что построенному по митохондриальным белкам профилю больше удовлетворяют гомологичные белки из альфапротеобактерий. То есть, предположительно, митохондриальный белок произошел от альфапротеобактерий. Однако данные, полученные при определении попарных эволюционных расстояний, указывают на близость митохондриальных белков к гаммапротеобактериям. Такое несоответствие могло возникнуть из-за некорректной выборки.



©MARIA KUZNETSOVA,2008