Создание паттерна по выравниванию семейства белков

На страничку четвертого семестра



  1. Задание 1

  2. Найденный паттерн:
    RIBOSOMAL_L6_1, PS00525; Ribosomal protein L6 signature 1.
    [PS]-[DENS]-x-Y-K-[GA]-K-G-[LIVM]

    В заданном белке (50S ribosomal protein L6):
    MSRVGKKLLEIPSDVTVTLNDNNTVAVKGPKGELTRTFHPDMEIKVEDNVLTVARPSDQKEHRAL
    HGTTRSLLGNMVEGVSKGFERGLELVGVGYRASKSGNKLVLNVGYSHPVEIVPEEGIEIEVPSQTKV
    VVKGTDKERVGAIAANIRAVRS PEPYKGKGI RYEGEVVRRKEGKSAK

    Описание семейства паттернов:
    Рибосомальный белок L6 - один из белков большой субъединицы рибосомы. Известно, что в Escherichia coli L6 напрямую связывается с 23S РНК и находится в аминоацил-тРНК-связывающем сайте пептидилтрансфееразного центра. Он принадлежит к семейству рибосомальных белков, которые по сходству последодовательностей разделены на следующие группы:

    * Eubacterial L6.
    * Algal chloroplast L6.
    * Cyanelle L6.
    * Archaebacterial L6.
    * Marchantia polymorpha mitochondrial L6.
    * Yeast mitochondrial YmL6 (gene MRPL6).
    * Mammalian L9.
    * Drosophila L9.
    * Plants L9.
    * Yeast L9 (YL11).

    Поскольку все вышеперечисленные белки являются родственными, очень сложно выделить паттерн, который определит их все. Было решено создать 2 паттерна, первый из которых определяет eubacterial, cyanelle and mitochondrial L6, а второй - archaebacterial L6 и eukaryotic L9.

    Число ненайденных паттерном последовательностей: 0
    Число известных пропущенных последовательностей: 64
    Точность: 100,00%
    Чувствительность: 91,61%

  3. Задание 2



  4. Полученное выравнивание:



    Вырванивание в msf формате

    Полученный паттерн: [NDGASH]-X-X-[TA]-V-K-G-[PS]-[KN]-G-[ETQ]-L-[VSTE]-[ERK]
    С помощью этого паттерна было найдено 129 последовательностей среди бактерий, с помощью паттерна из Prosite найдено 137 последовательностей из Firmicutes.
    С помощью нового паттерна не найдено 17 беклков.
    Неправильно найдено 9 белков.
    Файл c оценкой находок.

    Для создании паттерна я построила выравнивание следующих последовательностей:
    Firmicutes Actinobacteria и Cyanobacteria
    BACAN,BACSU, CLOTE, ENTFA, GEOKA, FINM2 ACIC1, ARTAT, ARTS2, ACAM1, CYAA5, GLOVI, SYNR3

    Далее я смотрела, какие белки найдены лишние и какие ненайдены предполагаемыми паттернами, добавляла некоторые из них в выравнивание и улучшала паттерн.

    © Karavaeva Julia 2009