МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В.ЛОМОНОСОВА
ФАКУЛЬТЕТ БИОИНЖЕНЕРИИ И БИОИНФОРМАТИКИ

Домашняя страничка Ильи Курочкина

Главная

I Семестр

II Семестр

III Семестр

Проекты

Обратная Связь

Работа с сервером MEME

  • 1. Нахождение общего мотива в предложенных последовательностях.

    На сервере MEME был выполнен поиск общего мотива среди последовательностей из файла, содержащего последовательности ДНК E.coli, находящимися перед генами, регулируемыми белком PurR (пуриновым репрессором).

    Параметры поиска MEME:

    • распределение количества встреч каждого мотива:"Zero or one per sequence"
    • максимальная и минимальная длина мотива: по 16 (поиск мотивов со строго заданной длиной)
    • число различных мотивов: 1

    В результате чего были получены, следующие результаты:

    LOGO

    Позиционно-спецефическая весовая матрица (PSSM)

    Номера позиций мотива A C G T Буква, отвечающей множеству нуклеотидов, дающих положительный вклад в вес
    1 121 -982 65 -982 R
    2 180 -982 -982 -982 A
    3 21 -94 65 -37 R
    4 -982 -982 223 -982 G
    5 63 138 -982 -982 M
    6 180 -982 -982 -982 A
    7 180 -982 -982 -982 A
    8 121 -94 -982 -37 A
    9 -982 223 -982 -982 C
    10 -982 -982 223 -982 G
    11 -137 -982 6 121 K
    12 -982 -982 -982 180 T
    13 -982 -982 -982 180 T
    14 -37 -94 106 -37 G
    15 -982 223 -982 -982 C
    16 -137 -94 187 -982 G

    Таблица найденных мотивов

    Имя последовательности Цепь Координата первого нуклеотида
    purM - 21
    cvpA - 29
    purE - 14
    pyrC + 32
    codB - 18
    purR + 38
    purL - 9
    guaB + 30
    glnB + 16

    Исходные последовательности с подчеркнутыми мотивами

    >purM
    aaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag
    >cvpA
    tttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat
    >purE
    tgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc
    >pyrC
    agggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta
    >codB
    aaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg
    >purR
    ggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa
    >purL
    ttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt
    >guaB
    gatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc
    >glnB
    ttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc
    

  • 2. Сравнение результатов с реальными сайтами узнавания PurR.

    С помощью МЕМЕ были найдены мотивы в 9 из 17 последовательностей. Предсказанные сайты всех этих последовательностей совпадают с реальными сайтами.
    Число реальных сайтов: 10
    Число правильных предсказаний: 9
    Общее число предсказаний: 9
    Чувствительность равняется 0,9
    Специфичность равняяется 1
    Во всех случаях правильных предсказаний координаты сайтов, предсказанных MEME были сдвинуты на 1 нуклеотид относительно реальных (влево для прямой цепи, вправо для обратной).


© 2008, Илья Курочкин