|
-
нахождение общих мотивов в предложенных последовательностях (предполагаемых сигналов, узнаваемый белком PurR) с помощью сервера MEME
Для нахождения предполагаемых сигналов я ввела на сервере заданный набор последовательностей с предполагаемыми сигналами и установила следующие параметры:
- распределение количества встреч каждого мотива:"Zero or one per sequence"
- максимальная и минимальная длина мотива: по 16 (ищем мотивы строго заданной длины)
- число различных мотивов: 1
В результате этого были получены
- LOGO:
- Матрица PSSM, в которой строки соответствовали позициям в сайте, а соответствие между столбцами и нуклеотидами легко определялось по LOGO:
A C G T положительный вклад в вес дают нуклеотиды
1 137 -1010 32 -1010 R
2 183 -1010 -1010 -1010 A
3 69 -127 32 -63 R
4 -63 -1010 190 -1010 G
5 69 73 -1010 -63 M
6 169 -127 -1010 -1010 A
7 183 -1010 -1010 -1010 A
8 96 -27 -127 -63 A
9 -1010 219 -1010 -1010 C
10 -1010 -1010 219 -1010 G
11 -63 -1010 -27 118 T
12 -1010 -1010 -1010 183 T
13 -1010 -1010 -1010 183 T
14 -163 -27 132 -63 G
15 -163 205 -1010 -1010 C
16 -163 -127 173 -163 G
- Собственно предполагаемые сигналы:
имя п-ти цепь начало P-VALUE
purM - 21 6.03e-10
cvpA - 29 6.03e-10
purE - 14 6.59e-09
pyrC + 32 8.77e-09
codB - 18 4.33e-08
purL - 9 7.03e-08
purR - 40 1.08e-07
guaB + 30 1.10e-06
glnB + 16 1.83e-06
purA - 78 3.67e-06
rpiA - 41 4.22e-06
Ниже приведены те последовательности из заданныых, в которых были найдены возможные сигналы(они подчеркнуты. в случае если в таблице выше сказано, что сигнал на комплементарной последовательности, надо понимать, что я подчеркиваю комплиментарный сигналу участок.)
>purM
aaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag
>cvpA
tttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat
>purE
tgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc
>pyrC
agggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta
>codB
aaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg
>purL
ttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt
>purR
ggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa
>guaB
gatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc
>glnB
ttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc
>purA
aaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaa
>rpiA
tattttatggatgagttaaccacgcggcttgccaacggggtctgaatcgctttttttgtatataatgcgtgtgaaatttcataccacaggcgaaacgatc
Сравнение результатов с реальными сайтами узнавания PurR.
было верно определено 10 сигналов. эксперементальным путем были определены также лишь 10 сигналов. всего же предсказаний было сделано 11.
Таким образом, чувствительность=10/10=1; специфичность=10/11=0,909
|