На главную
Term3
А
Н
Н
О
Т
А
Ц
И
Я
Г
Е
Н
О
В
С помощью команд entret embl:AALF01000001 -auto и seqretAALF01000001.entret -sask получил
нуклеотидную последовательность с 112001по116000 нуклеотида из генома Yersinia intermedia.
Задание заключается в том, чтобы определить, закодированы ли в нем белки, похожие на белки из Salmonella typhimurium
Был проиндексирован протеом Salmonella typhimurium с помощью команды formatdb -i salty_proteome.fasta -p T -n st.
Для поиска белков, похожих на белки из организма Salmonella typhimurium, была использована программа BLASTX.
Потому что мы подаем на вход нуклеотидную последовательность и проводим поиск в банке данных аминокислотных
последовательностей. И анализируем мы неаннотированный участок генома, т.е. выясняем, какие белки он кодирует. Это было
выполнено с помощью команды
blastall -p blastx -d st -i aalf01000001.fasta -o stres.txt.
Результат программы: blastx нашел 74 аминокислотных последовательности, которые кодируются в поданной нами на вход нукл.
последовательности, которые близки к содержащимся в протеоме у Salmonella typhimurium (E-value < 0.001).
Характеристика лучшей находки (query - Yersinia intermedia, Sbjct - Salmonella typhimurium):
>P63359 MSBA_SALTY Lipid A export ATP-binding/permease protein msbA.
&nspb Length = 582
Score = 298 bits (764), Expect = 1e-81
Identities = 183/571 (32%), Positives = 304/571 (53%), Gaps = 4/571 (0%)
Frame = -2
Гипотетические гены
В выдаче BLASTX были найдены два гена, для них отобраны лучшие выравнивания:
С ними и была проведена работа.
После запроса в SRS получили:
ID в UniProt
|
P63359
|
Q7CQK4
|
Координаты по blastx
|
2511-811
|
3440-3985
|
ID в EMBL
|
EMBL:AE008742
|
EMBL:AE008764
|
Из таблицы и из того, что мы получили в EMBL, видим, что гены находятся далеко друг от друга (в разных веркторах!).
Следовательно, можно даже не рисовать схему расположения генов (так как они расположены далеко друг от друга).
Отчет в формате *.doc можно посмотреть здесь
© Pouliakhina
All rights reserved