На главную
Term3

А Н Н О Т А Ц И Я
Г Е Н О В


С помощью команд entret embl:AALF01000001 -auto и seqretAALF01000001.entret -sask получил нуклеотидную последовательность с 112001по116000 нуклеотида из генома Yersinia intermedia.
Задание заключается в том, чтобы определить, закодированы ли в нем белки, похожие на белки из Salmonella typhimurium
Был проиндексирован протеом Salmonella typhimurium с помощью команды formatdb -i salty_proteome.fasta -p T -n st.
Для поиска белков, похожих на белки из организма Salmonella typhimurium, была использована программа BLASTX. Потому что мы подаем на вход нуклеотидную последовательность и проводим поиск в банке данных аминокислотных последовательностей. И анализируем мы неаннотированный участок генома, т.е. выясняем, какие белки он кодирует. Это было выполнено с помощью команды blastall -p blastx -d st -i aalf01000001.fasta -o stres.txt.
Результат программы: blastx нашел 74 аминокислотных последовательности, которые кодируются в поданной нами на вход нукл. последовательности, которые близки к содержащимся в протеоме у Salmonella typhimurium (E-value < 0.001).
Характеристика лучшей находки (query - Yersinia intermedia, Sbjct - Salmonella typhimurium):

>P63359 MSBA_SALTY Lipid A export ATP-binding/permease protein msbA. &nspb Length = 582
Score = 298 bits (764), Expect = 1e-81
Identities = 183/571 (32%), Positives = 304/571 (53%), Gaps = 4/571 (0%)
Frame = -2

Гипотетические гены

В выдаче BLASTX были найдены два гена, для них отобраны лучшие выравнивания:

С ними и была проведена работа. После запроса в SRS получили:
ID в UniProt P63359 Q7CQK4
Координаты по blastx 2511-811 3440-3985
ID в EMBL EMBL:AE008742 EMBL:AE008764

Из таблицы и из того, что мы получили в EMBL, видим, что гены находятся далеко друг от друга (в разных веркторах!). Следовательно, можно даже не рисовать схему расположения генов (так как они расположены далеко друг от друга).

Отчет в формате *.doc можно посмотреть здесь


© Pouliakhina
All rights reserved