Самостоятельная работа
На главную
Назад
Самостоятельная работа
Задача:определить, где на заданном фрагменте закодированы белки, похожие на белки из Bacillus subtilis.
Данный фрагмент - AAGY02000001, начало 1, конец 7000.
- Получим полный протеом бактерии Bacillus subtilis, выполним команду seqret 'sw:*_BACSU'. Получим файл bacsu.fasta
- Получим заданный участок, для этого спомощью команды seqret -sask выбирая соответствующий начало и конец последовательности (1-7000).
врезультате получим файл aa.fasta.
- Используя getorf извлекаем из фрагмента генома трансляции всех открытых рамок считывания
длинной не менее 240 нуклеотидов.Для этого введем команду: getorf -sequence aa.fasta -minsize 240 -table 11 -find 1 -outseq aaorf.orf
на выходе получим файл aaorf.orf, параметр -table 11 (Bacterial),означает поиск по бактериям
-minsize 240 - минимальная длинна 240 нуклеотидов).
- Для дальнейшего поиска по геному бактерии, создадим индексные файлы генома.
Для этого введем: formatdb -i bacsu.fasta -p F -n bs
- Можем проводить поиск для этого:
makeblastdb –in bacsu.fasta –dbtype prot –out bacsu
blastp –query aaorf.orf –db bacsu –evalue 0.001 –task blastp –out blastp1 –outfmt 7
на выходе получим файл blastp1 в котором содержатся наши находки
- Занесем результаты в таблицу credit
Гипотетические гены во фрагменте записи AAGY02000001 (1-7000)
3' -[<=RECA_BASCU 76-1239]--[<=CINA_BACSU 1297-2250]-[<=LYAT_BACSU 2638-3651]-[<=YYAR_BACSU 3662-4177]-[<=YDIB_BASCU 4170-4610]----5'
5' --------------------------------------------------------------------------------------------------------------------------------3'
Положение гипотетических генов в геноме
Найдем в записи embl соответствующие координаты для полученных генов:
ydiB 641654..642130
yyaR 4185160..4185681 complement
cinA 1763222..1764472
recA 1764645..1765691
lytR 3663281..3664201
3'-------[<=YYAR_BACSU 4185160..4185681]----------------------------------------------------------------------------------------------------------5'
5'---[=>YDIB_BASCU 641654..642130]------[=>CINA_BACSU 1763222..1764472]-[=>RECA_BASCU 1764645..1765691]----------[=>LYAT_BACSU 3663281..3664201]--3'
Сразу бросается в глаза направления - для фрагмента Streptococcus pneumoniae характерно обратное направление,
для генома Bacillus subtilis - прямое (исключение YYAR_BACSU), скорее всего различия возникли из-за того,
что при исследовании геномов, "базовое" направление задавалось разное, т.о. я считаю, что только YYAR_BACSU перепрыгнул на другую цепь.. Расположение генов сильно отличается,
интервалы между генами B.subtilis и S.pneumoniae заметно отличаются. Во фрагменте
сенной палочки расположение генов довольно плотное посравнению с геномом B.subtilis - максимальный интервал составляет 387 п.о. между
CINA_BASCU и LYAT_BACSU. Перекрывание присутствует во фрагменте: между YYAR_BASCU и YDIB_BASCU, составляет 8 п.о. (возможно
ошибка blast'a)
©Базылев Сергей, 2007