Зачетное задание. | ||||
:Главная :Семестры :Сайт ФББ | ||||
Дано: неаннотированный фрагмент генома бактерии Yersinia mollaretii Задача: определить, закодированы ли данном фрагменте какие-либо белки, похожие на известные белки родственной бактерии (кишечной палочки). 1. Получить интересующий участок генома можно при помощи команды seqret с опцией -sask 2. Полный протеом Escherichia coli K-12 можно получить при помощи команды : sw:*_ecoli >ecoli.fasta 3.Теперь ищем закодированные белки,для этого: 1)Получим трансляцию всех открытых рамок считывания: getorf aald01000001.fasta aald01000001.orf -find 1 -table 11 minsize 240 2)Далее ищем эти белки в протеоме E.Coli,для этого: а)Создаём индексные файлы для поиска по протеому formatdb -i ecoli.fasta -p t -n ec б)Используем Blast: blastall -p blastp -d ec -i aald01000001.orf -o out.txt -e 0.001 -m 9 3)При помощи скрипта подсчитываем количество гомологов. Результаты содержатся здесь 4.Составляем таблицу предполагаемых генов 5.Cхематичное расположение на фрагменте тех открытых рамок, для которых нашлись сходные последовательности в E. coli. Гипотетические гены во фрагменте 105001-112000 записи AALD01000001(Название генов даны по гомологичным в E. coli.) 3-1019 1690-3501 3'[<= YDEM_ECOLI]--[<= SGRR_ECOLI]-------------------------------- 5'--------------------------------[=> YDIB_ECOLI]---[=> HINT_ECOLI] 3615-4430 4512-4862 ------------------------------------------------------ 5' -----[=> YCFL_ECOLI]--[=> YCFM_ECOLI][=> THIK_ECOLI]-- 3' 4964-5350 5381-5959 5919-6806 6.Взаимное расположение предполагаемых генов данного фрагмента и гомологичных им генов в геноме кишечной палочки 72644-77299 3'[<= SGRR_ECOLI]---------------------------------------- 5'----------------------[=> HINT_ECOLI]---[=> YCFL_ECOLI] 1161108-11614667 1161470-1161847 -------------------------------------------5' -----[=> YCFM_ECOLI]--[=> THIK_ECOLI]------3' 1161861-1162502 1162483-1163307Итак, заметим что, hint, ycfl, ycfm, thik расположены друг за другом в обоих геномах на относительно небольших расстояниях,следовательно можно утверждать,что такое расположение имеет функциональный смысл в работе этих генов. |
||||
©Кирилин Евгений,2007 |