Зачетное задание.
 :Главная   :Семестры   :Сайт ФББ
Зачетное задание.

Дано: неаннотированный фрагмент генома бактерии Yersinia mollaretii
Задача: определить, закодированы ли данном фрагменте какие-либо белки, похожие на известные белки родственной бактерии (кишечной палочки).
1. Получить интересующий участок генома можно при помощи команды 
        seqret с опцией -sask
2. Полный протеом Escherichia coli K-12 можно получить при помощи команды :
sw:*_ecoli >ecoli.fasta
3.Теперь ищем закодированные белки,для этого:
  1)Получим трансляцию всех открытых рамок считывания:
   getorf aald01000001.fasta aald01000001.orf -find 1 -table 11 minsize 240
  2)Далее ищем эти белки в протеоме E.Coli,для этого:
   а)Создаём индексные файлы для поиска по протеому
    formatdb -i ecoli.fasta -p t -n ec
   б)Используем Blast:
    blastall -p blastp -d ec -i aald01000001.orf -o out.txt -e 0.001 -m 9
  3)При помощи скрипта подсчитываем количество гомологов.
   Результаты содержатся здесь 
4.Составляем таблицу предполагаемых генов
5.Cхематичное расположение на фрагменте тех 
открытых рамок, для которых нашлись сходные последовательности в E. coli.
 
   Гипотетические гены во фрагменте 105001-112000 записи AALD01000001(Название генов 
  даны по гомологичным в E. coli.)
 
        3-1019           1690-3501
3'[<= YDEM_ECOLI]--[<= SGRR_ECOLI]--------------------------------

5'--------------------------------[=> YDIB_ECOLI]---[=> HINT_ECOLI]
                                      3615-4430         4512-4862           




------------------------------------------------------ 5'

-----[=> YCFL_ECOLI]--[=> YCFM_ECOLI][=> THIK_ECOLI]-- 3'
          4964-5350       5381-5959      5919-6806



6.Взаимное расположение предполагаемых генов данного фрагмента и гомологичных 
им генов в геноме кишечной палочки

           
           
    72644-77299
3'[<= SGRR_ECOLI]----------------------------------------

5'----------------------[=> HINT_ECOLI]---[=> YCFL_ECOLI]
                        1161108-11614667  1161470-1161847


                                  
-------------------------------------------5'

-----[=> YCFM_ECOLI]--[=> THIK_ECOLI]------3'
     1161861-1162502  1162483-1163307    

Итак, заметим что, hint, ycfl, ycfm, thik расположены друг за другом в обоих геномах на относительно небольших расстояниях,следовательно можно утверждать,что такое расположение имеет функциональный смысл в работе этих генов.
©Кирилин Евгений,2007