Занятие 3. Программы пакета BLAST для работы с нуклеотидными последовательностями

  1. Создание индексных файлов для программ пакета BLAST
  2. Я создала индексные файлы по геномам Salmonella typhimurium, Xanthomonas campestris, Pasteurella multocida.

  3. Поиск в геноме участков, кодирующих белки, похожие на заданный
  4. Поиск гомологов TIG_ECOLI Геном Xanthomonas campestris
    Число находок с Е-value<0,001 1
    Характеристика лучшей находки: >AE012195 AE008922 |AE012195| Xanthomonas campestris pv. campestris str. ATCC 33913, section 103 of 460 of the complete genome. Length = 10083  
      E-value находки 4e-60
      AC соответствующей записи EMBL AE012195
      координаты выравнивания в записи EMBL 3079-4278
      Координаты CDS в записи EMBL 3079..4371
      AC UniProt в записи EMBL Q8PBY7
     Геномы Salmonella typhimurium, Xanthomonas campestris, Pasteurella multocida
     E-value лучшей находки 1e-59
    Общее число находок с Е-value<0,0014
    AC соответствующей записи EMBLAE008716
    координаты выравнивания(-ий) в записи генома 9820-11115

    При сравнении e-value находок можно заметить, что e-value двух первых белков довольно сильно отличаются (1-го 4e-60, а 2-го 0.002).Я думаю это достаточные основания считать этот белок гомологом TIG_ECOLI. При поиске по всем геномам отличие e-value лучшей находки меняется от 4e-60 до 1e-59, это говорит о том, что программа находит гомологов с довольно высокой точностью даже при увеличении или уменьшении базы данных.

    Поиск одновременно по нескольким геномам дал следующие результаты

    см.здесь

  5. Поиск гомологов с помощью программы BLASTN
  6.  >Из xanthomonas первым стоит AE012505, выравнивание которого приведено выше
    AE008922 |AE012418| Xanthomonas campestris pv. campestris
                 str. ATCC 33913,  section 326 of 460 of the complete
                 genome.
               Length = 10118
    
      Score = 32.2 bits (16), Expect = 1.0
     Identities = 16/16 (100%)
      Strand = Plus / Minusv
    
                                
     Query: 194  acgttctgggtgacct 209
                ||||||||||||||||
     Sbjct: 1915 acgttctgggtgacct 1900
    

    AE008716 в этом случае также стоит на первом месте, но его e-value ухудшилось сильно.AE012195 вообще в списке отсутствует. Из xanthomonas первым стоит AE008922 (выравниванеи выше)


    © Марина, Головастова ©:Головастова Марина