Поисковые системы.

    Сравнение поисковых систем.

  1. В поисковой системе Mrs информация представляется только в текстовом виде. Плохая структурированность таблицы мешает восприятию информации. Так же используется большое количество сокращений.
  2. SRS имеет более приятное цветовое решение. Текст не нагроможден: написаны только важные пункты. Особенно понравилась часть ссылок на статьи. Описание статей разделено по пунктам. Также радует наличие больших ссылок непосредственно на текст с указанием формата.
  3. Uniprot так же минимизирует информацию, поэтому воспринимается легче. Так же очень хорошая структура описания.
  4. Информация о последовательности в Mrs написана лишь словами. В SRS много цветных диаграмм описывающих вторичную структуру. В Uniprot есть не только диаграммы, но и посчитаны аминокислоты в последовательности.

      Работа с полем Taxonomy.

    1. bacillaceae; bacillales; bacillariaceae; bacillariales; bacillariophyceae; bacillariophycidae; bacillariophyta; bacillus.
    2. 23013 - записей о белках из организмов рода bacillus
    3. 67277 - записей о белках из организмов отдела Firmicutes

      Составление запросов.

      Формулировка функции белкаСтрока запросаКоличество найденных документов
      GTPase obgE([swissprot-Taxonomy:Firmicutes*] & ([swissprot-Description:GTPase*] & [swissprot-Description:obgE*])) 1
      GTP-binding protein obg([swissprot-Taxonomy:Firmicutes*] & (([swissprot-Description:GTP-binding*] & [swissprot-Description:protein*]) & [swissprot-Description:obg*])) 146
      OrfA([swissprot-Taxonomy:Firmicutes*] & [swissprot-Description:OrfA*]) 6
      Spo0B-associated GTP-binding protein([swissprot-Taxonomy:Firmicutes*] & (([swissprot-Description:Spo0B-associated*] & [swissprot-Description:GTP-binding*]) & [swissprot-Description:protein*])) 1
      Последовательности для запроса #3 из таблицы: fasta

      grep.

    4. grep "^AC" -c //P/y10/Term_2/Block1/Practice3/bacsu.gbk
    5. grep "^ID" -c //P/y10/Term_2/Block1/Practice3/bacsu.gbk
    6. grep "^SQ" -c //P/y10/Term_2/Block1/Practice3/bacsu.gbk
      Данные запросы равнозначны, так как эти строки уникальны для каждого белка. Результат: 18202.
      Счетчик белков с количеством статей 10-15: grep "^RN" //P/y10/Term_2/Block1/Practice3/bacsu.gbk | grep "1[012345]" -c
      Результат: 42
      © Nikolay Kondratev