Учебный сайт
Главная Семестры Проекты Обо мне

Сравнение поисковых систем SRS, MRS и UniProt:
При сравнении данных о белке BCCP_ECOLI из поисковых систем SRS, MRS и UniProt более удобными и приятными для глаза мне показались системы MRS и UniProt, хотя в SRS есть несколько удобных функций, отсутствующих в двух других поисковых системах.

Структура расположения данных о белке в SRS и MRS во многом схожа, порядок расположения полей с информацией о белке одинаков (однако в SRS, в отличие от MRS, есть поля Protein Existence и Keywords). Приятно, что в SRS указаны различные источники для получения статей, в которых идет речь о белке (плюс для каждой статьи есть метка с пояснением, находится ли она в открытом доступе или нет).

Структура поисковой ситемы UniProt отличается от структур SRS и MRS. Ее преимущество перед двумя другими системами в подробном разборе полей (поле Keywords), функций, в расшифровке сокращений (например, GO - gene ontology). К тому же в этой поисковой системе присутствует поле Relevant documents, что очень удобно при работе с этим белком.

Вместе с системой SRS их объединяет наглядная расшифровка поля Features, хотя в SRS все характерные участки цепи собраны на одной схеме, а в UniProt каждый участок на отдельной. Также в Uniprot удобно то, что вся информация о вторичной структуре вынесена на отдельную схему.

Интерфейс системы SRS мне кажется менее понятным и доступным, чем в двух других системах.


Сведения, полученные из раздела таксономии поисковой системы SRS:
В базе данных SwissProt с gam начинаются названия таксонов:
  • gambusia
  • gammaherpesvirinae
  • gammapapillomavirus
  • gammaproteobacteria
  • gammaretrovirus
  • gammaridea
Английским аналогом названия Гамма-протеобактерия является Gammaproteobacteria.
На запрос [swissprot-Taxonomy:Gammaproteobacteria*] было найдено 83513 записей (о белках из Гамма-протеобактерий в SwissProt).

Примеры запросов в SRS о белках из Гаммапротеобактерий, похожих на BCCP_ECOLI.
Формулировка функции белка Строка запроса Количество найденных документов
Синтез жирных кислот ([swissprot-Taxonomy:Gammaproteobacteria*] & (([swissprot-AllText:fatty*] & [swissprot-AllText:acid*]) & [swissprot-AllText:biosynthesis*])) 564
Связывается с биотином ([swissprot-Taxonomy:Gammaproteobacteria*] & ([swissprot-AllText:biotin*] & [swissprot-AllText:binding*])) 67
Есть какая-либо связь с ацетилКоАкарбоксилазой ([swissprot-Taxonomy:Gammaproteobacteria*] & ((([swissprot-AllText:acetyl*] & [swissprot-AllText:coenzyme*]) & [swissprot-AllText:A]) & [swissprot-AllText:carboxylase*])) 236
Синтез липидов ([swissprot-Taxonomy:Gammaproteobacteria*] & ([swissprot-AllText:Lipid*] & [swissprot-AllText:synthesis*])) 437
Результаты поиска по запросу ([swissprot-Taxonomy:Gammaproteobacteria*] & ([swissprot-AllText:biotin*] & [swissprot-AllText:binding*])) были сохранены в формате fasta. Посмотреть их можно тут: Посмотреть


Поиск в базе данных Medline:
В базе данных Medline было найдено 13 статей за 2007-2009 годы, содержащих в своей аннотации имя белка Biotin carboxyl carrier protein (текст запроса - ([medline-Year#2007:2009] & ((([medline-Abstract:Biotin*] & [medline-Abstract:carboxyl*]) & [medline-Abstract:carrier*]) & [medline-Abstract:protein*])).

Также в этой системе был осуществлен поиск статей 70-х годов, автором которых был Нейфах А.А. Так как латинское написание фамилии было неизвестно, запрос был составлен с использованием *: ([medline-Year#1970:1979] & [medline-Authors:N*fa*h,A.A*]). В результате было найдено 27 статей, а фамилия автора на латинице пишется Neyfakh. А.А. Нейфах - советский ученый, работавший в области генетики, эмбриологии, изучавший поведение РНК во время митоза, рание стадии развития эмбрионов и связанные с процессы.
Ни одна из статей не находится в открытом доступе, кроме того, лишь у 10 (написанных во второй половине 70-х) есть аннтотации.

© Яшина 2009