Четвёртый семестр

Описание базы данных LGIC

Цель упражнения — научится самостоятельно пользоваться незнакомой базой данных.

logo

Выбранная база: Ligand-gated ion channel subunit sequences database (LGIC)

БД LGIC посвящена управляемым лигандами ионным каналам.

База основана Николасом Новером (Nicolas Le Novére), группой Жан-Пьера Чанжу (Jean-Pierre Changeu) и Катриной Летондаль (Catherine Letondal) из университета Пастера. Сейчас она поддерживается в отделении Вычислительной нейробиологии Европейского биоинформатического института Николасом Новером и Марко Донизелли (Marco Donizelli). Мари-Анже Жите (Marie-Ange Djite) помогла перенести базу из института Пастера и организовать поиск. Поиск по сходству последовательности (FASTA similarity search) поддерживается группой внешней поддержки Европейского биоинформатического института.

Управляемые лигандами ионные каналы - трансмембранные белки, способные принимать различные конформации, по крайней мере при одной из которых белок образует пору, соединяющую разные стороны мембраны. Переход между конформациями осуществляется при присоединении лиганда.

БД не является автоматически сгенерированной. Сейчас она насчитывает 526 записей для лиганд-активируемых ионных каналов. При создании базы, сайта и поисковой системы использовались следующие программы: GNU emacs, ClustalW, FASTA, Phylip, bioperl, Xindice и Jakarta Tomcat.

Заходя на главную страницу, мы видим, кроме описания базы, ссылки на страницы трёх типов ионных каналов и ссылки на поиск по последовательности и по ключевому слову. Типы каналов — это: рецепторы cys-loop суперсемейства (например, никотиновые), состоят из пяти субъединиц; АТФ зависимые каналы, состоят из трёх субъединиц; глутамат-активируемые катионные каналы (например NMDA рецепторы), состоят из четырёх субъединиц. Пройдя по ссылке, мы получим список содержащихся в БД субъединиц данного типа. Для каждой можно получить последовательность гена, белка и/или транслита, а также посмотреть анализ филогении и ссылки на организм и белок/ген в NCBI, а для некоторых — ещё на документ в SWISSPROT или других баз данных.

В базе собраны, по-видимому, все известные белки лиганд-активируемых ионных каналов, однако по мере секвенирования генов этих белков у других организмов она может значительно расшириться.

Кроме поиска по последовательности, предусмотрен также поиск по ключевым словам. При этом выдаётся поле ввода для быстрого поиска и поля для прогрессивного поиска, возможен поиск по: описанию, LGIC идентификатору, локусу, организму, другим ресурсам, ссылкам, последовательности, типу. К сожалению, в каждое поле можно ввести только одно слово (но количество полей не ограничено), и все они могут быть разделены либо только через "и", либо только через "или".

Пробный запрос:

Результат: найдены 5-HT3 рецепторы мыши 5HT3Amumu и 5HT3Bmumu; результат делится на белки, транскрипты и гены (в моём случае для обеих записей в базе есть и белок, и транскрипт, и ген). Со странички результата можно сразу просмотреть или сохранить выбранные последовательности.

Второй пробный запрос:

Найдено 33 записи.
По этому запросу найдены все гистаминовые и серотониновые рецепторы, а также записи для Шпорцевых лягушек (Xenopus) и рецепторы, гены которых находятся в P12 локусе.

Моё мнение о базе данных:
База данных весьма удобная, однако рассчитана на узкий круг пользователей. Хотя есть и минусы: поиск не поддерживает сложные запросы, ссылки на некоторые документы UniProt не работают.