1. Сбор информации о своем ферменте

1. Мой фермент: CGT_HUMAN
Его название и ЕС код установил на сайте Uniprot:
2-hydroxyacylsphingosine 1-beta-galactosyltransferase
ЕС-код 2.4.1.45

2. Расшифровка кода:
2 - Трансферазы 4 - Гликозилтрансферазы 1 - Гексозилтрансферазы 45 - 2-гидроксиацилсфингозин 1-бета-галактозилтрансферазы
(установлено посредством поиска SRS по LENZYME и сервера EC2pdb)

3. Схема реакции, катализируемой данным ферментом (с сайта EC2pdb):

2. Сохранение функции фермента у белков со сходными последовательностями

1. Всего нашлось 1360 белков
Для анализа совпадений написал простенький скрипт в питоне (так как есть проблема с bash: если написать cat ec | grep 2.4. | wc , то учтется 2.4. не только в начале ЕС-кода, но и в конце).
Белков с таким же подклассом - 215 (к примеру, bash выдавал 221)
Белков с совпавшими первыми тремя цифрами - 153 (здесь естественно мой скрипт и bash сошлись)
Полное совпадение ЕС-кодов единственно - это CGT_MOUSE
2. Использовал команду: blastp -query human.seq -db mouse -out blast_result
Нашлось 16 белков, из которых считаю лишь первые 14 гомологами исходного белка (последние четыре - малые фрагметы с e_value > 1)


Таблица показывает, что позиция в выдаче бласта явно коррелирует с сохранением функции в том или ином приближении. Данный пример ярко демонстрирует, что сходство в последовательностях влечет за собой приблизительное сходство в функциях белков.