На главную страницу четвертого семестра

Сравнение ферментов с одинаковым кодом из эволюционно далеких организмов


С помощью запроса :

"([swissprot-ECNumber:1.1.1.22*] & (([swissprot-ID:*_Ecoli*] | [swissprot-ID:*_Human*]) | [swissprot-ID:*_Metja*])) "
было найдено 5 ферментов с кодом 1.1.1.22. Для четырёх ферментов обнаружены 3 гомологичных домена Pfam.



Для получения аминокислотных последовательностей доменов и определения их попарной идентичности были использованы приведенные ниже скрипты.

Первый скрипт позволил заполучить нужные для дальнейшей работы последовательности:

seqret sw:UDG5_ECOLI -sbegin 5 -send 183 -outseq UDG5_ECOLI_21.fasta
seqret sw:UDG5_ECOLI -sbegin 194 -send 287 -outseq UDG5_ECOLI_84.fasta
seqret sw:UDG5_ECOLI -sbegin 308 -send 386 -outseq UDG5_ECOLI_20.fasta
seqret sw:UDG8_ECOLI -sbegin 1 -send 179 -outseq UDG8_ECOLI_21.fasta
seqret sw:UDG8_ECOLI -sbegin 190 -send 283 -outseq UDG8_ECOLI_84.fasta
seqret sw:UDG8_ECOLI -sbegin 304 -send 382 -outseq UDG8_ECOLI_20.fasta
seqret sw:UDG_ECOLI -sbegin 1 -send 179 -outseq UDG_ECOLI_21.fasta
seqret sw:UDG_ECOLI -sbegin 190 -send 283 -outseq UDG_ECOLI_84.fasta
seqret sw:UDG_ECOLI -sbegin 304 -send 382 -outseq UDG_ECOLI_20.fasta
seqret sw:UGDH_HUMAN -sbegin 5 -send 204 -outseq UDGH_HUMAN_21.fasta
seqret sw:UGDH_HUMAN -sbegin 213 -send 310 -outseq UDGH_HUMAN_84.fasta
seqret sw:UGDH_HUMAN -sbegin 332 -send 447 -outseq UDGH_HUMAN_20.fasta


Второй скрипт позволил построить попарные выравнивания и сохранить их в формате msf:

needle UDG_ECOLI_20.fasta UDG5_ECOLI_20.fasta -aformat msf 1_4.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_20.fasta UDG8_ECOLI_20.fasta -aformat msf 1_7.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_20.fasta UDGH_HUMAN_20.fasta -aformat msf 1_10.msf -gapopen 10.0 -gapextend 0.5
needle UDG5_ECOLI_20.fasta UDG8_ECOLI_20.fasta -aformat msf 4_7.msf -gapopen 10.0 -gapextend 0.5
needle UDG5_ECOLI_20.fasta UDGH_HUMAN_20.fasta -aformat msf 4_10.msf -gapopen 10.0 -gapextend 0.5
needle UDG8_ECOLI_20.fasta UDGH_HUMAN_20.fasta -aformat msf 7_10.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_21.fasta UDG5_ECOLI_21.fasta -aformat msf 2_5.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_21.fasta UDG8_ECOLI_21.fasta -aformat msf 2_8.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_21.fasta UDGH_HUMAN_21.fasta -aformat msf 2_11.msf -gapopen 10.0 -gapextend 0.5
needle UDG5_ECOLI_21.fasta UDG8_ECOLI_21.fasta -aformat msf 5_8.msf -gapopen 10.0 -gapextend 0.5
needle UDG5_ECOLI_21.fasta UDGH_HUMAN_21.fasta -aformat msf 5_11.msf -gapopen 10.0 -gapextend 0.5
needle UDG8_ECOLI_21.fasta UDGH_HUMAN_21.fasta -aformat msf 8_11.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_84.fasta UDG5_ECOLI_84.fasta -aformat msf 3_6.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_84.fasta UDG8_ECOLI_84.fasta -aformat msf 3_9.msf -gapopen 10.0 -gapextend 0.5
needle UDG_ECOLI_84.fasta UDGH_HUMAN_84.fasta -aformat msf 3_12.msf -gapopen 10.0 -gapextend 0.5
needle UDG5_ECOLI_84.fasta UDG8_ECOLI_84.fasta -aformat msf 6_9.msf -gapopen 10.0 -gapextend 0.5
needle UDG5_ECOLI_84.fasta UDGH_HUMAN_84.fasta -aformat msf 6_12.msf -gapopen 10.0 -gapextend 0.5
needle UDG8_ECOLI_84.fasta UDGH_HUMAN_84.fasta -aformat msf 9_12.msf -gapopen 10.0 -gapextend 0.5


С помощью третьего скрипта были установлены проценты идентичности:

needle UDG_ECOLI_20.fasta UDG5_ECOLI_20.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" > 20.water
needle UDG_ECOLI_20.fasta UDG8_ECOLI_20.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 20.water
needle UDG_ECOLI_20.fasta UDGH_HUMAN_20.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 20.water
needle UDG5_ECOLI_20.fasta UDG8_ECOLI_20.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 20.water
needle UDG5_ECOLI_20.fasta UDGH_HUMAN_20.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 20.water
needle UDG8_ECOLI_20.fasta UDGH_HUMAN_20.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 20.water
needle UDG_ECOLI_21.fasta UDG5_ECOLI_21.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" > 21.water
needle UDG_ECOLI_21.fasta UDG8_ECOLI_21.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 21.water
needle UDG_ECOLI_21.fasta UDGH_HUMAN_21.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 21.water
needle UDG5_ECOLI_21.fasta UDG8_ECOLI_21.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 21.water
needle UDG5_ECOLI_21.fasta UDGH_HUMAN_21.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 21.water
needle UDG8_ECOLI_21.fasta UDGH_HUMAN_21.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 21.water
needle UDG_ECOLI_84.fasta UDG5_ECOLI_84.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" > 84.water
needle UDG_ECOLI_84.fasta UDG8_ECOLI_84.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 84.water
needle UDG_ECOLI_84.fasta UDGH_HUMAN_84.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 84.water
needle UDG5_ECOLI_84.fasta UDG8_ECOLI_84.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 84.water
needle UDG5_ECOLI_84.fasta UDGH_HUMAN_84.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 84.water
needle UDG8_ECOLI_84.fasta UDGH_HUMAN_84.fasta -gapopen 10.0 -gapextend 0.5 stdout | grep "# Identity:" >> 84.water

Пары доменов имеют следующие проценты Identity:

Парa доменовIdentity
UDG_ECOLI_20 — UDG5_ECOLI_20 73.4%
UDG_ECOLI_20 — UDG8_ECOLI_20 100.0%
UDG_ECOLI_20 — UDG_HUMAN_20 14.7%
UDG5_ECOLI_20 — UDG8_ECOLI_20 73.4%
UDG5_ECOLI_20 — UDG_HUMAN_20 15.3%
UDG8_ECOLI_20 — UDG_HUMAN_20 14.7%
UDG_ECOLI_21 — UDG5_ECOLI_21 67.6%
UDG_ECOLI_21 — UDG8_ECOLI_21 77.7%
UDG_ECOLI_21 — UDG_HUMAN_21 25.9%
UDG5_ECOLI_21 — UDG8_ECOLI_21 80.4%
UDG5_ECOLI_21 — UDG_HUMAN_21 30.0%
UDG8_ECOLI_21 — UDG_HUMAN_21 29.0%
UDG_ECOLI_84 — UDG5_ECOLI_84 92.6%
UDG_ECOLI_84 — UDG8_ECOLI_84 98.9%
UDG_ECOLI_84 — UDG_HUMAN_84 28.6%
UDG5_ECOLI_84 — UDG8_ECOLI_84 93.6%
UDG5_ECOLI_84 — UDG_HUMAN_84 27.6%
UDG8_ECOLI_84 — UDG_HUMAN_84 28.6%


Обсуждение:
Полученные значения Identity варьюруют в широких пределах от 14.7 % до 100%. Считается, что функция сохраняется одинаковой у ферментов с Identity~40%.
В таблице встречаются значения гораздо меньшие, например, 14.7% и 15.3%. Очевидно, что полученные значения отражают степень "эволюционной дальности" организмов (процент Identity для дрожжей по отношению к человеческому выше, чем соответственный для кишечной палочки).



© Андреева Мария aka mashik, 2006