Банк нуклеотидных последовательностей EMBL 


  1.  Система SRS (http://srs.ebi.ac.uk/):
    1. "EMBL":
      дата последнего проиндексированного в системе релиза: 07-Sep-2009;
      количество записей в нём: 108577013.
    2. Список классов ("Data Class") банка EMBL:


      ANN Constructed sequence with annotation не проиндексирован
      CON Constructed sequence не проиндексирован
      EST Expressed Sequence Tag 62846990
      GRV Genome Reviews не проиндексирован
      GSS Genome Survey Sequence 25905073
      HTC High Throughput cDNA sequencing 549753
      HTG High Throughput Genome sequencing 142473
      MGA Mass Genome Annotation не проиндексирован
      PAT Patent 10439165
      SET Project set (EMBL WGS Masters only) не проиндексирован
      STD Standard 7253026
      STS Sequence Tagged Site 1310171
      TPA Third Party Annotation 6520
      TSA Transcriptome Shotgun Assembly 123842
      WGS Whole Genome Shotgun не проиндексирован


    3. Список разделов ("Divisions") банка EMBL:


      ENV Пробы окружающей среды 4145029
      FUN Грибы 3942084
      HUM Человек 12841544
      INV Беспозвоночные 15518735
      MAM Остальных млекопитающих 9429823
      MUS Мышь домовая 7424621
      PHG Бактериофаги 5865
      PLN Растения 33806044
      PRO Прокариоты 909986
      ROD Грызуны 2261678
      SYN Синтетические 2671622
      TGN Трансгенные 265465
      UNC Неклассифицированные 3945859
      VRL Вирусные 827405
      VRT Других позвоночных 10581253


  2.  Описание гена NG23 в записи EMBL с кодом доступа BA000025:

    направление гена ( относительно направления, выбранного для записи): обратное;
    число кодирующих участков: 4;
    длина первого кодирующего участка: 180962-180849+1=114 ;
    длина последнего кодирующего участка: 179581-179486+1=96 ;
    длина первого интрона: 180848-180603+1=246 ;
    длина последнего интрона: 179857-179582+1=276 .

     
  3.   Поиск белка, соответсвующего последовательности самого длинного экзона гена NG23:

    Самый длинный экзон: последний ( длина 114). Вырезаем этот участок последовательности посредством программы "seqret".
    Поищем белки (http://blast.ncbi.nlm.nih.gov/), используя blastx ( поиск белков в базе данных, используюя нуклеотидную последовательность):
    - в поле "upload file" введем файл с последовательность в fasta-формате;
    - в поле "database" выберем банк swissprot;
    - поиск.
    В результате был найден 1 белок:
            sp|Q5SSQ6.2|G7D_HUMAN  RecName: Full=Protein G7d                   35.4    0.097 
            
    Участок первого белка, соответствующийданной последовательности: 1-38. Вот само выравнивание:
             Query  1    MGSQGSGGVPLVQAPYTVLLLPLGTSRQDPGAQSFFLW  114
                         MGSQGSGGVPLVQAPYTVLLLPLGTSRQDPGAQSFFLW
             Sbjct  1    MGSQGSGGVPLVQAPYTVLLLPLGTSRQDPGAQSFFLW  38
             

     
  4.  В записи Swiss-Prot, описывающей белок P45748, найдем все ссылки на банк EMBL:


    Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Описание Длина последовательности
    AP009048 геномная ДНК STD PRO 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome 4646332
    U00096 геномная ДНК STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675
    U18997 линейная геномная ДНК STD PRO 30-DEC-1994 Escherichia coli K-12 chromosomal region from 67.4 to 76.0 minutes. 372438


    Все записи, за исключением последней, являются геномными ДНК. Все они относятся к стандартному классу данных и описывают прокариотические организмы.


© Азнаурян 2008 marina-91@list.ru