NCBI/Sequences

Ćwiczenie I
Poszukiwanie homologów - BLASTN/BLASTX
  1. Znajdź w bazie NCBI/Nucleotide sekwencję X17S348 (element insercyjny IS6110 Mycobacterium tuberculosis). W roku 1994 na podstawie zamplifikowanych fragmentów DNA tej sekwencji, znalezionych w płucach peruwiańskiej mumii, postawiono hipotezę o występowaniu gruźlicy w Ameryce przed przybyciem Europejczyków... Aby dodatkowo potwierdziæ wyniki autorzy zamplifikowali również fragment DNA 133 bp, sekwencji kodującej położonej w pobliżu IS611:
    ggtctcaaacgcggcatcgaaaaggccgtggagaaggtcaccgagaccc
    tgctcaagggcgccaaggaggtcgagaccaaggagcagattgcggcca
    ccgcagcgatttcggcgggtgaccagtccatcggtgac

  2. Wejdź na stronę NCBI/BLAST.
  3. Przeszukaj bazę danych nr przy pomocy sekwencji IS6110 oraz fragmentu 133bp (użyj programów BLASTN i BLASTX)
  4. Spróbuj odpowiedzieć na następujące pytania:
    • Czy sekwencja IS6110 jest unikalna dla gruźlicy ? Jeżeli nie, w jakich organizmach występują homologi ?
    • Jakiego rodzaju białko jest kodowane przez fragment 133bp? Czy jest ono unikalne dla gruźlicy ?
    • Czy pierwotna teza artykułu z 1992 pozostaje uzasadniona ?
[Podano za: "Discovering Genomics, Proteomics & Bioinformatics"; AM Campbell, LJ Heyer; Pearson Education; 2003; p. 52]
Ćwiczenie II
Poszukiwanie homologów - BLASTP
  1. Wejdź na stronę NCBI/BLAST.
  2. Użyj BLASTP aby odnaleźć homologi przykładowej sekwencji. Uruchom dwa zapytania - jedno ograniczone do białek roślinnych, drugie do białek zwierzęcych.
  3. Spróbuj odpowiedzieć na następujące pytania:
    • czy ma ona jakieś zakonserwowane domeny (wyniki CDD), świadczące o funkcji ?
    • jaką funkcję pełnią białka tej klasy u roślin (użyj linków Related Articles)?
    • jaką funkcję pełnią homologi tego białka u zwierząt (jeśli brak wyników, ogranicz się do obszaru wykrytej konserwatywnej domeny NB-ARC i zastosuj jak najczulsze ustawienia BLASTa) ?
    • czy podobieństwo dotyczy zawsze całości sekwencji ?
Ćwiczenie III
BLAST Two Sequences
  1. Odzyskaj następujące rekordy bazy danych NCBI/Nucleotide, odpowiadające różnym sekwencjom glikoproteiny płaszcza wirusa gorączki Nilu:
    • AF205882 (wyizolowany: Izrael, 1998)
    • AF205881 (wyizolowany: Izrael, 1952)
    • AF196835 (wyizolowany: Nowy Jork, 1999)
    • AF001566 (wyizolowany: Afryka Centralna, 1967)
  2. Porównaj sekwencjê AF205881 z pozostałymi, przy pomocy narzędzia NCBI/BLAST2Sequences.
  3. Jakie wnioski można wyciągnąć na podstawie wykrytych podobieństw,  co do pochodzenia wirusa wyizolowanego w Nowym Jorku ?
[Podano za: "Discovering Genomics, Proteomics & Bioinformatics"; AM Campbell, LJ Heyer; Pearson Education; 2003; p. 56]
Ćwiczenie IV
Poszukiwanie dalekich homologów

Enzymy z klasy dehydrogenaz mrówczanowych (EC 1.2.1.2) należą z reguły do dehydrogenaz D-3 hydroksykwasów (pewna grupa metaloenzymów również wykazuje tą aktywność).
  1. Odszukaj sekwencję enzymu pochodzącą z Hordeum vulgare.
  2. Spróbuj odszukać jego bakteryjne homologi za pomocą PSI-BLASTA (2 iteracje).  Przypatrz się wartościom E-value najlepszych homologów w obu iteracjach.
  3. Spróbuj odpowiedzieć na pytania:
    • Czy PSI-BLAST znajduje nie reprezentowane wcześniej sekwencje ?
    • Jakie inne aktywności enzymatyczne są realizowane przez homologi dehydrogenazy mrówczanowej ?
    • Czy w 2 iteracji pojawiły się jakieś nowe aktywności wśród homologów ?