Anda di halaman 1dari 3

1

Analiza informatica a secventelor



Bioinformatica asigura baza teoretica, dar si uneltele practice pentru explorarea proteinelor si ADN-
ului. Ea consta dintr-o abordare computationala pentru gestionarea si analiza informatiilor biomedicale.
Este folosita tot mai mult in cercetare atat in cadru academic cat si industrial.
Obtinerea secventelor
1. Intrati pe pagina de web a NCBI (National Center for Biotechnology Information):
www.ncbi.nlm.nih.gov. NCBI este o retea exinsa de baze de date cu informatii genetice, medicale si
biochimice. Pentru informatii detaliate cu privire la acest site puteti accesa Manualul NCBI
(http://www.ncbi.nlm.nih.gov/books/NBK21101/).
2. Pentru a ajunge in portalul GQuery (http://www.ncbi.nlm.nih.gov/gquery/) selectati All
Databases din bara de navigatie din partea de sus a paginii, si dati click pe butonul Search.
Acesta ne asigura accesul la o mare varietate de informatii: de la literatura biomedicala (PubMed)
pana la baze de date ce cuprind secvente de nucleotide, secvente si structuri proteine etc.
3. Tastati in bara de cautare cuvintele cheie ale fragmentului de ADN cautat. In continuare vom lucra
cu adenilat ciclaza din Bordetella pertussis (cuvinte cheie: adenylate cyclase AND Bordetella
pertussis).
I
1
: Cate secvente nucleotidice s-au obtinut? Dar gene?
I
2
: Ce se obtine la folosirea cuvantului cheie: bacteria? De ce?
4. Accesati linkul Nucleotide: DNA and RNA sequences. In pagina afisata se poate gasi linkul adenilat
ciclazei din B. pertussis, urmat de cateva informatii legate de secventa respectiva: nr. de pb pe care
le contine (6441 pb), precum si Accession: A14850.1 si GI: 580667.
Accession cuprinde Accession number (nr de identificare unic atribuit fiecarei secvente
inregistrate, alcatuit dintr-o litera urmata de 5 cifre sau 2 litere urmate de 6 cifre), urmat de Version
number (indice al istoricului revizuirii care incepe cu 1 si creste cu fiecare revizuire a secventei).
GI (GenInfo Identifier) alcatuit dintr-o serie de cifre care sunt atribuite consecutiv pentru fiecare
secventa inregistrata si prelucrata de NCBI.
Cele doua sisteme functioneaza in paralel. Daca o secventa de ADN sau proteine sufera modificari de
orice natura, acesta va primi un nou numr de GI.
5. Accesati linkul adenilat ciclazei din B. pertussis pentru a acceseaza secventa in formatul GenBank.
Acesta cuprinde 3 parti: antet, caracteristici, si secventa in sine.
2

Structura antetului este prezentata in figura 1

Figura 1. Formatul GeneBank (Antet).
In cadrul modulului Features se regasesc informatii despre secventa in cauza (organismal de
provenienta, tipul de molecula, etc.), precum i regiunile biologice importante.
CDS (Coding DNA Sequence) = Secventa codificatoare, cuprinsa intre codonul strart (ATG) si codonul stop.
Ea corespunde cu secventa de aminoacizi rezultata in urma traducerii.
Secventa se gaseste in ultima parte a paginii.
Mai multe detalii se pot vedea pe site: http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html.
I
3
: Ce se intampla la accesarea linkului CDS situat la stanga paginii?
6. Salvati secventa codificatoare (CDS) prin accesarea meniului pop-up, aflat in dreptul linkului
Send: aflat in dreapta-sus a ferestrei (click stanga pe acesta, bifati Coding Sequences, selectati
FASTA Nucleotide si apasati butonul Create File).

Prelucrarea secventelor
1. Deschideti programul de prelucrare a secventelor (ADN/proteine) BioEdit (kitul de instalare se
poate downloada de pe http://www.mbio.ncsu.edu/bioedit/bioedit.html).
2. Deschideti secventa de ADN (CDS-ul adenilat ciclazei din B. pertussis) salvata de pe NCBI (File/Open,
selectati All Files in dreptul Files of Types: si deschideti documentul cu extensia .txt).
3. Pentru a obtine harta de restrictie a secventei ADN, selectati secventa si accesati modulul de
restrictie pe urmatoarea cale: Sequence/Nucleic Acid/Restriction Map.
3

Setati conditiile de afisare a hartii de restrictie (Display), asa cum este prezentat in figura 2. Aici sunt
bifate casutele pentru afisarea hartii si a listelor enzimelor de restrictie aranjate dupa nume si pozitia in
cadrul secventei, lista enzimelor care au doar un singur situs de restrictie, a celor care au cel mult 5 situsuri
de restrictie, precum si a enzimelor care nu prezinta nici un situs de restrictie. Sunt luate in considerare
doar enzimele care recunosc situsuri de restrictie compuse din cel putin 6 nucleotide.

Figura 2. Modulul de restrictie a programului BioEdit.
Casuta pentru ADN circular ramane nebifata.
I
4
: Cand este necesara bifarea casutei Circular DNA?
4. Apasati butonul Generate Map.
Se obtine un document text cu harta de restrictie si lista enzimelor respective.

De asemenea cu ajutorul programului BioEdit se pot face diverse alte prelucrari de secvente (atat
ADN cat si proteine). O prelucrare ar fi traducerea secventelor ADN in proteine (Sequence/Nucleic
Acid/Translate). Se poate alege cadrul de citire (frame) care in cazul nostru este 1 deoarece codonul start
ATG incepe chiar din pozitia 1 a secventei nucleotidice. Se mai pot face aliniamente a doua secvente de
ADN sau poteine (Sequence/Pairwise Alignment/).