RANGKUMAN PERTEMUAN 14
SEKUENSING DAN ANALISIS HOMOLOGI
A. Pengertian Sekuen DNA
Sekuen DNA adalah proses atau teknik penentuan urutan basa nukleotida pada suatu
molekul DNA. Urutan tersebut dikenal sebagai sekuen DNA yang merupakan informasi
paling mendasar suatu gen atau genom karena mengandung informasi dan instruksi yang
dibutuhkan untuk pembentukan fisik maupun sifat makhluk hidup. Sekuen DNA disebut
juga dengan suatu seri huruf-huruf mewakilkan struktur primer dari molekul DNA atau
"strand" nyata atau hipotetis. Kode nukleotida DNA dari jejeran basa nitogen ini digunakan
adalah A, C, G, dan T, mewakili empat nukleotida yang merupakan subunit dari untai DNA
(adenin, sitosin, guanin, timin). Jejeran nukleotida ini ditulis berjejer tanpa spasi, seperti
contoh dalam sekuens berikut Enzim retriksi dari Escherichia coli ditulis GAATTC.
Sekuens ini disebut informasi genetik. Sebuah deretan dari nukleotida yang lebih dari empat
jumlahnya dapat disebut sebuah sekuens. Berhubungan dengan fungsi biologinya, sebuah
sekuens dapat berupa sense atau anti-sense, dan kode atau nonkode. Sekuens DNA ada yang
membawa informasi genetik yaitu DNA Ekson dan Sekuens DNA dapat juga membawa
DNA sampah yaitu DNA yang tidak mengandung informasi genetik (DNA Intron).
Setiap organisme memiliki memiliki gen. Gen inilah sebagai suatu informasi genetik
pada suatu makhluk hidup tersimpan pada DNA-nya. Untuk mengetahui informasi genetik
tersebut digunakan teknik DNA Sequencing, yaitu metode yang digunakan untuk
menentukan urutan basa nukleotida (adenine, guanine, cytosine dan thymine) pada molekul
DNA. Saat ini teknik DNA Sequencing sudah memasuki tahap baru yang mengarah pada
large scale sequencing, jutaan bahkan miliaran basa nukleotida DNA dapat ditentukan
urutannya dalam sekali run saja pada mesin sekuen. Meskipun begitu, teknik lama berbasis
chain-termination masih umum digunakan, bahkan sangat efisien untuk menentukan sekuen
DNA fragmen pendek (masih dalam hitungan kilobasa). Jadi ditemukannya teknik DNA
Sequencing yang lebih canggih tidak menggusur mesin-mesin capillary sequencing yang
sudah digunakan di berbagai laboratorium biologi molekuler di seluruh dunia.
Mesin Sekuen DNA
Pembacaan suatu jejeran Molekul DNA adalah untuk mengetahui susunan suatu
sekuen DNA dari suatu mahkluk hidup. Telah dijelaskan dalam defenisi sekuen DNA di
atas bahwa sekuen DNA terdiri dari polimer molekul DNA berupa basa nitrogen yaitu
adenin, guanin, sitosin dan timin. Pembacaan sekuan ini mempunyai dua arah Forward
yaitu dari ke arah depan dari ujung 5’ – 3’ dan Reserve yaitu primer ke arah kebelakang
atau mundur dari ujung 3 – 5’. Kedua pita sekuen DNA ini bekerja pada dua untai berbeda
(sense dan antisense) dalam satu DNA.
Contoh situs ambigu adalah XhoII. Enzim ini mempunyai situs pemotongan
PuGATCPy. Pu merupakan singkatan dari purin (basa A atau G), sedangkan Py
merupakan singkatan dari pirimidin (pyrimidine) (basa T atau C). Jadi enzim XhoII dapat
mengenali dan memotong sekuen AGATCT, AGATCC, GGATCT dan GGATCC. Maka
kita bisa mengetahui sekuan untaian bawah (Reserve) yaitu TCTAGA, TCTAGG,
CCTAGA dan CCTAGG. Contoh lainnya pada spesies tumbuhan Goniothalamus
malayanus yang memiliki sekuen yang panjang penjujukan DNA kawasan gen trnL-trnF
arah kedepan. Kepanjangan data matriks yang terjajar adalah antara 403 bp. Sekuen ini
telah didaftar oleh Imam Mahadi dkk (2005) di GenBank.
Pembacaan nukleotidanya sama seperti di atas yang dimulai dari Timin dan berakhir
dengan sitosin. Pembacaan sekuen DNA dapat menggunakan softwere Bioinformatika.
Kemuktahiran data DNA yang telah ditemukan selama bertahuntahun telah banyak
menghasilkan data sekuens DNA oleh para ilmuwan di seluruh dunia, dan saat ini
kebanyakan jurnal ilmiah mempersyaratkan penyerahan sekuens DNA terlebih dahulu
untuk keperluan pangkalan data publik sebelum mereka menerima naskah selengkapnya
dari para penulis/ilmuwan. Pengelola pangkalan data akan saling bertukar informasi
tentang sekuens-sekuens yang terkumpul dan menyediakannya untuk akses publik
sehingga semua pangkalan data yang ada akan menjadi nara sumber yang sangat
bermanfaat. Sekuens-sekuens baru terus bertambah dengan kecepatan yang kian
meningkat. Begitu pula, sejumlah perangkat lunak komputer diperlukan agar data yang
tersedia dapat dimanfaatkan dengan lebih baik.
EMBL di Eropa dan GenBank di Amerika Serikat merupakan dua pangkalan data
sekuens DNA terbesar di dunia. Selain sekuens DNA, mereka juga mengelola data
sekuens RNA dan protein. Sementara itu, beberapa perusahaan mempunyai pangkalan
data sekuens DNA sendiri. Ketika sekuens suatu fragmen DNA telah diketahui, hanya
ada sedikit sekali gambaran yang dapat diperoleh dari sekuens tersebut. Analisis sekuens
perlu dilakukan untuk mengetahui beberapa karakteristik pentingnya seperti peta
restriksi, rangka baca, kodon awal dan kodon akhir, atau kemungkinan tempat
promoternya. Di samping itu, perlu juga dipelajari hubungan kekerabatan suatu sekuens
baru dengan beberapa sekuens lainnya yang telah terlebih dahulu diketahui. Biasanya,
analisis semacam itu dilakukan menggunakan paket-paket perangkat lunak, misalnya
paket GCG Universitas Wisconsin dan DNAstar. Untuk masa sekarang ini kebanyakan
hampir semua hasil data sekuen DNA suatu organisma sudah di simpan di GenBank di
Amerika Serikat.
Pada metode ini perpanjangan atau ekstensi rantai DNA dimulai pada situs
spesifik pada DNA cetakan dengan menggunakan oligonukleotida pendek yang
disebut primer yang komplementer terhadap DNA pada daerah situs tersebut. Primer
tersebut diperpanjang menggunakan DNA polimerase, enzim yang mereplikasi DNA.
Bersama dengan primer dan DNA polimerase, diikutsertakan pula empat jenis basa
deoksinukleotida (satuan pembentuk DNA), juga nukleotida pemutus atau penghenti
rantai (terminator rantai) dalam konsentrasi rendah (biasanya di-deoksinukleotida).
Penggabungan nukleotida pemutus rantai tersebut secara terbatas kepada rantai DNA
oleh polimerase DNA menghasilkan fragmenfragmen DNA yang berhenti bertumbuh
hanya pada posisi pada DNA tempat nukleotida tertentu tersebut tergabungkan.
Fragmen-fragmen DNA tersebut lalu dipisahkan menurut ukurannya dengan
elektroforesis gel poliakrilamida, atau sekarang semakin lazim dengan elektroforesis
menggunakan tabung gelas berjari-jari kecil (pipa kapiler) yang diisi dengan polimer
kental.
Pada metode sekuensing dye terminator atau Sanger asli urutan nukleotida
DNA tertentu dapat disimpulkan dengan membuat secara paralel empat reaksi
perpanjangan rantai menggunakan salah satu dari empat jenis basa pemutus rantai
pada masing-masing reaksi. Fragmen-fragmen DNA yang kemudian terbentuk
dideteksi dengan menandai (labelling) primer yang digunakan dengan fosforradioaktif
sebelum reaksi sekuensing dilangsungkan. Keempat hasil reaksi tersebut kemudian
dielektroforesis pada empat lajur yang saling bersebelahan pada gel poliakrilamida.
Hasil pengembangan metode ini menggunakan empat macam primer yang ditandai
dengan pewarna berpendar (fluorescent dye). Hal ini memiliki kelebihan karena tidak
menggunakan bahan radioaktif; selain menambah keamanan dan kecepatan, keempat
hasil reaksi dapat dicampur dan dielektroforesis pada satu lajur pada gel.
Jumlah kapiler pada mesin ini bervariasi, mulai dari 1, 4, 16, 48 hingga 96
kapiler dalam satu mesin, semakin banyak jumlah kapiler, semakin banyak pula
jumlah sampel DNA yang bisa ditentukan urutan basanya. Hasil pembacaan mesin
sequencer disebut electropherogram, yaitu peak-peak berwarna yang menunjukkan
urutan basa DNA-nya.
Untuk memperoleh hasil reaksi berlabel yang dapat dideteksi dari DNA
cetakan, metode "sekuensing daur" (cycle sequencing) paling lazim dilakukan. Dalam
metode ini dilakukan berturut-turut penempelan primer (primer annealing), ekstensi
oleh polimerase DNA, dan denaturasi (peleburan atau melting) untai-untai DNA
cetakan secara berulang-ulang (25–40 putaran). Kelebihan utama sekuensing daur
adalah lebih efisiennya penggunaan pereaksi sekuensing yang mahal (BigDye) dan
mampunya mengurutkan templat dengan struktur sekunder tertentu seperti hairpin
loop atau daerah kaya-GC. Setiap tahap pada sekuensing daur ditempuh dengan
mengubah temperatur reaksi menggunakan mesin pendaur panas (thermal cycler)
PCR.
Cara tersebut didasarkan pada fakta bahwa dua untai DNA yang
komplementer akan saling menempel (berhibridisasi) pada temperatur rendah dan
berpisah (terdenaturasi) pada temperatur tinggi. Hal penting lain yang memungkinkan
cara tersebut adalah penggunaan enzim DNA polimerase dari organisme termofilik
(organisme yang hidup di lingkungan bertemperatur tinggi), yang tidak mudah terurai
pada temperatur tinggi yang digunakan pada cara tersebut (>95°C).
b. Metode Pyrosequencing
Metode sekuensing DNA yang kini ada hanya dapat merunut sepotong pendek
DNA sekaligus. Contohnya, mesin sekuensing modern yang menggunakan metode
Sanger hanya dapat mencakup paling banyak sekitar 1000 pasang basa setiap
sekuensing. Keterbatasan ini disebabkan oleh probabilitas terminasi rantai yang
menurun secara geometris seiring dengan bertambahnya panjang rantai, selain
keterbatasan fisik ukuran dan resolusi gel.
Sekuens DNA dengan ukuran jauh lebih besar kerap kali dibutuhkan. Sebagai
contoh, genom bakteri sederhana dapat mengandung jutaan pasang basa, sedangkan
genom manusia terdiri atas lebih dari 3 miliar pasang basa.Berbagai strategi telah
dikembangkan untuk sekuensing DNA skala besar, termasuk strategi primer walking
dan shotgun sequencing. Kedua strategi tersebut melibatkan pembacaan banyak
bagian DNA dengan metode Sanger dan selanjutnya menyusun hasil pembacaan
tersebut menjadi sekuens yang runut. Masing-masing strategi memiliki kelemahan
sendiri dalam hal kecepatan dan ketepatan; sebagai contoh, metode shotgun
sequencing merupakan metode yang paling praktis untuk sekuensing genom ukuran
besar, namun proses penyusunannya rumit dan rentan kesalahan.
Data sekuen bermutu tinggi lebih mudah didapatkan bila DNA bersangkutan
dimurnikan dari pencemar yang mungkin terdapat pada sampel dan diamplifikasi.Hal
ini dapat dilakukan dengan metode reaksi berantai polimerase bila primer yang
dibutuhkan untuk mencakup seluruh daerah yang diinginkan cukup praktis
dibuat.Cara lainnya adalah dengan kloning DNA sampel menggunakan vektor bakteri,
yaitu memanfaatkan bakteri untuk "menumbuhkan" salinan DNA yang diinginkan
sebanyak beberapa ribu pasang basa sekaligus.Biasanya proyek-proyek sekuensing
DNA skala besar memiliki persediaan pustaka hasil kloning semacam itu.
D. Analisis Homologi
1. Aligment Sekuen DNA
Homologi suatu gen atau protein dapat ditentukan melalui analisis penyejajaran
sekuens (sequence alignment). Penjajaran sekuen (sequence alignment) adalah proses
penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan sekuens-sekuens
tersebut tampak nyata. Yang dikenal dengan alignment. Baris sekuens dalam suatu
alignment diberisisipan (umumnya dengan tanda “–”) sedemikian rupa sehingga
kolomkolomnya memuat karakter yang identik atau sama di antara sekuens-sekuens
tersebut. Berikut adalah contoh alignment DNA dari dua sekuens pendek DNA yang
berbeda, “TTACAAGG” dan “TTACTTTAAGG” (tanda “|” menunjukkan kecocokan
atau match di antara kedua sekuens.
Program BLAST
5) Metode Clustal
Metode Clustal adalah program bioinformatika dalam bentuk softwaer untuk
alignment multipel (multiple alignment), yaitu alignment beberapa sekuens sekaligus.
Dua varian utama Clustal adalah ClustalW dan ClustalX. Program ini sering
digunakan oleh peneliti kajian filogenetik.
6) Metode Hidden Markov Model (“Model Markov Tersembunyi”, HMM)
Metode ini digunakan untuk meng-alignment sekuen. Metode ini di sebut. HMM yaitu
merupakan model statistika yang mulanya digunakan dalam ilmu komputer untuk
mengenali pembicaraan manusia (speech recognition). Selain digunakan untuk
alignment, HMM juga digunakan dalam metode-metode analisis sekuens lainnya,
seperti prediksi daerah, pengkode protein dalam genom dan prediksi struktur sekunder
protein.
3. Proses Aligment
Zulfarina dan Imam, M. 2019. Buku Ajar Bioteknologi. Pekanbaru: Universitas Riau.