net/interpretasi-
chromatogram-hasil-dna-sequencing/)
Teori Dasar
Sebelum melangkah ada baiknya kita tilik dulu sedikit mengenai apa yang akan
kita kerjakan dan teori seputar sequence alignment ini.
Misalkan Anda memiliki sebuah gen (misal 16S rRNA bakteri) hasil amplifikasi
(PCR) dengan ukuran 1300bp yang akan ditentukan urutan-urutan basa
nukleotidanya. Maka yang dilakukan adalah mensekuen gen tersebut pada kedua
utasnya menggunakan dua primer (16S Forward dan 16S Reverse) karena panjang
hasil pembacaan alat sequencer ini terbatas tidak mampu menjangkau seluruh gen.
Proses berikutnya adalah menyambungkan kedua hasil pembacaan alat sehingga
menjadi sequen utuh menggunakan teknik Pairwise Sequence Alignment.
[simage=171,640,y,left]
Antarmuka BioEdit
Antarmuka BioEdit sangat sederhana, jika kita membuka satu file hasil
sequencing (*.ab1 atau *.abi) maka akan terbagi menjadi dua jendela, satu jendela
berisi electropherogram dan satunya lagi teks sekuen DNA-nya.
[simage=172,400,y,left]
Let’s Practise
Persiapan
File yang digunakan adalah hasil pembacaan sebuah fragment DNA dengan dua
arah pembacaan (menggunakan sepasang primer forward dan reverse). File ini
biasanya memiliki format *.ab1 atau *.abi jika alat yang digunakan bermerk
Applied Biosystems.
Langkah-langkah
Masing-masing file terdiri dari 2 jendela, yaitu chromatogram dan teks sekuen
DNA.
[simage=173,400,y,left]
Pada contoh ini misalnya posisi 750.
[simage=175,400,y,left]
Tekan Ctrl+F8 pada keyboard, atau klik “Edit” > “Copy Sequence(s)”
Pindah ke jendela sekuen pasangannya (misal yang Forward)
Tekan Ctrl+F9 pada keyboard, atau klik “Edit” > “Paste Sequence(s)”
[simage=176,400,y,left]
[simage=177,400,y,left]
Seleksi kedua nama sekuen dengan kombinasi tombol “Shift” atau “Ctrl” dan
Klik.
[simage=178,400,y,left]
Klik “Sequence” > “Pairwise Alignment” > “Align two sequences (Allow Ends to
slide)”
Hasil Alignment akan muncul pada jendela baru
[simage=179,400,y,left]
[simage=180,400,y,left]
[simage=181,400,y,left]
Interpretasi Electropherogram DNA
Sequencing
By Yepy Hardi Rustam on August 16, 2011 in Biotechnique, Biotechnology
Teknologi DNA Sequencing yang umum digunakan saat ini adalah Dye-
terminator sequencing, dimana output alat sequencer-nya adalah peak-peak yang
terdiri atas 4 warna yang mewakili masing-masing nukleotida yaitu hijau untuk
Adenine (A), merah untuk Thymine (T), biru untuk Cytosine (C) dan hitam untuk
Guanine (G). Peak inilah yang dinamakan electropherogram. Electropherogram
ini sudah diinterpretasikan (call) secara otomatis oleh program computer DNA
Sequencer menjadi urutan-urutan basa nukleotida (A-C-G-T), namun masalahnya
seringkali program komputer melakukan ‘kesalahan’ interpretasi pada
electropherogram yang bermasalah sehingga urutan basa nukleotida yang
dihasilkannya pun bisa salah. Hal ini tentu saja berpengaruh terhadap hasil
penelitian dan juga analisa lanjutan yang akan kita lakukan terhadap hasil
sekuensing tersebut.
Oleh karena itu, mutlak adanya interpretasi manual menggunakan ‘mata kepala
sendiri’ untuk mencari peak-peak yang ambigu dan membuang bagian
electropherogram yang mengandung terlalu banyak error. Berikut ini akan
diuraikan masalah yang sering timbul pada electropherogram, apa penyebabnya
dan bagaimana kita bisa mendapatkan interpretasi yang benar.
[simage=163,400,y,left]
[simage=164,400,y,left]
[simage=165,400,y,left]
Gambar 1 adalah electropherogram yang sangat bagus, excellent tanpa noise sama
sekali. Pada gambar 2 terlihat sedikit noise pada baseline tetapi peak utamanya
masih sangat jelas dan komputer tidak melakukan kesalahan pembacaan sama
sekali. Sedangkan pada gambar 3 noise-nya cukup tinggi sehingga mempengaruhi
pembacaan (call) pada komputer. Coba perhatikan peak nomor 271, 273 dan 279
yang terdiri dari lebih satu warna, begitu pula pada posisi 291 dan 301 dimana
terdapat peak yang menyisip diantara dua peak, dan yang paling parah pada posisi
310 yang sangat sulit untuk ditentukan manakah peak yang sebenarnya.
Noise seperti itu umum terjadi ketika sinyal sampel sequencingnya terlalu redup,
ini bisa dilihat dari ‘signal intensity’ dari electropherogram yang ada pada
windows yang berbeda pada program ‘Electropherogram viewer’ di komputer
atau pada bagian atas hasil print-out electropherogram. Biasanya terlihat seperti
berikut ini:
Signal yang sangat baik memiliki nilai antara 500 – 2000 (meskipun nilai ini
bervariasi antar instrument sequencer), signal antara 50 – 100 pun kadang-kadang
memberikan hasil yang bagus namun tentu saja disertai dengan ‘bonus’ berupa
noise. Biasanya bagian awal Electropherogram memiliki noise yang rendah dan
semakin ke bagian akhir semakin meningkat pula noisenya, hal ini termasuk
‘normal’ karena keterbatasan teknologi kapiler yang digunakan, namun noise ini
semakin menjadi-jadi jika dalam sampel masih terdapat sisa-sisa garam.
Tetapi terkadang spasi yang terlalu lebar diartikan sebagai ‘N’ oleh software,
padahal secara kasat mata terlihat bahwa tidak ada peak di bawah ‘N’ seperti yang
terlihat pada gambar 5 pada posisi peak 66. Bahkan pada gambar 6 terlihat ada
basa ‘G’ yang disisipkan antara peak 58 dan 60, padahal pada posisi 59 tersebut
yang ada hanyalah peak noise pada baseline, tetapi software membacanya sebagai
‘real peak’. Tentu saja hal ini dapat berakibat fatal terhadap pembacaan
electropherogram.
Idealnya satu posisi peak hanya terdiri atas satu warna saja, namun bisa saja
terjadi satu posisi diisi oleh lebih dari satu warna peak, biasanya jika produk PCR
yang disekuensing berasal dari DNA genom diploid, dimana posisi yang
polimorfik akan memunculkan kedua nukleotida secara simultan. Hasil
pembacaannya bisa jadi ‘N’ atau salah satu peak yang lebih tinggi.
[simage=169,160,y,left] [simage=170,160,y,left]
Gambar 7 merupakan contoh yang sangat jelas akan adanya SNP (single
nucleotide polymorphism) heterozygous, pada kasus ini salah satu alel memiliki
basa C dan satunya lagi T, dan keduanya nampak jelas sebagai dua peak yang
saling menumpuk, dan dibaca oleh software sebagai ‘N’. Sementara itu pada
gambar 8 sekilas tidak nampak adanya SNP karena pada posisi peak 192 terbaca
sebagai C, padahal di situ terdapat pula peak G yang lebih rendah.
Pemindaian dengan mata bisa saja dilakukan untuk mencari peak heterozygous
seperti ini, namun jika jumlah sampelnya sangat banyak tentu menjadi sangat
tidak praktis. Untunglah beberapa software berikut dapat menolong kita
melakukan pemindaian dan mendeteksi adanya peak heterozygous:
[simage=161,288,y,left]
[simage=162,288,y,left]
Pada gambar 9, kualitas peak sudah tidak sebaik yang seharusnya, selain ‘kaki’
yang makin melebar, dua peak sewarna yang berurutan terlihat menyatu, namun
hasil pembacaan software masih akurat dan kita pun masih dapat melihat puncak
masing-masing peak yang terlihat menyatu tersebut, seperti pada posisi 790-791,
792-793, 795-796 dan yang lainnya. Di samping itu jarak/spasi antar peak pun
masih seragam dan tidak terlihat ‘keanehan’.
Lain halnya dengan electropherogram pada gambar 10, peak-peak yang menyatu
sudah tidak nampak lagi masing-masing puncaknya (misalnya posisi 969-970,
973-974), juga muncul ‘N’ pada posisi 982 yang tidak bisa kita pastikan apakah di
situ seharusnya G atau A, dan bisakah kita pastikan berapa jumlah A setelah itu?
Jadi kita harus berhati-hati pada bagian akhir electropherogram, lihatlah apakah
terdapat nukleotida ganda yang seharusnya hanya satu, lalu benarkah hitungan
jumlah nukleotida yang berurutan, dan bahkan kadang-kadang satu nukleotida
yang diapit oleh deretan nukleotida yang sewarna ‘tenggelam’ di bawah peak
yang sangat lebar tadi. Pokoknya jika melihat spasi yang tidak seragam,
waspadalah.
Jika hasil pembacaan software sudah memiliki banyak error, interpretasi manual
dengan ‘mata kepala sendiri’ sudah sangat sulit dilakukan dan error yang terjadi
sudah di luar toleransi kebutuhan kita, maka abaikan saja sisa sekuen yang
mengandung error tersebut. Hingga batas mana sekuen tersebut akan kita ambil
bergantung pada kebutuhan dan tujuan kita melakukan DNA Sequencing.
Beberapa peneliti yang hanya ingin melihat posisi intro-ekson atau hanya ingin
mengetahui identitas suatu DNA bakteri misalnya, mungkin tidak terlalu
terganggu dengan adanya sedikit error. Namun jika tujuan sequencing tersebut
adalah untuk publikasi ilmiah atau pencarian SNP, maka error yang sedikit saja
tidak dapat ditolerir, hanya sekuen dengan kualitas terbaik saja yang akan diambil.
Untuk mengatasi error yang terjadi, bisa dilakukan dengan cara mensekuen dari
arah sebaliknya, sehingga ambiguitas pada satu arah sekuen bisa diatasi dengan
hasil sekuen komplemennya.