DNA Sequencing

Sciencebiotech.net Biotek untuk semua(http://sciencebiotech.
net/interpretasi-
chromatogram-hasil-dna-sequencing/)
Sequence Alignment di BioEdit

By Yepy Hardi Rustam on May 1, 2009 in BioInformatics, Biotechnology
Kalau di dunia pengolah kata ada Microsoft Word dan

sejenisnya, maka di dunia bioinformatika ada BioEdit. BioEdit adalah sebuah
program Sequence Alignment Editor buatan Tom Hall dari Ibis Biosciences
Carlsbad USA, yang berguna untuk melakukan analisa-analisa bioinformatika
terhadap sekuen-sekuen DNA, RNA maupun protein. Kita dapat melakukan
‘manipulasi’ sekuen dan mengolah sekuen tersebut sesuai keperluan. Mari kita
lihat salah satu kemampuan BioEdit diantara seabreg kemampuan lainnya, yaitu
Sequence Alignment. Saat ini kita fokuskan pada cara melakukan sequence
alignment untuk hasil pembacaan sekuen suatu fragment DNA yang dibaca secara
bi-directional alias dua arah (forward-reverse atau sense-antisense).
Teori Dasar
Pairwise Sequence Alignment
Sebelum melangkah ada baiknya kita tilik dulu sedikit mengenai apa yang akan
kita kerjakan dan teori seputar sequence alignment ini.
Misalkan Anda memiliki sebuah gen (misal 16S rRNA bakteri) hasil amplifikasi
(PCR) dengan ukuran 1300bp yang akan ditentukan urutan-urutan basa
nukleotidanya. Maka yang dilakukan adalah mensekuen gen tersebut pada kedua
utasnya menggunakan dua primer (16S Forward dan 16S Reverse) karena panjang
hasil pembacaan alat sequencer ini terbatas tidak mampu menjangkau seluruh gen.
Proses berikutnya adalah menyambungkan kedua hasil pembacaan alat sehingga
menjadi sequen utuh menggunakan teknik Pairwise Sequence Alignment.
Berikut ini diagram proses yang terjadi dalam proses analisanya.
[simage=171,640,y,left]
Antarmuka BioEdit
Antarmuka BioEdit sangat sederhana, jika kita membuka satu file hasil
sequencing (*.ab1 atau *.abi) maka akan terbagi menjadi dua jendela, satu jendela
berisi electropherogram dan satunya lagi teks sekuen DNA-nya.
Let’s Practise
Persiapan
Pastikan Anda sudah mempersiapkan hal-hal berikut ini:
 Software BioEdit yang sudah terinstall di komputer.
Jika belum ada bisa diunduh secara gratis di

http://www.mbio.ncsu.edu/BioEdit/BioEdit.html. BioEdit hanya bisa diinstall dan
dijalankan pada sistem operasi Windows 95/98/NT/2000/XP.
 Dua buah file hasil pembacaan alat DNA Sequencer.
File yang digunakan adalah hasil pembacaan sebuah fragment DNA dengan dua
arah pembacaan (menggunakan sepasang primer forward dan reverse). File ini
biasanya memiliki format *.ab1 atau *.abi jika alat yang digunakan bermerk
Applied Biosystems.
Lanjut! Anda siap untuk memulai.
Langkah-langkah
Menjalankan program BioEdit
 Jalankan program BioEdit dari Start Menu

 Buka file sekuen DNA (*.ab1 atau *.abi)
 File > Open > Pilih kedua file yang akan dialignment
Masing-masing file terdiri dari 2 jendela, yaitu chromatogram dan teks sekuen
DNA.
Perhatikan chromatogram, lihat posisi peak terakhir yang masih menunjukkan

kualitas pembacaan yang baik, karena peak dengan kualitas buruk atau setelah
produk PCR-nya berakhir harus dibuang (trim). Selengkapnya bisa dibaca pada
tulisan Interpretasi Chromatogram Hasil DNA Sequencing.
Pada contoh ini misalnya posisi 750.
Menghapus bagian sekuen yang tidak perlu

 Pindah ke jendela text sequence yang bersangkutan dan pastikan mode-nya

adalah “Edit”-“Overwrite”.
 Letakkan kursor sebelum basa terakhir (misal 750)
 Klik “Edit” > “Select to End”
 Tekan tombol “Del” pada keyboard, atau klik “Edit” > “Delete”
 Jika bagian depan electropherogram juga kualitasnya buruk, bisa dihapus
dengan cara yang sama.
 Lakukan hal yang sama untuk sekuen pasangannya (Reverse).
Menggabungkan 2 sekuen yang akan dialignment dalam satu jendela
 Seleksi Nama salah satu sekuen (misal yang Reverse)
 Tekan Ctrl+F8 pada keyboard, atau klik “Edit” > “Copy Sequence(s)”
 Pindah ke jendela sekuen pasangannya (misal yang Forward)
 Tekan Ctrl+F9 pada keyboard, atau klik “Edit” > “Paste Sequence(s)”
Sekarang kedua sekuen sudah berada dalam satu jendela
Melakukan Reverse Complement untuk menyamakan orientasi sekuen
 Seleksi nama salah satu sekuen (misal yang Reverse)

 Klik “Sequence” > “Nucleic Acid” > “Reverse Complement”
Melakukan Pairwise Alignment
 Seleksi kedua nama sekuen dengan kombinasi tombol “Shift” atau “Ctrl” dan
Klik.
 Klik “Sequence” > “Pairwise Alignment” > “Align two sequences (Allow Ends to
slide)”
 Hasil Alignment akan muncul pada jendela baru
Membuat Sekuen Konsensus
 Klik “Alignment” > “Create Consensus Sequence”

 Sekuen Consensus akan muncul di bawah kedua sekuen yang telah dialignment
 Lakukan Pengeditan pada Consensus Sequence dengan membandingkannya

kepada Chromatogram
 Simpan file dengan mengklik “File” > “Save As”
Untuk memudahkan pengeditan, tampilan sekuen bisa diubah ke bentuk titik

untuk sekuen yang conserve, artinya jika basa pada suatu sekuen sama dengan
basa di atasnya, maka akan ditampilkan sebagai titik. Ini akan memudahkan kita
dalam mencari sekuen mana yang tidak sesuai (mismatch). Anda bisa
bereksperimen dengan berbagai tampilan sekuen pada BioEdit dengan
mengaktifkan dan menonaktifkan tombol-tombol view.
Interpretasi Electropherogram DNA
Sequencing
By Yepy Hardi Rustam on August 16, 2011 in Biotechnique, Biotechnology
Teknologi DNA Sequencing yang umum digunakan saat ini adalah Dye-
terminator sequencing, dimana output alat sequencer-nya adalah peak-peak yang
terdiri atas 4 warna yang mewakili masing-masing nukleotida yaitu hijau untuk
Adenine (A), merah untuk Thymine (T), biru untuk Cytosine (C) dan hitam untuk
Guanine (G). Peak inilah yang dinamakan electropherogram. Electropherogram
ini sudah diinterpretasikan (call) secara otomatis oleh program computer DNA
Sequencer menjadi urutan-urutan basa nukleotida (A-C-G-T), namun masalahnya
seringkali program komputer melakukan ‘kesalahan’ interpretasi pada
electropherogram yang bermasalah sehingga urutan basa nukleotida yang
dihasilkannya pun bisa salah. Hal ini tentu saja berpengaruh terhadap hasil
penelitian dan juga analisa lanjutan yang akan kita lakukan terhadap hasil
sekuensing tersebut.
Oleh karena itu, mutlak adanya interpretasi manual menggunakan ‘mata kepala
sendiri’ untuk mencari peak-peak yang ambigu dan membuang bagian
electropherogram yang mengandung terlalu banyak error. Berikut ini akan
diuraikan masalah yang sering timbul pada electropherogram, apa penyebabnya
dan bagaimana kita bisa mendapatkan interpretasi yang benar.
Seberapa bersihkah electropherogram kita?
Electropherogram yang bersih memiliki ciri sebagai berikut:
 jarak/spasi antar peak yang sama

 setiap peak hanya terdiri dari satu warna
 ketinggian peak bisa bervariasi hingga berbeda 3 kali lipat antara peak tertinggi
dengan terendah
 mungkin saja terdapat peak-peak ‘noise’ pada baseline, namun jika kualitas
template dan primernya bagus biasanya noise ini sangat minim dan tidak
berpengaruh secara signifikan terhadap pembacaan
Berikut ini adalah contoh electropherogram, coba perhatikan tingkat kebersihan

baseline-nya.
Gambar 1 adalah electropherogram yang sangat bagus, excellent tanpa noise sama
sekali. Pada gambar 2 terlihat sedikit noise pada baseline tetapi peak utamanya
masih sangat jelas dan komputer tidak melakukan kesalahan pembacaan sama
sekali. Sedangkan pada gambar 3 noise-nya cukup tinggi sehingga mempengaruhi
pembacaan (call) pada komputer. Coba perhatikan peak nomor 271, 273 dan 279
yang terdiri dari lebih satu warna, begitu pula pada posisi 291 dan 301 dimana
terdapat peak yang menyisip diantara dua peak, dan yang paling parah pada posisi
310 yang sangat sulit untuk ditentukan manakah peak yang sebenarnya.
Noise seperti itu umum terjadi ketika sinyal sampel sequencingnya terlalu redup,
ini bisa dilihat dari ‘signal intensity’ dari electropherogram yang ada pada
windows yang berbeda pada program ‘Electropherogram viewer’ di komputer
atau pada bagian atas hasil print-out electropherogram. Biasanya terlihat seperti
berikut ini:
Signal G:168 A:110 T:160 C:186
Signal yang sangat baik memiliki nilai antara 500 – 2000 (meskipun nilai ini
bervariasi antar instrument sequencer), signal antara 50 – 100 pun kadang-kadang
memberikan hasil yang bagus namun tentu saja disertai dengan ‘bonus’ berupa
noise. Biasanya bagian awal Electropherogram memiliki noise yang rendah dan
semakin ke bagian akhir semakin meningkat pula noisenya, hal ini termasuk
‘normal’ karena keterbatasan teknologi kapiler yang digunakan, namun noise ini
semakin menjadi-jadi jika dalam sampel masih terdapat sisa-sisa garam.
Komputer juga bisa salah
Namanya juga komputer, buatan manusia, tentu saja bisa salah

menginterpretasikan peak pada electropherogram, malahan mata manusia bisa
lebih baik dalam hal ini. Kadangkala komputer membaca peak-peak yang ambigu
menjadi ‘N’, padahal mata manusia bisa melihat dengan jelas peak apa
sebenarnya yang ada di situ. Oleh karena itu kita perlu melakukan pemindaian
alias ‘scanning’ pada electropherogram untuk mencari peak-peak yang sangat
kecil/rendah, nukleotida yang terbaca sebagai ‘N’ atau peak-peak yang
jarak/spasinya lain daripada yang lain.
Peak-peak dengan jarak/spasi yang aneh
Cobalah perhatikan electropherogram sampel kita, pindailah peak-peaknya apakah

terdapat spasi antara 2 peak yang terlalu rapat atau terlalu renggang, begitu pula
pada spasi antar huruf ACGT yang ada di atas peak. Seperti pada gambar 4
berikut, jarak antara G dan A pada posisi 271 dan 272 lebih renggang dibanding
peak-peak lainnya, ini memang error yang umum pada sequencer kapiler ABI,
namun karena software sudah memprediksi error ini, dimana jarak antara peak G
yang langsung diikuti oleh peak A umumnya lebih besar, maka hasil pembacaan
electropherogram tidak terpengaruh.
[simage=166,160,y,left] [simage=167,160,y,left] [simage=168,160,y,left]
Tetapi terkadang spasi yang terlalu lebar diartikan sebagai ‘N’ oleh software,
padahal secara kasat mata terlihat bahwa tidak ada peak di bawah ‘N’ seperti yang
terlihat pada gambar 5 pada posisi peak 66. Bahkan pada gambar 6 terlihat ada
basa ‘G’ yang disisipkan antara peak 58 dan 60, padahal pada posisi 59 tersebut
yang ada hanyalah peak noise pada baseline, tetapi software membacanya sebagai
‘real peak’. Tentu saja hal ini dapat berakibat fatal terhadap pembacaan
electropherogram.
Peak heterozygous (double)
Idealnya satu posisi peak hanya terdiri atas satu warna saja, namun bisa saja
terjadi satu posisi diisi oleh lebih dari satu warna peak, biasanya jika produk PCR
yang disekuensing berasal dari DNA genom diploid, dimana posisi yang
polimorfik akan memunculkan kedua nukleotida secara simultan. Hasil
pembacaannya bisa jadi ‘N’ atau salah satu peak yang lebih tinggi.
[simage=169,160,y,left] [simage=170,160,y,left]
Gambar 7 merupakan contoh yang sangat jelas akan adanya SNP (single
nucleotide polymorphism) heterozygous, pada kasus ini salah satu alel memiliki
basa C dan satunya lagi T, dan keduanya nampak jelas sebagai dua peak yang
saling menumpuk, dan dibaca oleh software sebagai ‘N’. Sementara itu pada
gambar 8 sekilas tidak nampak adanya SNP karena pada posisi peak 192 terbaca
sebagai C, padahal di situ terdapat pula peak G yang lebih rendah.
Pemindaian dengan mata bisa saja dilakukan untuk mencari peak heterozygous
seperti ini, namun jika jumlah sampelnya sangat banyak tentu menjadi sangat
tidak praktis. Untunglah beberapa software berikut dapat menolong kita
melakukan pemindaian dan mendeteksi adanya peak heterozygous:
 Sequencher (GeneCodes, Inc)

 Mutation Surveyor (SoftGenetics, Inc)
 PHRED/PHRAP/POLYPHRED/CONSED Suite
Pemisahan/Resolusi Peak yang buruk pada bagian akhir

electropherogram
Ini merupakan keterbatasan dari teknologi capillary sequencing yang berbasis

metode dye terminator sequencing. Peak yang sempurna sekalipun hanya
memberikan data yang akurat hingga batas tertentu, selanjutnya peak-peak yang
muncul akan semakin melebar dan bergeser sehingga software maupun mata
manusia akan sulit untuk menginterpretasikan electropherogram tersebut secara
akurat. Hasil pembacaan software pun seringkali tidak dapat diandalkan.
Tergantung dari kualitas sample sequencing, kapiler, polimer serta bahan-bahan
pendukung lainnya, biasanya electropherogram memiliki kualitas peak yang baik
hingga posisi 600-700an, setelah itu kualitasnya makin memburuk.
Pada gambar 9, kualitas peak sudah tidak sebaik yang seharusnya, selain ‘kaki’
yang makin melebar, dua peak sewarna yang berurutan terlihat menyatu, namun
hasil pembacaan software masih akurat dan kita pun masih dapat melihat puncak
masing-masing peak yang terlihat menyatu tersebut, seperti pada posisi 790-791,
792-793, 795-796 dan yang lainnya. Di samping itu jarak/spasi antar peak pun
masih seragam dan tidak terlihat ‘keanehan’.
Lain halnya dengan electropherogram pada gambar 10, peak-peak yang menyatu
sudah tidak nampak lagi masing-masing puncaknya (misalnya posisi 969-970,
973-974), juga muncul ‘N’ pada posisi 982 yang tidak bisa kita pastikan apakah di
situ seharusnya G atau A, dan bisakah kita pastikan berapa jumlah A setelah itu?
Jadi kita harus berhati-hati pada bagian akhir electropherogram, lihatlah apakah
terdapat nukleotida ganda yang seharusnya hanya satu, lalu benarkah hitungan
jumlah nukleotida yang berurutan, dan bahkan kadang-kadang satu nukleotida
yang diapit oleh deretan nukleotida yang sewarna ‘tenggelam’ di bawah peak
yang sangat lebar tadi. Pokoknya jika melihat spasi yang tidak seragam,
waspadalah.
Jika masalahnya sudah terlalu banyak, buang saja bagian tersebut
Jika hasil pembacaan software sudah memiliki banyak error, interpretasi manual
dengan ‘mata kepala sendiri’ sudah sangat sulit dilakukan dan error yang terjadi
sudah di luar toleransi kebutuhan kita, maka abaikan saja sisa sekuen yang
mengandung error tersebut. Hingga batas mana sekuen tersebut akan kita ambil
bergantung pada kebutuhan dan tujuan kita melakukan DNA Sequencing.
Beberapa peneliti yang hanya ingin melihat posisi intro-ekson atau hanya ingin
mengetahui identitas suatu DNA bakteri misalnya, mungkin tidak terlalu
terganggu dengan adanya sedikit error. Namun jika tujuan sequencing tersebut
adalah untuk publikasi ilmiah atau pencarian SNP, maka error yang sedikit saja
tidak dapat ditolerir, hanya sekuen dengan kualitas terbaik saja yang akan diambil.
Untuk mengatasi error yang terjadi, bisa dilakukan dengan cara mensekuen dari
arah sebaliknya, sehingga ambiguitas pada satu arah sekuen bisa diatasi dengan
hasil sekuen komplemennya.
Sumber: The University of Michigan, DNA Sequencing Core

DNA Sequencing

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

DNA Sequencing

Diunggah oleh

Hak Cipta:

Format Tersedia

Sciencebiotech.net Biotek untuk semua(http://sciencebiotech.

Sequence Alignment di BioEdit

Kalau di dunia pengolah kata ada Microsoft Word dan

Pairwise Sequence Alignment

Berikut ini diagram proses yang terjadi dalam proses analisanya.

Pastikan Anda sudah mempersiapkan hal-hal berikut ini:

 Software BioEdit yang sudah terinstall di komputer.

Jika belum ada bisa diunduh secara gratis di

 Dua buah file hasil pembacaan alat DNA Sequencer.

Lanjut! Anda siap untuk memulai.

Menjalankan program BioEdit

 Jalankan program BioEdit dari Start Menu

Perhatikan chromatogram, lihat posisi peak terakhir yang masih menunjukkan

Menghapus bagian sekuen yang tidak perlu

 Pindah ke jendela text sequence yang bersangkutan dan pastikan mode-nya

Menggabungkan 2 sekuen yang akan dialignment dalam satu jendela

 Seleksi Nama salah satu sekuen (misal yang Reverse)

Sekarang kedua sekuen sudah berada dalam satu jendela

Melakukan Reverse Complement untuk menyamakan orientasi sekuen

 Seleksi nama salah satu sekuen (misal yang Reverse)

Melakukan Pairwise Alignment

Membuat Sekuen Konsensus

 Klik “Alignment” > “Create Consensus Sequence”

 Lakukan Pengeditan pada Consensus Sequence dengan membandingkannya

Untuk memudahkan pengeditan, tampilan sekuen bisa diubah ke bentuk titik

Seberapa bersihkah electropherogram kita?

Electropherogram yang bersih memiliki ciri sebagai berikut:

 jarak/spasi antar peak yang sama

Berikut ini adalah contoh electropherogram, coba perhatikan tingkat kebersihan

Signal G:168 A:110 T:160 C:186

Komputer juga bisa salah

Namanya juga komputer, buatan manusia, tentu saja bisa salah

Peak-peak dengan jarak/spasi yang aneh

Cobalah perhatikan electropherogram sampel kita, pindailah peak-peaknya apakah

Peak heterozygous (double)

 Sequencher (GeneCodes, Inc)

Pemisahan/Resolusi Peak yang buruk pada bagian akhir

Ini merupakan keterbatasan dari teknologi capillary sequencing yang berbasis

Jika masalahnya sudah terlalu banyak, buang saja bagian tersebut

Sumber: The University of Michigan, DNA Sequencing Core

Anda mungkin juga menyukai