Petunjuk Praktikum Sismik
Petunjuk Praktikum Sismik
SISTEMATIKA MIKROBIA
Oleh:
Dr. Enny Zulaikha, MP.
M. Andry
FAKULTAS BIOLOGI
UNIVERSITAS GADJAH MADA
YOGYAKARTA
praktikum ini kita akan menggunakan data hasil pengujian dari artikel penelitian yang
terdapat pada jurnal ilmiah dalam bentuk tabel n x t. Dengan demikian, kita telah
melewati tahapan kerja 13 dan langsung menuju tahapan data coding dan seterusnya.
Tabel 1.1. Kelompok karakter yang digunakan dalam taksonomi numerik bakteri (Priest
& Austin, 1993).
No
Kelompok Karakter
Morfologi kolonial
Morfologi selular
Sifat pertumbuhan
Sifat biokimia
Resistensi terhadap
antibiotik
Kemampuan
penggunaan senyawa
kimia sebagai satusatunya sumber C
Sifat serologis
Sifat kemotaksonomis
9
10
Sifat genetik
Phage typing
Jenis Karakter
Bentuk dan ukuran koloni, pigmentasi larut/tidak larut/
fluoresens.
Sifat pengecatan, bentuk & ukuran sel, motilitas,
ada/tidak nya flagela, ada/tidaknya spora.
Bentuk-bentuk pertumbuhan pada medium cair,
kekeruhan, aerobsis/anaerobsis, kebutuhan vitamin,
kemampuan tumbuh pada medium salinitas tinggi.
Kemampuan fermentasi/oksidasi karbohidrat,
kehadiran enzim katalase & oksidase, penghasilan
asam, indol, & gas H2S.
Kemampuan untuk tumbuh pada medium yang
mengandung antibiotik.
Kemampuan tumbuh pada medium minimal dengan
glukosa/alanin/sitrat sebagai satu-satunya sumber
karbon
Ada/tidaknya reaksi aglutinasi terhadap antiserum
spesifik
Kehadiran komponen sub-selular tertentu, seperti
peptidoglikan, menakuinon, asam mikolat.
Kandungan G+C pada DNA
Ada/tidaknya pola phage typing tertentu
2. Konstruksi Tabel n x t
Berdasarkan tabel n x t yang diperoleh dari artikel jurnal penelitian, selanjutnya kita
membuat tabel n x t sendiri. Tabel n x t dapat dibuat dengan program Microsoft Excel
(MS Excel). Pada MS Excel, strain (n) dimasukan sebagai kolom dan karakter pengujian
(t) dimasukan sebagai baris (Gambar 1.1.). Pengkodean pada tabel n x t menggunakan
sistem biner, yakni notasi 1 dan 0. Notasi 1 diberikan apabila ada kehadiran suatu
sifat dan notasi 0 diberikan untuk ketidakhadiran suatu sifat. Jika dilihat pada Gambar 1
tersebut, kemampuan V. fluvialis untuk dapat tumbuh pada medium dengan kandungan
NaCl 6% menjadikan spesies tersebut mendapatkan notasi 1 pada karakter
Pertumbuhan 6% NaCl. Sebaliknya, V. fluvialis tidak dapat tumbuh pada medium
dengan kandungan NaCl 0% sehingga membuatnya mendapatkan notasi 0 untuk sifat
tersebut. Dalam laporan tertulis atau publikasi ilmiah, penggunaan notasi 1 dan 0
pada n x t sebagai indikasi kehadiran dan ketidakhadiran suatu sifat pada suatu strain
terkesan kurang lazim. Pada umumnya, notasi + dan digunakan sebagai pengganti
1 dan 0. Namun demikian, notasi 1 dan 0 pada n x t dimaksudkan untuk
kepentingan analisis menggunakan program komputer, karena program tersebut tidak
dapat mengenali notasi + dan .
(a)
(b)
Gambar 1.2. (a) Tabel n x t awal, dan (b) modifikasi berupa penambahan baris simbol
strain [a, b, c] dan kolom simbol karakter [1, 2, 3, 4, 5].
Hasil copy akan terlihat seperti berikut:
*L 5 3
a
b
1
0
0
2
1
1
3
1
1
4
0
0
5
0
0
c
0
1
0
0
0
Simpan file tersebut dalam format .mvs dengan memberikan tambahan .mvs pada
akhir nama file dalam menu save. File .mvs tersebut selanjutnya dapat dibuka dengan
program MVSP 3.1. Selanjutnya, masuk ke program MVSP 3.1 dengan membuka
aplikasi mvspw. Pada MVSP, klik File Open dan pilih file .mvs yang tersimpan.
Ketika terbuka, MVSP akan menampilkan sebuah layar tambahan mengenai jumlah
variabel dan jumlah sampel dari file .mvs yang kita masukan. Pada program MVSP, kita
dapat mengubah kembali nama OTU/sampel yang sebelumnya telah diubah menjadi
simbol [a, b, c] dengan menu Data Edit Data. Pengubahan data pada menu
tersebut dapat menerima spasi, namun tidak dapat mencetak miring sebagaimana yang
seringkali dilakukan terhadap nama suatu spesies. Setelah semua simbol OTU diubah
menjadi nama spesiesnya, kita dapat menutup layar Edit Data tersebut dan memulai
analisis klaster.
Analisis klaster dilakukan melalui menu Analyses Cluster Analysis.
Pada layar Cluster Analysis, kita dapat menentukan jenis perhitungan indeks
similaritas dan analisis klaster yang diinginkan. Dalam praktikum ini kita akan mencoba
menggunakan dua jenis perhitungan indeks similaritas (SSM dan SJ) dan metode
pengklasteran average linkage / UPGMA. Pada metode pengklasteran, kita juga
dapat memilih single linkage / nearest neighbour atau complete linkage /
farthest neighbour. Setelah selesai memilih perhitungan indeks similaritas dan
metode pengklasteran pada submenu Options, kita dapat memilih output analisis pada
menu Advanced. Pada submenu Advanced, kita dapat menentukan penampilan hasil
analisis
pada
kolom
result
to
display.
Nyalakan
pilihan
Similarity/distance
matrix, Clustering
report, dan Text
dendrogram. Setelah semuanya selesai, maka klik OK.
Hasil analisis akan memunculkan dua layar, yakni layar pertama yang berisikan
matriks similaritas dan analisis klaster serta layar kedua yang menampilkan dendrogram.
Untuk memudahkan analisis selanjutnya, disarankan untuk meng-copy seluruh isi layar
pertama yang menyerupai layar Excel ke program MS Excel. Gambar dendrogram dapat
dijadikan file gambar (image file) dengan File Export.
4. Analisis Korelasi-Kofenetik
Analisis korelasi-kofenetik dilakukan untuk melihat tingkat akurasi suatu
dendrogram yang merepresentasikan matriks similaritas antar OTU. Analisis ini
membandingkan dua jenis matriks similaritas, yakni matriks similaritas awal (unsorted)
dan matriks similaritas yang diturunkan dari dendrogram (sorted). Analisis ini dapat
dilakukan dengan program MS Excel. Sebelum mengisikan nilai-nilai dari kedua matriks
similaritas, kita perlu membuat pasangan OTU terlebih dahulu. Jumlah kemungkinan
pasangan OTU yang dapat dibentuk dari n-OTU dijabarkan dengan rumus kombinasi:
Pada contoh diatas, kita dapat menghasilkan 3 jenis kemungkinan pasangan dari total 3
OTU, yakni [a,b], [a,c], dan [b,c]. Setelah semua kemungkinan pasangan dituliskan,
masukan nilai untuk kolom unsorted, yakni nilai similaritas dari matriks similaritas awal
dan kemudian nilai untuk kolom sorted yang berasal dari dendrogram / analisis klaster.
Dari hasil MVSP kita memperoleh matriks similaritas:
V. fluvialis
V. fluvialis
1.000
V. furnisii
1.000
V. natriegens 0.500
V. furnisii
1.000
0.500
V. natriegens
1.000
Objects
Group 2
Simil.
in group
V. furnisii
1.000
2
V. natriegens 0.500
3
A. Pengantar
Selain data fenotipik, data berupa profil sidik jari molekular (molecular fingerprints)
juga dapat digunakan dalam studi taksonomi mikrobia. Profil yang digunakan dapat
berasal dari DNA, RNA, atau protein. Studi klasifikasi menggunakan profil sidik jari
molekular termasuk ke dalam studi kemosistematik bersama dengan analisis komponen
selular lainnya (Priest & Austin, 1993). Teknik yang paling umum digunakan dalam studi
klasifikasi berdasarkan profil sidik jari molekular adalah restriction fragment length
polymorphisms (RFLP). Prinsip dasar dari penggunaan RFLP adalah adanya kesamaan
situs restriksi antara satu mikroorganisme dengan mikroorganisme lainnya yang dapat
dikenali oleh enzim restriksi endonuklease tertentu. Hal ini berarti bahwa distribusi situssitus restriksi tersebut dapat memberi gambaran mengenai kemiripan antara satu
mikroorganisme dengan lainnya secara molekular.
B. Cara Kerja
Seperti halnya pada praktikum acara 1, data yang dipakai dalam praktikum acara 2
ini diperoleh dari artikel penelitian yang terdapat pada jurnal ilmiah dalam bentuk
elektroforegram (foto elektroforesis).
1. Penelusuran Sumber Data
Data yang digunakan dalam praktikum ini berupa elektroforegram sidik jari
(fingerprint) molekular. Data fingerprint tersebut dapat berupa hasil ribotyping, RFLP,
RAPD, dan lainnya. Elektroforegram dari suatu artikel jurnal dapat di-crop menggunakan
program PDF reader seperti Adobe Reader melalui menu Tools Select & Zoom
Snapshot Tool. Buat file gambar (image file) format JPEG atau PNG dari
elektroforegram tersebut dengan memblok elektroforegram yang diinginkan dan copy
(ctrl+C) ke program Paint.
2. Pembuatan Diagrammatic Representative
Diagrammatic representative merupakan sebuah gambaran skematis yang mewakili
elektroforegram yang dianalisis. Penggunaan diagrammatic representative ini barfungsi
untuk mempertegas kehadiran atau ketidakhadiran suatu band dalam elektroforegram.
Kejelasan mengenai hadir atau tidaknya sebuah band merupakan hal yang penting karena
band tersebut diasumsikan sebagai karakter dalam data coding.
Pembuatan diagrammatic representative dapat dilakukan dengan program photo
editor seperti Corel Draw, Adobe Photoshop, atau Paint Shop Pro. Secara umum,
tahapan pembuatannya meliputi input gambar, penambahan layer transparan, dan
menggambarkan suatu garis pada layer transparan tersebut yang berpandu pada band
elektroforegram dibawahnya. Dalam praktikum ini program Paint Shop Pro (PSP) akan
digunakan untuk pembuatan diagrammatic representative ini. Pertama, buka program
PSP dan masukan file gambar elektroforegram yang telah dibuat sebelumnya melalui
menu File Open. Setelah gambar elektroforegram muncul, akan terdapat suatu kotak
bertuliskan Layer pada sisi sebelah kanan. Apabila kotak ini tidak muncul, kita dapat
memunculkannya melalui ikon Toggle Layer Palette pada sisi atas, ikon kedua
dari kanan. Pada layer palette tersebut, gambar yang kita masukan sebelumnya
dikategorikan sebagai Background. Kita dapat menambahkan layer baru dengan
menekan ikon Add New Layer yang terletak pada pojok kiri bawah layer
palette. Sebuah layer baru yang muncul akan diberi nama Layer 1 secara otomatis
dan terletak di atas layer Background. Klik ikon Layer 1 untuk mengaktifkannya
dan Pada Layer 1 inilah kita akan membuat diagrammatic representative dari
elektroforegram.
Setelah memilih Layer 1, aktifkan control palette dengan menekan ikon Toggle
Control Palette yang terletak 3 ikon di sebelah kiri Toggle Layer Palette.
Menu control palette berfungsi untuk mengatur jenis, ketebalan, bentuk, dan ukuran
brush tip yang akan digunakan untuk mewarnai Layer 1 berdasdarkan cetakan yang
ada pada elektroforegram. Sebelum mengatur apapun yang ada pada control palette,
aktifkan Paint Brushes yang terletak pada tool palette (menu di pojok kiri).
Pemilihan warna dapat dilakukan pada color palette (menu di pojok kanan). Kedua menu
tersebut masing-masing dapat diaktifkan melalui Toggle Tool Palette dan
Toggle Color Palette. Menu Control Palette terdiri atas dua submenu,
yakni Tool Controls dan Brush Tip. Untuk sementara, abaikan dahulu submenu
Tool Controls dan masuk ke submenu Brush Tip. Pada submenu Brush Tip
terdapat pilihan Shape, Size, Opacity, Hardness, Density, dan Step yang
masing-masing berfungsi untuk mengatur jenis kuas, ukuran kuas, ketebalan warna,
ketegasan bentuk kuas, kepadatan warna, dan gradasi kuas. Hasil pengaturan enam
parameter ini langsung ditampilkan pada layar di kiri atas submenu Brush Tip.
Sebagai contoh, pengaturan Brush Tip yang digunakan meliputi Shape:
Horizontal, Opacity: 25, Hardness: 50, Density: 100, dan Step: 1.
Size yang digunakan bergantung pada ukuran image file yang digunakan. Sebelum
mulai membuat diagrammatic representative, sebaiknya kita mengujikan hasil pengaturan
pada submenu Brush Tip untuk melihat kecocokannya langsung pada Layer 1.
Hasil pengujian kemudian dapat dihapus dengan mengaktifkan ikon Eraser pada tool
palette. Bentuk dan ukuran Eraser juga diatur pada menu Control Palette yang
sama dengan Brush Tip. Hasil penggambaran dapat dilihat pada Gambar 2.1.
Setelah penggambaran selesai dilakukan, simpan file tersebut (PSP akan secara
otomatis menyimpannya dalam format .psp). File .psp ini juga dapat dibuka dengan
program image viewer seperti ACDSee. Diagrammatic representative yang ditampilkan
adalah hasil penggambaran yang dilakukan tanpa menyertakan background foto
elektroforegram.
Gambar 2.1. (a) Elektroforegram awal yang dijadikan latar belakang/background dan (b)
hasil penggambaran yang berpandu pada latar belakang tersebut.
Dengan demikian, kita dapat menghilangkan foto elektroforegram dengan meng-klik
ikon Background pada Layer Palette dan kemudian Delete. Hasilnya hanya
akan tersisa pita-pita berwarna hasil penggambaran sebelumnya (Gambar 2.2). Simpan
kembali file ini dalam format .jpg (gunakan menu Save As) dengan nama lain agar
tidak mengganti file sebelumnya.
Gambar 2.2. (a) Elektroforegram dan (b) diagrammatic representative yang dihasilkan
dari elektroforegram tersebut.
3. Data Coding dan Analisis
Diagrammatic representative yang dihasilkan merupakan sumber untuk data coding.
Dalam hal ini, setiap pita yang tergambarkan pada diagrammatic representative
merupakan karakter, sehingga total seluruh pita dari seluruh strain mencerminkan jumlah
karakter (t) pada tabel n x t. Konversi diagrammatic representative menjadi tabel n x t
dapat dilakukan secara intuitif dengan melihat kesejajaran pita antar strain dan
menggolongkan pita-pita yang sejajar sebagai satu karakter (Gambar 2.3). Namun
demikian, apabila jumlah pita terlalu banyak maka diperlukan garis bantu untuk melihat
kesejajaran antar pita. Garis bantu tersebut dapat dibuat pada program Paint. Buka file
gambar diagrammatic representative dalam format .jpg dengan program Paint dan klik
ikon Line yang terletak pada bagian atas. Setelah itu buat garis dari ujung kiri ke ujung
kanan gambar dimulai dari pita teratas. Pita-pita yang bersinggungan dengan garis
tersebut dinyatakan sejajar dan menempati karakter yang sama.
10
11
TAKSONOMI FILOGENETIK
Acara 3 Klasifikasi Molekular Filogenetik Berdasarkan Gen 16S rRNA
A. Pengantar
Klasifikasi molekular filogenetik merupakan klasifikasi yang disusun dengan
mempertimbangkan jalur evolusi setiap organisme yang dikaji. Hal ini berbeda dengan
klasifikasi fenetik yang hanya melihat hubungan antar organisme berdasarkan karakter
yang ada pada saat ini (Priest & Austin, 1993). Dalam prosesnya, klasifikasi molekular
filogenetik menggunakan data berupa urutan (sequence) nukleotida pada DNA atau asam
amino pada protein. Sequence nukleotida yang digunakan dalam klasifikasi molekular
filogenetik harus merupakan sequence yang diwariskan langsung oleh nenek moyang
(homolog) serta memiliki kesamaan sejarah evolusi. Sebuah sequence dapat disebut
sebagai marker molekular apabila memenuhi persyaratan berupa: (1) terdistribusi pada
seluruh organisme, (2) memiliki kesetaraan fungsi pada seluruh organisme, dan (3)
memegang peranan vital bagi kehidupan organisme. Hal ini menjadikan marker
molekular merupakan sequence yang tepat untuk digunakan dalam studi klasifikasi
filogenetik.
Gen 16S rRNA merupakan salah satu contoh marker molekular karena terdapat pada
organisme baik yang berada pada domain Bacteria, Archaea, serta Eukarya. Saat ini,
informasi mengenai sequence gen 16S rRNA sudah sangat banyak tersedia pada database
internasional dan juga sudah dijadikan standar penetapan suatu spesies baru dalam studi
taksonomi. Pada praktikum ini kita akan mencoba mengklasifikasikan sejumlah bakteri
dengan cara merekonstruksi pohon filogenetik berdasarkan sequence gen 16S RNA yang
dimiliki.
B. Cara Kerja
3.1.1. Persiapan Data
Data yang digunakan dalam klasifikasi berbasis molekular filogenetik adalah berupa
urutan (sequence) nukleotida atau asam amino. Kedua jenis sequence ini umumnya dapat
diperoleh dari hasil sequencing DNA/protein maupun dari sequence database
internasional yang tersedia di internet. Untuk kemudahan dalam praktikum ini, kita akan
menggunakan cara kedua, yakni mengunduh sequence nukleotida/asam amino dari
internet. Saat ini sudah banyak sekali situs yang memfasilitasi hal tersebut. Situs
GenBank, DDBJ, serta EMBL merupakan situs dimana pencarian sequence
nukleotida/asam amino umumnya dilakukan. Dalam acara praktikum ini, kita akan
mencoba mengunduh data melalui GenBank (http://www.ncbi.nlm.nih.gov/Genbank/)
dan untuk selanjutnya sequence DNA akan digunakan sebagai contoh persiapan data.
Pada GenBank kita dapat mencari sequence DNA berdasarkan nama gen, spesies
pemilik gen, atau accession number pada kolom search yang tersedia. Accession number
12
merupakan penanda/identitas dari setiap sequence DNA yang telah disimpan pada situs
tersebut. Pada umumnya accession number tertulis pada artikel publikasi ilmiah yang
penelitinya telah menyumbangkan hasil sequencing-nya ke database yang ada. Pencarian
pada menu search di GenBank terdiri dari banyak menu sub-pencarian untuk
memudahkan penelusuran data, namun dalam praktikum ini kita akan lebih fokus pada
pencarian dengan menu Nucleotide, Protein, dan Genome. Sebagai contoh, apabila kita
ingin melakukan pencarian gen 16S rRNA bakteri Escherichia coli maka kita dapat
melakukan salah satu dari hal berikut:
1. Melakukan penelusuran pustaka, misalnya pada artikel jurnal untuk mendapatkan
accession number. Sebagai contoh, Escherichia coli ATCC 11775T pada Bergeys
Manual of Systematic Bacteriology (Brenner et al., 2005) memiliki accession number
X80725. Accession Number ini dapat diketikan pada kolom search nucleotide.
Cara ini merupakan pencarian yang cukup spesifik karena setiap sequence dari setiap
jenis organisme memiliki accession number tersendiri.
2. Melakukan penelusuran pada situs List of Prokaryotic names with Standing in
Nomenclature (LPSN, http://www.bacterio.cict.fr/). Penelusuran melalui situs ini
khusus untuk pencarian sequence bakteri dan archaea saja. Informasi yang diberikan
mengenai suatu genus/spesies meliputi type species, type strain, tahun ditemukan, dan
publikasi (valid/efektif) terkait genus/spesies tersebut.
3. Melakukan penelusuran pada kolom search nucleotide di GenBank dengan
mengetik kata kunci, seperti Escherichia coli 16S rRNA. Cara ini kurang spesifik
karena akan menghasilkan sejumlah daftar yang berisikan berbagai macam spesies
bakteri yang mengandung sequence gen 16S rRNA dan kita harus mencarinya satu per
satu.
4. Melakukan penelusuran pada kolom search genome di GenBank dan kemudian
mengetik nama spesies yang kita inginkan. Umumnya hasil penelusuran meliputi
sejumlah daftar complete genome dari spesies yang dicari. Kita dapat mencari gen
yang diinginkan dalam daftar complete genome tersebut. Cara ini cukup memakan
waktu, namun kita dapat menelusuri berbagai jenis gen dari spesies tersebut.
Contoh Hasil pencarian dengan accession number X80725 akan ditampilkan sebagai
berikut:
E.coli (ATCC 11775T) gene for 16S rRNA
GenBank: X80725.1
FASTA Graphics
LOCUS
X80725
1450 bp
DNA
linear
BCT 29-MAR-1996
DEFINITION E.coli (ATCC 11775T) gene for 16S rRNA.
ACCESSION
X80725
VERSION
X80725.1 GI:1240022
13
KEYWORDS
16S ribosomal RNA; 16S rRNA gene; 16S small
subunit ribosomal RNA.
SOURCE
Escherichia coli DSM 30083
ORGANISM Escherichia coli DSM 30083
Bacteria; Proteobacteria; Gammaproteobacteria;
Enterobacteriales;
Enterobacteriaceae; Escherichia.
REFERENCE
1
AUTHORS
Cilia,V., Lafay,B. and Christen,R.
TITLE
Sequence heterogeneities among 16S ribosomal RNA
sequences, and their effect on phylogenetic analyses at the
species level
JOURNAL
Mol. Biol. Evol. 13 (3), 451-461 (1996)
PUBMED
8742634
REFERENCE
2 (bases 1 to 1450)
AUTHORS
Lafay,B.
TITLE
Direct Submission
JOURNAL
Submitted (26-JUL-1994) B. Lafay, CNRS &
Universite Paris 6,Station Zoologique, Observatoire
Oceanologique, Villefranche Sur
Mer, 06230, FRANCE
FEATURES
Location/Qualifiers
source
1..1450
/organism="Escherichia coli DSM 30083"
/mol_type="genomic DNA"
/strain="ATCC 11775T"
/db_xref="taxon:866789"
gene
1..1450
/gene="16S rRNA"
rRNA
1..1450
/gene="16S rRNA"
/product="16S ribosomal RNA"
ORIGIN
1
agtttgatca tggctcagat tgaacgctgg cggcaggcct aacacatgca
agtcgaacgg
61 taacaggaag cagcttgctg ctttgctgac gagtggcgga cgggtgagta
atgtctggga
121 aactgcctga tggaggggga taactactgg aaacggtagc taataccgca
taacgtcgca
181 agcacaaaga gggggacctt agggcctctt gccatcggat gtgcccagat
gggatta...
14
Tulisan diatas mengandung informasi mengenai jenis sequence, asal sequence, produk
yang dihasilkan, dan sequence itu sendiri. Dalam contoh ini jenis sequence adalah gen
16S rRNA yang berasal dari Escherichia coli ATCC 11775T. Gen ini akan menghasilkan
produk berupa RNA ribosomal (rRNA). Informasi mengenai hasil pengkodean dari
sequence dapat dilihat pada FEATURES. Sequence dari DNA itu sendiri yang dituliskan
per 10 nukleotida pada kolom ORIGIN. Sequence ini selanjutnya dapat diunduh dalam
bentuk FASTA dengan cara meng-klik link FASTA pada baris ketiga, dan akan muncul:
E.coli (ATCC 11775T) gene for 16S rRNA
GenBank: X80725.1
GenBank Graphics
>gi|1240022|emb|X80725.1| E.coli (ATCC 11775T) gene for 16S
rRNA
AGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGG
TAACAGGAAGCAGCTTGCTGCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGA
AACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCA
AGCACAAAGAGGGGGACCTTAGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTA...
Kedua jenis data ini (informasi sequence dan sequence FASTA) dikompilasi ke masingmasing arsip untuk membuat database sendiri.
1. Sequence Alignment dengan Program ClustalX 2.1 (Larkin et al., 2001)
Alignment bertujuan untuk menata sequence agar satu sama lain diletakkan sesuai
dengan posisi homologi antar sequence. Hanya berdasarkan alignment inilah kita dapat
membandingkan antar sequence gen 16S rRNA dari masing-masing strain mikrobia yang
akan diklasifikasikan. Alignment menggunakan program ClustalX dilakukan dengan
mempersiapkan data sequence dalam format FASTA. Dataset sejumlah sequence yang
telah didapatkan dikumpulkan terlebih dahulu ke dalam 1 file Notepad dengan awalan
dari setiap sequence diberikan tanda >. Contohnya dapat dilihat pada sequence berikut:
>Allochromatium vinosum DSM 180
agagtttgatcctggctcagattgaacgctggcggcatgcctaacacatgcaa...
>Chlorobium luteolum DSM 273
aggaaagcggcttcggccgggagtacttggcgcaagggtgagtaaggcatagg...
>Chloroflexus aurantiacus J-10-fl
aaaggaggtgatccagccgcaccttccggtacggctaccttgttacgacttcg...
Penamaan dalam pembuatan dataset sequence ini juga perlu diperhatikan. Disarankan
untuk menyingkat nama dari setiap sequence yang ada karena program ClustalX akan
secara otomatis memotong karakter nama apabila melebihi 30 karakter. Selain itu, hasil
alignment ClustalX yang akan digunakan dalam program Phylip (.phy) juga akan secara
otomatis memotong karakter nama apabila melebihi 10 karakter. Hal ini akan
membingungkan apabila pembeda antar nama sequence satu dengan lainnya terletak pada
15
posisi karakter >10, karena ketika dipotong akan menghasilkan nama yang sama antar
sequence satu dengan lainnya. Dengan demikian, sebaiknya kita membuat daftar baru
(dengan MS Word atau Notepad) yang berisi rincian nama sequence beserta
singkatannya. Singkatan nama ini yang akan kita gunakan dalam dataset yang akan
diproses dalam ClustalX. Contoh dataset diatas setelah namanya disingkat akan menjadi:
>AvinDSM180
agagtttgatcctggctcagattgaacgctggcggcatgcctaacacatgcaa...
>ClutDSM273
aggaaagcggcttcggccgggagtacttggcgcaagggtgagtaaggcatagg...
>ChaurJ-10-fl
aaaggaggtgatccagccgcaccttccggtacggctaccttgttacgacttcg...
Perlu diperhatikan bahwa pemberian nama tidak boleh mengandung spasi. Penyingkatan
nama sequence hingga satu karakter (A-Z) sebaiknya tidak dilakukan karena akan
membuat program ClustalX salah mengenali karakter nama menjadi salah satu
komponen sequence nukleotida atau asam amino. Jadi, contoh seperti:
>A
caaaatggagagtttgatcctggctcaggatgaacgctggcggcgtgcttaac...
tidak boleh dilakukan karena nama A akan disalahartikan sebagai nukleotida oleh
ClustalX. Dataset yang telah siap selanjutnya disimpan dan selanjutnya dimasukan ke
dalam ClustalX. Pertama buka program ClustalX, File Load Sequences. Pilih
file dataset yang telah disimpan dan program tersebut akan secara otomatis menampilkan
nama sequence pada kolom sebelah kiri dan sequence-nya di kolom sebelah kanan
(Gambar 3.1).
16
Sebelum melakukan alignment, kita harus terlebih dahulu mengatur file output yang akan
dihasilkan. Program ClustalX dapat menghasilkan beberapa macam format file dari satu
jenis dataset, yakni: CLUSTAL, GCG/MSF, GDE, NBRF/PIR, NEXUS dan PHYLIP.
Masing-masing file output ini mempunyai kegunaan masing-masing karena diperlukan
oleh program-program analisis lainnya. Dalam praktikum ini kita hanya akan
menggunakan format CLUSTAL (.aln), GDE (.gde), dan PHYLIP (.phy). Pada program
ClustalX, pilih Alignment Output Format Options klik GDE FORMAT,
dan PHYLIP FORMAT CLOSE. Setelah itu pilih Alignment Do Complete
Alignment.
3.1.2. Rekonstruksi Pohon Filogenetik dengan PHYLIP v3.6.9 (Felsenstein, 2005)
Rekonstruksi dengan program ini membutuhkan file input dalam format .phy yang
dapat dihasilkan oleh program ClustalX atau MEGA. Program Phylip memiliki
serangkaian aplikasi executeable yang dapat menganalisis data sequence dengan berbagai
algoritme. Aplikasi yang terdapat pada Phylip antara lain:
clique
concense
contml
contrast
dnacomp
dnadist
dnainvar
dnaml
dnamlk
dnamove
dnapars
dnapenny
dollop
dolmove
dolpenny
draw
drawgram
drawtree
factor
fitch
gendist
main
mix
move
neighbor
pars
penny
proml
promlk
protdist
protpars
restdist
restml
retree
seqboot
treedist
17
18
19
20
Data sekuens dalam format FASTA dari Notepad kita salin pada blank sequence
dengan cara Ctrl+N untuk menambak kotak blank sequence. Nama Sequence 1,
Sequence 2, dst. dapat diganti dengan nama strain asli. Pada kotak sebelah nama
strain ditempelkan data sekuen nukleotida. Basa T dengan kotak warna merah,
basa G dengan kotak warna ungu, basa A dengan kotak warna hijau, dan basa C
dengan kotak biru.
Gambar 3.3. Proses memasukkan nucleotide sequence pada kolom blank sequence.
21
22
31
62
99
98
59
100
81
88
15
86
17
41
51
0.005
23
DAFTAR PUSTAKA
Brenner, D. J., N. R. Krieg, J. T. Staley & G. M. Garrity. 2005. Bergey's manual of
systematic bacteriology 2nd edition, volume 2: The Proteobacteria, Part B: The
Gammaproteobacteria. Springer Pub.: USA.
Chun, J. 1995. Computer-assisted clasification and identification of actinomycetes. Ph.D.
Thesis. University of Newcastle, UK.
Felsenstein, J. 2005. PHYLIP (Phylogeny Inference Package) version 3.6. Distributed by
the author. Department of Genome Sciences, University of Washington, Seattle,
USA.
Goodfellow, M. 1997. Microbial Systematics. In Microbiology and Medical
Microbiology. University of Newcastle Upon Tyne.
Kovach, W.L., 2007. MVSP - A MultiVariate Statistical Package for Windows, ver. 3.1.
Kovach Computing Services, Pentraeth, Wales, U.K.
Larkin, M. A., G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H.
McWilliam, F. Valentin, I. M. Wallace, A. Wilm, R. Lopez, J. D. Thompson, T. J.
Gibson, & D. G. Higgins.2007. Clustal W and Clustal X version 2.0.
Bioinformatics 23: 29472948.
Page, R. D. M. 1996. TREEVIEW: An application to display phylogenetic trees on
personal computers. Computer Applications in the Biosciences 12: 357358.
Priest, F. & B. Austin. 1993. Modern Bacterial Taxonomy 2nd Edition. Chapman & Hall
Pub.: England.
Sembiring, L. 2002. Sistematika Mikrobia (BIO 668) Petunjuk Praktikum. Fakultas
Biologi, Universitas Gadjah Mada, Yogyakarta, Indonesia.
Sembiring, L. 2002. Sistematika Molekular (BIO 765) Petunjuk Praktikum. Fakultas
Biologi, Universitas Gadjah Mada, Yogyakarta, Indonesia.
West, P. A., P. R. Brayton, T. N. Bryant, & R. R. Colwell. 1986. Numerical taxonomy of
vibrios isolated from aquatic environments. International Journal of Systematic
Bacteriology 36 (4): 531543.
24