Pendahuluan
Metabolisme sekunder bakteri dan fungi terdiri dari senyawa bioaktif yang kaya dan
berpotensi pada bidang farmasi, terdiri dari jalur biosintesis banyak bahan kimia yang telah
dan sedang digunakan seperti antibiotik, obat dengan kolesterol rendah atau obat antitumor.
Menariknya, gen-gen yang mengkodekan jalur biosintetik dan bertanggung jawab untuk
produksi metabolit sekunder sangat sering secara spasial terkluster bersama-sama pada posisi
tertentu pada kromosom. Arsitektur genetik ini telah membuka kemungkinan untuk
kemudahan deteksi jalur biosintesis metabolit sekunder melalui menempatkan kluster gengennya. Pada saat ini, pengeluaran untuk sekuensing bakteri dan fungi telah menurun secara
dramatis, dan banyak sekuensing genom tersedia. Berdasarkan pada profile hidden Markov
models dari gen-gen yang spesifik pada tipe kluster gen tertentu, antiSMASH dapat secara
akurat mengidentifikasi kluster gen yang mengkodekan metabolisme sekunder dari semua
kelas kimia yang diketahui. antiSMASH tidak hanya mendeteksi kluster gen tapi juga
menawarkan analisis sekuens secara detail.
Laman awal antiSMASH
1. Input nukleotida
2. Input Protein
Rapid
Annotation
using
Subsystem
Technology
(RAST)
untuk
Data yang dimasukkan haruslah diformat dengan tepat. Jika data GBK/EMBL/FASTA
dibuat secara manual, lakukanlah dalam editor teks yang polos seperti Notepad atau Emacs,
dan simpanlah data tersebut sebagai "All files (*.*)", diakhiri dengan ekstensi yang benar
(contohnya ".fasta", ".gbk", or ".embl"). Ada beberapa analisis pilihan yang dapat atau tidak
dapat berjalan pada sekuens yang dimasukkan. Yang paling direkomendasikan adalah Gene
Cluster Blast Comparative Analysis, yang menjalankan BlastP menggunakan masing-masing
sekuens asam amino dari kluster gen yang dideteksi sebagai query pada database yang besar
pada sekuens protein yang diprediksi dari kluster gen biosintesis metabolit sekunder dan
mengelompokkan hasil-hasil untuk mengidentifikasi kluster gen yang paling homolog dengan
kluster gen yang dideteksi pada sekuens nukleotida tersebut. Analisis ini dipilih oleh default.
Tersedia juga analysis of secondary metabolism gene families (smCOGs). Analisis ini
mencoba untuk mengalokasikan masing-masing gen dalam kluster gen yang dideteksi
menjadi famili gen metabolisme sekunder spesifik menggunakan model profil hidden Markov
yang spesifik untuk karakteristik conserved sequences pada famili ini. Selanjutnya, sebuah
pohon filogenetik dirancang untuk masing-masing gen bersama (maks. 100) dengan sekuens
seed alignment smCOG. Analisis ini dipilih oleh default.
Untuk banyak analisis genom yang teliti, tersedia analisis genom PFAM HMM untuk
semua gen dalam genom melalui modul CLUSEAN pipeline. Tentu saja, beberapa daerah
penting untuk metabolisme sekunder mungkin saja meleset dalam tahapan identifikasi kluster
gen (cth: karena daerah tersebut mewakili jalur biosintesis dari metabolisme sekunder yang
belum diketahui). Oleh karena itu, ketika analisis genom PFAM HMM dipilih, frekuensi
PFAM juga digunakan untuk menemukan semua daerah genom yang mana domain PFAM
khas untuk metabolisme sekunder berada. Keseluruhan analisis genom PFAM HMM dipilih
oleh default.
Keluaran antiSMASH
Keluaran dari analisis antiSMASH disusun dalam laman interaktif HTML dengan grafik SVG
(Scalable Vector Graphics), dan bagian yang berbeda dari analisis ditampilkan dalam panel
yang berbeda untuk setiap klaster gen. Contoh output dari data genom Streptomyces
coelicolor A3(2).
Awalnya, sebuah daftar cluster yang telah diidentifikasi ditampilkan pada laman hasil.
Sebuah kluster gen dapat dipilih untuk dilihat dengan mengeklik nomornya (kluster gen
dinomori sesuai urutan yang mana kluster ini muncul pada sekuens nukleotida yang
dimasukkan) pada panel Select Gene Cluster yang berada diatas banner bagian atas atau
dengan mengeklik kotak berwarna Cluster XX. Klik pada tombol Overview akan menuju
ke laman daftar overview. Tombol kluster gen berwarna dan dikodekan dengan prediksi
metabolit sekunder.
Pada panel paling atas, Gene cluster description, informasi yang diberikan adalah
tentang masing-masing gen cluster yang telah terdeteksi. Pada garis yang paling atas, tipe dan
lokasi biosintesis dari kluster gen ditampilkan. Disebelah bawah garis judul ini, semua gen
yang ada pada kluster gen yang dideteksi digaris besar. Batas kluster gen dihitung
menggunakan pilihan potongan yang berbeda per tipe gen kluster. Gen-gen biosintesis putatif
diwarnai dengan warna merah, transpor gen-gen yang berhubungan diwarnai biru, dan gengen yang regulasinya berhubungan diwarnai hijau. Prediksi-prediksi ini berdasarkan pada
smCOG yang secara fungsional dapat hilang jika memilih prengaturan untuk tidak
menjalankan prediksi smCOG. Jika menempatkan mouse pada gen, maka akan muncul nama
gen yang akan ditampilkan diatas gen. Mengeklik gen akan menyediakan banyak informasi
tentang gen tersebut: anotasinya, smCOG (secondary metabolism gene family), lokasinya,
dan hubungan spesifik gen tersebut.
Pada panel yang tengah, Detailed annotation, dapat menemukan informasi lebih dalam
pada kluster gen yang dipilih. Untuk prediksi modular polyketide synthase (PKS) dan/atau
protein nonribosomal peptide synthetase (NRPS), dapat memilih domain anotasi. Klik pada
gambar domain akan memberikan informasi lebih untuk ditampilkan, seperti nama pada
domain yang dideteksi, lokasi yang tepat, setiap kekhususan substrat yang diprediksi, dan
link untuk menjalankan Blast pada domain. Untuk klaster Lantipeptide yang diprediksi,
prediksi sekuens inti peptida pada semua prepeptida yang diidentifikasi ditampilkan
Pada panel yang paling bawah. Homologous gene cluster, menampilkan sepuluh
kluster gen teratas dari internal database antiSMASH yang paling mirip dengan kluster gen
yang dideteksi, secara visual sejajar dengannya. Menu seleksi yang dibawah dapat digunakan
untuk mengunduh kluster gen. Gen-gen dengan warna yang sama adalah homolog putatif
berdasarkan Blast yang signifikan diantara mereka.
Pada panel samping paling atas sebelah kanan. "Predicted core structure". Adalah prediksi
kasar dari keseluruhan struktur kimia dari produk dari kluster gen biosintesis nonribosomal
peptide atau polyketide yang diberikan, bersama dengan detail prediksi untuk semua
monomer detail prediksi tersedia untuk berbagai metode. Spesifitas domain PKS AT
diprediksi menggunakan 24 sekuens asam amino pada situs aktifnya, sama dengan pHMMs
berdasarkan metode Minowa et al yang juga menggunakannya untuk memprediksi spesifitas
Pada bagian kanan paling atas, sebuah tombol kecil menyajikan fungsi lebih lanjut. Tombol
berbentuk rumah akan menuju ke laman mulai antiSMASH. Tombol tanda tanya akan menuju
ke laman bantuan. Tombol tanda seru akan menuju ke lama penjelasan tentang antiSMASH.
Arah panah yang menunjuk kebawah akan membuka menu untuk mendowload kumpulan
hasil lengkap dari antiSMASH, data ringkasan excel dan data keluaran ringkasan
EMBL/GenBank. Data EMBL/GenBank dapat dilihat pada browser genom seperti Artemis.