Makalah
diajukan untuk melengkapi
Tugas Mata Kuliah
Bioinformatika
oleh
PENDAHULUAN
A. Latar Belakang
Sifat dan fungsi protein secara biokimia molekular sangat ditentukan oleh struktur
tiga dimensi (3D) protein. Penentuan struktur 3D protein dapat dilakukan dengan
Resonance dan Mikroskop Elektron. Cara tersebut rumit, lama dan memerlukan biaya
sangat besar untuk penentuan satu struktur protein. Cara penentuan struktur 3D protein
Secara in silico ada 3 (tiga) metode pemodelan struktur 3D protein, yaitu homology
modelling, fold recognition dan ab initio. Metode homology modelling menjadi pilihan
lebih mudah dan lebih cepat dibandingkan fold recognition dan ab initio. Salah satu
Homology modelling banyak digunakan dalam virtual screening obat, disain percobaan
pensejajaran sekuen asam amino protein target dengan protein lain yang telah diketahui
struktur 3D-nya secara instrumentasi. Protein yang sudah diketahui struktur 3D nya
disebut sebagai template. Sekuen protein yang urutan asam aminonya mirip, maka mirip
juga strukturnya.
Komari, N., Hadi, S., & Suhartono, E. (2020) menuliskan berdasarkan website
yang memberikan informasi struktur 3D protein, cukup banyak struktur 3D protein yang
melaporkan jumlah protein yang telah ditemukan sebanyak 167.518 protein. Jumlah ini
relatif sangat sedikit jika dibandingkan dengan data sekuen protein yang ditemukan.
sebanyak 563.082. Hal ini menunjukkan bahwa penelitian penentuan struktur protein lebih
lambat dibanding penelitian tentang sekuen protein. Hal ini mendorong untuk melakukan
penentuan struktur protein dengan metode lain, yaitu metode homology modelling.
Teripang laut (Stichopus japonicus) merupakan salah satu jenis hewan avertebrata
yang mengandung protein tinggi. Kandungan protein dalam teripang dapat mencapai 40%,
seperti yang ditunjukkan oleh hasil penelitian Oedjoe (dalam Kumayanjati, 2020).
Beberapa spesies teripang yang dianalisa memiliki kandungan protein yang cukup tinggi
yaitu berkisar 31,11% sampai 42,32% (Kumayanjati, 2020). Selain itu teripang juga
mukopolisakarida, glukosamine dan condroitin sulfate, mineral dan trace mineral, steroid,
B. Rumusan Masalah
adalah bagaimana cara membuat model struktur 3D dari protein Teripang laut (Stichopus
C. Tujuan Penelitian
Berdasarkan masalah yang telah dijelaskan maka tujuan penelitian ini adalah
server SWISSMODEL.
D. Kegunaan Penelitian
Struktur protein sub unit merupakan suatu informasi yang sangat dibutuhkan dalam
melakukan rekayasa protein. Dimana melalui rekayasa dapat dihasilkan protein yang lebih
stabil dan dapat bekerja dalam kondisi ekstrim. Selain itu dengan rekayasa protein, dapat
menghasilkan jenis protein yang sama seperti yang terdapat pada suatu organisme.
Sehingga untuk mengekstrak sejumlah protein tidak perlu harus mengorbankan banyak
organisme. Tentu saja hal ini sangat membantu dalam dunia industri karena dapat
pada teripang sebagai obat sehingga memungkinkan untuk diproduksi dalam skala
industri.
BAB II
METODE PENELITIAN
Alat yang digunakan dalam penelitian ini adalah laptop Lenovo Intel(R) Core(TM)
i3-8130U CPU @ 2.20GHz 2.21 GHz RAM 8.00 yang terkoneksi dengan internet.
B. Langkah-langkah Penelitian
Adapun tahapan pemodelannya terbagi atas penentuan sekuen target protein, identifikasi
memasukkan kata kunci protein yang akan dicari. Dari hasil-hasil tersebut dapat
langsung di cek apakah sekuen tersebut sudah memiliki struktur 3D atau belum dengan
mengklik bagian struktur. UniProt menunjukkan adanya struktur protein 3D, bila
terdapat link ke RSCB Protein Data Base (https://www.rcsb.org/). Selain itu juga bisa
mengecek langsung pada link RSCB PDB dengan cara menginputkan kode protein dari
UniProt. Sekuen yang akan dijadikan target adalah yang belum memiliki struktur 3D.
Template protein dipilih sesuai dengan parameter identity, QMEAN, dan QSQE.
3. Pembuatan model
Pembuatan model protein dilakukan dengan cara memilih template protein yang
menghasilkan 1 atau lebih model. Model yang dihasilkan dipilih sesuai parameter
4. Evaluasi model
A. Hasil
Protein yang dipilih adalah protein teripang laut (Stichopus Japonicus) yang
sekuen proteinnya telah ditentukan, tetapi struktur 3D nya belum ditentukan. Hasil
pencarian target protein pada database UniProt dengan memasukkan kata kunci
Agustus 2022. Database UniProt menyajikan banyak sekali jenis protein teripang laut.
Sekuen target protein dipilih dari salah satu nama protein yang berdasarkan data
struktur UniProt belum memiliki struktur 3D yang terdaftar di PDB. Pada penelitian ini
Data sekuen ini digunakan untuk pembuatan model struktur 3D protein menggunakan
1.
CSCYPDWMAIPGSGCYKYVDTPKTFEEAESTCRHFSPGPYGFGHLASVHSTEEYEALASM
VPGATDSWNPQVFIGLRLIDGVSPAWTDGSYYDYQNWCGNDPNAHPDGYGAFSGGSYC
NGQWVDVHTFTNDQFPFKCKLPCIE
Sekuen target protein dalam format FASTA seperti pada Gambar 1 di submit
dihasilkan ada 50 template dan 2 model. Pemilihan template didasarkan pada beberapa
parameter antara lain: Coverage, nilai GMQE, nilai QSQE, Identity, Methods, Oligo
Score dan Ligands. Parameter template yang dipilih adalah coverage yang cukup luas,
nilai GMQE tertinggi mendekati 1, nilai QSQE tertinggi mendekati 1, dan nilai identity
diatas 70%. Dari pertimbangan parameter tersebut maka dilakukan pemilihan dengan
memfilter urutan template dari tingkat coverage yang tertinggi ke yang terendah.
Tingkat coverage ini menunjukkan seberapa banyak sekuen yang dapat dicakup oleh
template. Artinya semakin banyak sekuen yang dicakup oleh template, semakin mirip
sekuen tersebut dengan template. Kemudian dipilih template dengan kode 3als.1.A
yang memiliki nilai indentity yang tertinggi. Template dengan kode 3als.1.A
mempunyai nilai Identity 40,58%, nilai parameter GMQE = 0.75, nilai QSQE = 0.24,
metode menggunakan X-Ray Difraction 3.00A dan oligo state-nya adalah homo
tetramer dengan ligan 4xCA Calcium ion (non kovalen). Data sekuen ini direlease pada
Model 1. 3als.1.A Lectin CEL-IV, C-type Crystal structure of CEL-IV dan Model 2.
4. Evaluasi model
Evaluasi struktur model adalah bagian penting dalam pembuatan model. Persen
identity sekuen target dan template adalah penilaian awal terhadap kualitas model.
Semakin besar persen identity antara sekuen dan target, maka model yang dibuat
semakin mendekati yang sebenarnya. Demikian juga dengan nilai GMQE yang
menunjukkan akurasi ketepatan template. Karena itu model yang dipilih adalah yang
memiliki tingkat coverage yang besar, GMQE yang mendekati 1 dan nilai identity yang
cukup tinggi. Maka model yang paling mendekati untuk dipilih adalah Model 1., seperti
Gambar 3.
5. Penilaian Model
pada parameter Ramachandran Plots dan MolProbity Results. Hasil Ramachadran Plots
baik jika residu asam amino secara umum lebih banyak pada daerah favoured
sebesar 90.83% dan daerah outliers 3.24%, artinya model tersebut mempunyai kualitas
Adapun hasil analisis dari model 3als.1.A menunjukkan hasil seperti yang
MolProbity 1.88
Score
Favoured
3.24% B70 PRO, C39 PRO, A79 ILE, D79 ILE, C79 ILE, B79 ILE, B82
VAL, C82 VAL, D82 VAL, A82 VAL, A100 ASN, B100
Ramachandran
ASN, D100 ASN, C100 ASN, A84 PRO, B84 PRO, C84
Outliers
PRO, D84 PRO
Outliers
12 B83 SER, D83 SER, A83 SER, C83 SER, C59 SER, B82
C-Beta
VAL, D59 SER, D82 VAL, A82 VAL, C82 VAL, B59 SER, A59
Deviations
SER
VAL-C62 PRO), D83 SER, (B58 ALA-B59 SER), A83 SER, B49
HIS, C83 SER, C49 HIS, D62 PRO, B62 PRO, D49 HIS, (D99
VAL-C20 ASP), B84 PRO, D84 PRO, A88 ASP, (B36 SER-B37
SER), D126 HIS, (A10 ILE-A11 PRO), D88 ASP, B59 SER, (C5
PRO-C6 ASP), C140 PRO, D44 HIS, A35 PHE, A44 HIS, (C105
HIS, C97 TRP, D34 HIS, (A19 VAL-A20 ASP), (B5 PRO-B6
D106 PRO)
Analisis struktur berdasarkan skor MolProbity, menurut Komari, N., Hadi, S.,
& Suhartono, E. (2020), skor MolProbity adalah kombinasi log-weighted dari clash
score, persentase Ramachandran yang tidak disukai dan persentase rotamer rantai
samping yang buruk. Skor ini menunjukkan satu nilai yang diharapkan untuk
kualitas model tersebut dikatakan lebih baik daripada struktur rata-rata pada resolusi
itu. Resolusi kristalografi template untuk model-1 adalah 3.00 Å dengan MolProbity
1.88. Hal ini menunjukkan bahwa skor MolProbity model-1 (1.88) lebih rendah dari
resolusi kristalografi template untuk model-1 (3.00 Å), maka berdasarkan pendapat
Komari, N., Hadi, S., & Suhartono, E. (2020), struktur model yang dihasilkan dalam
penelitian ini dikatakan lebih baik daripada struktur rata-rata pada resolusi itu.
Parameter lain yang dapat digunakan untuk menilai kualitas model adalah
Nilai QMEAN yang diperoleh dari model-1 adalah -2.36. Secara default, nilai tersebut
diubah menjadi skor-Z untuk menghubungkannya dengan apa yang kita harapkan dari
struktur sinar-X resolusi tinggi. Gambar 4 menggambarkan posisi model pada sebaran
nilai Z.
Gambar 4. Posisi Model (bintang merah) pada sebaran nilai Z
indikator yang dapat digunakan untuk menilai kualitas model, dimana nilai yang baik
adalah -4.0 sampai 0. QMEAN adalah fungsi penilaian gabungan yang dapat
menentukan perkiraan kualitas absolut global (yaitu untuk seluruh struktur) dan lokal
(yaitu per residu asam amino) berdasarkan satu model tunggal. Nilai QMEAN yang
diperoleh dari model 1 adalah -2.36. Karena masih berada pada rentang -4.0 sampai 0,
ini kualitas model yang dihasilkan cukup baik. Secara default, nilai tersebut diubah
menjadi skor-Z untuk menghubungkannya dengan apa yang kita harapkan dari struktur
sinar-X resolusi tinggi. Gambar 4 menggambarkan posisi model pada sebaran nilai Z.
Tanda bintang merah masih berada pada daerah Z-score < 1, artinya kualitas model masih
cukup baik.
Perkiraan kualitas local model per residu asam amino dapat dilihat pada Gambar
5. Grafik tersebut menggambarkan hubungan kesamaan antara residu asam amino model
(sebagai sumbu x) dengan struktur asli (sumbu y). Secara umum residu asam amino yang
terdapat asam amino yang mempunyai skore di bawah 0.6, namun jumlah residu yang
KESIMPULAN
Pemodelan protein dengan sekuen dari UniProt kode Q7M3Y0 dengan metode
3D. Model dengan kode template PDB : 3als.1.A. Evaluasi dan penilaian model-1 pada
Ramachandran Plots memiliki daerah favoured sebesar 90.83%, skor MolProbity sebesar 1.88
dan harga QMEAN -2.36. Model-1 adalah model struktur 3D protein yang bernilai baik.
DAFTAR PUSTAKA
Komari, N., Hadi, S., & Suhartono, E. (2020). Pemodelan Protein dengan Homology Modeling
menggunakan SWISS-MODEL: Protein Modeling with Homology Modeling using SWISS-
MODEL. Jurnal Jejaring Matematika dan Sains, 2(2), 65-70.
Kumayanjati, B. (2020). Teripang Sebagai Salah Satu Sumber Kolagen. Oseana, 45(1), 17-
27.)