Ditujukan untuk memenuhi salah satu tugas mata kuliah Toksikologi Lingkungan
Disusun oleh :
BANDUNG
2021
1. PENDAHULUAN
QSAR awal yang dipelopori oleh Hanch dan Fugita yang terdiri dari sejumlah kecil
molekul kemotipe tertentu yang digunakan untuk menurunkan persamaan linier sederhana untuk
memprediksi molekul berikutnya dalam deret yang akan disintesis. Keuntungan dari pendekatan
ini adalah bahwa istilah dalam persamaan umumnya sederhana dan mudah diinterpretasikan,
sedangkan jenis molekul yang diprediksi umumnya sangat mirip dengan yang sudah disintesis,
memberikan pengguna kepercayaan yang lebih besar dalam prediksi model. Sebaliknya, selama
dekade terakhir, peningkatan jumlah QSAR telah dilaporkan berdasarkan kumpulan data yang
besar dan beragam, yang umumnya disebut model global, yang dianggap lebih andal dalam
memprediksi beragam struktur daripada QSAR yang dibangun di atas kumpulan data kecil
dengan keragaman rendah (Byvatov et al., 2006; Gepp et al., 2006; Sciabola et al., 2007;
Gleeson et al., 2006; Votano et al., 2006). Model-model ini sering dibangun dengan
menggunakan metode statistik yang kompleks, dan sejumlah besar deskriptor geometris dan
elektrotopologi yang jarang diisi (Hall et al., 1995; Burden et al., 1989; Pearlman et al., 1998;
McGregor et al., 1999), dan sementara ini memungkinkan untuk deskripsi yang lebih fleksibel
dari struktur molekul dan cara yang dapat diandalkan untuk menghubungkan struktur dengan
aktivitas, ruang multidimensi yang ditentukan oleh model seperti itu akan menjadi semakin
kompleks dan terfragmentasi.
2. MATERIAL DAN METODE
a. Dataset nilai BHK21 eksperimental
Dataset nilai BHK21 eksperimental diperoleh dari jurnal Fioravanti et all, 2017.
Didapatkan 30 senyawa dengan nilai logBHK21 dari 0,90 hingga 1,95. Kemudian, total
dataset dibagi menjadi set pelatihan dan satu set validasi dengan rasio 6: 1.
Tabel 1. Dataset BHK21
No Log
Senyawa R R'
. BHK-21 CC50(µM) BHK21
1 4a H H 15 1.176091
2 4b H 2-F 21 1.322219
3 4c H 3-F 15 1.176091
4 4d H 4-F 13 1.113943
5 4e H 2-Cl 14 1.146128
6 4f H 3-Cl 9 0.954243
7 4g H 4-Cl 32 1.50515
8 4h H 2-CH3 14 1.146128
9 4i H 3-CH3 25 1.39794
10 4j H 4-CH3 8 0.90309
11 5a Oph H 13 1.113943
12 5b Oph 2-F 34 1.531479
13 5c Oph 3-F 10 1
14 5d Oph 4-F 9 0.954243
15 5e Oph 2-Cl 9 0.954243
16 5f Oph 3-Cl 10 1
17 5g Oph 4-Cl 8 0.90309
18 5h Oph 2-CH3 8 0.90309
19 5i Oph 3-CH3 9 0.954243
20 5j Oph 4-CH3 9 0.954243
21 6a Obn H 80 1.90309
22 6b Obn 2-F 90 1.954243
23 6c Obn 3-F 11 1.041393
24 6d Obn 4-F 60 1.778151
25 6e Obn 2-Cl 12 1.079181
26 6f Obn 3-Cl 45 1.653213
27 6g Obn 4-Cl 15 1.176091
28 6h Obn 2-CH3 22 1.342423
29 6i Obn 3-CH3 9 0.954243
30 6j Obn 4-CH3 36 1.556303
b. Perhitungan deskriptor
Seluruh struktur senyawa pada dataset dioptimasi dengan metode B3LYP/6-31G
menggunakan aplikasi Orca. Setelah diptimasi, desktriptor strukturnya dihitung
menggunakan aplikasi Padel descriptor. Dari hasil perhitungan diambil deskriptor dengan
jenis 3D berjumlah 431 deskriptor. Deskriptor tersebut digunakan untuk membuat
persamaan QSAR dengan 4 variabel.
c. Pemodelan QSAR
Metode yang digunakan untuk membangun pemodelan QSAR adalah Multi Linear
Regression (MLR) menggunakan aplikasi Build QSAR. Pemodelan QSAR MLR yang
merupakan metode regresi linier ringkas dan transparan yang banyak digunakan dalam
penelitian QSAR digunakan untuk membangun model QSAR linier dalam makalah ini,
model QSAR kemudian dievaluasi dengan validasi internal dan eksternal sesuai dengan
penelitian sebelumnya (Tropsha et al., 2003). Validasi set dilakukan dengan menggunakan 6
data set berbeda setelah itu data set yang diambil sebagai validasi setnya harus memiliki
nilia R2 mendekati 1, yang menandakna kelinieran suatu data. Tujuan dari regresi linier
berganda (MLR) adalah untuk memodelkan hubungan linier antara variabel penjelas
(independen) dan variabel respon (dependen). Parameter statistik yang digunakan untuk
memvalidasi model QSAR adalah koefisien determinasi (R2), koefisien cross-validation Q2,
dan Root Mean Square Error (RSME). Berikut cara menghitung R2 dan RMSE:
n
RSME=1−
√ ∑ ( y i− ^y i )2
i=1
n
(2)
y i adalah nilai logk O prediksi dan eksperimen dari data ke-i, masing-
Di mana y i dan ^ 3
masing; y adalah rata-rata nilai logk O eksperimental; n adalah jumlah dataset; dan k adalah
3
jumlah deskriptor.
3. HASIL DAN PEMBAHASAN
Kajian HKSA berkembang cukup pesat dengan berdasarkan peninjauan aspek struktur
kimia secara tiga dimensional (3D). Analisis HKSA 3D berawal dari permasalahan analisis
Hansch untuk senyawa-senyawa enantiomer yang memiliki kuantitas sifat dan kimiawi yang
sama tetapi memiliki aktivitas biologis yang berbeda. Ternyata diketahui bahwa efek stereokimia
berperanan pada harga aktivitas biologis obat. Hal ini tidak bisa dikaji secara akurat dengan
model analisis Hansch konvensional sehingga kemudian dikembangkan model analisis HKSA
baru secara 3D (Sardjoko, 1993).
Metode HKSA -3D menggunakan prosedur analisis perbandingan medan molekular atau
Comparative Molekular Field analysis (CoMFA) yang dikemukakan oleh Cramer dkk. (dalam
Charifson, 1997). CoMFA berusaha untuk menyusun suatu hubungan antara aktivitas biologis
dan sifat sterik dan/atau elektrolit dari suatu seri senyawa.
Prosedur CoMFA diawali dengan mendefenisikan aturan superposisi dari suatu seri
senyawa–senyawa, kemudian dilakukan perhitungan energi sterik dan energi interaksi
elektrostatik dengan atom–atom dari masing–masing senyawa pada setiap titik kisi (grid point)
dalam suatu ruang tiga dimensi. Hasil dari prosedur ini adalah suatu matriks dengan jumlah
kolom (energi interaksi medan) lebih banyak daripada jumlah baris (senyawa) (Hasegawa dkk,
1999; Charifson, 1997).
a. Model QSAR untuk logBHK21
Pemodelan yang dibangun dengan batas kepercayaan 95% dan terdiri dari 4 deskriptor.
Berikut ini merupakan persamaan QSAR yang didapatkan;
Persamaan :
Y1 = -0,0614 (± 0,0344) X207 - 0,1506 (± 0,0669) X255 + 0,1320 (± 0,0342) X217 - 0,2758 (±
0,1799) X119 + 2,9156 (± 0,5759)
Berdasarkan dari grafik, nilai koefisien determinasi set pelatihan (R2tr = 0.7874)
menunjukkan kecocokan yang kurang baik antara nilai logSI perhitungan dengan logSI
observasi. Model tidak mengalami masalah over-fitting dilihat dari perbedaan nilai R2tr dengan
Q 2tr yang tidak lebih dari 0.3, hal ini juga menunjukkan ketahanan yang baik dari model. Model
ini juga memiliki kemampuan prediksi yang baik, dilihat dari nilai parameter statistik seperti R2val
dan RMSEval.
Senyawa yang digunakan pada persamaan ini sebanyak 24 senyawa, dengan R = 0,902 ; s
= 0,146 ; F = 20,619 ; p < 0,0001 ; Q2 = 0,735 ; SPress = 0,173 dan SDEP = 0,157. Parameter-
parameter seperti R, R2 , F, dan SD dapat digunakan sebagai parameter penentu untuk
pengambilan keputusan pada analisis regresi multilinier.
Berdasarkan data yang diperoleh, model persamaan ini dapat digunakan karena memiliki
nilai R2tr tertinggi dibandingkan persamaan lain dan nilai SDEP yang kecil serta nilai F yang
besar yang berarti memiliki tingkat kepercayaan lebih dari 95%. Selanjutnya dilakukan
pengujian model persamaan dengan parameter statistik yang lain yaitu PRESS (Prediction
Residual Sum of Squares) untuk melihat kemampuan prediksi dari model persamaan yang
dihasilkan. Persamaan dianggap baik karena memiliki nilai SPress yang kecil.
4. Kesimpulan
Pemodelan QSAR untuk memprediksi nilai logBHK21 dari senyawa turunan 1,3,5-
triphenyl 4,5-dihyrdopyrazole dibangun menggunakan metode Multi Linear Regression (MLR)
berdasarkan deskriptor 3D. Pemodelan tersebut memiliki perfoema yang baik dilihat dari
kesesuaian dengan plot hasil perhitungan dengan nilai sebenarnya, ketangguhan model, dan
kemampuan prediksinya berdasarkan parameter statistic dari set validasi. Selain itu, berdasarkan
data yang diperoleh, model persamaan ini dapat digunakan karena memiliki nilai R2tr tertinggi
dibandingkan persamaan lain dan nilai SDEP yang kecil serta nilai F yang besar yang berarti
memiliki tingkat kepercayaan lebih dari 95%. Selanjutnya dilakukan pengujian model persamaan
dengan parameter statistik yang lain yaitu PRESS (Prediction Residual Sum of Squares) untuk
melihat kemampuan prediksi dari model persamaan yang dihasilkan. Persamaan dianggap baik
karena memiliki nilai SPress yang kecil.
DAFTAR PUSTAKA
E. Byvatov, K. Baringhaus, G. Schneider, H. Matter, A virtual screening filter for identification
of cytochrome P450 2C9 (CYP2C9) inhibitors, QSAR Comb. Sci. 26 (2006) 618–628.
Fioravanti, R., Desideri, N., Carta, A., Atzori, E. M., Delogu, I., Collu, G., & Loddo, R. (2017).
Inhibitors of Yellow Fever Virus replication based on 1,3,5-triphenyl-4,5-dihydropyrazole
scaffold: Design, synthesis and antiviral evaluation. European journal of medicinal
chemistry, 141, 15–25. https://doi.org/10.1016/j.ejmech.2017.09.060
F.R. Burden, Molecular identification number for substructure searches, J. Chem. Inf. Comput.
Sci. 29 (1989) 225–227.
J.R. Votano, M. Parham, L.M. Hall, L.H. Hall, L.B. Kier, S. Oloff, A. Tropsha, QSAR modeling
of human serum protein binding with several modeling techniques utilizing structure-
information representation, J. Med. Chem. 49 (2006) 7169–7181.
L.H. Hall, L.B. Kier, Electrotopological state indices for atoms types: a novel combination of
electronic. Topological and valence state information, J. Chem. Inf. Comput. Sci. 35
(1995) 1039–1045.
M.J. McGregor, S.M. Muskal, Pharmacophore fingerprinting. 1. Application to QSAR and
focused library design, J. Chem. Inf. Comput. Sci. 39 (1999) 569–574.
M.M. Gepp, M.C. Hutter, Determination of hERG channel blockers using a decision tree,
Bioorg. Med. Chem. 14 (2006) 5325–5332.
M.P. Gleeson, N.J. Waters, S.W. Paine, A.M. Davis, In silico human and rat Vss quantitative
structure-activity relationship models, J. Med. Chem. 49 (2006) 1953–1963.
Paul S. Charifson, Marcel Dekker. (1997). Practical Application of Computer-Aided Drug
Design. Inc., New York, NY.
R.S. Pearlman, K.M. Smith, Novel software tools for chemical diversity, Perspect. Drug Discov.
Des. 9 (1998) 339–353.
Sardjoko., 1993, Rancangan Obat, Gadjah Mada University Press, Yogyakarta
S. Sciabola, I. Morao, M.J. de Groot, Complex models pharmacophoric fingerprint method
(TOPP) for 3D-QSAR modeling: application to CYP2D6 metabolic stability, J. Chem. Inf.
Model. 47 (2007) 76–84.
Weaver, S., & Gleeson, M. P. (2008). The importance of the domain of applicability in QSAR
modeling. Journal of molecular graphics & modelling, 26(8), 1315–1326.
https://doi.org/10.1016/j.jmgm.2008.01.002