Disusun Oleh :
Kelompok 2 Gelombang 2 – FA1
FAKULTAS FARMASI
UNIVERSITAS BHAKTI KENCANA BANDUNG
2020
I. TUJUAN PERCOBAAN
Tujuan Instruksional Umum:
Mahasiswa mampu mengolah data optimasi geometri dan prediksi parameter fisikokimia
hingga mendapatkan persamaan HKSA yang valid.
Tujuan Instruksional Khusus:
1. Mahasiswa mampu memilih deskriptor secara statistika yang akan digunakan untuk
menyusun persamaan HKSA.
2. Mahasiswa mampu melakukan validasi statistika terhadap deskriptor-deskriptor yang
terpilih dengan metode Leave One Out (LOO).
3. Mahasiswa mampu menyusun persamaan HKSA.
d. Menentukan persamaan HKSA yang akan di validasi, dengan membuang data outlier
sesuai dengan yang telah dilakukan pada excel, pembuangan data outlier dilakukan dari
nomer senyawa terbesar ke terkecil di data view pada program SPSS
1. Dilakukan pembuangan pada senyawa no 29, 26, 23, 20, 18, 15, 14, 13, 12, 9, 8 dengan
blok no. Senyawa > delete.
Sehingga diperoleh data senyawa sebagai berikut : n=15
2. Kemudian lakukan regresi linear
Analyze > Regression > Linear
e. Parameter Validasi r2
Untuk mengetahui nilai R dan R2 dapat dilihat pada bagian “Model Summary”, sehingga
didapatkan hasil sebagai berikut :
R 0,943
R2 0,890
Fhit = 20,267
2. Menentukan nilai Ftabel dengan cara :
Buka excel > Masukkan rumus =FINV(0,05;df;(n-df-1))
4. Koefisien descriptor untuk data senyawa 1 merupakan hasil regresi linear data
senyawa 2-15 (senyawa 1 dihilangkan dan tidak diikut sertakan dalam regresi)
10. Dihitung nilai y-y’ dengan mengurangi nilai LogIC50 eksperimen (y) dengan nilai y’:
13. Dihitung nilai y – yrata-rata dengan mengurangi nilai y dengan nilai yrata-rata
14. Dihitung nilai (y-yrata-rata)2 dengan mengkuadratkan nilai dari data yrata-rata. Kemudian
hitung Σ(y-yrata-rata)2 :
Σ( y − y ’ )2
15. Dihitung nilai q2 dengan rumus 1-( ):
( y− y rata−rata) 2
IV. PEMBAHASAN
Analisis regresi multilinier dapat menentukan beberapa persamaan terpilih tetapi tidak
dapat menentukan mana persamaan terbaik jika semua persamaan yang terpilih tersebut memiliki
selisih nilai parameter statistik yang cukup kecil. Maka untuk menguji validitas dan keakuratan
prediksi yang dihasilkan oleh analisis regresi multilinier diperlukan sejumlah data uji di luar data
yang digunakan dalam fitting regresi. Namun jika jumlah data terbatas, ada metode yang disebut
metode validasi silang (Sembiring, 1995). Persamaan logIC50 prediksi didapatkan LogIC50 =
-0.900 + (0,083*Log P) - (0.010*CMA) + (0.012*Entropi) – (1,118*Eele) .Kemudian dari
persamaan tersebut dilakukan pengujian untuk melihat secara matematis seberapa baik
persamaan tersebut dapat memprediksi harga aktifitas farmakologi dengan cara membuat grafik
linier antara nilai Log (1/IC50) eksperimen dengan Log (1/IC50)prediksi.
Pembuangan data outlier / data yang menyimpang bertujuan agar memiliki data yang
memenuhi syarat ketika membuat persamaan HKSA dan mendapatkan persamaan HKSA yang
valid setelah dilakukan validasi. Pembuangan data outlier ini dilakukan hingga didaptakan nilai
R2>0,81 semakin sedikit data outlier yang dibuang, maka sebaran datanya semakin baik. Setelah
dilakukan pembuangan data outlier didapatkan nilai R2 sebesar 0,890 dan R sebesar 0,943.
Metode regresi linear yang digunakan adalah metode enter atau biasa disebut dengan metode
Forced entry merupakan salah satu metode regresi linear berganda yang terdapat dalam program
SPSS dimana prinsip dari metode ini yaitu memasukkan semua variable independen atau disebut
prediktor secara simultan kedalam model regresi tanpa melewati kriteria kemaknaan statistik
tertentu, berbeda dengan metode variable seleksi lainnya yang mempunyai kriteria statistik
tertentu seperti Backward, Forward dan Stepwise.
Model predikator terbaik adalah yang memenuhi persyaratan statistik dengan parameter
R, Fhit/Ftabel dan q2. Dari hasil tersebut dapat disimpulkan bahwa persyaratan statistika yang
pertama sudah dipenuhi, yaitu R>0,9 atau R2>0,81. Nilai R (koefisien korelasi) menunjukkan
tingkat hubungan antara data aktivitas biologis pengamatan percobaan dengan data hasil
perhitungan berdasarkan persamaan yang diperoleh dari analisis regresi. Koefisien korelasi
adalah angka yang bervariasi mulai dari 0 sampai 1. Semakin tinggi nilainya semakin baik
hubungannya. Untuk mendapatkan nilai koefisien korelasi yang dapat diterima tergantung
jumlah data penelitian. Semakin banyak jumlah data penelitian semakin rendah koefisien
korelasi atau nilai R yang dapat diterima. Nilai R2 menunjukkan berapa persen aktivitas biologis
yang dapat dijelaskan hubungannya dengan parameter sifat kimia fisika yang digunakan.
Sehingga dapat dilakukan tahap validasi lebih lanjut, yaitu dengan menghitung nilai F dan q2.
Nilai Fhit/Ftabel yang didapat sebesar 5.8272, dimana hasil tersebut memnuhi persyatan
karena memiliki nilai ≥ 1. Nilai F menunjukkan kemaknaan hubungan bila dibandingkan dengan
tabel F. Makin besar nilai F makin besar derajat kemaknaan hubungan. Nilai F adalah indikator
bilangan untuk menunjukkan bahwa hubungan, yang dinyatakan oleh persamaan yang didapat,
adalah benar atau merupakan kejadian kebetulan. Semakin tinggi nilai F semakin kecil
kemungkinan hubungan tersebut adalah karena kebetulan.
Untuk menguji validitas dari prediksi yang dihasilkan oleh model regresi, diperlukan
sejumlah data uji diluar data yang digunakan dalam fitting regresi. Namun jika sejumlah data
terbatas, ada metode yang disebut metode validasi silang (cross validation) (Sembiring, 1995).
Terdapat 2 metode validasi silang yang bisa dikembangkan yaitu metode Leave-one-out Cross
Validation (LOO-CV) atau validasi silang kurang satu dan Leave-two-out Cross Validation
(LTO-CV) atau validasi silang kurang dua. Pada pengujian metode validasi silang yang
dilakukan adalah LOO-CV. Metode LOO-CV akan menyisakan satu molekul sebanyak (n-1)
buah untuk fitting dan kemudian persamaan yang diperoleh diuji dengan data uji tersebut. Proses
berulang sampai tiap molekul telah diprediksi satu kali. (Sembiring, 1995).
Setelah mendapatkan persamaan LogIC50, selanjutnya mencari q2, dimana untuk mencari
dilakukan dengan cara validasi silang. Validasi silang adalah teknik untuk menilai keandalan
(reliability). Model statistik yang dibangun. dalam hal ini, dilakukan perhitungan koefisien
validasi silang atau leave-one-out (LOO) cofficient (q2), dimana nilai q2 harus lebih besar dari
0,5 agar sebuah model valid. Dalam teknik validasi silang, kemampuan model prediksi model
diestimasi menggunakan data senyawa yang sudah dikurangi satu (1) senyawa. Biasanya satu
senyawa dari training set dikeluarkan dan model baru dibangun tanpa senyawa tersebut,
Kemudian model tersebut digunakan untuk prediksi aktivitas senyawa yang dikeluarkan tadi.
Prosedur tersebut diulang sampai setiap senyawa dalam training set telah dikeluarkan satu
persatu. Berikut adalah rumus menghitung nilai q2 :
q 2=1−
∑ ( y− y ' ) ²
∑ ( y− yrata ) ²
Dimana y dan y’ masing-masing adalah aktivitas eksperimen dan aktivitas prediksi senyawa.
sedangkan yrata adalah nilai aktivitas eksperimen rata-rata senyawa dalam training set (Arba,
2019). Setelah melakukan perhitungan diperoleh nilai q 2 yaitu sebesar 0.991, dimana telah
memenuhi syarat yaitu lebih dari 0.5.
Nilai koefisien koefisien determinasi (r2) merupakan ukuran seberapa baik model yang
dibangun mereproduksi data eksperimen. Koefisien determinasi merupakan ukuran presisi nilai
yang dihitung dengan nilai yang diamati. Nilai koefisien determinasi yang semakin dekat 1,
berarti prediksi nilai yang dihitung semakin mendekati data eksperimen. Nilai r2 yang diperoleh
yaitu 0,890. Namun nilai koefisien determinasi yang mendekati 1 tidak serta merta menunjukkan
bahwa model HKSA sudah sempurna. Hal ini karena adanya tambahan deskriptor diketahui
meningkatkan nilai r2, walaupun deskriptor tersebut tidak menyumbang secara signifikan pada
model yang dibangun, karena itu diperlukan parameter lain untuk validasi model HKSA (Arba,
2019).
Nilai Fisher (F) yang merupakan ukuran level signifikansi model HKSA yang dibangun.
semakin tinggi nilai F maka semakin signifikan korelasi dari model yang dibangun. nilai F
biasanya digunakan sebagai kriteria untuk menentukan apakah model yang lebih kompleks lebih
baik daripada model yang kurang kompleks. Dari hasil perhitungan diperoleh nilai F yaitu
5.8272
DAFTAR PUSTAKA
Sembiring, R.,K, 1995, Analisis Regresi, Penerbit Institut Teknologi Bandung, Bandung.
Arba, Muhamad. 2019. Buku Ajar Farmasi Komputasi. Deepublish Publisher. Yogyakarta.