Anda di halaman 1dari 25

PERCOBAAN 1 QSAR 1: PEMBUATAN DATASET QSAR DAN PERHITUNGAN DESKRIPTOR

I. TUJUAN PERCOBAAN 1. Menggambarkan, memodelkan, dan membuat basis data struktur 3D seri senyawa untuk dataset QSAR 2. Menghitung deskriptor pada dataset QSAR II. DASAR TEORI Proses pencarian senyawa obat pada masa lampau melalui langkah eksperimen dengan biaya yang relatif besar, memerlukan waktu yang lama, dan adanya spekulasi (trial and error) namun hasil yang didapatkan seringkali senyawa produk tidak memiliki aktivitas yang lebih tinggi dari senyawa yang telah ada. Seiring dengan berkembangnya ilmu pengetahuan dan teknologi, tahun 1950 muncul kimia komputasi yang menjembatani antara kimia teori dengan eksperimen. Salah satu aplikasi kimia komputasi ialah Hubungan Kuantitatif Struktur dan Aktivitas (HKSA) atau QSAR (Quantitative Stucture and Activity Relationship) yang dapat digunakan dalam proses desain obat secara teoritik yang kemudian hasilnya dapat dijadikan acuan dalam proses sintesis senyawa obat baru (Pranowo, 2002). Dalam pengembangan obat baru secara laboratorium ada beberapa langkah eksperimen yang perlu dilakukan, seperti : desain, sintesis, purifikasi dan identifikasi. Kesemuanya itu harus dilalui sebelum sampai pada tahap uji aktivitas. Kelemahannya adalah jika semua tahap tersebut telah dikerjakan, namun hasil yang diperoleh (senyawa yang diteliti) ternyata mempunyai aktivitas yang tidak lebih baik. Sehingga waktu, biaya dan tenaga yang telah dikeluarkan dalam serangkaian kerja laboratorium menjadi terbuang. Dalam hal inilah aplikasi kimia komputasi dapat berperan penting dalam kimia medisinal terutama dalam hal perancangan obat, prediksi teoritis tentang sifat-sifat kimia dan aktivitas suatu molekul. Rancangan obat diterapkan dalam upaya untuk mendapat-kan obat baru dengan efektivitas yang lebih tinggi berdasarkan penalaran yang rasional dengan semaksimal mungkin mengurangi faktor coba-coba (Sardjoko, 1993). Hal ini dapat membantu mengurangi kegagalan riset-riset eksperimental di laboratorium serta dapat mengefisiensikan tenaga, waktu, biaya riset dan dapat mengurangi hewan uji yang digunakan serta untuk melindungi lingkungan dari toksisitas. Penggunaaan komputer sangat berperan guna membantu mempercepat penyelesaian perhitungan-perhitungan numeris untuk menghitung sifat molekul yang kompleks dan hasil perhitungannya berkorelasi secara signifikan dengan eksperimen. Salah satu aplikasi kimia komputasi yang dapat diterapkan adalah kajian Quantitative Structure-Activity Relationship (QSAR) atau hubungan kuantitatif struktur aktivitas. Kajian ini mempelajari korelasi secara kuantitatif antara struktur molekul dan nilai aktivitas biologis yang terukur secara eksperimen. Kajian QSAR menjabarkan suatu model persamaan yang menghubungkan ketergantungan harga aktivitas suatu senyawa secara eksperimen dengan
1

struktur molekul. Secara umum aktivitas senyawa adalah aktivitas biologis yang telah diuji secara klinis. Perkembangan kimia komputasi memungkinkan untuk perhitungan kuantum suatu senyawa sehingga dapat diperoleh struktur elektronik senyawa tersebut, yang dapat dinyatakan dengan parameter muatan atom, momen dwikutub, kerapatan elektron dan lainlain (Leach, 1996). Dalam analisis Hansch parameter-parameter diperlakukan sebagai variabel bebas (prediktor) untuk menerangkan harga aktivitas biologis. Analisis regresi multilinear banyak digunakan dalam menurunkan koefisien model. Hansch mempelajari senyawa yang sudah mempunyai kerangka dengan variasi struktur terbatas pada gugus fungsional pada sisi yang spesifik. Pendekatan dengan menggunakan cara ini telah diterapkan dalam memprediksi pengaruh substituen dalam sejumlah besar uji biologi. III. LANGKAH KERJA DAN PEMBAHASAN Mengatur Direktori Kerja (Current Working Directory) Untuk keperluan selanjutnya agar semua dokumen/file yang dihasilkan tersimpan dalam folder yang sama, maka perlu pengaturan current working directory di awal pekerjaan. Langkah ini bisa diakses melalui menu File->Open kemudian diarahkan ke folder tertentu >CWD->Yes->Cancel.

Membuka File Dengan mengakses menu File->Open pada folder dimana database tersimpan kemudian klik Import to Database atau OK. File yang digunakan berekstensi .txt.

Kotak dialog Database Import akan terbuka, kemudian ketikkan nama file sesuai nama database dan diberi akhiran .mdb, klik OK maka secara otomatis jendela Database Viewer MOE akan terbuka.

Hanya beberapa field yang akan digunakan untuk pekerjaan selanjutnya, oleh karena itu perlu dilakukan penghapusan field-field selain : CANONICAL_SMILES, CMPD_CHEMBLID, COMPOUND_KEY dan PCHEMBL_VALUE. Caranya dengan menyeleksi keempat field tersbut diatas (dengan menekan CTRL+seleksi), kemudian klik kanan dan pada menu pop up pilih Selection->Invert, klik kanan lagi pilih Selection->Delete Selected maka field yang tidak diseleksi akan terhapus. Pastikan bahwa field CANONICAL_SMILES berada di kolom paling kiri. Field PCHEMBL_VALUE diganti namanya menjadi PIC50 (untuk labelling) dengan cara klik kanan->Rename->ketik nama->Enter.

Energy Minimization (Energi Minimisasi) Aplikasi energi minimisasi di MOE menghitung koordinat atomik sebagai local minima dari sebuah fungsi energi molekular. Energi minimisasi berguna dalam pembangunan molekul (molecule building), menentukan konformasi molekul berenergi rendah, pencarian konformasional dan sebagai preparasi dalam analisis simulasi dinamik dan vibrasional molekular. Dalam MOE, minimisasi energi dapat dilakukan dengan metode kimia komputasi : Forcefield, seperti AMBER, CHARMM, MMFF94 dan sebagainya MOPAC semi-empiris seperti PM3, AM1, MNDO

Fungsi energi dari MOPAC berbeda secara fundamental dari molekular mekanik pada forcefield karena kemampuannya dalam melakukan simulasi reaksi kimia. 3D Database Minimization Seringkali dalam banyak kasus, suatu database mengandung sekumpulan molekul yang struktur 3Dnya perlu dibangun dan atau dilakukan perhitungan energi minimisasi. Untuk menjalankan fungsi semacam ini, MOE menyediakan suatu aplikasi untuk perhitungan energi minimisasi. Operasi ini dapat dijalankan dengan membuka menu DBV->Compute>Molecule->Energy Minimize.

Molecule Source : Structure ->CANONICAL_SMILES karena database inilah yang mengandung struktur molekul yang akan dibangun. Destination Field adalah nama dari field database yang akan mengandung struktur yang dihasilkan Jika pilihan Structure terseleksi, maka field destination akan sama dengan field pada molecule source. Jika field ini tidak diisi maka otomatis akan dianggap sama dengan field pada molecular source. Dalam hal ini destination field dituliskan sebagai mol.

Operation dalam hal ini dipilih Rebuild 3D yang berarti suatu koordinat 3D akan dibangun dari awal berdasarkan metode yang disebutkan diatas. RMS gradient memberi batasan kapan proses energi minimisasi diberhentikan. Pada saat RMS gradien berada di bawah nilai yang ditentukan, proses minimisasi energi berhenti. Untuk preparasi molekular dinamik, nilai RMS gradien sebesar 0.1 sudah cukup. Namun untuk analisis vibrasional, nilai RMS gradien harus lebih kecil dari 10-5. Dalam kasus ini nilai RMS gradien ditentukan sebesar 0,01. Preserve Existing Chirality yang berarti (jika ada) kiralitas dalam suatu molekul akan tetap dipertahankan pada semua pusat kiral. Add Hydrogens to Structures yang berarti penambahan hidrogen akan dilakukan jika diperlukan pada struktur 3D Calculate ForceField Partial Charges perhitungan muatan parsial dari setiap atom menggunakan metode muatan parsial yang sesuai untuk tiap medan tertentu. Setelah di klik OK untuk mengeksekusi perintah maka akan muncul field baru yang berjudul mol.

Optimasi Geometri dengan SCF Calculation Metode kimia komputasional menyediakan dua algoritma untuk mendeskripsikan sifat-sifat molekular seperti konstituen dari atom dan letaknya masing-masing pada koordinat Cartesius. Metode pertama yang paling sederhana adalah metode forcefield, dimana analogi bola dan pegas digunakan pada atom dan ikatannya, menggunakan suatu parameter untuk mereproduksi data kuantitatif. Perhitungan energi potensial dan gradien sangat efisien secara komputasional, bahkan dapat menemukan energi geometri minimum suatu molekul yang besar seperti protein.

Metode yang kedua melibatkan fungsi gelombang (wavefunction-based methods), yang menganggap bahwa setiap atom adalah satu set orbital atomik, yang dideskripsikan oleh suatu fungsi dasar,dan beberapa elektron yang mengelilinginya. Bentuk dari orbital tersebut didefinisikan berdasarkan fungsi terpilih yang diperoleh dari berbagai cara, seperti penyelesaian dari persamaan Schrdinger untuk elektron tunggal. Wavefunction-based methods bekerja dengan membangun asumsi awal kepadatan suatu matriks, maksudnya adalah fungsi dasar dari orbital atomik, kemudian secara berulang memperhalusnya dengan suatu teknik yang disebut self-consistent field (SCF). Pada setiap tahap, energi kinetik, tarikan inti, dan tolakan elektron-elektron dihitung, dan suatu koreksi diterapkan sampai tercapainya self-consistency. MOE menyediakan suatu framework untuk penggunaan perhitungan kimia kuantum yang bekerja dengan metode SCF dengan mengakses DBV->Compute->Molecule->SCF Calculation. SCF ini dapat diterapkan baik pada single molecule maupun satu set database.

Sanity check karena perhitungan SCF pada umumnya memerlukan kapasitas CPU yang besar per unit per waktu, sangat dianjurkan untuk meyakinkan terlebih dahulu apakah struktur yang terdapat di database merupakan awalan yang bagus. Ada 2 macam masalah umum yang akan menghasilkan perhitungan SCF menjadi tidak bernilai : 1. Koordinat struktur merupakan tampilan diagram 2D dan 2. Atom hidrogen eksplisit yang hilang. Secara default, opsi Ensure 3D Structures dan Ensure Hydrogens telah terseleksi. Jika keduanya

terseleksi, maka seluruh database akan dipindai terlebih dahulu sebelum perhitungan SCF dimulai. Molecule Source : mol Subjek dari database harus mengandung molecule-type field dengan struktur yang telah dimasukkan Geometry : Opt&Replace Opsi Optimize akan menginisiasi engine untuk meminimisasi struktur berdasarkan sifat-sifat terpilih yang telah dihitung sebelumnya. Opsi Opt&Replace selain melakukan fungsi tersebut juga akan menggantikan structure field dengan koordinat hasil perhitungan. SCF Engine : MOPAC Pemilihan SCF engine akan menetukan program apa yang akan dijalankan untuk melakukan perhitungan dan juga berbagai opsi yang tersedia. MOPAC (Molecular Orbital PACkage) adalah program software orbital molekular semiempirik untuk mempelajari struktur kimia, termasuk reaksi kimia. MOPAC kompatibel dengan MNDO, MINDO/3, AM1 dan PM3 Hamiltonians (untuk bagian perhitungan elektron). Pada kebanyakan bagian, MOPAC telah dioptimasi dan diparameterisasi untuk senyawa organik (dan beberapa senyawa logam transisi dengan orbital d terisi penuh). MOPAC dapat menghitung geometri, keadaan transisi, spektra vibrasional, kuantitas termodinamik dan konstanta kekuatan ikatan untuk molekul, radikal dan ion. Basis Set : AM1 (metode semi-empirik) Sangat bergantung pada engine yang dipilih. AM1, atau Austin Model 1, adalah metode semi empirik untuk perhitungan kuantum struktur elektronik molekular dalam kimia komputasi. Metode ini didasarkan pada perkiraan integral diatomik diferensial tumpang tindih yang diabaikan (Neglect of Differential Diatomic Overlap, NDDO). AM1 dikembangkan oleh Michael Dewar dan stafnya dan dipublikasikan tahun 1985. AM1 berusahan untuk memperbaiki MNDO dengan mengurangi tolakan antar atom dalam jarak pisah yang dekat. Problem kompleksitas parameterisasi di AM1 meningkat karena jumlah parameter dalam atom meningkat dari 7 di MNDO sampai 13-16 atom di AM1. Hasil dari perhitungan AM1 kadang-kadang digunakan sebagai titik awal untuk parameterisasi forcefield dalam pemodelan molekul. Metode semiempiris Austin Model 1 (AM1) dipilih untuk digunakan dalam penelitian ini karena cocok untuk sebagian besar senyawa organik, memiliki ketepatan prediksi yang lebih baik, tidak memerlukan memori yang besar dan waktu yang relatif cepat dalam proses perhitungannya (Tahir dan Wijaya, 2004). Metode dalam kimia komputasi sendiri ada bermacam-macam, seperti metode ab initio, semiempirik, dan molekular mekanik.
8

Ab Initio Ab initio berasal dari bahasa latin yang diberikan untuk menandai perhitungan yang diturunkan secara langsung dari prinsip-prinsip teoritis, tanpa memasukkan data eksperimen. Ab initio mengacu pada perhitungan mekanika kuantum melalui beberapa pendekatan matematis, seperti penggunaan persamaan yang disederhanakan (Born-Oppenheimer approximation) atau pendekatan untuk penyelesaian persamaan differensial. Tipe yang paling terkenal dari metode ab initio adalah perhitungan HartreeFock (HF) dengan metode pendekatan medan pusat (central field approximation). Ini berarti bahwa tolakan Coulombik antar elektron tidak secara spesifik dimasukkan dalam perhitungan, tetapi efek total interaksi korelasinya dimasukkan dalam perhitungan sebagai suatu besaran konstan. Sejumlah tipe perhitungan dimulai dengan perhitungan HF kemudian dikoreksi dengan memasukkan term tolakan antar elektron, yang diistilahkan dengan efek korelasi (correlation effect). Beberapa contoh dari metode ini adalah teori perturbasi Moeler-Plesset (MPn, n menyatakan tingkat koreksi), Ikatan Valensi Tergeneralisasi (Generalized Valence Bond, GVB), Medan Keajekan Diri MultiKonfigurasi (Multi-Configurations Self Consistent Field, MC-SCF), Interaksi Konfigurasi (Configuration Interaction, CI), dan Coupled Cluster Theory, CC. Sebagai suatu kelompok, metode tersebut dikenal dengan perhitungan terkorelasi atau Post-SCF. Metode yang dapat mengatasi terjadinya kesalahan perhitungan HF dalam suatu molekul dinamakan Monte Carlo Kuantum (Quantum Monte Carlo, QMC). Ada beberapa macam QMC, misalnya fungsi variasional, diffusi dan Green. Metode ini bekerja dengan fungsi gelombang terkorelasi secara ekplisit dan evaluasi integral numerik menggunakan integrasi Monte Carlo. Perhitungan ini memerlukan waktu yang panjang, tetapi perlu diingat bahwa metode ini merupakan metode yang paling akurat yang diketahui sekarang. Metode ab initio alternatif yang berkembang pesat pada dekade ini adalah teori fungsional kerapatan (Density Functional Theory, DFT). Dalam DFT, total energi dinyatakan dalam term kerapatan elektron total, bukan sebagai fungsi gelombang. Dalam jenis perhitungan ini, terdapat pendekatan hamiltonian dan pendekatan pernyataan untuk kerapatan elektron total. Sisi baik dari metode ab initio adalah metode ini menghasilkan perhitungan yang pada umumnya mendekati penyelesaian eksak karena semua jenis pendekatan yang telah dibuat dapat dianggap cukup kecil secara numerik relatif terhadap penyelesaian eksaknya. Sisi buruk dari metode ab initio adalah mereka merupakan metode yang mahal. Metode ini memerlukan kapasitas yang besar pada waktu operasi CPU komputer, memori dan ruang penyimpanan (disk). Metode HF memerlukan waktu berbanding lurus dengan N pangkat 4, N adalah fungsi basis, sehingga perhitungan akan berlipat 16 kali jika fungsi basis yang digunakan dua kali lebih besar. Dalam prakteknya, penyelesaian yang akurat sekali hanya akan diperoleh jika molekul mengandung hanya beberapa puluh elektron.
9

Secara umum, perhitungan ab initio memberikan hasil kualitatif yang sangat baik dan dapat memberikan kenaikan keakuratan hasil kuantitatif jika molekul yang dikaji semakin kecil. Semi empirik Perhitungan semiempiris disusun dengan cara yang secara umum sama dengan perhitungan HF. Beberapa perhitungan, seperti integral elektron ganda diselesaikan dengan cara pendekatan atau sama sekali dihilangkan. Dalam rangka mengoreksi kesalahan perhitungan akibat penghilangan sebagian dari perhitungan HF, metode ini diparameterisasi dengan cara fitting kurva untuk menghasikan beberapa parameter atau angka agar dapat memberikan kesesuaian dengan data eksperimen. Sisi baik dari perhitungan semiempiris adalah lebih cepat daripada perhitungan ab initio. Sisi buruk dari perhitungan semiempiris adalah hasilnya sangat bergantung pada tersedianya parameter yang sesuai dengan molekul yang dianalisis. Jika molekul yang dikaji mirip dengan molekul yang ada dalam database yang digunakan dalam metode parameterisasi, hasilnya akan baik. Jika molekul yang dikaji berbeda secara signifikan dengan molekul yang digunakan dalam metode parameterisasi, jawabannya mungkin akan sangat berbeda dengan data eksperimen. Perhitungan semiempiris telah sangat sukses dalam menjelaskan masalah di bidang kimia organik yang hanya mengandung beberapa unsur secara ekstensif dan molekul dengan ukuran yang sedang. Namun demikian, metode semiempiris akan memberikan beberapa kesalahan, khususnya jika harus menjelaskan permasalahan pada kimia anorganik, terutama jika bekerja dengan melibatkan unsur-unsur transisi. Molekular Mekanik Jika molekul sangat besar untuk dapat ditinjau dengan metoda semiempiris, masih ada kemungkinan untuk memodelkan atribut mereka dengan mengabaikan mekanika kuantum secara penuh. Metoda yang dikenal dengan mekanika molekular menyediakan pernyataan aljabar yang sederhana untuk energi total senyawa, tanpa harus menghitung fungsi gelombang atau kerapatan elektron total. Pernyataan energi mengandung persamaan klasik sederhana, seperti persamaan osilator harmonis untuk menggambarkan energi yang tercakup pada terjadinya uluran, bengkokan dan torsi ikatan, gaya antarmolekul, seperti interaksi van der Waals dan ikatan hidrogen. Semua tetapan dalam persamaan ini harus diperoleh dari data eksperimen atau perhitungan ab initio. Dalam metoda mekanika molekukar, data base senyawa yang digunakan dalam metoda parameterisasi merupakan hal yang krusial berkaitan dengan kesuksesan perhitungan. Himpunan parameter dan fungsi matematika dinamakan medan gaya (Force-Field). Seperti halnya pada metoda semiempiris yang diparameterisasi terhadap satu himpunan molekul organik, metoda mekanika molekular diparameterisasi terhadap golongan yang khas dari molekul seperti kelompok hidrokarbon, alkohol atau protein. Suatu medan gaya tertentu, misalnya protein, hanya akan berjalan baik untuk mendeskripsikan kelompok senyawa protein,
10

tetapi akan menghasilkan data yang jelek jika digunakan untuk menghitung golongan senyawa yang lain. Sisi baik dari mekanika molekular adalah dimungkinkannya melakukan modeling terhadap molekul yang besar seperti halnya protein dan segmen dari DNA, sehingga metoda ini merupakan alat utama perhitungan bagi para biokimiawan. Sisi buruk dari mekanika molekular adalah banyak sifat kimia yang tidak dapat didefinisikan dengan metoda ini, seperti halnya keadaan eksitasi elektronik. Dalam upaya untuk bekerja dengan sistem yang besar dan komplek, sering perangkat lunak mekanika molekular mempunyai kemampuan dan kemudahan untuk menggunakan perangkat lunak grafik. Mekanika molekular terkadang digunakan karena kemudahannya dalam menggambarkan sistem, tetapi tidak perlu merupakan cara terbaik untuk menerangkan sebuah sistem molekul. Charge Model : atomic Pengurutan Dataset Dapat dilakukan dengan mengakses menu DBV->Compute->Molecule->Molecule Name

Klik OK untuk mengekasekusi perintah, maka database akan tertata urut sesuai urutan COMPOUND_KEY. Apabila masih belum urut, pengurutan dapat dilakukan secara manual dengan klik kanan pada baris database yang akan diurutkan, pada menu pop-up pilih Move kemudian kilik pada lokasi pemindahan.

11

Perhitungan Deskriptor Deskriptor adalah parameter-paramater yang mengkarakterisasi sifat struktural. Dalam QSAR, deskriptor merupakan kuantifikasi sifat struktural yang diperlukan untuk menghubungkan dengan aktivitas biologis. Deskriptor dapat diperoleh baik dari percobaan eksperimental maupun komputasional. MOE menyediakan lebih dari 600 jenis deskriptor yang bisa diakses melalui QuaSAR-Descriptor. Proses perhitungan dapat dimulai dari jendela Database Viewer melalui menu Compute->Descriptor->Calculate. Karena setiap karakteristik molekular dapat digunakan sebagai deskriptor, maka tidak ada prosedur perhitungan tunggal dalam QuaSAR-Descriptor. QuaSAR-Descriptor lebih merupakan sekumpulan perhitungan untuk banyak deskriptor. Prosedur perhitungan dalam QuaSARDescriptor dapat dijelaskan sebagai berikut. Apabila diberikan suatu database molekular dengan molecular field, suatu rangkaian karakteristik numerik akan dikalkulasi untuk tiap molekul dan disimpan salam database. Tiap jenis deskriptor memiliki suatu kode yang unik yang mengidentifikasi deskriptor tersebut.

12

Pemilihan deskriptor merupakan langkah pertama yang penting dalam kajian QSAR. Jika hubungan antara deskriptor terpilih dan aktivitas kuat, selanjutnya aktivitas senyawa obat baru dapat diprediksi.

Deskriptor salam MOE dibagi menjadi beberapa kelas: 2D : Deskriptor 2D hanya mengunakan informasi atom dan ikatan dalam molekul untuk perhitungan. Koordinat 3D dan konformasi indiviual tidak diperhitungkan i3D : Internal 3D Deskriptor menggunakan koordinat 3D untuk setiap molekul, namun tidak dipengaruhi oleh rotasi dan translasi pada konformasi x3D : Eksternal 3D Deksriptor juga menggunakan koordinat 3D namun juga memerlukan referensi kerangka yang mutlak (misalnya molekul yang melekat pada reseptor yang sama)

Dalam kasus ini tidak semua deskriptor dimasukkan dalam perhitungan. Deskriptor yang mempunyai awalan AM1, MNDO dan PM3 dihapus (di-exclude dari list) karena SCF engine yang digunakan adalah MOPAC. Deskriptor yang memiliki ke-3 awalan tersebut sudah termasuk dalam MOPAC.

13

PERCOBAAN 2 QSAR 2 : ANALISIS QSAR


I. TUJUAN PERCOBAAN 1. Melakukan perhitungan dan pemilihan deskriptor terhadap dataset seri senyawa inhibitor COX-2 2. Melakukan analisis QSAR terhadap dataset seri senyawa inhibitor COX-2 II. DASAR TEORI Salah satu cara yang paling umum untuk menyatakan hubungan antara struktur dan aktivitas secara kuantitatif adalah dengan membuat hubungan linier. Untuk memperoleh hubungan linier tersebut dilakukan dengan analisis regresi multivariat. Analisis regresi multilinier dalam QSAR menghubungkan salah satu atau lebih variabel bebas x (parameter sifat fisikokima struktur yang dalam QSAR disebut prediktor atau deskriptor) dengan suatu variabel tidak bebas y (parameter aktivitas biologis). Variabel tak bebas mengandung suku nilai kesalahan (error, ), sedangkan variabel bebas secara ideal disusun untuk tidak mengandung suatu kesalahan apapun. Dalam kenyatannya, hal ini hanyalah suatu pendekatan karena parameter sifat fisikokimia juga mengandung kesalahan eksperimen, hanya saja kesalahan yang terjadi lebih kecil daripada kesalahan eksperimen pada parameter aktivitas biologis atau dianggap konstan. Dalam banyak kasus kesalahan yang terjadi pada variabel bebas telah diketahui. Deskriptor adalah parameter-parameter yang mengkarakterisasi sifat struktural. Dalam QSAR, deskriptor merupakan kuantifikasi sifat struktural yang diperlukan untuk menghubungkan dengan aktivitas biologis. Deskriptor dapat diperoleh dari percobaan eksperimental atau komputasional. Bagus atau tidaknya model-model persamaan regresi multilinear yang diperoleh diukur dari parameter-parameter statistik : koefisien korelasi (r atau r2), standar eror (s), dan kriteria Fisher (F). Persamaan yang powerful ditandai dari nilai r yang mendekati 1, nilai s kecil, dan nilai F besar (secara relatif). Model-model terbaik inilah yang dipilih menjadi kandidat persamaan QSAR. Disamping itu, untuk menguji konsistensi (reliabilitas) model persamaan QSAR dalam melakukan prediksi terhadap molekul lain dilakukan dengan uji validasi silang. Model-model persamaan terbaik yang paling valid setelah diuji validasi silang inilah yang kemudian kita pilih menjadi persamaan QSAR.

14

III. LANGKAH KERJA DAN PEMBAHASAN QuaSAR Wizard Aplikasi QuaSAR di MOE digunakan untuk menganalisis data eksperimental dan menyusun model numerik dari data untuk tujuan prediksi dan interpretasi. Jika hasil percoban untuk sejumlah m molekul telah diperoleh, yi menyatakan hasil percobaan untuk molekul i dan mi menyatakan molekul i, maka sekumpulan data ini disebut sebagai dataset atau training set. Untuk membangun suatu model numerik yang bergantung pada molekul perlu disusun suatu representasi numerik dari molekul. Walaupun tabel koneksi representasi dari molekul (seperti daftar atom dan ikatan) juga merupakan numerik, hal ini tidak dapat dijadikan untuk membangun suatu model, perlu represntasi yang lebih sederhana daripada itu. Molekul dideksripsikan sebagai deskriptor untuk tujuan pembangunan model. Deskriptor dapat berupa kuantitas apa saja yang bergantung pada molekul, seperti berat molekul, volume van der Waals, momen dipol dan jumlah atom karbon. Diasumsikan bahwa xij menyatakan deskriptor ke j dari molekul dan xi menyatakan vektor dari n deskriptor dari molekul i. Suatu model adalah rumus numerikal yang diparameterisasi menggunakan training set. Rumus numerik ini menampung, sebagai masukan (input), suatu vektor dari deskriptor molekular yang digunakan untuk memprediksi hasil percobaan. Aplikasi QuaSAR di MOE mencakup dua model di bawah ini: I. Model Regresi Linear (Linear Regression Models). Suatu model linear dimana hasil percobaan diekspresikan sebagai kombinasi linear dari deskriptor ditambah konstanta. Parameter, atau koefisien, dari model ditentukan dengan suatu cara tertentu sehingga rata-rata kuadrat kesalahan (mean squared error) antara hasil percobaan dari training set dan dari model yang dibangun dapat diminimalisasi. Model Biner (Binary Models). Model biner mengasumsikan bahwa hasil percobaan merupakan binary value (1 atau 0), merepresentasikan Lolos/Tidak atau Aktif/Inaktif nya molekul tersebut. Model biner menggunakan training set untuk mengestimasikan probabilitas bahwa suatu molekul baru nantinya akan memberikan hasil percobaan sebesar 1 .

II.

Metode kemometri yang digunakan dalam percobaan ini adalah metode statistik MLR (Multi Linear Regression) karena senyawa yang dikaji relatif banyak. Kualitas dari suatu model dinyatakan secara statistik (seperti koefisien korelasi maupun persen akurasi ). Hal ini berarti bahwa suatu asumsi dasar untuk pembangunan suatu model adalah kenyataan bahwa training set merupakan suatu representasi, atau dengan kata lain, harus memiliki sejumlah besar sampel yang cukup sehingga hasilnya tidak bias. Lebih tepatnya, metode ini mengasumsikan bahwa training set dapat dimodelkan secara independen dan variabel acaknya terdistribusi secara identik.

15

Setelah suatu model telah dibangun, perlu dilakukan pengujian untuk menentukan seberapa besar kekuatan prediksi dari model tersebut. Model yang mampu untuk mereproduksi hasil percobaan dari training set mungkin tidak akan bekerja baik untuk molekul baru. Fenomena ini dikenal dengan nama overfitting dan biasanya menandakan adanya parameter yang terlalu banyak pada model tersebut atau jumlah data pada training set tidak cukup besar. Aplikasi QuaSAR juga mencakup metode untuk menghilangkan outlier (molekul training set dengan eror model yang sangat besar) dan validasi silang (cross validation). Validasi silang merupakan suatu prosedur dimana sejumlah porsi dari training set dikeluarkan dari pembangunan model dan secara berurutan digunakan untuk mensimulasi pembentukan molekul baru.

Langkah pertama yang dilakukan adalah memilih database yang akan dianalisis dengan memanggil modul QuaSAR Wizard (MOE->Tools->QuaSAR Wizard) setelah sebelumnya diatur current working directorynya. Opsi Open in Viewer juga diseleksi agar hasilnya nanti terbuka di Database Viewer, setelah itu klik Next untuk membuka kotak dialog berikutnya.

16

Langkah kedua adalah melakukan perhitungan deskriptor dengan memastikan bahwa pada : Select Activity Field : PIC50 Select : All 2D and 3D descriptors (no MOPAC) kemudian klik Calculate selected descriptors. Namun langkah ini tidak dilakukan karena perhitungan deskriptor telah dilakukan pada percobaan sebelumnya, sehingga langsung diklik Next untuk menuju kotak dialog berikutnya.

17

Pada kotak dialog yang ketiga dalam MOE QuaSAR Wizard ini memberikan pilihan untuk memecah data menjadi training set dan test set dalam porsi tertentu. Training set adalah suatu set data yang akan diolah regresinya (fitting) dalam analisis regresi, sedangkan test set adalah satu set data yang independen terhadap data training, namun mengikuti pola distibusi probabilitas yang sama seperti data training. Pendekatan semacam ini dilakukan untuk meminimalisi masalah overfitting, dimana persamaan yang diperoleh melalui analisis regresi mampu menjelaskan suatu hubungan pada data training yang tidak berlaku secara umum. Hal ini biasanya disebabkan oleh model yang terlalu kompleks, misalnya terlalu banyak parameter dibandingkan banyak data yang ada. Pemecahan dataset menjadi training set dan test set dilakukan jika dalam database mengandung banyak sekali jumlah molekul (>40). Dalam kasus ini hanya ada 25 molekul dalam database sehingga tidak diperlukan pemecahan database. Bagian test database di uncheck dan fraction in training ditulis sebesar 1.0 (tidak ada yang dipecah). Setelah tahapan ini akan terbentuk file database baru dengan nama yang sama berakhiran train.mdb.

18

Kotak dialog selanjutnya memberikan pilihan untuk refinement descriptor, artinya pemilihan deskriptor yang esensial dalam QSAR Langkah ini sifatnya opsional namun dapat mempersingkat waktu analisis dalam pencarian persamaan QSAR nantinya. Fungsi semacam ini juga dapat diakses melalui QuaSAR Contingency (DBV->Compute->Descriptors>Contingency). Pada dasarnya QuaSAR Contingency akan melakukan analisis kontigensi bivariat untuk tiap deskriptor dan aktivitasnya. Output dari analisis ini adalah suatu tabel koefisien yang dapat digunakan untuk memilih deskriptor yang esensial. Pada kotak dialog diatas terlihat bahwa deskriptor yang esensial setelah dijalankan perintah Prune Descriptors by Contingency akan berwarna terseleksi (berwarna biru). Setelah proses ini selesai maka suatu tabel koefisien akan ditampilkan dalam suatu text editor (biasanya Notepad) yang berisi beberapa parameter yang dapat menjadi acuan untuk penentuan deskriptor esensial, seperti koefisien kontingensi C, Cramers V, koefisien ketidakpastian U dan koefisien korelasi R2. Contoh dari tampilan outputnya adalah seperti dibawah ini.

19

Deskriptor yang tidak terseleksi (tidak esensial) dapat dihapus satu persatu secara manual di Database Viewer (pada file yang berakhiran train.mdb) sebelum kotak dialog keempat ini ditutup (Close). QuaSAR Evolution

20

QuaSAR Evolution digunakan untuk meng-generate persamaan-persamaan QSAR berdasarkan deskriptor yang telah diseleksi sebelumnya. QuaSAR Evolution ini menggunakan Genetic Algorithm untuk menyeleski deskriptor yang paling esensial serta mengoptimasi persamaan QSAR. Genetic algorithm merupakan suatu teknik pencarian yang meniru proses seleksi alam dalam prosesnya, seperti penurunan sifat, mutasi, seleksi dan crossover. Initial length dalam hal ini merupakan jumlah deskriptor yang akan dikombinasi dalam proses genetic algorithm, dimulai dari angka terkecil yaitu 2 dan dilanjutkan sampai seterusnya. Parameter lain dibiarkan seperti default. Untuk memulai proses evolusi tombol Run diklik. Setelah proses evolusi selesai, akan diperoleh database baru yang berisi modelmodel QSAR kombinasi 2 deskriptor berakhiran _eq.mdb. Proses ini diulang terus dengan mengganti initial length dengan bilangan yang lebih besar (3, 4, dan seterusnya) sampai diperoleh persamaan QSAR yang dirasa cukup memuaskan. Validasi silang dengan metode Leave One Out dilakukan setelah mendapatkan persamaan QSAR tertentu. Hasil dari validasi silang ini akan muncul di database viewer sebagai Y prediksi. Perhitungan parameter statistik untuk uji validasi silang yaitu PRESS dilakukan secara terpisah di Microsoft Excel. Compute->Analysis->Correlation Plot dengan sumbu x adalah Y prediksi dari persamaan QSAR terpilih dan sumbu y adalah nilai pIC50

IV. HASIL DAN PEMBAHASAN Model persamaan QSAR terpilih (2, 3 dan 4 deskriptor) No Persamaan 1 8.74688 + -0.604587 * a_acc + -0.9667 * vsurf_ID1 2 8.55376 + 0.121782 * RDF085v + RMSE 0,3113 0,2582 RR 0,6348 0,7487 LOF/s 0,1373 0,1209 F 19,1165 20,8540 PRESS 3,017152 2,1542395
21

0.715518 * a_acc + -0.959595 * vsurf_ID1 9.05011 + 0.17977 * RDF130e + 0.724473 * a_acc + -1.08416 * vsurf_ID1 8.29264 + 0.0534239 * RDF085u + 0.646948 * a_acc + -0.924766 * vsurf_ID1 8.49946 + 0.116956 * RDF085v + 0.0728364 * RDF100u + -0.849022 * a_acc + -0.913227 * vsurf_ID1 8.15021 + 0.00506883 * DASA + 0.0668748 * RDF085u + -0.735665 * a_acc + -0.82944 * vsurf_ID1 9.3283 + -0.122672 * RDF030u + 0.195805 * RDF085m + 0.491133 * RDF085v + -0.929373 * a_acc

0,2643

0,7367

0,1209

19,5817

2,763742

0,2698

0,7256

0,1260

18,5059

2,412864

0,2177

0,8213

0,1025

22,9791

1,642189

0,2179

0,8210

0,1027

22,9295

1,883164

0,2191

0,8190

0,1038

22,6259

2,458861

Deskriptor esensial (yang sering muncul) : a_acc, vsurf_ID1 Model persamaan terpilih : persamaan 5 a_acc merupakan pharmacophore feature descriptors, yang menyatakan jumlah atom penerima (akseptor) ikatan hidrogen (tidak termasuk atom asidik namun termasuk atom baik yang berperan baik sebagai donor maupun akseptor ikatan hidrogen, seperti OH) vsurf_ID1 merupakan kelompok deskriptor luas permukaan, volume dan bentuk. Deskriptor dalam kelompok ini bergantung kepada konektivitas struktur dan konformasi. Vsurf_ID* menyatakan hydrophopic integy moment (ada 8 deskriptor). Parameter statistik yang pertama dinilai dari persamaan QSAR yang diperoleh yaitu koefisien determinasi (r2) yang menjelaskan berapa % aktivitas biologis yang dapat dijelaskan hubungannya dengan parameter sifat kimia fisik (deskriptor) yang digunakan. Nilai r2 berada antara 0-1. Semakin mendekati 1 nilai r maka persamaan tersebut memiliki hubungan yang tinggi antara variabel bebas dan variabel tak bebasnya. Dalam persamaan QSAR terpilih diatas, persamaan ke-5 lah yang memiliki nilai r2 paling tinggi yaitu sebesar 0,8213. Parameter statistik yang berikutnya adalah SE (Standard Error) atau dalam MOE disebut sebagai LOF (lack of fit) yang menjelaskan tingkat kesalahan persamaan QSAR yang diperoleh. Semakin kecil nilai SE maka model persamaan regresi tersebut semakin baik. Dalam persamaan QSAR terpilih di atas, persamaan ke-5 lah yang memiliki nilai LOF/SE paling kecil, yaitu sebesar 0,1025. Selanjutnya parameter harga Anova (F) berfungsi untuk melihat pengaruh secara keseluruhan variabel bebas terhadap variabel tak bebas, digunakan untuk menguji apakah persamaan yang didapatkan ada hubungan linearitasnya atau hanya sebuah kebetulan. Persamaan QSAR dianalisis dengan membandingkan nilai Fhitung dengan Ftabel. Jika Fhitung > Ftabel atau nilai Fhitung/Ftabel >1 maka persamaan tersebut ada hubungan linearitas bukan hanya sebuah kebetulan semata. Semakin besar nilai
22

Fhitung/Ftabel maka semakin signifikan persamaan tersebut. Dalam persamaan QSAR terpilih di atas, persamaan ke-5 lah yang memiliki harga F paling besar yaitu sebesar 22,9791. Penggunaan parameter diatas seperti r2, SE dan F secara statistik telah mencukupi untuk memilih model persamaan terbaik tetapi belum dapat memberikan gambaran yang nyata tentang kemampuan prediksi dari masing-masing model persamaan yang diperoleh hasil perhitungan statistik Multi Linear Regression (MLR). Prediction Residual Sum of Squares (PRESS) digunakan sebagai parameter uji selanjutnya untuk mengetahui kemampuan prediksi model-model persamaan tersebut, menurut Draper dan Smith (1981) semakin kecil nilai PRESS suatu model persamaan QSAR maka kemampuannya untuk memprediksi aktivitas biologi semakin baik. Nilai PRESS diperoleh dengan metode Leave One Out. Dari persamaan QSAR diatas persamaan ke-5 lah yang memiliki harga PRESS terkecil yaitu sebesar 1,642189. Dengan berbagai pertimbangan parameter statistik diatas, persamaan ke-5 lah yang dipilih sebagai persamaan QSAR terbaik. SCAFFOLD Analog 3-substitutusi 2-methyl-6-methylsulfonylindole

23

Nilai pIC50 yang berarti -log (IC50) menggambarkan konsentrasi yang dibutuhkan untuk menghambat separo dari aktivitas biologis, biasanya digunakan untuk mengukur efektivitas suatu senyawa terhadap aktivitas biologis tertentu. Nilai pIC50 yang semakin besar mengindikasikan potensi suatu senyawa yang lebih besar. Berdasarkan hasil eksperimen diatas, nilai pIC50 yang paling besar adalah pada senyawa 13a dengan substituen S-fenil-F (di posisi 4). Jika dibandingkan dengan persamaan QSAR terpilih : IC50 = 8.49946 + 0.116956 * RDF085v + 0.0728364 * RDF100u + -0.849022 * a_acc + 0.913227 * vsurf_ID1 Atom elektronegatif seperti flour, nitrogen dan oksigen merupakan akseptor ikatan hidrogen. Hal ini berkorelasi dengan persamaan QSAR diatas khususnya pada deskriptor a_acc. Semakin banyak jumlah atom akseptor ikatan hidrogen, maka semakin kecil nilai IC50nya atau dengan kata lain semakin besar nilai pIC50 nya. Flour merupakan atom dengan elektronegatifitas terbesar (4.0) jadi semakin mudah menjadi akseptor ikatan hidrogennya, sehingga aktivitasnya semakin kuat. Sulfur juga merupakan atom dengan elektronegatifitas relatif kuat yaitu sebesar 2,5. Hal ini menunjukkan bahwa persamaan QSAR yang terpilih berkorelasi dengan aktivitas biologis (data eksperimental). Analog 2-substitutusi-6-methylsulfonyl-3-thioaryloxyindole

24

Hal yang serupa juga berlaku untuk analog senyawa diatas. Senyawa yang memiliki harga p IC50 terbesar adalah senyawa 24g, yang memiliki atom dengan elektronegatifitas kuat yaitu Cl dan gugus CN. V. KESIMPULAN 1. Persamaan QSAR terpilih IC50 = 8.49946 + 0.116956 * RDF085v + 0.0728364 * RDF100u + -0.849022 * a_acc + 0.913227 * vsurf_ID1
2. Parameter statistik dari persamaan QSAR terpilih : r = 0,8213, LOF = 0,1025, F = 22,9791, PRESS = 1,642189
2

3. Deskriptor esensial : a_acc, vsurf_ID1 4. Terdapat hubungan antara persamaan QSAR yang diperoleh dengan aktivitas biologis hasil eksperimental

VI. DAFTAR PUSTAKA Leach, A.R., 1996, Molecular Modelling : Principles and Aplications, Addison Wishley, Longman, London Molecular Operating Environment (MOE), 2010.10; Chemical Computing Group Inc., 1010 Sherbooke St.West, Suite #910, Montreal, QC, Canada, H3A, 2R7, 2010. Pranowo, H. D. 2002. Kimia Komputasi. Pusat Kimia Komputasi Indonesia-Austria Kimia FMIPA UGM. Yogyakarta. Sardjoko, 1993, Rancangan Obat, UGM Press, Yogyakarta.

25

Anda mungkin juga menyukai