Anda di halaman 1dari 67

BIOINFORMATICS AND QSAR

ACHMAD SYAHRANI – GALIH STARIO PUTRO


KRIAN, 8 MARET 2021
BIOINFORMATICS AND QSAR
 Perkembangan kimia medisinal Era Industry 4.0 menyebabkan semua berbasis
komputasi yang menghasilkan data bioinformatika. Saat ini dengan adanya COVID-
19 ( + COVID-117) kita berada ZAMAN NOW, sejak awal Maret 2020, sekarang
Maret 2021, jadi sudah SETAHUN – zaman sudah TIDAK NORMAL lagi ,
tetapi sudah NEW NORMAL.
 Data Bioinformatika saat berguna untuk mengurangi trial and errors ketika
mengembangkan obat baru yang lebih aman, efektif dengan efek samping
seminimal mungkin.
 Computer Aided Drug Design (CADD) saat ini sangat membantu dalam proses
penemuan obat baru
BIOINFORMATIKA
Saat pertama mendengar istilah Bioinformatika, mungkin akan terbesit beberapa pertanyaan dalam benak kita,
diantaranya :
1. Apa itu bioinformatika?
2. Apa bedanya dengan istilah lain misalnya, bioinspired computing, atau algoritma genetika?
Pada kesempatan kali ini, saya akan mencoba mengulas salah satu bidang ilmu interdisiplin, yaitu
Bioinformatika, dimana Kecerdasan Buatan merupakan bidang ilmu yang mutlak digunakan dalam
bioinformatika.
Bioinformatika dapat dikatakan merupakan gabungan dari kata biologi dan kata informatika. Hal ini
dapat mensiratkan definisi dari bioinformatika, yaitu informatika (ilmu komputer) yang digunakan
untuk mengolah data biologi (life sciences) (Jones and Pevzner, 2004).
Secara keseluruhan, tidak hanya ilmu komputer yang digunakan untuk mengolah data biologi tetapi juga disiplin
ilmu lain seperti statistika. Sehingga di sini, kita dapat memahami perbedaan yang jelas antara bioinformatika
dengan beberapa istilah lain, misalnya bioinspired computing dan algoritma genetika. Bioinspired computing
merupakan algoritma-algoritma yang terinspirasi oleh mahluk hidup. Salah satu algoritma dari bioinspired
computing adalah algoritma genetika yaitu algoritma yang bertumpu pada teori genetika dan evolusi.
Pada bidang ilmu bioinformatika, akan dipelajari metode – metode komputasi untuk memecahkan
pertanyaan – pertanyaan dalam bidang biologi yang sulit dicari solusinya jika hanya dikerjakan oleh
biologi dalam laboratorium basah (wet lab). Data – data biologi akan digunakan dan diolah oleh komputer
menggunakan algoritma/metode komputasi yang sesuai untuk mencoba menjawab pertanyaan – pertanyaan
tersebut. Pengolahan data oleh komputer ini sering diistilahkan dikerjakan pada laboratorium kering
(dry lab).
Bagi seorang computer scientist, apakah yang diperlukan untuk memulai belajar bioinformatika?
Senjata dari seorang computer scientist adalah keahlian untuk metode komputasi dan algoritma.
Kita tidak perlu mendalami biologi seperti ahli biologi, tetapi cukup memahami apa input dan output yang
diharapkan dengan berkonsultasi dengan ahli biologi kemudian membuat pipeline metode – metode komputasi
atau algoritma yang akan digunakan untuk mendapatkan output tersebut. Semua metode komputasi dan
algoritma akan digunakan, tentunya salah satunya adalah kecerdasan buatan.

Bioinformatika untuk Medis


Bioinformatika merupakan hal yang baru, hal ini
tidak dapat lepas dari perkembangan biologi
molekul modern yang ditandai dengan kemampuan
manusia untuk memahami genom, yaitu Blue Print
informasi genetik yang menentukan sifat dari setiap
makhluk hidup yang disandi dalam bentuk pita
molekul DNA (asam deoksiribonukleat).
Bioinformatika adalah salah satu cabang baru
ilmu biologi yang merupakan perpaduan
antara biologi dan teknologi informasi.
Menurut Durso (1997) bioinformatika adalah
manajemen dan analisis informasi biologis yang
disimpan dalam database.
Pada awal perkembangan ilmu
pengetahuan. Para pakar biologi molekuler,
ahli biologi melakukan pengambilan data
biologis dengan menggunakan eksperimen
atau pendekatan lainnya. Data tersebut
disimpan di dalam suatu database,
struktur protein, dan data sekuen
protein. Data yang masif tersebut tidak
dapat dianalisa secara efektif karena
keterbatasan manusia. Oleh karena itu,
dibutuhkan ahli komputer untuk membantu
kerja dari ahli biologi. Sehingga dapat ditarik
kesimpulan jika Bioinformatika adalah
bidang ilmu yang mempelajari teknik
komputasi dalam melakukan
pengumpulan dan analisa data biologis
kompleks. Biologi, ilmu komputer,
matematika, dan statistika memiliki peranan
penting di dalam bidang bioinformatika.
Kehadiran bioinformatika tidak terlepas dari
data biologi yang masif dan sulit dikelola
secara manual sehingga menjadi tren
penelitian di bidang biologi saat ini.
Peran Komputer dalam Penemuan Obat

Membawa senyawa kimia dari aras ide menjadi obat yang


beredar di pasar merupakan proses yang membutuhkan
sekitar rata-rata 800 juta US dollar menurut catatan yang
disampaikan DiMasi dkk. (2003). Biaya yang sangat besar
tentunya, apalagi dikaitkan dengan kemampuan ekonomi
negara-negara berkembang, seperti Indonesia. Strategi
dan upaya yang efektif dan ekonomis diperlukan untuk
membawa Indonesia juga turut diperhitungkan dalam
penemuan obat

Tawaran yang menarik akhir-akhir ini adalah pemanfaatan


komputer sebagai alat bantu dalam penemuan obat.
Kemampuan komputasi yang meningkat eksponensial
merupakan peluang untuk mengembangkan simulasi dan
kalkulasi dalam merancang obat. Komputer
menawarkan metode in silico sebagai komplemen
metode in vitro dan in vivo yang lazim digunakan
dalam proses penemuan obat. Terminologi in silico,
analog dengan in vitro dan in vivo, merujuk pada
pemanfaatan komputer dalam studi penemuan obat.
Mengapa dikatakan menarik?

Alasan utamanya adalah efisiensi biaya. Sebagai ilustrasi akan disampaikan perbandingan penemuan obat
secara konvensional dan dengan bantuan komputer ketika ditemukan suatu senyawa A dalam tanaman Z yang
diduga aktif sebagai senyawa antikanker dengan menghambat enzim X, suatu enzim yang sudah diketahui
strukturnya secara kristalografi :

1. Konvensional
Secara konvensional yang bisa dilakukan adalah mensintesis turunan dan analog senyawa A dan diujikan dalam
enzim X sampai ditemukan benerapa senyawa yang sangat potensial untuk dikembangkan. Pada senyawa-
senyawa potensial tersebut dilakukan uji lanjutan dan secara alami senyawa-senyawa tersebut dapat
berguguran dan tidak sampai ke pasar karena terbentur beberapa masalah pada uji lanjutan, misal didapati
toksis. Kemudian dilakukan skrining lagi dari tanaman yang secara empiris dilaporkan mengobati kanker.

2. Dengan bantuan komputer (Computer Aided Drug Discovery; CADD)


Di lain pihak, keberadaan sebuah komputer pribadi dilengkapi dengan aplikasi kimia komputasi yang memadai
ditangan ahli kimia komputasi medisinal yang berpengalaman dapat menayangkan senyawa A secara tiga
dimensi (3D) dan melakukan komparasi dengan senyawa lain yang sudah diketahui memiliki aktivitas tinggi,
misal senyawa B. Berdasarkan komparasi 3D dilengkapi dengan perhitungan similaritas dan energi, memberikan
gambaran bagian-bagian dan gugus-gugus potensial yang dapat dikembangkan dari senyawa A (pharmacophore
query).
Kemudian berbagai senyawa turunan dan analog disintesis secara in silico alias digambar sesuai persyaratan
aplikasi komputer yang digunakan (Untuk selanjutnya disebut senyawa hipotetik).
Hal ini jelas jauh lebih murah daripada sintesis yang sebenarnya.
Keberadaan data struktur 3D enzim X akan sangat membantu. Aplikasi komputer dapat melakukan studi
interaksi antara senyawa-senyawa hipotetik dengan enzim X secara in silico pula.
Dari studi ini dapat diprediksi aktivitas senyawa-senyawa hipotetik dan dapat dilakukan eliminasi senyawa-
senyawa yang memiliki aktivitas rendah. Sebelum diusulkan untuk disintesis, senyawa-senyawa hipotetik
tersebut dengan diprediksi toksisitasnya secara in silico dengan cara melihat interaksinya dengan enzim-enzim
yang bertanggung jawab pada metabolisme obat.
Dari beberapa langkah in silico tersebut, dapat diusulkan beberapa senyawa analog dan turunan senyawa A
yang memang potensial untuk disintesis dan dikembangkan, atau mengusulkan untuk mengembangkan seri
baru. Jumlah senyawa yang diusulkan biasanya jauh lebih sedikit dibandingkan penemuan obat secara
konvensional.
Dalam hal ini komputer membantu untuk mereduksi jumlah senyawa yang diusulkan secara rasional dan
diharapkan lebih efektif serta, membantu mempelajari interaksi obat dengan targetnya bahkan kemungkinan
sifat toksis senyawa tersebut dan metabolitnya.
Berdasar pengalaman penulis, dalam waktu satu tahun di Indonesia dikarenakan kurang pengalaman (dan
starting material tidak dapat ditemui di agen lokal, harus impor dan butuh waktu tiga bulan jika ada stoknya;
alat untuk elusidasi struktur sangat jarang dan andaikan ada pun sering tidak dalam kondisi dapat digunakan,)
rata-rata hanya mampu melaporkan sintesis 3 senyawa sederhana. Peran komputer dalam hal ini bagi negara
berkembang dapat dioptimalkan.
Berdasarkan ilustrasi di atas dapat disarikan dua metode yang saling melengkapi dalam penggunaan komputer
sebagai alat bantu penemuan obat, yaitu:
(i) berdasarkan senyawa yang diketahui berikatan dengan target atau biasa disebut ligand, (rancangan
obat berdasarkan ligand; ligand-based drug design (LBDD) dan
(ii) berdasarkan struktur target baik berupa enzim maupun reseptor yang bertanggung jawab atas
toksisitas dan aktivitas suatu senyawa di dalam tubuh (rancangan obat berdasarkan struktur target;
structure-based drug design (SBDD)).
LBDD memanfaatkan informasi sifat fisikokimia senyawa-senyawa aktif sebagai landasan mendesain senyawa
baru. Tiga metode LBDD yang lazim digunakan adalah pharmacophore discovery dan hubungan kuantitatif
struktur-aktivitas/quantative structure-activity relationship (HKSA/QSAR), dan docking studies.
Pharmacophore discovery yaitu metode mencari kesamaan sifat fisikokimia antara lain sifat elektronik,
hidrofobik dan sterik dari senyawa-senyawa yang dilaporkan aktif kemudian dibangun suatu bagian 3D yang
menggabungkan sifat gugus-gugus maupun bagian senyawa yang diduga bertangung jawab terhadap
aktivitasnya (pharmacophore).
Adapun QSAR memadukan statistika dengan sifat fisikokimia senyawa yang dapat dikalkulasi dengan bantuan
komputer guna menurunkan suatu persamaan yang dapat digunakan memprediksi aktivitas suatu senyawa
Struktur protein target dapat dimodelkan dari data yang diperoleh struktur kristalnya maupun hasil analisis
Nuclear Magnetic Resonance (NMR) maupun Data Genomic (Bioinformatics). Struktur protein hasil kristalografi
dapat diakses di www.rscb.org.
SBDD memanfaatkan informasi dari struktur protein target guna mencari sisi aktif protein yang berikatan
dengan senyawa. Berdasarkan prediksi sisi aktif dapat dirancang senyawa yang diharapkan berikatan dengan
protein target tersebut dan memiliki aktivitas biologis.
Dengan memanfaatan informasi dari struktur target maupun sifat fisikokimia ligand dapat dilakukan skrining uji
interaksi senyawa-senyawa yang diketahui aktif (ligand) pada prediksi sisi aktif protein.
Berdasarkan informasi yang diperoleh dirancang senyawa baru yang diharapkan lebih poten dari
senyawa-senyawa yang ada. Hal ini juga digunakan untuk studi interaksi ligand dengan protein targetnya.
Salah satu kelemahan docking studies dalam untuk studi interaksi adalah asumsi struktur protein yang kaku,
yang tidak memfasilitasi efek induced-fit dari interaksi protein dengan ligand-nya. Fleksibilitas protein dan
interaksinya dengan suatu senyawa dapat dianalisis dengan mengaplikasikan Molecular Dynamics (MD),
simulasi yang melihat perubahan struktur suatu senyawa terhadap waktu berdasarkan parameter-parameter
tertentu.
Permasalahan utama untuk pemanfaatan komputer ini adalah keberadaan aplikasi kimia komputasi yang
memadai dan lengkap. Salah satu aplikasi kimia komputasi yang cukup memadai untuk penemuan obat adalah
Molecular Operating Environment (MOE) yang dikembangkan Chemical Computing Group
(www.chemcomp.com). MOE selain menawarkan fasilitas yang cukup lengkap juga user-friendly sehingga cocok
digunakan dalam pembelajaran. Hanya saja aplikasi kimia komputasi yang user-friendly biasanya mahal
sehingga alasan efisiensi biaya tidak lagi relevan. Sebagai informasi, biaya lisensi untuk penggunaan akademis
(non komersial) sekitar 2000 US dollar pertahun. Namun demikian di era open source ini semakin banyak
aplikasi-aplikasi kimia komputasi berbasis open source maupun yang menawarkan free academic
license (Geldenhuys dkk., 2006). Hanya saja aplikasi-aplikasi tersebut seringkali tidak user-friendly dan untuk
memanfaatkannya membutuhkan kemampuan komputer yang lebih dalam, seperti menguasai LINUX-based
operating system dan command line editor bawaan masing-masing aplikasi. Selain tidak user-friendly, aplikasi-
aplikasi tersebut seringkali fokus pad.
DESAIN OBAT BERBANTUAN KOMPUTER (CADD)
Tujuan paling mendasar dalam desain obat adalah untuk memprediksi apakah molekul tertentu akan mengikat
target dan jika demikian seberapa kuat. Mekanika molekul atau dinamika molekul paling sering digunakan
untuk memperkirakan kekuatan interaksi antarmolekul antara molekul kecil dan target biologisnya. Metode
ini juga digunakan untuk memprediksi konformasi molekul kecil dan memodelkan perubahan konformasi pada
target yang mungkin terjadi jika molekul kecil mengikatnya. [3] [4] Semi-empiris , metode kimia kuantum ab
initio , atau teori fungsional kerapatan sering digunakan untuk memberikan parameter yang dioptimalkan
untuk kalkulasi mekanika molekuler dan juga memberikan perkiraan sifat elektronik (potensial elektrostatis,
polarisasi , dll.) dari kandidat obat yang akan mempengaruhi afinitas pengikatan. [23]

Metode mekanika molekuler juga dapat digunakan untuk memberikan prediksi semi-kuantitatif dari afinitas
pengikatan. Selain itu, fungsi penilaian berbasis pengetahuan dapat digunakan untuk memberikan perkiraan
afinitas yang mengikat. Metode ini menggunakan regresi linier , pembelajaran mesin , jaringan saraf ,
atau teknik statistik lainnya untuk mendapatkan persamaan afinitas pengikatan prediktif dengan menyesuaikan
afinitas eksperimental dengan energi interaksi yang diturunkan secara komputasi antara molekul kecil dan
target. [24] [25]
Idealnya, metode komputasi akan dapat memprediksi afinitas sebelum suatu senyawa disintesis dan karenanya
secara teori hanya satu senyawa yang perlu disintesis, sehingga menghemat banyak waktu dan biaya.
Kenyataannya adalah bahwa metode komputasi saat ini tidak sempurna dan paling-paling hanya memberikan
perkiraan afinitas yang akurat secara kualitatif. Dalam praktiknya, masih diperlukan beberapa iterasi desain,
sintesis, dan pengujian sebelum obat yang optimal ditemukan. Metode komputasi telah mempercepat
penemuan dengan mengurangi jumlah iterasi yang diperlukan dan sering kali menyediakan struktur baru. [26] [27]
Desain obat dengan bantuan komputer dapat digunakan pada salah satu tahap penemuan obat berikut:
1. Identifikasi hit menggunakan penyaringan virtual (desain berbasis struktur atau ligan)
2. Pengoptimalan afinitas dan selektivitas hit-to-lead (desain berbasis struktur, QSAR , dll.)
3. Memimpin pengoptimalan properti farmasi lainnya sambil mempertahankan afinitas
Diagram Alir Analisis Pengelompokan Biasa untuk Desain Obat Berbasis Struktur
Untuk mengatasi prediksi yang tidak mencukupi dari afinitas pengikatan yang dihitung dengan fungsi penilaian
terkini, interaksi protein-ligan dan informasi struktur 3D senyawa digunakan untuk analisis.
Untuk desain obat berbasis struktur, beberapa analisis pasca-skrining yang berfokus pada interaksi protein
-ligan telah dikembangkan untuk meningkatkan pengayaan dan secara efektif menambang kandidat potensial :

Penilaian konsensus [28] [29]


• Memilih kandidat dengan pemungutan suara dari beberapa fungsi penilaian
• Dapat kehilangan hubungan antara informasi struktural protein-ligan dan kriteria penilaian
Analisis cluster [30] [31]
• Mewakili dan mengelompokkan kandidat menurut informasi 3D protein-ligan
• Membutuhkan representasi yang bermakna dari interaksi protein-ligan.
Jenis
Siklus penemuan obat yang menyoroti strategi desain obat berbasis ligan (tidak langsung) dan berbasis struktur
(langsung). Ada dua tipe utama rancangan obat. Yang pertama disebut sebagai desain obat berbasis ligan
dan yang kedua, desain obat berbasis struktur . [2]
COMPUTER-AIDED DRUG
DESIGN
SBDD (STRUCTURE BASED
DRUG DESIGN)
Berbasis struktur
Desain obat berbasis struktur (atau desain obat langsung ) bergantung pada pengetahuan tentang struktur
tiga dimensi dari target biologis yang diperoleh melalui metode seperti kristalografi sinar-X atau
spektroskopi NMR . [34]
Jika struktur eksperimental target tidak tersedia, dimungkinkan untuk membuat model homologi target
berdasarkan struktur eksperimental dari protein terkait. Dengan menggunakan struktur target biologis, kandidat
obat yang diperkirakan berikatan dengan afinitas dan selektivitas tinggi terhadap target dapat dirancang
dengan menggunakan grafik interaktif dan intuisi ahli kimia obat.. Sebagai alternatif, berbagai prosedur
komputasi otomatis dapat digunakan untuk menyarankan kandidat obat baru. [35]
Metode terkini untuk rancangan obat berbasis struktur secara kasar dapat dibagi menjadi tiga kategori
utama. [36]
Metode pertama adalah identifikasi ligan baru untuk reseptor tertentu dengan mencari database besar dari
struktur 3D dari molekul kecil untuk menemukan database yang sesuai dengan kantong pengikat reseptor
menggunakan program docking perkiraan cepat . Metode ini dikenal sebagai penyaringan virtual.
Kategori kedua adalah desain de novo ligan baru. Dalam metode ini, molekul ligan dibangun dalam batasan
kantong pengikat dengan merakit potongan-potongan kecil secara bertahap. Potongan-potongan ini dapat berupa
atom individu atau fragmen molekul. Keuntungan utama dari metode semacam itu adalah bahwa struktur baru,
tidak terdapat dalam database mana pun, dapat disarankan. [37][38] [39]
Metode ketiga adalah optimalisasi ligan yang diketahui dengan mengevaluasi analog yang diusulkan dalam
rongga pengikatan. [36]
LBDD (LIGAND BASED DRUG
DESIGN)
Berbasis ligan

Desain obat berbasis ligan (atau desain obat tidak langsung ) bergantung pada pengetahuan tentang
molekul lain yang mengikat target biologis yang diinginkan.
Molekul lain ini dapat digunakan untuk mendapatkan model farmakofor yang menentukan karakteristik
struktural minimum yang diperlukan yang harus dimiliki molekul untuk mengikat target. [32]
Dengan kata lain, model target biologis dapat dibangun berdasarkan pengetahuan tentang apa yang
mengikatnya, dan model ini pada gilirannya dapat digunakan untuk merancang entitas molekul baru yang
berinteraksi dengan target.

Atau, hubungan aktivitas-struktur kuantitatif (QSAR), di mana korelasi antara sifat-sifat molekul yang
dihitung dan aktivitas biologisnya yang ditentukan secara eksperimental., dapat diturunkan.
Hubungan QSAR ini pada gilirannya dapat digunakan untuk memprediksi aktivitas analog baru. [33]
Identifikasi situs yang mengikat.

Identifikasi lokasi pengikatan adalah langkah pertama dalam desain berbasis struktur. [16] [40] Jika struktur
target atau homolog yang cukup mirip ditentukan dengan adanya ligan terikat, maka ligan harus dapat
diamati dalam struktur di mana lokasi tempat pengikatan tidak terlalu penting. Namun, mungkin ada situs
pengikatan alosterik kosong yang mungkin menarik. Lebih lanjut, mungkin hanya struktur apoprotein
(protein tanpa ligan) yang tersedia dan identifikasi yang dapat diandalkan dari situs kosong yang memiliki
potensi untuk mengikat ligan dengan afinitas tinggi bukanlah hal yang sepele. Singkatnya, identifikasi lokasi
penjilidan biasanya bergantung pada identifikasi cekung permukaan pada protein yang dapat menampung
molekul seukuran obat yang juga memiliki "hot spot" yang sesuai ( permukaan hidrofobik , situs ikatan
hidrogen , dll.) yang mendorong pengikatan ligan. [16] [40]
Fungsi penilaian
Fungsi scoring untuk docking
Desain obat berbasis struktur mencoba menggunakan struktur protein sebagai dasar untuk mendesain ligan
baru dengan menerapkan prinsip pengenalan molekuler. Afinitas tinggi selektif yang mengikat target
umumnya diinginkan karena mengarah ke obat yang lebih mujarab dengan efek samping yang lebih sedikit.
Jadi, salah satu prinsip terpenting untuk merancang atau mendapatkan ligan baru yang potensial adalah
memprediksi afinitas pengikatan ligan tertentu ke targetnya (dan antitarget yang diketahui ) dan
menggunakan afinitas yang diprediksi sebagai kriteria untuk seleksi. [41]
Salah satu fungsi penilaian empiris untuk tujuan umum awal untuk menggambarkan energi pengikatan ligan ke
reseptor dikembangkan oleh Böhm. [42] [43] Fungsi penilaian empiris ini berupa:
dimana:
 ΔG0 - offset yang diturunkan secara empiris yang sebagian sesuai dengan hilangnya keseluruhan entropi
translasi dan rotasi ligan saat pengikatan.
 ΔGhb - kontribusi dari ikatan hidrogen
 ΔGionic - kontribusi dari interaksi ionik
 ΔGlip - kontribusi dari interaksi lipofilik dimana | A lipo | adalah luas permukaan kontak lipofilik antara ligan dan
reseptor
 ΔGrot - penalti entropi karena pembekuan yang dapat diputar dalam ikatan ligan saat mengikat

Persamaan "master" termodinamika yang lebih umum adalah sebagai berikut: [44]

dimana:
• desolvasi - penalti entalpik untuk menghilangkan ligan dari pelarut
• gerak - hukuman entropik untuk mengurangi derajat kebebasan saat ligan berikatan dengan reseptornya
• konfigurasi - energi regangan konformasi yang diperlukan untuk menempatkan ligan dalam konformasi "aktif"
• interaksi - penguatan entalpik untuk "menyelesaikan" ligan dengan reseptornya

Ide dasarnya adalah bahwa energi bebas pengikat secara keseluruhan dapat diuraikan menjadi komponen
independen yang diketahui penting untuk proses pengikatan. Setiap komponen mencerminkan jenis perubahan
energi bebas tertentu selama proses pengikatan antara ligan dan reseptor targetnya. Persamaan Master adalah
kombinasi linier dari komponen-komponen ini. Berdasarkan persamaan energi bebas Gibbs, dibangun hubungan
Berbagai metode komputasi digunakan untuk memperkirakan masing-masing komponen persamaan master.
Misalnya, perubahan luas permukaan kutub pada pengikatan ligan dapat digunakan untuk memperkirakan energi
desolvasi. Jumlah ikatan yang dapat diputar yang dibekukan pada ikatan ligan sebanding dengan suku
gerakannya. Energi konfigurasi atau regangan dapat diperkirakan menggunakan kalkulasi mekanika
molekuler. Akhirnya energi interaksi dapat diperkirakan menggunakan metode seperti perubahan permukaan
non polar, potensi gaya rata-rata yang diturunkan secara statistik, jumlah ikatan hidrogen yang terbentuk, dll.
Dalam praktiknya, komponen persamaan master disesuaikan dengan data eksperimen menggunakan regresi
linier berganda. Ini dapat dilakukan dengan rangkaian pelatihan yang beragam termasuk berbagai jenis ligan dan
reseptor untuk menghasilkan model "global" yang kurang akurat tetapi lebih umum atau rangkaian ligan dan
reseptor yang lebih terbatas untuk menghasilkan model "lokal" yang lebih akurat tetapi kurang umum. [45]

Contoh
Sebuah contoh khusus dari desain obat rasional melibatkan penggunaan informasi tiga dimensi tentang
biomolekul yang diperoleh dari teknik seperti kristalografi sinar-X dan spektroskopi NMR. Rancangan obat dengan
bantuan komputer khususnya menjadi jauh lebih mudah diatur ketika ada struktur resolusi tinggi dari protein
target yang terikat pada ligan yang kuat. Pendekatan penemuan obat ini kadang-kadang disebut sebagai
rancangan obat berbasis struktur. Contoh tegas pertama dari penerapan desain obat berbasis struktur yang
mengarah ke obat yang disetujui adalah dorzolamide inhibitor anhidrase karbonat , yang telah disetujui pada
tahun 1995. [46] [47]
Studi kasus penting lainnya dalam desain obat rasional adalah imatinib, penghambat tirosin kinase yang
dirancang khusus untuk protein fusi bcr-abl yang merupakan karakteristik untuk leukemia kromosom-positif
Philadelphia (leukemia mielogenous kronis dan kadang-kadang leukemia limfositik akut ). Imatinib
secara substansial berbeda dari obat kanker sebelumnya , karena kebanyakan agen kemoterapi hanya
menargetkan sel yang membelah dengan cepat, tidak membedakan antara sel kanker dan jaringan lain. [48]
Telah dikemukakan bahwa sifat desain obat rasional yang sangat kaku dan terfokus menekan
kebetulan dalam penemuan obat. [50] Karena banyak dari penemuan medis yang paling signifikan
telah terjadi secara tidak sengaja, fokus baru-baru ini pada desain obat yang rasional dapat membatasi
kemajuan penemuan obat. Lebih lanjut, desain rasional suatu obat mungkin dibatasi oleh pemahaman yang
kasar atau tidak lengkap tentang proses molekuler yang mendasari penyakit yang dimaksudkan untuk diobati.
[51]

Lihat juga
• Bioisostere
• Bioinformatika
• Kimiawi
• Pengembangan obat
• Penemuan obat
• Daftar perusahaan farmasi
• Kimia obat
• Perangkat lunak desain molekuler
• Modifikasi molekuler
• Desain obat retrometabolik
Pengembangan obat adalah proses
membawa obat farmasi baru ke
pasar setelah senyawa timbal telah
diidentifikasi melalui proses
penemuan obat. Ini termasuk
penelitian praklinis tentang
mikroorganisme dan hewan,
pengajuan status peraturan, seperti
melalui Administrasi Makanan dan
Obat Amerika Serikat untuk obat
baru yang diteliti untuk memulai uji
klinis pada manusia, dan mungkin
termasuk langkah untuk mendapatkan
persetujuan peraturan dengan
aplikasi obat baru untuk
memasarkan obat. [1] [2]Keseluruhan
proses - dari konsep hingga pengujian
praklinis di laboratorium hingga
pengembangan uji klinis, termasuk uji
coba Fase I – III - hingga vaksin atau
obat yang disetujui biasanya
membutuhkan waktu lebih dari satu
dekade. [1] [2] [3]
TARGET RECEPTOR STORAGE
IN RCSB
2 METHODS COMMONLY USED TO FIND
RECEPTOR/PROTEIN TARGET
X-RAY CRYSTALL0GRAPHY
METHOD
NMR SPECTROSCOPY
METHOD
STEP 6 : DOCKING OTHER
CHEMICALS
EXAMPLE FOR DOCKING
RESULT

R. Y. Utomo., M. Ikawati; E. Meiyanto; Revealing the Potency of Citrus and Galangal Constituents
o Halt SARS-CoV-2 Infection. doi:10.20944/preprints202003.0214.v1
K. Abraham Peele et al.,
Molecular docking and dynamic simulations for antiviral compounds against SARS-CoV-2: A computational study.,
https://doi.org/10.1016/j.imu.2020.100345
STEP 7 : CHOICE SOME
CHEMICALS AND SCREENING
THEIR ADMET
8
9
QUANTITATIVE STRUCTURE ACTIVITY RELATIONSHIP
Hubungan Kuantitatif Struktur Aktivitas (HKSA)
Model Hubungan Kuantitatif Struktur-Aktivitas adalah model regresi atau model
klasifikasi yang digunakan dalam ilmu-ilmu biologi, kimia, Kimia Medisinal, dan
ilmu teknik. Wikipedia
HKSA (HUBUNGAN KUANTITATIF STRUKTUR DAN AKTIVITAS)
Struktur kuantitatif-hubungan aktivitas
Model hubungan struktur-aktivitas kuantitatif (model QSAR ) adalah model regresi atau klasifikasi yang
digunakan dalam ilmu kimia dan biologi serta teknik. Seperti model regresi lainnya, model regresi QSAR
menghubungkan sekumpulan variabel "prediktor" (X) dengan potensi variabel respon (Y), sedangkan model
QSAR klasifikasi menghubungkan variabel prediktor dengan nilai kategorik variabel respon.
Dalam pemodelan QSAR, prediktor terdiri dari sifat fisika-kimia atau deskriptor molekuler teoretis [1] [2] bahan
kimia; variabel respons QSAR bisa menjadi aktivitas biologis bahan kimia. Model QSAR pertama-tama
merangkum hubungan yang seharusnya antara struktur kimia dan aktivitas biologis dalam kumpulan data bahan
kimia. Kedua, model QSAR memprediksi aktivitas bahan kimia baru. [3] [4]

Istilah terkait mencakup hubungan struktur-properti kuantitatif (QSPR ) ketika properti kimia dimodelkan
sebagai variabel respons. [5] [6] "Sifat atau perilaku yang berbeda dari molekul kimia telah diteliti dalam bidang
QSPR. Beberapa contohnya adalah struktur kuantitatif-hubungan reaktivitas (QSRR), struktur kuantitatif-
hubungan kromatografi (QSCRs) dan, struktur kuantitatif-hubungan toksisitas (QSTRs), struktur kuantitatif-
hubungan elektrokimia (QSERs), dan struktur kuantitatif-hubungan biodegradabilitas (QSBRs). " [7]

Sebagai contoh, aktivitas biologis dapat dinyatakan secara kuantitatif sebagai konsentrasi suatu zat yang
diperlukan untuk memberikan respons biologis tertentu. Selain itu, ketika sifat fisikokimia atau struktur
dinyatakan dengan angka, seseorang dapat menemukan hubungan matematis, atau hubungan struktur-aktivitas
kuantitatif, di antara keduanya. Ekspresi matematika, jika divalidasi dengan hati-hati [8] [9] [10] kemudian dapat
digunakan untuk memprediksi respons model struktur kimia lainnya. [11]
Sebuah QSAR berbentuk model matematika :
Aktivitas = f (sifat fisiokimia dan / atau sifat struktur) + kesalahan
Kesalahan tersebut meliputi kesalahan model ( bias ) dan variabilitas observasi, yaitu variabilitas dalam observasi
bahkan pada model yang benar.
Langkah-langkah penting dalam studi QSAR
Langkah-langkah utama QSAR / QSPR termasuk (i) Pemilihan kumpulan Data dan ekstraksi deskriptor struktural /
empiris (ii) pemilihan variabel, (iii) konstruksi model dan (iv) evaluasi validasi. " [7]
SAR dan paradoks SAR
Asumsi dasar untuk semua hipotesis berbasis molekul adalah bahwa molekul yang serupa memiliki aktivitas yang
serupa. Prinsip ini juga disebut Structure – Activity Relationship ( SAR ). Oleh karena itu, masalah yang
mendasarinya adalah bagaimana menentukan perbedaan kecil pada tingkat molekuler, karena setiap jenis
aktivitas, misalnya kemampuan reaksi , kemampuan biotransformasi , kelarutan , aktivitas target, dan sebagainya,
mungkin bergantung pada perbedaan lain. Contoh yang diberikan dalam bioisosterism ulasan Patanie / Lavoie [12]
dan Brown. [13]
Secara umum, orang lebih tertarik untuk menemukan tren yang kuat . Hipotesis yang dibuat biasanya bergantung
pada jumlah bahan kimia yang terbatas , jadi harus berhati-hati untuk menghindari overfitting : pembuatan
hipotesis yang sangat cocok dengan data pelatihan tetapi berkinerja buruk saat diterapkan pada data baru.
The SAR Paradoks mengacu pada fakta bahwa itu tidak terjadi bahwa semua molekul yang sama memiliki
kegiatan serupa.
Jenis
Berbasis fragmen (kontribusi grup)
Secara analogi, "koefisien partisi" —pengukuran kelarutan diferensial dan itu sendiri merupakan komponen
prediksi QSAR — dapat diprediksi baik dengan metode atom (dikenal sebagai "XLogP" atau "ALogP") atau
dengan metode fragmen kimiawi (dikenal sebagai "CLogP" dan variasi lainnya). Telah ditunjukkan bahwa logP
senyawa dapat ditentukan oleh jumlah fragmennya; metode berbasis fragmen umumnya diterima sebagai
prediktor yang lebih baik daripada metode berbasis atom. [14] Nilai pecahan telah ditentukan secara statistik,
berdasarkan data empiris untuk nilai logP yang diketahui. Metode ini memberikan hasil yang beragam dan
umumnya tidak dipercaya memiliki akurasi lebih dari ± 0,1 unit. [15]

Grup atau Fragmen QSAR juga dikenal sebagai GQSAR. [16]


GQSAR memungkinkan fleksibilitas untuk mempelajari berbagai fragmen molekul yang diminati dalam
kaitannya dengan variasi respons biologis. Fragmen molekuler dapat menjadi substituen di berbagai tempat
substitusi dalam kumpulan molekul kongenerik atau dapat didasarkan pada aturan kimia yang telah ditentukan
sebelumnya dalam kasus himpunan non-kongenerik. GQSAR juga mempertimbangkan deskriptor fragmen lintas
istilah, yang dapat membantu dalam mengidentifikasi interaksi fragmen kunci dalam menentukan variasi
aktivitas. [16]
Penemuan prospek menggunakan Fragnomics adalah paradigma yang muncul. Dalam konteks ini FB-QSAR
terbukti menjadi strategi yang menjanjikan untuk desain perpustakaan fragmen dan dalam upaya identifikasi
fragmen-untuk-memimpin. [17]
Pendekatan lanjutan pada QSAR berbasis fragmen atau kelompok berdasarkan konsep kemiripan farmakofor
dikembangkan. [18] Metode ini, QSAR berbasis farmakofor-kesamaan (PS-QSAR) menggunakan deskriptor
farmakofor topologi untuk mengembangkan model QSAR. Prediksi aktivitas ini dapat membantu kontribusi fitur
farmakofor tertentu yang dikodekan oleh masing-masing fragmen terhadap peningkatan aktivitas dan / atau
efek merugikan. [18]
3D-QSAR
Akronim 3D-QSAR atau 3-D QSAR mengacu pada penerapan kalkulasi medan gaya yang membutuhkan
struktur tiga dimensi dari sekumpulan molekul kecil tertentu dengan aktivitas yang diketahui (set pelatihan).
Set pelatihan perlu ditumpangkan (diselaraskan) oleh data eksperimen (misalnya berdasarkan kristalografi
protein ligan ) atau perangkat lunak superimposisi molekul . Ini menggunakan potensi yang dihitung, misalnya
potensi Lennard-Jones, daripada konstanta eksperimental dan berkaitan dengan keseluruhan molekul daripada
substituen tunggal. QSAR 3-D pertama diberi nama Comparative Molecular Field Analysis (CoMFA) oleh Cramer
et al. Ini memeriksa bidang sterik (bentuk molekul) dan bidang elektrostatik [19] yang dikorelasikan dengan
menggunakan regresi kuadrat terkecil parsial (PLS).
Ruang data yang dibuat kemudian biasanya dikurangi dengan ekstraksi fitur berikut (lihat juga reduksi dimensi
). Metode pembelajaran berikut dapat berupa salah satu metode pembelajaran mesin yang telah disebutkan ,
misalnya mendukung mesin vektor . [20] Pendekatan alternatif menggunakan pembelajaran multi-contoh
dengan mengkodekan molekul sebagai kumpulan contoh data, yang masing-masing mewakili kemungkinan
konformasi molekul. Label atau respons diberikan untuk setiap himpunan yang sesuai dengan aktivitas molekul,
yang diasumsikan ditentukan oleh setidaknya satu contoh dalam himpunan (yaitu beberapa konformasi
molekul). [21]
Pada tanggal 18 Juni 2011, paten Comparative Molecular Field Analysis (CoMFA) telah mencabut batasan apa
pun pada penggunaan GRID dan teknologi partial least-square (PLS). [ butuh rujukan ]

Berbasis deskriptor kimia

Dalam pendekatan ini, deskriptor yang mengkuantifikasi berbagai properti elektronik, geometris, atau sterik dari
suatu molekul dihitung dan digunakan untuk mengembangkan QSAR. [22] Pendekatan ini berbeda dari pendekatan
fragmen (atau kontribusi kelompok) di mana deskriptor dihitung untuk sistem secara keseluruhan dan bukan dari
properti masing-masing fragmen. Pendekatan ini berbeda dari pendekatan 3D-QSAR di mana deskriptor dihitung
dari besaran skalar (misalnya, energi, parameter geometris) daripada dari bidang 3D.
Contoh dari pendekatan ini adalah QSAR yang dikembangkan untuk polimerisasi olefin oleh setengah senyawa
sandwich . [23] [24]

Pemodelan

Dalam literatur sering ditemukan bahwa ahli kimia memiliki preferensi untuk metode kuadrat terkecil parsial
(PLS), [ rujukan? ] Karena menerapkan ekstraksi fitur dan induksi dalam satu langkah.
Pendekatan data mining

Model SAR komputer biasanya menghitung fitur dalam jumlah yang relatif besar. Karena mereka tidak memiliki
kemampuan interpretasi struktural, langkah-langkah preprocessing menghadapi masalah pemilihan fitur (yaitu,
fitur struktural mana yang harus diinterpretasikan untuk menentukan hubungan struktur-aktivitas). Pemilihan fitur
dapat dilakukan dengan inspeksi visual (seleksi kualitatif oleh manusia); dengan data mining; atau dengan
penambangan molekul.

Prediksi berbasis data mining yang khas menggunakan, misalnya , mesin vektor dukungan , pohon keputusan ,
jaringan saraf tiruan untuk mendorong model pembelajaran prediktif.
Pendekatan penambangan molekul , kasus khusus dari pendekatan penambangan data terstruktur , menerapkan
prediksi berbasis matriks kesamaan atau skema fragmentasi otomatis ke dalam substruktur molekul. Selain itu,
ada juga pendekatan menggunakan pencarian subgraf umum maksimum atau kernel grafik . [25] [26]
Analisis pasangan
molekul yang cocok
Artikel utama: Analisis
pasangan molekul yang
cocok

Biasanya model QSAR yang


diturunkan dari
pembelajaran mesin non
linier dipandang sebagai
"kotak hitam", yang gagal
memandu ahli kimia obat.
Baru-baru ini ada konsep
yang relatif baru dari analisis
pasangan molekul yang
cocok [27] atau MMPA yang
didorong prediksi yang
digabungkan dengan model
QSAR untuk mengidentifikasi
tebing aktivitas. [28]
Evaluasi kualitas model QSAR

Pemodelan QSAR menghasilkan model prediktif yang berasal dari aplikasi alat statistik yang menghubungkan
aktivitas biologis (termasuk efek terapeutik yang diinginkan dan efek samping yang tidak diinginkan) atau sifat
fisika-kimia dalam model QSPR bahan kimia (obat / toksikan / polutan lingkungan) dengan perwakilan deskriptor
struktur atau sifat molekul . QSAR diterapkan dalam banyak disiplin ilmu, misalnya: penilaian risiko , prediksi
toksisitas, dan keputusan peraturan [29] selain penemuan obat dan optimalisasi timbal . [30]Memperoleh model
QSAR yang berkualitas tergantung pada banyak faktor, seperti kualitas data masukan, pilihan deskriptor dan
metode statistik untuk pemodelan dan untuk validasi. Setiap pemodelan QSAR pada akhirnya harus menghasilkan
model yang kuat secara statistik dan prediktif yang mampu membuat prediksi yang akurat dan andal dari respons
model senyawa baru.

Untuk validasi model QSAR, biasanya berbagai strategi diadopsi: [31]

1. Validasi internal atau validasi silang (sebenarnya, saat mengekstraksi data, validasi silang adalah ukuran
ketahanan model, semakin kuat model (q2 lebih tinggi) semakin sedikit ekstraksi data yang mengganggu
model asli);
2. Validasi eksternal dengan membagi kumpulan data yang tersedia menjadi kumpulan pelatihan untuk
pengembangan model dan kumpulan prediksi untuk pemeriksaan prediktivitas model;
3. Validasi eksternal buta dengan penerapan model pada data eksternal baru dan
4. Pengacakan data atau pengacakan Y untuk memverifikasi tidak adanya korelasi kebetulan antara respons
dan deskriptor pemodelan.
Keberhasilan model QSAR bergantung pada keakuratan data masukan, pemilihan deskriptor dan alat statistik
yang sesuai, dan yang terpenting validasi model yang dikembangkan. Validasi adalah proses di mana
keandalan dan relevansi prosedur ditetapkan untuk tujuan tertentu; untuk model QSAR, validasi harus
terutama untuk ketahanan, kinerja prediksi dan domain penerapan (AD) model. [8] [9] [10] [32] [33]

Beberapa metodologi validasi bisa menjadi masalah. Misalnya, membiarkan validasi silang satu keluar
umumnya mengarah pada perkiraan kapasitas yang terlalu tinggi. Bahkan dengan validasi eksternal, sulit
untuk menentukan apakah pemilihan set pelatihan dan pengujian dimanipulasi untuk memaksimalkan
kapasitas prediksi model yang sedang dipublikasikan.

Berbagai aspek validasi model QSAR yang perlu diperhatikan meliputi metode pemilihan senyawa set
pelatihan, [34] pengaturan ukuran set pelatihan [35] dan dampak pemilihan variabel [36] untuk model set pelatihan
untuk menentukan kualitas prediksi. Pengembangan parameter validasi baru untuk menilai kualitas model QSAR juga
penting. [10] [37] [38]
Aplikasi
Bahan kimia
Salah satu aplikasi QSAR historis pertama adalah untuk memprediksi titik didih . [39]
Hal ini juga diketahui misalnya bahwa dalam tertentu keluarga dari senyawa kimia , terutama dari kimia organik ,
bahwa ada yang kuat korelasi antara struktur dan sifat yang diamati. Contoh sederhananya adalah hubungan
antara jumlah karbon dalam alkana dan titik didihnya . Terdapat tren yang jelas dalam peningkatan titik didih
dengan peningkatan jumlah karbon, dan ini berfungsi sebagai alat untuk memprediksi titik didih alkana yang lebih
tinggi . Aplikasi yang masih sangat menarik adalah persamaan Hammett , persamaan Taft dan metode prediksi
pKa .
[40]

Biologis
Aktivitas biologis molekul biasanya diukur dalam tes untuk menetapkan tingkat penghambatan transduksi sinyal
atau jalur metabolisme tertentu . Penemuan obat sering kali melibatkan penggunaan QSAR untuk mengidentifikasi
struktur kimia yang dapat memiliki efek penghambatan yang baik pada target tertentu dan memiliki toksisitas
rendah (aktivitas non-spesifik). Yang menarik adalah prediksi koefisien partisi log P , yang merupakan ukuran
penting yang digunakan dalam mengidentifikasi " keserupaan obat " menurut Aturan Lima Lipinski .
Sementara banyak analisis hubungan aktivitas struktur kuantitatif melibatkan interaksi satu keluarga molekul
dengan enzim atau tempat pengikatan reseptor , QSAR juga dapat digunakan untuk mempelajari interaksi antara
domain struktural protein. Interaksi protein-protein dapat dianalisis secara kuantitatif untuk variasi struktural yang
dihasilkan dari mutagenesis yang diarahkan ke lokasi . [41]
Ini adalah bagian dari metode pembelajaran mesin untuk mengurangi risiko paradoks SAR, terutama dengan
mempertimbangkan bahwa hanya sejumlah data terbatas yang tersedia (lihat juga MVUE ). Secara umum, semua
masalah QSAR dapat dibagi menjadi pengkodean [42] dan pembelajaran . [43]
Aplikasi

(Q) Model SAR telah digunakan untuk manajemen risiko . QSARS disarankan oleh otoritas pengatur; di Uni
Eropa , QSAR disarankan oleh regulasi REACH , di mana "REACH" disingkat "Pendaftaran, Evaluasi, Otorisasi,
dan Pembatasan Bahan Kimia". Penerapan peraturan metode QSAR mencakup penilaian toksikologi silico
terhadap pengotor genotoksik. [44] Perangkat lunak penilaian QSAR yang umum digunakan seperti DEREK atau
MCASE digunakan untuk genotoksisitas pengotor menurut ICH M7 .

Ruang deskriptor kimia yang lambung cembungnya dihasilkan oleh set pelatihan bahan kimia tertentu disebut
domain penerapan set pelatihan . Prediksi sifat bahan kimia baru yang terletak di luar domain penerapan
menggunakan ekstrapolasi , sehingga kurang dapat diandalkan (rata-rata) daripada prediksi dalam domain
penerapan. Penilaian keandalan prediksi QSAR tetap menjadi topik penelitian.
Persamaan QSAR dapat digunakan untuk memprediksi aktivitas biologis molekul baru sebelum sintesisnya.
R4 R2
O
O
N NH2
H
O
R4 R2
O
O
N NH2
H
O
R4 R2
O
O
N NH2
H
O
R4 R2
O
O
N NH2
H
O
7
COMBINATION MODEL

Anda mungkin juga menyukai