Disusun Oleh
NIM : 24030122130086
KELAS :A
JURUSAN : KIMIA
Dalam beberapa tahun terakhir, minat para disiplin keilmuwan IPTEK terhadap
prediksi senyawa organik melalui retrosintesis berbasis artificial intelligence ( (AI)
meningkat secara drastis. Sintesis senyawa organik telah berkembang cukup pesat
untuk memenuhi tantangan yang ditimbulkan oleh target molekul yang semakin
beragam dan kompleks. Retrosintesis telah memberikan kontribusi substansial untuk
replikasi, konformasi, penolakan, dan memperbaiki produk alami untuk desain dan
sintesis obat. Dalam beberapa tahun terakhir, telah terjadi peningkatan minat yang
drastis dalam prediksi retrosintesis dengan teknik kecerdasan buatan (AI). Tidak seperti
prediksi retrosintesis konvensional yang dilakukan oleh ahli kimia dan seorang pakar
kesehatan, retrosintesis berbasis AI dapat memprediksi reaksi dan rute retrosintesis
secara otomatis. Hal Ini memberikan peluang untuk mengatasi banyak tantangan
konvensional, termasuk ketergantungan yang tinggi pada keahlian yang luas, sub-
optimalitas rute, dan biaya komputasi yang mahal. Saat menghadapi sintesis senyawa
tertentu, seperti obat, banyak ahli kimia memulai dengan produk akhir itu sendiri.
Mereka kemudian mencoba mengidentifikasi blok penyusun individu dan langkah-
langkah reaksi yang diperlukan untuk membuat seluruh senyawa. Proses retrosintesis ini
membantu ahli kimia mengembangkan jalur sintetik dari prekursor yang tersedia ke
molekul target. Selama bertahun-tahun, beberapa sumber retrosintesis yang didukung
komputer telah tersedia untuk membantu ahli kimia mengidentifikasi jalur sintetik,
salah satunya perangkat lunak Synthia™ retrosynthesis, yang pada awalnya
dikembangkan di laboratorium akademik dan menggunakan algoritme canggih untuk
memberikan solusi sintesis yang tidak bergantung pada literatur
PENDAHULUAN
Prediksi retrosintesis, yang pertama kali diresmikan oleh Corey dan Wipke pada tahun
1969, merancang urutan reaksi untuk menguraikan target secara rekursif menjadi blok
bangunan yang lebih sederhana sampai molekul awal yang tersedia secara komersial
tercapai. Prediksi retrosintesis terdiri dari dua tugas dasar yaitu single-step
retrosynthesis prediction and multi-step retrosynthesis prediction tujuan dalam prediksi
retrosintesis langkah tunggal adalah untuk memprediksi reaktan yang mungkin
diberikan molekul target, seperti yang ditunjukkan gambar di bawah ini
Dengan cara pemutusan, yang memutus ikatan antara atom-atom molekul target,
diperoleh satu atau lebih synthon . Satu hal yang harus ditekankan dimana synthon
(misalnya, elektrofilik “PhC=O+” kelompok pada Gambar. 1) sebagai fragmen adalah
ion atau radikal dan biasanya tidak ada sebagai spesies yang stabil, sedangkan reaktan
(misalnya, benzoil bromida) yang sesuai dengan synthon merupakan suatu prekursor
yang biasa digunakan dalam praktek retrosintesis. Setelah prediksi retrosintesis satu
langkah yang akurat dan rekursif selesai, retrosintesis multi langkah berfokus
memprediksi pada perencanaan rangkaian reaksi optimal yang meminimalkan jumlah
langkah sintesis, biaya awal molekul, limbah yang dihasilkan, dan sebagainya.
Seperti yang ditunjukkan pada gambar di bawah ini, molekuler yang menyandikan
perubahan dalam konektivitas atom selama reaksi kimia diwakili oleh pola subgraf.
Mulai dari molekul target, template dipilih berikut ini aturan yang telah ditetapkan dan
diterapkan pada molekul target untuk menentukan reaktan.
Pengguna juga memiliki opsi untuk melupakan proses perencanaan otomatis dan
menggunakan perangkat lunak retrosintesis Synthia™ secara manual. Hal itu,
memberikan penggunanya kebebasan untuk menavigasi melalui jalur retrosintesis yang
diberikan, dimulai dengan molekul target dan bergerak mundur secara iteratif
berdasarkan preferensi pengguna. Pada setiap langkah, perangkat lunak menyertakan
perincian dan referensi reaksi. Untuk informasi lebih lanjut tentang perangkat lunak
retrosintesis Synthia™, kunjungi: https://www.sigmaaldrich.com/synthia
Dalam memprediksi jalur suatu reaksi, retrosintesis dibagi menjadi dua yaitu prediksi
retrosintesis langkah tunggal (Single-step retrosynthesis prediction) dan retrosintesis
multi langkah (Multi-step retrosynthesis prediction)
1. Single-step retrosynthesis prediction
Terdapat langkah langkah yang ditempuh dalam memprediksi jalur suatu
reaksi kimia dalam single step retrosynthesis
1. Pemilihan Template
Sebuah template mengkodekan perubahan konektivitas antara produk
dan reaktan, sedangkan set template berisi sekelompok template untuk
aturan suatu reaksi kimia yang berbeda. Dengan memberi template dan
produk yang cocok, maka akan memudahkan untuk mendapatkan semua
reaktan dalam reaksi. Dengan demikian, metode berbasis templatetelah
ditentukan untuk prediksi retrosintesis satu langkah.
2. Ekstraksi template
Langkah pertama, Aturan reaksi kimia dikodifikasi oleh ahli kimia. Para
ahli merumuskan reaksi mana yang memungkinkan . Sejak saat itu,
aturan konvensional untuk transformasi generik telah digunakan dalam
prediksi retrosintesis dan telah meraih sukses besar untuk beberapa
produk kompleks. Dengan pertumbuhan reaksi yang tak terkendali, ada
kebutuhan mendesak untuk ekstraksi template secara otomatis, sehingga
algoritma heuristik diusulkan untuk membangun aturan umum dari
contoh reaksi yang diketahui . Aturan yang ditentukan oleh para ahli
sudah tepat, akan tetapi usulan tersebut masih belum cukup kuat untuk
menjelaskan cakupan fraksi dari jenis reaksi. Meskipun sangat efisien
untuk membuat template melalui ekstraksi template otomatis, template
tersebut mengalami tradeoff antara generalisasi dan kebenaran. Selain
itu, jumlah templat sangat besar dan terus meningkat karena reaksi baru
terus ditemukan.
3. Pengambilan template
Templat yang menyandikan rute sintetik molekul yang motif
strukturalnya mirip dengan molekul target lebih diprioritaskan, dan
hanya 100 templat yang produknya memiliki kemiripan terbesar dengan
molekul target yang diambil. Sehubungan dengan ukuran kesamaan (𝑝 ,
𝑃) antar molekul. RetroSim mempertimbangkan kesamaan struktur 2D,
yang diimplementasikan melalui dua langkah. Pertama, sebuah molekul
direpresentasikan sebagai vektor menggunakan sidik jari melingkar
Morgan, di mana hyperparameter radius mengacu pada ukuran
lingkungan terbesar yang harus dipertimbangkan, selain itu fitur dari
setiap simetri atom juga disertakan. Kedua, menyelidiki beberapa
persamaan suatu simetri molecular yang memungkinkan pada molekul
target. Perlu dicatat bahwa metrik representasi dan kesamaan semuanya
diimplementasikan dalam paket perangkat lunak RDKit.
Alih-alih bergantung pada kesamaan molekul eksplisit, NeuralSym
menempatkan masalah pengambilan template sebagai masalah klasifikasi
multi-kelas untuk secara otomatis mempelajari pola molekul target, yang
menentukan template mana yang akan digunakan. Jaringan saraf yang
terhubung penuh digunakan untuk melakukan klasifikasi multi-kelas,
seperti yang ditunjukkan pada Gambar. 7. Input ke jaringan saraf adalah
molekul target yang direpresentasikan menggunakan sidik jari dan
simpul output sesuai dengan semua templat. Saat dilengkapi dengan
molekul target baru, jaringan saraf yang terlatih mengambil template top-
k yang probabilitas softmax-nya adalah k tertinggi
2. Prediksi bolak-balik.
Sebuah evaluasi ketat kelayakan prediksi retrosintesis akan menyelidiki
apakah prekursor yang dihasilkan (yaitu, reaktan) dapat menghasilkan
produk seperti yang diharapkan, yang akan membutuhkan bahan kimia
lanjutan model prediksi reaksi. Evaluasi bolak-balik menggambarkan
evaluasi yang memperkenalkan dua metrik evaluasi bolak-balik berupa
akurasi dan cakupan bolak-balik. Akurasi bolak balik mengacu pada
rasio yang valid reaktan untuk semua reaktan yang diprediksi oleh model
prediksi reaksi kimia mundur, di mana "valid" berarti reaktan dapat
menghasilkan produk target, seperti yang diprediksi oleh model prediksi
reaksi kimia maju. Cakupan mengevaluasi jumlahnya produk target yang
model retrosintetiknya menghasilkan setidaknya satu rangkaian reaktan
yang valid. Metrik evaluasi cakupan mendorong model retrosintesis
untuk menghasilkan reaktan yang valid untuk berbagai macam molekul
target dan dengan demikian menggantikannya kekurangan akurasi bolak-
balik, yang mungkin memberi penghargaan berlebihan pada model yang
menghasilkan banyak prekursor yang valid hanya untuk beberapa reaksi.
2. Diversity (Keanekaragaman)
Dalam ruang reaksi kimia, ada banyak cara menghasilkan molekul, dan cara
yang berbeda mungkin sesuai dengan jenis reaksi yang berbeda. Di sini perlu
dicatat bahwa reaksi organik dengan mekanisme reaksi yang sama termasuk
dalam kategori yang sama. Model retrosintesis yang baik diharapkan
menghasilkan rute sintetik yang beragam mungkin untuk molekul target, di
mana keragamannya dapat dievaluasi dengan divergensi Jensen–Shannon (JSD)
[15] antara distribusi kemungkinan reaksi yang termasuk dalam jenis reaksi. JSD
dihitung sebagai berikut:
Metode berbasis model kemudian disusun berdasarkan aturan yang ada dengan
mengandalkan definisi pusat reaksi yang telah ditentukan sebelumnya dan
mempertimbangkan ikatan yang berubah selama reaksi. Sebagai sarana untuk
mengatasi keterbatasan metode berbasis model yang mengabaikan fungsionalitas
dan subkelas di luar pusat reaksi, pendekatan berbasis data mengidentifikasi
berbagai tingkat deskripsi pusat reaksi dengan memperluas pusat reaksi untuk
menyertakan ikatan samping (side chain). Kode hash juga dikenal sebagai tipe
reaksi yang dihitung secara otomatis untuk setiap tingkat deskripsi pusat reaksi,
dengan mempertimbangkan jenis atom, keadaan valensi, jumlah total atom
hidrogen terikat, jumlah -elektron, aromatisitas, muatan formal , dan informasi
pusat reaksi. Metode berbasis data lainnya mengelompokkan reaksi yang berbagi
nomor klasifikasi reaksi (RC) ke dalam satu kategori, di mana nomor RC
mencirikan pola konversi jenis atom di pusat reaksi. Pendekatan Condensed
Reaction Graph (CRG) secara langsung menggabungkan semua reaktan dan
produk reaksi menjadi keadaan transisi imajiner atau molekul semu, sehingga
deskriptor molekul semu dapat digunakan untuk mengevaluasi kemiripan antar
reaksi. Pendekatan berbasis data, bagaimanapun, cenderung gagal mendeteksi
reaksi yang memiliki mekanisme dasar yang serupa tetapi topologi yang berbeda
dari pusat reaksi yang diperluas
3. Efisiensi
Kualitas lain yang diinginkan untuk mengevaluasi apakah suatu reaksi harus
diprioritaskan adalah efisiensi, yang diukur menggunakan skor kompleksitas
sintetik dari reaktan reaksi dan hasil produk target. Reaksi dengan reaktan yang
lebih mudah disintesis dan hasil produk target yang lebih tinggi lebih disukai
𝑦 = 𝑉a 𝑉t × 100%
Karena kesulitan dalam penentuan nilai retrosintesis (yaitu, biaya) molekul secara
heuristik dan akurat, peneliti termotivasi untuk mempelajari nilai dari pengalaman
perencanaan retrosintesis yang disimulasikan secara historis. Kebijakan yang dipelajari
yang diparametrikan dengan jaringan saraf sedemikian rupa secara offline berfungsi
sebagai probabilitas awal yang andal untuk algoritme pencarian. Intinya, tentu saja,
adalah untuk membangun dataset pelatihan dari rute perencanaan retrosintesis, di mana
setiap molekul dijelaskan dengan biaya yang ditentukan dari rute sintetiknya. Pekerjaan
yang ada bergantung pada rute yang dirancang oleh ahli kimia atau kerajinan tangan
dengan kumpulan data reaksi satu langkah, akibatnya set data rute retrosintesis yang
kompleks mengalami keterbatasan ukuran, vibrasi, dan ketidakseimbangan karena
hanya didasarkan pada rute yang berhasil. Segler dan Waller yang telah meneliti soal
ini, menggunakan reaksi dari literatur sebagai kebenaran dasar untuk melakukan
prapelatihan jaringan saraf yang menentukan peringkat templat reaksi untuk
menghasilkan reaksi retrosintesis ketika diberi molekul tertentu. Jaringan kebijakan
kemudian dimasukkan ke dalam formula upper confidence bound (UCB) untuk
menyeimbangkan eksplorasi dan eksploitasi dalam MCTS
2. PERAN KECERDASAN BUATAN (AI) DALAM RETROSINTESIS
Dalam pencarian rencana sintesis, program perangkat lunak dapat menganalisis jutaan
potensi bahan awal, zat antara, dan reaksi, serta memungkinkan analisis yang lebih
menyeluruh dari semua kemungkinan sintetik untuk molekul tertentu. Program
perangkat lunak dapat mengandalkan kecerdasan buatan (AI) untuk meningkatkan
perencanaan retrosintesis dan AI dapat diterapkan dengan cara yang berbeda. Misalnya,
dalam pembelajaran mesin, algoritme komputer meningkat seiring bertambahnya
pengalaman menganalisis kumpulan data. Dalam sistem berbasis aturan—salah satu
bentuk AI yang paling sederhana dan tertua—algoritma ditentukan oleh sekumpulan
aturan yang dikodekan.
Sistem AI berbasis aturan meniru penalaran pakar manusia yang memecahkan masalah;
pengetahuannya berasal dari seperangkat aturan yang memberi tahu perangkat lunak apa
yang harus dilakukan atau apa yang harus disimpulkan dalam situasi yang berbeda.
Seiring kemajuan teknologi, AI telah diterapkan pada masalah yang lebih kompleks,
termasuk sintesis kimia. Perangkat lunak retrosintesis Synthia™ adalah sistem berbasis
aturan dan memperoleh pengetahuannya dari database lebih dari 100.000 aturan reaksi
kimia. Kekuatan sistem berbasis aturan berasal dari fakta bahwa semua aturan perangkat
lunak dikodekan dengan hasil tertentu. Dalam kasus perencanaan retrosintesis, aturan
dikodekan oleh ahli kimia. Keunggulan perangkat lunak seperti Synthia™ adalah
database reaksi kimia yang dikodekan dengan tangan yang tidak ada di tempat lain
sehingga resiko kebocoran data sangat kecil.
Manfaat lain dari pendekatan berbasis aturan adalah tidak terbatas pada literatur yang
ada. Gajewska, yang merupakan bagian dari tim yang mengembangkan peranti lunak
Synthia™ retrosynthesis,4 mengatakan bahwa sistem berbasis aturan dapat
menghasilkan jalur sintetik yang layak yang belum pernah dipublikasikan sebelumnya.
Perangkat lunak retrosintesis otomatis tidak diragukan lagi akan terus meningkat selama
bertahuntahun karena ilmuwan komputer dan ahli kimia menerapkan strategi AI. Salah
satu manfaat perangkat lunak retrosintesis dengan database kode tangan yang besar
seperti Synthia™ adalah kemampuan untuk melampaui penemuan obat tradisional dan
memperluas ruang bahan kimia yang tersedia dengan eksplorasi sintetik.
•Representasi molekuler
Metode representasi molekul utama yang diterapkan dalam masalah retrosintesis yaitu
string SMILES, sidik jari, dan grafik. SMILES adalah sistem notasi kimia yang paling
banyak diadopsi untuk representasi struktur molekul . SMILES mudah diakses oleh ahli
kimia, namun cukup interaktif untuk memungkinkan komputer menghasilkan notasi
garis yang unik. Mirip dengan bahasa alami, sistem SMILES menggabungkan karakter
dan aturan tata bahasa untuk menentukan struktur yang ketat berdasarkan prinsip kimia
(Chemical Principals). Setelah representasi SMILES telah dibuat oleh peneliti dapat
secara intuitif memprediksi prekursor langkah tunggal untuk retrosintesis melalui model
terjemahan mesin urutan-ke-urutan (sequence to sequence)
Sidik jari molekuler adalah alat cheminformatics lain yang berguna untuk mewakili
molekul. Ide intinya adalah untuk memetakan molekul menjadi string bit atau susunan
numerik dengan panjang , di mana setiap bit mengkodekan apakah molekul tersebut
berisi fitur substruktural yang unik atau tidak. Akibatnya, beberapa jenis sidik jari
molekuler ada sesuai dengan sifat fitur substruktural, mulai dari fitur berbasis kunci
substruktur dan berbasis jalur hingga fitur melingkar dua dimensi (2D) dan tiga
dimensi (3D).
2. Tantangan retrosintesis
Meskipun hanya reaksi satu langkah yang dihasilkan dalam prediksi retrosintesis satu
langkah, masih ada beberapa tantangan. Menurut definisi prediksi retrosintesis langkah
tunggal , mesin mengalami dua masalah utama yaitu
Demikian pula, masalah lain tentang "bagaimana menghasilkan reaktan dan reagen"
melibatkan penentuan reaktan dan reagen mana yang diperlukan untuk reaksi tersebut.
Setelah pusat reaksi ditentukan, molekul target dapat dipecah menjadi synthons namun,
synthons belum tentu valid. Menghasilkan atau mengubah sinton ini secara langsung
menjadi reaktan yang valid dan r adalah reagen tata bahasa kimia yakni, reagen harus
berupa molekul yang “valid”
Gambar 4(a) menunjukkan moleku molekul “tidak valid”. Kedua, reaksi dari reaktan ke
produk harus layak secara kimiawi; yaitu, selektivitas pusat reaksi harus sesuai dengan
pereaksi, kondisi reaksi, efek elektronik, halangan sterik, teori orbital molekul, dan lain
sebagainya. Pada Gambar 4(b), menunjukkan reaksi yang tidak layak yang pusat
reaksinya memiliki reaktivitas rendah karena efek elektronik. Terakhir, semua atom
dalam produk target harus dipetakan ke dalam reaktan yakni, reaksi harus mengikuti
hukum kekekalan atom. Reaksi yang ditunjukkan pada Gambar 4(c) adalah contoh
tantangan di mana hukum kekekalan atom tidak terpenuhi. Lebih penting lagi, metode
yang digunakan untuk menghasilkan reaktan bervariasi berdasarkan representasi
molekul metode berbasis grafik adalah prioritas utama untuk representasi grafik,
sedangkan metode berbasis urutan sangat cocok untuk representasi SMILES.
Pertama, ruang pencarian untuk kemungkinan rencana retrosintesis pada semua rute
sintesis yang mungkin seringkali besar secara eksponensial, mengingat ada banyak
langkah sintesis yang dapat ditempuh oleh molekul target di setiap langkah yang
berbeda.
Kedua, kriteria untuk rute sintetik yang baik tidak jelas, karena ahli kimia yang
berbeda cenderung memiliki pendekatan retrosintesis yang berbeda terhadap molekul
target, yang sebagian besar bergantung pada pengalaman dan pemahaman pribadi
masing-masing tentang retrosintesis. Selain itu, kriteria rute retrosintesis yang baik
dapat berbeda sehubungan dengan skenario kimiawi. Misalnya, rute retrosintesis yang
baik dalam manufaktur industri berfokus pada stabilitas dan manajemen biaya,
sedangkan rute yang baik di dunia akademis adalah pendekatan retrosintesis baru yang
cukup untuk menangani molekul dengan struktur kompleks. Selain itu, beberapa data
set rute retrosintesis yang dapat diandalkan terbuka untuk umum, dan peneliti cenderung
menggunakan rute konvensial untuk mengevaluasi algoritme perencanaan retrosintesis
atau untuk membandingkan rute yang dihasilkan dengan rute yang dilaporkan oleh ahli
kimia melalui A/B double-blind tes , yang melelahkan dan subyektif. Oleh karena itu,
perencanaan retrosintesis yang digerakkan oleh AI diperlukan agar ahli kimia dapat
mempercepat proses pencarian jalur dalam skenario yang berbeda dan mengotomatiskan
prosedur evaluasi rute.
Kesimpulan
Coley CW, Green WH, Jensen KF. RDChiral: an RDKit wrapper for handling
stereochemistry in retrosynthetic template extraction and application. J Chem Inf
Model 2019;59(6):2529–37
Coley CW, Thomas III DA, Lummiss JAM, Jaworski JN, Breen CP, Schultz V, et al. A
robotic platform for flow synthesis of organic compounds informed by AI
planning. Science 2019;365(6453):eaax1566.
Fortunato ME, Coley CW, Barnes BC, Jensen KF. Data augmentation and pretraining
for template-based retrosynthetic prediction in computer-aided synthesis
planning. J Chem Inf Model 2020;60(7):3398–40
Nair A, Pong V, Dalal M, Bahl S, Lin S, Levine S. Visual reinforcement learning with
imagined goals. 2018. arXiv:1807.04742.
Schwaller P, Probst D, Vaucher AC, Nair VH, Kreutter D, Laino T, et al. Mapping the
space of chemical reactions using attentionbased neural networks. Nat Mach
Intell 2021;3(2)