Anda di halaman 1dari 26

ROLE OF ARTIFICIAL INTELLIGENCE IN CHEMISTRY :

RETROSINTESIS BERBASIS ARTIFICIAL INTELLIGENCE (AI)

Disusun Oleh

NAMA : ANDI DARMAWAN

NIM : 24030122130086

KELAS :A

JURUSAN : KIMIA

PROGRAM STUDI KIMIA


FAKULTAS SAINS MATEMATIKA

UNIVERSITAS DIPONEGORO SEMARANG


2023
ABSTRAK

Dalam beberapa tahun terakhir, minat para disiplin keilmuwan IPTEK terhadap
prediksi senyawa organik melalui retrosintesis berbasis artificial intelligence ( (AI)
meningkat secara drastis. Sintesis senyawa organik telah berkembang cukup pesat
untuk memenuhi tantangan yang ditimbulkan oleh target molekul yang semakin
beragam dan kompleks. Retrosintesis telah memberikan kontribusi substansial untuk
replikasi, konformasi, penolakan, dan memperbaiki produk alami untuk desain dan
sintesis obat. Dalam beberapa tahun terakhir, telah terjadi peningkatan minat yang
drastis dalam prediksi retrosintesis dengan teknik kecerdasan buatan (AI). Tidak seperti
prediksi retrosintesis konvensional yang dilakukan oleh ahli kimia dan seorang pakar
kesehatan, retrosintesis berbasis AI dapat memprediksi reaksi dan rute retrosintesis
secara otomatis. Hal Ini memberikan peluang untuk mengatasi banyak tantangan
konvensional, termasuk ketergantungan yang tinggi pada keahlian yang luas, sub-
optimalitas rute, dan biaya komputasi yang mahal. Saat menghadapi sintesis senyawa
tertentu, seperti obat, banyak ahli kimia memulai dengan produk akhir itu sendiri.
Mereka kemudian mencoba mengidentifikasi blok penyusun individu dan langkah-
langkah reaksi yang diperlukan untuk membuat seluruh senyawa. Proses retrosintesis ini
membantu ahli kimia mengembangkan jalur sintetik dari prekursor yang tersedia ke
molekul target. Selama bertahun-tahun, beberapa sumber retrosintesis yang didukung
komputer telah tersedia untuk membantu ahli kimia mengidentifikasi jalur sintetik,
salah satunya perangkat lunak Synthia™ retrosynthesis, yang pada awalnya
dikembangkan di laboratorium akademik dan menggunakan algoritme canggih untuk
memberikan solusi sintesis yang tidak bergantung pada literatur
PENDAHULUAN

Prediksi retrosintesis, yang pertama kali diresmikan oleh Corey dan Wipke pada tahun
1969, merancang urutan reaksi untuk menguraikan target secara rekursif menjadi blok
bangunan yang lebih sederhana sampai molekul awal yang tersedia secara komersial
tercapai. Prediksi retrosintesis terdiri dari dua tugas dasar yaitu single-step
retrosynthesis prediction and multi-step retrosynthesis prediction tujuan dalam prediksi
retrosintesis langkah tunggal adalah untuk memprediksi reaktan yang mungkin
diberikan molekul target, seperti yang ditunjukkan gambar di bawah ini

Dengan cara pemutusan, yang memutus ikatan antara atom-atom molekul target,
diperoleh satu atau lebih synthon . Satu hal yang harus ditekankan dimana synthon
(misalnya, elektrofilik “PhC=O+” kelompok pada Gambar. 1) sebagai fragmen adalah
ion atau radikal dan biasanya tidak ada sebagai spesies yang stabil, sedangkan reaktan
(misalnya, benzoil bromida) yang sesuai dengan synthon merupakan suatu prekursor
yang biasa digunakan dalam praktek retrosintesis. Setelah prediksi retrosintesis satu
langkah yang akurat dan rekursif selesai, retrosintesis multi langkah berfokus
memprediksi pada perencanaan rangkaian reaksi optimal yang meminimalkan jumlah
langkah sintesis, biaya awal molekul, limbah yang dihasilkan, dan sebagainya.

Memprediksi retrosintesis merupakansuatu hal yang sangat menantang bagi semua


orang. Hal ini disebabkan jumlah kemungkinan transformasi suatu molekul sangatlah
besar sehingga menghasilkan ruang pencarian yang luas. Maka dari itu, diperlukan
kreativitas dan keahlian yang luas dari ahli kimia yang berpengalaman. Kedua, bahkan
untuk seorang ahli dan pakar sekalipun , pemahaman tentang mekanisme reaksi masih
sangat minim dan tidak mudah untuk memilih rute optimal di antara banyak rute
retrosintesis yang mungkin.

Seperti yang ditunjukkan pada gambar di bawah ini, molekuler yang menyandikan
perubahan dalam konektivitas atom selama reaksi kimia diwakili oleh pola subgraf.
Mulai dari molekul target, template dipilih berikut ini aturan yang telah ditetapkan dan
diterapkan pada molekul target untuk menentukan reaktan.

Sayangnya, sistem berbasis aturan tersebut mengalami beberapa kelemahan. Kelemahan


utama dari sistem tersebut adalah ketidakmampuan untuk memberikan prediksi yang
akurat untuk molekul target baru atau jenis reaksi dari basis pengetahuan yang terbatas.
Maka dari itu, system opersional suatu artificial intelligence (AI) telah memicu minat
untuk menggunakan teknik pembelajaran mesin mengatasi keterbatasan sistem pakar
berbasis aturan. Prinsip utama yang diterapkan adalah membuat mesin mempelajari
suatu proses reaksi kimiawi skala besar dari kumpulan data eksperimental yang ada
untuk memprediksi reaksi dan melakukan retrosintesis. Hingga saat ini, serangkaian
penelitian ekstensif telah dilakukan menunjukkan bahwa model yang dibantu AI dapat
mencapai kinerja perencanaan retrosintesis yang kompetitif dan bahkan unggul
dibandingkan dengan sistem berbasis aturan. Di bagian sisa ulasan ini, kita akan
membahas algoritma AI yang ada untuk prediksi retrosintesis langkah tunggal dan multi
langkah.
PEMBAHASAN

Selama bertahun-tahun, beberapa sumber retrosintesis berbasis computer telah tersedia


untuk membantu ahli kimia mengidentifikasi jalur sintetik. Ewa Gajewska, spesialis
kimia dan perangkat lunak untuk Merck KGaA, Darmstadt, Jerman, mengatakan
sebagian besar platform ini secara otomatis mengekstrak pengetahuan mereka dari
reaksi yang telah dipublikasikan dalam literatur. Perangkat lunak Synthia™
retrosynthesis, yang ditawarkan oleh MilliporeSigma, pada awalnya dikembangkan di
laboratorium akademik dan menggunakan algoritme canggih untuk memberikan solusi
sintesis yang tidak bergantung pada literatur. Desain retrosintesis yang dipandu
komputer dapat menghemat waktu bagi para peneliti dengan secara otomatis dengan
menghasilkan jalur sintesis dari produk akhir molekuler yang diinginkan ke blok yang
tersedia secara komersial. Selain menghemat waktu, retrosintesis berbasis computer ini
juga memberikan kelebihan dalam faktor biaya, strategi sintesis alternatif, dan
ketersediaan bahan baku (prekursor). Gambar dibawah ini merupakan salah satu
software yang dikembangkan untuk retrosintesis suatu prekursor
1. PERENCANAAN RETROSINTESIS, LANGKAH DEMI LANGKAH
Perencanaan retrosintesis otomatis dimulai dengan mengidentifikasi jalur
sintesis molekul tertentu yang ditelusuri kembali ke building block yang tersedia
secara komersial. Perangkat lunak retrosintesis Synthia™ juga dapat
mempertimbangkan fitur kimiawi seperti gugus fungsi dan stereokimia saat
memberikan solusi jalur yang layak. Setelah hasilnya masuk, pengguna dapat
menavigasi jalur yang diusulkan dan memfilter hasilnya menggunakan sejumlah
kriteria, termasuk kesamaan urutan reaksi, jumlah langkah reaksi, dan harga
bahan awal. Pengguna juga dapat mengunggah inventaris bahan kimia mereka
sendiri sehingga perangkat lunak dapat merencanakan jalur kembali ke apa yang
telah mereka miliki di lab (Gambar 2). Synthia™ akan menyoroti molekul yang
perlu dilindungi, dan menyarankan gugus pelindung yang kompatibel dengan
kondisi reaksi.

Pengguna juga memiliki opsi untuk melupakan proses perencanaan otomatis dan
menggunakan perangkat lunak retrosintesis Synthia™ secara manual. Hal itu,
memberikan penggunanya kebebasan untuk menavigasi melalui jalur retrosintesis yang
diberikan, dimulai dengan molekul target dan bergerak mundur secara iteratif
berdasarkan preferensi pengguna. Pada setiap langkah, perangkat lunak menyertakan
perincian dan referensi reaksi. Untuk informasi lebih lanjut tentang perangkat lunak
retrosintesis Synthia™, kunjungi: https://www.sigmaaldrich.com/synthia

Dalam memprediksi jalur suatu reaksi, retrosintesis dibagi menjadi dua yaitu prediksi
retrosintesis langkah tunggal (Single-step retrosynthesis prediction) dan retrosintesis
multi langkah (Multi-step retrosynthesis prediction)
1. Single-step retrosynthesis prediction
Terdapat langkah langkah yang ditempuh dalam memprediksi jalur suatu
reaksi kimia dalam single step retrosynthesis
1. Pemilihan Template
Sebuah template mengkodekan perubahan konektivitas antara produk
dan reaktan, sedangkan set template berisi sekelompok template untuk
aturan suatu reaksi kimia yang berbeda. Dengan memberi template dan
produk yang cocok, maka akan memudahkan untuk mendapatkan semua
reaktan dalam reaksi. Dengan demikian, metode berbasis templatetelah
ditentukan untuk prediksi retrosintesis satu langkah.

2. Ekstraksi template
Langkah pertama, Aturan reaksi kimia dikodifikasi oleh ahli kimia. Para
ahli merumuskan reaksi mana yang memungkinkan . Sejak saat itu,
aturan konvensional untuk transformasi generik telah digunakan dalam
prediksi retrosintesis dan telah meraih sukses besar untuk beberapa
produk kompleks. Dengan pertumbuhan reaksi yang tak terkendali, ada
kebutuhan mendesak untuk ekstraksi template secara otomatis, sehingga
algoritma heuristik diusulkan untuk membangun aturan umum dari
contoh reaksi yang diketahui . Aturan yang ditentukan oleh para ahli
sudah tepat, akan tetapi usulan tersebut masih belum cukup kuat untuk
menjelaskan cakupan fraksi dari jenis reaksi. Meskipun sangat efisien
untuk membuat template melalui ekstraksi template otomatis, template
tersebut mengalami tradeoff antara generalisasi dan kebenaran. Selain
itu, jumlah templat sangat besar dan terus meningkat karena reaksi baru
terus ditemukan.

3. Pengambilan template
Templat yang menyandikan rute sintetik molekul yang motif
strukturalnya mirip dengan molekul target lebih diprioritaskan, dan
hanya 100 templat yang produknya memiliki kemiripan terbesar dengan
molekul target yang diambil. Sehubungan dengan ukuran kesamaan (𝑝 ,
𝑃) antar molekul. RetroSim mempertimbangkan kesamaan struktur 2D,
yang diimplementasikan melalui dua langkah. Pertama, sebuah molekul
direpresentasikan sebagai vektor menggunakan sidik jari melingkar
Morgan, di mana hyperparameter radius mengacu pada ukuran
lingkungan terbesar yang harus dipertimbangkan, selain itu fitur dari
setiap simetri atom juga disertakan. Kedua, menyelidiki beberapa
persamaan suatu simetri molecular yang memungkinkan pada molekul
target. Perlu dicatat bahwa metrik representasi dan kesamaan semuanya
diimplementasikan dalam paket perangkat lunak RDKit.
Alih-alih bergantung pada kesamaan molekul eksplisit, NeuralSym
menempatkan masalah pengambilan template sebagai masalah klasifikasi
multi-kelas untuk secara otomatis mempelajari pola molekul target, yang
menentukan template mana yang akan digunakan. Jaringan saraf yang
terhubung penuh digunakan untuk melakukan klasifikasi multi-kelas,
seperti yang ditunjukkan pada Gambar. 7. Input ke jaringan saraf adalah
molekul target yang direpresentasikan menggunakan sidik jari dan
simpul output sesuai dengan semua templat. Saat dilengkapi dengan
molekul target baru, jaringan saraf yang terlatih mengambil template top-
k yang probabilitas softmax-nya adalah k tertinggi

Meskipun NeuralSym dilatih untuk mempelajari satu templat yang


diberikan sebuah molekul dalam kumpulan data, banyak transformasi
yang berpotensi berguna di luar tolak ukur dikecualikan. Untuk
mengatasi masalah ini, benchmark ditambahkan dengan lebih banyak
data sintetik pada penerapan template dan prapelatihan jaringan relevansi
template yang mempelajari semua template yang berpotensi mengarah ke
reaktan. Jaringan relevansi templat yang telah dilatih sebelumnya, yang
kemudian disempurnakan pada reaksi nyata, mencapai daya ingat yang
lebih tinggi dalam penerapan templat dan lebih beragam dalam reaktan
yang dihasilkan daripada metode sebelumnya seperti NeuralSym.
Alternatif lain bernama MHNreact mengatasi masalah ini dengan
menyandikan kedua template dan produk sebagai input, berbeda dengan
pendekatan sebelumnya, yang memprediksi kumpulan template tetap
ketika diberikan molekul target sebagai input. MHNreact kemudian
menggunakan jaringan Hopfield (MHN) modern untuk mempelajari
hubungan antara templat dan produk.

4. Prediksi pusat reaksi


Algoritme berbasis template cukup menerapkan template yang diambil
dan menghasilkan reaktan . Template yang diambil menyediakan
beberapa kandidat pusat reaksi yang memungkinkan sebagai penyedia
jalur reaksi suatu molekul , RetroSim dan NeuralSym menentukan pusat
reaksi berdasarkan peringkat templat, sementara GLNs memprediksi
pusat reaksi berdasarkan peringkat reaktan, sebagaimana didefinisikan di
atas.

5. Evaluasi reaksi kandidat


1. Kelayakan
Model retrosintesis sendiri mampu memeringkat reaksi yang diprediksi
dengan jangkauan skor tertentu . Misalnya, RetroSim menggunakan
kemiripan molekuler untuk menentukan peringkat kandidat suatu reaksi
kimia secara keseluruhan
skor kesamaan) adalah produk dari kesamaan produk (𝑠prod) dan
kesamaan reaktan (𝑠reac), yaitu sebuah GLN [10(𝑠reac), that is, 𝑠 =
𝑠prod × 𝑠reac] menguraikan penilaian reaksi kandidat menjadi dua
bagian fungsi skor template (ω1) dan reaktan
fungsi skor (ω2). Fungsi skor templat selanjutnya diuraikan menjadi dua
bagian: skor produk (v1) dan skor reaktan (v2). Skor ini menentukan
peringkat reaksi yang diprediksi. Untuk metode pembangkitan berbasis
synthon dan langsung ,skor berjumlah probabilitas log dari seluruh string
SMILES, yang merupakan jumlah dari probabilitas log untuk semua
prediksi token, Pemeringkatan reaksi kandidat ini sama dengan yang
dilakukan oleh pencarian sinar.

2. Prediksi bolak-balik.
Sebuah evaluasi ketat kelayakan prediksi retrosintesis akan menyelidiki
apakah prekursor yang dihasilkan (yaitu, reaktan) dapat menghasilkan
produk seperti yang diharapkan, yang akan membutuhkan bahan kimia
lanjutan model prediksi reaksi. Evaluasi bolak-balik menggambarkan
evaluasi yang memperkenalkan dua metrik evaluasi bolak-balik berupa
akurasi dan cakupan bolak-balik. Akurasi bolak balik mengacu pada
rasio yang valid reaktan untuk semua reaktan yang diprediksi oleh model
prediksi reaksi kimia mundur, di mana "valid" berarti reaktan dapat
menghasilkan produk target, seperti yang diprediksi oleh model prediksi
reaksi kimia maju. Cakupan mengevaluasi jumlahnya produk target yang
model retrosintetiknya menghasilkan setidaknya satu rangkaian reaktan
yang valid. Metrik evaluasi cakupan mendorong model retrosintesis
untuk menghasilkan reaktan yang valid untuk berbagai macam molekul
target dan dengan demikian menggantikannya kekurangan akurasi bolak-
balik, yang mungkin memberi penghargaan berlebihan pada model yang
menghasilkan banyak prekursor yang valid hanya untuk beberapa reaksi.

2. Diversity (Keanekaragaman)
Dalam ruang reaksi kimia, ada banyak cara menghasilkan molekul, dan cara
yang berbeda mungkin sesuai dengan jenis reaksi yang berbeda. Di sini perlu
dicatat bahwa reaksi organik dengan mekanisme reaksi yang sama termasuk
dalam kategori yang sama. Model retrosintesis yang baik diharapkan
menghasilkan rute sintetik yang beragam mungkin untuk molekul target, di
mana keragamannya dapat dievaluasi dengan divergensi Jensen–Shannon (JSD)
[15] antara distribusi kemungkinan reaksi yang termasuk dalam jenis reaksi. JSD
dihitung sebagai berikut:

JSD(PD0 , PD1 , … , PD𝑁) = 𝐻(∑ 1 𝑁 PD𝑖 𝑁 𝑖=0 )− 1 𝑁 ∑ 𝐻(PD𝑖 ) 𝑁 𝑖=0

Metode berbasis model kemudian disusun berdasarkan aturan yang ada dengan
mengandalkan definisi pusat reaksi yang telah ditentukan sebelumnya dan
mempertimbangkan ikatan yang berubah selama reaksi. Sebagai sarana untuk
mengatasi keterbatasan metode berbasis model yang mengabaikan fungsionalitas
dan subkelas di luar pusat reaksi, pendekatan berbasis data mengidentifikasi
berbagai tingkat deskripsi pusat reaksi dengan memperluas pusat reaksi untuk
menyertakan ikatan samping (side chain). Kode hash juga dikenal sebagai tipe
reaksi yang dihitung secara otomatis untuk setiap tingkat deskripsi pusat reaksi,
dengan mempertimbangkan jenis atom, keadaan valensi, jumlah total atom
hidrogen terikat, jumlah -elektron, aromatisitas, muatan formal , dan informasi
pusat reaksi. Metode berbasis data lainnya mengelompokkan reaksi yang berbagi
nomor klasifikasi reaksi (RC) ke dalam satu kategori, di mana nomor RC
mencirikan pola konversi jenis atom di pusat reaksi. Pendekatan Condensed
Reaction Graph (CRG) secara langsung menggabungkan semua reaktan dan
produk reaksi menjadi keadaan transisi imajiner atau molekul semu, sehingga
deskriptor molekul semu dapat digunakan untuk mengevaluasi kemiripan antar
reaksi. Pendekatan berbasis data, bagaimanapun, cenderung gagal mendeteksi
reaksi yang memiliki mekanisme dasar yang serupa tetapi topologi yang berbeda
dari pusat reaksi yang diperluas

3. Efisiensi
Kualitas lain yang diinginkan untuk mengevaluasi apakah suatu reaksi harus
diprioritaskan adalah efisiensi, yang diukur menggunakan skor kompleksitas
sintetik dari reaktan reaksi dan hasil produk target. Reaksi dengan reaktan yang
lebih mudah disintesis dan hasil produk target yang lebih tinggi lebih disukai

𝑦 = 𝑉a 𝑉t × 100%

2. Prediksi Retrosintesis Multi Langkah (Multi Steps Retrosynthesis)

Sebelum melakukan perencanaan retrosintesis multi-langkah, kita perlu memilih reaksi


dari set kandidat yang sah dengan memberi molekul target pada setiap langkah,
mengamati umpan balik, dan kemudian melakukan pemilihan berikutnya pada molekul
target baru. Proses ini memiliki kemiripan yang mencolok dengan pengambilan
keputusan berurutan dalam permainan pengambilan keputusan strategis umum. Dengan
kata lain, masalah perencanaan retrosintesis multi-langkah dapat dibingkai sebagai
permainan satu pemain . Oleh karena itu, dua masalah penelitian utama yang harus
ditangani dalam perencanaan retrosintesis multi-langkah adalah sama dengan
menyelesaikan permainan yaitu, bagaimana mencari rute yang berhasil secara efisien
dan bagaimana memperkirakan nilai setiap rute. Selain itu, tidak seperti permainan
seperti catur, di mana status pemenangnya adalah biner, perencanaan retrosintesis
mengharuskan status pemenang dibedakan sesuai dengan biaya sintesis.

Karena kesulitan dalam penentuan nilai retrosintesis (yaitu, biaya) molekul secara
heuristik dan akurat, peneliti termotivasi untuk mempelajari nilai dari pengalaman
perencanaan retrosintesis yang disimulasikan secara historis. Kebijakan yang dipelajari
yang diparametrikan dengan jaringan saraf sedemikian rupa secara offline berfungsi
sebagai probabilitas awal yang andal untuk algoritme pencarian. Intinya, tentu saja,
adalah untuk membangun dataset pelatihan dari rute perencanaan retrosintesis, di mana
setiap molekul dijelaskan dengan biaya yang ditentukan dari rute sintetiknya. Pekerjaan
yang ada bergantung pada rute yang dirancang oleh ahli kimia atau kerajinan tangan
dengan kumpulan data reaksi satu langkah, akibatnya set data rute retrosintesis yang
kompleks mengalami keterbatasan ukuran, vibrasi, dan ketidakseimbangan karena
hanya didasarkan pada rute yang berhasil. Segler dan Waller yang telah meneliti soal
ini, menggunakan reaksi dari literatur sebagai kebenaran dasar untuk melakukan
prapelatihan jaringan saraf yang menentukan peringkat templat reaksi untuk
menghasilkan reaksi retrosintesis ketika diberi molekul tertentu. Jaringan kebijakan
kemudian dimasukkan ke dalam formula upper confidence bound (UCB) untuk
menyeimbangkan eksplorasi dan eksploitasi dalam MCTS
2. PERAN KECERDASAN BUATAN (AI) DALAM RETROSINTESIS
Dalam pencarian rencana sintesis, program perangkat lunak dapat menganalisis jutaan
potensi bahan awal, zat antara, dan reaksi, serta memungkinkan analisis yang lebih
menyeluruh dari semua kemungkinan sintetik untuk molekul tertentu. Program
perangkat lunak dapat mengandalkan kecerdasan buatan (AI) untuk meningkatkan
perencanaan retrosintesis dan AI dapat diterapkan dengan cara yang berbeda. Misalnya,
dalam pembelajaran mesin, algoritme komputer meningkat seiring bertambahnya
pengalaman menganalisis kumpulan data. Dalam sistem berbasis aturan—salah satu
bentuk AI yang paling sederhana dan tertua—algoritma ditentukan oleh sekumpulan
aturan yang dikodekan.

Sistem AI berbasis aturan meniru penalaran pakar manusia yang memecahkan masalah;
pengetahuannya berasal dari seperangkat aturan yang memberi tahu perangkat lunak apa
yang harus dilakukan atau apa yang harus disimpulkan dalam situasi yang berbeda.
Seiring kemajuan teknologi, AI telah diterapkan pada masalah yang lebih kompleks,
termasuk sintesis kimia. Perangkat lunak retrosintesis Synthia™ adalah sistem berbasis
aturan dan memperoleh pengetahuannya dari database lebih dari 100.000 aturan reaksi
kimia. Kekuatan sistem berbasis aturan berasal dari fakta bahwa semua aturan perangkat
lunak dikodekan dengan hasil tertentu. Dalam kasus perencanaan retrosintesis, aturan
dikodekan oleh ahli kimia. Keunggulan perangkat lunak seperti Synthia™ adalah
database reaksi kimia yang dikodekan dengan tangan yang tidak ada di tempat lain
sehingga resiko kebocoran data sangat kecil.

Manfaat lain dari pendekatan berbasis aturan adalah tidak terbatas pada literatur yang
ada. Gajewska, yang merupakan bagian dari tim yang mengembangkan peranti lunak
Synthia™ retrosynthesis,4 mengatakan bahwa sistem berbasis aturan dapat
menghasilkan jalur sintetik yang layak yang belum pernah dipublikasikan sebelumnya.

Perencanaan retrosintesis otomatis memberi peneliti kemampuan untuk menguji dan


memvalidasi senyawa lebih cepat. Keuntungan ini membantu para ilmuwan lebih baik
menanggapi krisis kesehatan masyarakat yang menuntut terapi baru.
Perkembangan AI yang belum pernah terjadi sebelumnya selama dekade terakhir telah
menyebabkan perkembangan studi terbaru yang menggunakan teknik AI untuk
mengatasi tantangan dan meningkatkan kinerja prediksi retrosintesis. Pada Gambar. 5
telah memberikan perincian lanskap prediksi retrosintesis yang digerakkan oleh AI saat
ini, yang mencakup dua komponen utama prediksi retrosintesis satu langkah dan
prediksi retrosintesis multi-langkah, serta dua elemen desain algoritmik dari representasi
molekul dan evaluasi reaksi kandidat, yang memberikan dasar untuk prediks
retrosintesis langkah tunggal dan multi langkah. Bersama-sama, keempat elemen ini
membentuk ruang desain untuk metode prediksi retrosintesis berbasis AI yang
mengarahkan pengembangan algoritme baru dan penyesuaian untuk aplikasi tertentu.
Pada bagian ini, kami memecah literatur yang ada sesuai dengan lanskap yang
diusulkan

3. Peran Retrosintesis di berbagai bidang

Pandemi COVID-19 telah menyoroti kebutuhan akan pengembangan dan kemampuan


pembuatan obat yang cepat dan efisien. Proses mensintesis kandidat terapeutik potensial
untuk pengujian klinis secara historis menjadi hambatan yang signifikan karena waktu
yang dibutuhkan untuk mengidentifikasi jalur sintesis yang layak dan bahan awal.

• Mempercepat penemuan obat


Sebelum disintesis dan divalidasi secara eksperimental Mengidentifikasi senyawa mana
yang dapat disintesis dengan mudah dan cepat sangat penting untuk mempercepat jalur
penemuan obat. Mempersempit daftar kandidat obat potensial sangat membantu ahli
kimia obat seperti yang menjalankan laboratorium kimia organik sintetik yang berfokus
pada penemuan obat dan pengembangan praklinis. Perencanaan retrosintesis otomatis
memberi peneliti kemampuan untuk menguji dan memvalidasi senyawa lebih cepat.
Percepatan membantu para ilmuwan lebih baik menanggapi krisis kesehatan masyarakat
yang menuntut terapi baru.

• Meningkatkan kimia proses

Di luar penemuan obat, perencanaan retrosintesis otomatis dapat membantu


meningkatkan produksi terapi. Dalam konteks COVID-19, obat apa pun yang terbukti
menjadi pengobatan yang efektif kemungkinan besar akan menghadapi permintaan yang
melebihi pasokan. Selain itu, banyak proses sintesis obat yang dipatenkan atau
dirahasiakan untuk menghindari persaingan. Namun, selama pandemi global, petugas
kesehatan masyarakat membutuhkan beberapa jalur suplai obat yang sama.
Dengan menggunakan analisis retrosintesis berbasis komputer, kita bisa menyaring
kemungkinan jalur sintesis yang hampir tak terbatas untuk memprediksi sebuah jalur
yang mungkin untuk senyawa obat bereaksi, rute yang efektif ialah rute dimana rute
tersebut membutuhkan biaya yang komersial dari bahan awal alternatif. Setidaknya
dalam satu kasus, jalur sintetik yang diusulkan menggunakan bahan awal berbiaya lebih
rendah daripada yang saat ini digunakan. Sebuah perusahaan biasanya dapat
mengurangi masalah rantai efisiensi biaya yang mungkin dibutuhkan pada saat krisis,
seperti pandemi, menggunakan Retrosintesis dibantu AI. Langkah tersebut juga menjadi
jalan keluar untuk mengurangi risiko produksi dengan menyediakan jalur sintesis
alternatif jika pasokan salah satu produk atau bahan awal terganggu. Lab kimia modern
baru-baru ini mengerjakan sebuah proyek untuk menentukan bagaimana perencanaan
retrosintesis otomatis dapat membantu merancang 12 senyawa terapeutik SARS-CoV-2
yang berbeda. Protokol sintesis untuk masing-masing sudah ada tetapi bergantung pada
tersedianya bahan awal yang sudah ada. Menyadari bahwa pandemi dapat membebani
rantai pasokan ini, Cernak ingin melihat apakah perangkat lunak retrosintesis Synthia™
dapat menghasilkan protokol baru yang menggunakan produk awal alternatif (Gambar
3).

Pengguna biasanya menggunakan perangkat lunak retrosintesis Synthia™ untuk


mencari jalur atau bahan awal yang tidak jelas. Banyak pertimbangan yang disebutkan
di atas dapat diperhitungkan saat menyiapkan kriteria pencarian awal di platform dan
memungkinkan peneliti mempersempit solusi sintetik yang berfungsi dalam
parameternya. Ide inovatif yang terinspirasi oleh Synthia™ dapat berfungsi sebagai titik
awal baru untuk pengembangan proses kimia
• Evolusi dan Pengembangan

Perangkat lunak retrosintesis otomatis tidak diragukan lagi akan terus meningkat selama
bertahuntahun karena ilmuwan komputer dan ahli kimia menerapkan strategi AI. Salah
satu manfaat perangkat lunak retrosintesis dengan database kode tangan yang besar
seperti Synthia™ adalah kemampuan untuk melampaui penemuan obat tradisional dan
memperluas ruang bahan kimia yang tersedia dengan eksplorasi sintetik.

•Representasi molekuler

Metode representasi molekul utama yang diterapkan dalam masalah retrosintesis yaitu
string SMILES, sidik jari, dan grafik. SMILES adalah sistem notasi kimia yang paling
banyak diadopsi untuk representasi struktur molekul . SMILES mudah diakses oleh ahli
kimia, namun cukup interaktif untuk memungkinkan komputer menghasilkan notasi
garis yang unik. Mirip dengan bahasa alami, sistem SMILES menggabungkan karakter
dan aturan tata bahasa untuk menentukan struktur yang ketat berdasarkan prinsip kimia
(Chemical Principals). Setelah representasi SMILES telah dibuat oleh peneliti dapat
secara intuitif memprediksi prekursor langkah tunggal untuk retrosintesis melalui model
terjemahan mesin urutan-ke-urutan (sequence to sequence)

Sidik jari molekuler adalah alat cheminformatics lain yang berguna untuk mewakili
molekul. Ide intinya adalah untuk memetakan molekul menjadi string bit atau susunan
numerik dengan panjang , di mana setiap bit mengkodekan apakah molekul tersebut
berisi fitur substruktural yang unik atau tidak. Akibatnya, beberapa jenis sidik jari
molekuler ada sesuai dengan sifat fitur substruktural, mulai dari fitur berbasis kunci
substruktur dan berbasis jalur hingga fitur melingkar dua dimensi (2D) dan tiga
dimensi (3D).

2. Tantangan retrosintesis

1. Prediksi Retrosintesis Satu Langkah

Meskipun hanya reaksi satu langkah yang dihasilkan dalam prediksi retrosintesis satu
langkah, masih ada beberapa tantangan. Menurut definisi prediksi retrosintesis langkah
tunggal , mesin mengalami dua masalah utama yaitu

a. cara menentukan pusat reaksi produk


b. cara menghasilkan reaktan dan reagen
Masalah "bagaimana menentukan pusat reaksi" melibatkan penentuan prinsip apa yang
dapat digunakan untuk meniru otak ahli kimia saat menentukan pemutusan untuk
molekul target. Menentukan pemutusan adalah tantangan bahkan untuk ahli kimia
berpengalaman, karena biasanya ada banyak cara untuk menguraikan molekul, dan rute
sintetik yang optimal secara global tergantung pada struktur global dari rute tersebut.
Para ahli mengikuti beberapa aturan dasar untuk secara intuitif menentukan prioritas
pemutusan ikatan kimia. Sayangnya, aturan ini kurang digeneralisasikan ke berbagai
produk, dan bahkan tidak jelas karena keterbatasan pengetahuan kimia yang ada. Untuk
mesin, hubungan satu-ke-banyak dalam identifikasi pusat reaksi (yaitu, molekul target
dapat memiliki banyak pusat reaksi dan disintesis dengan banyak reaksi potensial)
menimbulkan tantangan penyesuaian model dan evaluasi yang signifikan.

Demikian pula, masalah lain tentang "bagaimana menghasilkan reaktan dan reagen"
melibatkan penentuan reaktan dan reagen mana yang diperlukan untuk reaksi tersebut.
Setelah pusat reaksi ditentukan, molekul target dapat dipecah menjadi synthons namun,
synthons belum tentu valid. Menghasilkan atau mengubah sinton ini secara langsung
menjadi reaktan yang valid dan r adalah reagen tata bahasa kimia yakni, reagen harus
berupa molekul yang “valid”

Gambar 4(a) menunjukkan moleku molekul “tidak valid”. Kedua, reaksi dari reaktan ke
produk harus layak secara kimiawi; yaitu, selektivitas pusat reaksi harus sesuai dengan
pereaksi, kondisi reaksi, efek elektronik, halangan sterik, teori orbital molekul, dan lain
sebagainya. Pada Gambar 4(b), menunjukkan reaksi yang tidak layak yang pusat
reaksinya memiliki reaktivitas rendah karena efek elektronik. Terakhir, semua atom
dalam produk target harus dipetakan ke dalam reaktan yakni, reaksi harus mengikuti
hukum kekekalan atom. Reaksi yang ditunjukkan pada Gambar 4(c) adalah contoh
tantangan di mana hukum kekekalan atom tidak terpenuhi. Lebih penting lagi, metode
yang digunakan untuk menghasilkan reaktan bervariasi berdasarkan representasi
molekul metode berbasis grafik adalah prioritas utama untuk representasi grafik,
sedangkan metode berbasis urutan sangat cocok untuk representasi SMILES.

Prediksi retrosintesis multi-langkah =1 , Selain menyandikan molekul sebagai string


SMILES,dimungkinkan untuk merepresentasikan molekul secara alami sebagai grafik.
Proliferasi Karena panjang jalur retrosintesis dapat mencapai 60 langkah atau lebih,
tujuan akhir perencanaan

2. Retrosintesis Multi Langkah

retrosintesis dapat menghasilkan rute retrosintesis multi-langkah, yang dapat dicapai


dengan menggunakan algoritme prediksi retrosintesis satu langkah yang telah
disebutkan sebelumnya. Sementara prediksi retrosintesis satu langkah yang
mencerminkan kelayakan reaksi telah diselidiki secara luas dan terus dikembangkan
secara berkelanjutan , upaya algoritme baru yang lebih sedikit telah dilakukan untuk
mengatasi masalah prediksi retrosintesis multi langkah yang sangat rumit dalam
menavigasi ke bahan blok bangunan yang tersedia secara komersial . Beberapa
tantangan yang harus diatasi saat merancang dan mengevaluasi model perencanaan
retrosintesis yang sesuai keinginan diantara lain:

Pertama, ruang pencarian untuk kemungkinan rencana retrosintesis pada semua rute
sintesis yang mungkin seringkali besar secara eksponensial, mengingat ada banyak
langkah sintesis yang dapat ditempuh oleh molekul target di setiap langkah yang
berbeda.

Kedua, kriteria untuk rute sintetik yang baik tidak jelas, karena ahli kimia yang
berbeda cenderung memiliki pendekatan retrosintesis yang berbeda terhadap molekul
target, yang sebagian besar bergantung pada pengalaman dan pemahaman pribadi
masing-masing tentang retrosintesis. Selain itu, kriteria rute retrosintesis yang baik
dapat berbeda sehubungan dengan skenario kimiawi. Misalnya, rute retrosintesis yang
baik dalam manufaktur industri berfokus pada stabilitas dan manajemen biaya,
sedangkan rute yang baik di dunia akademis adalah pendekatan retrosintesis baru yang
cukup untuk menangani molekul dengan struktur kompleks. Selain itu, beberapa data
set rute retrosintesis yang dapat diandalkan terbuka untuk umum, dan peneliti cenderung
menggunakan rute konvensial untuk mengevaluasi algoritme perencanaan retrosintesis
atau untuk membandingkan rute yang dihasilkan dengan rute yang dilaporkan oleh ahli
kimia melalui A/B double-blind tes , yang melelahkan dan subyektif. Oleh karena itu,
perencanaan retrosintesis yang digerakkan oleh AI diperlukan agar ahli kimia dapat
mempercepat proses pencarian jalur dalam skenario yang berbeda dan mengotomatiskan
prosedur evaluasi rute.
Kesimpulan

Penyedian sintesis jalur reaksi secara isolasi merupakan problema yang


dihadapi oleh manusia pada saat itu, bukan hanya memerlukan ketelitian dan
keterampilan khusus, memerlukan biaya yang tinggi dan tentunya waktu waktu yang
lama. Maka dari itu, untuk mendapatkan hasil yang memuaskan dengan biaya yang
relatif murah, retrosintesis berbasis AI ini dibutuhkan untuk membantu mencari jalan
keluar dalam memprediksi sebuah rute untuk berjalannya suatu reaksi kimia. Dengan
pengembangan perencanaan sintesis berbantuan komputer, evaluasi rute otomatis
menjadi penting saat mengevaluasi kinerja berbagai program suatu reaksi. Selain
mempertimbangkan kualitas setiap reaksi satu langkah di dalam rute, kualitas
keseluruhan rute yang ditentukan oleh strategi retrosintesis sangat penting. Misalnya,
sintesis konvergen merupakan prioritas untuk strategi retrosintesis, karena mengurangi
panjang maksimum jalur retrosintesis dan meningkatkan tingkat hasil keberhasilan
jenis reaksi protek yang muncul bersamaan di dalam satu rute retrosintesis untuk
menghindari reaksi non-selektif. Pendekatan AI berorientasi data murni telah membuat
kemajuan signifikan dalam efektivitas dan efisiensi, mengungguli mesin konvensional
berdasarkan aturan yang diekstraksi dan heuristik yang dirancang dengan tangan.
Sistem AI pakar-ahli yang terus berkembang yang disebut Synthia melengkapi
pendekatan berorientasi data dalam merencanakan sintesis target yang kompleks.
Masalah prediksi retrosintesis sangat riskan dengan kegagalan , hal ini dsisebabkan oleh
jumlah kemungkinan transformasi kimia sangat besar, menghasilkan ruang pencarian
yang luas. Konsekuensinya, diperlukan kreativitas dan keahlian yang luas dari ahli
kimia yang berpengalaman. Desain retrosintesis yang dipandu komputer dapat
menghemat waktu bagi para peneliti dengan secara otomatis menghasilkan jalur sintesis
dari produk akhir molekuler yang diinginkan ke blok bangunan yang tersedia secara
komersial sehingga sangat membantu para disiplin keilmuwan science yang terkendala
untuk mengatasi kelemahan pada retrosintesis konvensional.
DAFTAR PUSTAKA

Bjerrum EJ, Thakkar A, Engkvist O. Artificial applicability labels for improving


policies in retrosynthesis prediction. Mach Learn Sci Technol 2020;2(1):017001.

Chen B, Li C, Dai H, Song L. Retro*: learning retrosynthetic planning with neural


guided A* search. In: Proceedings of the 37th International Conference on
Machine Learning; 2020 Jul 12-18; online. 2020. p. 1608–16

Coley CW, Green WH, Jensen KF. RDChiral: an RDKit wrapper for handling
stereochemistry in retrosynthetic template extraction and application. J Chem Inf
Model 2019;59(6):2529–37

Coley CW, Thomas III DA, Lummiss JAM, Jaworski JN, Breen CP, Schultz V, et al. A
robotic platform for flow synthesis of organic compounds informed by AI
planning. Science 2019;365(6453):eaax1566.

Dai H, Li C, Coley CW, Dai B, Song L. Retrosynthesis prediction with conditional


graph logic network. In: Proceedings of the 33rd Conference on Neural
Information Processing Systems (NeurIPS 2019); 2019 Dec 8–14; Vancouver,
BC, Canada. 2019. p. 8872– 82

Fortunato ME, Coley CW, Barnes BC, Jensen KF. Data augmentation and pretraining
for template-based retrosynthetic prediction in computer-aided synthesis
planning. J Chem Inf Model 2020;60(7):3398–40

Jeon W, Kim D. Autonomous molecule generation using reinforcement learning and


docking to develop potential novel inhibitors. Sci Rep 2020;10(1):22104.

Mikulak-Klucznik B, Gołębiowska P, Bayly AA, Popik O, Klucznik T, Szymkuć S, et


al. Computational planning of the synthesis of complex natural products. Nature
2020;588(7836):83–8.

Moerland TM, Broekens J, Plaat A, Jonker CM. Model-based reinforcement learning: a


survey. 2020. arXiv:2006.16712.

Nair A, Pong V, Dalal M, Bahl S, Lin S, Levine S. Visual reinforcement learning with
imagined goals. 2018. arXiv:1807.04742.

Nicolaou KC, Rigol S, Yu R. Total synthesis endeavors and their contributions to


science and society: a personal account. CCS Chem 2019;1(1):3–37
Nugmanov RI, Mukhametgaleev RN, Akhmetshin T, Gimadiev TR, Afonina VA,
Madzhidov TI, et al. CGRtools: Python library for molecule, reaction, and
condensed graph of reaction processing. J Chem Inf Model 2019;59(6):2516–21.

Radford A, Wu J, Child R, Luan D, Amodei D, Sutskever I. Language models are


unsupervised multitask learners. OpenAI blog 2019

Schwaller P, Petraglia R, Zullo V, Nair VH, Haeuselmann RA, Pisoni R, et al.


Predicting retrosynthetic pathways using transformerbased models and a hyper-
graph exploration strategy. Chem Sci 2020;11(12):3316–25.

Schwaller P, Probst D, Vaucher AC, Nair VH, Kreutter D, Laino T, et al. Mapping the
space of chemical reactions using attentionbased neural networks. Nat Mach
Intell 2021;3(2)

Seidl P, Renz P, Dyubankova N, Neves P, Verhoeven J, Segler M, et al. Modern


Hopfield networks for few- and zero-shot reaction template prediction. 2021.
arXiv:2104.03279.

Shi C, Xu M, Guo H, Zhang M, Tang J. A graph to graphs framework for retrosynthesis


prediction. In: Proceedings of the 37th International Conference on Machine
Learning; 2020 Jul 12-18; online. 2020. p. 8818–27.

Silver D, Singh S, Precup D, Sutton RS. Reward is enough. Artif Intell


2021;299:103535

Szymkuć S, Badowski T, Grzybowski BA. Is organic chemistry really growing


exponentially? Angew Chem Int Ed 2021;133(50):26430–6

Yan C, Ding Q, Zhao P, Zheng S, Yang J, Yu Y, et al. RetroXpert: decompose


retrosynthesis prediction like a chemist. In: Proceedings of the 34th Conference
on Neural Information Processing Systems (NeurIPS 2020); 2020 Dec 6–
12;online. 2020. p. 11248–58

Anda mungkin juga menyukai