IJCIT
(Indonesian Journal on Computer and Information Technology)
Journal Homepage: http://ejournal.bsi.ac.id/ejurnal/index.php/ijcit
ABSTRAK
Pembelajaran mesin merupakan bagian dari kecerdasan buatan yang banyak digunakan untuk
memecahkan berbagai masalah. Artikel ini menyajikan ulasan pemecahan masalah dari penelitian-
penelitian terkini dengan mengklasifikasikan machine learning menjadi tiga kategori: pembelajaran
terarah, pembelajaran tidak terarah, dan pembelajaran reinforcement. Hasil ulasan menunjukkan ketiga
kategori masih berpeluang digunakan dalam beberapa kasus terkini dan dapat ditingkatkan untuk
mengurangi beban komputasi dan mempercepat kinerja untuk mendapatkan tingkat akurasi dan presisi
yang tinggi. Tujuan ulasan artikel ini diharapkan dapat menemukan celah dan dijadikan pedoman untuk
penelitian pada masa yang akan datang.
Katakunci: pembelajaran mesin, pembelajaran reinforcement, pembelajaran terarah, pembelajaran
tidak terarah
ABSTRACTS
Machine learning is part of artificial intelligence that is widely used to solve various problems. This article
reviews problem solving from the latest studies by classifying machine learning into three categories:
supervised learning, unsupervised learning, and reinforcement learning. The results of the review show
that the three categories are still likely to be used in some of the latest cases and can be improved to
reduce computational costs and accelerate performance to get a high level of accuracy and precision. The
purpose of this article review is expected to be able to find a gap and it is used as a guideline for future
research.
Keywords: machine learning, reinforcement learning, supervised learning, unsupervised learning
Jurnal ini dapat diakses secara terbuka dan memiliki lisensi CC-BY-SA
(https://creativecommons.org/licenses/by-sa/4.0/) ©2020 by penulis dan IJCIT
76 | Vol. 5 No.1, Mei 2020 Hal. 75-82
biasanya disebut dengan kecerdasan buatan Learning sering disebut cluster dikarenakan
(Artificial Intelligence) yang merupakan bagian tidak ada kebutuhan untuk pemberian label
dari ilmu komputer. dalam kumpulan data dan hasilnya tidak
Kecerdasan Buatan merupakan salah satu mengidentifikasi contoh di kelas yang telah
bidang dalam ilmu komputer yang ditujukan ditentukan (Thupae, Isong, Gasela, & Abu-
pada pembuatan software dan hardware yang Mahfouz, 2018). Sedangkan Reinforcement
dapat berfungsi sebagai sesuatu yang dapat Learning biasanya berada antara Supervised
berpikir seperti manusia (Sunarya, Santoso, & Learning dan Unsupervised Learning (Board,
Sentanu, 2015). Kecerdasan buatan banyak 2017), teknik ini bekerja dalam lingkungan yang
digunakan untuk memecahkan berbagai dinamis di mana konsepnya harus
masalah seperti bisnis (Rahardja, Roihan, & menyelesaikan tujuan tanpa adanya
others, 2017), robotika, bahasa alami, pemberitahuan dari komputer secara eksplisit
matematika, game, persepsi, diagnosis medis, jika tujuan tersebut telah tercapai (Das & Nene,
teknik, analisis keuangan, analisis sains, dan 2017).
penalaran (Russell & Norvig, 2016). Metode supervised learning didasarkan
Machine learning dapat didefinisikan pada kumpulan sampel data yang memiliki label.
sebagai aplikasi komputer dan algoritma Kumpulan sampel digunakan untuk meringkas
matematika yang diadopsi dengan cara karakteristik distribusi ukuran perilaku dalam
pembelajaran yang berasal dari data dan setiap jenis aplikasi sehingga membentuk model
menghasilkan prediksi di masa yang akan datang perilaku dari data (Amei, Huailin, Qingfeng, &
(Goldberg & Holland, 1988). Adapun proses Ling, 2011). Supervised learning dikelompokkan
pembelajaran yang dimaksud adalah suatu lebih lanjut dalam masalah klasifikasi dan
usaha dalam memperoleh kecerdasan yang regresi. Masalah klasifikasi adalah ketika
melalui dua tahap antara lain latihan (training) variabel output berbentuk kategori, seperti
dan pengujian (testing) (Huang, Zhu, & Siew, merah atau biru atau penyakit dan tidak ada
2006). penyakit. Sedangkan masalah regresi adalah
Bidang machine learning berkaitan ketika variabel output adalah nilai riil, seperti
dengan pertanyaan tentang bagaimana dollar atau berat (Brownlee, 2016).
membangun program komputer agar meningkat Supervised learning memiliki beberapa
secara otomatis dengan berdasar dari algoritma populer seperti Back-propagation
pengalaman (Mitchell, 1997). (Negnevitsky, 2005), Linear regression, Random
Penelitian terkini mengungkapkan bahwa Forest, Support Vector Machines (Brownlee,
machine learning terbagi menjadi tiga kategori: 2016), Naive Bayesian, Metode Rocchio,
Supervised Learning, Unsupervised Learning, Decision Tree, k-Nearest Neighbor, Neural
Reinforcement Learning (Somvanshi & Chavan, Network (Darujati & Gumelar, 2012), Logistic
2016). Skema keterkaitan artificial intelligence Regression, dan Neural Network (Lakshmi &
dan machine learning dapat dijelaskan dalam Sheshasaayee, 2015). Kemudian beberapa
Gambar 1. algoritma untuk klasifikasi pun disebutkan
dalam seperti Support Vector Machines (SVM),
Normal Bayesian Classifier (NBC), K-Nearest
Neighbor (KNN), Trees Gradient Boosted (GBT),
Random Trees (RT), dan Artificial Neural
Networks (ANN) (Židek, Pitel’, & Hošovsk\`y,
2017). Algoritma lainnya pun dibahas dalam
(Athmaja, Hanumanthappa, & Kavitha, 2017)
seperti Gaussian Mixture models, Hidden
Markov Models, logistic regression, Kernel
Gambar 1. Skema Artificial Intelligence dan Regression, Deep neural networks, Deep belief
Machine Learning networks, PCA, Kernel Perceptron.
Beberapa masalah dalam kategori ini
Teknik yang digunakan oleh Supervised berkisar pada klasifikasi misalnya dalam bidang
Learning adalah metode klasifikasi di mana lalu lintas seperti pengembangan Automatic
kumpulan data sepenuhnya diberikan label Plate Plate Recognition (ALPR) yang dapat
untuk mengklasifikasikan kelas yang tidak digunakan di banyak aplikasi, seperti
dikenal. Sedangkan teknik Unsupervised pemantauan lalu lintas jalan, pembayaran tol
otomatis, dan manajemen parkir (Kosala, Reinforcement learning berasal dari teori
Harjoko, & Hartati, 2017). Pemanfaatan machine belajar hewan. Pembelajaran ini tidak
learning pun dalam bidang industri dilakukan memerlukan pengetahuan sebelumnya, dapat
pada penelitian (Krisandi, Helmi, & others, secara mandiri mendapatkan kebijakan opsional
2013). Selain itu dalam bidang kedokteran dengan pengetahuan yang diperoleh melalui
seperti masalah pencitraan medis (Latif, Xiao, coba-coba dan terus berinteraksi dengan
Imran, & Tu, 2019), pengelolaan data pasien lingkungan yang dinamis (Qiang & Zhongli,
(Khan, Doucette, Cohen, & Lizotte, 2012) dan 2011). Masalah reinforcement learning
pemeriksaan gaya berjalan seseorang bisa diselesaikan dengan mempelajari pengalaman
diprediksi dengan akurasi yang cukup tinggi baru melalui trial-and-error (Mahmud, Kaiser,
(LeMoyne, Kerr, Mastroianni, & Hessel, 2014). Hussain, & Vassanelli, 2018). Algoritma
Dalam bidang teknologi seperti jam pintar (Lee, reinforcement learning terkait dengan algoritma
Yoon, & Lee, 2018), multimedia (Holder, Pin, & pemrograman dinamis yang sering digunakan
Kalva, 2009), klasifikasi teks (Darujati & untuk menyelesaikan masalah optimisasi
Gumelar, 2012) dan lain sebagainya tentu saja (Mitchell, 1997).
sudah banyak yang memanfaatkan machine Banyak masalah machine learning dalam
learning dengan kategori supervised learning. dunia nyata termasuk dalam kategori ini. Hal ini
Dalam jenis pembelajaran Unsupervised dikarenakan bisa mencapai harga yang mahal
Learning, sistem disediakan dengan beberapa bahkan memakan waktu untuk pemberian label
input sampel tetapi tidak ada output yang hadir. pada data terkait kemungkinan untuk
Karena tidak ada output yang diinginkan di sini memerlukan akses ke bagian pakar. Padahal
kategorisasi dilakukan sehingga algoritma data yang tidak memiliki label itu didapatkan
membedakan dengan benar antara kumpulan dengan harga yang murah dan mudah untuk
data. Ini adalah tugas mendefinisikan fungsi dikumpulkan dan disimpan (Brownlee, 2016).
untuk menggambarkan struktur yang Secara khusus metode reinforcement
tersembunyi dari data yang tidak berlabel learning berdasarkan model proses pengambilan
(Somvanshi & Chavan, 2016). Unsupervised keputusan Markov (Markov decision process)
learning dikelompokkan lebih lanjut dalam mencakup dua jenis. Pertama yaitu metode
masalah clustering dan asosiasi. Masalah berbasis model seperti algoritma SARSA, di
pengelompokan (clustering) adalah tempat mana reinforcement learning pertama kali
untuk menemukan pengelompokan yang mempelajari pengetahuan model, kemudian
melekat dalam data, seperti mengelompokkan mendapatkan strategi yang optimal dari
pelanggan berdasarkan pada perilaku pengetahuan model tersebut. Kedua adalah
pembelian. Sedangkan masalah asosiasi adalah metode yang relevan model seperti algoritma
aturan yang menggambarkan sebagian besar Temporal Difference dan algoritma Q-learning,
data yang ada, seperti orang yang membeli A di mana reinforcement learning secara langsung
juga cenderung membeli B (Brownlee, 2016). menghitung strategi yang optimal tanpa
Unsupervised learning memiliki beberapa pengetahuan model (Qiang & Zhongli, 2011).
algoritma populer seperti k-means, Apriori Beberapa masalah dalam kategori ini
(Brownlee, 2016), Independent Subspace misalnya dalam bidang teknologi seperti
Analysis (ISA) (G. Wu et al., 2013), DBSCAN pelayananan yang cerdas dengan
(Ester, Kriegel, Sander, Xu, & others, 1996). memanfaatkan bidang IoT dan kota pintar
Beberapa masalah misalnya dalam (smart city) (Mohammadi, Al-Fuqaha, Guizani, &
bidang finansial untuk meninjau sejumlah besar Oh, 2018). Dalam bidang teknologi lainnya
data maka unsupervised learning biasanya dapat seperti pemrosesan bahasa alami (Sharma &
digunakan (Board, 2017). Dalam bidang industri Kaushik, 2017) dan computer vision (Z. Wu,
misalnya dalam (Aji & Wibisono, 2018), Khan, Gao, & Guan, 2018) dan (Watanabe &
kemudian dalam bidang kedokteran Ishimaru, 2016) juga menggunakan kategori ini.
unsupervised learning digunakan dalam proses Artikel ini akan menyajikan beberapa
segmentasi pembuluh darah (Dharmawan, Ng, & penelitian terkini mengenai pemanfaatan
Rahardja, 2018), dan bidang teknologi seperti algoritma machine learning berdasarkan
jaringan komputer maupun pencegahan masing-masing kategori, dengan harapan dapat
serangan keamanannya (Das & Nene, 2017) pun menemukan celah dan dijadikan pedoman
menggunakan kategori ini. untuk penelitian pada masa yang akan datang.