Anda di halaman 1dari 8

Mari kita pahami contoh model ML tempat kita membuat aplikasi untuk mengenali emosi pengguna

berdasarkan ekspresi wajah. Jadi, membuat aplikasi seperti itu dimungkinkan dengan model
pembelajaran Mesin di mana kami akan melatih model dengan memberi makan gambar wajah dengan
berbagai emosi yang diberi label di dalamnya. Setiap kali aplikasi ini digunakan untuk menentukan
suasana hati pengguna, ia membaca semua data yang dimasukkan kemudian menentukan suasana hati
pengguna mana pun.

Oleh karena itu, dengan kata sederhana, kita dapat mengatakan bahwa model pembelajaran mesin
adalah representasi yang disederhanakan dari sesuatu atau proses. Dalam topik ini, kita akan
membahas berbagai model pembelajaran mesin serta teknik dan algoritmenya.

Apa itu Model Pembelajaran Mesin?


Model Machine Learning dapat dipahami sebagai program yang telah dilatih untuk menemukan pola
dalam data baru dan membuat prediksi. Model-model ini direpresentasikan sebagai fungsi matematika
yang menerima permintaan dalam bentuk data input, membuat prediksi pada data input, dan kemudian
memberikan output sebagai respons. Pertama, model-model ini dilatih melalui sekumpulan data, dan
kemudian mereka diberikan algoritme untuk menalar data, mengekstrak pola dari data umpan, dan
belajar dari data tersebut. Setelah model ini dilatih, mereka dapat digunakan untuk memprediksi
kumpulan data yang tidak terlihat.
Ada berbagai jenis model pembelajaran mesin yang tersedia berdasarkan tujuan bisnis dan kumpulan
data yang berbeda.

Klasifikasi Model Machine Learning:


Berdasarkan tujuan bisnis dan kumpulan data yang berbeda, ada tiga model pembelajaran untuk
algoritme. Setiap algoritma pembelajaran mesin menjadi salah satu dari tiga model:

 Pembelajaran Terawasi
 Pembelajaran tanpa pengawasan
 Pembelajaran Penguatan

Supervised Learning dibagi lagi menjadi dua kategori:


 Klasifikasi

 Regresi

Pembelajaran tanpa pengawasan juga dibagi ke dalam


kategori di bawah ini:
 Kekelompokan

 Aturan Asosiasi

 Pengurangan Dimensi

1. Model Pembelajaran Mesin yang Diawasi

Supervised Learning adalah model pembelajaran mesin yang paling sederhana untuk dipahami di
mana data input disebut data pelatihan dan memiliki label atau hasil yang diketahui sebagai output.
Jadi, ia bekerja berdasarkan prinsip pasangan input-output. Ini membutuhkan pembuatan fungsi yang
dapat dilatih menggunakan kumpulan data pelatihan, dan kemudian diterapkan pada data yang tidak
diketahui dan membuat beberapa kinerja prediktif. Pembelajaran yang diawasi berbasis tugas dan
diuji pada kumpulan data berlabel.
Kita dapat menerapkan model pembelajaran terawasi pada masalah kehidupan nyata yang sederhana.
Misalnya, kami memiliki kumpulan data yang terdiri dari usia dan tinggi badan; kemudian, kita dapat
membangun model pembelajaran terawasi untuk memprediksi tinggi badan seseorang berdasarkan
usianya.
Model Supervised Learning selanjutnya diklasifikasikan menjadi dua kategori:

Regresi
Dalam masalah regresi, outputnya adalah variabel kontinu. Beberapa model Regresi yang umum
digunakan adalah sebagai berikut:
a) Regresi Linier
Regresi linier adalah model pembelajaran mesin paling sederhana di mana kami mencoba
memprediksi satu variabel keluaran menggunakan satu atau lebih variabel masukan. Representasi
regresi linier adalah persamaan linier, yang menggabungkan sekumpulan nilai input (x) dan output
yang diprediksi (y) untuk himpunan nilai input tersebut. Direpresentasikan dalam bentuk garis:

Y = bx+c.

Model Pembelajaran Mesin


Tujuan utama dari model regresi linier adalah untuk menemukan garis yang paling cocok yang paling
cocok dengan titik-titik data.
Regresi linier diperluas ke regresi linier berganda (menemukan bidang yang paling sesuai) dan regresi
polinomial (menemukan kurva yang paling sesuai).
b) Pohon Keputusan
Pohon keputusan adalah model pembelajaran mesin populer yang dapat digunakan untuk masalah
regresi dan klasifikasi.
Sebuah pohon keputusan menggunakan struktur keputusan seperti pohon bersama dengan
kemungkinan konsekuensi dan hasil mereka. Dalam hal ini, setiap simpul internal digunakan untuk
mewakili pengujian pada atribut; setiap cabang digunakan untuk mewakili hasil tes. Semakin banyak
simpul yang dimiliki pohon keputusan, semakin akurat hasilnya.
Keuntungan dari pohon keputusan adalah intuitif dan mudah diimplementasikan, tetapi kurang akurat.
Pohon keputusan banyak digunakan dalam riset operasi, khususnya dalam analisis keputusan,
perencanaan strategis, dan terutama dalam pembelajaran mesin.
c) Hutan Acak
Random Forest adalah metode pembelajaran ensemble, yang terdiri dari sejumlah besar pohon
keputusan. Setiap pohon keputusan di hutan acak memprediksi hasil, dan prediksi dengan suara
terbanyak dianggap sebagai hasil.
Model hutan acak dapat digunakan untuk masalah regresi dan klasifikasi.
Untuk tugas klasifikasi, hasil random forest diambil dari suara terbanyak. Sedangkan pada tugas
regresi, hasil diambil dari mean atau rata-rata prediksi yang dihasilkan oleh setiap pohon.
d) Jaringan Syaraf
Jaringan syaraf tiruan adalah bagian dari pembelajaran mesin dan juga dikenal sebagai jaringan syaraf
tiruan. Jaringan saraf terdiri dari neuron buatan dan dirancang sedemikian rupa sehingga menyerupai
struktur dan cara kerja otak manusia. Setiap neuron buatan terhubung dengan banyak neuron lain
dalam jaringan saraf, dan jutaan neuron yang terhubung seperti itu menciptakan struktur kognitif yang
canggih.

Jaringan saraf tiruan terdiri dari struktur multilayer, yang berisi satu lapisan input, satu atau lebih
lapisan tersembunyi, dan satu lapisan output. Karena setiap neuron terhubung dengan neuron lain, ia
mentransfer data dari satu lapisan ke neuron lain dari lapisan berikutnya. Akhirnya, data mencapai
lapisan terakhir atau lapisan keluaran dari jaringan saraf dan menghasilkan keluaran.
Jaringan saraf bergantung pada data pelatihan untuk mempelajari dan meningkatkan akurasinya.
Namun, jaringan saraf yang terlatih & akurat dapat mengelompokkan data dengan cepat dan menjadi
alat pembelajaran mesin dan AI yang andal. Salah satu jaringan saraf yang paling terkenal adalah
algoritma pencarian Google.

Klasifikasi
Model klasifikasi adalah tipe kedua dari teknik Supervised Learning, yang digunakan untuk
menghasilkan kesimpulan dari nilai-nilai yang diamati dalam bentuk kategoris. Misalnya, model
klasifikasi dapat mengidentifikasi apakah email tersebut adalah spam atau bukan; pembeli akan
membeli produk atau tidak, dll. Algoritma klasifikasi digunakan untuk memprediksi dua kelas dan
mengkategorikan output ke dalam kelompok yang berbeda.
Dalam klasifikasi, model pengklasifikasi dirancang yang mengklasifikasikan kumpulan data ke dalam
kategori yang berbeda, dan setiap kategori diberi label.
Ada dua jenis klasifikasi dalam pembelajaran mesin:
 Klasifikasi biner: Jika masalah hanya memiliki dua kelas yang mungkin, disebut
pengklasifikasi biner. Misalnya, kucing atau anjing, Ya atau Tidak,
 Klasifikasi multi-kelas: Jika masalah memiliki lebih dari dua kelas yang mungkin, itu adalah
pengklasifikasi multi-kelas.
Beberapa algoritma klasifikasi yang populer adalah sebagai berikut:
a) Regresi Logistik
Regresi Logistik digunakan untuk menyelesaikan masalah klasifikasi dalam pembelajaran mesin.
Mereka mirip dengan regresi linier tetapi digunakan untuk memprediksi variabel kategori. Itu dapat
memprediksi output baik Ya atau Tidak, 0 atau 1, Benar atau Salah, dll. Namun, alih-alih memberikan
nilai yang tepat, ini memberikan nilai probabilistik antara 0 & 1.
b) Mendukung Mesin Vektor
Mendukung mesin vektor atau SVM adalah algoritma pembelajaran mesin yang populer, yang banyak
digunakan untuk tugas klasifikasi dan regresi. Namun, secara khusus digunakan untuk menyelesaikan
masalah klasifikasi. Tujuan utama SVM adalah untuk menemukan batas keputusan terbaik dalam
ruang N-dimensi, yang dapat memisahkan titik data ke dalam kelas, dan batas keputusan terbaik
dikenal sebagai Hyperplane. SVM memilih vektor ekstrim untuk menemukan hyperplane, dan vektor
ini dikenal sebagai vektor pendukung.

c) Nave Bayes
Naïve Bayes adalah algoritma klasifikasi populer lainnya yang digunakan dalam pembelajaran mesin.
Disebut demikian karena didasarkan pada teorema Bayes dan mengikuti asumsi naif (independen)
antara fitur yang diberikan sebagai:

Setiap pengklasifikasi nave Bayes mengasumsikan bahwa nilai variabel tertentu tidak tergantung pada
variabel/fitur lainnya. Misalnya, jika suatu buah perlu diklasifikasikan berdasarkan warna, bentuk, dan
rasanya. Jadi kuning, lonjong, dan manis akan dikenali sebagai mangga. Di sini setiap fitur tidak
tergantung pada fitur lainnya.

2. Model pembelajaran mesin tanpa pengawasan


Model pembelajaran mesin tanpa pengawasan menerapkan proses pembelajaran yang berlawanan
dengan pembelajaran yang diawasi, yang berarti memungkinkan model untuk belajar dari kumpulan
data pelatihan yang tidak berlabel. Berdasarkan dataset yang tidak berlabel, model memprediksi
output. Menggunakan pembelajaran tanpa pengawasan, model mempelajari pola tersembunyi dari
kumpulan data dengan sendirinya tanpa pengawasan apa pun.
Model pembelajaran tanpa pengawasan terutama digunakan untuk melakukan tiga tugas, yaitu sebagai
berikut:

 Kekelompokan
Kekelompokan adalah teknik pembelajaran tanpa pengawasan yang melibatkan
pengelompokan atau meraba-raba titik data ke dalam cluster yang berbeda berdasarkan
persamaan dan perbedaan. Objek-objek dengan kemiripan paling banyak tetap berada dalam
kelompok yang sama, dan mereka tidak memiliki atau sangat sedikit kesamaan dari kelompok
lain.
Algoritma pengelompokan dapat digunakan secara luas dalam tugas yang berbeda seperti
Segmentasi gambar, Analisis data statistik, Segmentasi pasar, dll.Beberapa algoritma
Clustering yang umum digunakan adalah K-means Clustering, Hierarchal Clustering,
DBSCAN, dll.

 Pembelajaran Aturan Asosiasi


Pembelajaran aturan asosiasi adalah teknik pembelajaran tanpa pengawasan, yang
menemukan hubungan menarik antara variabel dalam kumpulan data yang besar. Tujuan
utama dari algoritma pembelajaran ini adalah untuk menemukan ketergantungan satu item
data pada item data yang lain dan memetakan variabel-variabel tersebut sesuai sehingga dapat
menghasilkan keuntungan yang maksimal. Algoritma ini terutama diterapkan dalam analisis
Keranjang Pasar, penambangan penggunaan Web, produksi berkelanjutan, dll.
Beberapa algoritma yang populer dari Association rule learning adalah Apriori Algorithm,
Eclat, FP-growth algorithm.

 Pengurangan Dimensi
Jumlah fitur/variabel yang ada dalam kumpulan data dikenal sebagai dimensionalitas
kumpulan data, dan teknik yang digunakan untuk mereduksi dimensionalitas dikenal sebagai
teknik reduksi dimensionalitas.
Meskipun lebih banyak data memberikan hasil yang lebih akurat, itu juga dapat memengaruhi
kinerja model/algoritma, seperti masalah pemasangan berlebih. Dalam kasus seperti itu,
teknik pengurangan dimensi digunakan.
"Ini adalah proses mengubah kumpulan data dimensi yang lebih tinggi menjadi kumpulan
data dimensi yang lebih rendah untuk memastikan bahwa itu memberikan informasi yang
serupa."
Metode pengurangan dimensi yang berbeda seperti PCA (Analisis Komponen Utama),
Dekomposisi Nilai Singular, dll.

Pembelajaran Penguatan

Dalam pembelajaran penguatan, algoritme mempelajari tindakan untuk serangkaian status tertentu
yang mengarah ke status tujuan. Ini adalah model pembelajaran berbasis umpan balik yang
mengambil sinyal umpan balik setelah setiap keadaan atau tindakan dengan berinteraksi dengan
lingkungan. Umpan balik ini berfungsi sebagai imbalan (positif untuk setiap tindakan baik dan negatif
untuk setiap tindakan buruk), dan tujuan agen adalah memaksimalkan imbalan positif untuk
meningkatkan kinerjanya.
Perilaku model dalam pembelajaran penguatan mirip dengan pembelajaran manusia, karena manusia
mempelajari sesuatu melalui pengalaman sebagai umpan balik dan berinteraksi dengan lingkungan.
Di bawah ini adalah beberapa algoritma populer yang termasuk dalam pembelajaran penguatan:

 Q-learning: Q-learning adalah salah satu algoritma pembelajaran penguatan bebas model
yang populer, yang didasarkan pada persamaan Bellman.
Ini bertujuan untuk mempelajari kebijakan yang dapat membantu agen AI untuk mengambil tindakan
terbaik untuk memaksimalkan hadiah dalam keadaan tertentu. Ini menggabungkan nilai Q untuk
setiap pasangan keadaan-tindakan yang menunjukkan hadiah untuk mengikuti jalur keadaan tertentu,
dan mencoba untuk memaksimalkan nilai-Q.

 State-Action-Reward-State-Action (SARSA): SARSA adalah algoritma On-policy yang


didasarkan pada proses keputusan Markov. Ini menggunakan tindakan yang dilakukan oleh
kebijakan saat ini untuk mempelajari nilai-Q. Algoritma SARSA adalah singkatan dari State
Action Reward State Action, yang melambangkan tuple (s, a, r, s', a').

 Deep Q Network: DQN atau Deep Q Neural network adalah Q-learning dalam jaringan
neural. Ini pada dasarnya digunakan di lingkungan ruang negara besar di mana
mendefinisikan tabel-Q akan menjadi tugas yang kompleks. Jadi, dalam kasus seperti itu,
daripada menggunakan tabel-Q, jaringan saraf menggunakan nilai-Q untuk setiap tindakan
berdasarkan keadaan.

Pelatihan Model Pembelajaran Mesin


Setelah model pembelajaran Mesin dibangun, itu dilatih untuk mendapatkan hasil yang sesuai. Untuk
melatih model pembelajaran mesin, seseorang membutuhkan sejumlah besar data yang telah diproses
sebelumnya. Di sini data yang telah diproses sebelumnya berarti data dalam bentuk terstruktur dengan
nilai nol yang dikurangi, dll. Jika kami tidak menyediakan data yang telah diproses sebelumnya, maka
ada kemungkinan besar model kami dapat berkinerja buruk.
Bagaimana memilih model terbaik?
Pada bagian di atas, kita telah membahas berbagai model dan algoritma pembelajaran mesin. Tapi
satu pertanyaan paling membingungkan yang mungkin muncul untuk setiap pemula bahwa "model
mana yang harus saya pilih?". Jadi, jawabannya tergantung terutama pada kebutuhan bisnis atau
kebutuhan proyek. Selain itu, ini juga tergantung pada atribut terkait, volume dataset yang tersedia,
jumlah fitur, kompleksitas, dll. Namun, dalam praktiknya, disarankan agar kita selalu memulai dengan
model paling sederhana yang dapat diterapkan pada model tertentu. masalah dan kemudian secara
bertahap meningkatkan kompleksitas & menguji akurasi dengan bantuan penyetelan parameter dan
validasi silang.
Perbedaan antara model pembelajaran mesin dan Algoritma
Salah satu pertanyaan paling membingungkan di kalangan pemula adalah apakah model pembelajaran
mesin, dan algoritmanya sama? Karena dalam berbagai kasus dalam pembelajaran mesin dan ilmu
data, kedua istilah ini digunakan secara bergantian.
Jawaban atas pertanyaan ini adalah Tidak, dan model pembelajaran mesin tidak sama dengan
algoritma. Secara sederhana, algoritma ML seperti prosedur atau metode yang berjalan pada data
untuk menemukan pola darinya dan menghasilkan model. Pada saat yang sama, model pembelajaran
mesin seperti program komputer yang menghasilkan keluaran atau membuat prediksi. Lebih khusus
lagi, ketika kita melatih suatu algoritma dengan data, itu menjadi sebuah model.

Anda mungkin juga menyukai