Anda di halaman 1dari 28

Machine Learning

• Mampu memahami konsep machine


learning dan aplikasinya
• Perbedaan supervised, unsupervised,
dan reinforcement learning

Capaian • Ketepatan mendeskripsikan konsep dari


regression dan classification

Belajar • Ketepatan mengidentifikasi strategi yang


akan diterapkan pada masalah yang
diberikan
• Ketepatan menguraikan perbedaan
antara machine learning dan data mining
• Pembelajaran mesin atau yang biasa disebut
Machine Learning diciptakan oleh Arthur Samuel
pada tahun 1959.
• Machine learning didefinisikan sebagai bidang
studi yang memberikan komputer kemampuan
untuk belajar tanpa diprogram secara eksplisit.

Apa itu • Machine learning merupakan suatu pemrograman


komputer yang digunakan untuk mengoptimalkan

Machine
kriteria kinerja menggunakan data contoh atau
penelitian terdahulu (past experience).
• Metode pembelajaran dalam machine learning

Learning? yaitu menyelidiki bagaimana computer dapat


belajar atau meningkatkan kinerjanya berdasarkan
data yang ada.
• Perkembangan machine learning sangatlah pesat.
Contoh penerapan machine learning yaitu pada
penerjemahan Bahasa dengan menggunakan
computer yang dimana merubah suara menjadi
teks dan juga filter email spam pada email.
1. Asisten pribadi virtual
2. Prediksi macet
3. Jaringan transportasi online
4. Pengawasan video

Aplikasi-aplikasi 5.
6.
Layanan media social
Spam email dan pemfilteran malware

dari Machine 7. Dukungan pelanggan online


8. Pemurnian hasil mesin pencari
Learning 9. Rekomendasi produk
10. Deteksi penipuan online
11. Biologi komputasi
12. Terjemahan mesin
13. Mobil tanpa pengemudi
Klasifikasi Algoritma Machine Learning
• Pembelajaran dengan perngawasan atau yang biasa
disebut supervised learning pada dasarnya sebuah
sinonim dari klasifikasi. Metode ini yang paling
umum digunakan dalam machine learning.
Supervised learning berasal dari contoh berlabel di
training dataset.

Supervised • Contohnya, email yang masuk dipilih apakah spam


atau tidak. Saat pertama kali kita memutuskan suatu

Learning email dari pengirim tertentu adalah spam, sistem


tidak memiliki data pemilahan sehingga semua email
diterima sebagaimana mestinya. Namun setelah kita
menandai email dari suatu pengirim adalah spam,
sistem akan secara otomatis terus memasukkan
email tersebut ke folder spam sampai kita
membatalkan stempel atau pilihan spam pada
pengirim email tersebut.
https://www.uc.ac.id/ict/perbedaan-supervised-learning-and-unsupervised-learning/
Tipe-tipe Supervised Learning
• Klasifikasi (classification): Masalah klasifikasi adalah ketika variabel
keluaran berupa kategori, seperti "merah" atau "biru" atau "penyakit"
dan "tidak ada penyakit” (contoh: Linear regression, Decision tree,
Naïve bayes, random forest dan Support vector machines (SVM).
• Regresi (regression): Masalah regresi adalah ketika variabel keluaran
adalah nilai riil, seperti "dolar" atau "bobot". (contoh: k-means dan
apriori algorithm)
Contoh Penggunaan Algoritma Supervised Learning

• Grafik diatas menggambarkan bagaimana


memperkirakan harga rumah yang ada di New
• Ketika seorang penjual memiliki rumah seluas 850
Delhi. Beberapa data yang dikumpulkan
sebelumnya seperti area cakupan setiap rumah kaki persegi dan dia ingin mengetahui harga jual dari
dengan harga yang sesuai dari kota New Delhi. rumah tersebut, maka algoritme ML dapat
Data yang di plot berupa informasi ukuran melakukannya dengan menempatkan garis lurus
rumah yang berbeda dimana sumbu Y mewakili melalui data yang diplot. Berdasrkan kurva yang
harga rumah dan ukuran rumah dalam satuan diperoleh, dapat diketahui bahwa rumah seluas 850
kaki persegi untuk sumbu X. kaki persegi dapat dijual sekitar 18 lakh rupee.
Contoh Penggunaan Algoritma Supervised Learning (2)

• Tidak sampai disitu, semakin bertambahnya data yang ditambahkan pada dataset maka
gafiknya terlihat berubah seperti yang ditunjukkan pada gambar diatas. Dibandingkan dengan
garis lurus yang telah digambarkan sebelumnya, polynomial yang kedua lebih cocok untuk
data tersebut. Dengan menggunakan polynomial yang kedua, analis mendapatkan prediksi
yang lebih baik dan tentunya penjual juga mengharapkan harga mendekati 20 lakh rupee
seperti yang ditunjukkan pada grafik diatas.
• Pembelajaran tanpa pengawasan atau biasanya
disebut unsupervised learning merupakan metode
yang digunakan jika tidak ada variabel hasil untuk
diprediksi atau diklasifikasikan. Oleh karena itu, tidak
ada "pembelajaran" dari kasus-kasus di mana variabel
hasil seperti itu diketahui. Association rules, metode
pengurangan dimensi, dan teknik pengelompokan
merupakan metode unsupervised learning.

Unsupervised • Pada supervised learning, tujuannya yaitu


mempelajari pemetaan dari input ke output yang telah

Learning
disediakan sebelumnya oleh supervisor. Sedangkan di
unsupervised learning, tidak ada supervisor yang
mana hanya input yang dimiliki. Hal tersebut
bertujuan untuk keteraturan dalam input data.
• Terdapat berbagai macam input yang mebuat pola
tertentu lebih sering muncul daripada yang lain,
dengan menggunakan unsupervised learning,
pengolah dapat melihat apa yang umumnya terjadi
dan tidak. Dalam statistik, ini disebut estimasi
kepadatan (density estimation).
https://www.uc.ac.id/ict/perbedaan-supervised-learning-and-unsupervised-learning/
Teknik-teknik Unsupervised Learning
• Clustering (pengelompokan): Masalah pengelompokan adalah saat
Anda ingin menemukan pengelompokan yang melekat dalam data,
seperti mengelompokkan pelanggan menurut perilaku pembelian.
contoh: random forest, dan support vector machines.
• Association (asosiasi) : Masalah pembelajaran aturan asosiasi adalah
saat Anda ingin menemukan aturan yang menjelaskan sebagian besar
data Anda, seperti orang yang membeli X juga cenderung membeli Y.
contoh: k-means dan apriori algorithm.
Contoh
Unsupervised
Learning

•Gambar di atas merupakan pengelompokan data pelanggan pada 3 lokasi dalam kota yang sama
Contoh Penerapan Unsupervised Learning

• Google news menggunakan


unsupervised learning untuk
mengelompokkan item berita yang
ditulis pada topik yang berbeda.
• Dimana algoritme mengelompokkan
secara otomatis mengelompokkan
item berita yang sejenis
menggunakan atribut yang berbeda
seperti jumlah kata, Panjang kalimat,
jumlah halaman dan lainnya.
• Dalam reinforcement learning, Teknik machine learning yang
terdahulu menjadi pembelajaran dimana kebijakan-kebijakan yang
baik dan urutan tindakan yang baik di masa lalu untuk dapat
menghasilkan kebijakan dapat dipelajari lalu diterapkan dalam
metode pembelajaran ini.
• Selama proses training, komputer dituntun oleh algoritma dalam
melakukan kegiatan trial and error, mirip seperti anak kecil yang
belajar berjalan. Setiap kali percobaan trial and error dilakukan
Reinforcement akan ada feedback untuk komputer. Feedback dari tindakan
(action) sebelumnya akan digunakan sebagai panduan sekaligus
peta (guide and mapping) untuk melakukan aksi selanjutnya.
Learning • Contoh:
Dalam permainan game, terdapat suatu gerakan saja tidak penting
melainkan Gerakan tersebut harus dengan urutan yang baik. Karena
Gerakan yang baik dihasilkan oleh kebijakan yang baik. Strategi yang
dimilki Ketika bermain game merupakan kunci dari kesuksesan
sebuah permainan. Ketika telah mendapatkan algoritma yang pas
dalam bermain game, maka algoritma tersebut memungkinkan
diterapkan terhadap hal lainnya. Diketahui permainan game
merupakan area yang penting dalam melakukan penelitian di bidang
machine learning dan artificial intelligence.
Reinforcement learning digunakan dalam aplikasi
seperti game komputer (di mana mesin bermain
dengan manusia), mobil tanpa pengemudi, navigasi
robot, dll. Metode tersebut bekerja melalui trial and
error, dan mesin memilih tindakan yang menghasilkan
imbalan terbesar. Algoritma ini memiliki tiga komponen
utama yang disebutkan sebagai berikut :
• Agen: digunakan untuk pembelajaran dan
Reinforcement pengambilan keputusan. Agen memilih tindakan
yang memaksimalkan beberapa metrik reward

Learning
tertentu selama jangka waktu yang juga ditentukan.
• Lingkungan: mendefinisikan dunia luar tempat agen
berinteraksi.
• Tindakan: mendefinisikan tugas yang harus dilakukan
oleh agen.
Dengan demikian, reinforcement learning
memungkinkan mesin dan agen perangkat lunak untuk
secara otomatis menentukan perilaku ideal dalam
konteks tertentu, untuk memaksimalkan kinerjanya.
Implementasi Reinforcement Learning
Contoh sederhana yang dapat membantu menggambarkan cara
kerja RL berupa skenario mengajarkan trik baru kepada seekor
kucing
• Karena kucing tidak mengerti bahasa bahasa manusia, kita
tidak dapat memberi tahu kucing secara langsung apa yang
harus dilakukan. Sebaliknya, kita akan mengikuti strategi yang
berbeda.
• Kita meniru situasi, dan kucing mencoba merespons dengan
berbagai cara. Jika respon kucing sesuai yang diinginkan, kita
akan memberikan ikannya.
• Setiap kali kucing dihadapkan pada situasi yang sama, kucing
tersebut melakukan tindakan serupa dengan lebih antusias Kucing adalah agen yang berada pada environment (lingkungan). Dalam hal
dengan harapan mendapatkan lebih banyak reward (makanan). ini, environment itu adalah rumah. Contoh state/action (Tindakan) adalah
kucing duduk, dan kita menggunakan kata khusus untuk kucing agar berjalan.
• Hal tersebut mengajarkan bahwa kucing mendapat “apa yang Agent kita bereaksi dengan melakukan transisi tindakan dari satu “state” ke
“state” lainnya. Misalnya, kucing berubah dari duduk menjadi berjalan.
harus dilakukan” dari pengalaman positif dan kucing juga Reaksi agent adalah suatu tindakan, dan policy adalah metode pemilihan
tindakan yang diberikan suatu state dengan harapan hasil yang lebih baik.
belajar apa yang tidak boleh dilakukan saat dihadapkan pada Setelah transisi, kucing mungkin mendapatkan reward atau penalti sebagai
pengalaman negatif. imbalan.
Regression
• Analisis regresi adalah metodologi statistik yang paling sering digunakan untuk prediksi
numerik, meskipun metode lain juga ada. Regresi juga mencakup identifikasi tren
distribusi berdasarkan data yang tersedia.
• Regresi linier sederhana adalah contoh dari algoritma supervised learning.
• Variabel Y adalah variabel hasil (yang diketahui) dan variabel X adalah variabel prediktor.
• Garis regresi dibuat untuk meminimalkan jumlah deviasi kuadrat antara nilai Y aktual dan
nilai yang diprediksi oleh garis tersebut. Garis regresi juga dapat digunakan untuk
memprediksi nilai Y untuk nilai baru X yang nilai Y-nya tidak kita ketahui.
• Model regresi linier biasanya digunakan untuk prediksi sedangkan untuk klasifikasi
digunakan model regresi logistic. Dalam kedua kasus, kita dapat menerapkan prosedur
pemilihan subset yang secara algoritmik memilih subset variabel prediktor di antara set
yang lebih besar (lihat detail di bab yang relevan).
• Klasifikasi dan prediksi adalah dua bentuk
analisis data yang dapat digunakan untuk
mengekstrak model yang menggambarkan
kelas data penting atau untuk memprediksi
tren data di masa depan.
• Dalam klasifikasi terdapat 2 kemungkinan
yang bersifat ya dan tidak. Sebagai contoh,

Klasifikasi perusahaan kartu kredit


meminjamkan sebuah pinjaman kepada
ingin

nasabah, Riwayat dari nasabah tersebut


harus dianalisis yang terdiri dari
pendapatan, pengeluaran, tabungan dan
lainnya yang dapat mempengaruhi dalam
pengelompokan apakah nasabah tersebut
akan menjadi nasabah yang berpotensi
tidak membayar pinjaman maupun
sebaliknya [0=default,1=non-default].
Contoh Penerapan Klasifikasi
Contoh lainnya:

Terdapat 2 kelas klasifikasi terhadap pelanggan yaitu “low-risk” dan “high-risk”. Informasi mengenai
pelanggan yang mempengaruhi apakah pelanggan tersebut berada pada ketegori yang mana.

Ketika X = x , dan P(Y = 1 | X = x) = 0.8 , maka pelanggan memiliki 80% probabilitas masuk kedalam
kategori ”high-risk” dan 20% probabilitas masuk dalam kategori “low-risk”. Berdasarkan hasil
kasifikasi tersebut, dapat disimpulkan bahwa diberikan atau tidak diberikannya pinjam kepada
nasabah yang diketahui Ketika bank akan mendapatkan keuntungan atau kerugian dari keputusan
tersebut.
Contoh Pembelajaran:
No. Task Method
1 Face recognition Classification
Supervised learning
2 Spam email
Supervised learning Classification
3 Orang yang akan membeli rumah Association
kemungkinan membeli furniture baru Unsupervised
4 Pelanggan dikelompokkan berdasarkan learning
minat belanja Unsupervised
learning Clustering
5 Memprediksi harga rumah Regression
6 Pengajaran terhadap robot Supervised learning
Reinforcement
Learning
Data Mining vs Machine Learning

• Data mining mengacu pada penggalian pengetahuan dari sejumlah besar data, dan ini adalah proses
untuk menemukan berbagai jenis pola yang melekat dalam data dan yang akurat, baru, dan berguna.
Ini adalah proses berulang dan digunakan untuk mengungkap tren dan pola yang sebelumnya tidak
diketahui dalam sejumlah besar data untuk mendukung pengambilan keputusan.
• Data mining adalah bagian dari analisis bisnis yang serupa dengan penelitian eksperimental. Asal mula
data mining adalah database dan statistik. Dua komponen diperlukan untuk mengimplementasikan
teknik data mining: yang pertama adalah database dan yang kedua adalah pembelajaran mesin
(machine learning).
• Data mining membutuhkan keterlibatan manusia untuk membersihkan dan menyiapkan data serta
memahami polanya. Sementara dalam machine learning, upaya manusia dilibatkan hanya untuk
menentukan algoritme, setelah itu algoritme mengambil alih operasi.
Relasi Data Mining dan
Machine Learning

• Data mining merupakan pembelajaran yang


menggunakan berbagai macam Teknik yang
Sebagian tekniknya dipelajari dan ditemukan
dalam machine learning.

• Artificial intelligence merupakan istilah yang


sangat luas sedangkan machine learning adalah
sub bagian dari artificial intelligence dan deep
learning merupakan sub bagian dari machine
learning.
Data Mining VS Machine Learning
Perbandingan Data Mining Machine Learning
Meaning Melibatkan penggalian pengetahuan memperkenalkan algoritma baru dari data
yang berguna dari sejumlah data besar serta pengalaman masa lalu
History Dikenalkan pada tahun 1930, dimana Diperkenal pada tahun 1959
awalnya disebut sebagai penemuan
pengetahuan dalam database.

Responsibility Data mining digunakan untuk Machine learning mengajarkan computer


menemukan pola pada data yang ada. untuk mempelajari dan memahami
Dan itu dapat digunakan untuk atruan yang diberikan
menetapkan aturan.

Nature Adanya keterlibatan dan intervensi dari Pemogramannya otomatis, setelah


manusia. dirancang akan diimplementasikan sendiri
dan tidak ada atau sangat sedikit usaha
manusia yang diperlukan.

Sumber: Bhatia (2019)


Alhamdulillah

Anda mungkin juga menyukai