Machine
kriteria kinerja menggunakan data contoh atau
penelitian terdahulu (past experience).
• Metode pembelajaran dalam machine learning
Aplikasi-aplikasi 5.
6.
Layanan media social
Spam email dan pemfilteran malware
• Tidak sampai disitu, semakin bertambahnya data yang ditambahkan pada dataset maka
gafiknya terlihat berubah seperti yang ditunjukkan pada gambar diatas. Dibandingkan dengan
garis lurus yang telah digambarkan sebelumnya, polynomial yang kedua lebih cocok untuk
data tersebut. Dengan menggunakan polynomial yang kedua, analis mendapatkan prediksi
yang lebih baik dan tentunya penjual juga mengharapkan harga mendekati 20 lakh rupee
seperti yang ditunjukkan pada grafik diatas.
• Pembelajaran tanpa pengawasan atau biasanya
disebut unsupervised learning merupakan metode
yang digunakan jika tidak ada variabel hasil untuk
diprediksi atau diklasifikasikan. Oleh karena itu, tidak
ada "pembelajaran" dari kasus-kasus di mana variabel
hasil seperti itu diketahui. Association rules, metode
pengurangan dimensi, dan teknik pengelompokan
merupakan metode unsupervised learning.
Learning
disediakan sebelumnya oleh supervisor. Sedangkan di
unsupervised learning, tidak ada supervisor yang
mana hanya input yang dimiliki. Hal tersebut
bertujuan untuk keteraturan dalam input data.
• Terdapat berbagai macam input yang mebuat pola
tertentu lebih sering muncul daripada yang lain,
dengan menggunakan unsupervised learning,
pengolah dapat melihat apa yang umumnya terjadi
dan tidak. Dalam statistik, ini disebut estimasi
kepadatan (density estimation).
https://www.uc.ac.id/ict/perbedaan-supervised-learning-and-unsupervised-learning/
Teknik-teknik Unsupervised Learning
• Clustering (pengelompokan): Masalah pengelompokan adalah saat
Anda ingin menemukan pengelompokan yang melekat dalam data,
seperti mengelompokkan pelanggan menurut perilaku pembelian.
contoh: random forest, dan support vector machines.
• Association (asosiasi) : Masalah pembelajaran aturan asosiasi adalah
saat Anda ingin menemukan aturan yang menjelaskan sebagian besar
data Anda, seperti orang yang membeli X juga cenderung membeli Y.
contoh: k-means dan apriori algorithm.
Contoh
Unsupervised
Learning
•Gambar di atas merupakan pengelompokan data pelanggan pada 3 lokasi dalam kota yang sama
Contoh Penerapan Unsupervised Learning
Learning
tertentu selama jangka waktu yang juga ditentukan.
• Lingkungan: mendefinisikan dunia luar tempat agen
berinteraksi.
• Tindakan: mendefinisikan tugas yang harus dilakukan
oleh agen.
Dengan demikian, reinforcement learning
memungkinkan mesin dan agen perangkat lunak untuk
secara otomatis menentukan perilaku ideal dalam
konteks tertentu, untuk memaksimalkan kinerjanya.
Implementasi Reinforcement Learning
Contoh sederhana yang dapat membantu menggambarkan cara
kerja RL berupa skenario mengajarkan trik baru kepada seekor
kucing
• Karena kucing tidak mengerti bahasa bahasa manusia, kita
tidak dapat memberi tahu kucing secara langsung apa yang
harus dilakukan. Sebaliknya, kita akan mengikuti strategi yang
berbeda.
• Kita meniru situasi, dan kucing mencoba merespons dengan
berbagai cara. Jika respon kucing sesuai yang diinginkan, kita
akan memberikan ikannya.
• Setiap kali kucing dihadapkan pada situasi yang sama, kucing
tersebut melakukan tindakan serupa dengan lebih antusias Kucing adalah agen yang berada pada environment (lingkungan). Dalam hal
dengan harapan mendapatkan lebih banyak reward (makanan). ini, environment itu adalah rumah. Contoh state/action (Tindakan) adalah
kucing duduk, dan kita menggunakan kata khusus untuk kucing agar berjalan.
• Hal tersebut mengajarkan bahwa kucing mendapat “apa yang Agent kita bereaksi dengan melakukan transisi tindakan dari satu “state” ke
“state” lainnya. Misalnya, kucing berubah dari duduk menjadi berjalan.
harus dilakukan” dari pengalaman positif dan kucing juga Reaksi agent adalah suatu tindakan, dan policy adalah metode pemilihan
tindakan yang diberikan suatu state dengan harapan hasil yang lebih baik.
belajar apa yang tidak boleh dilakukan saat dihadapkan pada Setelah transisi, kucing mungkin mendapatkan reward atau penalti sebagai
pengalaman negatif. imbalan.
Regression
• Analisis regresi adalah metodologi statistik yang paling sering digunakan untuk prediksi
numerik, meskipun metode lain juga ada. Regresi juga mencakup identifikasi tren
distribusi berdasarkan data yang tersedia.
• Regresi linier sederhana adalah contoh dari algoritma supervised learning.
• Variabel Y adalah variabel hasil (yang diketahui) dan variabel X adalah variabel prediktor.
• Garis regresi dibuat untuk meminimalkan jumlah deviasi kuadrat antara nilai Y aktual dan
nilai yang diprediksi oleh garis tersebut. Garis regresi juga dapat digunakan untuk
memprediksi nilai Y untuk nilai baru X yang nilai Y-nya tidak kita ketahui.
• Model regresi linier biasanya digunakan untuk prediksi sedangkan untuk klasifikasi
digunakan model regresi logistic. Dalam kedua kasus, kita dapat menerapkan prosedur
pemilihan subset yang secara algoritmik memilih subset variabel prediktor di antara set
yang lebih besar (lihat detail di bab yang relevan).
• Klasifikasi dan prediksi adalah dua bentuk
analisis data yang dapat digunakan untuk
mengekstrak model yang menggambarkan
kelas data penting atau untuk memprediksi
tren data di masa depan.
• Dalam klasifikasi terdapat 2 kemungkinan
yang bersifat ya dan tidak. Sebagai contoh,
Terdapat 2 kelas klasifikasi terhadap pelanggan yaitu “low-risk” dan “high-risk”. Informasi mengenai
pelanggan yang mempengaruhi apakah pelanggan tersebut berada pada ketegori yang mana.
Ketika X = x , dan P(Y = 1 | X = x) = 0.8 , maka pelanggan memiliki 80% probabilitas masuk kedalam
kategori ”high-risk” dan 20% probabilitas masuk dalam kategori “low-risk”. Berdasarkan hasil
kasifikasi tersebut, dapat disimpulkan bahwa diberikan atau tidak diberikannya pinjam kepada
nasabah yang diketahui Ketika bank akan mendapatkan keuntungan atau kerugian dari keputusan
tersebut.
Contoh Pembelajaran:
No. Task Method
1 Face recognition Classification
Supervised learning
2 Spam email
Supervised learning Classification
3 Orang yang akan membeli rumah Association
kemungkinan membeli furniture baru Unsupervised
4 Pelanggan dikelompokkan berdasarkan learning
minat belanja Unsupervised
learning Clustering
5 Memprediksi harga rumah Regression
6 Pengajaran terhadap robot Supervised learning
Reinforcement
Learning
Data Mining vs Machine Learning
• Data mining mengacu pada penggalian pengetahuan dari sejumlah besar data, dan ini adalah proses
untuk menemukan berbagai jenis pola yang melekat dalam data dan yang akurat, baru, dan berguna.
Ini adalah proses berulang dan digunakan untuk mengungkap tren dan pola yang sebelumnya tidak
diketahui dalam sejumlah besar data untuk mendukung pengambilan keputusan.
• Data mining adalah bagian dari analisis bisnis yang serupa dengan penelitian eksperimental. Asal mula
data mining adalah database dan statistik. Dua komponen diperlukan untuk mengimplementasikan
teknik data mining: yang pertama adalah database dan yang kedua adalah pembelajaran mesin
(machine learning).
• Data mining membutuhkan keterlibatan manusia untuk membersihkan dan menyiapkan data serta
memahami polanya. Sementara dalam machine learning, upaya manusia dilibatkan hanya untuk
menentukan algoritme, setelah itu algoritme mengambil alih operasi.
Relasi Data Mining dan
Machine Learning