Teknik yang digunakan dalam data mining erat kaitannya dengan “penemuan”
(discovery) dan “pembelajaran” (learning) yang terbagi dalam dua metode
utama pembelajaran yaitu :
• Supervised Learning
• Unsupervised Learning
1. Supervised Learning
Supervised Learning adalah teknik yang paling banyak digunakan. Teknik ini sama
dengan “programming by example”. Teknik ini melibatkan fase pelatihan dimana
data pelatihan historis yang karakter–karakternya dipetakan ke hasil-hasil yang
telah diketahui diolah dalam algoritma data mining. Proses ini melatih algoritma
untuk mengenali variable–variable dan nilai–nilai kunci yang nantinya akan
digunakan sebagai dasar dalam membuat perkiraan–perkiraan ketika diberikan
data baru.
Contoh Supervised Learning
• Contoh Supervised Learning adalah ketika Anda memiliki sejumlah buku yang
sudah dilabeli dengan kategori tertentu. Misalnya, kategori buku novel seperti
Digital Fortress, Inferno, Deception Point. Kategori buku akademik, seperti
Pengantar Teknologi Informasi, R in Action, Rekayasa Perangkat Lunak. Kategori
biografi antara lain Anne Frank, Abraham Lincoln dan Mandela. Selanjutnya,
ketika Anda membeli sejumlah buku baru, maka Anda harus mengindentifikasi isi
dari buku tersebut, dan memasukannya dalam kategori. Ketika Anda membeli
buku Logika fuzzy, Anda pasti akan memasukan buku tersebut ke dalam buku
akademik.
2. Unsupervised Learning
Teknik pembelajaran ini tidak melibatkan fase pelatihan seperti yang terdapat
pada supervised learning. Teknik ini bergantung pada penggunaan algoritma yang
mendeteksi semua pola, seperti associations dan sequences, yang muncul dari
kriteria penting yang spesifik dalam data masukan. Pendekatan ini mengarah pada
pembuatan banyak aturan (rules) yang mengkarakterisasikan penemuan
associations, clusters, dan segments. Aturan–aturan ini kemudian dianalisis untuk
menemukan hal–hal yang penting
Contoh Unsupervised Learning
• Contoh Anggaplah Anda belum pernah membeli buku sama sekali, namun dalam satu hari,
Anda membeli banyak tumpukan buku dan ingin membaginya kedalam beberapa kategori
agar nantinya mudah dicari. Anda akan mengidentifikasi buku buku mana yang mirip.
Dalam hal ini, kita memilih pendekatan buku berdasarkan isinya. Misalnya anda memiliki
buku Twilight, Inferno, Harry Potter, Pengantar Teknologi Informasi, Sistem Pendukung
Keputusan, Rekayasa Perangkat Lunak, Anne Frank, Abraham Lincoln dan Mandela. Anda
akan mengklasifikasikan buku Pengantar Teknologi Informasi, R in Action, Rekayasa
Perangkat Lunak Anda ke dalam buku akademik karena keperluannya untuk kuliah. Untuk
melakukan hal itu Anda perlu algoritma yang mendukung untuk pengimplementasian dari
metode tersebut.
• Kesimpulannya dari penjelasan di supervised dan unsupervised learning
diatas adalah jika anda memiliki data data sebelumnya dan memiliki
variabel target yang akan diklasifikasikan, maka Anda dapat memakai
metode supervised learning. Jika Anda ingin membagi data — data tersebut
ke dalam beberapa kelompok maka Anda memakai metode unsupervised
learning.
Algoritma Supervised Learning
• Decision tree
• Nearest — Neighbor Classifier
• Naive Bayes Classifier
• Artificial Neural Network
• Support Vector Machine
• Fuzzy K-Nearest Neighbor
Algoritma Unsupervised Learning
• K-Means
• Hierarchical Clustering
• DBSCAN
• Fuzzy C-Means
• Self-Organizing Map
Deccision Tree
• Decision tree (pohon keputusan) adalah salah satu metode klasifikasi yang paling
populer, karena mudah untuk diinterpretasi oleh manusia. Decision tree adalah model
prediksi menggunakan struktur pohon atau struktur berhirarki.
• Pada hari ini, Senin 18 September 2022 saya mengikuti sebuah seminar,
namun karena dari pagi harinya saya belum sarapan dan perut terasa lapar
sedangkan waktu makan siang baru tersedia jam 12.30 maka dari itu saya
memutuskan akan ijin keluar terlebih dahulu untuk mencari makan diluar
tempat seminar. Namun sebagai konsekuensi dari keputusan yang saya ambil,
saya akan tertinggal materi dalam seminar tersebut.