METHOD
Penerapan Metode Asosiasi untuk mengetahui Pola
Belanja Konsumen dengan menggunakan Algoritma
Apriori
DATA MINING IS ?
Secara sederhana , data mining adalah penambangan atau penemuan informasi
baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat
besar (Davies, 2004). Data mining adalah proses yang mempekerjakan satu atau
lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan
mengekstraksi pengetahuan (knowledge) secara otomatis (Hermawati, 2013)
Hal penting yang terkait dengan data mining (Kusrini, 2009) adalah :
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada
3. Tujuan data mining adalah untuk mendapatkan hubungan atau pola yang mungkin
memberikan indikasi yang bermanfaat
DATA MINING METHOD
Rujukan Buku : DATA MINING KONSEP DAN TEKNIK V.2 (Q. W. Han)
Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan assosiasi antara
kombinasi suatu item.
(Fungsi Association Rules seringkali disebut dengan "market basket analysis",
yang digunakan untuk menemukan relasi atau korelasi diantara himpunan item)
Association Rules
Contoh aturan asosiatif dari analisa pembelian disuatu pasar swalayan
adalah dapat diketahuinya berapa besar kemungkinan seorang pelanggan
membeli roti bersamaan dengan roti.
Salah satu algoritma yang biasa digunakan dalam metode asosiasi adalah
algoritma apriori.
4
ASSOCIATION METHOD ALGORITHM
Rujukan Buku : DATA MINING KONSEP DAN TEKNIK V.2 (Q. W. Han)
Apriori Algorithm
Istilah-istilah
-- itemset adalah sekumpulan item-item dalam sebuah keranjang
-- k-itemset adalah itemset yang berisikan k item, misalnya roti, mentega, telur adalah 3-
itemset
-- frequent support adalah k-itemset yang dimiliki oleh support di mana frequent k-itemset yang
di miliki di atas minimum support atau memenuhi minimum support
-- candidat itemset adalah frequent itemset yang dikombinasikan dari k-itemset sebelumnya
Sebuah supermarket memiliki data transaksi seperti yang terdapat pada tabel berikut :
4 Roti, Mentega
1 1 1 0 0 0 0 1
2 1 1 1 1 0 0 0
3 0 0 1 1 1 0 0
4 1 1 0 0 0 0 0
5 1 1 1 1 0 1 0
jumlah 4 4 3 3 1 1 1
9 45%
Hasil support dari itemset 2 yaitu :
Hasil pola frequent dari support dari setiap item yaitu : Itemset Support Count Support
Roti,Mentega 4 80%
Itemset Support Support
Count Roti, Telur 2 40%
Roti 4 80% Roti,Susu 2 40%
Mentega 4 80% Mentega,Telur 2 40%
Telur 3 60%
Mentega,Susu 2 40%
Susu 3 60%
Telur,Susu 3 60%
Buncis 1 20%
Kecap 1 20%
Pena 1 20% Masing –masing dari Kombinasi itemset 2 pada table diatas
memenuhi standar minimum support yakni lebih besar sama
Item yang memenuhi standar minimum support sebagai pola
dengan 2
frequent tinggi yaitu pada itemset Roti, Mentega, Telur dan
susu.
Langkah 3 Langkah 4
c.) Itemset 3 ( Iterasi 3) d.) Itemset 4 ( Iterasi 4)
Proses pembentukan itemset atau C3 dengan jumlah Proses pembentukan itemset atau C3 dengan jumlah
minimum support sebagai pola frekuensi tinggi = 2 diselesaikan minimum support sebagai pola frekuensi tinggi = 2 diselesaikan
dengan rumus : dengan rumus :
Hasilnya :
Kombinasi itemset 3 pada table memenuhi minimum Tidak ada lagi kombinasi yang bisa dibentuk untuk k-itemset
support,sehingga itemset diatas akan menjadi acuan untuk berikutnya, proses berhenti, pola frequent tinggi yang
itemset selanjutnya (itemset pola frekuensi tinggi ) ditemukan adalah “ Roti, Mentega, Telur dan Susu”.
Langkah 5
Pembentukan aturan asosiasi Hasilnya :
Setelah semua pola frekuensi tinggi ditemukan, kemudian
Itemset Support {AUB} Support{ Confidence
cari aturan asosiasi yang memenuhi syarat minimum nilai A}
confidence . {Susu} -> {Roti,Mentega,Telur} 40% 60% 66%
Nilai confidence dari aturan A B diperoleh : {Roti} -> {Susu,Mentega,Telur} 40% 80% 50%
{Mentega} -> {Roti,Susu,Telur} 40% 80% 50%
{Telur} -> {Susu,Mentega,Roti} 40% 60% 66%
{Telur,Roti} -> {Susu, Mentega} 40% 40% 100%
{Mentega,Roti} -> {Susu, Telur} 60% 80% 66%
{Mentega,Telur} -> {Susu, Roti} 40% 40% 100%
{Susu,Roti} -> {Mentega, Telur} 40% 40% 100%
{Susu,Telur} -> {Mentega, Roti} 80% 60% 66%
{Mentega,Susu} -> {Telur} 40% 40% 100%
{Mentega,Roti} -> {Telur} 40% 80% 50%
{Mentega,Roti} -> {Susu} 60% 80% 50%
{Mentega,Telur} -> {Susu} 60% 40% 66%
Dari table disamping dapat dilihat bahwa semua itemset {Susu,Telur} -> {Mentega} 80% 60% 66%
memenuhi nilai minimum confidence maka dapat {Susu,Roti} -> {Mentega} 80% 40% 50%
disimpulkan bahwa itemset yang paling sering dibeli oleh {Susu} -> {Mentega} 80% 60% 66%
konsumen adalah “ Roti, Mentega, Susu dan Telur “. {Roti} -> {Mentega} 80% 80% 100%
{Telur} -> {Mentega} 80% 60% 66%
{Roti} -> {Susu} 60% 80% 50%
{Telur} -> {Susu} 60% 60% 100%
{Roti} -> {Telur} 60% 80% 50%
Perbandingan Menggunakan
Aplikasi WEKA
Hasil perhitungan menggunakan apliksi WEKA