ASSOCIATION
Metode asosiasi termasuk salah satu metode dalam data mining yang banyak
dipergunakan saat ini. Sebagai contoh web e-commerce yang menggunakan metode
ini untuk membuat produk terkait. Selain itu di tempat perbelanjaan bagaimana
manajer penjualan dapat mengestimasi produk apa yang persediaannya perlu
ditingkatkan dan sebaliknya. Dalam metode ini terdapat beberapa teknik yang
disebut Association Rule dengan Algoritma Apriori.
Association Rule Mining adalah teknik data mining untuk menemukan aturan
asosiatif antara suatu kombinasi item. Contoh aturan asosiatif dari analisis
pembelian di suatu pasar swalayan adalah dapat diketahuinya berapa besar
kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Penting
tidaknya suatu aturan asosiasi dapat diketahui dengan dua parameter yaitu:
1. Support :
Suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu
item/itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah
suatu item/itemset layak untuk dicari confidence tersebut (misal, dari
keseluruhan transaksi yang ada, seberapa besar tingkat dominasi yang
menunjukkan item A dan B dibeli bersamaan).
2. Confidence :
Suatu ukuran yang menunjukkan hubungan antar 2 item secara conditional
(misal, seberapa sering item B dibeli jika orang membeli item A) ‘(Kusrini dan
Emha, 2009:150).
Algoritma Apriori termasuk jenis aturan asosiasi pada data mining salah
satunya adalah Algoritma Apriori
ALGORITMA APRIORI
Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi
dasar dari berbagai teknik data mining lainnya. Secara khusus, salah satu tahap
analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan
algoritma yang efisien adalah analisis pola frekuensi tinggi (frequent pattern
mining).
Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter,
yaitu support dan confidence. Support (nilai penunjang) adalah persentase
kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian)
adalah kuatnya hubungan antar item dalam aturan asosiasi.
Aturan asosiasi biasanya dinyatakan dalam bentuk:
{roti, mentega} → {susu} (support = 40%, confidence = 50%)
Aturan tersebut berarti “50% dari transaksi di database yang memuat item roti
dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi
yang ada di database memuat ketiga item tersebut.”
Dapat juga diartikan: “Seorang konsumen yang membeli roti dan mentega punya
kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena
mewakili 40% dari catatan transaksi selama ini.”
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang
memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan
assosiatif A -> B. Nilai confidence dari aturan A -> B diperoleh dari rumus berikut:
Langkah Apriori
Langkah 3 : Kombinasikan itemset dengan nilai support diatas atau sama dengan 30%, berarti
pensil dihapus karena nilai supportnya hanya 25%. Rumus supportnya
Dari daftar frequent 1-itemset kemudian dilakukan proses pencarian pola 2 item yang
dibuat menjadi daftar calon frequent 2-itemset. Jumlah anggota daftar calon frequent
menggunakan rumus kombinasi nCr=n!/r!(n-r)!
Langkah 4 : Hilangkan 2-itemset yang tidak memenuhi nilai minimum support =30%, diperoleh
Karena nilai support 3-itemset dibawah 30%, maka yang dihitung adalah
assosiasi 2-itemset
Aturan Support Confidence
Jika membeli Buku maka membeli pulpen 65% 87%
Jika membeli Buku maka membeli type-ex 35% 47%
Jika membeli Pulpen maka membeli Type-ex 35% 41%
Karena Nilai minimal support = 30% dan nilai minimum confidence=50%, maka
data terpilih adalah sbb :
Tabel 1
Tabel 2
Langkah ke-1 : Hitung banyaknya transaksi untuk setiap item. Hati-hati, untuk item O
(Onion) dibeli sebanyak 4 item, namun pembelian O hanya ada 3 transaksi.
Tabel 3
• Langkah ke-2 : Berdasarkan golden rule yang telah disebutkan di atas, saring data pada
Tabel 3, hanya memilih item yang memiliki transaksi minimal sebanyak 3 transaksi. Item
yang banyaknya transaksi kurang dari 3, dibuang. Hasilnya dapat dilihat di Tabel 4 berikut
:
Tabel 4
Langkah ke-3 : Buat pasangan item dimulai dari item pertama, yaitu MO, MK, ME, MY.
Kemudian dilanjutkan dengan item kedua. Misalnya OK, OE, OY. Perhatikan, OM tidak
dibuat karena OM = MO (pasangan yang dibuat dari item pertama).
Tabel 5
Langkah ke-4 : Hitung berapa kali suatu pasangan item dibeli bersamaan. Contohnya
pasangan MO dibeli secara bersamaan dalam itemset {M, O, N, K, E, Y}. Pasangan MK
dibeli bersamaan sebanyak 3 kali yaitu di dalam {M,O,N,K,E,Y}, {M,A,K,E}, dan {M,U,C, K,
Y}. Hasilnya dapat dilihat pada Tabel berikut :
Tabel 6
Langkah ke-5 : Gunakan golden rule, hapus semua pasangan item yang banyaknya
transaksi kurang dari tiga. Hasilnya adalah pada berikut :
Tabel 7
Langkah ke-6 : Buat pasangan tiga item dengan aturan menggunakan pasangan item pada
Tabel 7 yang memiliki huruf awal yang sama yaitu :
Tabel 8
Langkah ke-7 : Gunakan lagi golden rule, dengan membuang pasangan tiga item yang
banyaknya transaksi kurang dari 3. Hasilnya tinggal OKE karena KEY hanya dibeli
bersamaan dua kali.
Nilai Confidence
Untuk mengetahui tingkat keyakinan (confidence), frequent itemset (yaitu {O, K, E})
dapat digunakan untuk mencari aturan-aturan asosiasi antar item di dalam frequent
itemset tersebut. Caranya adalah :
Latihan : Tentukan rule asosiasi yang terbentuk, jika minimum support=40% dan minimum
confidence 80%
No Transaksi
1 roti,mentega,susu
2 susu
3 kopi,keju
4 roti,mentega,susu,keju
5 susu,keju
6 selai,kopi,susu
7 roti,mentega,kopi,susu,keju
8 selai,mentega,kopi,keju
9 susu,keju
10 roti,mentega,kopi,keju
11 selai,roti,susu
12 roti,susu,keju
13 roti,mentega
14 mentega,susu,keju
15 susu
16 roti,mentega,susu,keju
17 selai,susu
18 selai,roti,mentega,kopi,keju
19 selai,roti,susu
20 selai,roti,mentega,keju