Anda di halaman 1dari 12

Materi X

ASSOCIATION
Metode asosiasi termasuk salah satu metode dalam data mining yang banyak
dipergunakan saat ini. Sebagai contoh web e-commerce yang menggunakan metode
ini untuk membuat produk terkait. Selain itu di tempat perbelanjaan bagaimana
manajer penjualan dapat mengestimasi produk apa yang persediaannya perlu
ditingkatkan dan sebaliknya. Dalam metode ini terdapat beberapa teknik yang
disebut Association Rule dengan Algoritma Apriori.

Association Rule Mining adalah teknik data mining untuk menemukan aturan
asosiatif antara suatu kombinasi item. Contoh aturan asosiatif dari analisis
pembelian di suatu pasar swalayan adalah dapat diketahuinya berapa besar
kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Penting
tidaknya suatu aturan asosiasi dapat diketahui dengan dua parameter yaitu:

1. Support :
Suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu
item/itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah
suatu item/itemset layak untuk dicari confidence tersebut (misal, dari
keseluruhan transaksi yang ada, seberapa besar tingkat dominasi yang
menunjukkan item A dan B dibeli bersamaan).
2. Confidence :
Suatu ukuran yang menunjukkan hubungan antar 2 item secara conditional
(misal, seberapa sering item B dibeli jika orang membeli item A) ‘(Kusrini dan
Emha, 2009:150).

Algoritma Apriori termasuk jenis aturan asosiasi pada data mining salah
satunya adalah Algoritma Apriori

ALGORITMA APRIORI

• Algoritma apriori merupakan salah satu algoritma klasik data mining.


• Algoritma apriori digunakan agar komputer dapat mempelajari aturan
asosiasi, mencari pola hubungan antar satu atau lebih item dalam suatu
dataset.
• Algoritma apriori banyak digunakan pada data transaksi atau biasa disebut
market basket, misalnya sebuah swalayan memiliki market basket, dengan
adanya algoritma apriori, pemilik swalayan dapat mengetahui pola pembelian
seorang konsumen, jika seorang konsumen membeli item A , B, punya
kemungkinan 50% dia akan membeli item C, pola ini sangat signifikan dengan
adanya data transaksi selama ini
• Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan
assosiatif yang memenuhi syarat minimum untuk support (minimum support)
dan syarat minimum untuk confidence (minimum confidence).
• Tetapi di lain pihak Apriori memiliki kelemahan karena harus melakukan scan
database setiap kali iterasi, sehingga waktu yang diperlukan bertambah
dengan makin banyak iterasi. Masalah ini yang dipecahkan oleh algoritma-
algoritma baru seperti FP-growth
• Penerapan asosiasi :peletakan posisi barang di wal-mart Amerika.
Amazon.com memberikan rekomendasi buku, Google mengembangkan auto
complete yaitu jika user mengetik suatu kata maka akan muncul daftar kata
berikutnya

Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi
dasar dari berbagai teknik data mining lainnya. Secara khusus, salah satu tahap
analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan
algoritma yang efisien adalah analisis pola frekuensi tinggi (frequent pattern
mining).

Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter,
yaitu support dan confidence. Support (nilai penunjang) adalah persentase
kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian)
adalah kuatnya hubungan antar item dalam aturan asosiasi.
Aturan asosiasi biasanya dinyatakan dalam bentuk:
{roti, mentega} → {susu} (support = 40%, confidence = 50%)

Aturan tersebut berarti “50% dari transaksi di database yang memuat item roti
dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi
yang ada di database memuat ketiga item tersebut.”

Dapat juga diartikan: “Seorang konsumen yang membeli roti dan mentega punya
kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena
mewakili 40% dari catatan transaksi selama ini.”

Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan


asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan
syarat minimum untuk confidence (minimum confidence). (Kusrini dan Emha,
2009:149)

Cara Kerja Algoritma Apriori

1. Tentukan minimum support dan minimum confidence.


2. Iterasi 1 : hitung item-item dari support(transaksi yang memuat seluruh item)
dengan men-scan database untuk 1-itemset, setelah 1-itemset didapatkan, dari 1-
itemset apakah diatas minimum support, apabila telah memenuhi minimum support,
1-itemset tersebut akan menjadi pola frequent tinggi.
3. Iterasi 2 : untuk mendapatkan 2-itemset, harus dilakukan kombinasi dari k-
itemset sebelumnya, kemudian scan database lagi untuk hitung item-item yang
memuat support. itemset yang memenuhi minimum support akan dipilih sebagai
pola frequent tinggi dari kandidat.
4. Tetapkan nilai k-itemset dari support yang telah memenuhi minimum support dari
k-itemset.
5. Lakukan proses untuk iterasi selanjutnya hingga tidak ada lagi k- itemset yang
memenuhi minimum support.

Formula Pencarian Nilai Support & Confidence

Nilai support sebuah item diperoleh dengan rumus berikut:

𝐣𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀


Support (A) = 𝐓𝐨𝐭𝐚𝐥 𝐓𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢

Sedangkan nilai support dari 2 item diperoleh dari rumus berikut:

𝐣𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀 𝐝𝐚𝐧 𝐁


Support ( AUB)= 𝐓𝐨𝐭𝐚𝐥 𝐓𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢

Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang
memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan
assosiatif A -> B. Nilai confidence dari aturan A -> B diperoleh dari rumus berikut:

𝐣𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀 𝐝𝐚𝐧 𝐁


Confidence = P(B|A) = 𝐉𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀

Langkah Apriori

1. Menentukan besarnya minimum support dan minimum confidence


2. Tentukan Jumlah transaksi tiap itemset (support)
3. Pangkas itemset sesuai nilai minimum support masuk ke daftar frequensi
1-itemset
4. Buat daftar calon frequent 2 itemset sesuai data point 2
5. Jumlah calon frequent menggunakan rumus kombinasi nCr=n!/r!(n-r)!
6. Pangkas itemset sesuai nilai minimum support masuk ke daftar frequensi
2-itemset
7. Lalu hitung nilai Confidence nya dengan rumus :

𝐣𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀 𝐝𝐚𝐧 𝐁


Confidence = P(B|A) = 𝐉𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀
Contoh Kasus 1: menentukan asosiasi data transaksi penjualan toko xyz dengan nilai
minimum support (MS) = 30% dan nilai minimum confidence (MC) = 50%
(sumber: Andre Valerian. Implementasi algoritma apriori untuk prediksi stok peralatan tulis pada took xyz..Jitter. ISSN :2407-3911)

Langkah 1 : tentukan nilai support masing-masing item


Langkah 2 : Pilih transaksi 1-itemset yang memenuhi nilai support =30%

𝐣𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀


Support (A) =
𝐓𝐨𝐭𝐚𝐥 𝐓𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢

Langkah 3 : Kombinasikan itemset dengan nilai support diatas atau sama dengan 30%, berarti
pensil dihapus karena nilai supportnya hanya 25%. Rumus supportnya

𝐣𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀 𝐝𝐚𝐧 𝐁


Support ( AUB)= 𝐓𝐨𝐭𝐚𝐥 𝐓𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢

Dari daftar frequent 1-itemset kemudian dilakukan proses pencarian pola 2 item yang
dibuat menjadi daftar calon frequent 2-itemset. Jumlah anggota daftar calon frequent
menggunakan rumus kombinasi nCr=n!/r!(n-r)!

No Itemset Jumlah Support


1 Buku,Pulpen 13 65%
2 Buku,Kertas 4 20%
3 Buku, Spidol 3 15%
4 Buku, Type-ex 7 35%
5 Pulpen,Kertas 5 25%
6 Pulpen, Spidol 5 25%
7 Pulpen,Type-ex 7 35%
8 Kertas, Spidol 2 10%
9 Kertas, Type-ex 2 10%
10 Spidol, Type-ex 2 10%

Langkah 4 : Hilangkan 2-itemset yang tidak memenuhi nilai minimum support =30%, diperoleh

No Itemset Jumlah Support


1 Buku,Pulpen 13 65%
4 Buku, Type-ex 7 35%
7 Pulpen,Type-ex 7 35%
Langkah 5 : Kombinasikan 3-itemset

No Itemset Jumlah Support


1 Buku,Pulpen,Type-ex 5 0,25

Langkah 6 Hitung nilai confidence

𝐣𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀 𝐝𝐚𝐧 𝐁


Confidence = P(B|A) = 𝐉𝐮𝐦𝐥𝐚𝐡 𝐭𝐫𝐚𝐧𝐬𝐚𝐤𝐬𝐢 𝐦𝐞𝐧𝐠𝐚𝐧𝐝𝐮𝐧𝐠 𝐀

Karena nilai support 3-itemset dibawah 30%, maka yang dihitung adalah
assosiasi 2-itemset
Aturan Support Confidence
Jika membeli Buku maka membeli pulpen 65% 87%
Jika membeli Buku maka membeli type-ex 35% 47%
Jika membeli Pulpen maka membeli Type-ex 35% 41%

Karena Nilai minimal support = 30% dan nilai minimum confidence=50%, maka
data terpilih adalah sbb :

Aturannya Support Confidence


Jika membeli Buku maka membeli pulpen 65% 87%

Assosiasi dengan Rapidminer


Contoh 2 : Menentukan asosiasi penjualan barang dengan Minimum support=3,
Minimum Confidence= 60%

Misalnya terdapat tabel transaksi sbb :

Tabel 1

Untuk mempermudah kita singkat nama-nama barang diatas sbb :

Tabel 2

Langkah ke-1 : Hitung banyaknya transaksi untuk setiap item. Hati-hati, untuk item O
(Onion) dibeli sebanyak 4 item, namun pembelian O hanya ada 3 transaksi.

Tabel 3
• Langkah ke-2 : Berdasarkan golden rule yang telah disebutkan di atas, saring data pada
Tabel 3, hanya memilih item yang memiliki transaksi minimal sebanyak 3 transaksi. Item
yang banyaknya transaksi kurang dari 3, dibuang. Hasilnya dapat dilihat di Tabel 4 berikut
:

Tabel 4

Langkah ke-3 : Buat pasangan item dimulai dari item pertama, yaitu MO, MK, ME, MY.
Kemudian dilanjutkan dengan item kedua. Misalnya OK, OE, OY. Perhatikan, OM tidak
dibuat karena OM = MO (pasangan yang dibuat dari item pertama).

Tabel 5

Langkah ke-4 : Hitung berapa kali suatu pasangan item dibeli bersamaan. Contohnya
pasangan MO dibeli secara bersamaan dalam itemset {M, O, N, K, E, Y}. Pasangan MK
dibeli bersamaan sebanyak 3 kali yaitu di dalam {M,O,N,K,E,Y}, {M,A,K,E}, dan {M,U,C, K,
Y}. Hasilnya dapat dilihat pada Tabel berikut :

Tabel 6
Langkah ke-5 : Gunakan golden rule, hapus semua pasangan item yang banyaknya
transaksi kurang dari tiga. Hasilnya adalah pada berikut :

Tabel 7

Langkah ke-6 : Buat pasangan tiga item dengan aturan menggunakan pasangan item pada
Tabel 7 yang memiliki huruf awal yang sama yaitu :

• OK dan OE, menjadi OKE


• KE dan KY, menjadi KEY
• Kemudian hitung ada beberapa banyaknya transaksi dari pasangan tiga item
berdasarkan Tabel 2. Hasilnya dapat dilihat pada Tabel 8.

Tabel 8

Langkah ke-7 : Gunakan lagi golden rule, dengan membuang pasangan tiga item yang
banyaknya transaksi kurang dari 3. Hasilnya tinggal OKE karena KEY hanya dibeli
bersamaan dua kali.

Kesimpulan : Tiga item yang sering dibeli bersamaan adalah O, K, dan E.

Nilai Confidence
Untuk mengetahui tingkat keyakinan (confidence), frequent itemset (yaitu {O, K, E})
dapat digunakan untuk mencari aturan-aturan asosiasi antar item di dalam frequent
itemset tersebut. Caranya adalah :

1. Itemset dibuatkan himpunan bagiannya. Hasilnya seperti pada contoh di bawah :


• {O}
• {K}
• {E}
• {O, K}
• {K, E}
• {O, E}
2. Cari asosiasi pada semua himpunan bagian yang telah dibuat, misal : {O} => {K, E}
artinya : jika O dibeli, bagaimana kemungkinan K dan E akan dibeli pada transaksi
yang sama. O dibeli pada 3 transaksi dan di dalam 3 transaksi tersebut, K dan E
juga dibeli. Maka keyakinannya adalah :

• {O} => {K, E} : keyakinannya adalah 3/3 x 100% = 100%.


• {K} => {O,E} : keyakinannya adalah 3/5 x 100% = 60%
• {E} => {O,K} : keyakinannya adalah 3/3 x 100% = 100%
• {K,E} => {O} : keyakinannya adalah 3/4 x 100% = 75%
• {O,E} => {K} : keyakinannya adalah 3/3 x 100% = 100%
• {O,K} => {E} : keyakinannya adalah 3/3 x 100% = 100%

Latihan : Tentukan rule asosiasi yang terbentuk, jika minimum support=40% dan minimum
confidence 80%

No Transaksi
1 roti,mentega,susu
2 susu
3 kopi,keju
4 roti,mentega,susu,keju
5 susu,keju
6 selai,kopi,susu
7 roti,mentega,kopi,susu,keju
8 selai,mentega,kopi,keju
9 susu,keju
10 roti,mentega,kopi,keju
11 selai,roti,susu
12 roti,susu,keju
13 roti,mentega
14 mentega,susu,keju
15 susu
16 roti,mentega,susu,keju
17 selai,susu
18 selai,roti,mentega,kopi,keju
19 selai,roti,susu
20 selai,roti,mentega,keju

Anda mungkin juga menyukai