Yang artinya :
50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu.
40% dari seluruh transaksi yang ada di database memuat ketiga item itu.“
Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga
membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi.
Menambang Aturan Asosiasi
Berdasarkan data set transaki, akan dicari aturan yang dapat memprediksi
kejadian bersama sebuah item, berdasarkan kejadian bersama dari item-item
lainnya dalam transaksi
Market-Basket transactions Contoh Aturan Asosiasi
TID Items {Diaper} {Bir},
1 Roti, Susu {Susu, Roti} {Telur, Coke}
{Bir, Roti} {Susu}
2 Roti, Diaper, Bir, Telur
3 Susu, Diaper, Bir, Coke Tanda implikasi di atas berarti kejadian bersama,
4 Roti, Susu, Diaper, Bir bukan sebab akibat!
Support (S), Perbandingan terjadinya sebuah itemset terhadap jumlah seluruh itemset dalam dataset
Contoh
TID Items
{Milk, Diaper} Beer
𝜎(𝑀𝑖𝑙𝑘, 𝐷𝑖𝑎𝑝𝑒𝑟, 𝐵𝑒𝑒𝑟 ) 2 1 Bread, Milk
𝑆= = = 0.4
|𝑇| 5 2 Bread, Diaper, Beer, Eggs
3 Milk, Diaper, Beer, Coke
𝜎(𝑀𝑖𝑙𝑘, 𝐷𝑖𝑎𝑝𝑒𝑟, 𝐵𝑒𝑒𝑟 ) 2
𝐶= = = 0.67 4 Bread, Milk, Diaper, Beer
𝜎(𝑀𝑖𝑙𝑘, 𝐷𝑖𝑎𝑝𝑒𝑟) 3
5 Bread, Milk, Diaper, Coke
Ilustrasi Prinsip Apriori
Item Count Items (1-itemsets)
Bread 4 Itemset Count Pairs (2-itemsets)
Coke 2 {Bread, Milk} 3 (No need to generate candidates
Milk 4 {Bread, Beer} 2 involving Coke or Eggs)
Beer 3 {Bread, Diaper} 3
Diaper 4 {Milk, Beer} 2
Eggs 1 {Milk, Diaper} 3
{Beer, Diaper} 3
Minimum Support = 3
Triplets (3-itemsets)
Itemset Count
{Bread, Milk, Diaper} 3
Contoh :
1. Terdapat transaksi belanja
*Sebuah itemset menunjukkan itemset yg memiliki frekuensi kemunculan lebih dari nilai minimum yg telah ditentukan (Φ).
Dari data pada kombinasi 2-itemset, Misalkan kita tentukan Ф = 2
F2 = {{teh, gula}, {gula, kopi}, {gula, susu}, {gula, roti}, {kopi, susu}, {susu, roti}}
Kombinasi 3-itemset
• 3-itemset dibentuk dari F2
Kombinasi Jumlah
• Kombinasi dari itemset F2 digabungkan menjadi 3-itemset
teh, gula, kopi 1 • Itemset dari F2 yg dapat digabungkan adalah itemset yg
memiliki kesamaan dalam k-1
teh, gula, susu 1
Dengan demikian F3 = {{gula, susu, kopi}}, karena hanya
gula, susu, kopi 2 kombinasi inilah yang memiliki frekuensi kemunculan >= Ф
gula, susu, roti 0
Aturan Confidence
Jika membeli teh, maka akan membeli gula 5/5 100%
jika membeli gula, maka akan membeli teh 5/8 63%
jika membeli gula, maka akan membeli kopi 3/8 38%
jika membeli kopi, maka akan membeli gula 3/4 75%
jika membeli gula, maka akan membeli susu 4/8 50%
jika membeli susu, maka akan membeli gula 4/6 67%
jika membeli gula, maka akan membeli roti 2/8 25%
jika membeli roti, maka akan membeli gula 2/4 50%
jika membeli kopi, maka akan membeli susu 3/4 75%
jika membeli susu, maka akan membeli kopi 3/6 50%
jika membeli susu, maka akan membeli roti 3/6 50%
jika membeli roti, maka akan membeli susu 3/4 75%
5. Pembentukan Aturan Asosiasi dari F3
Aturan Confidence
jika membeli gula dan susu, maka akan membeli kopi 2/4 50%
jika membeli gula dan kopi, maka akan membeli susu 2/3 67%
jika membeli kopi dan susu, maka akan membeli gula 2/3 67%
Misalkan ditetapkan nilai confidence minimal adalah 60%, maka aturan yang bisa
terbentuk adalah aturan dua berikut:
1. jika membeli gula dan kopi, maka akan membeli susu
2. jika membeli kopi dan susu, maka akan membeli gula
6. Aturan Asosiasi Final