Anda di halaman 1dari 23

Data Mining

MATERI 2 – ATURAN ASOSIASI (ASSOSIATION RULE)


Analisis Asosiasi
Adalah sebuah metodologi untuk mencari relasi
istimewa/menarik yang tersembunyi dalam himpunan data
(data set) yang besar.
Relasi yang tersembunyi ini dapat direpresentasikan dalam
bentuk aturan asosiasi (association rules) atau himpunan
barang yang seringkali muncul (frequent itemset)
Aturan Asosiasi
• Teknik data mining untuk menemukan aturan assosiatif antara
suatu kombinasi item.
• Analisis asosiasi juga sering disebut dengan istilah market
basket analysis.
• teknik data mining yang menjadi dasar dari berbagai teknik
data mining lainnya. Khususnya salah satu tahap dari analisis
asosiasi yang disebut analisis pola frequensi tinggi (frequent
pattern mining)
Contoh Aturan Assosiatif (AR)
Analisa pembelian di suatu pasar swalayan adalah dapat
diketahuinya berapa besar kemungkinan seorang pelanggan
membeli roti bersamaan dengan susu.
Dengan pengetahuan tersebut pemilik pasar swalayan dapat
mengatur penempatan barangnya atau merancang kampanye
pemasaran dengan memakai kupon diskon untuk kombinasi
barang tertentu.
2 Parameter pada AR
• support (nilai penunjang) yaitu persentase kombinasi item
tersebut dalam database
• confidence (nilai kepastian) yaitu kuatnya hubungan antar item
dalam aturan assosiatif.
Aturan assosiatif (AR)
biasanya dinyatakan dalam bentuk :
{roti, mentega} {susu} (support = 40%, confidence = 50%)

Yang artinya :
50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu.
40% dari seluruh transaksi yang ada di database memuat ketiga item itu.“

Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga
membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi.
Menambang Aturan Asosiasi
Berdasarkan data set transaki, akan dicari aturan yang dapat memprediksi
kejadian bersama sebuah item, berdasarkan kejadian bersama dari item-item
lainnya dalam transaksi
Market-Basket transactions Contoh Aturan Asosiasi
TID Items {Diaper} {Bir},
1 Roti, Susu {Susu, Roti} {Telur, Coke}
{Bir, Roti} {Susu}
2 Roti, Diaper, Bir, Telur
3 Susu, Diaper, Bir, Coke Tanda implikasi di atas berarti kejadian bersama,
4 Roti, Susu, Diaper, Bir bukan sebab akibat!

5 Roti, Susu, Diaper, Coke


Istilah
Itemset : Koleksi dari sejumlah (satu/ lebih) item.
TID Items
Contoh : {Beer}, {Milk, Bread, Diaper} 1 Bread, Milk
K-Itemset. Item set yg terdiri dari k item. 2 Bread, Diaper, Beer, Eggs
Contoh: 3-item set = {Milk, Bread, Diaper} 3 Milk, Diaper, Beer, Coke
4 Bread, Milk, Diaper, Beer
Support Count (σ). Frekuensi terjadinya sebuah itemset dalam data set.
5 Bread, Milk, Diaper, Coke
Contoh: σ ({Milk, Bread, Diaper}) = 2

Support (S), Perbandingan terjadinya sebuah itemset terhadap jumlah seluruh itemset dalam dataset

Contoh: S({Milk, Bread, Diaper}) = 2/5


Istilah (2)
Frequent Itemset
Itemset yang nilai supportnya lebih besar atau sama dengan “minsup threshold” Support Count
Associaton Rule, adalah ekspresi implikasi ( X ->Y), dimana X dan Y adalah itemset yang saling
disjoint
contoh : {Milk, Diaper} {Beer} TID Items
1 Bread, Milk
2 Bread, Diaper, Beer, Eggs
3 Milk, Diaper, Beer, Coke
4 Bread, Milk, Diaper, Beer
5 Bread, Milk, Diaper, Coke
2 Tahap Metodologi dasar analisis asosiasi (1)
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support
dalam database.

nilai support sebuah item diperoleh dengan rumus berikut:

𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴


𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴) =
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖

Sedangkan nilai support dari 2 item diperoleh dari rumus:

𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵


𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴𝐵) =
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
2 Tahap Metodologi dasar analisis asosiasi (2)
2. Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang
memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan
assosiatif AB

Nilai confidence dari aturan AB diperoleh dari rumus berikut:

𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵


𝐶𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 = 𝑃(𝐵|𝐴) =
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴
2 Tahap Metodologi dasar analisis asosiasi (3)
 Support (s)
Perbandingan transaksi- transaksi yang mengandung X dan Y
 Confidence (c)
Menunjukkan kekerapan munculnya item-item dalam Y dalam transaksi yang mengandung X

Contoh
TID Items
{Milk, Diaper}  Beer
𝜎(𝑀𝑖𝑙𝑘, 𝐷𝑖𝑎𝑝𝑒𝑟, 𝐵𝑒𝑒𝑟 ) 2 1 Bread, Milk
𝑆= = = 0.4
|𝑇| 5 2 Bread, Diaper, Beer, Eggs
3 Milk, Diaper, Beer, Coke
𝜎(𝑀𝑖𝑙𝑘, 𝐷𝑖𝑎𝑝𝑒𝑟, 𝐵𝑒𝑒𝑟 ) 2
𝐶= = = 0.67 4 Bread, Milk, Diaper, Beer
𝜎(𝑀𝑖𝑙𝑘, 𝐷𝑖𝑎𝑝𝑒𝑟) 3
5 Bread, Milk, Diaper, Coke
Ilustrasi Prinsip Apriori
Item Count Items (1-itemsets)
Bread 4 Itemset Count Pairs (2-itemsets)
Coke 2 {Bread, Milk} 3 (No need to generate candidates
Milk 4 {Bread, Beer} 2 involving Coke or Eggs)
Beer 3 {Bread, Diaper} 3
Diaper 4 {Milk, Beer} 2
Eggs 1 {Milk, Diaper} 3
{Beer, Diaper} 3
Minimum Support = 3
Triplets (3-itemsets)
Itemset Count
{Bread, Milk, Diaper} 3
Contoh :
1. Terdapat transaksi belanja

Transaksi Item yang dibeli


1 susu teh gula
2 teh gula roti
3 teh gula
4 susu roti
5 susu gula roti
6 teh gula
7 gula kopi susu
8 gula kopi susu
9 susu roti kopi
10 gula teh kopi
2. Pisahkan masing-masing 3. Hitung jumlah banyaknya pembelian untuk setiap item
item yang dibeli
Transaksi teh gula kopi susu roti
Item yang dibeli
1 1 1 0 1 0
Teh 2 1 1 0 0 1
3 1 1 0 0 0
gula
4 0 0 0 1 1
kopi 5 0 1 0 1 1
6 1 1 0 0 0
susu
7 0 1 1 1 0
roti 8 0 1 1 1 0
9 0 0 1 1 1
10 1 1 1 0 0
∑ 5 8 4 6 4
Kombinasi 2-itemset

• Misalkan Φ = 2 Kombinasi Jumlah


• maka semua itemset yang frekuensi kemunculannya lebih teh, Gula 5
dari atau sama dengan 2 kali disebut frequent. teh, kopi 1
• Himpunan dari frequent k-itemset dilambangkan dengan teh, susu 1
Fk teh, roti 1
gula, kopi 3
gula, susu 4
gula, roti 2
kopi,susu 3
kopi, roti 1
susu, roti 3

*Sebuah itemset menunjukkan itemset yg memiliki frekuensi kemunculan lebih dari nilai minimum yg telah ditentukan (Φ).
Dari data pada kombinasi 2-itemset, Misalkan kita tentukan Ф = 2
F2 = {{teh, gula}, {gula, kopi}, {gula, susu}, {gula, roti}, {kopi, susu}, {susu, roti}}

Kombinasi 3-itemset
• 3-itemset dibentuk dari F2
Kombinasi Jumlah
• Kombinasi dari itemset F2 digabungkan menjadi 3-itemset
teh, gula, kopi 1 • Itemset dari F2 yg dapat digabungkan adalah itemset yg
memiliki kesamaan dalam k-1
teh, gula, susu 1
Dengan demikian F3 = {{gula, susu, kopi}}, karena hanya
gula, susu, kopi 2 kombinasi inilah yang memiliki frekuensi kemunculan >= Ф
gula, susu, roti 0

gula, kopi, roti 0

kopi, susu, roti 1


4. Pembentukan Aturan Asosiasi dari F2

Aturan Confidence
Jika membeli teh, maka akan membeli gula 5/5 100%
jika membeli gula, maka akan membeli teh 5/8 63%
jika membeli gula, maka akan membeli kopi 3/8 38%
jika membeli kopi, maka akan membeli gula 3/4 75%
jika membeli gula, maka akan membeli susu 4/8 50%
jika membeli susu, maka akan membeli gula 4/6 67%
jika membeli gula, maka akan membeli roti 2/8 25%
jika membeli roti, maka akan membeli gula 2/4 50%
jika membeli kopi, maka akan membeli susu 3/4 75%
jika membeli susu, maka akan membeli kopi 3/6 50%
jika membeli susu, maka akan membeli roti 3/6 50%
jika membeli roti, maka akan membeli susu 3/4 75%
5. Pembentukan Aturan Asosiasi dari F3
Aturan Confidence
jika membeli gula dan susu, maka akan membeli kopi 2/4 50%
jika membeli gula dan kopi, maka akan membeli susu 2/3 67%
jika membeli kopi dan susu, maka akan membeli gula 2/3 67%

Misalkan ditetapkan nilai confidence minimal adalah 60%, maka aturan yang bisa
terbentuk adalah aturan dua berikut:
1. jika membeli gula dan kopi, maka akan membeli susu
2. jika membeli kopi dan susu, maka akan membeli gula
6. Aturan Asosiasi Final

Aturan Support Confidence Support x Confidence


Jika membeli teh, maka akan membeli gula 50% 100% 50%
jika membeli gula, maka akan membeli teh 50% 63% 32%
jika membeli susu, maka akan membeli gula 40% 67% 27%
jika membeli kopi, maka akan membeli gula 30% 75% 23%
jika membeli kopi, maka akan membeli susu 30% 75% 23%
jika membeli roti, maka akan membeli susu 30% 75% 23%
jika membeli gula dan kopi, maka akan membeli susu 20% 67% 13%
jika membeli kopi dan susu, maka akan membeli gula 20% 67% 13%
Lanjutan
Setelah didapat hasil perkalian antara support dan confidence, pilihlah yang hasil perkaliannya paling
besar. Hasil paling besar dari perkalian perkalian tersebut merupakan rule yang dipakai pada saat
menjual.
1. Jika membeli teh, maka akan membeli gula
2. jika membeli gula, maka akan membeli teh
3. jika membeli susu, maka akan membeli gula
4. jika membeli kopi, maka akan membeli gula
5. jika membeli kopi, maka akan membeli susu
6. jika membeli roti, maka akan membeli susu
7. jika membeli gula dan kopi, maka akan membeli susu
8. jika membeli kopi dan susu, maka akan membeli gula
Tugas
Transaksi Item yang dibeli
1 Brokoli, bayam, jagung
2 Jamur, kentang, jagung
3 Jagung, wortel, buncis, kentang
4 Bayam, jagung, wortel, buncis
5 Buncis, jamur, brokoli
6 Kentang, jamur, buncis, wortel
7 Wortel, jagung
8 Brokoli, wortel, bayam
9 Kentang, jamur, buncis
10 Buncis, jagung
11 Bayam, brokoli, buncis, kentang
12 Jamur, buncis, kentang
13 Kentang, jagung, jamur, buncis
14 Jagung, bayam, wortel, buncis, brokoli
Lanjutan Tugas
Pisahkan masing-masing item yang dibeli
Hitung jumlah banyaknya pembelian untuk setiap item
Misalkan Φ = 2
Dari data pada kombinasi 2-itemset, Misalkan kita tentukan Ф = 3
Buat pembentukan Aturan Asosiasi dari F2
Buat pembentukan Aturan Asosiasi dari F3
Buat aturan Asosiasi Final

Anda mungkin juga menyukai