Anda di halaman 1dari 16

Association Analysis

(association rule mining)


Bentuk
• Aturan asosiasi umumnya dinyatakan dalam bentuk :

X => Y , dimana X dan Y adalah itemset


Contoh : {roti, mentega}  {susu} (support = 40%, confidence = 50%)

• Aturan tersebut berarti “50%” dari transaksi di database yang


memuat item roti dan mentega juga memuat item susu. Sedangkan
40% dari seluruh transaksi yang ada di database memuat ketiga
item itu.
• Dapat juga diartikan : seorang konsumen yang membeli roti dan
mentega punya kemungkinan 50% untuk juga membeli susu.
Aturan ini cukup signifikan karena mewakili 40% dari catatan
transasksi selama ini.
Contoh

{Diapers}  {Beer}
Aturan di atas menunjukan adanya hubungan yang kuat antara penjualan
Diapers dan Beer, karena banyak pembeli yang membeli Diapers
juga membeli Beer
Terminology
• Itemset: Koleksi nol atau lebih item set; {Beer, Milk,
Diapers}
– I= {i1,i2, …., id}: himpunan semua item dlm trans belanja;
– T = {t1,t2, …., tN}: himpunan semua transaksi;
– k-itemset ; 3 itemset ; {Beer, Milk, Diapers}
• Transaction Width: jumlah item yang terdapat dalam
sebuah transaksi.
– Transaksi tj dikatakan mengandung itemset x jika x merupakan subset dari tj.
• Support Count: jumlah transaksi yang mengandung itemset
tertentu.
– Support count untuk {Beer, Diapers, Milk} = 2, karena hanya dua
transakasi yang mengandung ketiga item tersebut.
Terminology
• Aturan Asosiasi (association Rule):
– ekspresi implikasi dalam bentuk X  Y, dimana X dan Y adalah itemset
terpisah atau XY =
– Kekuatan aturan asosiasi diukur dengan support dan confidence
– Support = seberapa sering aturan tersebut diterapkan dalam dataset

Contoh

Aturan : {Milk, Diapers}  Beers


Support Count = 2; Jumlah total transaksi = 5; maka :
Support ({Milk, Diapers}  Beers) = 2/5 =0.4
Terminology
• Aturan Asosiasi (association Rule):
• Confidence = frekuensi item dalam Y yang muncul dalam transaksi yang
mengandung X

Contoh:
Aturan : {Milk, Diapers}  Beers
Confidence diperoleh dari frekuensi {Milk, Diapers, Beers} dibagi frekuensi
{Milk, Diapers} = 2/3 = 0.67
Terminology
• Formulasi masalah Association Rule Mining
dinyatakan:
Diberikan semua himpunan transaksi T, cari semua aturan
yang memiliki:
support ≥ minsup ;
confidence ≥ minconf;
Dimana minsup dan minconf merupakan nilai ambang atau
threshold bagi support atau confidence
Dua strategi pembangkitan association rule:

1. Strategi pembangkitan frequent itemset


Bertujuan untuk mencari semua itemset yang
memenuhi nilai ambang minsup (frequent
itemset)
2. Strategi pembangkitan aturan
Bertujuan untuk mengekstrak aturan yang
memenuhi nilai ambang minconf dari
frequent itemset (strong rules)
Strategi pembangkitan association rule:

1. Strategi pembangkitan frequent itemset


Misal I= {a,b,c,d,e},maka daftar seluruh itemset
yang dapat dibentuk:

Sebuah k item dapat


membangkitkan 2k-1
frequent itemset.

Gambar: Stuktur Lattice


Strategi pembangkitan association rule:

Cara mengurangi kompleksitas komputasi dalam


pembangkitan frequent itemset:
1. Mengurangi jumlah candidate itemset (M).
Apriori: Cara menghilangkan beberapa
candidate itemset tanpa menghitung nilai
supportnya.
2. Mengurangi jumlah perbandingan
Prinsip Apriori
“If an itemset is frequent, then all of the subsets must also be
frequent”
Jika sebuah itemset sering muncul, maka seluruh subset dari
itemset tersebut juga harus sering muncul;
Contoh:
Jika {c,d,e} frequent
maka seluruh subset-
nya juga harus frequent
Prinsip Apriori
Contoh:
Jika {a,b} infrequent
maka seluruh subset-
nya juga harus
infrequent
Prinsip Apriori
• Apriori merupakan algoritma association rule
mining berdasarkan support-based pruning untuk
mengendalikan jumlah candidate itemset;
Prinsip Apriori

Gambar: Pembangkitan frequent itemset menggunakan Apriori


Prinsip Apriori
1. Setiap item dianggap candidate 1-itemset ; hitung
supportnya, maka candidate itemset {Cola} and {Egg}
dibuang karena kemunculannya kurang dari 3;
2. Membangkitkan candidate 2-itemset hanya dengan
menggunakan frequent 1-itemset. Karena terdapat 4
frequent 1-itemset, maka jumlah candidate frequent 2-
itemset adalah 6;
3. 2 dari 6 candidate frequent 2-itemset, yaitu {Beer, Bread}
dan {Bear, Milk} nilai supportnya rendah /infrequent
4. Membangkitkan candidate 3-itemset dari empat
candidate frequent 2-itemset;
Pembangkitan Aturan
2. Pembangkitan Aturan:
• Bagaimana mengekstrak aturan asosiasi dari
frequent itemset yang diberikan;
• Abaikan aturan yang memiliki anteseden dan
konsekuen kosong; (  atau Y };
• Aturan asosiasi yang dipilih harus telah
memenuhi ambang support / threshold

Anda mungkin juga menyukai