{Diapers} {Beer}
Aturan di atas menunjukan adanya hubungan yang kuat antara penjualan
Diapers dan Beer, karena banyak pembeli yang membeli Diapers
juga membeli Beer
Terminology
• Itemset: Koleksi nol atau lebih item set; {Beer, Milk,
Diapers}
– I= {i1,i2, …., id}: himpunan semua item dlm trans belanja;
– T = {t1,t2, …., tN}: himpunan semua transaksi;
– k-itemset ; 3 itemset ; {Beer, Milk, Diapers}
• Transaction Width: jumlah item yang terdapat dalam
sebuah transaksi.
– Transaksi tj dikatakan mengandung itemset x jika x merupakan subset dari tj.
• Support Count: jumlah transaksi yang mengandung itemset
tertentu.
– Support count untuk {Beer, Diapers, Milk} = 2, karena hanya dua
transakasi yang mengandung ketiga item tersebut.
Terminology
• Aturan Asosiasi (association Rule):
– ekspresi implikasi dalam bentuk X Y, dimana X dan Y adalah itemset
terpisah atau XY =
– Kekuatan aturan asosiasi diukur dengan support dan confidence
– Support = seberapa sering aturan tersebut diterapkan dalam dataset
Contoh
Contoh:
Aturan : {Milk, Diapers} Beers
Confidence diperoleh dari frekuensi {Milk, Diapers, Beers} dibagi frekuensi
{Milk, Diapers} = 2/3 = 0.67
Terminology
• Formulasi masalah Association Rule Mining
dinyatakan:
Diberikan semua himpunan transaksi T, cari semua aturan
yang memiliki:
support ≥ minsup ;
confidence ≥ minconf;
Dimana minsup dan minconf merupakan nilai ambang atau
threshold bagi support atau confidence
Dua strategi pembangkitan association rule: