Anda di halaman 1dari 35

Association Rules and

Frequent Item Analysis

Prodi Informatika 2021

Anna Baita, M. Kom.

Fakultas Ilmu Komputer


• SCPMK 1682104: Mahasiswa dapat menerapkan Association rule mining [CPMK21]
• The student can implement the association rule mining.

2
ANALISIS ASOSIASI

➢ Analisis asosiasi atau association rule


mining adalah teknikdata mining untuk
menemukan aturan assosiatif antara
suatu kombinasi item
➢ Contoh dari aturan assosiatif adalah
analisa pembelian di suatu pasar
swalayan yaitu dapat diketahuinya
berapa besar kemungkinan seorang
pelanggan membeli roti bersamaan
dengan susu.

3
ANALISIS ASOSIASI

➢ Dengan pengetahuan tersebut pemilik pasar


swalayan dapat mengatur penempatan
barangnya atau merancang kampanye
pemasaran dengan memakai kupon diskon
untuk kombinasi barang tertentu.
➢ Karena analisis asosiasi menjadi terkenal
karena aplikasinya untuk menganalisa isi
keranjang belanja di pasar swalayan, analisis
asosiasi juga sering disebut dengan istilah
market basket analysis

4
Market Basket Analysis
Market Basket Analysis

Strategi

✓Didekatkan letaknya
✓Dijauhkan letaknya, dengan pertimbangan cust membeli barang
lain
✓Stok barang harus tersedia, jangan sampai kosong
✓Alternatif pengganti merk lain untuk barang sejenis
✓Dijual sepaket
✓Promosi barang lain yang kurang laku
Contoh Penerapan Kaidah Asosiasi Data

Marketing and Sales Promotion


• Contoh: Ketergantungan {bagels,...} {potato chips}
• potato chips sebagai consequent dapat digunakan untuk
menentukan apa yang dilakukan untuk meningkatkan
penjualan
• Bagels in the antecendence dapat digunakan untuk melihat
produk mana yang akan terkena dampak jika toko tersebut
tidak lagi menjual bagels
• Bagels in the antecendence and potato chips in
consequent dapat digunakan untuk melihat produk apa
yang harus dijual dengan bagels untuk mempromosikan
penjualan potato chips
Contoh Penerapan Kaidah Asosiasi

Supermarket Shelf Management


▪ Tujuan untuk mengenali item2 yang dibeli bersama-sama(dalam sekali
transaksi) oleh beberapa pelanggan.
▪ Pendekatan : memproses data point of sale dengan pemindai barcode
untuk dicari ketergantungan antar item.
▪ Implementasi real pada promosi di supermarket atau swalayan, akan
banyak kita jumpai pembelian 6 pack keju cheedar yang dibundling
dengan 1 pack roti tawar.
▪ Atau kita jumpai, penataan pampers yang berdekatan dengan tissue,
Dasar Analisis Asosiasi

❑ Penting tidaknya suatu aturan assosiatif dapat diketahui dengan


dua parameter:
➢ support (nilai penunjang) yaitu persentase kombinasi item
tersebut dalam total transaksi

➢ confidence (nilai kepastian) yaitu kuatnya hubungan antar item


dalam aturan assosiatif
BENTUK ATURAN ASOSIASI

❑ {roti, mentega} -> {susu}


(support = 40%, confidence = 50%)
❑ Yang artinya :
❑ Support, bahwa 40% dari semua transaksi menunjukkan bahwa
roti,mentega dan susu dibeli bersama-sama
❑ Confidence/Keyakinan 50% berarti bahwa 50% customer yang
membeli roti,mentega juga membeli susu
SUPPORT

𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑨


𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨) =
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖

𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑨 𝑑𝑎𝑛 𝑩


𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨 → 𝑩) = 𝑷(𝑨 ∪ 𝑩) =
𝑇𝑜𝑡𝑎𝑙 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖

Notice :
bahwa notasi P (A∪B) menunjukkan probabilitas bahwa suatu transaksi mengandung gabungan set A dan B (mis., Itu berisi setiap item
dalam A dan B).
Ini tidak boleh dikacaukan dengan P (A atau B), yang menunjukkan probabilitas bahwa suatu transaksi mengandung A atau B.

Data Mining Concepts and Techniques, Jiawei Han, Micheline Kamber, Jian Pei,elsivier 2012
CONFIDENCE A→B

𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵


𝑪𝒐𝒏𝒇𝒊𝒅𝒆𝒏𝒄𝒆 𝑷(𝑩|𝑨) =
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴

𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴 ∪ 𝐵) 𝑆𝑢𝑝𝑝𝑜𝑟𝑡_𝑐𝑜𝑢𝑛𝑡 (𝐴 ∪ 𝐵)
𝑪𝒐𝒏𝒇𝒊𝒅𝒆𝒏𝒄𝒆(𝑨 → 𝑩) = 𝑷(𝑩|𝑨) = =
𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴) 𝑆𝑢𝑝𝑝𝑜𝑟𝑡_𝑐𝑜𝑢𝑛𝑡 (𝐴)

Data Mining Concepts and Techniques, Jiawei Han, Micheline Kamber, Jian Pei,elsivier 2012
DEFINISI ANALISIS ASOSIASI

suatu proses untuk menemukan semua aturan assosiatif yang


memenuhi syarat minimum untuk : support (minimum support) dan
confidence (minimum confidence).
Diagram Penyelesaian Masalah Asosiasi rule

Tentukan Data Transaksi

Representasikan data transaksi dalam database transaksional

Bentuk dalam data tabular untuk masing-masing item

Buat calon 2- itemset dari data transaksi

Tentukan nilai ᵩ dan pilih item yang memenuhi nilai Minimum Support
Bentuk aturan Asosiasi, lalu pilih pasangan item yang sesuai dengan nilai
minimum confidence yang telah ditentukan

hitung Support x confidence untuk memperoleh nilai yang diharapkan


Tabel Representasi Biner
Tabel Pembelian
Algorithma Association Rules

❑Algoritma Apriori termasuk dalam association rules.


❑Algoritma lainnya yang termasuk kedalam association rules
diantaranya :
 FP-Growth
 Generalized Rule Induction
 Hash Based algorithm
Pseudo-Code Apriori Algorithm
Ilustrasi Algoritma Apriori
Minimum Support 50%=0.5
Database TDB

TId Items Item Set Support Item Set Support Item Set
C1 {A} 0,5
10 A,C,D L1 {A} 0,5 {A,B}

20 B,C,E 1st Scan {B} 0,75 {B} 0,75 {A,C}

30 A,B,C,E {C} 0,75 {C} 0,75 {A,E}

40 B,E {D} 0,25 {E} 0,75 {B,C}


{E} 0,75 {B,E}

Item Set Support {C,E}


Item Set Support C2
L2 {A,B} 0,25
L3
{A,C} 0,5 {A,C} 0,5
C3 Item Set
Item Set Support
3rd Scan {B,C} 0,5 {A,E} 0,25
{B,C,E} 0,5 {B,C,E} 2nd Scan
{B,E} 0,75 {B,C} 0,5
{C,E} 0,5 {B,E} 0,75

{C,E} 0,5
CONTOH TRANSAKSI
FORMAT TRANSAKSI DALAM DATABASE TRANSAKSIONAL

Transaction Id Items

1 Broccoli

1 Green peppers

1 Corn

2 Asparagus

2 Squash

2 Corn

3 Corn

3 Tomatoes

...... ........
FORMAT TABULAR TRANSAKSI
• Misalkan D adalah himpunan transaksi, dimana masing-masing transaksi T
dalam D merepresentasikan himpunan item yang berada dalam I.
• Misalkan kita memiliki himpunan items A (misal Beans dan squash) dan
himpunan item lain B (misal asparagus).
• Kemudian aturan asosiasi akan berbentuk
• Jika A, maka B ( A→B)
• Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B
merupakan mutually exclusive.
• Definisi ini tidak berlaku untuk aturan trivial seperti : Jika beans dan Squash
Maka beans
❑Aturan yang akan diambil adalah aturan yang memiliki support dan/atau confidence
yang tinggi.
❑ Aturan yang kuat adalah aturan-aturan yang melebihi kriteria support dan/atau
confidence minimum.
❑ Misalnya seorang analist menginginkan aturan yang memiliki support lebih dari
20 % dan confidence lebih dari 35 %.
Frequent Item Analysis

❑ Sebuah itemset adalah himpunan item-item yang ada


dalam I
❑ k-itemset adalah itemset yang berisi k item. Misalnya:
{squash, beans} : 2-itemset
{broccoli, green peppers, corn} : 3-itemset.
❑ Frequent Itemset menunjukkan itemset yang memiliki frekuensi kemunculan lebih dari nilai
minimum yang
telah ditentukan (ф).
❑ Misalkan ф = 4, maka semua itemset yang frekuensi kemunculannya lebih dari 4 kali
disebut frequent.
Himpunan dari frequent k-itemset dilambangkan dengan Fk.
CALON 2-ITEMSET

ф=4
❑ jika ditetapkan nilai ф = 4 maka
F2 ={ {asparagus, beans}, {asparagus, squash},
{beans,corn}, {beans, squash}, {beans, tomatoes},
{broccoli, green peppers}, {corn,tomatoes} }
❑Kombinasi dari itemset dalam F2 dapat kita gabungkan menjadi calon 3-
itemset.
❑Itemset-itemset dari F2 yang dapat digabungkan adalah itemset-
itemset yang memiliki kesamaan dalam k-1 item pertama
CALON ATURAN ASOSIASI DARI F2
CALON 3-ITEMSET

ф = 4,

Dengan demikian F3 = {{asparagus, beans, squash}},


karena hanya
kombinasi inilah yang memiliki frekeunsi
kemunculan >= ф
CALON ATURAN ASOSIASI DARI F3

Misalkan ditetapkan nilai confidence minimal adalah 80% maka aturan yang bisa
terbentuk adalah aturan dengan 2 antecedent berikut:

if buy asparagus and beans, then buy squash


if buy asparagus and squash, then buy beans
ATURAN FINAL

confidence minimal adalah 80%

2 Item set

3 Item set
Contoh Lain

❑ Suatu spermarket mempunyai sejumlah transaksi seperti dalam tabel


❑ Buatlah association rule dari data tersebut dengan cara menghitung support
dan confidence (minimum support= 0.3)
Referensi

• http://staffwww.itn.liu.se/~aidvi/courses/06/dm/lectures/lec7.pdf
• http://www.codeding.com/AprioriJS/Apriori.html
• https://www.youtube.com/watch?v=WGlMlS_Yydk
• Data Mining Concepts and Techniques, Jiawei Han, Micheline Kamber,
JianPei,elsivier 2012
Any Question??
Evaluasi
• Carilah rule-rule asosiasi yang dari transaksi berikut menggunakan algoritma FP-
Growth. Gunakan min support 50%.

Anda mungkin juga menyukai