Anda di halaman 1dari 33

Metode Asosiasi (Association Rule)

Sienny Rusli 2021210043 | Anton Sunardi 2021210045 | Irma Rahmianti 2021210058

SEKOLAH TINGGI MANAJEMEN INFORMASI & KOMPUTER


LIKMI
BANDUNG
2022
1

Aturan Assosiasi
 Adalah pernyataan “ Jika – maka “
 Membantu menunjukkan kemungkinan hubungan antara item data
 Membantu menemukan korelasi dalam data transaksional
 Sifatnya adalah Deskriptif
 Sering disebut Market Basket Analysis (analisis keranjang pasar)

Penggunaan Kasus untuk aturan Asosiasi


Idealnya digunakan untuk menjelaskan korelasi kejadian atara kumpulan data atau pola
transaksi dalam data relasional dan data transaksional
2
Beberapa kasus penggunaan metode asosiasi dalam
kehidupan nyata

1. Dalam bidang Obat-obatan (Medicine)


Dokter dapat menggunakan aturan asosiasi untuk membantu diagnosis pasien, dengan
menentukan probabilitas dari penyakit tertentu dengan membandingkan hubungan gejala
dalam data dari kasus-kasus sebelumnya

2. Dalam bidang retail (eceran)


Pengecer dapat mengumpulkan data tentang pola pembelian untuk menentukan produk
apa yang kemungkinan besar dibeli secara bersamaan
3 3. Dalam bidang hiburan (entertainment)

Layanan Netflix, Youtube, Spotify dan lain-lain dapat menggunakan aturan asosiasi untuk
mendorong rekomendasi konten, dengan menganalisis data perilaku pengguna untuk pola
yang “sering”.

Rekomendasi konten dari hasil analisis data perilaku pengguna untuk pola yang
paling “sering” atau menarik bagi pengguna

Algoritma

4. Desain pengalaman pengguna (user experience design)

Pengembang dapat mengumpulkan data tentang bagaimana konsumen menggunakan situs


web yang dibuat, kemudian mengoptimalkan design antar muka situs web dari
kecenderungan pengguna meng-klik web tertentu dan apa yang memaksimalkan peluang
dari perilaku tersebut
4
Cara kerja aturan asosiasi
 Penambangan aturan asosiasi melibatkan analisis data untuk “pola” atau “kejadian
bersama” dalam sebuah database.
 Hal ini mengidentifikasi “if-then” yang “sering”

Bagian dalam aturan asosiasi

1. Antesenden (jika)
Antesenden adalah item yang ditemukan dalam data

2. Konsekuen (maka)
Konsekuen adalah item yang ditemukan dalam kombinasi dengan antesenden

Membandingkan keyakinan yang didapatkan


Menggunakan dukungan kriteria &
Mencari data untuk pola “if-then’ dengan keyakinan yang diharapkan atau
keyakinan untuk mengidenfikasi
Yang paling sering berapa kali pernyataan jika-maka diharapkan
hubungan yang paling penting
terbukti benar
5
Ukuran efektifitas aturan asosiasi
Kekuatan aturan asosiasi diukur dengan dua parameter utama:
1. Dukungan (support)
2. Kepercayaan (confidence)

Dukungan mengacu pada “seberapa sering” aturan yang diberikan muncul dalam database

Kepercayaan/keyakinan mengacu pada berapa kali aturan yang diberikan ternyata “benar”

Kemungkinan yang dapat terjadi:


Korelasi data yang kuat karena sering muncul – tapi sedikit terjadi saat diterapkan

Dukungan tinggi tetapi kepercayaan/keyakinan rendah


6
Parameter lainnya
Nilai Angkat atau dikenal dengan rasio kepercayaan terhadap dukungan.

Jika hasil bernilai negative maka terdapat korelasi negative antar ttitik data.

Jika hasil bernilai positive maka terdapat korelasi positive antar titik data.
Jika rasio = 1 maka tidak ada korelasi antar titik data
7

 Algoritma Artificial Immune System (AIS)


Dengan algoritma AIS, item set dihasilkan dan dihitung saat memindai data. Dalam data transaksi,
algoritma AIS menentukan item set besar mana yang berisi transaksi, dan item set baru dibuat dengan
memperluas item set yang besar dengan item lain dalam data transaksi.
 SETM
Algoritme SETM juga menghasilkan kumpulan item saat memindai database, tetapi algoritma ini
menghitung kumpulan item di akhir pemindaiannya. Item set baru dihasilkan dengan cara yang sama
seperti algoritma AIS, tetapi ID transaksi dari transaksi pembangkitan disimpan dengan itemset dalam
struktur data berurutan. Di akhir, jumlah dukungan dari kumpulan item dibuat dengan menggabungkan
struktur sekuensial.
 APRIORI
Dengan algoritma Apriori, item set ditampilkan hanya dengan menggunakan item set besar sebelumnya.
Item set sebelumnya digabungkan untuk menghasilkan semua item set dengan ukuran yang lebih besar
satu per satu. Setiap item set yang dihasilkan dengan sub set yang tidak besar kemudian dihapus.
Algoritma Apriori menganggap setiap sub set dari frequent item set juga menjadi frequent item set.
Dengan pendekatan ini, algoritme mengurangi jumlah kandidat yang dipertimbangkan dengan hanya
menjelajahi item set yang jumlah dukungannya lebih besar dari jumlah dukungan minimum.
8
Inti dari aturan asosiasi
Adalah aturan sebab akibat yang dapat diterapkan dalam menarik informasi yang
memiliki korelasi signifikan.

Dari berbagai algoritma yang ada dalam aturan asosiasi, algoritma yang paling umum dan
sering digunakan adalah algoritma APRIORI

Poin penting dalam aturan APRIORI


1. Nilai Support (persentase jumlah kasus untuk kombinasi item tertentu)
2. Nilai Confidence (persentase keakurasian dari aturan asosiasi yang dihasilkan)

X ∩ Y = Jumlah transaksi yang berisi X dan Y


Support, s (X Y) = ( X ∩ Y) N = Total jumlah seluruh transaksi
N
Nilai Support yang rendah berarti asosiasi jarang
terjadi dalam data set (seluruh data transaksi)
9
X ∩ Y = Jumlah transaksi yang berisikan X dan Y
( X ∩ Y)
Confidence, c (X Y) = X = Jumlah transaksi yang berisikan X
X
Nilai Confident yang tinggi menggambarkan banyaknya
Y yang muncul dalam transaksi yang berisi X
10
Contoh Soal
Suatu supermarket memiliki sejumlah transaksi seperti di dalam tabel.
 Buatlah association rule dari data tersebut dengan menghitung nilai support dan
confidence.
 Gunakan metode Apriori dengan nilai minimum support min 0.3 confidence 0.8
dan Φ = 2
Tabel Transaksi
ID Transaksi Item Pembelian
T1 Beras, Telur, Minyak
T2 Beras, Minyak
T3 Beras, Gula, Minyak
T4 Garam, Beras, Gula, Minyak
T5 Garam, Gula
11 Penyelesaian
Metodologi dasar dari Algoritma Apriori terdiri dari dua tahapan
1. Analisis pola frekuensi tinggi
2. Pembentukkan aturan asosiatif

1. Analisis Pola Frekuensi Tinggi


Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam suatu
database
Nilai support sebuah item diperoleh dengan rumus
Support (A) = Jumlah Transaksi mengandung A
Total Transaksi

Sedangkan nilai support untuk dua item diperoleh dari rumus berikut
Support (A ∩ B) = Jumlah Transaksi mengandung A ∩ B
Total Transaksi
12 Langkah Pertama : Mengubah data transaksi ke dalam bentuk tabular

Tabel Transaksi
ID Transaksi Item Pembelian
T1 Beras, Telur, Minyak
T2 Beras, Minyak
T3 Beras, Gula, Minyak
T4 Garam, Beras, Gula, Minyak
T5 Garam, Gula

Tabular Item yang Dibeli

Item yang dibeli Transaksi Beras Telur Minyak Gula Garam


Beras T1 1 1 1 0 0
Telur T2 1 0 1 0 0
Minyak T3 1 0 1 1 0
Gula T4 1 0 1 1 1
T5 0 0 0 1 1
Garam
Total Transaksi = 5 Σ Jumlah 4 1 4 3 2
13 Langkah kedua : menentukan nilai K-item set yang
memenuhi nilai support yang telah diberikan di soal
Iterasi 1

Tabel 1 Itemset
No Item Σ transaksi Support Rumus :
1 Beras 4 0,8 v
2 Telur 1 0,2 x
3 Minyak 4 0,8 v Support(A) = Jumlah Transaksi mengandung A
4 Gula 3 0,6 v
5 Garam 2 0,4 v
Total Transaksi

Ketentuan
Total Transaksi = 5 Nilai min support = 0,3
15
Tabel 1 Itemset Terpilih
No Item Σ Transaksi Support
1 Beras 4 0,8
3 Minyak 4 0,8
4 Gula 3 0,6
5 Garam 2 0,4

Iterasi 2
Kombinasi 2 Itemset
No Kombinasi
1 Beras, Minyak
2 Beras, Gula
3 Beras, Garam
4 Minyak, Gula
5 Minyak, Garam
6 Gula, Garam
16 Rumus menghitung support 2 item

Suppport (A ∩ B) = Jumlah Transaksi mengandung A dan B


Total Transaksi

Total Transaksi = 5

1. Beras, Minyak 2. Beras, Gula


Item yang dibeli Item yang dibeli
Transaksi Beras Minyak transaksi 2 item Transaksi Beras Minyak transaksi 2 item
T1 1 1 Y T1 1 0 N
T2 1 1 Y T2 1 0 N
T3 1 1 Y T3 1 1 Y
T4 1 1 Y T4 1 1 Y
T5 0 0 N T5 0 1 N
Jumlah Transaksi 2 item 4 Jumlah Transaksi 2 item 2
Support 0,8 Support 0,4
3. Beras, Garam 4. Minyak, Gula
17
Item yang dibeli Item yang dibeli
transaksi 2
Transaksi Beras Garam transaksi 2 item Transaksi Minyak Gula item
T1 1 0 N T1 1 0 N
T2 1 0 N T2 1 0 N
T3 1 0 N T3 1 1 Y
T4 1 1 Y T4 1 1 Y
T5 0 1 N T5 0 1 N
Jumlah Transaksi 2 item 1 Jumlah Transaksi 2 item 2
Support 0,2 Support 0,4

5. Minyak, Garam 6. Gula, Garam


Item yang dibeli transaksi 2 Item yang dibeli transaksi 2
Transaksi Minyak Garam item Transaksi Gula Garam item
T1 1 0 N T1 0 0 N
T2 1 0 N T2 0 0 N
T3 1 0 N T3 1 0 N
T4 1 1 Y T4 1 1 Y
T5 0 1 N T5 1 1 Y
Jumlah Transaksi 2 item 1 Jumlah Transaksi 2 item 2
Support 0,2 Support 0,4
18 Tabel 2 Item set
No Item Σ transaksi Support
1 Beras, Minyak 4 0,8 v

2 Beras, Gula 2 0,4 v

3 Beras, Garam 1 0,2 x

4 Minyak, Gula 2 0,4 v

5 Minyak, Garam 1 0,2 x

6 Gula, Garam 2 0,4 v

Ketentuan support min 0,3

Tabel 2 Itemset Terpilih


No Item Σ transaksi Support
1 Beras, Minyak 4 0,8
2 Beras, Gula 2 0,4
4 Minyak, Gula 2 0,4
6 Gula, Garam 2 0,4
19
Iterasi 3 Kombinasi 3 Item
Kombinasi
No Item Σ transaksi Support No  
1 Beras, Minyak 4 0,8
Beras, Minyak, Gula
2 Beras, Gula 2 0,4 1  
4 Minyak, Gula 2 0,4
Beras, Minyak,Garam
6 Gula, Garam 2 0,4 2  

Rumus menghitung dari 3 item

Support (A∩B∩C) = Jumlah transaksi yang mengandung A,B dan C


Total transaksi

1. Beras, Minyak, Gula


Item yang dibeli
Transaksi Beras Minyak Gula Transaksi 3 Item
T1 1 1 0 N
T2 1 1 0 N
T3 1 1 1 Y
T4 1 1 1 Y
T5 0 0 1 N
Jumlah transaksi 3 item 2
Support 0,4
20

2. Beras, Minyak, Garam


Transaksi Item yang dibeli
  Beras Minyak Garam Transaksi 3 Item
T1 1 1 0 N
T2 1 1 0 N
T3 1 1 0 N
T4 1 1 1 Y
T5 0 0 1 N
Jumlah transaksi 3 item 1
Support 0,2

Tabel 3 Itemset
No Item Σ transaksi Support
1 Beras, Minyak, Gula 2 0,4 v

2 Beras, Minyak, Garam 1 0,2 x


21 Ketentuan support min 0,3

Tabel 3 Itemset

No Item Σ transaksi Support

1 Beras, Minyak, Gula 2 0,4 v

Iterasi 4

Tabel 3 Itemset Terpilih


kombinasi 4 item

No Item Σ transaksi Support No Kombinasi

   
1 Beras, Minyak, Gula 2 0,4

Tidak ada kombinasi yang bisa dibuat lagi. Oleh karena itu iterasi dihentikan
22 2. Pembentukan Aturan Asosiasi

Rumus
Confidence = Σ item yang dibeli sekaligus

Σ jumlah transaksi pada bagian antecendent

Pembentukan Rule

1. Rule yang dipakai adalah "Jika x maka y" di mana x adalah antecendent dan y adalah consequent

2. Untuk antecendent boleh lebih dari 1 unsur, sedangkan untuk consequent terdiri dari 1 unsur

Didapatkan himpunan frekuen item (FK) sebagai berikut:

F2 = {{Beras, Minyak}, {Beras, Gula}, {Minyak, Gula}, {Gula, Garam}}


F3 = {Beras, Minyak, Gula}
23
Aturan Asosiasi 2 Item set

Rule Σ A&B ΣA Confidence

Jika membeli Beras maka membeli Minyak 4 4 1

Jika membeli Minyak maka membeli Beras 4 4 1

Jika membeli Beras maka membeli Gula 2 4 0,5

Jika membeli Gula maka membeli Beras 2 3 0,6666667

Jika membeli Minyak maka membeli Gula 2 4 0,5

Jika membeli Gula maka membeli Minyak 2 3 0,6666667

Jika membeli Gula maka membeli Garam 2 3 0,6666667

Jika membeli Garam maka membeli Gula 2 2 1


24

Aturan Asosiasi 3 Item set

Rule Σ A&B ΣA Confidence

Jika membeli Beras dan Minyak maka membeli Gula 2 4 0,5

Jika membeli Beras dan Gula maka membeli Minyak 2 2 1

Jika membeli Minyak dan Gula maka membeli Beras 2 2 1


Asosiasi Final
25 Atuan yang digunakan adalah aturan yang memiliki confidence >=0,8

Rule Support Confidence Support * Confidence

Jika membeli Beras maka membeli Minyak 0,8 1 0,8 * 1 0,8

Jika membeli Minyak maka membeli Beras 0,8 1 0,8 * 1 0,8

Jika membeli Garam maka membeli Gula 0,4 1 0,4 * 1 0,4

Jika membeli Beras dan Gula maka membeli Minyak 0,4 1 0,4 * 1 0,4

Jika membeli Minyak dan Gula maka membeli Beras 0,4 1 0,4 * 1 0,4

Aturan Asosiasi

Aturan yang digunakan adalah aturan yang memiliki hasil paling besar dari perkalian nilai support dan nilai confidence
1. Jika membeli Beras maka membeli Minyak
2. Jika membeli Minyak maka membeli Beras
26

Tabel Transaksi
ID Transaksi Item Pembelian
T1 Beras, Telur, Minyak
T2 Beras, Minyak
T3 Beras, Gula, Minyak
T4 Garam, Beras, Gula, Minyak
T5 Garam, Gula

 Jadi dari penyelesaian soal tabel di atas, dapat diambil kebijakan untuk supermarket
tersebut untuk mengatur strategi pada peletakan barang. Misalnya mendekatkan rak beras
dan minyak, menghitung stock beras dan minyak.
27 Rapidminer

Pilih data yang akan diolah dalam Rapidminer


28
Pilih attribute

Select Attributes

Beras
Garam
Gula
Minyak
Telur
29
Pengolahan Apriori

Numerical to Binominal

Remap Binominals
30
Frequent Item

FP-Growth

0.3
31
Confidence

0.8

Create Association Rules


32
Visualisasi dengan Rapidminer

Minyak akan terbeli bersamaan dengan Beras dengan tingkat


confidence 1 dan didukung oleh 80% data secara keseluruhan

Anda mungkin juga menyukai