Anda di halaman 1dari 22

Asosiasi Data Mining dengan

Algoritma APriori

3.1 Pendahuluan
Algoritma A Priori termasuk dalam cabang ilmu data mining untuk kategori
assosiasi (Purnia and Warnilah, 2017). Algoritma A Priori merupakan salah satu
algoritma yang digunakan untuk menemukan pola frekuensi tinggi yang sangat
terkenal (Bagus et al., 2018). Pola frekuensi tinggi merupakan pola-pola item di
dalam suatu database yang memiliki frekuensi atau Support di atas ambang
batas tertentu yang disebut dengan istilah minimum Support. Pola frekuensi
tinggi ini digunakan untuk menyusun aturan assosiatif dan juga beberapa teknik
data mining lainnya. Aturan yang menyatakan asosiasi antara beberapa atribut
sering disebut sebagai affinity analysis atau market basket analysis (Panjaitan et
al., 2019).

3.2 Assosiasi
Aturan assosiasi (Association rule) adalah salah satu metode yang ada di data
mining yang bertujuan mencari pola yang sering muncul di antara banyak
transaksi, di mana setiap transaksi terdiri dari beberapa item (Aditya, Marisa and
Purnomo, 2016). Association rule merupakan bagian dari frequent pattern
mining. Frequent pattern mining merupakan salah satu task data mining yang
sangat penting. Task ini mencari hubungan/ relasi, assosiasi, dan korelasi dalam
data (Aribowo, 2015). Tugas assosiasi dalam penambangan data adalah
menemukan atribut yang muncul sekaligus. Dalam dunia bisnis lebih sering
48 Data Mining : Algoritma dan Implementasi

disebut analisis keranjang belanja (market basket analysis) (Pahlevi, Sugandi


and Sintawati, 2018).

Gambar 3.1: Proses secara umum data mining (Assosiasi)(Supriyadi et al.,


2018)

3.2.1 Aturan Assosiasi dalam Penjualan


Beberapa aturan assosiasi dalam penjualan yang menjadi hal terpenting yang
dilakukan oleh aturan asosiasi adalah:
a. Tersedianya database market basket (transaksi pembelian) pada pusat
penjualan (apapun) yang secara otomatis menemukan assosiasi produk
atau item-item yang tersimpan dalam database tersebut. Dalam hal ini
database market basket tersebut mengandung record dalam jumlah
yang amat besar di mana tiap record mencatat semua item yang dibeli
oleh pelanggan dalam transaksi tunggal (Aqra et al., 2018).
b. Manfaat yang diperoleh dari aturan assosiasi:

1. Manfaat bagi manajer:


(a) Dapat ditentukannya penempatan barang-barang dalam layout
dengan tepat. Contoh: susu diletakkan berdekatan dengan diapers;
(b) Promosi produk;
(c) Segmentasi pembeli;
(d) Pembuatan katalog.
(e) Melihat pola kecenderungan pola belanja pelanggan
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 49

2. Aturan asosiasi juga dapat diterapkan dalam bentuk sistem


rekomendasi, Contoh:
(a) Sistem rekomendasi pembelian buku atau dvd online
(www.amazon.com);
(b) Sistem rekomendasi pencarian artikel dalam search engine;
(c) Sistem rekomendasi peminjaman atau pengadaan buku pada
perpustakaan; dalan lain-lain (Riszky and Sadikin, 2019; Bagus et
al., 2018).
3. Penyajian informasi transaksi ke dalam bentuk “if-then”atau “jika
maka”. Aturan ini dihitung dari sifat probabilistik yang dimiliki oleh
data yang ada (Nurjoko and Kurniawan, 2016).

Istilah - istilah umum dalam Aturan Assosiasi


a) Itemset
 Sekumpulan satu/ lebih item. Misal: {Milk, Bread, Diaper}
 k-itemset merupakan suatu itemset yang terdiri dari k-item
b) Support count ()

Frekuensi kemunculan suatu itemset. Misal:  ({Milk, Bread, Diaper}) = 2


c) Support

Pecahan transaksi yang terdiri dari suatu itemset. Misal: s ({Milk, Bread,
Diaper}) = 2/5
d) Frequent Itemset (Ф)

Suatu itemset yang memiliki nilai Support lebih tinggi atau sama dengan batas
minimum Support (minsup)
e) Association Rule

Persamaan dalam bentuk X  Y, di mana X dan Y merupakan itemset. Misal:


{Milk, Diaper}  {Beer}
f) Rule Evaluation Metrics
 Support (s)
50 Data Mining : Algoritma dan Implementasi

Pecahan transaksi yang terdiri dari kedua item X dan Y


 Confidence (c)

Ukuran seberapa sering item dalam y muncul darlam transaksi yang terdiri dari
x.
Contoh:
Tabel 3.1: Contoh aturan assosiasi
Transaksi Items
Transaksi 1 Bread, Milk
Transaksi 2 Bread, Diaper, Beer, Eggs
Transaksi 3 Milk, Diaper, Beer, Coke
Transaksi 4 Bread, Milk, Diaper, Beer
Transaksi 5 Bread, Milk, Diaper, Coke
(Sumber: Data Olahan sendiri)
Misal:
{Milk, Diaper}  Beer
 (Milk, Diaper, Beer) 2
s   0.4
|T| 5
 (Milk,Diaper,Beer) 2
c   0.67
 (Milk, Diaper) 3

3.3 Algoritma A Priori


Arti A Priori secara umum merupakan anggapan atau sikap yang sudah
ditentukan sebelum (melihat, menyelidiki) terhadap sesuatu. Oleh karena itulah,
Algoritma A Priori termasuk dari jenis aturan asosiasi pada data mining seperti
yang telah disebutkan sebelumnya (Riszky and Sadikin, 2019). Analisis
assosiasi atau association adalah teknik data mining untuk menemukan aturan
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 51

assosiatif antara suatu kombinasi item (Murnawan, Sinaga and Nughraha,


2018). Salah satu contoh dari aturan assosiatif adalah hasil analisa pembelian di
suatu toko di mana dapat diketahui berapa besar kemungkinan seorang
pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut
pemilik toko dapat mengatur penempatan barangnya atau merancang
pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.
Analisis assosiasi menjadi terkenal karena aplikasinya dapat menganalisa isi
keranjang belanja di toko, analisis assosiasi juga sering disebut dengan istilah
market basket analysis (Purnia and Warnilah, 2017). Berikut Tabel 3.2 di bawah
ini merupakan contoh transaksi pada suatu took.
Tabel 3.2: Tabel Transaksi Barang yang Dibeli (Purnia and Warnilah, 2017)
Transaksi Barang yang dibeli
Transaksi 1 Barang1, Barang2, Barang3
Transaksi 2 Barang1, Barang2
Transaksi 3 Barang2, Barang5
Transaksi 4 Barang1, Barang2, Barang5
Mempelajari aturan assosiasi berarti komputer diminta untuk mencari barang-
barang yang sering dibeli bersamaan. Pada Tabel 3.2 di atas, barang-barang
yang paling sering dibeli bersamaan adalah Barang1 dan Barang2. Untuk
selanjutnya barang disebut dengan item dan himpunan barang disebut itemset.
Penting tidaknya suatu aturan assosiasi dapat diketahui dengan dua parameter,
Support (nilai penunjang) yaitu: persentase kombinasi item tersebut dalam
database dan confidence (nilai kepastian) yaitu: kuatnya hubungan antar item
dalam aturan asosiasi (Bagus et al., 2018).
Aturan asosiasi biasanya dinyatakan dalam bentuk:
Contoh:
{roti, mentega} -> {susu} (Support = 40%, confidence = 50%)
Penjelasan: 50% dari transaksi di database yang memuat item roti dan mentega
juga memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di
database memuat ketiga item itu. Hal tersebut dapat juga diartikan: Seorang
konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga
membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan
transaksi selama ini.
52 Data Mining : Algoritma dan Implementasi

Dalam hal analisis assosiasi digunakan untuk menemukan semua aturan


assosiasi yang memenuhi syarat minimum untuk Support (minimum Support)
dan syarat minimum untuk confidence (minimum confidence).

3.3 Langkah Penyelesaian Algoritma A


Priori
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap:
a. Analisa pola frekuensi tinggi

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai
Support dalam database. Nilai Support sebuah item diperoleh dengan rumus
berikut:
𝐽𝑢𝑚𝑙𝑎& 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠i 𝑚𝑒𝑛/𝑎𝑛𝑑𝑢𝑛/ 𝐴
Support (A) = (3.1)
𝑇𝑜𝑡𝑎𝑙 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠i
sedangkan nilai Support dari 2 item diperoleh dari rumus 2 berikut:
Support (A, B) = P (A  B)
∑ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠i 𝑚𝑒𝑛/𝑎𝑛𝑑𝑢𝑛/ 𝐴 𝑑𝑎𝑛 𝐵
Support (A, B) = (3.2)
∑ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠i

b. Pembentukan aturan assosiasi

Setelah semua pola frekuensi tinggi ditemukan, dicari aturan assosiasi yang
memenuhi syarat minimum untuk confidence dengan menghitung
confidence aturan assosisasi A  B. Nilai confidence dari aturan A  B
diperoleh darirumus berikut:
∑ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠i 𝑚𝑒𝑛/𝑎𝑛𝑑𝑢𝑛/ 𝐴 𝑑𝑎𝑛 𝐵
Confidence= P (B|A)= (3.3)
∑ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠i 𝐴

Sedangkan cara kerja dari Algoritma A Priori sendiri terbagi dari beberapa tahap
yang disebut iterasi. Tahapan tersebut adalah :
1. Pembentukan kandidat itemset, kandidat k-itemset dibentuk dari
kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu ciri
dari algoritma A Priori adalah adanya pemangkasan kandidat k-itemset
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 53

yang subsetnya yang berisi k-1 item tidak termasuk dalam pola
frekuensi tinggi dengan panjang k-1.
2. Perhitungan Support dari tiap kandidat k-itemset. Support dari tiap
kandidat k-itemset didapat dengan menscan database untuk
menghitung jumlah transaksi yang memuat semua item di dalam
kandidat k-itemset tersebut. Ini juga merupakan ciri dari algoritma A
Priori di mana diperlukan perhitungan dengan scan seluruh database
sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k-
item atau k-itemset ditetapkan dari kandidat k-itemset yang
Supportnya lebih besar dari minimum Support.
4. Bila tidak didapat pola frekuensi tinggi maka seluruh proses
dihentikan. Bila tidak, maka k tambah satu dan kembali ke bagian 1.

Kasus 1: Berikut adalah contoh penyelesaian algoritma A Priori kasus pertama.


Ada beberapa transaksi yang disediakan (Penulis menggunakan simbol karakter
huruf untuk contoh kasus pertama).
Tabel 3.3: Contoh kasus pertama transaksi barang yang dibeli
Transaksi Item yang dibeli
T1 D, E, C
T2 C, A
T3 C, B, D
T4 A, C, E, D
T5 E, D
T6 E, C, B
T7 B, D, A
(Sumber: Data Olahan sendiri)
Berdasarkan item yang dibeli pada tabel 3.3, langkah yang harus dilakukan
adalah:
54 Data Mining : Algoritma dan Implementasi

a. Pisahkan masing-masing item yang dibeli dalam bentuk tabel atau


sejenisnya. Hal ini dilakukan agar kita mengetahui item apa yang dari
dari sekian transaksi yang dilakukan dalam satu periode (hari atau
bulan). Dalam hal ini item yang dibeli adalah: A, B, C, D, E.
b. Buat tabel seperti di bawah ini dan hitung jumlahnya berdasarkan tabel
3.4.

Tabel 3.4: Perhitungan item yang dibeli berdasarkan item


Transaksi A B C D E
T1 0 0 1 1 1
T2 1 0 1 0 0
T3 0 1 1 1 0
T4 1 0 1 1 1
T5 0 0 0 1 1
T6 0 1 1 0 1
T7 1 1 0 1 0
∑ = (k=1) 3 3 5 5 4
(Sumber: Data Olahan sendiri)
c. Tentukan Frequent Itemset (Ф)

Misalkan kita tentukan Ф = 3, maka kita dapat menentukan frekuent itemset.


Dari tabel 3.4 di atas diketahui total Ф untuk transaksi k=1, semuanya lebih besar
dari Ф. Maka:
F1= {{A}, {B}, {C}, {D}, {E}}.
Nilai k=1 ≥ Ф.
Untuk k=2 (2 unsur), diperlukan tabel untuk tiap-tiap pasang item. Himpunan
yang mungkin terbentuk adalah {A,B}, {A,C}, {A,D}, {A,E}, {B,C}, {B,D},
{B,E}, {C,D}, {C,E}, {D,E}.
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 55

Tabel 3.5: himpunan yang mungkin terbentuk untuk k=2 (2 unsur)


T A B Hasil T A C Hasil T A D Hasil
T1 0 0 S T1 0 1 S T1 0 1 S
T2 1 0 S T2 1 1 P T2 1 0 S
T3 0 1 S T3 0 1 S T3 0 1 S
T4 1 0 S T4 1 1 P T4 1 1 P
T5 0 0 S T5 0 0 S T5 0 1 S
T6 0 1 S T6 0 1 S T6 0 0 S
T7 1 1 P T7 1 0 S T7 1 1 P
∑ 1 ∑ 2 ∑ 2

T A E Hasil T B C Hasil T B D Hasil

T1 0 1 S T1 0 1 S T1 0 1 S
T2 1 0 S T2 0 1 S T2 0 0 S
T3 0 0 S T3 1 1 P T3 1 1 P
T4 1 1 P T4 0 1 S T4 0 1 S
T5 0 1 S T5 0 0 S T5 0 1 S
T6 0 1 S T6 1 1 P T6 1 0 S
T7 1 0 S T7 1 0 S T7 1 1 P
∑ 1 ∑ 2 ∑ 2

T B E Hasil T C D Hasil T C E Hasil


T1 0 1 S T1 1 1 P T1 1 1 P
T2 0 0 S T2 1 0 S T2 1 0 S
T3 1 0 S T3 1 1 P T3 1 0 S
T4 0 1 S T4 1 1 P T4 1 1 P
T5 0 1 S T5 0 1 S T5 0 1 S
T6 1 1 P T6 1 0 S T6 1 1 P
T7 1 0 S T7 0 1 S T7 0 0 S
∑ 1 ∑ 3 ∑ 3
56 Data Mining : Algoritma dan Implementasi

T D E Hasil
T1 1 1 P
T2 0 0 S
T3 1 0 S
T4 1 1 P
T5 1 1 P
T6 0 1 S
T7 1 0 S
∑ 3
Dari tabel-tabel 2 unsur di atas, P merupakan item-item yang dijual bersamaan,
sedangkan S merupakan item-item yang dijual secara bersamaan atau tidak
terjadi transaksi. Σ melambangkan jumlah Frequent Itemset (Ф). Jumlah
Frequent Itemset (Ф) harus lebih besar atau sama dengan jumlah Frekuensi item
set (Σ >= Ф). Dari tabel 3.5 di atas, maka didapat:
F2 = {{C,D},{C,E},{D,E}}.
Kombinasi dari itemset dalam F2, dapat kita gabungkan menjadi calon 3-
itemset. Itemset-itemset yang dapat digabungkan adalah itemset-itemset yang
memiliki kesamaan dalam k-1 item pertama.
Untuk k=3 (3 unsur), himpunan yang mungkin terbentuk adalah: {C, D, E}.
Tabel 3.6: himpunan yang mungkin terbentuk untuk k=3 (3 unsur)
T C D E Hasil
1 1 1 1 P
2 1 0 0 S
3 1 1 0 S
4 1 1 1 P
5 0 1 1 S
6 1 0 1 S
7 0 1 0 S
∑ 2
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 57

Dari tabel 3.5 di atas, didapat F3= { }, karena tidak ada Σ >= Ф sehingga F4,
F5, F6 dan F7 juga merupakan himpunan kosong.
d. Tentukan (ss-s) sebagai antecedent dan s sebagai consequent dari Fk
(frequent itemset of size k) yang telah didapat pada F2. Di mana
himpunan F2= {{C,D},{C,E},{D,E}}
Maka dapat disusun:
1) Untuk {C, D}:
Jika (ss-s) = C, Jika s = D, Maka →If beli C then beli D
Jika (ss-s) = D, Jika s = C, Maka →If beli D then beli C

2) Untuk {C, E}:


Jika (ss-s) = C, Jika s = E, Maka →If beli C then beli E
Jika (ss-s) = E, Jika s = C, Maka →If beli E then beli C
3) Untuk {D, E}:
Jika (ss-s) = D, Jika s = E, Maka →If beli D then beli E
Jika (ss-s) = E, Jika s = D, Maka →If beli E then beli D
e. Dari langkah di atas, maka kita memperoleh 6 rule yang dapat
digunakan:
If beli C then beli D
If beli D then beli C
If beli C then beli E
If beli E then beli C
If beli D then beli E
If beli E then beli D

f. Hitung support dan confidence dengan menggunakan rumus 3.2 dan


3.3 seperti pada tabel 3.7 berikut:
Tabel 3.7: Perhitungan support dan confidence
If antecedent then Support confidence
consequent
If beli C then beli D (3/7)x100%=42,86% (3/5)x100%=60%
If beli D then beli C (3/7)x100%=42,86% (3/5) x100%=60%
If beli C then beli E (3/7)x100%=42,86% (3/5) x100%=60%
If beli E then beli C (3/7)x100%=42,86% (3/4) x100%=75%
58 Data Mining : Algoritma dan Implementasi

If antecedent then Support confidence


consequent
If beli D then beli E (3/7)x100%=42,86% (3/5) x100%=60%
If beli E then beli D (3/7)x100%=42,86% (3/4) x100%=75%
g. Setelah perhitungan nilai support dan confidence diperoleh (tabel 3.7),
kemudian lakukan perkalian antara support dan confidence, di mana
confidence nya diambil 70% (untuk kasus ini nilai confidence diambil
70% keatas. Proses penentuan confidence berbeda disetiap kasus.
Disesuaikan dengan contoh kasus. Pemberian nilai dilakukan
berdasarkan hasil perhitungan support dan confidence. Gunakan
konsep penalaran dalam mengambil nilai confidence yang dijadikan
patokan.

Tabel 3.8: Nilai confidence nya 70% ke atas


If antecedent then Support confidence Support x
consequent confidence
If beli E then beli C 42,86% 75% 0.32145
If beli E then beli D 42,86% 75% 0.32145
h. Setelah perkalian support dan confidence dilakukan, hasil perkalian
yang paling tinggi adalah rule yang dipakai pada saat menjual.
Karena dari hasil ke-2 penjualan bernilai sama, maka ke-2 penjualan
dapat dijadikan rule.
1. Jika membeli E maka akan membeli C dengan support 42,86% dan
confidence 75%
2. Jika membeli E maka akan membeli D dengan support 42,86% dan
confidence 75%

Kasus 2: Berikut adalah contoh penyelesaian algoritma A Priori kasus kedua.


Ada beberapa transaksi yang disediakan.
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 59

Tabel 3.9: Contoh kasus kedua transaksi barang yang dibeli


Transaksi Item yang dibeli
T1 Susu, Teh, Gula
T2 Teh, Gula, Roti
T3 Teh, Gula
T4 Susu, Roti
T5 Susu, Gula, Roti
T6 Teh, Gula
T7 Gula, Kopi, Susu
T8 Gula, Kopi, Susu
T9 Susu, Roti, Kopi
T10 Gula, Teh, Kopi
(Sumber: Data Olahan sendiri)
Berdasarkan item yang dibeli pada tabel 3.9, langkah yang harus dilakukan
adalah:
1. Pisahkan masing-masing item yang dibeli dalam bentuk tabel atau
sejenisnya. Dalam hal ini item yang dibeli adalah: Susu, Teh, Gula,
Roti, Kopi.
2. Buat tabel seperti di bawah ini dan hitung jumlahnya berdasarkan tabel
3.10.

Tabel 3.10: Perhitungan item yang dibeli berdasarkan item


Transaksi Susu Teh Gula Roti Kopi
T1 1 1 1 0 0
T2 0 1 1 1 0
T3 0 1 1 0 0
T4 1 0 0 1 0
T5 1 0 1 1 0
60 Data Mining : Algoritma dan Implementasi

Transaksi Susu Teh Gula Roti Kopi


T6 0 1 1 0 0
T7 1 0 1 0 1
T8 1 0 1 0 1
T9 1 0 0 1 1
T10 0 1 1 0 1
∑ = (k=1) 6 5 8 4 4
(Sumber: Data Olahan sendiri)
3. Tentukan Frequent Itemset (Ф)

Misalkan kita tentukan Ф = 2, Dari tabel 3.10 di atas diketahui total Ф untuk
transaksi k=1, semuanya lebih besar dari Ф. Maka:
F1= {{Susu}, {Teh}, {Gula}, {Roti}, {Kopi}}.
Nilai k=1 ≥ Ф.
Untuk k=2 (2 unsur), diperlukan tabel untuk tiap-tiap pasang item. Himpunan
yang mungkin terbentuk adalah {Susu, Teh}, {Susu, Gula}, {Susu, Roti},
{Susu, Kopi}, {The, Gula}, {The, Roti}, {Teh, Kopi}, {Gula, Roti}, {Gula,
Kopi}, {Roti, Kopi}.
Tabel 3.11: himpunan yang mungkin terbentuk untuk k=2 (2 unsur)
T Sus Teh H T Sus Gul H T Sus Roti H
u u a u
T1 1 1 P T1 1 1 P T1 1 0 S
T2 0 1 S T2 0 1 S T2 0 1 S
T3 0 1 S T3 0 1 S T3 0 0 S
T4 1 0 S T4 1 0 S T4 1 1 P
T5 1 0 S T5 1 1 P T5 1 1 P
T6 0 1 S T6 0 1 S T6 0 0 S
T7 1 0 S T7 1 1 P T7 1 0 S
T8 1 0 S T8 1 1 P T8 1 0 S
T9 1 0 S T9 1 0 S T9 1 1 P
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 61

T1 0 1 S T1 0 1 S T1 0 0 S
0 0 0
∑ 1 ∑ 4 ∑ 3

T Sus Kop H T Teh Gul H T Teh Roti H


u i a
T1 1 0 S T1 1 1 P T1 1 0 S
T2 0 0 S T2 1 1 P T2 1 1 P
T3 0 0 S T3 1 1 P T3 1 0 S
T4 1 0 S T4 0 0 S T4 0 1 S
T5 1 0 S T5 0 1 S T5 0 1 S
T6 0 0 S T6 1 1 P T6 1 0 S
T7 1 1 P T7 0 1 S T7 0 0 S
T8 1 1 P T8 0 1 S T8 0 0 S
T9 1 1 P T9 0 0 S T9 0 1 S
T1 0 1 S T1 1 1 P T1 1 0 S
0 0 0
∑ 3 ∑ 5 ∑ 1

T Teh Kop H T Gul Roti H T Gul Kop H


i a a i
T1 1 0 S T1 1 0 S T1 1 0 S
T2 1 0 S T2 1 1 P T2 1 0 S
T3 1 0 S T3 1 0 S T3 1 0 S
T4 0 0 S T4 0 1 S T4 0 0 S
T5 0 0 S T5 1 1 P T5 1 0 S
T6 1 0 S T6 1 0 S T6 1 0 S
T7 0 1 S T7 1 0 S T7 1 1 P
T8 0 1 S T8 1 0 S T8 1 1 P
T9 0 1 S T9 0 1 S T9 0 1 S
T1 1 1 P T1 1 0 S T1 1 1 P
0 0 0
∑ 1 ∑ 2 ∑ 3
62 Data Mining : Algoritma dan Implementasi

T Roti Kop H
i
T1 0 0 S
T2 1 0 S
T3 0 0 S
T4 1 0 S
T5 1 0 S
T6 0 0 S
T7 0 1 S
T8 0 1 S
T9 1 1 P
T1 0 1 S
0
∑ 1
Dari tabel-tabel 2 unsur di atas, P merupakan item-item yang dijual bersamaan,
sedangkan S merupakan item-item yang dijual secara bersamaan atau tidak
terjadi transaksi. Σ melambangkan jumlah Frequent Itemset (Ф). Jumlah
Frequent Itemset (Ф) harus lebih besar atau sama dengan jumlah Frekuensi item
set (Σ >= Ф). Dari tabel 3.11 di atas, maka didapat:
F2= {{Teh, Gula}, {Susu, Gula}, {Susu, Roti}, {Susu, Kopi}, {Gula, Kopi},
{Gula, Roti}}
Kombinasi dari itemset dalam F2, dapat kita gabungkan menjadi calon 3-
itemset. Itemset-itemset yang dapat digabungkan adalah itemset-itemset yang
memiliki kesamaan dalam k-1 item pertama.
Untuk k=3 (3 unsur), himpunan yang mungkin terbentuk adalah: {Teh, Gula,
Susu, Roti, Kopi}.
Tabel 3.12: himpunan yang mungkin terbentuk untuk k=3 (3 unsur)
T Teh Gula Susu Hasil T Teh Gula Roti Hasil
T1 1 1 1 P T1 1 1 0 S
T2 1 1 0 S T2 1 1 1 S
T3 1 1 0 S T3 1 1 0 S
T4 0 0 1 S T4 0 0 1 S
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 63

T5 0 1 1 S T5 0 1 1 S
T6 1 1 0 S T6 1 1 0 S
T7 0 1 1 S T7 0 1 0 S
T8 0 1 1 S T8 0 1 0 S
T9 0 0 1 S T9 0 0 1 S
T10 1 1 0 S T10 1 1 0 S
∑ 1 ∑ 1

T Teh Gula Kopi Hasil T Teh Susu Roti Hasil


T1 1 1 0 S T1 1 1 0 S
T2 1 1 0 S T2 1 0 1 S
T3 1 1 0 S T3 1 0 0 S
T4 0 0 0 S T4 0 1 1 S
T5 0 1 0 S T5 0 1 1 S
T6 1 1 0 S T6 1 0 0 S
T7 0 1 1 S T7 0 1 0 S
T8 0 1 1 S T8 0 1 0 S
T9 0 0 1 S T9 0 1 1 S
T10 1 1 1 P T10 1 0 0 S
∑ 1 ∑ 0

T Teh Susu Kopi Hasil T Teh Roti Kopi Hasil


T1 1 1 0 S T1 1 0 0 S
T2 1 0 0 S T2 1 1 0 S
T3 1 0 0 S T3 1 0 0 S
T4 0 1 0 S T4 0 1 0 S
T5 0 1 0 S T5 0 1 0 S
T6 1 0 0 S T6 1 0 0 S
T7 0 1 1 S T7 0 0 1 S
T8 0 1 1 S T8 0 0 1 S
T9 0 1 1 S T9 0 1 1 S
64 Data Mining : Algoritma dan Implementasi

T10 1 0 1 S T10 1 0 1 S
∑ 0 ∑ 0

T Gula Susu Roti Hasil T Gula Susu Kopi Hasil


T1 1 1 0 S T1 1 1 0 S
T2 1 0 1 S T2 1 0 0 S
T3 1 0 0 S T3 1 0 0 S
T4 0 1 1 S T4 0 1 0 S
T5 1 1 1 P T5 1 1 0 S
T6 1 0 0 S T6 1 0 0 S
T7 1 1 0 S T7 1 1 1 P
T8 1 1 0 S T8 1 1 1 P
T9 0 1 1 S T9 0 1 1 S
T10 1 0 0 S T10 1 0 1 S
∑ 1 ∑ 2

T Susu Roti Kopi Hasil


T1 1 0 0 S
T2 0 1 0 S
T3 0 0 0 S
T4 1 1 0 S
T5 1 1 0 S
T6 0 0 0 S
T7 1 0 1 S
T8 1 0 1 S
T9 1 1 1 P
T10 0 0 1 S
∑ 1
Dari tabel 3.12 di atas, maka
F3= {Gula, Susu, Kopi}
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 65

karena hanya kombinasi inilah yang memiliki frekeunsi kemunculan


>= ф
4. Tentukan (ss-s) sebagai antecedent dan s sebagai consequent dari Fk
(frequent itemset of size k) yang telah didapat pada F2 dan F3. Di mana
himpunan F2= {{Teh, Gula}, {Susu, Gula}, {Susu, Roti}, {Susu,
Kopi}, {Gula, Kopi}, {Gula, Roti}} dan F3= {Gula, Susu, Kopi}.
Maka dapat disusun himpunan F2:
a) Untuk {Teh, Gula}:
Jika (ss-s) = Teh, Jika s = Gula, Maka →If beli Teh then beli Gula
Jika (ss-s) = Gula, Jika s = Teh, Maka →If beli Gula then beli Teh
b) Untuk {Susu, Gula}:
Jika (ss-s) = Susu, Jika s = Gula, Maka →If beli Susu then beli Gula
Jika (ss-s) = Gula, Jika s = Susu, Maka →If beli Gula then beli Susu
c) Untuk {Susu, Roti}:
Jika (ss-s) = Susu, Jika s = Roti, Maka →If beli Susu then beli Roti
Jika (ss-s) = Roti, Jika s = Susu, Maka →If beli Roti then beli Susu
d) Untuk {Susu, Kopi}:
Jika (ss-s) = Susu, Jika s = Kopi, Maka →If beli Susu then beli Kopi
Jika (ss-s) = Kopi, Jika s = Susu, Maka →If beli Kopi then beli Susu
e) Untuk {Gula, Kopi}:
Jika (ss-s) = Gula, Jika s = Kopi, Maka →If beli Gula then beli Kopi
Jika (ss-s) = Kopi, Jika s = Gula, Maka →If beli Kopi then beli Gula
f) Untuk {Gula, Roti}:
Jika (ss-s) = Gula, Jika s = Roti, Maka →If beli Gula then beli Roti
Jika (ss-s) = Roti, Jika s = Gula, Maka →If beli Roti then beli Gula
Maka dapat disusun himpunan F3:
a) Untuk {Gula, Susu, Kopi}:
Jika (ss-s) = Gula dan Susu, Jika s = Kopi, Maka →If beli Gula and
Susu then beli Kopi
b) Untuk {Gula, Kopi, Susu}:
Jika (ss-s) = Gula dan Kopi, Jika s = Susu, Maka →If beli Gula and
Kopi then beli Susu
c) Untuk {Kopi, Susu, Gula}:
66 Data Mining : Algoritma dan Implementasi

Jika (ss-s) = Kopi dan Susu, Jika s = Kopi, Maka →If beli Kopi and
Susu then beli Gula
5. Dari langkah di atas, maka kita memperoleh 12 rule untuk F2 dan 3 rule
untuk F3 yang dapat digunakan:
If beli Teh then beli Gula
If beli Gula then beli Teh
If beli Susu then beli Gula
If beli Gula then beli Susu
If beli Susu then beli Roti
If beli Roti then beli Susu
If beli Susu then beli Kopi
If beli Kopi then beli Susu
If beli Gula then beli Kopi
If beli Kopi then beli Gula
If beli Gula then beli Roti
If beli Roti then beli Gula
If beli Gula and Susu then beli Kopi
If beli Gula and Kopi then beli Susu
If beli Kopi and Susu then beli Gula

6. Hitung support dan confidence dengan menggunakan rumus 3.2 dan 3.3
seperti pada tabel 3.13 berikut:
Tabel 3.13: Perhitungan support dan confidence
If antecedent then consequent Support confidence
If beli Teh then beli Gula (5/10)x100%=50% (5/5)x100%=100%

If beli Gula then beli Teh (5/10)x100%=50% (5/8)x100%=62,5%


If beli Susu then beli Gula (4/10)x100%=40% (4/6)x100%=66,7%
If beli Gula then beli Susu (4/10)x100%=40% (4/8)x100%=50%
If beli Susu then beli Roti (3/10)x100%=30% (3/6)x100%=50%
If beli Roti then beli Susu (3/10)x100%=30% (3/4)x100%=75%
If beli Susu then beli Kopi (3/10)x100%=30% (3/6)x100%=50%
If beli Kopi then beli Susu (3/10)x100%=30% (3/4)x100%=75%
If beli Gula then beli Kopi (3/10)x100%=30% (3/8)x100%=37,5%
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 67

If antecedent then consequent Support confidence


If beli Kopi then beli Gula (3/10)x100%=30% (3/4)x100%=75%
If beli Gula then beli Roti (2/10)x100%=20% (2/8)x100%=25%
If beli Roti then beli Gula (2/10)x100%=20% (2/4)x100%=50%
If beli Gula and Susu then beli Kopi (2/10)x100%=20% (2/4)x100%=50%
If beli Gula and Kopi then beli Susu (2/10)x100%=20% (2/3)x100%=66,7%
If beli Kopi and Susu then beli Gula (2/10)x100%=20% (2/3)x100%=66,7%

7. Setelah perhitungan nilai support dan confidence diperoleh (tabel


3.13), kemudian lakukan perkalian antara support dan confidence, di
mana confidence nya diambil 60% (untuk kasus ini nilai confidence
diambil 60% keatas. Proses penentuan confidence berbeda disetiap
kasus. Disesuaikan dengan contoh kasus. Pemberian nilai dilakukan
berdasarkan hasil perhitungan support dan confidence. Gunakan konsep
penalaran dalam mengambil nilai confidence yang dijadikan patokan.
Tabel 3.14: Nilai confidence nya 60% ke atas
If antecedent then consequent Support confidence Support x
confidence
If beli Teh then beli Gula 50% 100% 0,50000
If beli Gula then beli Teh 50% 62,5% 0,31250
If beli Susu then beli Gula 40% 66,7% 0,26680
If beli Roti then beli Susu 30% 75% 0,22500
If beli Kopi then beli Susu 30% 75% 0,22500
If beli Kopi then beli Gula 30% 75% 0,22500
If beli Gula and Kopi then beli 20% 66,7% 0,13340
Susu
If beli Kopi and Susu then beli 20% 66,7% 0,13340
Gula
8. Setelah perkalian support dan confidence dilakukan, hasil perkalian
yang paling tinggi adalah rule yang dipakai pada saat menjual. Karena
Bab 3 Asosiasi Data Mining dengan Algoritma A Priori 67

dari hasil ke-8 penjualan bernilai sama, maka ke-8 penjualan dapat
dijadikan rule.
a) If beli Teh then beli Gula dengan support 50% dan confidence
100%.
b) If beli Gula then beli The dengan support 50% dan confidence
62,5%.
c) If beli Susu then beli Gula dengan support 40% dan confidence
66,7%.
d) If beli Roti then beli Susu dengan support 30% dan confidence
75%.
e) If beli Kopi then beli Susu dengan support 30% dan confidence
75%.
f) If beli Kopi then beli Gula dengan support 30% dan confidence
75%.
g) If beli Gula and Kopi then beli Susu dengan support 20% dan
confidence 66,7%.
h) If beli Kopi and Susu then beli Gula dengan support 20% dan
confidence 66,7%.

Anda mungkin juga menyukai