*Email: rifkynovrian@gmail.com
ABSTRAK
Kata kunci: data mining, market basket analysis, Apriori, Frequent Pattern Growth, Fuzzy C-Covering
ABSTRACT
Keywords: data mining, market basket analysis, Apriori, Frequent Pattern Growth, Fuzzy C-Covering
1. PENDAHULUAN asosiasi yang dihasilkan oleh masing-masing
algoritma akan dievaluasi dan dianalisa guna
Perkembangan teknologi informasi menemukan algoritma yang paling baik dan
telah memberikan kontribusi pada cepatnya sesuai (best-fit algorithm) untuk
pertumbuhan jumlah data yang dikumpulkan permasalahan yang dikaji dalam penelitian
dan disimpan dalam basis data berukuran ini.
besar (gunung data). Dibutuhkan sebuah
metode atau teknik yang dapat merubah
gunungan data tersebut menjadi sebuah
informasi berharga atau pengetahuan 2. METODE
(knowledge) yang bermanfaat untuk Adapun pada Market Basket
mendukung pengambilan keputusan bisnis. Analysis, kerangka pemikiran yang
Suatu teknologi yang dapat digunakan untuk digunakan meliputi [8]:
mewujudkannya adalah data mining [1]. Data a. Business Understanding
mining adalah proses mencari pola atau b. Data Understanding
informasi menarik dalam data terpilih dengan c. Pemilihan Model Data Mining
menggunakan teknik atau metode tertentu d. Pemilihan Algoritma Asosiasi
[2]. Salah satu metode yang sering e. Data Preparation
digunakan dalam teknologi data mining f. Data Mining
adalah metode asosiasi atau association rule g. Evaluasi dan Analisa
mining. Di dalam bidang usaha retail metode
association rule mining ini lebih dikenal Sehingga dapat digambarkan dalam bentuk
dengan istilah analisa keranjang belanja diagram sebagai berikut:
(market basket anaysis).
Market basket analysis adalah suatu
metodologi untuk melakukan analisis buying
habit konsumen dengan menemukan
asosiasi antar beberapa item yang berbeda,
yang diletakkan konsumen dalam shopping
basket (keranjang belanja) yang dibeli pada
suatu transaksi tertentu [6].
Dalam Market basket analysis,
algoritma yang umum digunakan adalah
algoritma Apriori, tetapi disamping itu ada
juga alternatif algoritma lainnya yang dapat
digunakan, antara lain algoritma FP Growth
dan Fuzzy C-Covering [3]. Dengan
peningkatan data transaksi yang semakin
besar, maka dirasa perlu dilakukan analisa
perbandingan terhadap kinerja masing-
masing algoritma tersebut guna mencari
algoritma terbaik untuk digunakan dalam
proses data mining market basket.
Dalam penelitian ini penulis akan
mencoba untuk melakukan suatu eksperimen
terhadap data transaksi penjualan produk di Gambar 1. Kerangka pemikiran penelitian market basket
analysis
minimarket Indomaret melalui sebuah
aplikasi yang menggunakan 3 metode Pengujian dari penelitian ini
market basket analysis untuk melihat dilakukan dengan menjalankan perangkat
hubungan asosiasi (korelasi) antara sejumlah lunak dengan masing-masing algoritma
atribut penjualan. Algoritma yang akan untuk melakukan proses data mining dengan
digunakan adalah algoritma Apriori, algoritma parameter yang sama, lalu membandingkan
Frequent Pattern Growth (FP-Growth), dan hasil yang diperoleh dari proses tersebut.
Fuzzy C-Covering. Ketiga algoritma ini Informasi data transaksi penjualan yang
digunakan untuk membentuk frequent digunakan untuk pengujian adalah sebagai
itemsets yang nantinya akan dijadikan berikut :
sebagai acuan untuk merumuskan aturan- Data : Transaksi penjualan
aturan asosiasi yang dihasilkan oleh model minimarket (periode
market basket analysis. Aturan-aturan Februari 2017)
Format : Database Lk = { c ϵ C't | c.count ≥ minsup}
Jml Transaksi : 3167 transaksi }
Jml Barang : 2093 barang return U kLk;
Pengolahan data yang dilakukan Dimana
pada penelitian ini adalah sebagai berikut: L : himpunan frequent itemset
1. Melakukan analisa data dengan minsup : minimum support
algoritma Apriori. C : himpunan kandidat itemset
2. Melakukan analisa data dengan c : kandidat itemset
algoritma FP-Growth. t : transaksi
3. Melakukan analisa data dengan
algoritma Fuzzy C-Covering. 2.2 Algoritma FP-Growth
4. Melakukan teknik analisis.
5. Evaluasi. FP-Growth adalah salah satu
alternatif algoritma yang dapat digunakan
2.1 Algoritma Apriori untuk menentukan himpunan data yang
paling sering muncul (frequent itemset)
Arti Apriori secara umum adalah dalam sebuah kumpulan data. FP-Growth
anggapan atau sikap yang sudah ditentukan menggunakan pendekatan yang berbeda
sebelum (melihat,menyelidiki) terhadap dari paradigma yang digunakan pada
sesuatu. Algoritma Apriori merupakan algoritma Apriori [6].
algoritma yang sangat terkenal untuk Algoritma FP-Growth merupakan
menemukan pola frekuensi tinggi. Pola pengembangan dari algoritma Apriori,
frekuensi tinggi ini digunakan untuk sehingga kekurangan dari algoritma Apriori
menyusun aturan assosiatif dan juga diperbaiki oleh algoritma FP-Growth. Pada
beberapa teknik data mining lainnya. Aturan algoritma Apriori diperlukan generate
yang menyatakan asosiasi antara beberapa candidate untuk mendapatkan frequent
atribut sering disebut sebagai affinity analysis itemsets. Akan tetapi, pada algoritma FP-
atau market basket analysis [7]. Algoritma Growth, generate candidate tidak dilakukan
Apriori digunakan untuk mencari frequent karena FP-Growth menggunakan konsep
itemset yang memenuhi minimum support pembangunan tree dalam pencarian frequent
kemudian mendapatkan rule yang memenuhi itemsets. Hal tersebutlah yang menyebabkan
minimum confidence dari frequent itemset algoritma FP-Growth lebih cepat dari
tadi [5]. Adapun dua proses utama yang algoritma Apriori [6].
dilakukan dalam algoritma Apriori, yaitu [10]: Karakteristik algoritma FP-Growth
1. Join yaitu struktur data yang digunakan adalah
Setiap item dikombinasikan dengan item tree yang disebut dengan FP-Tree. Dengan
yang lainnya sampai tidak terbentuk menggunakan FP-Tree, algoritma FP-Growth
kombinasi lagi dapat langsung mengekstrak frequent
2. Prune (pemangkasan) itemset dari FP-Tree.
Hasil dari item yang telah dikombinasikan Penggalian itemset yang frequent
tadi lalu dipangkas dengan menggunakan dengan menggunakan algoritma FP-Growth
minimum support yang telah ditentukan akan dilakukan dengan cara membangkitkan
user. struktur data tree atau disebut dengan FP-
Bentuk algoritma dari metode Apriori dapat Tree. Metode FP-Growth dapat dibagi
dituliskan sebagai berikut [7] : menjadi 3 tahapan utama, yaitu sebagai
berikut [9]:
L1 = {frequent itemset with one element} 1. Tahap pembangkitan conditional pattern
for (k=2; Lk-1 ≠Ø ; k++) base.
{ 2. Tahap pembangkitan conditional FP-Tree.
Ck = apriori-gen(Lk-1); //pembuatan kandidat 3. Tahap pencarian frequent itemset.
baru Ketiga tahap tersebut merupakan langkah
for all transactions t yang akan dilakukan untuk mendapatkan
{ frequent itemset, yang dapat dilihat pada
C't = subset (Ck, t); //kandidat yang algoritma berikut:
tampil pada t
for all candidates C ϵ C’t do Input : FP-Tree Tree
c.count ++; Output : Rt sekumpulan lengkap pola
} frequent
Method : FP-Growth (Tree, null)
Procedure : FP-Growth (Tree, α) Degree of Similarity in Fuzzy C-Covering
{ Setiap crisp element dari data I juga
01 : if Tree mengandung single path P;
dapat direpresentasikan sebagai fuzzy set
02 : then untuk tiap kombinasi (dinotasikan
dari fuzzy classes (T) dengan rumus [6]:
β) dari node-node dalam path do
03 : bangkitkan pola β α dengan support dari μtj (im )
node-node dalam β, μim (t j ) = . . (4)
∑𝑖∈𝐼 𝜇𝑡𝑗 (𝑖)
04 : else untuk tiap a1 dalam header dari
Tree do
{
05 : bangkitkan pola Fuzzy Conditional Probability Relation
06: bangun β = a1 α dengan support =
a1.support Umumnya, dalam mengukur serajat
07 : if Tree β = θ kesamaan antara dua fuzzy set digunakan
08 : then panggil FP-growth (Tree, β) fuzzy conditional probality relation dengan
} rumusan sebagai berikut [6]:
} R(X, Y) = P(X|Y) =
|X∩Y|
=
∑𝑖∈𝐼 min{𝜇𝑥 (𝑖),𝜇𝑌 (𝑖)}
Y ∑𝑖∈𝐼 𝜇𝑌 (𝑖)
20
Rule
15
Minsup=2
10 0
Minsup=4
5 0
0
Dari semua hasil uji coba di atas,
dibuat suatu grafik berdasarkan nilai support
dan waktu yang dibutuhkan untuk mencari
frequent k-itemset (Process Time). Grafik
tersebut dapat dilihat pada gambar dibawah
ini.
Gambar 4.10. Diagram perbandingan rule
Apriori, FP-Growth, dan Fuzzy C-Covering
pada 3000 transaksi
Grafik Perbandingan Rule
Algoritma Apriori, FP-Growth,
dan Fuzzy C-Covering pada
3000 Transaksi Perbandingan Waktu Apriori,
FP-Growth, dan Fuzzy C-
40 Covering pada 2000 Transaksi
35
3500
30
3000
Rule
25 Minsup = 20 2500
20 Minsup= 20
Waktu
Minsup = 40 2000
15 Minsup= 40
1500
10
1000
5
500
0
0
*Satuan Detik
6000
5000
UCAPAN TERIMA KASIH
Waktu
4000
3000
2000 1. Bapak Drs. H. Darsono selaku Ketua
1000 Minsup= 20 Yayasan Sasmita Jaya.
0 Minsup= 40 2. Bapak Dr. Rasmadi selaku Ketua STMIK
Eresha dan Dosen pembimbing Utama.
3. Bapak Dr. Makhsun, M.Si selaku Ketua
Program Studi Pascasarjana Magister
Komputer.
4. Bapak Ahmad Fikri Zulfikar, M.kom selaku
*Satuan Detik Dosen pembimbing pendamping.
5. Kedua orang tua serta istri yang telah
banyak memberikan doa, motivasi, dan
Gambar 4.12. Diagram perbandingan
dorongan dalam penyelesaian tesis ini.
waktu Apriori, FP-Growth, dan Fuzzy C-
6. PT. Indomarco Prismatama, selaku
Covering pada 3000 transaksi
perusahaan pemilik minimarket Indomaret
yang telah memberikan kesempatan dan
informasi data penjualan untuk digunakan
sebagai sumber data dalam tesis ini.
4. KESIMPULAN 7. Rekan-rekan kuliah kelas A STMIK
Berdasarkan uraian analisa dari Eresha atas kebersamaan dan
sistem yang sudah dijalankan, maka dapat bantuannya
disimpulkan sebagai berikut : 8. Pihak lainnya yang tidak dapat saya
a. Algoritma Apriori melakukan scanning sebutkan satu persatu yang telah
data secara berulang pada tiap memberi dukungan dan bantuan dalam
kombinasi item sehingga proses penulisan penelitian ini
menjadi lambat dan tidak efisien.
Algoritma FP-Growth memiliki
perulangan yang lebih ringkas
berdasarkan struktur tree dan hanya DAFTAR PUSTAKA
melakukan 2 kali scanning data.
Algoritma Fuzzy C-Covering [1] CRISP-DM. “Cross Industry Standard
membutuhkan proses pengelompokan Process for Data Mining” [On-
item berdasarkan transaksi terlebih line].http://www.crisp-
dahulu sebelum melakukan perulangan dm.org/Process/index.html” [July 28,
kombinasi dimana pada tiap perulangan 2017].
dibatasi oleh nilai support. [2] Eko Prasetyo.Data Mining : Konsep Dan
b. Dari hasil peneltian yang telah Aplikasi Menggunakan Matlab.
dilakukan, algoritma FP-Growth Yogyakarta: Penerbit Andi, 2013.
membutuhkan waktu proses yang paling
singkat daripada algoritma Apriori dan [3] Eko Prasetyo.Data Mining : Mengolah
Fuzzy C-Covering. Sedangkan algoritma Data Menjadi Informasi. Yogyakarta:
Apriori membutuhkan waktu proses Penerbit Andi, 2014.
yang paling lama daripada algoritma FP-
Growth dan Fuzzy C-Covering. [4] Fathansyah. Basis Data.
c. Algortima Fuzzy C-Covering Informatika.2015.
menghasilkan rule yang lebih sedikit [5] Han, J. Kamber, M. DataMining: Concepts
dibandingkan dengan algoritma Apriori and Techniques : Chapter 6. Mining
dan FP-Growth. Pada analisis hasil Association Rules in Large Databases.
pengujian, ditemukan bahwa semakin Simon Fraser University, 2000.
kecil minimum support dan confidence
yang ditemukan maka semakin banyak
[6] Hermawati, F. A. Data Mining.
Yogyakarta: Penerbit Andi, 2013.
[7] Kusrini, dkk. Algoritma Data Mining.
Yogyakarta : Andi Offset, 2009.
[8] Larose, Daniel T. Discovering Knowledge
in Data : An Introduction to Data Mining.
John Willey & Sons, Inc., 2005.
[9] Dicky Novriansyah. dkk. Algoritma Data
Mining dan Pengujian.Yogyakarta : Andi
Offset, 2015.
[10] Nugroho. Teori Data Mining dan
Aplikasi, Jakarta : Graha Ilmu, 2014.