Abstrak
Data mining adalah disiplin ilmu yang mempelajari sebuah teknik dari pola, statistik, database
untuk menggali informasi yang berguna dan berharga. Suatu Swalayan Indomaret pasti
mempunyai data transaksi penjualan. Data transaksi penjualan ini seringkali diperlakukan
hanya sebagai rekaman tanpa pengolahan lebih lanjut sehingga tidak mempunyai nilai guna
lebih, dari data transaksi penjualan dapat diketahui informasi yaitu mengetahui pola pembelian
konsumen dengan teknik aturan asosiasi menggunakan metode algoritma apriori. Penelitian ini
memanfaatkan data primer yang masih baru yaitu data transaksi penjualan dari bulan
September sampai Oktober tahun 2015. Hasil yang didapat dari pengolahan data transaksi
penjualan berupa itemset dengan penerapan konsep analisis asosiasi mining diketahui nilai
support pada tiap item,kombinasi item, nilai confidence dalam pembentukan frequent itemset.
Maka, diketahui barang yang paling banyak dibeli secara bersamaan oleh konsumen indomaret
yaitu jika membeli mie instan maka membeli air mineral dengan nilai confidence 77%, jika
membeli rokok maka membeli air mineral dengan nilai confidence 60%, jika membeli air
mineral maka membeli rokok dengan nilai confidence 27%, dan jika membeli air mineral maka
membeli mie instan dengan nilai confidence 20%. Informasi ini sangat berguna bagi pihak
pengelola indomaret untuk menyusun strategi dengan menambah persediaan barang dan
menyusun tata letak barang secara berdekatan.
Kata Kunci : Data Mining, Algoritma Apriori, Aturan Asosiasi, Transaksi penjualan indomaret
Abstract
Data mining is a discipline that learns about the techniques of pattern, Statistics and database
to find out information which is useful and valuable. A minimarket, for example Indomaret,
must has sales transaction data. The longer daily sales transaction data, the more it will lead to
accumulation of data. The accumulation of data can be an useful information to determine
consumer purchasing patterns with the technique of association rules using a priori algorithm.
This study utilizes newer primary data, it is the sales transaction data from September to
October 2015. The results of the data processing is the form of itemset with the application of
the concept of mining association analysis support in the unknown value of each item, a
combination of items, the value of confidence in the establishment frequent itemset. Thus, it will
be known what is the most purchasing items by customers. For example, if someone buys noodle
then he will buy mineral water in 77% confidence level, if he buys mineral water then he will
buy cigarettes in 60% confidence level, if he buys mineral water then he will buy cigarettes in
27% confidence level, and if he buys mineral water then he will buy instant noodles with 20 %
confidence level. This information is very useful for the Indomaret manager to develop
strategies to increase the supply of goods and arrange the layout of the adjacent goods.
Keywords : Data Mining, Apriori Algorithm, Association Rules, Indomaret Sales Transaction
2
itemset yang dijalankan pada pada Indomaret Indraprasta Semarang,
sekumpulan data. Analisis apriori berdasarkan data transaksi penjualannya
adalah suatu proses untuk menemukan ?”.
semua aturan apriori yang memenuhi 1.3. Batasan Masalah
syarat minimum untuk support dan Sesuai dengan rumusan masalah diatas
syarat minimum untuk confidence [3]. maka batasan masalah yang dibahas
Penerapan Algoritma Apriori dapat hanya meliputi :
membantu dalam membentuk kandidat 1.Data yang digunakan adalah data
kombinasi item, kemudian dilakukan transaksi penjualan pada bulan
pengujian apakah kombinasi tersebut September sampai Oktober 2015.
memenuhi parameter support dan 2.Penelitian menggunakan metode
confidence minimum yang merupakan market basket analysis dengan
nilai ambang yang diberikan oleh algoritma apriori.
peneliti. Jika memenuhi parameter 3.Penerapan konsep analisis asosiasi
support dan confidence maka hasil mining melalui support dan confidence.
tersebut dapat membantu dalam 4.Penerapan kaidah asosiasi dalam
penentuan pola pembelian barang dan bentuk frequent itemset.
membantu tata letak barang berdasarkan 1.4. Tujuan Penelitian
kencenderungan konsumen membeli Berdasarkan rumusan masalah diatas
barang[2]. tujuan penelitian ini adalah, sebagai
Market Basket Analysis dengan berikut :
algoritma apriori dapat meningkatkan 1.Analisis data transaksi penjualan di
penjualan karena dengan Indomaret Indraprasta Semarang.
menerapkannya dapat diketahui pola 2.Menerapkan algoritma apriori dalam
kebiasaan belanja pelanggan, sehingga menemukan pola pembelian konsumen.
barang - barang yang sering dibeli 1.5. Manfaat Penelitian
pelanggan ditempatkan secara strategis 1.Membantu perusahaan dalam
dan stoknya akan diperbanyak agar mengetahui pola keterkaitan barang
mencukupi, supaya tidak cepat habis yang sering dibeli pelanggan secara
dan barang - barang yang kurang bersamaan.
diminati pelanggan stoknya dikurangi 2.Membantu perusahaan untuk
agar tidak me numpuk yang bisa mengatur stok barang dan dapat
mengakibatkan kerugian bagi pengelola mempermudah mengatur peletakan
serta barang-barang yang sering dibeli barang berdasarkan pola keterkaitan
secara bersamaan oleh pelanggan akan barang yang satu dengan yang lainnya.
ditempatkan berdekatan.
Oleh karena itu peneliti akan II. LANDASAN TEORI
menggunakan metode Market Basket 2.1. Tinjauan Pustaka
Analysis dengan menerapkan algoritma a)Penelitian yang dilakukan oleh (Dewi
apriori dalam penelitian, untuk Kartika Pane, 2013)
mengetahui kebiasaan belanja Dalam penelitian ini menerapkan data
pelanggan sehingga memudahkan mining pada penjualan produk
dalam stok barang dan order barang. elektronik dengan algoritma apriori
1.2. Rumusan Masalah (studi kasus : kreditplus).
Dari latar belakang permasalahan yang b)Publikasi majalah ilmiah (Kennedi
sudah diuraikan diatas, dapat Tampubolon , Hoga Saragih, dan Bobby
dirumuskan masalah yang akan di cari Reza 2013)
solusinya yaitu : “Bagaimanakah Implementasi Data Mining Algoritma
melakukan analisis pola pembelian Apriori pada Sistem Persediaan alat-alat
konsumen dengan Algoritma Apriori kesehatan
3
c)Penelitian yang dilakukan oleh peninjauan kumpulan data untuk
(Almon Junior Simanjuntak, 2013) menemukan hubungan yang tidak
Aplikasi Data Mining Untuk Pemodelan diduga dan meringkas data dengan cara
Pembelian barang dengan menggunakan yang berbeda dengan sebelumnya, yang
Algoritma Apriori dapat dipahami dan bermanfaat bagi
d)Penelitian yang dilakukan oleh (A.A pemilik data.” (Larose, 2006). “Data
Gede Bagus Mariana dan I Made Dwi mining merupakan bidang dari beberapa
Putra Asana 2013) keilmuan yang menyatukan teknik dari
Analisis Keranjang Belanja dengan pembelajaran mesin, pengenalan pola,
Algoritma Apriori pada Perusahaan statistik, database, dan visualisasi untuk
Retail penanganan permasalahan pengambilan
e)Penelitian yang dilakukan oleh informasi dari database yang besar.”
(Wijhah Islamika 2014) (Larose, 2006).
Analisis Asosiasi Data Dengan 2.5. Algoritma Apriori
Algoritma Apriori Untuk Sistem Apriori termasuk jenis aturan asosiasi
Pendukung Keputusan Penjualan pada data mining. Aturan yang
Barang Berbasis Web menyatakan asosiasi antara beberapa
f)Penelitian yang dilakukan oleh (Robi atribut sering disebut affinity analysis
Yanto, Riri Khoiriah 2015) atau market basket analysis. Analisis
Implementasi Data Mining dengan asosiasi atau association rule mining
Metode Algoritma Apriori dalam adalah teknik data mining untuk
Menentukan Pola Pembelian Obat menemukan aturan asosiatif antara
2.2. Analisis suatu kombinasi item. Contoh analisis
Menurut KBBI (kamus besar bahasa asosiatif dari analisis pembelian di suatu
Indonesia) analisis adalah kata benda pasar swalayan adalah dapat
yang berarti penyelidikan terhadap diketahuinya berapa besar kemungkinan
suatu peristiwa untuk mengetahui seseorang pelanggan membeli roti
keadaan yang sebenarnya. Nosi lain bersamaan dengan susu. Dengan
untuk analisis adalah penjabar an pengetahuan tersebut, pemilik pasar
sesudah dikaji sebaik-baiknya dan swalayan dapat mengatur penempatan
pemecahan persoalan yang dimulai barangnya atau merancang kampanye
dengan dugaan akan kebenarannya. pemasaran dengan memakai kupon
2.3. Pola Pembelian Konsumen diskon untuk kombinasi barang tertentu.
Pola adalah bentuk atau model (atau, Karena analisis asosisasi menjadi
lebih abstrak, suatu set peraturan) yang terkenal karena aplikasinya untuk
bisa dipakai untuk membuat atau untuk menganalisis isi keranjang di pasar
menghasilkan suatu atau bagian. swalayan, analisis asosiasi juga sering
Definisi Pembelian adalah Suatu disebut market basket analysis. (Kusrini
pristiwa atau tindakan yang dilakukan dan Emha Taufiq Luthfi, 2009:149)
oleh dua belah pihak dengan tujuan Algoritma apriori merupakan algoritma
menukarkan barang atau jasa dengan yang paling terkenal untuk menemukan
menggunakan alat transaksi yang sah pola frekuensi tinggi. algoritma apriori
dan sama-sama memiliki kesepakatan dibagi menjadi beberapa tahap yang
dalam transaksinya. Konsumen adalah disebut narasi atau pass (Efori Buulolo,
setiap orang pemakai barang dan atau 2013) yaitu:
jasa yang tersedia dalam masyarakat, 1.Pembentukan kandidat itemset,
baik bagi kepentingan diri sendiri, kandidat k-itemset dibentuk dari
keluarga, maupun orang lain. kombinasi (k-1)-itemset yang didapat
2.4. Data Mining dari iterasi sebelumnya. Satu cara dari
Data mining merupakan analisis dari algoritma apriori adalah adanya
4
pemangkasan kandidat k-itemset yang dengan total transaksi yang terjadi pada
subset-nya yang berisi k-1 item tidak dataset.
termasuk dalam pola frekuensi tinggi 2.Pembentukan Aturan Asosiasi
dengan panjang k-1. Langkah yang dilakukan setelah
2.Penghitungan support dari tiap menentukan nilai support pada itemset
kandidat k-itemset. Support dari tiap berfrekuensi tinggi lalu dibentuk aturan
kandidat k-itemset didapat dengan asosiasi yang menyatakan kuatnya
menscan database untuk menghitung hubungan kombinasi itemset pada
jumlah transaksi yang memuat semua transaksi. Untuk menentukan aturan
item didalam kandidat k-itemset asosiasi yang terbentuk minimal itemset
tersebut. Ini adalah juga ciri dari harus memiliki dua kandidat X dan Y.
algoritma apriori dimana diperlukan Untuk menentukan aturan X → Y
penghitungan dengan cara seluruh digunakan rumus:
database sebanyak k-itemset terpanjang. Confidence(X→Y)=
3.Tetapkan pola frekuensi tinggi. Pola Σ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 𝑑𝑎𝑛 𝑌
frekuensi tinggi yang memuat k item Σ Transaksi mengandung X
atau k-itemset ditetapkan dari kandidat Pada rumus diatas untuk menentukan
k-itemset yang supportnya lebih besar nilai confidence pada aturan asosiasi,
dari minimum support. jumlah transaksi yang mengandung
4.Bila tidak didapat pola frekuensi item X dan Y dibagi dengan jumlah
tinggi baru maka seluruh proses transaksi yang mengandung item X.
dihentikan. Bila tidak, maka k ditambah 2.6. Swalayan Indomaret
satu dan kembali bagian 1. Supermarket atau pasar swalayan adalah
Metode dasar analisis asosiasi terbagi sebuah toko yang menjual segala
menjadi dua tahap : kebutuhan sehari-hari. Indomaret adalah
1.Pola frekuensi tinggi jaringan peritel waralaba di Indonesia.
Adalah tahap dimana pembentukan Indomaret merupakan salah satu anak
kombinasi antar item yang telah perusahaan Salim Group.Indomaret
memenuhi syarat minimum support merupakan jaringan minimarket yang
yang telah ditentukan sebelumnya. Nilai menyediakan kebutuhan pokok dan
support pada suatu itemset dapat kebutuhan sehari-hari.
diperoleh dengan menggunakan sebuah 2.7. WEKA
rumus di bawah ini: Weka adalah aplikasi data mining open
Support(X)
source berbasis Java. Aplikasi ini
Σ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 dikembangkan pertama kali oleh
= Total Transaksi
(1)
Universitas Waikato di Selandia Baru
Rumus diatas memiliki arti untuk sebelum menjadi bagian dari Pentaho.
menentukan nilai support pada satu item Weka terdiri dari koleksi algoritma
jumlah transaksi yang mengandung machine learning yang dapat digunakan
item X dibagi dengan jumlah transaksi untuk melakukan generalisasi atau
yang ada pada database. formulasi dari sekumpulan data
Sedangkan pada dua itemset atau lebih sampling.
diperoleh dengan rumus:
Support(X,Y)= III.METODOLOGI PENELITIAN
Σ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 𝑑𝑎𝑛 𝑌 3.1. Objek Penelitian
(2)
Total Transaksi Pada Penelitian ini objek yang akan di
Pada rumus diatas untuk menentukan ambil adalah sebuah swalayan
nilai support pada dua itemset atau Indomaret Indraprasta Semarang,
lebih, jumlah transaksi yang dengan mengambil data primer yaitu
mengandung item X dan Y dibagi data transaksi penjualan barang periode
5
bulan September dan Oktober tahun dalam bentuk 1 dan 0 atau format data
2015. dalam bentuk biner.
7
15÷315 = 4,76 jadi nilai support (air
11 MINYAK 1/315 0,32% mineral,air teh) yaitu 4,76% dan
12 PEMBALUT 3/315 0,95%
seterusnya. Berikut ini adalah nilai
support dari 2 kombinasi item:
13 PERMEN 23/315 7,30%
Support(X,Y)=
14 OBAT 3/315 0,95% Σ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 𝑑𝑎𝑛 𝑌
15 ORANGE 36/315 11,43% Total Transaksi
Minimum support kombinasi 2 item
16 ODOL 32/315 10,15%
yang ditentukan adalah 10% jadi barang
17 ROKOK 73/315 23,17% yang memiliki nilai support dibawah
18 ROTI 47/315 14,92% 10% akan dihilangkan, berikut ini
19 SABUN 40/315 12,70% barang yang memenuhi minimum
20 SABUN CUCI 4/315 1,27% support :
21 SABUN 27/315 8,57% No Itemset Jumlah MS 10%
WAJAH 1 Air mineral, 33 10,47%
22 SHAMPOO 17/315 5,40% Mie instan
23 SNACK 55/315 17,46% 2 Air mineral, 44 14%
24 SOFT DRINK 21/315 6,67% Rokok
25 SUSU 22/315 6,98%
26 TISSUE 27/315 8,57% 4.3.2 Pembentukan Aturan Asosiasi
Minimum support yang ditentukan Langkah yang dilakukan setelah
adalah 13% jadi barang yang memiliki mengetahui nilai support pada itemset
nilai support dibawah 13% akan berfrekuensi tinggi dengan minimum
dihilangkan, berikut ini barang yang support yang sudah ditentukan lalu
memenuhi minimum support : dibentuk aturan asosiasi yang
NO ITEM SET JUMLAH MS menyatakan kuatnya hubungan
13% kombinasi itemset pada transaksi yaitu
1 AIR 165 52,38% confidence. Untuk menentukan aturan
MINERAL
2 AIR TEH 45 14,28%
asosiasi yang terbentuk minimal itemset
harus memiliki dua kandidat X dan Y
3 MIE 43 13,65%
INSTAN pada tabel diatas sudah ditunjukan 2
4 ROKOK 73 23,17% kombinasi item, karena setelah
5 ROTI 47 14,92% dilakukan 3 kombinasi item tidak ada
yang memenuhi minimum support
6 SNACK 55 17,46%
maka 2 kombinasi yang memenuhi
Setelah itu barang yang memenuhi untuk pembentukan asosiasi peneliti
minimum support akan dikombinasikan menetapkan minimum confidence 20%.
lagi menjadi 2 item, peneliti
menetapkan nilai minimum support Rumus Confidence(X→Y) =
Σ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 𝑑𝑎𝑛 𝑌
sebesar 10 % untuk 2 item, mencari Σ Transaksi mengandung X
nilai support 2 item menggunakan Pada rumus diatas untuk menentukan
rumus Support(X,Y) = nilai confidence pada aturan asosiasi,
Σ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 𝑑𝑎𝑛 𝑌
Total Transaksi jumlah transaksi yang mengandung
, untuk menentukan nilai support pada item X dan Y dibagi dengan jumlah
dua item atau lebih, jumlah transaksi transaksi yang mengandung item X,
yang mengandung item X dan Y dibagi transaksi yang mengandung mie instan
dengan total transaksi yang ada pada dan air mineral berjumlah 33 sedangkan
dataset, transaksi yang mengandung air transaksi yang mengandung mie instan
mineral dan teh berjumlah 15 ada 43 maka 33÷43=0,77. Jadi, nilai
sedangkan total transaksi 315 maka confidence mie instan maka air mineral
8
yaitu 77%, berikut ini hasil akhirnya :
MS MC
HASIL AKHIR
10% 20%
MIE INSTAN,AIR
33/43 10,47% 77%
MINERAL
ROKOK,AIR
44/73 14% 60%
MINERAL
AIR
44/165 14% 27,00%
MINERAL,ROKOK
AIR
MINERAL,MIE 33/165 10,47% 20%
INSTAN
4.4. Pengujiam Menggunakan Weka
Untuk membuktikan data – data
yang telah dihasilkan berupa pola
hubungan kombinasi antar item dan
rule-rule asosiasi sesuai dengan
algoritma apriori yang sudah dihitung
secara manual maka dilakukan
pengujian dengan menggunakan suatu
aplikasi. Aplikasi yang digunakan
adalah Weka versi 3.7.13 sebagai Hasil Pengujian dengan WEKA dan
berikut : rule yang di tampilkan pada aplikasi
sama dengan perhitungan manual yang
dilakukan dengan algoritma apriori.
10