id
JURNAL RESTI
(Rekayasa Sistem dan Teknologi Informasi)
Vol. 2 No. 2 (2018) 472 – 478 ISSN : 2580-0760 (media online)
Erlin Elisa
Universitas Putera Indonesia,Fakultas Teknik dan Komputer,Sistem Informasi,elin210110@gmail.com
Abstract
Data mining is a technique to extract new information from the data warehouse, information is considered very
important and valuable because by mastering the information so easily to achieve a goal, this makes everyone
competing to obtain information, as well as on trading businesses such as minimarket Ayu in Kota Batam.
Minimarket is located close to the home of the population, this certainly affects the level of sales, with the daily
sales activities, sales transaction data will continue to grow, causing data storage is greater. Sales transaction
data is only used as an archive without being put to good use. Basically the data set has very useful information.
The analysis of market basket with Apriori Algorithm is one method of data mining which aims to find the
pattern of association based on consumer spending pattern, so that it can be known what items are purchased
simultaneously. The result of this research found that the highest support and confidence value is Oil and Milk
with a support value of 42.85% and confidence of 85.71%.
Keywords: Data Mining, Market Basket Analysis, Association Rules, Apriori Algorithms
Abstrak
Data mining merupakan teknik untuk menggali informasi baru dari gudang data, informasi dipandang sangat
penting dan berharga karena dengan menguasai informasi maka dengan mudah untuk mencapai sebuah tujuan,
hal ini membuat setiap orang berlomba untuk memperoleh informasi, demikian juga pada usaha perdagangan
seperti minimarket Ayu di Kota Batam. Minimarket ini berlokasi dekat dengan rumah penduduk, hal ini tentunya
mempengaruhi tingkat penjualan, dengan adanya kegiatan penjualan setiap hari, data transaksi penjualan akan
terus bertambah, menyebabkan penyimpanan data semakin besar. Data transaksi penjualan hanya dijadikan arsip
tanpa dimanfaatkan dengan baik. Pada dasarnya kumpulan data memiliki informasi yang sangat bermanfaat.
Analisis keranjang pasar dengan Algoritma Apriori merupakan salah satu metoda data mining yang bertujuan
untuk mencari pola assosiasi berdasarkan pola belanja yang dilakukan konsumen, sehingga bisa diketahui item-
item barang apa saja yang dibeli secara bersamaan, Hasil dari penelitian ini menemukan Nilai support dan
confidence tertinggi adalah Minyak dan Susu dengan nilai support 42,85% dan confidence 85,71%.
Kata kunci: Data Mining, Analisa Keranjang Pasar, Metode Asosiasi, Algoritma Apriori.
Potensi bisnis minimarket Indonesia 2017 akan lebih diantara produk-produk yang dipasarkan, misalnya
baik dibandingkan dengan tahun lalu. Para pelaku menemukan bahwa produk A biasanya dibeli
retail mematok pertumbuhan bisnis ritel Indonesia bersamaan dengan produk B dalam waktu tertentu dan
mencapai 12%, angka ini menurut data Aprindo jumlah tertentu. Teknik ini merupakan salah satu cara
(Asosiasi Pengusaha Ritel Indonesia) pertumbuhan untuk melakukan data mining yang berguna untuk
retail 2016 optimis berada diangka 10% lebih baik menemukan knowledge dari data-data yang ada [3].
dari 2015 yang hanya mencapai 8%. Salah satu jenis Knowledge tersebut dapat digunakan oleh perusahaan
usaha ritel yang masih sangat prospektif adalah adalah untuk meningkatkan keuntungan atau menentukan
minimarket. Menurut penelitian [2]. pada jurnal strategi pemasaran.
penelitiannya yang berjudul perbedaan pelayanan pada
ritel tradisional dengan ritel modern menyebutkan 2. Tinjauan Pustaka
Industri ritel tumbuh pesat dengan menjamurnya pasar
2.1 Penelitian Terdahulu
modern. Yang dimaksud dengan pasar modern adalah
minimarket atau swalayan yang mana pelayanan Berdasarkan pengamatan penelitan terdahulu tentang
dilakukan sendiri oleh konsumen karena toko tidak Penerapan Metode Association Rule Menggunakan
menyediakan pramuniaga yang khusus melayanan Algoritma Apriori Pada Simulasi Prediksi Hujan
konsumen. Salah satu jenis pasar modern yang saat ini Wilayah Kota Bandung”. Dataset yang digunakan
sedang berkembang pesat menawarkan kepraktisan adalah data klimatologi yang diambil dari BMKG
dan kecepatan atau waktu yang tidak lama dalam stasiun geofisika kelas 1 Bandung. Hasil akhir dari
berbelanja dengan didukung luas dari toko atau gerai Penelitian ini berupa aturan-aturan asosiasi
tidak terlalu besar, sekitar 90-150 meter persegi dan (association rules) dimana aturan-aturan ini dapat
menjual 3.000-4.000 jenis barang dijadikan sebagai acuan dalam memprediksi cuaca
hujan atau tidak hujan untuk satu hari kedepan [4].
Pada saat sekarang ini jumlah minimarket terus
berkembang membuat para pengelola minimarket juga Sedangkan pengamatan pada penelitian tentang
dituntut untuk menerapkan strategi pemasaran yang Pemanfaatan Algoritma Apriori untuk Perancangan
lebih baik. Untuk itu maka para pengelola harus Ulang Tata Letak Barang di Toko Busana”, Penelitian
mencermati pola-pola pembelian yang dilakukan oleh ini menggunakan algoritma Apriori untuk
konsumen seperti usaha minimarket di kota batam. menganalisis pola belanja konsumen (market basket
Kota batam merupakan kota dengan pertumbuhan analysis) di toko busana muslimah karena
ekonomi yang baik salah satunya dapat dilihat dari pertimbangan masih sedikitnya penelitian dalam
banyaknya usaha ritel seperti minimarket, usaha konteks serupa. Hasil penelitian berupa sistem
minimarket ini sangat diminati oleh pedagang baik berbasis web yang menghasilkan aturan asosiasi
yang berasal dari luar kota batam maupun pribumi sehingga penataan ulang bisa dilakukan secara
karena hasil keuntungan yang diperoleh dari usaha ini dinamis. Pengujian dengan dataset baru dan
sangat menjanjikan. Minimarket ayu sebagai salah perbandingan dengan Weka membuktikan bahwa
satu minimarket yang lokasinya strategis dekat sistem berhasil menerapkan algoritma Apriori.
komplek perumahan dan sekolah tentunya kegiatan Keberhasilan dinilai berdasarkan kesamaan aturan
penjualan pada setiap harinya meningkat. Dengan asosiasi pada Weka dengan aturan asosiasi pada
meningkatnya jumlah penjualan maka, ditemukan sistem.[5]. Algoritama apriori digunakan karena
banyak kekurangan yang terjadi, diantaranya algoritma ini merupakan teknik asosiasi yang
permasalahan peletakkan barang-barang yang tidak sederhana untuk menentukan pola pembelian
sesuai dengan perilaku kebiasaan konsumen dalam konsumen dan memperkirakan di masa yang akan
membeli barang secara bersamaan dalam satu waktu. datang untuk menata barang dalam keadaan yang
Hal ini tentu akan mempengaruhi tingkat penjualan dinamis.
barang. Data transaksi penjualan akan terus bertambah
setiap harinya dan menyebabkan penyimpanan data 2.2 Data Mining
yang sangat besar. Kebanyakan data transaksi
penjualan hanya dijadikan arsip saja tanpa Data mining, sering juga disebut sebagai knowledge
dimanfaatkan dengan baik. Padahal kumpulan data discovery in database (KDD) adalah kegiatan yang
tersebut memiliki informasi yang sangat bermanfaat. meliputi pengumpulan, pemakaian data, historis untuk
menemukan keteraturan, pola atau hubungan dalam
Berdasarkan permasalahan di atas, maka pada set data berukuran besar [6].
minimarket ayu diperlukan adanya teknik data mining
untuk mengelompokkan data barang berdasarkan Secara umum tahapan – tahapan proses Knowledge
kecenderungannya yang muncul bersamaan dalam Discovery in Databases terdiri dari [7] :
suatu transaksi, Market Basket Analysis atau analisa 1. Data Cleaning
keranjang pasar adalah suatu metode yang bekerja Proses menghilangkan noise dari data yang tidak
mencari dan menemukan pola-pola yang berasosiasi konsisten.
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
473
Erlin Elisa
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
Menurut Turban dalam bukunya yang berjudul Algoritma apriori adalah adalah algoritma yang paling
”Decision Support Systems and Intelligent Systems”, terkenal untuk menemukan pola frekuensi tinggi.
data mining adalah suatu istilah yang digunakan untuk algoritma apriori dibagi menjadi beberapa tahap yang
menguraikan penemuan pengetahuan di dalam basis disebut narasi atau pass Pembentukan kandidat
data. Data mining adalah proses yang menggunakan itemset, kandidat k-itemset dibentuk dari kombinasi
teknik statistik, matematika, kecerdasan buatan, dan (k-1)-itemset yang didapat dari iterasi sebelumnya.
machine learning untuk mengekstraksi dan Satu cara dari algoritma apriori adalah adanya
mengidentifikasi informasi yang bermanfaat dan pemangkasan kandidat k-itemset yang subset-nya yang
pengetahuan yang terkait dari berbagai basis data berisi (k-1) item tidak termasuk dalam pola frekuensi
besar [9]. tinggi dengan panjang k-1[12].
Algoritma apriori adalah salah satu algoritma yang
2.3 Teknik Asosiasi melakukan pencarian frequent itemset dengan
menggunakan teknik association rule. Untuk mencari
Menurut Larose dalam bukunya yang berjudul
association rule dari suatu kumpulan data, tahap
”Discovering Knowledge in Data: An Introduction to
pertama yang harus dilakukan adalah mencari frequent
Data Mining”, data mining dibagi menjadi beberapa
itemset terlebih dahulu. Frequent itemset adalah
kelompok berdasarkan tugas atau pekerjaan yang
sekumpulan item yang sering muncul secara
dapat dilakukan [10]. salah satunya yaitu assosiasi,
bersamaan. Penting tidaknya suatu asosiasi dapat
tugas asosiasi dalam data mining adalah menemukan
diketahui dengan dua tolak ukur, yaitu support dan
attribut yang muncul dalam satu waktu. Dalam dunia
confidence. Support adalah nilai penunjang atau
bisnis lebih umum disebut analisis keranjang belanja.
persentase kombinasi sebuah item dalam database,
Contoh asosiasi dalam bisnis dan penelitian adalah:
sedangkan confidence adalah nilai kepastian yaitu
1. Meneliti jumlah pelanggan dari perusahaan
kuatnya hubungan antar item dalam aturan asosiasi.
telekomunikasi seluler yang diharapkan untuk
Proses utama yang dilakukan dalam algoritma apriori
memberikan respon positif terhadap penawaran
untuk mendapat frequent itemset. [7].
upgrade layanan yang diberikan.
2. Menentukan barang dalam supermarket yang Adapun metodologi dasar analisis asosiasi adalah
dibeli secara bersamaan dan yang tidak pernah sebagai berikut :
dibeli secara bersamaan. a) Analisis Pola Frekuensi Tinggi
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
474
Erlin Elisa
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
Tahapan ini mencari kombinasi item yang memenuhi sehingga membantu dalam mendapatkan suatu
syarat minimum dari nilai support dalam database. solusi yang terbaik dari masalah tersebut. Jadi,
Nilai support sebuah item diperoleh dengan rumus langkah pertama ini adalah langkah awal yang
berikut. terpenting dalam penelitian ini.
2. Analisa Masalah
(1) Langkah analisis masalah merupakan langkah
untuk dapat memahami masalah yang telah
Sedangkan nilai support dari 2 item diperoleh dari ditentukan ruang lingkup atau batasannya. Dengan
rumus berikut. menganalisis masalah yang telah ditentukan
tersebut, maka diharapkan masalah dapat dipahami
∑
dengan baik.
(2) 3. Mempelajari Literatur
Untuk mencapai tujuan, maka dipelajari beberapa
b) Pembentukan Aturan Asosiasi literatur-literatur yang diperkirakan dapat
Pembentukan Aturan Asosiasi Setelah semua pola digunakan. Kemudian literatur-literatur yang
frekuensi tinggi ditemukan, barulah dicari aturan dipelajari tersebut diseleksi untuk dapat
asosiasi yang memenuhi syarat minimum untuk ditentukan literatur-literatur mana yang akan
confidence dengan menghitung confidence aturan digunakan dalam penelitian.
asosiasif “ jika A maka B “ .Nilai confidence dari 4. Mengumpulkan Data
aturan “ jika A maka B “ diperoleh dari rumus Dalam pengumpulan data dilakukan observasi
berikut. yaitu pengamatan secara langsung di minimarket
∑ ayu sehingga permasalahan yang ada dapat
∑
(3)
diketahui secara jelas. Kemudian dilakukan
interview yang bertujuan untuk mendapatkan
3. Metodologi Penelitian
informasi atau data yang dibutuhkan. Selain itu
3.1 Desain Penelitian juga dilakukan studi kepustakaan yaitu dengan
membaca buku-buku yang menunjang dalam
Desain penelitian ini merupakan langkah-langkah
melakukan analisis terhadap data dan informasi
yang akan dilakukan dalam penyelesaian masalah.
yang didapat. Analisa teknik pengolahan data
Adapun desain penelitian ini dapat dilihat pada
menggunakan algoritma apriori. Data yang
Gambar 1.
diperoleh dari tempat penelitian selanjutnya
dilakukan analisa dan pengolahan menggunakan
Mendeskripsikan Masalah algoritma apriori.
5. Perancangan Algoritma Apriori
Analisa Masalah Pada tahap ini akan dilakukan proses perancangan
dari model sistem dengan algoritma apriori
Mempelajari Literatur
sehingga diperoleh nilai support dan Confidence
dan menghasilkan suatu rule pola market basket
analysis pada data transaksi penjualan atau
Mengumpulkan Data
pembelian konsumen .
6. Implementasi Algoritma Apriori
Analisa Teknik Pengolahan Data Adapun langkah-langkah dalam tahapan ini
Menggunakan Algoritma Apriori
adalah:
Implementasi Algoritma
a. Analisis Pola Frekuensi Tinggi
Apriori b. Pembentukan Aturan Asosiasi
7. Pengujian Hasil
Pegujian Hasil Pada tahap ini, penulis melakukan pengujian dan
hasil perancangan sistem menggunakan software
Gambar 1. Desain penelitian Data Mining open source Tanagra. Sistem diuji
dengan prosedur-prosedur untuk melakukan
Berdasarkan desain penelitian pada Gambar 1, maka eksplorasi dan permodelan dari data-data yang ada
masing-masing langkahnya dapat diuraikan seperti sehingga mendapatkan suatu hubungan
berikut ini : tersembunyi dari data tersebut.
1. Mendeskripsikan Masalah
Mendeskripsikan masalah yang akan teliti perlu 4. Hasil dan Pembahasan
ditentukan terlebih dahulu. Mendeskripsikan Dari format data transaksi penjualan, maka akan
masalah dalam penelitian dengan menentukan dan dilakukan Analisis Asosiasi algoritma apriori dengan
mendefinisikan batasan masalah yang akan diteliti, membuat nilai support yaitu menunjukkan persentasi
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
475
Erlin Elisa
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
jumlah transaksi yang berisi nilai A dan B dalam banyak item yang ada dibeli dalam setiap transaksi
kasus ini menunjukan apabila jika membeli Teh,gula seperti pada Tabel 3.
maka akan membeli kopi. Analisis asosiasi
didefenisikan sebagai suatu proses untuk menemukan Tabel 3. Format Tabular Data Transaksi
semua aturan asosiasi yang memenuhi syarat Tran- Beras Minyak Teh Kopi Gula Susu Roti
minimum untuk support (minimum support) dan saksi
syarat minimum untuk confidence (minimum 1 0 0 1 1 1 0 0
2 1 0 0 1 0 1 0
confidence) yaitu menunjukkan persentasi banyaknya 3 0 1 0 1 0 1 1
B pada transaksi yang mengandung A. pada kasus ini 4 0 1 0 1 1 0 1
yaitu presentase yang terdapat pada transaksi yang 5 1 1 1 0 0 0 0
mengandung item teh,gula dan kopi. Untuk 6 1 1 0 0 0 1 1
7 0 0 0 1 0 0 1
menghitung support A digunakan rumus (1) 8 0 0 1 0 1 0 1
sedangkan untuk menghitung nilai support A,B dapat 9 1 1 0 0 0 1 0
dilihat pada rumus (2). Berikut ini adalah penjelasan 10 0 1 0 1 0 0 0
lebih terperinci mengenai tiap-tiap langkah dalam 11 0 1 1 0 1 1 0
12 1 1 0 0 0 1 0
pembentukan Asosiasi dengan menggunakan 13 1 1 0 1 0 1 0
algoritma Apriori. 14 0 1 1 1 1 0 1
Jumlah 6 10 5 8 5 7 6
4.1 Data Transaksi Penjualan
4.4 Pembentukan Itemset
Analisis pola frekuensi tinggi dari kombinasi item
pada data transaksi penjualan, adapun data dari 1 Itemset
transaksi belanja pada Minimarket Ayu dapat dilihat
pada Tabel 1. Berikut ini adalah penyelesaian berdasarkan data yang
Tabel 1. Data Transaksi sudah disediakan pada Tabel 3 format tabular data
transaksi Proses pembentukan C1 atau disebut dengan
Tran-
saksi
Item yang dijual 1 itemset didapat berdasarkan rumus (1) analisa pola
1 Tehh Gula Kopi frekuensi tinggi.
2 Beras Susu Kopi
3 Kopi Roti Minyak Susu
1
4 Gula Kopi Roti Minyak
5 Minyak Beras Tehh
6 Susu Beras Minyak Roti
7 Roti Kopi
8 Tehh Roti Gula
9 Susu Beras Minyak
10 Minyak Kopi
11 Gula Tehh Minyak Susu
12 Beras Minyak Susu
13 Susu Kopi Beras Minyak
14 Kopi Gula Roti Minyak Teh
8.
4.2 Representasi Data Transaksi
Data transaksi pada Tabel 1 direpresentasikan Hasil dari perhitungan diatas diubah kedalam bentuk
kedalam bentuk Tabel 2. persentase untuk mengetahui confidence dari masing-
masing item penjualan, hasil tersebut dapat dilihat
Tabel 2 .Representasi Data Transaksi pada Tabel 4.
Kode
Transaksi Item Tabel 4. Support Setiap Item
1 Beras Kode
2 Minyak Transaksi Item Jumlah Confidence
3 Teh 1 Beras 6 43%
4 Kopi 2 Minyak 10 71%
5 Gula 3 Tehh 5 36%
6 Susu 4 Kopi 8 57%
7 Roti 5 Gula 5 36%
6 Susu 7 50%
7 Roti 6 43%
4.3 Tabulasi Data Transaksi
Data transaksi pada Tabel 1 di bentuk tabel tabular Dari proses pembentukan itemset pada Tabel 4
yang akan mempermudah dalam mengetahui berapa support setiap item, hasil pembentukan 1 itemset akan
dilakukan kombinasi 2 itemset.
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
476
Erlin Elisa
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
Kombinasi 3 Itemset
Kombinasi dari itemset pada C2 bisa digabungkan
menjadi 3 itemset. Proses pembentukan C3 atau
disebut dengan 3 itemset dapat dilihat dari Tabel 6.
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
477
Erlin Elisa
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol . 2 No. 2 (2018) 472 - 478
478