Anda di halaman 1dari 21

PROJECT DATA ANALYTICS – ASSOCIATION RULES PADA TOKO

ROTI

Oleh

Farchan Tri Putra 2201769673


Melyanto TJ 2201748946
Daffa Ibrani 2201844723
SUMBER DATA
Data yang digunakan berupa data transaksi penjualan roti yang diperoleh
melalui situs Kaggle.com, dimana link untuk sumber data tersebut adalah berikut:
Bakery Sales | Kaggle
DATA DAN VARIABEL PENELITIAN
Data berupa data transaksi penjualan roti dalam rentang waktu 2019 – 2020
sebanyak 2654 record.

Variabel yang ada adalah sebagai berikut:

1. Datetime
Waktu pada saat order dilakukan.
2. Day of a week
Hari pada saat order dilakukan.
3. Total
Total amount dari transaksi yang berlangsung.
4. Place
Lokasi pelanggan (regional korea).
5. Daftar nama produk dan kuantitas yang terjual:

- Angbutter - Gateau chocolat


- Plain bread - Pandoro
- Jam - Cheese cake
- Americano - Lemon ade
- Croissant - Orange pound
- Caffe latte - Wiener
- Tiramisu croissant - Vanilla latte
- Cacao deep - Berry ade
- Pain au chocolat - Tiramisu
- Almond croissant - Menrique cookies
- Milk tea

Dari seluruh variable yang ada pada dataset, tidak semuanya digunakan untuk
analisis. Variable yang digunakan hanya nama produk dan jumlah yang terjual
pada setiap transaksi.
PENDAHULUAN
A. Latar belakang
Perkembangan teknologi informasi memberikan dampak yang besar bagi
perkembangan jumlah data. Pada saat ini segala sesuatu berhubungan dengan
data. Social media memiliki perkembangan data pesat setiap harinya, bidang
kesehatan rumah sakit memiliki data record pasien dan juga obat-obatan,
industri ritel memiliki data customer dan penjualannya. Dibutuhkan sebuah
metode yang dapat mengolah data tersebut kemudian mengekstraknya menjadi
informasi atau knowledge yang bermanfaat untuk pengambilan keputusan
kedepannya. Salah satu teknologi yang dapat digunakan untuk melakukan hal
tersebut adalah data mining.
Data mining adalah proses mencari pola atau informasi yang menarik dari
data yang tersimpan dalam jumlah besar. Proses data mining ini merupakan
evolusi alami dari teknologi database, dimana seiring berkembangnya waktu
perkembangan data semakin pesat sehingga dibutuhkan metode untuk
mengekstrak pengetahuan dari data yang ada.
Menganalisis kebiasaan belanja konsumen pada suatu usaha adalah salah
satu strategi marketing yang biasa digunakan pada industri ritel. Dengan
menggunakan strategi pengambilan keputusan dan memahami perilaku belanja
konsumen, pelaku usaha dapat menentukan strategi yang tepat dalam
meningkatkan penjualan produk di tempat usahanya.
Usaha toko roti merupakan salah satu dari berbagai macam usaha yang
ada. Roti merupakan salah satu makanan pengganti nasi yang memiliki
karbohidrat yang tinggi. Biasanya roti atau jenis kue lainnya juga digunakan
sebagai buah tangan ketika bertamu ke rumah kerabat atau teman. Banyaknya
toko roti saat ini seperti Holland Bakery, BreadTalk, dan sebagainya, membuat
persaingan antar usaha tersebut semakin ketat sehingga dibutuhkan strategi
pemasaran yang tepat untuk dapat meningkatkan penjualan.
Salah satu metode data mining yang dapat digunakan di bidang usaha
retail ini adalah metode association rule atau dikenal dengan istilah market
basket analysis. Association rule merupakan proses menemukan pola, korelasi,
asosiasi, atau struktur kausal yang sering terjadi dari sekumpulan data yang
ditemukan di berbagai jenis basis data seperti data relasional, data
transaksional dan bentuk penyimpanan data lainnya. Association rule
umumnya mengambil bentuk IF-THEN yang menggabungkan beberapa item
menjadi satu. Contohnya dalam industri retail, apabila customer membeli
barang A dan B maka customer juga membeli barang C. Rule ini dihasilkan
berdasarkan analisis dari data transaksi yang pernah terjadi.
Latar belakang tersebut mendasari dari tujuan penelitian ini yaitu
menentukan strategi pemasaran produk yang tepat dan sesuai dengan kebiasaan
belanja pelanggan. Data yang digunakan untuk menganalisis perubahan pola
kebiasaan belanja konsumen pada penelitian ini adalah data transaksi pada
Toko Roti XYZ selama 6 bulan terakhir.
B. Rumusan masalah
Berdasarkan permasalahan yang dijelaskan pada bagian latar belakang,
berikut ini rumusan masalah yang didapatkan:
1. Apa sajakah Aturan Asosiasi (Rule) produk yang terbentuk
berdasarkan hasil metode Association Rule yang digunakan pada data
transaksi yang ada?
2. Bagaimana strategi pemasaran produk yang tepat berdasarkan hasil
Rule yang terbentuk?
3. Bagaimana visualisasi data yang dapat dibentuk berdasarkan hasil dari
analisis?
METODOLOGI PENELITIAN
Metode penelitian yang digunakan adalah eksperimen dengan tahapan: (1)
Identifikasi masalah, (2) Pengumpulan data, (3) Pembersihan dan penyiapan data,
(4) Analisis menggunakan Algoritma Apriori dan FP-Growth, (5) Hasil analisis,
(6) Evaluasi.

Gambar 1 Kerangka Kerja


Penulis juga menggunakan referensi acuan berupa jurnal. Beberapa jurnal dan
hasil penelitiannya adalah sebagai berikut;
1. PENERAPAN METODE DATA MINING MARKET BASKET
ANALYSIS TERHADAP DATA PENJUALAN PRODUK BUKU
DENGAN MENGGUNAKAN ALGORITMA APRIORI DAN
FREQUENT PATTERN GROWTH (FP-GROWTH) : STUDI KASUS
PERCETAKAN PT. GRAMEDIA. Jurnal TELEMATIKA MKOM Vol.4
No.1.
Hasil atau rule yang terbentuk pada penelitian tersebut sebagai berikut.

Aturan asosisasi Support Confidence Supp X Confidance


{Lem, shrink, 0,681 1 0,6806
ArtKartonCover} =>
{Soft Cover}
{Lem,ArtKartonCover 0,7658 0,9992 0,765187
} => {Soft Cover}
{Lem, shrink} => {Soft 0,6896 1 0,6896
Cover}
{Lem} => {Soft 0,7868 0,9989 0,785935
Cover}
{Shrink, 0,711 0,998 0,709578
ArtKartonCover} =>
{Soft Cover}
{ArtKartonCover} => 0,9112 0,9971 0,908558
{Soft Cover}
{ Soft Cover, Lem, 0,6806 0,9869 0,671684
shrink} =>
{ ArtKartonCover }
{Lem, shrink} => 0,6806 0,9869 0,671684
{ ArtKartonCover }
{Lem, shrink} => {Soft 0.6806 0,9869 0,671684
Cover, ArtKartonCover
}
{ Soft Cover, shrink} 0,711 0,9858 0,700904
=> { ArtKartonCover }
Tingkat kekuatan aturan asosisasi 0,725541
2. ASSOCIATION RULE MINING UNTUK PENENTUAN
REKOMENDASI PROMOSI PRODUK. Jurnal SIMETRIS, Vol 5 No 2
Rule yang dihasilkan dengan minimum support 40% (0,4) dan minimum
confidence 80% (0,8).

No. Premises Conclusion Lift


1. Milk Peaches 0,875
2. White bread Peaches 0,888
3. Eggs Peaches 0,923
HASIL DAN PEMBAHASAN
Tahapan yang dilakukan penulis adalah sebagai berikut.
1. Import data

Data yang berhasil diimport sebanyak 2.654 data. Data ini yang akan
digunakan untuk analisis.
2. Data pre-processing
Sebagaimana dilihat, terdapat data yang tanda tanya atau missing, maka
dibutuhkan operator replace missing value dan dilakukan inputasi data.
Karena data yang dibutuhkan untuk association rule hanya data produk
yang terjual, maka kita tentukan attribute filter nya subset kemudian set
default nya menjadi zero agar apabila data yang tanda tanya sebelumnya
berubah menjadi 0.

Setelah dicek di data statisticsnya, missing value sudah 0 tetapi terdapat


attribute atau produk yang tidak terjual sama sekali pada dataset, maka
attribute tersebut tidak perlu dimasukkan.
3. Analisis data
Lalu pilih operator select attribute untuk menentukan attribute yang
digunakan untuk analysis.

Karena croque monsieur dan mad garlic tidak terdapat penjualan pada
dataset, maka tidak perlu dimasukkan. Analysis akan menggunakan algoritma
FP-Growth dan operator create association rule, dimana operator ini hanya
menerima tipe data nominal sedangkan dataset berupa numerical sehingga
diperlukan pengubahan tipe data terlebih dahulu menggunakan operator
Numerical to Binominal.
Karena sebelumnya sudah select attribute apa saja yang digunakan, maka
attribute filter type tidak perlu subset lagi tetapi langsung pilih All saja.

Data yang sebelumnya 0 maka akan terisi false dan yang terdapat value
atau nilainya maka akan terisi true.

Disini penulis menggunakan minimal support 0.05 dan minimal


confidence 0.8 karena ketik menggunakan minimal support dan confidence
lebih dari itu maka tidak terdapat rule yang terbentuk.
4. Hasil analisis
Berikut adalah rule yang terbentuk.

Conclusio
Premises Support Confidence Lift
n
plain
croissant, jam 0,028 0,82 2568
bread
plain
Pain au chocolat, jam 0,02 0,825 2556
bread
orange pound,
angbutter 0,02 0,844 1135
pandoro
plain
angbutter, jam 0,048 0,865 2678
bread
plain
jam 0,072 0,873 2703
bread

Hasil yang terbentuk adalah apabila customer membeli croissant dan jam maka
customer juga akan membeli plain bread. Support dan confidence nya sebagai
terlampir dan minimal nilai lift adalah 1000 untuk ketentuan rule tersebut kuat
atau tidak. Pada rule yang terbentuk sudah sesuai dengan minimal lift yang
terbentuk.
Penulis mencoba menentukan minimum support paling tinggi yang dapat
diterapkan untuk mengetahui rule terkuat dan digunakan 0,3 sebagai minimum
supportnya.
Didapatkan hasil sebagai berikut.

Premises Conclusion Support Confidence Lift

Jam plain bread 0,072 0,873 2.703

Ini adalah rule terkuat yang terbentuk menggunakan FP-Growth dan Create
Association Rule. Rule nya adalah apabila customer membeli Jam maka customer
juga membeli Plain Bread dengan nilai support 0,072 dan confidence 0,873 dan
nilai lift 2.703.
5. Visualisasi data
Untuk mempermudah melihat hasil analisis, penulis menginterpretasikan
data dalam bentuk dashboard penjualan.

Dijelaskan perbandingan penjualan dari tiap-tiap rule untuk melihat


apakah dari rule yang terbentuk memberikan hasil yang menguntungkan
berdasarkan dataset yang ada. Penjualan terbanyak adalah produk Angbutter
dengan total penjualan 3.227 kemudian yang kedua adalah Croissant 1.049
dan yang ketiga adalah Plain bread 1.028.
Data yang ditampilkan berupa penjualan dari tiap-tiap produk yang ada
pada rule yang dibagi menjadi tiap bulan dan tahun.
Penulis juga membuat storyboard sebagai berikut.
KESIMPULAN DAN SARAN
Beberapa kesimpulan yang dapat diambil dari hasil penilitian ini adalah:

a. Dari hasil obeservasi terhadap data transaksi penjualan roti yang didapat
dari situs Kaggle.com, telah ditemukan sebanyak 25 atribut yang dapat
dimanfaatkan untuk market basket analysis menggunakan metode
association rule.
b. Penilitian market basket analysis menggunakan tools RapidMiner dengan
algoritma FP-Growth dan Create Association Rule terhadap atribut-atribut
penjualan yang ada pada dataset.
c. Hasil analisa berupa sejumlah aturan asosiasi dengan tingkat kekuatan rule
yang berbeda ditentukan dengan nilai support, nilai confidence, dan nilai
lift yang dimiliki pada tiap-tiap rule.
d. Rule terkuat yang terbentuk berdasarkan hasil analisis adalah:

Premises Conclusion Support Confidence Lift

Jam plain bread 0,072 0,873 2.703

apabila customer membeli Jam maka customer juga membeli Plain Bread
dengan nilai support 0,072 dan confidence 0,873 dan nilai lift 2.703.

Saran:
a. Berdasarkan hasil analisis, dapat dilakukan strategi product bundling
dengan promo bagi rule yang paling kuat sehingga dapat memungkinkan
untuk menarik customer lebih banyak dan meningkatkan penjualan.
b. Dapat juga dilakukan product placement yang berdekatan sesuai dengan
rule yang terbentuk sehingga mempermudah customer membelinya

REFERENSI
Goldie Gunadi, D. I. (2012). PENERAPAN METODE DATA MINING
MARKET BASKET ANALYSIS TERHADAP DATA PENJUALAN
PRODUK BUKU DENGAN MENGGUNAKAN ALGORITMA
APRIORI DAN FREQUENT PATTERN GROWTH (FP-GROWTH) :
STUDI KASUS PERCETAKAN PT. GRAMEDIA. Jurnal TELEMATIKA
MKOM Vol.4 No.1.

Jeong, H. (n.d.). kaggle.com. Retrieved from


https://www.kaggle.com/hosubjeong/bakery-sales?
select=Bakery+Sales.csv

Triyanto, W. A. (2014). ASSOCIATION RULE MINING UNTUK


PENENTUAN REKOMENDASI PROMOSI PRODUK. Jurnal
SIMETRIS, Vol 5 No 2.

Anda mungkin juga menyukai