879-Article Text-4210-1-10-20220703
879-Article Text-4210-1-10-20220703
1 (2022) 10-17
Terbit online pada laman web jurnal : https://e-journal.unper.ac.id/index.php/informatics
| ISSN (Print) 2775-2208 | ISSN (Online) 2715-0453 |
INFORMASI ARTIKEL A B S T R A K
Sejarah Artikel:
Online Shop adalah salah satu fasilitas yang disajikan oleh internet, yang
Diterima Redaksi: 01 Februari 2022 mampu mempermudah masyarakat dalam belanja tanpa harus bertatap muka
Revisi Akhir: 04 Juni 2022 dengan pelanggan, tanpa harus antri dan tawar menawar. Pertumbuhan ekonomi
Diterbitkan Online : 02 Juli 2022 digital semakin besar persaingan bisnis juga akan semakin berat, akibatnya
Kata Kunci : semakin banyak online shop tidak hanya menampilkan produk-produk tetapi juga
Online Shop, Sistem Rekomendasi,
perlu didukung oleh pemilihan produk yang tepat untuk menarik perhatian
Algoritma K-Means Clustering, Sillhoutte pelanggan. Terlalu banyaknya variasi produk yang ditawarkan secara random
Coeficient (acak) pada online shop membuat beberapa pelanggan kesulitan dalam
Korespondensi : menentukan produk yang akan dibeli. Berdasarkan permasalahan yang muncul
maka penelitian mengenai Sistem Rekomendasi Penawaran Produk Pada Online
Telepon / Hp : +6282113923299
E-mail : naufalfarhan256@gmail.com
Shop Menggunakan K-Means Clustering ini dilakukan. Sistem ini menggunakan
algoritma K-Means Clustering serta dataset yang digunakan adalah data transaksi
penjualan dari kurun waktu 1 tahun terakhir agar cakupanya tidak meluas dengan
menggunakan data terbaru. Hasil dari penelitian ini ditemumakan bahwa ada 3
cluster yang memiliki karakteristik berbeda yaitu, cluster 1 dengan karakteristik
penjualan sedang dengan rentang umur pembeli 36-50 tahun, cluster 2 dengan
karakteristik penjualan terbanyak dengan rentang umur pembeli 18-26 tahun dan
cluster 3 dengan karakteristik penjualan rendah dengan rentang umur 27-35 tahun.
Dari hasil cluster yang didapat bahwa produk yang direkomendasikan merupakan
produk terpopuluer dari setiap clusternya. Hasil perhitungan nilai sillhouette
coeficient didapatkan cluster dengan jumlah 3 karena memiki nilai paling
mendekati Si = 1 yaitu dengan nilai 0.5564393731451109.
10
Farhan Naufal, dkk, Sistem Rekomendasi Penawaran Produk … 11
Pada tahap ini dilakukan untuk mempersiapkan Clustering pada suatu data pada dasarnya adalah
data serta memproses data mentah sebelum dilakukanya suatu tahapan untuk menggolongkan suatu himpunan
proses data mining. Hal ini dilakukan agar data dapat data yang atribut kelas belum dideskripsikan,
terintegrasi dengan system yang akan digunakan pada berdasarkan konsepnya prinsip clustering adalah untuk
saat proses penambangan data. Pada tahap Pre- memaksimalkan dan meminimalkan kemiripan intra
Processing Data ini terdapat 3 tahapan yaitu data kelas. Misalnya, ada suatu himpunan objek, langkah
cleaning, data selection, dan data transformation. pertama dapat di klasterisasi menjadi beberapa
himpunan kelas kemudian menjadi sebuah himpunan
1. Data Cleaning beraturan sehingga dapat diturunkan berdasarkan
Pada tahap ini ini dilakukan proses cleaning data klasifikasi tertentu. Clustering seringdigunakan sebagai
untuk membersihkan data dengan cara melengkapi data tahap awal dalam proses data mining, dengan hasil
yang kosong, menghapus data duplikat atau clusteryang terbentuk akan menjadi input dari algoritma
menghilangkan noise [5]. Selain itu pada tahap ini akan berikutnya yang digunakan [17].
mengubah format data agar dataset dapat diintergrasi Teknik Clustering adalah teknik yang paling
dengan system aplikasi. banyak digunakan untuk prediksi masa depan [12].
Aplikasi ini dapat membantu customer dalam
pengambilan keputusan untuk membeli suatu
2. Data Selection
produk. Penelitian ini menggunakan analisis cluster
Pada tahap ini dilakukan setelah proses cleaning
untuk menyatukan suatu produk ke dalam kelompok
data selesai, yaitu dilakukanya pemilihan atribut agar
sesuai dengan karakteristiknya. Data clustering
data dapat di proses penambangan data maka perlu
merupakan bagian dari metode data mining yang
memilih atribut yang tepat sehingga terintegrasi dengan
mempunyai sifat tidak terawasi atau tidak memerlukan
baik. Dari 15 atribut yang ada peneliti memilih 8 atribut
target output (unsupervised) yang digunakan untuk
yaitu no transaksi, bulan transaksi, customer, umur
mengelompokkan sejumlah data besar ke dalam
customer, merk, tipe, harga jual dan harga beli.
himpunan bagian yang disebut dengan cluster dimana
Pemilihan atribut tersebut dilakukan karena hanya data
setiap cluster adalah kumpulan objek data yang serupa
tersebutlah yang diperlukan untuk peroses data mining
12 Informatics And Digital Expert (INDEX), Vol. 4, No. 1, Mei 2022, hlm. 10-17
didasari pada literatur dan teori-teori oleh penelitian b. Implementasi Kelola Data
terdahulu yang digunakan sebagai pemahaman Halaman Kelola Data merupakan halaman yang
pendukung dan acuan dalam penelitian ini. Dengan digunakan untuk mengelola data produk pada sistem
begitu, hal tersebut akan menunjukan bahwa setiap seperti menambah data, import data, hapus data dan
tahapan memiliki pegangan yang kuat.
edit data.
1. Use case diagram
Use case diagram digunakan untuk memodelkan
prilaku aktor yang berinteraksi dengan sistem pada
aplikasi yang dibangun pada penelitian ini. Aktor
merupakan user yang akan menggunakan aplikasi
tersebut, sementara use case merupakan fungsi yang
disediakan pada aplikasi tersebut [10]. Pada Gambar 3.
dibawah merupakan use case diagram pada penelitian
ini.
Gambar 3 Halaman Kelola Data
√(0 − 4)2
300
√(1 − 4)2 =( )
138
Februari
√(1 − 4)2
=2,173913
√(3 − 4)2
√(2 − 4)2
333
√(1 − 3)2 =( )
144
Data 1, 4,690416 Maret
√(0 − 1)2
Centroid = 2,3125
√(1 − 3)2
3 √(3 − 1)2
Farhan Naufal, dkk, Sistem Rekomendasi Penawaran Produk … 15
A. Hasil
Mencari Rata-Rata Variabel
Nilai rata-rata adalah angka representasi atau biasa Pada tahap ini dilakukannya implementasi dari
juga disebut sebagai mean dari suatu kelompok data perancangan sistem yaitu menampilkan hasil clustering
yang mewakili data secara keseluruhan. Dapat terhadap produk pada toko online syakila shop.
digunakan untuk membandingkan kualitas suatu
kelompok dengan kelompok lain ,Mewakili kondisi
suatu kelompok dengan 1 angka dan Mendeskripsikan
suatu kelompok dengan singkat.
153
=( )
Nilai 63
Sample 1
=2,428571
156
=( )
Nilai 63
Sample 2
=2,47619
Gambar 6 Hasil Cluster
penjualan rendah dengan rentang umur pembeli 27-35 Dan Collaborative,” J. Ilm. Teknol. Inf. Asia, vol.
tahun. 9, no. 1, pp. 6–13, 2015.
[2] W. A. Triyanto, “Association Rule Mining
B. Pengujian Cluster Untuk Penentuan Rekomendasi Promosi
Produk,” J. SIMETRIS, vol. Vol.5, no. No.2, pp.
Pengujian dilakukan terhadap semua data produk
121–126, 2014.
dengan memasukkan beberapa titik pusat secara acak
[3] F. Ekonomika, D. A. N. Bisnis, and U.
kemudian dilakukan perhitungan nilai silhouette
Diponegoro, “ANALISIS FAKTOR-FAKTOR
coefficient dari setiap tititk pusat yang dimasukkan.
YANG MEMPENGARUHI KEPUTUSAN
Berikut adalah tabel proses pengujian terhadap data
PEMBELIAN DENGAN SISTEM PRE
produk dengan memasukkan sebanyak 7 cluster yang
ORDER SECARA ( Studi Kasus Pada Online
berbeda dapat dilihat pada Tabel 8.
Shop Chopper Jersey ),” 2013.
Tabel 9 Pengujian Cluster [4] C. S. Fatoni, E. Utami, and F. W. Wibowo,
Jumlah Cluster Hasil Silhouette Coeffiecient “Sistem Rekomendasi Produk Online Store
Menggunakan Metode Apriori,” J. Inf. Politek.
2 0.4815986035475924
Indonusa Surakarta, vol. 4, no. 2, pp. 20–27,
3 0.5564393731451109 2018.
4 0.3099605480256625 [5] A. K. Ningsih and W. Witanti, “Sistem
Rekomendasi Penjualan Menu Makanan di
5 0.2343006050013521
UMKM Kuliner Menggunakan Association
6 0.2292355977405526 Rule,” J. ICT Inf. Commun. Technol., vol. 19,
7 0.22686121831886946 no. 2, pp. 87–90, 2021, doi: 10.36054/jict-
8 0.08479385867480424
ikmi.v20i2.265.
[6] A. Kurniawan, “Sistem Rekomendasi Produk
Sepatu Dengan Menggunakan Menggunakan
Dari hasil pengujian 7 cluster yang dimasukan
Metode Collaborative Filtering,” Semin. Nas.
didapatkan cluster dengan jumlah 3 yang memiliki nilai
Teknol. Inf. dan Komun., vol. 2016, no. Sentika,
silhouette coefficient paling mendekati dengan nilai Si =
pp. 610–614, 2016, [Online]. Available:
1 yaitu dengan nilai 0.5564393731451109. Nilai
https://fti.uajy.ac.id/sentika/publikasi/makalah/2
silhouette dapat dikatakan baik apabila bernilai positif
016/92.pdf.
karena titik pusat sudah berada di dalam cluster yang
[7] M. El Fikri, R. Ahmad, and R. Harahap,
tepat sedangkan jika nilai silhouette dikatakan negatif
“Strategi Mengembangkan Kepuasan Pelanggan
menandakan terjadinya overlapping sehingga titik pusat
Online Shop Dalam Meningkatkan Penjualan
berada diantara dua cluster. (Studi Kasus Sabun Pyari),” J. Manaj. Tools,
vol. 12, no. 1, pp. 87–105, 2020, doi:
5. KESIMPULAN 10.1017/CBO9781107415324.004.
Penelitian ini menghasilkan perangkat lunak yang [8] H. Sy, Rismayani, and A. Syam, “Data Mining
dapat mengelompokan data berdasarkan data transaksi Menggunakan Algoritma K-Means
penjualan pada sebuah online shop. Hasil akhir dari Pengelompokan Penyebaran Diare Di Kota
penelitian ini adalah mengelompokan sebuah data yang Makassar,” SISITI Semin. Ilm. Sist. Inf. dan
dapat digunakan sebagai bahan perekomendasian. Hasil Teknol. Inf., vol. 8, no. 1, pp. 73–82, 2019.
dari data mining menggunakan K-Means Clustering [9] I. M. A. W. Putra, G. Indrawan, and K. Y. E.
menghasilkan 3 cluster yaitu, cluster 1 dengan Aryanto, “Sistem Rekomendasi Berdasarkan
karakteristik penjualan sedang dengan rentang umur Data Transaksi Perpustakaan Daerah Tabanan
pembeli 36-50 tahun , cluster 2 dengan karakteristik dengan menggunakan K-Means Clustering,” J.
penjualan terbanyak dengan rentang umur pembeli 18- Ilmu Komput. Indones., vol. 3, no. 1, pp. 18–22,
26 dan cluster 3 dengan karakteristik penjualan rendah 2018, [Online]. Available:
dengan rentang umur 27-35. Dari hasil cluster yang http://119.252.161.254/e-
didapat bahwa produk yang direkomendasikan journal/index.php/jik/article/view/2749/1314.
merupakan produk terpopuler dari setiap clusternya. [10] Y. Wautelet, “Using the RUP/UML business use
Dari hasil 7 kali pengujian terhadap jumlah titik pusat, case model for service development governance:
cluster yang berjumlah 3 memiliki nilai sillhouette A business and IT alignment based approach,”
coeficient yang paling mendekati nilai Si=1 yaitu dengan Proc. - 2020 IEEE 22nd Conf. Bus. Informatics,
nilai 0.5564393731451109. CBI 2020, vol. 2, pp. 121–130, 2020, doi:
10.1109/CBI49978.2020.10069.
DAFTAR PUSTAKA [11] G. Abdurrahman, “Clustering Data Ujian Tengah
Semester (UTS) Data Mining Menggunakan
[1] B. T. W. Utomo and A. W. Anggriawan, “Sistem Algoritma K-Means,” Jurnal Sistem &
Rekomendasi Paket Wisata Se-Malang Raya Teknologi Informasi Indonesia (JUSTINDO),
Menggunakan Metode Hybrid Content Based vol. 1, no. 2, pp. 71– 79, 2016.
Farhan Naufal, dkk, Sistem Rekomendasi Penawaran Produk … 17