32-Article Text-127-1-10-20220205

Terbit online pada laman web jurnal: http://publikasi.bigdatascience.
id
JURNAL DATA SCIENCE & INFORMATIKA

(JDSI)
Vol. 1 No. 2 (2021) 58 - 62 ISSN Media Elektronik: 2808-9987
Penerapan Algoritma K-Means Dalam Prediksi Penjualan

Karoseri
Delia Anggarwati1, Odi Nurdiawan2 , Irfan Ali 3 ,Dian Ade Kurnia4
12ProgramStudi Komputerisasi Akuntansi STMIK IKMI Cirebon
3ProgramRekayasa Perangkat Lunak STMIK IKMI Cirebon
4Program Studi Manajemen Informatika STMIK IKMI Cirebon
1deliaanggarwati9@gmail.com*, 2odinurdiawan2020@gmail.com, 3irfanaali0.0@gmail.com , 4dianade2012@gmail.com
Abstract
The carosery is a heavy transportation equipment such as transporting garbage, car accidents, sand, stones,
gravel, drinking water and others. In carosery sales, sales are very important in increasing company profits.
Therefore, the carosery is in great demand by consumers to help the needs of life. So that in this sales data, there
is a lot of data generated, so there is no data that knows what type of carosery is needed by consumers and lacks
predicting carosery sales. This study also discusses a problem, which applies data mining with the k-means
algorithm. Data mining is in charge of analyzing the characteristics of the data to find interesting hidden
patterns using certain techniques, methods, and algorithms. In this study, the attributes used are number, date,
name of service, dealer, carosery, quantity (unit), chassis type, price / unit and contract value. Operators used in
the k-means algorithm process are date to numerical, nominal to numerical, normalize and clustering. The data
used are 203 data grouped into 2 clusters, cluster 0 produces 93 sales items for the carosery that are not in
demand by consumers and cluster 1 produces 110 sales items for the carosery that are in demand by consumers..
Keywords: Carosery, Sales, Data Mining, K-Means
Abstrak
Karoseri merupakan alat angkut berat seperti angkut sampah, mobil kecelakaan, pasir, batu, kerikil, air minum
dan lainnya. Dalam penjualan karoseri, penjualan sangatlah penting dalam meningkatkan laba perusahaan. Oleh
karena itu, karoseri banyak diminati oleh konsumen untuk mempermudah membantu kebutuhan sehari-hari.
Sehingga dalam data penjualan ini banyaknya data yang dihasilkan maka, belum adanya data yang mengetahui
tipe karoseri apa saja yang banyak dibutuhkan oleh konsumen dan kurangnya memprediksi penjualan karoseri.
Penelitian ini pun membahas dari sebuah permasalahan tersebut, yang menerapkan data mining dengan
algoritma k-means. Data mining bertugas menganalisis karakteristik data untuk mencari pola-pola tersembunyi
yang menarik dengan menggunakan teknik, metode dan algoritma tertentu. Dalam penelitian ini atribut yang
digunakan yaitu no, tanggal, nama dinas, dealer, karoseri, jumlah (unit), tipe chasis, harga/unit dan nilai kontrak.
Operator yang digunakan pada proses algoritma k-means yaitu date to numerical, nominal to numerical,
normalize dan clustering. Data yang digunakan sebanyak 203 data dikelompokkan menjadi 2 cluster, cluster 0
menghasilkan 93 item penjualan karoseri kurang laris yang kurang diminati oleh konsumen dan cluster 1
menghasilkan 110 item penjualan karoseri sangat laris yang banyak diminati oleh konsumen.
Kata kunci: Karoseri, Penjualan, Data Mining, K-Means.
Diterima Redaksi : 07-01-2022 | Selesai Revisi : 01-02-2022 | Diterbitkan Online : 05-02-2022

1
Delia Anggarwati1, Odi Nurdiawan2 , Irfan Ali, 3 Dian Ade Kurnia4
Jurnal Data Science dan Informatika (JDSI) Vol. 1 No. 2 (2022) xx – xx
1. Pendahuluan Menggunakan Algoritma K-Means tahun 2019, yaitu

mengenai permasalahan belum adanya sistem yang
Peran teknologi kian berkembang pesat di
mendata penjualan produk sehingga terjadi
berbagai aspek kehidupan seperti halnya dalam
kekosongan produk yang diminta konsumen untuk
bidang pendidikan, perbankan bahkan di dunia
meminimalisir kekecewaan pelanggan atas
bisnis sekalipun. Ketatnya persaingan yang terjadi di
permintaan produk yang tidak tersedia di gudang,
dunia bisnis membuat perusahaan-perusahaan makin
penulis mengelompokan barang-barang menjadi 3
gencar meningkatkan kinerja karyawannya
kelompok. Kesimpulan dari penelitian ini yaitu dari
mengingat peran teknologi yang dapat
90 produk dihasilkan C1 kelompok barang dengan
mengefisienkan waktu pekerjaan dan data yang
permintaan tinggi, C2 kelompok. barang dengan
diolah lebih akurat, sehingga banyak perusahaan
permintaan sedang dan C3 kelompok barang dengan
yang beralih dari sistem manual ke sistem digital.
permintaan rendah. Dengan adanya pengelompokan
Data-data perusahaan yang melonjak setiap
data penjualan di PT. Motorindo Perkasa Raya,
tahunnya membuat permasalahan atas bank data
perusahaan lebih dapat memantau produk yang
yang diperoleh dari perusahaan. Khususnya di
tersedia di gudang dan dapat memperkecil
bagian penjualan yang jika dibiarkan bermasalah
kemungkinan kehabisan produk yang dipesan
akan berakibat fatal bagi perusahaan.
pelanggan.[3]
Data penjualan yang diperoleh penulis cukup
Permasalah yang terjadi di PT. Senang Jaya
terorganisasi dengan baik, namun akan lebih baik
Abadi yaitu sulitnya menentukan strategi penjualan
lagi jika diolah kembali dengan sistem pengolah data
karoseri pada awal tahun dimana pada bulan Januari
seperti data mining yang akan digunakan untuk
hingga Mei penjualan karoseri sangat menurun.
menentukan pola kuantitas penjualan. Salah metode
Sementara pada bulan Juni hingga Desember
data mining yang diterapkan penelitian ini yaitu
penjualan karoseri melonjak drastis, hal tersebut
metode clustering, clustering merupakan sebuah
membuat perusahaan kerepotan dalam memenuhi
metode pengelompokan data un-supervised atau
permintaan pelanggan. Selain itu, kerugian
tidak berlabel. Berdasarkan jurnal Penerapan Data
perusahaan dapat menyebabkan berkurangnya
Mining untuk Klasifikasi Produk Merk Bata
pendapatan dan modal yang dikeluarkan perusahaan.
Menggunakan Algoritma K-Means tahun 2018 yang
ditulis oleh Hernita Samosir, Muhamad Amin, dan
Oleh sebab itu, dibutuhkannya prediksi penjualan
Indra Ramadona Harahap, penjualan merupakan
karoseri dan strategi produksi karoseri pada akhir
aspek terpenting untuk mendapatkan pendapatan
tahun dimana perusahaan dapat menentukan
perusahaan dengan menggunakan algoritma K-
persediaan produk karoseri apa saja yang banyak
Means.[1]
diminati oleh konsumen. Akar permasalahan ini
terdapat di bagian produksi yang akan sangat
Penelitian dengan judul Clustering Data
terbantu jika adanya prediksi penjualan karoseri dan
Penjualan Pada Toko Perlengkapan Outdoor
hal tersebut dapat meminimalisir keterlambatan
Menggunakan Metode K-Means yang dilakukan
pengiriman karoseri jika pesanan membludak
oleh Fintri Indriyani dan Eni Irfiani tahun 2019,
diakhir tahun.
menerangkan bahwa metode algoritma k-means
dapat mengelompokkan data persediaan produk
2. Metode Penelitian
penjualan untuk menjaga kepuasan konsumen. Hal
ini dikarenakan Toko Genta Corp kesulitan dalam Penelitian ini menggunakan metode Knowledge
menentukan persediaan produk dan data penjualan Discovery and Database merupakan suatu proses
masih dilakukan secara manual, sehingga terjadinya untuk mendapatkan suatu informasi pada sebuah
penumpukan persediaan produk yang kurang laris data yang tersembunyi menjadi sebuah pola-pola
dan ada produk yang tidak ada persediaannya. karakteristik dari data tersebut. Langka - langkah
Dengan menggunakan algoritma K-Means proses KDD dapat dilihat pada gambar 1.
menghasilkan produk nilai centroid c1 64,7%
produk yang paling laris, centroid c2 24,3% produk
yang cukup laris dan sedangkan nilai centroid paling
rendah yaitu c1 11,1% menghasilkan produk yang
kurang laris. Sehingga data yang dihasilkan dapat
sebagai pertimbangan bagi manajemen untuk
mengatur persediaan produk.[2]
Dalam penelitian jurnal yang dilakukan oleh Sri

Gambar 1 Tahapan dalam KDD
Marliska Hutabarat dan Anita Sindar dengan judul
Data Mining Penjualan Suku Cadang Sepeda Motor a. Data Cleaning

58
Data cleaning dilakukan untuk yang dibutuhkan pada algoritma K-Means. Tipe data
menghapus sebuah data yang tidak valid atau yang dibutuhkan yaitu numerical, maka tahapan
noise, memperbaiki sebuah data untuk proses yang digunakan yaitu operator date to
menjadi sebuah data yang valid. numerical, nominal to numerical dan normalize.
Berikut ini tahapan transformasi dataset.
b. Data Integration
Data integration merupakan memadukan
dua data atau lebih yang dikelompokkan
dalam sebuah gudang data (data warehouse).
Yang bertujuan untuk mencari sebuah data
yang terbaik agar tidak terjadinya kesalahan
dalam pengambilan sebuah keputusan dalam
proses data mining. Gambar 2 Tampilan Awal Aplikasi Rapidminer
c. Data Selection Setelah itu, import data set ke repository dengan

Pemilihan sebuah atribut data yang nama file data set yang telah disesuaikan. Kemudian
digunakan dan mengutamakan pada data pilih lokasi file excel yang dimaksud.
target dimana untuk penemuan (discovery)
yang disimpan dalam suatu file terpisah dari
database.
d. Data Transformation
Suatu proses data yang sudah dipilih
sesuai proses data yang dicari atau sesuai
informasi yag ingin dicari dalam basis data.
Gambar 3 Tampilan Import File Excel
e. Data Mining
Data mining merupakan proses pencarian Kemudian pilih atribut yang akan diperlukan
sebuah pola yang unik dalam sebuah data dalam proses data transformasi yaitu ”No.” sebagai
terpilih sesuai dengan tujuan KDD dengan id atau identitas, “tanggal” sebagai date, “nama
menggunakan metode tertentu. dinas, dealer, karoseri, type chasis” sebagai
polynominal, “jumlah (unit), harga/unit dan harga
f. Interpretation / Evaluasi kontrak” sebagai integer. Jika sudah no problem,
Evaluasi pola berfungsi untuk maka save data yang telah ditentukan.
mengindentifikasi pola-pola unik dari
kumpulan data yang diproses menggunakan
data mining hingga menghasilkan sebuah
pengetahuan baru yang sesuai dengan
penelitian yang dituju
g. Knowledge Presentation
Proses terakhir dari tahapan KDD adalah
presentasi pengetahuan yang bertujuan untuk Gambar 4 Tampilan untuk Merubah Tipe Atribut
menginformasikan hasil keputusan yang
didapat dan sebagai penerjemah hasil akhir Setelah save data, langkah berikutnya melakukan
dari data mining.[4] seret (drag and drop) pada data set repository ke
menu bar process., kemudian search pada operator
3. Hasil dan Pembahasan pertama date to numerical, operator yang kedua
nominal to numerical dan yang ketiga operator
3.1. Hasil normalize lakukan seret (drag and drop) ke menu
bar process lalu hubungkan connector, seperti
Data yang akan dijadikan sampel dalam penelitian digambar 5.
ini yaitu data penjualan periode 2019 sampai 2020
yang berjumlah 203 data dari PT. Senang Jaya
Abadi berbentuk file excel. Tahapan awal yang
dilakukan yaitu data transformasi. Data transformasi
dilakukan dengan memberikan inisialisasi terhadap
data yang memiliki nilai akan disesuaikan tipe data

59
Dan pada gambar 6 dibawah ini merupakan hasil

dari normalize sudah melewati tahapan operator
pertama dan kedua.
Gambar 5 Tampilan Operator Date to Numerical, Nominal to

Numerical dan Normalize
Setelah itu sesuaikan parameter operator date to

numerical, nominal to numerical dan normalize Gambar 6 Hasil dari Normalize
sebagai berikut ini:
Tahap terakhir pada operator empat yaitu K-Means
a) Operator Date To Numerical (Clustering) kemudian seret (drag and drop) ke
Tabel 1 Parameter Date To Numerical menu bar process lalu hubungkan connector, seperti
No. Parametrs Value pada gambar 7.
1. Atribut name Tanggal
2. Time unit Month
3. Month relative to Year
Gambar 7 Tampilan Operator Clustering

b) Operator Nominal To Numerical
Tabel 2 Parameter Nominal To Numerical Setelah itu sesuaikan parameter clustering yang
No. Parametrs Value diperlukan dengan nilai k sebanyak 2 untuk melihat
penjualan mana saja yang mendominasi disetiap
1. Attribut filter type Subset cluster. Max runs sebanyak 10 kali agar perulangan
dapat mengamati lebih dalam suatu objek dengan
2. Coding type Unique integers objek lain yang kemiripan sifat dapat ditelisik oleh
sistem sebanyak 10 kali sehingga hasil dari proses
3. Unexpected value All 0 and
handli… warning
yang didapat lebih akurat. Measure type yang
digunakan numerical measure dengan jenis
Pada subset pilih atribut yang akan dirubah perhitungan jarak menggunakan euclidean distance
mejadi angka(numerical) pada kolom yaitu karena penerapan pehitungan dalam euclidean
dealer, karoseri, nama dinas, dan tipe chasis. distance lebih sederhana dengan melihat jarak
terdekat dari suatu objek ke objek yang lainPertama
c) Operator Normalize membuka aplikasi Rapidminer sehingga akan
Tabel 3 Parameter Normalize muncul tampilan awal seperti gambar 2 berikut.
No. Parametrs Value
3.2. Pembahasan
1. Attribute filter type Subset
2. Method Range transformation
3. Min 0.0
4. Max 1.0
Pada subset pilih atribut yang akan

Gambar 8 Hasil Cluster Model
dinormalisasi adalah tanggal, nama dinas,
karoseri, tipe chasis, dealer, jumlah (unit), Cluster model merupakan hasil pengelompokan
harga/unit dan nilai kontrak. algoritma k-means dari data penjualan karoseri yang
diproses dan terbagi menjadi 2 kelompok didapatlah
cluster 0 berjumlah 93 item dan cluster 1 berjumlah

60
110 item. Berikut merupakan tabel item-item yang

masuk pada setiap cluster. Pada gambar 10 merupakan scatter cluster
terhadap karoseri dan jumlah (unit) yang dipesan,
Tabel 4 Hasil Cluster 0 cluster 0 dengan jumlah (unit) karoseri yang dipesan
kurang stabil. Dan Cluster 1 dengan jumlah (unit)
CLUSTER TANGGAL KAROSERI
JUMLAH
Harga/unit
karoseri yang dipesan sangat stabil.
(UNIT)
cluster_0 Jan-19 0.0 1 Rendah

Gambar 11 Cluster Terhadap Karoseri dan Tanggal Penjualan
.... ....
Gambar 11 diatas menunjukkan scatter cluster
karoseri dan tanggal penjualan terlihat pada gambar,
Tabel 4 Hasil Cluster 1 bahwa cluster 0 menunjukkan diawal tahun sampai
dipertengahan tahun 2019-2020 tipe karoseri yang
JUMLAH dijual kurang beragam. Sedangkan cluster 1
CLUSTER TANGGAL KAROSERI Harga/unit
(UNIT)
menunjukkan dipertengahan tahun sampai diakhir
tahun 2019-2020 tipe karoseri yang dijual sangat
cluster_1 Agu-19 0.475 1 Tinggi
beragam.
cluster_1 Agu-19 0.5 1 Tinggi
Tabel 5 Jenis Karoseri Pada Setiap Cluster
Jenis
cluster_1 Agu-19 0.525 1 Tinggi Clust Harga Jumlah Penjualan Karoseri
er Karoseri Penjualan Perbulan
cluster_1 Sep-19 0.55 1 Tinggi
0.0, 0.02,
Kurang Kurang 0.05, 0.07,
.... .... 0 Rendah 0.1, 0.2, 0.3
Stabil Beragam
0.4, 0.5,
Sangat Sangat 0.6, 0.7,
1 Tinggi 0.8, 0.9
Stabil Beragam
Terlihat pada tabel 5 jika dilihat dari jenis, harga

karoseri yang rendah, jumlah penjualan kurang stabil
dan penjualan perbulan kurang beragam diawal
bulan sampai pertengahan bulan, maka anggota pada
cluster 0 merupakan penjualan yang kurang laris,
Gambar 9 Cluster Terhadap Karoseri dan Harga/Unit peminatnya sangat sedikit oleh konsumen, sehingga
produksi tidak perlu mengadakan penyetokan
Gambar 9 merupakan scatter cluster terhadap produk karoseri seperti jenis karoseri 0.0, 0.02, 0.05,
karoseri dan harga/unit. Cluster 0 menunjukkan 0.07, 0.1, 0.2 dan 0.3.
harga karoseri tergolong redang. Dan Cluster 1
menunjukkan harga karoseri tergolong tinggi. Sementara cluster 1 menempati pada posisi
terakhir dan termasuk ke dalam penjualan yang
sangat laris. Penjualan yang terdapat dalam cluster
ini harga karoseri yang tinggi, tetapi jumlah
penjualan karoseri sangat stabil dan penjualan
perbulannya sangat beragam dipertengahan bulan
hingga akhir bulan, maka diperlukannya penyetokan
produk karoseri yang banyak diminati oleh
konsumen seperti jenis karoseri 0.4, 0.5, 0.6, 0.7, 0.8
dan 0.9.
Gambar 10 Cluster Terhadap Karoseri dan Jumlah (Unit)

61
Berikut merupakan penjabar dari jenis karoseri di dalamnya terdapat atribut-atribut yang memiliki
yang tertera : kesamaan karakteristik. Setelah dilakukannya
pengelompokan data mining menggunakan
1) 0.0 merupakan jenis karoseri ambulance, algoritma K-Means clustering data penjualan
2) 0.02 merupakan jenis karoseri skylif, karoseri terbagi atas 2 cluster. Cluster 0 berisi
3) 0.05 merupakan jenis karoseri tangki BBM penjualan karoseri kurang laris dan cluster 1 berisi
5000 ltr, penjualan karoseri laris. Setelah terbagi menjadi dua
4) 0.07 merupakan jenis karoseri arm roll, cluster dapat diketahui prediksi karoseri yang
5) 0.1 merupakan jenis karoseri box diproduksi ditahun yang akan datang yaitu Dump
aluminium, Truck, Dump Truck Aero, Tangki Vacuum 4000 L,
6) 0.2 merupakan jenis karoseri self loader, Tangki Air 5000 L, Kontainer Tertutup dan
7) 0.3 merupakan jenis karoseri dalmas, Kontainer Terbuka.
8) 0.4 merupakan jenis karoseri tangki air 5000
ltr, Daftar Rujukan
9) 0.5 merupakan jenis karoseri dump truck,
10) 0.6 merupakan jenis karoseri kontainer [1] H. Samosir, M. Amin, and I. R. Harahap, “Penerapan
Data Mining Klasifiksi Produk Merk Bata
tertutup, Menggunakan Algoritma K-Means,” J. Teknol. dan Sist.
11) 0.7 merupakan jenis karoseri dump truck Inf., vol. 2, no. 1, pp. 161–166, 2021.
aero, [2] F. Indriyani and E. Irfiani, “Clustering Data Penjualan
12) 0.8 merupakan jenis karoseri kontainer pada Toko Perlengkapan Outdoor Menggunakan
Metode K-Means ( Clustering Sales Data at Outdoor
terbuka, Equipment Stores Using K-Means Method ),” J.
13) 0.9 merupakan jenis karoseri tangki vacuum Inform., vol. 7, no. November, pp. 109–113, 2019.
5000 ltr. [3] S. M. Hutabarat and A. Sindar, “Data Mining Penjualan
Suku Cadang Sepeda Motor Menggunakan Algoritma
K-Means,” J. Nas. Komputasi dan Teknol. Inf., vol. 2,
4. Kesimpulan no. 2, p. 126, 2019, doi: 10.32672/jnkti.v2i2.1555.
[4] Fauzansyah, “Implementasi Algoritma K-Means
Berdasarkan uraian diatas, dapat diambil Clustering Untuk Menentukan Arketipr Pembelian Suku
kesimpulan bahwa data mining, awalnya data Cadang Dan Asesoris Komputer(Studi Kasus Di Toko
penjualan karoseri bercampur dan atributnya tidak Laksamana Komputer Dumai),” J. Inform. Manaj. dan
memilik kriteria, setelah dilakukannya proses data Komput., vol. 9, no. 1, pp. 26–35, 2017.
mining dengan penerapan algoritma K-Means,
atribut menjadi terbagi atas berbagai kelompok yang

62

32-Article Text-127-1-10-20220205

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

32-Article Text-127-1-10-20220205

Diunggah oleh

Hak Cipta:

Format Tersedia

Terbit online pada laman web jurnal: http://publikasi.bigdatascience.

JURNAL DATA SCIENCE & INFORMATIKA

Penerapan Algoritma K-Means Dalam Prediksi Penjualan

Diterima Redaksi : 07-01-2022 | Selesai Revisi : 01-02-2022 | Diterbitkan Online : 05-02-2022

1. Pendahuluan Menggunakan Algoritma K-Means tahun 2019, yaitu

Dalam penelitian jurnal yang dilakukan oleh Sri

Jurnal Data Science dan Informatika (JDSI) Vol. 1 No. 1 (2021) xx – xx

c. Data Selection Setelah itu, import data set ke repository dengan

Jurnal Data Science dan Informatika (JDSI) Vol. 1 No. 1 (2021) xx – xx

Dan pada gambar 6 dibawah ini merupakan hasil

Gambar 5 Tampilan Operator Date to Numerical, Nominal to

Setelah itu sesuaikan parameter operator date to

1. Atribut name Tanggal

2. Time unit Month

3. Month relative to Year

Gambar 7 Tampilan Operator Clustering

2. Method Range transformation

Pada subset pilih atribut yang akan

Jurnal Data Science dan Informatika (JDSI) Vol. 1 No. 1 (2021) xx – xx

110 item. Berikut merupakan tabel item-item yang

cluster_0 Jan-19 0.0 1 Rendah

cluster_0 Jan-19 0.0 1 Rendah

cluster_0 Jan-19 0.025 1 Rendah

cluster_0 Jan-19 0.05 1 Rendah

Terlihat pada tabel 5 jika dilihat dari jenis, harga

Jurnal Data Science dan Informatika (JDSI) Vol. 1 No. 1 (2021) xx – xx

Jurnal Data Science dan Informatika (JDSI) Vol. 1 No. 1 (2021) xx – xx

Anda mungkin juga menyukai