id
Abstract
The carosery is a heavy transportation equipment such as transporting garbage, car accidents, sand, stones,
gravel, drinking water and others. In carosery sales, sales are very important in increasing company profits.
Therefore, the carosery is in great demand by consumers to help the needs of life. So that in this sales data, there
is a lot of data generated, so there is no data that knows what type of carosery is needed by consumers and lacks
predicting carosery sales. This study also discusses a problem, which applies data mining with the k-means
algorithm. Data mining is in charge of analyzing the characteristics of the data to find interesting hidden
patterns using certain techniques, methods, and algorithms. In this study, the attributes used are number, date,
name of service, dealer, carosery, quantity (unit), chassis type, price / unit and contract value. Operators used in
the k-means algorithm process are date to numerical, nominal to numerical, normalize and clustering. The data
used are 203 data grouped into 2 clusters, cluster 0 produces 93 sales items for the carosery that are not in
demand by consumers and cluster 1 produces 110 sales items for the carosery that are in demand by consumers..
Keywords: Carosery, Sales, Data Mining, K-Means
Abstrak
Karoseri merupakan alat angkut berat seperti angkut sampah, mobil kecelakaan, pasir, batu, kerikil, air minum
dan lainnya. Dalam penjualan karoseri, penjualan sangatlah penting dalam meningkatkan laba perusahaan. Oleh
karena itu, karoseri banyak diminati oleh konsumen untuk mempermudah membantu kebutuhan sehari-hari.
Sehingga dalam data penjualan ini banyaknya data yang dihasilkan maka, belum adanya data yang mengetahui
tipe karoseri apa saja yang banyak dibutuhkan oleh konsumen dan kurangnya memprediksi penjualan karoseri.
Penelitian ini pun membahas dari sebuah permasalahan tersebut, yang menerapkan data mining dengan
algoritma k-means. Data mining bertugas menganalisis karakteristik data untuk mencari pola-pola tersembunyi
yang menarik dengan menggunakan teknik, metode dan algoritma tertentu. Dalam penelitian ini atribut yang
digunakan yaitu no, tanggal, nama dinas, dealer, karoseri, jumlah (unit), tipe chasis, harga/unit dan nilai kontrak.
Operator yang digunakan pada proses algoritma k-means yaitu date to numerical, nominal to numerical,
normalize dan clustering. Data yang digunakan sebanyak 203 data dikelompokkan menjadi 2 cluster, cluster 0
menghasilkan 93 item penjualan karoseri kurang laris yang kurang diminati oleh konsumen dan cluster 1
menghasilkan 110 item penjualan karoseri sangat laris yang banyak diminati oleh konsumen.
Kata kunci: Karoseri, Penjualan, Data Mining, K-Means.
Data cleaning dilakukan untuk yang dibutuhkan pada algoritma K-Means. Tipe data
menghapus sebuah data yang tidak valid atau yang dibutuhkan yaitu numerical, maka tahapan
noise, memperbaiki sebuah data untuk proses yang digunakan yaitu operator date to
menjadi sebuah data yang valid. numerical, nominal to numerical dan normalize.
Berikut ini tahapan transformasi dataset.
b. Data Integration
Data integration merupakan memadukan
dua data atau lebih yang dikelompokkan
dalam sebuah gudang data (data warehouse).
Yang bertujuan untuk mencari sebuah data
yang terbaik agar tidak terjadinya kesalahan
dalam pengambilan sebuah keputusan dalam
proses data mining. Gambar 2 Tampilan Awal Aplikasi Rapidminer
d. Data Transformation
Suatu proses data yang sudah dipilih
sesuai proses data yang dicari atau sesuai
informasi yag ingin dicari dalam basis data.
Gambar 3 Tampilan Import File Excel
e. Data Mining
Data mining merupakan proses pencarian Kemudian pilih atribut yang akan diperlukan
sebuah pola yang unik dalam sebuah data dalam proses data transformasi yaitu ”No.” sebagai
terpilih sesuai dengan tujuan KDD dengan id atau identitas, “tanggal” sebagai date, “nama
menggunakan metode tertentu. dinas, dealer, karoseri, type chasis” sebagai
polynominal, “jumlah (unit), harga/unit dan harga
f. Interpretation / Evaluasi kontrak” sebagai integer. Jika sudah no problem,
Evaluasi pola berfungsi untuk maka save data yang telah ditentukan.
mengindentifikasi pola-pola unik dari
kumpulan data yang diproses menggunakan
data mining hingga menghasilkan sebuah
pengetahuan baru yang sesuai dengan
penelitian yang dituju
g. Knowledge Presentation
Proses terakhir dari tahapan KDD adalah
presentasi pengetahuan yang bertujuan untuk Gambar 4 Tampilan untuk Merubah Tipe Atribut
menginformasikan hasil keputusan yang
didapat dan sebagai penerjemah hasil akhir Setelah save data, langkah berikutnya melakukan
dari data mining.[4] seret (drag and drop) pada data set repository ke
menu bar process., kemudian search pada operator
3. Hasil dan Pembahasan pertama date to numerical, operator yang kedua
nominal to numerical dan yang ketiga operator
3.1. Hasil normalize lakukan seret (drag and drop) ke menu
bar process lalu hubungkan connector, seperti
Data yang akan dijadikan sampel dalam penelitian digambar 5.
ini yaitu data penjualan periode 2019 sampai 2020
yang berjumlah 203 data dari PT. Senang Jaya
Abadi berbentuk file excel. Tahapan awal yang
dilakukan yaitu data transformasi. Data transformasi
dilakukan dengan memberikan inisialisasi terhadap
data yang memiliki nilai akan disesuaikan tipe data
3. Min 0.0
4. Max 1.0
0.4, 0.5,
Sangat Sangat 0.6, 0.7,
1 Tinggi 0.8, 0.9
Stabil Beragam
Berikut merupakan penjabar dari jenis karoseri di dalamnya terdapat atribut-atribut yang memiliki
yang tertera : kesamaan karakteristik. Setelah dilakukannya
pengelompokan data mining menggunakan
1) 0.0 merupakan jenis karoseri ambulance, algoritma K-Means clustering data penjualan
2) 0.02 merupakan jenis karoseri skylif, karoseri terbagi atas 2 cluster. Cluster 0 berisi
3) 0.05 merupakan jenis karoseri tangki BBM penjualan karoseri kurang laris dan cluster 1 berisi
5000 ltr, penjualan karoseri laris. Setelah terbagi menjadi dua
4) 0.07 merupakan jenis karoseri arm roll, cluster dapat diketahui prediksi karoseri yang
5) 0.1 merupakan jenis karoseri box diproduksi ditahun yang akan datang yaitu Dump
aluminium, Truck, Dump Truck Aero, Tangki Vacuum 4000 L,
6) 0.2 merupakan jenis karoseri self loader, Tangki Air 5000 L, Kontainer Tertutup dan
7) 0.3 merupakan jenis karoseri dalmas, Kontainer Terbuka.
8) 0.4 merupakan jenis karoseri tangki air 5000
ltr, Daftar Rujukan
9) 0.5 merupakan jenis karoseri dump truck,
10) 0.6 merupakan jenis karoseri kontainer [1] H. Samosir, M. Amin, and I. R. Harahap, “Penerapan
Data Mining Klasifiksi Produk Merk Bata
tertutup, Menggunakan Algoritma K-Means,” J. Teknol. dan Sist.
11) 0.7 merupakan jenis karoseri dump truck Inf., vol. 2, no. 1, pp. 161–166, 2021.
aero, [2] F. Indriyani and E. Irfiani, “Clustering Data Penjualan
12) 0.8 merupakan jenis karoseri kontainer pada Toko Perlengkapan Outdoor Menggunakan
Metode K-Means ( Clustering Sales Data at Outdoor
terbuka, Equipment Stores Using K-Means Method ),” J.
13) 0.9 merupakan jenis karoseri tangki vacuum Inform., vol. 7, no. November, pp. 109–113, 2019.
5000 ltr. [3] S. M. Hutabarat and A. Sindar, “Data Mining Penjualan
Suku Cadang Sepeda Motor Menggunakan Algoritma
K-Means,” J. Nas. Komputasi dan Teknol. Inf., vol. 2,
4. Kesimpulan no. 2, p. 126, 2019, doi: 10.32672/jnkti.v2i2.1555.
[4] Fauzansyah, “Implementasi Algoritma K-Means
Berdasarkan uraian diatas, dapat diambil Clustering Untuk Menentukan Arketipr Pembelian Suku
kesimpulan bahwa data mining, awalnya data Cadang Dan Asesoris Komputer(Studi Kasus Di Toko
penjualan karoseri bercampur dan atributnya tidak Laksamana Komputer Dumai),” J. Inform. Manaj. dan
memilik kriteria, setelah dilakukannya proses data Komput., vol. 9, no. 1, pp. 26–35, 2017.
mining dengan penerapan algoritma K-Means,
atribut menjadi terbagi atas berbagai kelompok yang