Klasifikasi Pengguna Kendaraan Roda 4 Dengan Algoritma K-Nearest Neighbor

KLASIFIKASI PENGGUNA KENDARAAN RODA
4 DENGAN ALGORITMA K-NEAREST

NEIGHBOR
Fazli Arif, Farros Taufiqur Rahman
Program Studi Teknik Komputer, Jurusan Teknik Komputer
Universitas Negeri Makassar
Abstract— Perkembangan teknologi informasi mulai memasuki bagian terpenting dalam suatu bidang pekerjaan,
informasi yang didapat dalam suatu pekerjaan menyangkut hal umum dan khusus. Komputer merupakan salah satu
hasil dari perkembangan teknologi canggih yang dapat digunakan untuk membantu segala jenis pekerjaan termasuk
transaksi pada pekerjaan bisnis dengan kemudahan yang ada didalam Software komputer seorang user dapat melakukan
operasional transaksi dengan cepat. Penggunaan komputer juga dibutuhkan oleh seorang marketing. Penjualan mobil
pada perusahaan masih belum stabil dan mengakibatkan banyaknya mobil tidak terjual dan tidak terawat karena
kurangnya minat konsumen untuk membeli. Agar perusahaan tidak mengalami masalah penjualan, maka perusahaan
harus mampu mencari solusi dengan cara mampu melakukan prediksi. Sehingga penelitian ini bertujuan untuk
melakukan prediksi penjualan mobil menggunakan algoritma K-NN. Dataset yang digunakan untuk memprediksi di
ambil dari data penjualan mobil yang berisi data spesifikasi mobil dan penjualannya. Setelah dilakukan analisis
mengggunakan algoritma K-NN, dengan bantuan software Python, maka diperoleh tingkat akurasi dalam memprediksi
penjualan sebesar 41,6%
Kata kunci — Car, Klasifikasi, K-Knearest Neighbor
I. PENDAHULUAN
Mobil merupakan salah satu angkutan transportasi yang paling banyak digunakan pada saat ini. Baik mobil pribadi
maupun mobil umum telah menjadi pilihan utama dalam melakukan kegiatan sehari – hari karena mobil memiliki keunggulan
yang tidak dimiliki alat transportasi lain yang saat ini juga banyak digunakan seperti motor dan bus. Mobil dapat dinaiki sampai 8
orang sekaligus termasuk supir, dengan mobil yang hanya bisa dinaiki 2 orang saja sehingga membutuhkan banyak mobil saat
ingin berpergian bersama keluarga atau teman - teman, Sedangkan bus sebenarnya bisa dinaiki oleh banyak orang namun karena
bentuknya yang panjang dan besar membuat bus tidak lebih efisien dibandingkan mobil. Mobil memiliki beberapa jenis dan merk
yang berbeda. Konsumen akan memilih mobil yang diinginkannya berdasarkan latar belakang yang berbeda. Maka dari itu
mengetahui preferensi konsumen akan sangat menguntungkan penjual. Konsumen akan dikelompokkan berdasarkan merek mobil
yang dibeli sehingga penjual dapat mengetahui karakteristik konsumen yang membeli suatu jenis atau Merk tertentu.
Berikut adalah grafik mobil di indonesia. Pada grafik tersebut, terlihat penjualan dari Januari – Juni 2019 konstan
diangka kisaran 80.000 dan mengalami penurunan dibulan Juni menjadi 59.600. Lalu angka penjualan Kembali normal dan
XXX-X-XXXX-XXXX-X/XX/Rp.XX.00 ©20XX UBP

konstan. Tapi dibulan April 2020 angka penjualan menurun drastis dari sebelumnya 76.811 menjadi 7.868. Penjualan mobil
Kembali meningkat hingga bulan Maret 2021 terjadi peningkatan drastis hingga angka 84.910
Hal ini menyebabkan banyaknya pilihan yang dimiliki konsumen. Konsumen akan memilih mobil yang diinginkannya
berdasarkan latar belakang yang berbeda. Maka dari itu mengetahui preferensi konsumen akan sangat menguntungkan penjual.
Konsumen akan dikelompokkan berdasarkan merek mobil yang dibeli sehingga penjual dapat mengetahui karakteristik konsumen
yang membeli suatu jenis atau Merk tertentu.
Penelitian ini bertujuan untuk Mengetahui minat pembeli kendaraan beroda 4 berdasarkan dataset penjualan yang akan
bermanfaat kepada penjual sehingga dapat mengetahui jenis dan merek kendaraan mana yang paling diminati dan juga yang tidak
diminati pembeli.
II. LITERATUR REVIEW

A. Big Data
Big data merupakan istilah umum untuk sekumpulan data yang jumlahnya sangat besar dan kompleks sehingga tidak mudah
untuk ditangani atau proses hanya dengan metode pemrosesan data biasa. Terdapat tiga masalah utama yang diselesaikan oleh big
data, antara lain
1. Volume Ukuran data yang disimpan atau diproses.
2. Velocity Kecepatan membuat data. Kecepatan data dibuat umumnya berbanding lurus dengan volume data.
3. Variety Keberagaman data yang diolah. Dari segi format maupun struktur data. Teknologi yang berkaitan dengan big data
akan memudahkan proses pengumpulan data-data yang sebelumnya tidak bisa atau sulit untuk dikumpulkan.
B. Sistem
Perkembangan teknologi terasa sangat dibutuhkan dalam perusahaan, Big Data mengolah data informasi mengoptimalkan
operasi, mencegah ancaman dan penipuan, dan memanfaatkan sumber daya baru. Meningkatnya permintaan terhadap informasi
tersebut memerlukan pendekatan fundamental baru untuk arsitektur, alat-alat dan praktik.
Dengan menggunakan data – data yang kita peroleh dari sistem kita bisa mengklasifikasikan data, mengoptimalkan operasi,
mencegah ancaman dan penipuan, dan memanfaatkan sumber daya baru. Teknologi big data harus mendukung layanan pencarian,
pengembangan, pengelolaan, dan penganalisaan untuk semua jenis data dari data transaksi dan aplikasi sampai data mesin dan
sensor untuk sosial, gambar, dan data spasial.
C. Python
Python merupakan bahasa pemrograman yang cocok digunakan dalam jenis kepentingan website, pengembangan aplikasi
dan banyak lainnya kegunaan yang dimiliki. Python juga memiliki dukungan untuk modul dan package, dimana python sendiri
memperbolehkan sistem modul dan kode untuk digunakan kembali.
III. METODE PENELITIAN
K-nearest neighbor adalah salah satu algoritma machine learning dengan pendekatan supervised learning yang bekerja dengan
mengkelaskan data baru menggunakan kemiripan antara data baru dengan sejumlah data (k) pada lokasi yang terdekat yang telah
tersedia. Algoritma ini menerapkan “lazy learning” atau “instant based learning” dan merupakan algoritma non parametrik.
Algoritma KNN digunakan untuk klasifikasi dan regresi.
K-nearest neighbors melakukan klasifikasi dengan proyeksi data pembelajaran pada ruang berdimensi banyak. Ruang ini
dibagi menjadi bagian-bagian yang merepresentasikan kriteria data pembelajaran. Setiap data pembelajaran direpresentasikan
menjadi titik-titik c pada ruang dimensi banyak. Teknik pencarian tetangga terdekat yang umum dilakukan dengan menggunakan
formula jarak euclidean. Berikut adalah urutan kerja dari melakukan klasifikasi dengan K-nearest neighbors.
1. berikut diberikan tabel yang berasal dari 5 baris dataset yang digunakan dalam penelitian ini
2. Pertama yaitu melakukan normalisasi nilai pada data training dengan menggunakan rumus
Normalisasi = Data−(Minimum kolom data )/(Maksimum kolom data)−( Minimum kolom data )
3. Lalu menghitung Jarak Euclidean untuk mencari jarak antara 2 titik, yaitu titik training dan data testing.
m
∑ ( xik −x jk ¿ 2 )1 /2
k =1
Dimana,
Xik = nilai X pada training data
Xjk = nilai X pada testing data
m = batas jumlah banyaknya data
4. Lalu membandingkan Jarak Euclidean paling kecil diantara data tersebut untuk mengetahui kelas dari data testing. Dari
hasil perbandingan diketahui bahwa data testing memiliki kelas yang sama dengan baris keempat yaitu kelas 2.
IV. HASIL DAN PEMBAHASAN

1. Melakukan import pandas dan mounting ke drive
2. Menggunakan Pandas untuk membaca file excel dan memperlihatkan 5 baris teratas
3. Menghapus kolom yang tidak digunakan yaitu kolom Model
4. Memisahkan tabel Class di variabel X dan tabel lainnya di variabel y, lalu membagi dataset 80% untuk training dan 20%
untuk testing
5. Melakukan standarisasi nilai pada data training dan testing, lalu melakukan klasifikasi dengan KNN dengan nilai k
adalah 2
6. Melakukan prediksi pada data testing, lalu menghitung matriks confusion dan skor akurasinya. Pada program ini
didapakan akurasi 41%.
7. Melaukukan klasifikasi lebih lanjut dengan menggunakan nilai k dari 1 sampai 40 untuk mengetahui nilai k yang cocok.
8. Menampilkan grafik error dari klasifikasi lanjut

9. Pada grafik berikut, terlihat nilai k yang paling cocok adalah 2 dengan rate error 57%. untuk mendapatkan hasil yang
lebih baik, maka menggunakan nilai k yang memiliki error rate paling rendah disarankan.
V. KESIMPULAN
Berdasarkan hasil penelitian ini dapat disimpulkan bahwa :

1. Dengan melakukan prediksi penjualan menggunakan algoritma KNN, penjual dapat mengetahui jenis dan spesifikasi
mobil apa yang memiliki penjualan yang baik dan juga mobil yang memiliki penjualan yang buruk
2. Pengujian algoritma K-NN dapat menghasilkan laporan prediksi berdasarkan data penjualan mobil yang berisi data
spesifikasi mobil dan penjualannya dengan tingkat keberhasilan mencapai 41,6%.
VI. DAFTAR PUSTAKA
[1] Muhammad Firmansyah Rafsyanzani s., Andi Maslan, “Implementasi Metode K-Nearest Neighbor dalam peramalan penjualan mobil
bekas di kota batam,” Jurnal Comasie, Vol 4 No.02 2021
[2] Agustina Dhea Tiaratuti, Slamet Sudaryanto M.Kom, “Implementasi Metode K-Nearest Neighbor dalam peralamalan penjualan mobil pada
PT. BENGAWAN ABADI MOTOR”, hal 3 - 7
[3] Ilham Gumantung Gusti, Muhammad Nasrun, Ratna Astuti Nugrahaeni “Rekomendasi Sistem Pemilihan mobil menggunakan K-Nearest
Neighbor (KNN) Collaborative Filtering,” Jurnal Tektrika, Vol.4, No.1, Januari 2019.

Klasifikasi Pengguna Kendaraan Roda 4 Dengan Algoritma K-Nearest Neighbor

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Klasifikasi Pengguna Kendaraan Roda 4 Dengan Algoritma K-Nearest Neighbor

Diunggah oleh

Hak Cipta:

Format Tersedia

KLASIFIKASI PENGGUNA KENDARAAN RODA

4 DENGAN ALGORITMA K-NEAREST

Kata kunci — Car, Klasifikasi, K-Knearest Neighbor

XXX-X-XXXX-XXXX-X/XX/Rp.XX.00 ©20XX UBP

II. LITERATUR REVIEW

1. Volume Ukuran data yang disimpan atau diproses.

III. METODE PENELITIAN

IV. HASIL DAN PEMBAHASAN

3. Menghapus kolom yang tidak digunakan yaitu kolom Model

8. Menampilkan grafik error dari klasifikasi lanjut

Berdasarkan hasil penelitian ini dapat disimpulkan bahwa :

Anda mungkin juga menyukai