2279 7516 2 PB

Infotek : Jurnal Informatika dan Teknologi
Vol. 3 No. 2, Juli 2020, hal. 104-114
Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Efektivitas Penjualan Vape

(Rokok Elektrik) pada “Lombok Vape On”
Yahya1*, Winda Puspita Hidayanti2

1,2Program Studi Sistem Informasi, Universitas Hamzanwadi
*ayhay7078@gmail.com
Abstrak
Perusahaan yang dibangun dengan tujuan untuk menghasilkan barang atau jasa yang ditujukan untuk memenuhi
kebutuhan konsumen juga untuk memperoleh keuntungan bagi perusahaan tersebut. Perusahaan sudah tentu
memiliki tujuan yang sama yaitu mencapai target yang sudah direncanakan dan mampu menghasilkan
pemasukan yang selalu meningkat disetiap tahunnya. Dan salah satu kegiatan usaha yang harus dilakukan agar
perusahaan tetap berjalan dan berkembang adalah penjualan. Keputusan yang diambil pemegang tanggung
jawab perusahaan akan mempengaruhi perusahaan dimasa depan. Salah satu keputusan yang harus ditentukan
yaitu produk yang akan diproduksi dan dijual untuk periode selanjutnya. Dilihat dari era globalisasi saat ini bahwa
usaha yang dapat mengikuti zaman yaitu produk rokok elektrik (Vape). Produk tersebut benar-benar diminati oleh
kalangan anak muda hususnya para pria. Salah satu instansi yang mengambil keputusan untuk menggeluti bisnis
tersebut yaitu Lombok Vape On. “Lombok Vape On” memiliki konsumen yang cukup banyak sehingga
pendapatan yang didapat tentu banyak, akan tetapi pendapatannya tidak menentu dan tidak dapat diprediksi
dengan baik setiap bulannya. Tujuan dari penelitian ini untuk mengklasifikasikan hasil penjualan dari Lombok
Vape on untuk mengetahui efektifitas penjualan perbulannya agar toko tersebut dapat mengetahui pasang surut
pemasukan yang didapat. Apabila instansi tersebut mengetahui tingkat penjualannya maka instansi tersebut
dengan mudah mengubah strategi penjualan agar stabil dan meningkat. Untuk itu peneliti menerapkan metode K-
Nearest Neighbor untuk mengklasifikasin masalah tersebut,dan diharapkan metode ini mampu mengatasi
masalah pada “Lombok Vape On”.
Kata Kunci : K-NN, Vape, Lombok Vape On
Abstract
Companies that are built with the aim of producing goods or services that are intended to meet the needs of
consumers as well as to obtain profits for the company. The company certainly has the same goal which is to
achieve the planned target and be able to generate revenue that is always increasing every year. And one of the
business activities that must be done so that the company continues to run and develop is sales. The decision
taken by the holder of corporate responsibility will affect the company in the future. One of the decisions that must
be determined is the product to be produced and sold for the next period. Judging from the current era of
globalization, businesses that can keep up with the times are electric cigarette products (vape). These products
are really in demand by young people especially men. One of the agencies that made the decision to run the
business was Lombok Vape On. Lombok Vape On has quite a lot of consumers so that the income earned is
certainly a lot, but the income is uncertain and cannot be well predicted every month. The purpose of this study is
to classify the sales results from Lombok Vape on to determine the effectiveness of monthly sales so that the
store can know the ups and downs of income obtained. If the agency knows the level of sales, the agency can
easily change the sales strategy to be stable and increase. For this reason researchers applied the K-Nearest
Neighbor method to classify the problem, and it is hoped that this method is able to overcome the problem in
Lombok Vape On.
Keywords: K-NN, Vape, Lombok Vape On
e-ISSN 2614-8773 104

Vol. 3 No. 2, Juli 2020, hal. 104-114
1. Pendahuluan dihasilkan tidak stabil dan tidak mampu

Penjualan merupakan salah satu unsur penting diprediksi kenaikan dan penurunan
dalam suatu bisnis di bidang pemasaran, setiap penjualannya.
bisnis memiliki tujuan yang umum disetiap Dari penelitian yang dilakukan, berusaha untuk
langkah dan prosesnya, tujuan yang dimaksud mengklasifikasikan hasil penjualan dari “Lombok
mampu mencapai target yang sudah Vape On” untuk mengetahui efektifitas
direncanakan dan mampu menghasilkan penjualan. Data yang digunakan adalah data
pemasukan yang selalu meningkat disetiap hasil penjualan tahun 2019 dan
tahunnya, selain itu bisnis yang baik memiliki mengklasifikasikan hasil penjualan pada
tujuan jangka panjang supaya masa yang akan “Lombok Vape On” berdasarkan jumlah item
datang dapat mengalami perubahan ke arah atau jenis barang yang mampu terjual.
yang lebih baik. Kegiatan perusahaan yang bisa Dengan melakukan klasifikasi pada toko tersebut
menghasilkan keuntungan adalah penjualan, dan dapat mengetahui pasang surut pemasukan
penjualan merupakan salah satu faktor yang didapat dari toko “Lombok Vape On”. Untuk
terpenting dalam bisnis. Dengan adanya mengetahui efektifitas dari toko tersebut,
perkembangan yang semakin pesat di era dilakuakn dengan menggunakan salah satu
globalisasi ini, pebisnis berlomba-lomba untuk metode dalam data mining yang merupakan
mendapatkan banyak keuntungan dengan proses yang menggunakan teknik statistik,
berbagai macam kegiatan penjualan dimana matematika, kecerdasan buatan, machine
semakin banyak barang yang terjual maka leraning untuk mengekstraksi dan
semakin banyak pula keuntungan yang dicapai. mengidentifikasi informasi yang bermanfaat dan
Salah satu bisnis yang fenomena dikalangan pengetahuan yang terkait dari berbagai database
masyarakat saat ini yaitu bisnis Vape (Rokok yang besar, sedangkan metode yang digunakan
Elektrik) dimana belakangan ini kita tahu bahwa yaitu metode K-Nearest Neighbor.
rokok elektrik sudah mulai diminati oleh Kelebihan menggunakan metode K-Nearest
masyarakat banyak terutama pada Neighbor diperkirakan dapat memberikan hasil
perkembangan gaya hidup dikalangan pria, prosentase yang cukup bagus sehingga
namun selain pria, saat ini wanita remaja juga prosentase yang dihasilkan mampu membuat
menjadi salah satu peminat dari rokok elektrik toko “Lombok Vape On” mengetahui pasang
tersebut. Salah satu toko di Nusa Tenggara surut dari hasil penjualan. Apabila toko
Barat yang memilih untuk mendirikan bisnis mengetahui peningkatan atau penurunan dari
rokok elektrik yaitu “Lombok Vape on”, toko hasil penjualannya maka toko dapat segera
tersebut menghasilkan penjualan yang cukup mengambil tindakan untuk mengubah dan
besar setiap tahun, tetapi hasil penjualan yang meningkatkan strategi yang jauh lebih baik lagi.
e-ISSN 2614-8773 105

Vol. 3 No. 2, Juli 2020, hal. 104-114
Berdasarkan uraian di atas, maka penelitian digunakan adalah k=1, k=3, k=5 dan k=7.
yang dilakukan adalah Penerapan Algoritma K- Hasil penelitian menunjukkan bahwa, hasil
Nearest Neighbor Untuk Klasifikasi Efektivitas produksi yang dominan adalah dengan nilai
Penjualan Vape (Rokok Elektrik) Pada “Lombok k=7 sebesar yang memiliki nilai accuracy
Vape On”. sebesar 34%. Hal tersebut juga
mengindikasikan bahwa K-Nearest Neighbor
2. Tinjauan Pustaka (KNN) dipengaruhi oleh jumlah klastering
2.1. Penelitian terkait data[2].
Dalam penulisan skripsi ini, penulis terinspirasi - Penelitian yang dilakukan oleh Ricky
menggunakan referensi dari penelitian-penelitian Imanuel Ndaumanu, Kusrini, M. Rudyanto
sebelumnya yang berkaitan dengan Arief yang berjudul Analisis Prediksi Tingkat
pembahasan skripsi yang dibuat. Penelitian ini Pengunduran Diri Mahasiswa Dengan
terkait penggunaan data mining dengan Metode K-Nearest Neighbor. Pada penelitian
menggunakan algoritma K-Nearest Neighbor. ini, dikemukakan bahwa dari jumlah
Berikut ini penelitian terdahulu yang berkaitan pendaftaran mahasiswa baru ini, banyak
dengan proposal skripsi antara lain: juga mahasiswa yang mengundurkan diri
- Penelitian yang dilakukan (Resti Hutami, setiap tahunnya yang disebabkan berbagai
2016), algoritma ini digunakan untuk masalah. Oleh karena adanya mahasiswa
melakukan prediksi data penjualan furniture yang mengundurkan diri, penulis melakukan
pada CV. Octo Agung Jepara. Hasil analisis pengunduran diri mahasiswa
penelitian menunjukan metode yang menggunakan algoritma K-Nearest
diusulkan berhasil diimplementasikan untuk Neighbor. Penelitian ini bertujuan untuk
menyelesaikan kasus prediksi penjualan memprediksi seberapa tingkat akurasi
dengan tingkat error sebesar 6 persen dan pengunduran diri mahasiswa STIKOM
akurasi 94 persen[1]. UYELINDO Kupang.[3].
- Penelitian yang dilakukan oleh Nobertus
Krisandi. Dkk dengan judul “Algoritma K- 2.2. Landasan Teori
Nearest Neighbor dalam Klasifikasi Data 1. Pengertian Data Mining
Hasil Produksi Kelapa Sawit pada PT. Data mining merupakan disiplin ilmu yang
Minamas Kecamatan Parindu”. Data yang mempelajari metode untuk mengekstrak
digunakan adalah data hasil produksi kelapa pengetahuan atau menemukan pola dari suatu
sawit (Tonase) dari 50 kelompok tani pada data. Data mining adalah suatu metode
periode Juli-Desember 2011 pada PT. pengolahan data untuk menemukan pola yang
Minasa Kabupaten Sanggau. Nilai k yang tersembunyi dari data tersebut. Hasil dari
e-ISSN 2614-8773 106

Vol. 3 No. 2, Juli 2020, hal. 104-114
pengolahan data dengan metode data mining ini output berupa pengetahuan baru yang
dapat digunakan untuk mengambil keputusan di diharapkan memberikan kontribusi yang lebih
masa depan. Salah satu teknik yang dibuat baik secara detail dijelaskan sebagai berikut :
dalam data mining adalah bagaimana menelusuri
data yang ada untuk membangun sebuah model,
kemudian menggunakan model tersebut agar
dapat mengenali pola data yang lain yang tidak
berada dalam basis data yang tersimpan.
Kebutuhan untuk prediksi juga dapat Gambar 1. Tahapan data mining
memanfaatkan teknik ini. Dalam data mining, a. Data Selection
pengelompokan data juga bisa dilakukan. Pemilihan (seleksi) data dari sekumpulan
Tujuannya adalah agar kita dapat mengetahui data operasional. Data hasil seleksi akan
pola universal data-data yang ada[1]. digunakan untuk proses data mining, dan
disimpan dalam suatu berkas dan terpisah
2. Pengertian Penerapan dari basis data operasional.
Menurut Kamus Besar Bahasa Indonesia (KBBI), b. Cleaning Data
pengertian penerapan adalah perbuatan Proses cleaning dilakukan dengan
menerapkan, sedangkan menurut beberapa ahli, menghilangkan noise, membuang duplikasi
penerapan adalah suatu perbuatan data, memeriksa data yang tidak konsisten,
mempraktekkan suatu teori, metode, dan hal dan memperbaiki kesalahan pada data,
lain untuk mencapai tujuan tertentu dan untuk seperti kesalahan cetak (tipografi).
suatu kepentingan yang diinginkan oleh suatu c. Transformasi Data
kelompok atau golongan yang telah terencana Tahap ini merupakan proses transformasi
dan tersusun sebelumnya. pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining.
3. Tahapan Data Mining
d. Data mining
Menurut Fayyad, 1996 dalam jurnal Yuli Sudriani
Data mining merupakan proses mencari pola
yang berjudul “Tren Analisa Data Berskala Besar
atau informasi yang sangat menarik dalam
Terkait Penelitian Ekologi” menyatakan tahapan
data terpilih dengan menggunakan teknik
yang dilakukan pada proses data mining diawali
atau metode tertentu.
dari seleksi data dari data sumber ke data target,
e. Interpretation/Evalution
tahap preprocessing untuk memperbaiki kualitas
Tahap ini mencakup pemeriksaan apakah
data, transformasi, data mining serta tahap
pola atau informasi yang ditemukan
interpretasi dan evaluasi yang menghasilkan
e-ISSN 2614-8773 107

Vol. 3 No. 2, Juli 2020, hal. 104-114
bertentangan dengan fakta atau hipotesis c. Training Datasets

yang ada sebelumnya. Training dataset satu set data yang berisi
nilai dari kedua komponen di atas yang
4. Klasifikasi digunakan untuk menentukan kelas yang
Klasifikasi adalah satu bentuk analisis data cocok berdasarkan predictor.
yang menghasilkan model untuk d. Testing dataset
mendeskripsikan kelas data yang penting. Testing dataset berisi data baru yang akan
Klasifikasi memprediksi kategori ke dalam label diklasifikasikan oleh model yang telah dibuat
class. Klasifikasi merupakan proses untuk dan akurasi klasifikasi dievaluasi.
menemukan model atau fungsi yang
menjelaskan atau membedakan konsep atau 5. Algoritma K-NN (K-Nearest Neighbor)
class data, dengan tujuan untuk dapat K-Nearest Neighbor (K-NN) adalah suatu metode
memperkirakan kelas dari suatu objek yang yang menggunakan algoritma supervised dimana
labelnya tidak diketahui[2]. hasil dari sampel uji yang baru diklasifikasikan
Algoritma klasifikasi yang banyak digunakan berdasarkan mayoritas dari kategori pada K-NN.
secara luas, yaitu Decision/Classification Trees, Tujuan dari algoritma ini adalah mengklasifikasi
Bayesian Classifiers/Naïve Bayes Classifiers, objek baru berdasakan atribut dan sampel latih.
Neural Networks, Analisa Statistik, Algoritma Pengklasifikasian tidak mengguna kan model
Genetika, Rough Sets, K-Nearest Neighbor, apapun untuk dicocokkan dan hanya
Metode Rule Based, Memory Based Reasoning, berdasarkan pada memori. Diberikan titik uji,
dan Support Vector Machines (SVM). Proses akan ditemukan sejumlah K objek (titik training)
klasifikasi didasarkan pada empat komponen yang paling dekat dengan titik uji. Klasifikasi
(Gorunescu, 2011) [3]: menggunakan voting terbanyak di antara
a. Kelas klasifikasi dari K objek. Algoritma K-NN
Variabel dependen yang berupa kategorikal menggunakan klasifikasi ketetanggaan sebagai
yang merepresentasikan label yang terdapat nilai prediksi dari sampel uji yang baru. Dekat
pada objek. Contohnya: resiko penyakit atau jauhnya tetangga biasanya dihitung
jantung, resiko kredit, customer loyalty, jenis berdasarkan jarak Eucledian[4].
gempa. J Piksel 1(1) : 65 -76 (2013). Langkah-langkah untuk menghitung algoritma K-
b. Predictor Variabel independen Nearest Neighbor:
Predictor Variabel independenyang - Menentukan parameter K (Jumlah tetangga
direpresentasikan oleh karakteristik (atribut) paling dekat).
data. Contohnya: merokok, minum alkohol,
tekanan darah, tabungan, aset, gaji.
e-ISSN 2614-8773 108

Vol. 3 No. 2, Juli 2020, hal. 104-114
- Menghitung kuadrat jarak Euclid (queri Keterangan :

instance) masing-masing objek terhadap P= Kasus baru
data sampel yang diberikan. q = Kasus yang ada dalam penyimpanan
- Kemudian mengurutkan objek-objek n = Jumlah atribut dalam tiap kasus
tersebut ke dalam kelompok yang i = Atribut individu antara 1 sampai dengan n
mempunyai jarak Euclid terkecil. f = Fungsi similarity atribut i antara kasus p dan
- Mengumpulkan kategori Y (Klasifikasi kasus q
Nearest Neighbor) w= Bobot yang diberikan pada atribut ke-i.
Ada banyak cara untuk mengukur jarak
kedekatan antara data baru dengan data lama 6. Definisi Dataset
(data training), diantaranya euclidean distance Untuk istilah mainframe IBM untuk suatu file,
dan manhattan distance (city block distance), lihat Kumpulan data (mainframe IBM). Untuk
yang paling sering digunakan adalah euclidean perangkat antarmuka telekomunikasi, lihat
distance (Bramer,2007), yaitu[5]: Modem. Kumpulan data (atau dataset) adalah
√( ) ( ) ( ) kumpulan data. Dalam kasus data tabular, satu
Dimana a = a1,a2,..., an, dan b = b1, b2, ..., bn set data sesuai dengan satu atau lebih tabel
mewakili n nilai atribut dari dua record. Untuk database, di mana setiap kolom tabel mewakili
atribut dengan nilai kategori, pengukuran dengan variabel tertentu, dan setiap baris sesuai dengan
euclidean distance tidak cocok. Sebagai catatan tertentu dari set data yang dimaksud.
penggantinya, digunakan fungsi sebagai berikut Kumpulan data mencantumkan nilai untuk setiap
(Larose, 2006):different(ai,bi) ={0jika ai=bi1 variabel, seperti tinggi dan berat objek, untuk
selainnya. Dimana ai dan bi adalah nilai kategori. setiap anggota kumpulan data. Setiap nilai
Jika nilai atribut antara dua record yang dikenal sebagai datum. Kumpulan data juga
dibandingkan sama maka nilai jaraknya 0, dapat terdiri dari kumpulan dokumen atau file.
artinya mirip, sebaliknya, jika berbeda maka nilai
kedekatannya 1, artinya tidak mirip sama sekali. 7. RapidMiner
Misalkan atribut warna dengan nilai merah dan RapidMiner merupakan perangkat lunak yang
merah, maka nilai kedekatannya 0, jika merah dibuat oleh Dr. Markus Hofmann dari Institute of
dan biru maka nilai kedekatannya 1. Technologi Blanchardstown dan Ralf Klinkenberg
Untuk menghitung kemiripan kasus, digunakan dari rapid-i.com dengan tampilan GUI (Graphical
rumus (Kusrini, 2009): User Interface) sehingga memudahkan
( ) pengguna dalam menggunakan perangkat lunak
∑ ( ) ini. Perangkat lunak ini bersifat open source dan
dibuat dengan menggunakan program Java di
e-ISSN 2614-8773 109

Vol. 3 No. 2, Juli 2020, hal. 104-114
bawah lisensi GNU PublicLicence dan serta referensi yang terkait dengan topik
RapidMiner dapat dijalankan di sistem operasi yang akan dibahas dalam penyusunan
manapun. Dengan menggunakan RapidMiner, skripsi ini, serta mengunjungi (Browsing)
tidak dibutuhkan kemampuan koding khusus, situs-situs internet yang berhubungan
karena semua fasilits sudah disediakan. dengan skripsi.
RapidMiner dikhususkan untuk penggunaan data
mining. Model yang disediakan juga cukup 3.2. Teknik Pemrosesan Data
banyak dan lengkap, seperti Model Bayesian, 1. Eksperimen Algoritma K-Nearest Neighbor
Modelling, Tree Induction, Neural Network dan Data berikut adalah datasets penjualan pada
lain-lain. Banyak metode yang disediakan oleh “Lombok Vape On”. Dimana terdapat 9 record
RapidMiner mulai dari klasifikasi, klustering, untuk data training yaitu no 1-9 dan 1 data
asosiassi dan lain-lain. testing yaitu no 10.
Tabel 1. Data Seleksi
3. Metode Penelitian
3.1. Teknik Pengumpulan Data
Untuk memperoleh data yang digunakan dalam
penelitian ini, ada beberapa metode yang
digunakan antara lain :
- Observasi
Teknik observasi yang dilakukan adalah
mengumpulkan data dengan melakukan Langkah-langkah dari algoritma K-Nearest
obsevasi atau pengamatan langsung ke Neighbor :
Lombok Vape On untuk melakukan - Penentuan parameter k=5 (jumlah tetangga
penelitian dan mencari informasi-informasi paling dekat). Disini dalam penentuan
yang dibutuhkan dalam menyelesaikan parameter k=5
penelitian ini. - Menghitung Eucliden distance)

Tabel 2. Hasil Euclidean distance
- Interview (Wawancara)
Melakukan komunikasi langsung dengan
teknik tanya jawab atau wawancara dengan
pemilik toko Lombok Vape On.
- Studi pustaka
Suatu metode pengumpulan data dengan
cara membaca dan mempelajari buku-buku
yang berhubungan dengan penelitian ini,
e-ISSN 2614-8773 110

Vol. 3 No. 2, Juli 2020, hal. 104-114
- Mengurutkan objek-objek tersebut kedalam Data yang memiliki Euclid terkecil adalah data ke
kelompok yang mempunyai jarak Euclidian 2, 6, 4, 9, 8 dari data yang sudah diuji tersebut
terkecil. Untuk mengurutkannya kita hanya terdapat semua data mencapai target. Sehingga
perlu membuat urutan dari data yang mayoritas data mampu mencapai target. Jadi
mempunyai jarak terkecil ke data terbesar. hasil klasifikasi dan pengolahan untuk kawat koil
Tabel 3 Urutan Jarak Euclidian terkecil dalah penyandang mencapai target.
2. Pengujian Algoritma
Diperlukan beberapa tahapan untuk mengolah
data yaitu:
a. Untuk menganalisa, dibutuhkan data training
yang akan diolah dan dimasukkan kedalam
- Mengumpulkan kategori Y (Klasifikasi
Rapidminer dan menggunakan berbagai
Nearest Neighbor). Pada tahap ini hanya
macam format seperti csv, xls, mdb, dan
mengambil data sesuai dengan jumlah k yang
lain-lain. Adapun format data yang digunkan
kita tentukan adalah k=5. Jadi, kita memilih 5
oleh penulis yaitu xls.
data yang memiliki Euclid terkecil, dan
b. Buka aplikasi rapidminer, kemudian akan
hasilnya sebagai berikut :
tampil halaman awal, selanjutnya kelik File
Tabel 4. Urutan kategori Y
dan pilih New Proses.
- Dengan menggunakan kategori mayoritas, Gambar 2. Tampilan kerja Rapidminer

maka didapat hasil klasifikasi dan pengolahan c. Memasukkan data yang akan diolah dan
seperti tabel di bawah: sesuikan format data yang dimiliki oleh
Tabel 5. Urutan kategori mayoritas
peneliti, dan disini peneliti menggunakan
format xls kemudian kelik pada pencarian
atau [filter] di Rapidminer seperti pada
gambar di bawah ini, Kemudian pilih Import
Wizard.
e-ISSN 2614-8773 111

Vol. 3 No. 2, Juli 2020, hal. 104-114
Gambar 6. Tampilan pengecekan data

g. Tahapan ini dilakukan untuk menentukan
label pada data, dan apabila ada atribut yang
tidak diperlukan, hilangkan centang paling
Gambar 3. Pemilihan format data atas sesuaikan urutan dari atribut yang tidak
d. Tampilan data untuk import wizard diperlukan tersebut. Kemudian pilih finish
diperlukan 5 langkah dalam tahapan ini, untuk masuk ke tahap selanjutnya, seperti
langkah ke-1 tentukan nama file yang berisi gambar di bawah ini:
data training yang akan dimasukkan dan
selanjutnya klik next pada gambar di bawah
ini.
Gambar 7. Pemilihan tabel atribut dan label

h. Tahapan ini dilakukan untuk menambahkan
model algoritma yang dibutuhkan, pilih Tab
Gambar 4. Pemilihan Data
Operator- Modelling-Classification and
e. Tampilan data untuk menentukan tempat
Regression-Lazy Modelling- k-NN. Apabila
data tersimpan, selanjutnya klik next pada
sudah terpilih algortima terebut selanjutnya
gambar di bawah ini:
Geser k-NN ke arah Main Process dan
hubungkan seperti gambar di bawah ini :
Gambar 5 Tampilan sheet data

f. Tampilan untuk melihat data yang kosong,
Gambar 8. Relasi data training dengan model
atau data yang tidak dapat diolah.
i. Tampilan untuk melihat hasil dari
Selanjutnya klik next pada gambar di bawah
pengolahan menggunakan algoritma K-
ini:
Nearest Neighbor, pilih menu Process-Run
maka akan tampil hasil seperti berikut ini :
e-ISSN 2614-8773 112

Vol. 3 No. 2, Juli 2020, hal. 104-114
2. Confusion Matrix
Jumlah true positif (TP) adalah 121 record
diklasifikasikan sebagai class yang mencapai
target dan false negatif (FN) sebanyak 21 record
diklasifikasikan sebagai class yang mencapai
Gambar 9. Relasi data training dengan model target namun pada kenyataannya adalah berada
pada class yang tidak mencapai target.
4. Hasil dan Pembahasan
Berikutnya 122 record false positif (TN)
1. Cros validation
diklasifikasikan sebagai class yang tidak
Pengujian ini menggunakan 281 data, pengujian
mencapai target, dan 17 record false positif (FP)
ini juga dilakukan untuk mengetahui pengaruh
diklasifikasikan sebagai class yang tidak
nilai k terhadap tingkat akurasi data, semakin
mencapai target namun ternyata diklasifikasikan
tinggi jumlah k yang digunakan maka akan
sebagai class yang mencapai target.
semakin bagus hasil dari pengujian. Nilai k yang
Berdasarkan Tabel 8 menunjukkan bahwa
terbaik pada algoritma ini tergantung pada jenis
tingkat akurasi menggunakan algoritma K-
data yang digunakan. Nikai k yang bagus dapat
Nearest Neighbor dengan K-Fold Validation 6
dipilih dengan optimasi parameter, contohnya
adalah sebesar 86.48%, dan dapat dihitung
dengan menggunakan cross validation. Dalam
untuk mencari nilai accuracy, sensitivity,
kasus khusus, klasifikasi K-Nearest Neighbor
specificity, Ppv dan Npv pada persamaan di
dapat diprediksi berdasarkan training data yang
bawah ini.
paling dekat (dengan kata lain k=1). Nilali k
3. Kurva ROC
(ketetanggaan paling dekat) yang digunakan
dalam penelitian ini adalah 1, 2, 3, 4, 5, 6, 7, 8, 9,
10 dengan cross validation 10.
Gambar di atas adalah grafik ROC dengan nilai

Algoritma K-Nearest Neighbor akan melakukan AUC (Area Under Curve) dengan hasil accuracy
training terhadap data yang telah dipisahkan oleh dengan K-Fold Validation 6 sebesar 86.48%
Cross Validation menjadi dua tempat yaitu satu dengan nilai akurasi Excellent Classification.
tempat untuk data training dan satu tempat untuk
data testing. Training terdiri dari metode K- 5. Kesimpulan
Nearest Neighbor yang digunakan dan testing Berdasarkan hasil penelitian yang dilakukan,
terdiri dari apply model dan performance. dapat disimpulkan bahwa data penjualan yang
e-ISSN 2614-8773 113

Vol. 3 No. 2, Juli 2020, hal. 104-114
telah diolah dengan menerapkan teknik data

mining menggunakan algoritma K-Neraest 6. Daftar Pustaka
Neighbor. Dari data penjualan dapat diketahui [1] R. A. Pangestu, S. Rudiarto, and D.
Fitrianah, “Aplikasi Web Berbasis
bahwa rata-rata jumlah satu jenis barang
Algoritma K-Nearest Neighbour Untuk
penjualan 10 pcs dapat disebut sebagai kategori Menentukan Klasifikasi Barang Studi
Kasus : Perum Peruri,” vol. 2, no. 1, 2018.
mampu mencapai target dan apabila kurang dari
[2] B. Sawit, S. Bss, and M. Metode, “Data
10 pcs yang terjual maka akan disebut dengan Mining Untuk Memprediksi Hasil Produksi
Buah Sawit Pada Pt Bumi Sawit Sukses
kategori tidak mampu mencapai target. Dari
(Bss) Menggunakan Metode K-Nearest
kategori tersebut dapat diketahui hasil Neighbor”, pp. 198–207, 2019.
[3] H. B. Suhartini1, “Klasifikasi Algoritma K-
pengolahan jumlah barang yang paling banyak
Nearest Neighbor Berbasis Particle
terjual oleh toko bisnis Lombok Vape On. Swarm Optimization Untuk Kelayakan
Bantuan Rehabilitasi Rumah Tidak Layak
Pengujian ini dilakukan dengan cara menghitung
Huni Pada Desa Lenek Duren Kecamatan
sesuai dengan langkah-langkah algoritma K-NN Aikmel Kabupaten Lombok Timur
Suhartini1,Hariman,” vol. 2, no. 2, pp. 79–
(K-Nearest Neighbor) untuk menghasilkan model
85, 2019.
sehingga masuk dalam kategori excellent [4] Yahya, “Prediksi Jumlah Penggunaan
BBM Perbulan Menggunakan Algoritma
classification, pengolahan dilakukan dengan
Decition Tree(C4.5),” vol. 1, no. 1, pp.
menggunakan 9 Validation, dari pengolahan 56–63, 2018.
[5] M. Rivki and A. M. Bachtiar,
tersebut terdapat K-Fold Validation 6 menjadi
“Implementasi Algoritma K-Nearest
percobaan yang memiliki akurasi tertinggi. Dari Neighbor Dalam Pengklasifikasian
Follower Twitter Yang Menggunakan
percobaan yang telah dilakukan dapat diketahui
Bahasa Indonesia,” J. Sist. Inf., vol. 13,
hasil nilai K-Fold Validation 6 dengan hasil no. 1, p. 31, 2017.
[6] Y. A. Setianto, K. Kusrini, and H. Henderi,
akurasi diperoleh sebesar 86.48% dan AUC
“Penerapan Algoritma K-Nearest
sebesar 0.874. Oleh karena itu metode algoritma Neighbour Dalam Menentukan
Pembinaan Koperasi Kabupaten
K-Nearest Neighbor merupakan salah satu
Kotawaringin Timur,” Creat. Inf. Technol.
algoritma klasifikasi yang baik digunakan dan J., vol. 5, no. 3, p. 232, 2019.
mampu mengklasifikasikan jumlah barang yang
[7] U. B. Rahayu, U. Islam, N. Sunan, and G.
dapat terjual paling banyak. Adapaun jenis Djati, “Penerapan Algoritma K-Nearest
Neighbor Dan Algoritma Simple Multi
barang yang dikategorikan terjual paling banyak
Attribute Rating Technique Untuk
oleh toko bisnis tersebut yaitu jenis barang Aegis Menentukan Strategi Penjualan Pada Pt .
Inti ( Persero ),” 2016.
boost, One fire, Coil gear 300mah, Voopoo vinci
[8] B. SAWIT, S. BSS, AND M. METODE,
coil, Smok rpm coil 0 3. Sehingga dalam “Data Mining Untuk Memprediksi Hasil
Produksi Buah Sawit Pada Pt Bumi Sawit
menganalisa data metode ini cukup akurat untuk
Sukses (Bss) Menggunakan Metode K-
menganalisis data penjualan yang dikategorikan Nearest Neighbor,” PP. 198–207, 2019.
jenis barang paling dominan.
e-ISSN 2614-8773 114

2279 7516 2 PB

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

2279 7516 2 PB

Diunggah oleh

Hak Cipta:

Format Tersedia

Infotek : Jurnal Informatika dan Teknologi

Vol. 3 No. 2, Juli 2020, hal. 104-114

Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Efektivitas Penjualan Vape

Yahya1*, Winda Puspita Hidayanti2

Kata Kunci : K-NN, Vape, Lombok Vape On

Keywords: K-NN, Vape, Lombok Vape On

e-ISSN 2614-8773 104

1. Pendahuluan dihasilkan tidak stabil dan tidak mampu

e-ISSN 2614-8773 105

e-ISSN 2614-8773 106

e-ISSN 2614-8773 107

bertentangan dengan fakta atau hipotesis c. Training Datasets

e-ISSN 2614-8773 108

- Menghitung kuadrat jarak Euclid (queri Keterangan :

e-ISSN 2614-8773 109

obsevasi atau pengamatan langsung ke Neighbor :

Lombok Vape On untuk melakukan - Penentuan parameter k=5 (jumlah tetangga

penelitian dan mencari informasi-informasi paling dekat). Disini dalam penentuan

yang dibutuhkan dalam menyelesaikan parameter k=5

penelitian ini. - Menghitung Eucliden distance)

e-ISSN 2614-8773 110

- Dengan menggunakan kategori mayoritas, Gambar 2. Tampilan kerja Rapidminer

e-ISSN 2614-8773 111

Gambar 6. Tampilan pengecekan data

Gambar 7. Pemilihan tabel atribut dan label

Gambar 5 Tampilan sheet data

e-ISSN 2614-8773 112

Gambar di atas adalah grafik ROC dengan nilai

e-ISSN 2614-8773 113

telah diolah dengan menerapkan teknik data

e-ISSN 2614-8773 114

Anda mungkin juga menyukai