Anda di halaman 1dari 5

IEEE TRANSACTIONS ON JOURNAL NAME, MANUSCRIPT ID 1

IMPLEMENTASI DATA MINING UNTUK


PREDIKSI PENJUALAN KARTU
SMARTFREN MENGGUNAKAN METODE
NAIVE BAYES BERBASIS WEB
Rahmaniar
——————————  ——————————

1 PENDAHULUAN
1.1 Latar Belakang
PT. Inti Central Niaga adalah salah satu outlet bandar 1.2 Rumusan Masalah
penjualan kartu smartfren di kota Makassar. Berdasarkan Berdasarkan uraian latar belakang di atas dapat dirumuskan
data penjualan kartu smartfren pada PT. Inti Central masalah sebagai berikut :
Niaga penjualan setiap item khususnya pada kartu a. Bagaimana merancang Implementasi Data Mining untuk
prabayar mengalami tingkat penjualan yang fluktuatif Prediksi Penjualan Kartu Smartfren Menggunakan Metode
setiap bulannya sebagai contoh grand total penjualan Naïve Bayes Berbasis Web?
item tipe kartu prabayar di bulan januari 2019 sebanyak b. Bagaimana mengimplementasikan Data Mining Prediksi
untuk Pejualan Kartu Smartfren Menggunakan Metode Na-
10,175 item dan penjualan menurun di bulan februari
ïve Bayes Berbasis Web?
menjadi 9,689 item, di bulan maret 3,016 item dan terus
mengalami penurunan dan kenaikan yang signifikan 1.2 Tujuan Penelitian
hingga september 2019 grand total penjualan menjadi Adapun tujuan yang hendak dicapai dalam pelaksanaan
5,575 item. Dapat disimpulkan penjualan kartu terkhusus penelitian ini adalah sebagai berikut :
untuk tipe stater pack (SP) atau kartu perdana mengalami a. Untuk merancang Implementasi Data Mining untuk
perubahan setiap bulannya. Prediksi Pejualan Kartu Smartfren Menggunakan
Hal ini mendasari bahwa dalam menentukan stok Metode Naïve Bayes Berbasis Web.
penjualan kartu smartfren disetiap outlet, outlet akan b. Untuk mengimplementasikan Data Mining untuk Pred-
dibingungkan berapa banyak stok kartu smartfren yang iksi Pejualan Kartu Smartfren Menggunakan Metode
akan dipesan terutama outlet baru karena kurangnya Naïve Bayes Berbasis Web.
pengetahuan perkembangan penjualan kartu smartfren.
Sehingga outlet baru ragu untuk memesan banyak kartu 1.3 Manfaat
smartfren dikarenakan adanya beberapa outlet mengalami Adapun manfaat yang ingin dicapai adalah mem-
kerugian. Kerumitan dan ruang lingkup pengambilan permudah outlet bandar dalam menentukan jumlah pe-
dapat diatasi dengan program prediksi penjualan kartu sanan stok kartu smartfren dilihat dari prediksi penjualan
smartfren. bulan berikutnya apakah penjualan akan naik, turun atau
Metode yang digunakan adalah metode Naive normal.
Bayes merupakan sebuah metoda klasifikasi
menggunakan metode probabilitas dan statistik yang 1.4 Bidang Pengaplikasian
dikemukakan oleh ilmuwan Inggris Thomas Bayes. Naive Bidang pengaplikasian sistem ini yakni bidang
Bayes Classifier bekerja sangat baik dibanding dengan ekonomi penjualan kartu smartfren pada Outlet bandar
model classifier lainnya. Hal ini dibuktikan oleh Xhemali Smartfren PT. Inti Central Niaga Makassar.
, Hinde Stone dalam jurnalnya “Naïve Bayes vs. Decision
Trees vs. Neural Networks in the Classification of Training 1.5 Analisis Data
Web Pages” mengatakan bahwa “Naïve Bayes Classifier Data-data penjualan tahun 2018 dan 2019 tersebut diseleksi
memiliki tingkat akurasi yang lebih baik dibanding mod- dan akan digunakan untuk diolah dalam memprediksi penjualan
el classifier lainnya”. kartu smartfren. Adapun atribut seleksi data penjualan kartu
Berdasarkan hal tersebut maka penulis mengangkat smartfren adalah Type Kartu Smartfren, Kuantitas dan Bulan.
judul penelitian “Implementasi Data Mining untuk
Prediksi Penjualan Kartu Smartfren Menggunakan
Metode Naïve Bayes Berbasis Web”.

————————————————

xxxx-xxxx/0x/$xx.00 © 200x IEEE Published by the IEEE Computer Society


2 IEEE TRANSACTIONS ON JOURNAL NAME, MANUSCRIPT ID

TABEL 1
VARIABEL DATA SELEKSI
No. Type Kartu Kuantitas Bulan (2019)
1 SP60K 1 JANUARI
2 SP30K 1 JANUARI
3 SP GSM 1 JANUARI
4 SP65K 1 JANUARI
5 SP65K 1 JANUARI
6 SP65K 1 JANUARI
7 SP30K 1 JANUARI
8 SP30K 1 JANUARI
9 SP30K 1 JANUARI Gambar 2.2 Proses Data Mining
10 SP NOW 1 JANUARI Sumber Kennedi Tampubolon et,al (2013).
11 SP GSM 1 JANUARI Ada empat tahap yang dilalui dalam Data Mining antara
12 SP65K 1 JANUARI lain (Kennedi Tampubolon et,al , 2013:97):
13 SP65K 1 JANUARI a) Tahap pertama: Precise statement of the problem
(mendefinisikan permasalahan yang ingin diketahui).
14 SP30K 1 JANUARI Misalnya ingin mengetahui apakah seorang customer ber-
15 SP30K 1 JANUARI potensi memiliki kredit macet, atau mengidentifikasi
seorang customer apakah akan pindah ke kompetitor bisnis
16 SP65K 1 JANUARI
kita, dan lain sebagainya. Setelah menemukan pertanyaan
17 SP65K 1 JANUARI bisnis yang perlu dijawab oleh data mining, selanjutnya
18 SP65K 1 JANUARI tentukan tipe tugas untuk menjawab pertanyaan bisnis ter-
sebut. Tugas dasar yang menjadi dasar algoritma data min-
19 SP65K 1 JANUARI ing adalah klasifikasi, regresi, segmentasi, asosiasi dan se-
20 SP65K 1 JANUARI quence analisis.
..6199 SP65K 1 OKTOBER b) Tahap kedua: Initial Exploration (Mempersiapkan data
yang menjadi sumber untuk data mining termaksud data
Sumber : PT.Inti Central Asia. “cleaning” untuk mempelajari polanya). Setelah
menemukan defenisi masalah, langkah berikutnya adalah
mencari data yang mendukung defenisi masalah. Menen-
2 TINJAUAN PUSTAKA
tukan porsi data yang digunakan men-training data mining
2.1 Data Mining berdasarkan algoritma data mining yang telah dibuat.
Data mining merupakan proses yang menggunakan
teknik statistik, matematika, kecerdasan buatan, dan ma- Setelah persiapan data selesai dilakukan, langkah berikutnya
chine learning untuk mengekstraksi dan mengidenfikasi adalah memberikan sebagian dataa kedalam algoritma data
informasi yang bermanfaat dan pengetahuan yang terakit mining.
dari berbagai database besar/Data Warehouse (Turban, c) Tahap ketiga: Model building and validation. Validasi
dalam Kennedi Tampubolon et,al , 2013:96). apakah data mining memberikan prediksi yang akurat.
Keluaran dari data mining bisa dipakai untuk memper- Setelah training data selesai dilakukan, data mining
baiki pengambilan keputusan dimasa depan (Budi Santo- tersebut perlu di-“uji” atau di-validasi keakuratannya
sa, dalam Kennedi Tampubolon et,al , 2013:96). terhadap data testing.
d) Tahap ke-empat: Deployment. Tahap ini memilih aplikasi
Berdasarkan defenisi-defenisi yang telah disampaikan,
yang tepat terhadap data mining untuk membuat prediksi.
hal penting yang terkait dengan Data Mining adalah:
a. Data mining merupakan suatu proses otomatis ter-
Data Mining dibagi menjadi beberapa metode ber-
hadap data yang sudah ada.
dasarkan tugas yang dapat dilakukan, yaitu:
b. Data yang akan diproses berupa data yang sangat
a) Asosiasi (Association)
besar.
Satu contohnya Market Basket Analysis, yaitu salah
c. Tujuan data mining adalah mendapatkan hubungan
satu metode asosiasi yang menganalisa kemungkinan
atau pola yang akan mungkin memberikan indikasi
pelanggan untuk membeli beberapa item secara ber-
yang bermanfaat.
samaan.
b) Pengklusteran (clustering)
Proses KDD secara garis besar dapat dijelaskan sebagai
berikut : Pengklusteran merupakan pengelompokan record,
pengamatan, atau memperhatikan dan membentuk
kelas objek-objek yang memiliki kemiripan. Kluster
adalah kumpulan record yang memiliki kemiripan sa-
AUTHOR ET AL.: TITLE 3

tu dengan yang lainnya dan memiliki ketidakmiripan satu algoritma yang terdapat pada teknik klasifikasi.
dengan record-record dalam kluster lain. Pengkluster- Naive Bayes merupakan pengklasifikasian dengan
an berbeda dengan klasifikasi yaitu tidak adanya var- metode probabilitas dan statistik
iabel target dalam pengklusteran. Pengklusteran tid-
ak mencoba untuk melakukan klasifikasi, mengesti- 2.2 Studi Literatur
masi, atau memprediksi nilai dari variabel target. Penelitian sebelumnya menjadi salah satu acuan
Akan tetapi, algoritma pengklusteran mencoba untuk penulis dalam melakukan penelitian sehingga penulis
melakukan pembagian terhadap keseluruhan data dapat memperkaya teori yang digunakan dalam
menjadi kelompok-kelompok yang memiliki kemiri- mengkaji penelitian yang dilakukan. Dari penelitian sebe-
pan. lumnya terdapat perbedaan dari judul penelitian yang
c) Prediksi (prediction) penulis angkat. Berikut beberapa jurnal penelitian terkait
Prediksi hampir sama dengan klasifikasi dan es- yang diangkat sebagai referensi dalam menunjang bahan
timasi, kecuali bahwa dalam prediksi nilai dari hasil kajian pada penelitian penulis.
akan ada di masa mendatang. 1. Penerapan Algoritma Linier Regression Untuk
Contoh prediksi bisnis dan penelitian adalah: Menentukan Estimasi Luas Lahan Panen Tanaman
1. Prediksi harga beras dalam tiga bulan yang akan Jagung Terhadap Curah Hujan Dan Area Tambah
datang. Tanam Di Kabupaten Rembang oleh Mayasari, A.
2. Prediksi persentasi kenaikan kecelakaan lalu Y,R (2015)
lintas tahun depan jika batas bawah kecepatan Penelitian penerapan algoritma linier regression ini
dinaikkan. pada data mining untuk menentukan estimasi luas la-
Beberapa metode dan teknik yang digunakan dalam han panen tanaman jagung terhadap curah hujan
klasifikasi dan estimasi dapat pula digunakan (untuk sangat membantu dalam menghitung hasil estimasi
keadaan yang tepat) untuk prediksi. (Kusrini dan luas lahan panen tanaman jagung tersebut.
Lutfi 2009:11). 2. Model Data Mining Dalam Penerapan Data Mining
d) Estimasi (estimation) Untuk Prediksi Rating Penjualan Buku
Estimasi hampir sama dengan klasifikasi, kecuali Menggunakan Metode Naive Bayes oleh Sulastri
variabel target estimasi lebih kearah numerik dari dan Yusuf Sulistyo Nugroho (2017)
pada kearah kategori. Model dibangun Sistem data mining menggunakan metode naïve
menggunakan record lengkap yang menyediakan bayes untuk memprediksi rating penjualan buku
nilai dari variabel target sebagai prediksi. Selanjut- memiliki kinerja yang baik dari segi akurasi, presisi
nya, pada peninjauan berikutnya estimasi nilai dari dan recall. Dengan nilai akurasi sebesar 74,60%. Ber-
variabel target dibuat berdasarkan nilai variabel dasarkan pengujian yang dilakukan terhadap 180 da-
predikasi. Sebagai contoh akan dilakukan estimasi ta uji dalam memprediksi rating penjualan buku,
tekanan darah sistolik pada pasien rumah sakit ber- metode ini dinilai berhasil karena memiliki nilai
dasarkan umur pasien, jenis kelamin, indeks berat dengan hasil tinggi sebanyak 115 data, hasil dapat
badan, dan level sodium darah. Hubungan antara dilihat dalam menu laporan.
tekanan darah sistolik dan nilai variabel prediksi da- 3. Implementasi Naïve Bayes untuk penjualan pulsa
lam proses pembelajaran akan menghasilkan model konter matahari cell oleh M Qowiyyun nada (2017)
estimasi. Model estimasi yang dihasilkan dapat Sistem peramalan penjualan pulsa dengan metode
digunakan untuk kasus baru lainnya. naive bayes. Merupakan suatu konsep penge-
Contoh lain yaitu estimasi nilai indeks prestasi lompokan data yang menggunakan teknik data min-
kumulatif mahasiswa program pasca sarjana dengan ing.Pengelompokan data diambil melalui data krite-
melihat nilai indeks prestasi mahasiswa tersebut pa- ria yang meliputi fasepenjualan dalam minggu ke be-
da saat mengikuti program sarjana. (Kusrini dan Lut- rapa dan jumlah nominal pulsa misal 5k, 10k, 20k,
fi 2009:10) 25k dan 50k. Data yang telah dimasukkan ke dalam
e) Klasifikasi (classification) sistem akan diproses dipilah untuk menentukan pa-
Klasifikasi adalah fungsi pembelajaran yang da minggu keberapa penjualan UP, DOWN ATAU
memetakan (mengklasifikasi) sebuah unsur (item) da- NOL.
ta ke dalam salah satu dari beberapa kelas yang su-
dah didefinisikan. Contoh lain klasifikasi dalam 4. Penerapan Data Mining dengan Algoritma Naive
bisnis dan penelitian adalah: Bayes Clasifier untuk Mengetahui Minat Beli
Menentukan apakah suatu transaksi kartu kredit Pelanggan terhadap Kartu Internet XL (Studi Kasus
merupakan transaksi yang curang atau tidak. di CV. Sumber Utama Telekomunikasi) oleh Dicky
1. Memperkirakan apakah suatu pengajuan hipotek Nofriansyah, dkk (2018)
oleh nasabah merupakan suatu kredit yang baik Sistem ini metode klasifikasi mampu menemukan
atau buruk. model yang membedakan konsep atau kelas data,
2. Mendiagnosis penyakit seorang pasien untuk dengan tujuan untuk dapat memperkirakan kelas
mendapatkan termasuk kategori penyakit apa. dari suatu objek yang labelnya tidak diketahui. Algo-
(Kusrini dan Lutfi 2009:11) ritma naive bayes dapat memprediksi peluang di masa
Algoritma Naive Bayes Clasifier merupakan salah depan berdasarkan pengalaman dimasa sebelumnya.
4 IEEE TRANSACTIONS ON JOURNAL NAME, MANUSCRIPT ID

Hasil dari penelitian ini agar dapat memprediksi atau Di mana Variabel C merepresentasikan kelas, sementara vari-
memperkirakan laku atau tidak kartu internet yang abel F1 ... Fn merepresentasikan karakteristik petunjuk yang
baru, sehingga perusahaan dapat mengambil kepu- dibutuhkan untuk melakukan klasifikasi. Maka rumus tersebut
tusan dan meningkatkan strategi pemasaran. menjelaskan bahwa peluang masuknya sampel karakteristik
5. Metode Naïve Bayes dalam memprediksi stok ba- tertentu dalam kelas C (Posterior) adalah peluang munculnya
rang (Studi Kasus CV.Abadi Mahkota Padang) kelas C (sebelum masuknya sampel tersebut, seringkali dise-
Oleh Andri Yunaldi (2018) but prior), dikali dengan peluang kemunculan karakteristik
CV. Mahkota Abadi tidak dapat memenuhi per- karakteristik sampel pada kelas C (disebut juga likelihood),
dibagi dengan peluang kemunculan karakteristik karakteristik
mintaan yang disebabkan stok yang ada telah habis,
sampel secara global (disebut juga evidence). Karena itu, ru-
dan untuk mendapatkan kembali harus menunggu
mus diatas dapat pula ditulis secara sederhana sebagai berikut:
untuk bebarapa hari. Dalam mengklasifikasi dan Nilai Evidence selalu tetap untuk setiap kelas pada satu sam-
memprediksi stok barang, penulis menggunakan pel.
Metode Naive Bayes. Metode ini merupakan suatu
metode yang mempunyai akurasi yang baik dalam
hal klarifikasi dan prediksi. Dari hasil perhitungan
menggunakan tools memberikan hasil yang sama
dengan perhitungan secara manual dengan melihat Nilai dari posterior tersebut nantinya akan dibandingkan
pada tingkat galat atau nilai kesalahan atau error dengan nilai nilai posterior kelas lainnya untuk menentukan ke
yang diberikan sebagai berikut : MAD = 13,3972, kelas apa suatu sampel akan diklasifikasikan.
MSE = 2901,0898, MAPE = 5,91%, MPE = -5,519%. Penjabaran lebih lanjut rumus Bayes tersebut dilakukan
dengan menjabarkan ( | ) menggunakan aturan perkalian se-
bagai berikut:
3 METODE PENELITIAN
3.1 Algoritma Naïve Bayes
Menurut Santosa dalam Ridwan (2013:61) “Naïve Bayes
Classifier merupakan salah satu algoritma dalam teknik data
mining yang menerapkan teori Bayes dalam klasifikasi.”
Teorema keputusan Bayes adalah pendekatan statistik yang
fundamental dalam pengenalan pola (pattern recognition). Na- Dapat dilihat bahwa hasil penjabaran tersebut menyebab-
ïve bayes didasarkan pada asumsi penyederhanaan bahwa nilai kan semakin banyak dan semakin kompleksnya faktor-faktor
atribut secara conditional saling bebas jika diberikan nilai out- syarat yang mempengaruhi nilai probabilitas, yang hampir
put. Dengan kata lain, diberikan nilai output, probabilitas mustahil untuk dianalisa satu persatu. Akibatnya, perhitungan
mengamati secara bersama adalah produk dari probabilitas in- tersebut menjadi sulit untuk dilakukan. Di sinilah digunakan
dividu. asumsi independensi yang sangat tinggi (naif), bahwa masing
Dikutip dari Hermawati (2013:54) Persamaan dari teorama masing petunjuk (F1,F2...Fn) saling bebas (independen) satu
Bayes adalah: sama lain. Dengan asumsi tersebut, maka berlaku suatu kesa-
maan sebagai berikut:
Untuk i≠j , sehingga
Persamaan di atas merupakan model dari teorema Naive Bayes
yang selanjutnya akan digunakan dalam proses klasifikasi.
Untuk klasifikasi dengan data kontinyu digunakan rumus
Di mana : Densitas Gauss:
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi X
(posteriori probabilitas)
P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H) : Probabilitas X berdasarkan kondisi pada
hipotesis H
P(X) : Probabilitas X Di mana :
P : Peluang
Untuk menjelaskan metode Naive Bayes, perlu diketahui Xi : Atribut ke i
bahwa proses klasifikasi memerlukan sejumlah petunjuk untuk xi : Nilai atribut ke i
menentukan kelas apa yang cocok bagi sampel yang dianalisis Y : Kelas yang dicari
tersebut. Karena itu, metode Naive Bayes di atas disesuaikan yi : Sub kelas Y yang dicari
sebagai berikut: μ : Mean, menyatakan rata-rata dari seluruh
atribut
σ : Deviasi standar, menyatakan varian dari se
luruh atribut.
AUTHOR ET AL.: TITLE 5

3.2 Jenis dan Sumber Data a.Analisa Permasalahan


Data yang penulis dapatkan merupakan data sekunder yang Pada tahap ini akan dilakukan analisis dengan metode
merupakan kumpulan dari data penjualan dari produk Smartfren prediksi atau forecasting pada data transaksi penjualan kartu
untuk Outlet bandar PT.Inti Central Asia. Data yang penulis internet Smartfren.
kumpulkan terhitung dari bulan Januari 2018 sampai dengan b. Preprosessing Data
bulan September 2019. Sebagai bahan dalam pengujian metode Mempersiapkan data yang akan ditambang.
yang digunakan dalam memprediksi stok barang penulis c. Pengujian
mengambil sampel pada januari 2019 sampai September 2019. Pada tahap ini dilakukan proses pengujian dan percobaan
Tahapan pengumpulan data sebagai berikut : terhadap aplikasi sesuai dengan kebutuhan yang ditentukan
a. Studi Literatur sebelumnya agar berjalan seperti yang diharapkan.
Studi literatur yang digunakan dalam penulisan Penelitian
ini adalah mengumpulkan bahan referensi mengenai metode 4 IMPLEMENTASI ALGORITMA
prediksi dari berbagai buku, jurnal, dan beberapa referensi
lainnya. 5 HASIL DAN PEMBAHASAN
b. Observasi 6 KESIMPULAN DAN SARAN
Metode pengumpulan data yang dilakukan dengan menga-
dakan pengamatan atau peninjauan langsung terhadap sumber REFERENCES
permasalahan serta berkomunikasi langsung dengan pihak yang
bersangkutan serta bertanggungjawab dalam penentuan restock [1] Dicky Nofriansyah. 2015. Algoritma Data Mining dan Pen-
kartu dan penjualan. gujiannya. Yogyakarta: Deepublish
c. Wawancara [2] Fajar A. H. 2013. Data Mining. Yogyakarta: Andi Offset. H.
[3] Kusrini & Emha, T. L. 2009. Algoritma Data Mining. Yogyakarta:
Metode pengumpulan data yang dilakukan melalui tanya
Andi Offset.
jawab yang diajukan secara langsung kepada narasumber untuk
mendapatkan data atau informasi yang berkaitan dengan objek
penelitian.
Adapun kerangka pemikiran penelitian ini sebagai berikut :

Gambar 3.1 Kerangka Pemikiran

Anda mungkin juga menyukai