6203 21930 1 PB
6203 21930 1 PB
1,2
Universitas Mercu Buana Jakarta
Fakultas Ilmu Komputer
Jl. Meruya Selatan 1 No. 1, Kembangan, 11650, Jakarta Barat
e-mail: 1herry.derajad@mercubuana.ac.id, 2saruni.dwiasnati@mercubuana.ac.id
Abstrak
Apotek merupakan tempat sarana pelayanan informasi obat dan perbekalan farmasi lainnya kepada
masyarakat. Dewasa ini telah banyak apotek yang berdiri dan tersebar hingga ke pedesaan sehingga
memudahkan masyarakat untuk mengakses peralatan farmasi dan obat-obatan. Tujuan penelitian ini
adalah untuk menganalisis masalah-masalah pada penentuan sebuah produk mana yang dapat di
kategorikan LAKU atau TIDAK LAKU. Jenis obat yang makin lama makin bervariatif, dari obat yang
berharga murah sampai harga yang kalau dilihat sangat kurang masuk akal namun fungsinya sangat
bagus. Meningkatnya peredaran jenis obat terutama vitamin, hal ini mendorong penulis untuk
melakukan penelitian untuk menentukan produk vitamin mana yang LAKU atau TIDAK LAKU yang
bisa di gunakan sebagai pedoman sebuah apotek dalam menentukan jumlah stok barang yang harus
ada pada gudang apotek tersebut. Informasi yang diinginkan dari penelitian ini adalah mendapatkan
nilai accuracy untuk data penjualan obat-obatan terutama jenis-jenis vitamin yang sering menjadi
pilihan dari nasabah yang membutuhkan obat-obatan tersebut dengan menggunakan algoritma
klasifikasi data mining yaitu algoritma Naïve Bayes. Penelitian ini menggunakan tools Rapidminner
versi 8 sebagai media untuk menguji data yang akan diolah untuk mendapatkan hasil accuracy dan
nilai ROC. Nilai accuracy tersebut menunjukkan di nilai 88.00%.
Abstract
A pharmacy is a place for drug information services and other pharmaceutical supplies to the
community. Nowadays many pharmacies have been established and spread to the countryside,
making it easier for the public to access pharmaceutical equipment and medicines. The purpose of
this study is to analyze the problems in determining which product can be categorized as DO or NOT.
The types of drugs which are increasingly varied, from low-priced drugs to prices that are seen as
very unreasonable but whose function is very good. Increased circulation of drugs, especially
vitamins, this prompts the authors to conduct research to determine which vitamin products are
DOING or NOT DOING which can be used as a guideline for a pharmacy in determining the amount
of stock that must exist in the pharmacy warehouse. The information desired from this research is to
obtain accuracy values for sales data of drugs, especially the types of vitamins that are often the
choice of customers who need these drugs by using a data mining classification algorithm, the Naïve
Bayes algorithm. This research uses Rapidminner version 8 as a media tool to test the data to be
processed to get accuracy and ROC values. The accuracy value shows that the value is 88.00%.
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 2
JURNAL INFORMATIKA, Vol.7 No.1 April 2020
ISSN: 2355-6579 | E-ISSN: 2528-2247
tinggi dan Data yang heterogen dan berbeda beberapa waktu yang lalu dan prediksi harga
sifat satu dengan yang lainnya (Ratniasih, saham dalam empat bulan ke depan.
2019). Salah satu metode utama data mining
Setiap metode tersebut memiliki adalah Supervised Learning ( Pembelajaran
algoritma-algoritma yang terbaik yang dapat dengan Guru), algoritma ini melakukan proses
digunakan untuk memproses dataset yang belajar berdasarkan nilai dari indikator target
ada. Namun dalam Penelitian ini diharapkan yang terhubung dengan indikator prediktor.
dapat membangun sebuah sistem dalam Sedangkan metode analisis yang terdapat
mengestimasi jenis vitamin untuk pada data mining salah satu nya adalah
meningkatkan penjualan pada bulan Klasifikasi. Klasifikasi sendiri memiliki definisi
berikutnya yang sesuai dengan data-data sebuah proses yang digunakan untuk
penjualan sebelumnya sehingga jenis vitamin menemukan model atau fungsi yang
yang diminati oleh pelanggan benar-benar mendeskripsikan dan membedakan data ke
tersedia pada apotek tersebut sehingga dapat dalam kelas-kelas yang bertujuan untuk
membantu apotek dalam meningkatkan omset menemukan pola yang lebih memiliki nilai dari
penjualannya menggunakan algoritma Naïve data yang berukuran relatif besar hingga
Bayes. sangat besar. Klasifikasi melibatkan proses
Data mining merupakan suatu langkah pemeriksaan karakteristik dari objek dan
dalam melakukan Knowledge Discovery in memasukkan objek ke dalam salah satu kelas
Databases (KDD). Knowledge discovery yang sudah didefinisikan sebelumnya. Dalam
sebagai suatu proses terdiri atas pembersihan klasifikasi hanya terdapat satu atribut dari
data (data cleaning), integrasi data (data sekian banyaknya atribut yang bisa menjadi
integration), pemilihan data (data selection), kemungkinan yang disebut atribut target,
transformasi data (data transformation), data sedangkan atribut lainnya yang terdapat
mining, evaluasi pola (pattern evaluation) dan disebut atribut prediktor. Tiap kemungkinan
penyajian pengetahuan (knowledge nilai yang dimiliki oleh atribut target
presentation). Data mining mengacu pada menunjukkan class yang diprediksi
proses untuk menambang (mining) berdasarkan nilai-nilai dari atribut prediktor.
pengetahuan dari sekumpulan data yang Naive Bayes merupakan teknik prediksi
sangat besar untuk menghasilkan sebuah berbasis probabilistik sederhana yang
pengetahuan baru dari bidang tertentu berdasar pada penerapan teorema Bayes
(Firdaus, 2017). (aturan bayes) dengan asumsi independensi (
Pada Data Mining terdapat 3 bagian ketidaktergantungan) yang kuat (naif). Dengan
yaitu: Assosiation, Klasifikasi dan Clustering. kata lain, dalam Naive Bayes model yang
Assosiation memiliki definisi sebuah proses digunakan adalah model fitur independen
yang digunakan untuk menemukan suatu (Prasetyo,2012).
hubungan yang terdapat pada nilai atribut dari Sistem pengolahan data yang ada pada
sekumpulan data yang dimiiki, sedangkan beberapa apotek yang ada di Indonesia masih
Klasifikasi adalah teknik yang dilakukan untuk belum dapat mengetahui dengan pasti produk
memprediksi class atau properti dari setiap apa saja yang LAKU atau TIDAK LAKU pada
instance data, dan Clustering sendiri memliki bulan sebelumnya agar mengetahui produk
makna pengelompokan data tanpa mana yang harus di stok lebih banyak lagi
berdasarkan kelas data tertentu ke dalam untuk bulan selanjutnya
kelas objek yang sama sesuai dengan topik Data yang akan digunakan pada
penelitian ini adalah 150 dataset. Penelitian
yang diangkat.
ini dilakukan karena atas masalah mengetahui
Prediksi memiliki kemiripan definisi produk pada bulan sebelumnya agar dapat
dengan klasifikasi, akan tetapi data yang menentukan stok produk mana yang mesti di
digunakan pada klasifikasi berdasarkan perbanyak menggunakan algoritma Naïve
perilaku atau nilai yang diperkirakan pada Bayes agar mengetahui nilai accuracy nya.
masa yang akan datang yang dilihat dari Penelitian sebelumnya mengenai data
pola/nilai pada masa lalu. Contoh dari tugas mining dengan menggunakan algoritma Naïve
prediksi misalnya untuk memprediksikan Bayes adalah hasil penelitian yang dilakukan
adanya pengurangan jumlah pelanggan dalam oleh (Dwiasnati, Devianto, 2018)
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 3
JURNAL INFORMATIKA, Vol.7 No.1 April 2020
ISSN: 2355-6579 | E-ISSN: 2528-2247
menghasilkan algoritma Naïve Bayes dapat sekitar 150 data yang telah diklasifikasikan
dilakukan dalam penelitian di berbagai aspek berdasarkan variable yang ada.
bidang, seperti pada data set dalam Masalah yang harus dipecahkan pada
memprediksi Nasabah Potensial pada sebuah penelitian kali ini adalah, bagaimana
perusahaan asuransi. Hasil penelitian yang menghasilkan nilai accuracy yang jauh lebih
dilakukan oleh ( Budiyanto, Dwiasnati, 2018) optimal untuk mengklasifikasikan prediksi
menyatakan bahwa algoritma Naïve Bayes Calon Nasabah Potensial untuk ditawari
tersebut mampu membantu penyelesaian produk lainnya. Dataset yang digunakan pada
permasalahan pemilihan produk terlaris di penelitian ini ada pada Gambar di bawah ini:
sebuah perusahaan yang bergerak dalam
pengadaan dan layanan barang dari sistem
CCTV bersama dengan sistem Kontrol Akses
dengan tingkat akurasi memiliki kebenaran
81.36%. Selanjutnya penelitian yang
dilakukan oleh (Prabowo, Kodar, 2019) dapat
digunakan untuk memprediksi lama masa
studi mahasiswa pada sebuah universitas baik
fakultas eksak ataupun fakultas social.
Penelitian yang dilakukan oleh (Bustami,
2014) dapat digunakan untuk memprediksi
nasabah sebuah perusahaan asuransi untuk
mengetahui lancar, kurang lancar atau tidak
lancarnya nasabah tersebut dalam
pembayaran pinjaman tersebut.
Metode Penelitian
Penelitian ini akan mengusulkan hasil
accuracy baru untuk sebuah permasalahan
memprediksi Produk LAKU atau TIDAK LAKU
pada bulan sebelumnya untuk mnegetahui Gambar 1. Dataset
pola minat pelanggan terhadap pembelian
vitamin pada sebuah apotek. Data yang b. Pengolahan Data
digunakan dalam penelitian ini di ambil pada Dataset ini dalam tahap preprocessing harus
tahun 2018 bulan Januari-Mei, data yang di melalui 3 proses, yaitu:
ambil kisaran 5.000 an namun untuk data Tahap ini akan melibatkan sub proses antara
testing untuk penelitian ini penulis hanya lain:
mengambil sampel data sebanyak 137. a) Membuang duplikasi data
Model desain ini akan melakukan pemrosesan b) Memeriksa data yang inkonsisten
data training dan data testing untuk menguji c) Memperbaiki kesalahan pada data.
metode algoritma yang digunakan. Tahapan
yang akan dilalui dibagi menjadi 3 bagian, Dan Hasil akhir dari data ini berupa kumpulan
yaitu preprocessing, seleksi fitur (Feature
data yang sudah bersih atau tidak ada missing
Selection) dan validation yang didalamnya
valuenya.
berisi sub proses training dan testing.
c. Evaluasi dan Validasi Data
a. Pengumpulan Data
Validasi dilakukan menggunakan 10
Data yang digunakan pada penelitian
fold cross validation. Dimana dengan
kali ini merupakan data sekunder, karena
menggunakan teknik ini dengan membagi
sumber data diperoleh melalui media
perantara atau secara tidak langsung yang secara acak ke dalam tiap bagian dimana
berupa buku, catatan, bukti yang telah terdiri dari 10 bagian untuk setiap bagian akan
tervalidasi, atau arsip baik yang dipublikasikan dilakukan proses klasifikasi terlebih dahulu,
maupun yang tidak dipublikasikan secara Sedangkan pengukuran akurasi diukur
umum yaitu 100 ribu data yang akan dipecah dengan confusion matrix dan kurva ROC
menjadi 80 persen data training dan 20 persen (Receiver Operating Characteristics) untuk
data testing. Data testing yang digunakan mengukur nilai AUC.
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 4
JURNAL INFORMATIKA, Vol.7 No.1 April 2020
ISSN: 2355-6579 | E-ISSN: 2528-2247
PerformanceVector:
accuracy: 88.00% +/- 10.67%
(mikro: 87.92%)
ConfusionMatrix:
True: Tidak Ya
Tidak: 2 8
Ya: 10 129
precision: 92.74% +/- 3.26%
(mikro: 92.81%) (positive class:
Ya)
Gambar 2. Sumber : (Gorunescy, 2011) ConfusionMatrix:
True: Tidak Ya
Tidak: 2 8
Hasil dan Pembahasan Ya: 10 129
Data yang digunakan dalam recall: 94.01% +/- 11.73% (mikro:
pengklasifikasiaan Calon Nasabah Potensial 94.16%) (positive class: Ya)
terdiri dari 5.000 dataset,137 data yang ConfusionMatrix:
digunakan untuk data testing berdasarkan True: Tidak Ya
variabel yang tersedia. Klasifikasi dilakukan Tidak: 2 8
dengan menggunakan Software Rapidminer Ya: 10 129
dengan versi 8 untuk mengolah data yang AUC (optimistic): 0.514 +/- 0.330
sudah di tentukan (mikro: 0.514) (positive class:
Ya)
1. Confusion Matrix algoritma Naïve Bayes AUC: 0.494 +/- 0.329 (mikro:
0.494) (positive class: Ya)
Gambar.3 merupakan perhitungan akurasi AUC (pessimistic): 0.478 +/-
data training menggunakan algoritma Naïve 0.328 (mikro: 0.478) (positive
Bayes yang menghasilkan accuracy 88.00%. class: Ya)
Diketahui data training terdiri dari 150 record
data, 10 data di klasifikasikan LAKU ternyata Gambar 4 .Text view model Confusion
TIDAK LAKU, 2 data diprediksi TIDAK LAKU Matrix algoritma Naïve Bayes
dan benar-benar TIDAK LAKU, 129 di
prediksikan LAKU ternyata benar-benar LAKU Gambar 4. merupakan perhitungan accuracy
serta 8 data diprediksikan TIDAK LAKU data menggunakan algoritma Naïve Bayes.
ternyata LAKU. Diketahui data training terdiri dari 150 record
data, 10 data di klasifikasikan LAKU ternyata
TIDAK LAKU, 2 data diprediksi TIDAK LAKU
dan benar-benar TIDAK LAKU, 129 di
prediksikan LAKU ternyata benar-benar
LAKU serta 8 data diprediksikan TIDAK
LAKU ternyta LAKU.
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 5
JURNAL INFORMATIKA, Vol.7 No.1 April 2020
ISSN: 2355-6579 | E-ISSN: 2528-2247
Model yang dihasilkan pada algoritma Naïve P(H) = Probabilitas hipotesis H (prior prob.)
Bayes yang dihasilkan menggunakan P(X|H) = Probabilitas X berdasarkan kondisi
Rapidminner, yaitu: tersebut
P(X) = Probabilitas dari X
3. Penjualan
Penjualan merupakan sebuah proses
dimana kebutuhan pembeli dan kebutuhan
penjual dipenuhi, melalui antar pertukaran
Gambar 5. Model algoritma Naïve Bayes
informasi dan kepentingan. Dalam proses
penjualan, penjual atau penyedia barang dan
jasa memberikan kepemilikan suatu
2. Algoritma Naïve Bayes
komoditas kepada pembeli untuk suatu harga
Algoritma Naïve Bayes Bayesian
tertentu. Secara umum pengertian penjualan
classification adalah pengklasifikasian statistik
adalah sejumlah total yang dikenakan kepada
yang dapat digunakan untuk memprediski
pelanggan untuk barang atau jasa yang di jual.
probabilitas keanggotaan suatu class.
Bayesian classification didasarkan pada
Kesimpulan
teorema Bayes yang memiliki kemampuan
Sistem Klasifikasi Penjualan Obat ini
klasifikasi serupa dengan decesion tree dan
digunakan untuk menentukan merk vitamin
neural network. Bayesian classification
apa yang LAKU atau TIDAK LAKUnya pada
terbukti memiliki akurasai dan kecepatan yang
sebuah apotek yang ada di Jakarta dengan
tinggi saat diaplikasikan ke dalam database
meggunakan algoritma Naïve Bayes.
dengan data yang besar[Supriyanto, 2013].
Penelitian ini menggunakan 150 dataset.
Metode Bayes merupakan pendekatan
Penelitian ini dilakukan karena adanya
statistic untuk melakukan inferensi induksi
masalah untuk mengetahui produk pada bulan
pada persoalan klasifikasi. Pertama kali
sebelumnya agar dapat menentukan stok
dibahas terlebih dahulu tentang konsep dasar
produk mana yang mesti di perbanyak lagi,
dan definisi pada Teorema Bayes, kemudian
dan stok barang mana yang harus lebih
menggunkan teorema ini untuk melakukan
dipersedikitkan. Pengujian pada data
klasifikasi dalam Data Mining.Teorema Bayes
rekapitulasi penjualan Obat dengan proses
memiliki bentuk umum sebagai berikut :
mining Algoritma Naïve Bayes menghasilkan
tingkat accuracy dengan nilai 88.00%, dimana
dalam pengujian model data, keseluruhan
data set digunakan sebagai data testing.
Penelitian ini dilakukan menggunakan tools
Gambar 6. Rumus Dasar Algoritma Naïve Rapidminner pada dataset penjualan obat
Bayes dengan menggunakan algoritma Naïve Bayes.
.
Referensi
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 6
JURNAL INFORMATIKA, Vol.7 No.1 April 2020
ISSN: 2355-6579 | E-ISSN: 2528-2247
Bustami. (2014). Penerapan Algoritma Naive Saruni, D., Yudo, D. (2018). Naive Bayes
Bayes Untuk Mengklasifikasi Data Optimization Based On Particle Swarm
Nasabah Asuransi. Jurnal Informatika Optimization To Predict The Decision Of
Vol. 8, No. 1, Januari. Insurance Customer Candidate.
Fajar, E.P., Achmad, K.(2019). Analisis International Journal of Computer
Prediksi Masa Studi Mahasiswa Techniques, 1-7.
Menggunakan Algoritma Naïve Bayes. Jurnal Supriyanto, Catur. Purnama Parida. 2013.
Ilmu Teknik dan Komputer, 147-151. deteksi penyakit diabetes type ii dengan
Firdaus,Diky (2017). “Penggunaan Data naive bayes berbasis particle swarm
Mining dalam Kegiatan Sistem optimization. Jurnal Teknologi Informasi,
Pembelajaran Berbantuan Komputer”. Volume 9 Nomor 2, Oktober 2013.
Jurnal FORMAT, Vol 6 Nomor 2, ISSN : Angelina Permatasari. 2013.Perancangan
2089-5615 Sistem Informasi Penjualan Pada Apotek.
Prasetyo, E, 2012, Data Mining : Konsep dan ComTech. Vol.4 No. 1 Juni 2013: 55-67
Aplikasi menggunakan Matlab, Aditya Prihantara dan Berliana Kusuma Riasti.
Yogyakarta: Andi 2012. Design Dan Implementasi Sistem
Ratniasih, Ni Luh, 2019. Optimasi Data Mining Informasi Apotek Pada Apotek Mitra
Menggunakan Algoritma Naïve Bayes Agung Pacitan. Journal Speed – Sentra
dan C4.5 Untuk Klasifikasi Kelulusan Penelitian Engineering dan Edukasi –
Mahasiswa. Jurnal Teknologi Informasi Volume 4 No 3 - 2012 - ijns.org
dan Komputer, Volume 5, Nomor 1,
Januari 2019.
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 7