Abstrak
Persaingan penjualan produk antar industri farmasi di Indonesia semakin ketat.
Keadaan dan permintaan pasar juga menjadi semakin kompleks dan sulit diprediksi.
Oleh karena itu, industri farmasi harus memiliki perencanaan strategis di bidang
pemasaran, diantaranya melalui prediksi permintaan atau penjualan. Sejauh ini PT.
Metiska Farma sudah menerapkan metode prediksi untuk kebutuhan rencana
produksi. Namun, hasil dari metode peramalan yang telah dilakukan tidak akurat,
selain kurang efektif karena dilakukan secara manual. Pada studi yang disajikan
pada makalah, dilakukan uji coba prediksi berbasis teknik Machine Learning yaitu
metode Long Short Term Memory (LSTM). Untuk menguji coba teknik yang
diusulkan digunakan dataset produk “X” dengan parameter kinerja Mean Absolute
Percentage Error (MAPE) dan Root Mean Squared Error (RMSE). Hasil penelitian
melalui evaluasi kinerja model data training terhadap data testing, menunjukkan
bahwa nilai LSTM dalam memprediksi penjualan sebesar 13,762,154.00 untuk
RMSE dalam nilai rupiah dan MAPE sebesar 12%.
Abstract
The competition in product sales between the pharmaceutical industry in Indonesia is
getting tougher. Market conditions and demands are also increasingly complicated and
unpredictable. Therefore, the pharmaceutical industry must have strategic planning in the
marketing field, where the offer is available. Hitherto, PT. Metiska Farma has applied a
prediction method for the needs of production plan. However, the results of applying such
forecasting method are inaccurate, because, besides being less effective, this method is
done manually. In the study presented in this paper, a prediction test based on Machine
Learning techniques was conducted, which was the Long Short Term Memory (LSTM)
method. To test the proposed technique, the product dataset “X” was used with
performance parameters of Mean Absolute Percentage Error (MAPE) and Root Mean
Squared Error (RMSE). The results of the study, through evaluating the model
performance of data training on data testing, showed that the LSTM value in predicting
sales was 13,762,154.00 for RMSE in rupiah values, and the MAPE was 12%.
diharapkan keuntungan perusahaan akan lombok oleh Ahmad Ashril Rizal dan Siti
meningkat [1]. Soraya [6]. Penelitian ini mengkaji prediksi
Peramalan (forecasting) adalah seni kunjungan wisatawan di pulau lombok
dan ilmu untuk memperkirakan kejadian di dengan pendekatan Recurrent Neural
masa depan. Hal ini dapat dilakukan Network Long Short Term Memory (RNN
dengan melibatkan pengambilan data LSTM) menggunakan multi time steps.
historis dan memproyeksikannya ke masa Kemudian kinerja model dievaluasi
mendatang. Dengan cara membentuk menggunakan Root Mean Square Error
model matematis atau prediksi intuisi (RMSE). Hasil penelitian yang dilakukan
bersifat subyektif yang disesuaikan untuk memprediksi kunjungan wisatawan
dengan pertimbangan yang baik [2]. dengan RNN LSTM menggunakan multi
Peramalan merupakan alat bantu yang time steps mendapatkan hasil RMSE
sangat diperlukan bagi kebijakan sebesar 6888.37 pada data training dan
perencanaan organisasi bisnis maupun 14684.33 pada data testing.
pengambilan keputusan manajemen yang Kemudian, pada penelitian yang
penting lainnya [3]. Salah satu manfaat dilakukan oleh QIU Mingyue, dkk adalah
peramalan penjualan adalah dapat memprediksi arah indeks pasar saham
memperkirakan penjualan secara akurat harian [7]. Topik utama dari penelitian ini
dari waktu ke waktu sehingga dapat dibuat adalah kemampuan untuk memprediksi
rencana produksi yang sesuai dengan arah harga pada hari berikutnya dari indeks
perkiraan penjualan [4]. pasar saham Jepang. Pada studi ini,
Dengan adanya peramalan, maka prediksi dilakukan menggunakan model
perusahaan dapat mencapai tujuan artificial neural network (ANN) yang
perusahaan serta pengambilan keputusan dioptimalkan menggunakan genetic
dalam produksinya. Karena pentingnya algorithms (GA). Dalam menguji kinerja
peramalan, berbagai studi mengenai model eksperimen dilakukan dengan
peramalan telah dilakukan. Terdapat menerapkan dua tipe variabel input yaitu
beberapa studi terkait yang telah dilakukan indikator input tipe satu dan indikator input
oleh para peneliti diantaranya yaitu prediksi tipe dua. Dari kedua variabel input tersebut,
pergerakan saham [5], prediksi kunjungan indikator input tipe dua memberikan kinerja
wisatawan [6], prediksi arah indeks pasar yang lebih baik sebesar 86.39% untuk
saham harian [7], dan perbandingan memprediksi arahnya.
metode klasifikasi untuk memprediksi Perbandingan metode klasifikasi pada
potensi resiko [8]. data kandidat pelanggan untuk
Long Short Term Memory yang memprediksi potensi resiko. Studi yang
digunakan oleh Tingwei Gao, dkk [5] dilakukan oleh Mujiono Sadikin & Fahri
bertujuan untuk memprediksi pergerakan Alfiandi ini membandingkan metode data
saham pada hari berikutnya. Data stok mining klasifikasi C.45 dengan Naïve Bayes
perdagangan dasar digunakan dalam pada penyedia kredit kendaraan untuk
pembuatan model prediksi. Pada studi ini memprediksi calon pelanggan yang
peneliti membandingkan model LSTM berpotensi menghasilkan lebih banyak
dengan 3 model lainnya yaitu moving keuntungan [8]. Kriteria pelanggan atau
average (MA), exponential moving average atribut yang digunakan untuk diteliti ada 5,
(EMA), dan support vector machine (SVM). yaitu gaji, usia, status perkawinan, cicilan
Kinerja dari keempat model tersebut dan kelayakan. Evaluasi kriteria dilakukan
kemudian dievaluasi menggunakan Root berdasarkan akurasi, daya ingat & presisi.
Mean Square Error (RMSE). Dari studi ini Hasil evaluasi akurasi dan presisi yang
dihasilkan bahwa model MA memiliki nilai dihasilkan oleh algoritma C.45 lebih baik
40.9691, EMA 24.6726, SVM 21.8863, dan dibandingkan dengan algoritma Naïve
LSTM 20.4668. Bayes, yaitu 83.33% akurasi dan 89.16%
Selanjutnya, penelitian mengenai presisi. Namun untuk daya ingat algoritma
prediksi kunjungan wisatawan di pulau Naïve Bayes lebih baik dibandingkan
algoritma C.45, yaitu dengan nilai 83.75% data time series yang tergolong sebagai
untuk Naïve Bayes dan 82.22% untuk C.45. data sequence. Data time series
PT. Metiska Farma adalah merupakan suatu rangkaian pengamatan
perusahaan yang bergerak di bidang berdasarkan urutan waktu dari karakteristik
industri farmasi. Untuk memenuhi kuantitatif dari satu atau kumpulan kejadian
kebutuhan pasar, industri farmasi perlu yang diambil dalam periode waktu tertentu.
melakukan perencanaan sebelum Long Short Term Memory (LSTM)
melakukan tahap produksi. Perencanaan merupakan salah satu pengembangan
produksi biasanya dilakukan berdasarkan neural network yang dapat digunakan untuk
prediksi atau peramalan. Prediksi penjualan pemodelan data time series [10]. LSTM
sangat dibutuhkan untuk meningkatkan nilai mampu mengatasi ketergantungan jangka
produk baru dan juga untuk meningkatkan panjang (long term dependencies) pada
jumlah produksi [9]. Perusahaan ini telah masukannya. Sebuah penelitian A New
melakukan prediksi penjualan namun Method for Semantic Consistency
hasilnya kurang akurat. Semakin banyak Verification of Aviation Radiotelephony
permintaan pasar, semakin sulit untuk Communication Based on LSTM-RNN
melakukan prediksi dengan cara manual. mengatakan bahwa LSTM berhasil
Untuk mengatasi permasalahan kesulitan diterapkan pada berbagai tugas sekuensial
peramalan secara manual tersebut, pada dan bahasa pemodelan [11]. Sebuah cell
penelitian ini dilakukan eksperimen dalam LSTM menyimpan sebuah nilai atau
peramalan berbasis Machine Learning keadaan (cell state), baik untuk periode
menggunakan teknik Long Short Term waktu yang panjang atau singkat. LSTM
Memory. mempunyai memory block yang akan
Metode yang dapat diterapkan adalah menentukan nilai mana yang akan dipilih
Long Short Term Memory (LSTM). Tujuan sebagai keluaran yang relevan terhadap
utama dari LSTM pada kasus peramalan masukan yang diberikan. Hal ini adalah
(forecasting) adalah membuat prediksi yang keunggulan yang dimiliki oleh LSTM.
akurat terhadap suatu variabel. Peramalan Pada penelitian ini dilakukan 3 tahap
terbaik didasarkan pada tingkat kesalahan utama yaitu: 1) Preprocessing Data; 2)
prediksi, di mana semakin kecil tingkat Pembuatan model melalui proses training
kesalahan yang dihasilkan, semakin tepat LSTM Network; 3) Melakukan uji terhadap
sebuah metode dalam memprediksi [1]. data testing. Hasil akhir penelitian ini
Perhitungan tingkat kesalahan yang berupa prediksi penjualan yang akan
digunakan pada studi ini adalah Root Mean dijadikan sebagai acuan dalam
Square Error (RMSE) dan Mean Absolute perencanaan produksi perusahaan. Setelah
Percent Error (MAPE). mendapatkan prediksi dari skenario terbaik,
Pada penelitian ini digunakan data kinerja LSTM dievaluasi menggunakan
penjualan antara tahun 2017 sampai RMSE dan MAPE. Hasil penelitian dengan
dengan 2019. Data penjualan di PT. kinerja terbaik ditunjukan dari nilai
Metiska Farma memiliki atribut waktu kesalahan terkecil yang dihasilkan oleh
(tanggal penjualan) dan nilai (value RMSE yang mencapai angka
penjualan harian yang didapat dalam 13,762,154.00 dan MAPE mencapai angka
bentuk rupiah) sehingga termasuk ke dalam 12%.
Nilai Penjualan
2 5,880,000; 11,585,000; dll
(Rupiah)
1 2017-04-01 5,880,000
2 2017-04-03 11,585,000
3 2017-04-04 41,090,000
4 2017-04-05 40,320,000
5 2017-04-06 18,130,000
B. Tahapan Eksperimen
Tahapan aktivitas dalam penelitian ini komposisi data testing dan data training
berturut – turut: penyiapan data, pembuatan dalam prosentase. Skenario uji coba
model, dan evaluasi model. Tahapan tersebut disajikan pada Tabel 3. Setelah
penyiapan data terdiri dari pengumpulan seluruh dataset tersebut dibagi sesuai
data, preprocessing, representasi data, dan komposisi yang dibutuhkan, masing –
pemilahan data (dataset splitting). Tahapan masing data training dan data testing
rinci diilustrasikan seperti pada Gambar 1. dikonversi menjadi file csv (comma
Preprocessing data terdiri dari data separated values).
cleansing dan normalisasi dataset. Setelah
tahap preprocessing data selesai dilakukan Table 3. Komposisi Dataset
kemudian dataset dibagi menjadi dua, No Data Training Data Testing
dataset training dan dataset testing. Tahap
selanjutnya dalam penelitian ini untuk 1 70% 30%
mencapai hasil prediksi proses membangun
sistem dibagi menjadi dua yaitu proses 2 80% 20%
training dan proses prediksi. Karena saat
3 90% 10%
menjalankan proses pembuatan model
memakan waktu yang cukup lama, maka
proses training dilakukan secara terpisah D. Preprocessing Data
dengan proses prediksi. Proses Preprocessing Data pada
Tahap eksperimen model dimulai studi ini dengan melakukan normalisasi
dengan pembuatan model dan training pada dataset menggunakan teknik min-max
LSTM Network. Hasil training berupa model scaler dari sklearn [13]. Caranya dengan
LSTM yang berupa file HDF5 atau .h5 [12]. merubah nilai real atau nilai aktual menjadi
Model yang diperoleh selanjutnya nilai dengan range interval. Nilai range
digunakan pada proses prediksi dengan interval dalam penelitian ini juga dibagi
memuat file model. Tahap akhir eksperimen menjadi dua uji coba, yaitu [0,1] dan [1,1]
berupa proses denormalisasi data hasil untuk mendapatkan nilai prediksi yang
testing untuk mendapatkan nilai hasil terbaik. Dibawah ini adalah rumus untuk
prediksi dan nilai evaluasi dari hasil kinerja normalisasi.
model.
Manfaat dari proses training dan 𝑥− 𝑥𝑚𝑖𝑛
prediksi dilakukan secara terpisah adalah 𝑥′ =
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 (1)
ketika menjalankan proses prediksi jika
tidak ada data baru. Tidak perlu melakukan Keterangan:
pemodelan data training kembali melainkan 𝑥 ′ = Nilai hasil normalisasi
langsung memuat dari file .h5 tersebut. Hal 𝑥 = Nilai data aktual yang akan
itu akan mempercepat proses prediksi dinormalisasi
karena tanpa harus melakukan training 𝑥𝑚𝑖𝑛 = Nilai minimum dari data aktual
kembali terhadap data yang sama. 𝑥𝑚𝑎𝑥 = Nilai maksimum dari data aktual
C. Input Dataset E. Long Short Term Memory Network
Dataset yang digunakan pada Long Short Term Memory (LSTM)
penelitian ini adalah data penjualan antara disebutkan untuk pertama kali pada tahun
tahun 2017 sampai dengan 2019. Dataset 1997 dijelaskan oleh Hochreiter dan
yang dikumpulkan kemudian dipilah Schmidhuber [14]. LSTM disebut juga
menjadi data training dan data testing. sebagai jaringan saraf dengan arsitektur
Skenario penggunaan dataset untuk yang mudah beradaptasi, sehingga
eksperimen disiapkan berdasarkan
Dengan,
Gambar 3. Sell 𝑊𝑖 = Bobot dari Input Gate.
Memory LSTM 𝑆𝑡−1 = State sebelumnya atau state pada
waktu t-1.
Dengan,
𝐶̃ = Intermediate cell state.
𝑊𝑐 = Bobot dari cell state.
𝑆𝑡−1 = State sebelumnya
atau state pada waktu t
– 1.
𝑋𝑡 = Input pada waktu t.
Dengan,
𝑑 = Nilai hasil denormalisasi Keterangan:
𝑑′ = Nilai data normalisasi 𝑦̃𝑖 = Nilai hasil peramalan
𝑚𝑎𝑥 = Nilai maksimum dari data aktual 𝑦𝑖 = Nilai aktual / Nilai sebenarnya
𝑚𝑖𝑛 = Nilai minimum dari data aktual n = Jumlah data
P2 [-1,1] [0,1]
1 = P1.1, P2.1
2 = P1.1, P2.2
3 = P1.2, P2.1
4 = P1.2, P2.2
5 = P1.3, P2.1
6 = P1.3, P2.2
Hasil dari eksperimen kelima tersebut. Melalui plot dan tabel yang
memberikan nilai RMSE yang paling disajikan pada Gambar 5 dan Tabel 7 dapat
rendah, yaitu sebesar 13,762,154.00 dan dilihat perbandingan nilai hasil prediksi
MAPE sebesar 12%. Dengan begitu sudah dengan nilai aktual dari eksperimen kelima
dapat diperoleh perbandingan nilai hasil yang telah dilakukan
prediksi dengan nilai aktual dari eksperimen
persentase rata – rata kesalahan model menjualkan produknya. Maka selisih yang
antara nilai prediksi dengan nilai aktual dihasilkan lebih tinggi pada hari – hari
perhari terkecil adalah 12%. Perlu tertentu seperti ditunjukkan pada prediksi
diketahui bahwa nilai persentase error hasil eksperimen atau yang disebut juga
yang tinggi disebabkan oleh penjualan dengan data outlier.
yang terjadi di akhir bulan, karena
terkadang pada akhir bulan PT. Metiska
Farma memberikan diskon saat
Tabel 7. Hasil Nilai Prediksi dan Nilai Aktual Eksperimen Kelima
Day Predicted Expected MAPE
2 45,547,249.53 49,595,000.00 8%
… … … …
11 456,838,651.49 489,195,000.00 7%
13 10,362,349.13 10,010,000.00 4%
14 31,670,533.23 32,025,000.00 1%
15 201,475,229.81 212,730,000.00 5%
… … … …
21 57,434,408.86 59,780,000.00 4%
22 26,033,044.91 26,810,000.00 3%
23 46,367,671.00 48,685,000.00 5%
24 10,379,442.74 10,745,000.00 3%
25 196,269,260.67 208,950,000.00 6%
… … … …
31 20,753,156.84 21,000,000.00 1%
32 31,283,508.79 32,410,000.00 3%
33 203,593,754.30 216,265,000.00 6%
34 1,145,212,114.03 1,221,990,000.00 6%
35 174,632,649.80 185,255,000.00 6%