Hardian Kokoh Pambudi1, Putu Giri Artha Kusuma2, Femi Yulianti3, Kevin Ahessa Julian4
Program Studi Teknik Logistik, Fakultas Rekayasa Industri1,2,3,4
Telkom University
Jl. Telekomunikasi no.1, Terusan Buah Batu, Dayeuhkolot, Kab. Bandung
hkpambudi@telkomuniversity.ac.id1, putugiriak@telkomuniversity.ac.id2, femiyulianti@telkomuniversity.ac.id3,
kevinahessajulian@student.telkomuniversity.ac.id4
Abstrak Abstract
Salah satu ukuran kinerja bagi industri logistik, One of the key performance indicators for the
khususnya perusahaan pengiriman barang, adalah logistics industry, especially freight forwarder
ketepatan waktu penghantaran. Hal ini masih menjadi company (cargo), is the delivery time. This is still a
tantangan bagi perusahaan guna menjamin tingkat challenge in this industry in terms of ensuring the
kepuasan pelanggan dan menurunkan biaya customer service level and reducing transportation
transportasi. Di sisi lain, perkembangan teknologi costs. On the other hand, the development of
informasi saat ini memungkinkan organisasi atau information technology now allows an organization
perusahaan dapat mengumpulkan data dalam jumlah or company to collect large amounts of data
besar secara otomatis. Metode yang cukup andal yang automatically. A decent method that can be used to
dapat digunakan dalam melakukan analisis data analyze the data for prediction purposes is machine
prediksi adalah machine learning, yaitu metode learning, which is a method of extracting data into a
ekstraksi data menjadi sebuah pola informasi tertentu. certain pattern of information. This research aims to
Penelitian ini bertujuan untuk mengaplikasikan tiga apply three machine learning methods to estimate the
metode machine learning untuk memperkirakan status status of shipping goods. The method used in this
pengiriman barang. Metodologi yang digunakan pada study follows the machine learning process published
penelitian ini mengikuti proses machine learning by the Cross Industry Standard Process for Data
yang dirilis oleh the Cross Industry Standard Process Mining (CRISP-DM), namely; business processes
for Data Mining (CRISP-DM), yaitu; memahami understanding, data understanding, data preparation,
proses bisnis, memahami data, persiapan data, model development, evaluation, and implementation.
pengembangan model, evaluasi, dan implementasi. Based on the results of the study, the random forest
Berdasarkan hasil penelitian, metode random forest method produces better accuracy than the logistic
menghasilkan nilai akurasi yang lebih baik jika regression and artificial neural network (ANN)
dibandingkan dengan metode regresi logistik dan methods, which is 76.6%, while the results of ANN
artificial neural network (ANN), yaitu sebesar 76,6%, and logistic regression methods are 73.81% and
sedangkan metode ANN dan regresi logistik sebesar 72.84% respectively.
73,81% dan 72,84%.
Keywords:
Kata kunci:
predictive data analytics, machine learning, delivery
analisis data prediksi, machine learning, waktu time, transportation and logistics
pengiriman, transportasi dan logistik
100
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
101
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
variabel keluaran bersifat biner atau dikotomis, penampung atau disebut bag. Beberapa bag tersusun
sehingga, nilai variabel dependen dari hasil dari observasi yang dipilih secara acak dari data
perhitungan di dalam model, akan dipetakan dengan observasi orisinil dalam training dataset. Dataset
sebuah fungsi menjadi nilai yang sifatnya biner pada bag terbentuk dari pengambilan dengan
(Hosmer Jr dkk., 2013). pengembalian yang memungkinkan sebuah hasil
observasi memiliki peluang untuk terpilih kembali.
Berdasarkan jumlah variabel masukannya, regresi
logistik dibedakan menjadi dua, yaitu regresi logistik II.4 Artificial Neural Network (ANN)
tunggal (single logistic regression), di mana hanya
Artificial neural network (ANN) merupakan
terdapat satu jenis variabel masukan, dan regresi
metode klasifikasi dari machine learning yang
logistik jamak (multiple logistic regression), di mana
terinspirasi dari struktur sistem saraf makhluk hidup
terdapat dua atau lebih variabel masukan, untuk
(neural systems). Seperti halnya sistem saraf pada
memprediksi nilai variabel keluarannya. Dalam
otak manusia ANN mempunyai struktur dasar yang
penelitian ini, model regresi yang digunakan adalah
serupa, yaitu terdiri dari beberapa simpul (nodes),
regresi logistik jamak.
yang bisa sebagai variabel masukan (input), keluaran
Jika terdapat n buah variabel masukan yang (output), atau antara, yang antar simpulnya
disimbolkan oleh x = (x1, x2, …, xn), dan Y adalah dihubungkan oleh penghubung atau link (Tan dkk.,
variabel keluaran di mana peluang P (Y = 1 | x) = 2016). Masing-masing penghubung terdapat bobot
π(x), maka persamaan regresi logistik dituliskan (weight) yang mengindikasikan kekuatan amplifikasi
sebagai berikut: yang diterima oleh simpul masukan menuju simpul
tujuan, sehingga, ANN dapat didefinisikan sebagai
sebuah kesatuan fungsi yang memetakan nilai
variabel masukan yang ada di lapisan masukan (input
layer) menuju lapisan keluaran (output layer) dengan
di mana menggunakan bobot sebagai parameter
penghubungnya (Aggarwal, 2018). Adapaun struktur
dasar dari ANN digambarkan oleh Gambar 1.
102
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
mengembangkan model prediksi yang digunakan mendeteksi potensi masalah. Hasil dari penelitian ini
untuk memperkirakan durasi waktu pelayanan pada adalah kemampuan model dalam memprediksi status
industri jasa asuransi menggunakan metode process pengiriman antara overload dan underload dari
mining. Model tersebut juga telah diimplementasikan kapasitas (Feldman dkk., 2013).
di kasus nyata dengan tingkat akurasi yang baik (Van
Adapun Metzger dkk. (2014) mengembangkan
der Aalst dkk., 2011).
dan membandingkan model prediksi untuk
Kang dkk. (2012) mengembangkan model memperkirakan masalah yang mungkin akan terjadi
prediksi menggunakan metode machine learning, selama aktivitas proses bisnis pada industri logistik.
yaitu support vector machines (SVM) untuk Adapun metode yang digunakan antara lain machine
memantau proses bisnis secara waktu nyata (real- learning, constrain satisfaction, dan quality of service
time). Model ini juga menyediakan informasi berupa (QoS) aggregation. Model prediksi yang
status proses yang sedang berjalan. Hasil penelitian dikembangkan kemudian digunakan untuk
ini menunjukkan bahwa pengembangan dari algoritma menganalisis sebuah dataset pada perusahaan
SVM dapat digunakan untuk menghasilkan prediksi kargo/jasa pengiriman barang udara. Hasil dari
secara waktu nyata dan dapat digunakan oleh industri penelitian ini didapatkan bahwa dengan menggunakan
(Kang dkk., 2012). ketiga metode di atas, akurasi prediksi yang
dihasilkan minimal sebesar 70%. Adapun kombinasi
Evermann dkk. (2016) menggunakan metode
dari dua metode, yaitu machine learning dan
deep learning, salah satu jenis metode machine
constraint satisfaction mampu meningkatkan tingkat
learning, untuk memprediksi kondisi akhir dari proses
akurasi prediksi sebesar 23% (Metzger dkk., 2014).
bisnis yang sedang berjalan. Hal ini dilakukan dengan
tujuan untuk mengidentifikasi proses-proses yang Penelitian ini merupakan pengembangan dari dua
berisiko tidak memenuhi indikator kinerja utama penelitian sebelumnya (Feldman dkk., 2013; Metzger
(KPI), misalnya ketepatan waktu. Metode yang dkk., 2014) dan menggunakan data dari sumber yang
digunakan adalah recurrent neural network (RNN). sama. Tujuan utama dari penelitian ini adalah adanya
Hasil dari penelitian ini menunjukkan tingkat akurasi perbandingan tingkat akurasi model prediksi yang
yang tinggi, yaitu lebih dari 90% untuk dua dataset dikembangkan dengan menggunakan tiga jenis
yang digunakan (Evermann dkk., 2016). metode machine learning yang dikenal memiliki
tingkat akurasi yang tinggi, yaitu regresi logistik
Bevacqua dkk. (2013) mengembangkan model
(logistic regression), random forest, dan artificial
prediksi waktu proses (run-time) dengan
neural network (ANN).
menggunakan kombinasi dari beberapa teknik
penambangan (data mining), mulai dari pattern II.6 Proses Bisnis Pengiriman Barang
mining, non-parametric regression, dan predictive
Gambar 1 menggambarkan proses bisnis
clustering. Hasil dari penelitian ini adalah model yang
pengiriman barang yang menjadi kasus studi pada
dikembangkan mampu memprediksi dengan andal
penelitian ini. Model tersebut mewakili struktur
dan akurat. Saat dipadukan dengan variabel lain
proses bisnis pada freight forwarding company atau
seperti beban kerja dan kalender, metode predictive
perusahaan kargo, khususnya jasa ekspedisi pesawat
clustering menunjukkan hasil terbaik jika
udara. Beberapa pengiriman yang kuantitasnya relatif
dibandingkan dengan metode lain (Bevacqua dkk.,
kecil dari pengirim dikonsolidasikan, kemudian
2013).
dikirim bersama kepada pelanggan agar lebih aman
Feldmannn dkk. (2013) mengembangkan model dan murah. Oleh karena itu, proses bisnis pada
yang disebut proactive event processing, yang perusahaan ini dibagi menjadi dua bagian, yaitu
merupakan pengembangan dari complex event incoming transport dan outgoing transport, yang
processing. Model ini bertujuan untuk mendeteksi secara bersama bertujuan untuk memastikan bahwa
adanya kemungkinan munculnya masalah dalam pengiriman dilakukan secara tepat waktu sampai ke
rangkaian bisnis proses. Penelitian ini menerapkan pelanggan. Setiap bagian dari proses bisnis
model prediksinya di industri transportasi untuk melibatkan layanan transportasi fisik berikut (Metzger
memprediksi berat muatan kargo. Menurut penelitian dkk., 2014):
ini, karena industri kargo membutuhkan biaya yang
mahal sehingga perlu ada sistem yang dapat
103
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
1) RCS (Freight reception): Barang diterima oleh III.1.1 Business Understanding (Memahami
maskapai, kemudian diperiksa di gudang Proses Bisnis)
keberangkatan.
Dalam penelitian ini, tahap pertama yang
2) DEP (Freight departure): Barang dikirim ke dilakukan oleh peneliti adalah memahami proses
pesawat dan dikonfirmasi di atas pesawat, pesawat bisnis dari pengiriman barang oleh perusahaan kargo.
berangkat. Seperti yang telah dijelaskan pada bagian II.2, bahwa
proses pengiriman barang melalui empat kegiatan
3) RCF (Freight arrival): Barang sampai di bandara
utama, yaitu RCS, DEP, RCF, dan DLV.
tujuan dan disimpa di gudang kedatangan.
III.1.2 Data Understanding (Memahami Data)
4) DLV (Freight delivery): Barang dikirim dari
gudang bandara ke pelanggan. Setelah memahami proses bisnis, tahap
selanjutnya adalah memahami data yang terkait
dengan proses bisnisnya, baik yang sudah tersedia
maupun yang masih perlu dilakukan pencarian lebih
lanjut. Pada penelitian ini, data yang digunakan
adalah data yang dirilis oleh the International Air
Transport Association (IATA).
Gambar 1. Proses Bisnis Pengiriman Barang (Metzger Seperti yang sudah disebutkan pada bagian II.6
dkk., 2014) bahwa proses pengiriman barang melalui empat
kegiatan utama. Masing-masing dari setiap kegiatan
dalam proses bisnis tersebut tercatat waktu yang
III. ANALISIS DAN PERANCANGAN direncanakan (planned time) dan waktu yang
sebenarnya (actual time). Selain berupa atribut durasi
III.1 Metodologi waktu proses per bagian, terdapat juga atribut lain
seperti identitas pengiriman dan bandara yang dilalui
Metodologi dari penelitian ini mengacu pada
oleh layanan transportasinya.
proses machine learning yang mengacu pada proses
data mining oleh the Cross Industry Standard Process III.1.3 Data Preparation (Mempersiapkan Data)
for Data Mining (CRISP-DM) yang dijelaskan oleh
Setelah proses memahami selesai, selanjutnya
Gambar 2.
dilakukan tahap mempersiapkan data agar siap
digunakan untuk pengembangan model prediksi.
Tahapan ini dilakukan antara lain dengan mengubah
format yang sesuai dengan kebutuhan (tabular
format), mereduksi variabel yang tidak diperlukan,
dan menghilangkan data dengan nilai yang hilang
(missing value), dan penambahan atau pengubahan
nilai pada salah satu atau beberapa variabel agar
sesuai dengan tujuan penelitian dan pendekatan
pengembangan model yang akan digunakan.
Pada penelitian ini, nilai variabel yang
disesuaikan adalah penambahan variabel “remark”
yang mempunyai dua nilai kategorikal, yaitu “late”
jika nilai “actual time” lebih besar daripada “planned
Gambar 2. Proses Penggunaan Metode Machine
learning oleh CRISP-DM (Provost & Fawcett, 2013)
time”, dan nilai “fast”, jika nilai “actual time” lebih
besar daripada “planned time”.
Selanjutnya, dilakukan penentuan variabel
Adapun penjelasan secara lebih detail mengenai independen dan variabel dependen dari beberapa
metodologi yang dilakukan dalam penelitian ini variabel yang ada. Berdasarkan studi literatur yang
adalah sebagai berikut: dilakukan, ditentukan bahwa berdasarkan seluruh
104
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
proses bisnis yang dilalui, terdapat data RCS dan logistik, random forrest, dan artificial neural network,
DLV sebanyak satu kali, serta DEP dan RCF dan (ANN). Perangkat lunak yang digunakan adalah
sebanyak dua kali. Keenam data tersebut dalam Weka 3.8, sebuah open-source software pengolahan
pengembangan model sebagai variabel independen. data berbasis machine learning yang cukup
Adalapun variabel dependen adalah status pengiriman menyediakan antar muka yang ramah pengguna.
dari seluruh proses yang ada, yaitu “late” jika
Walaupun hubungan antara variabel masukan dan
penghantarannya terlambat, dan “fast” jika
keluaran relatif sama dan mengacu pada Gambar 3,
penghantarannya lebih cepat dibandingkan waktu
terdapat dua bagian pada tahap pengembangan model
yang direncanakan.
ini, yaitu model yang menggambarkan pengiriman
Selanjutnya, dipilih beberapa catatan transaksi barang dari tempat asal menuju gudang konsolidasi
yang terhitung lengkap, atau menghilangkan data atau incoming transport, dan model yang
instance yang tidak lengkap. Dari proses tersebut, menggambarkan pengiriman barang dari dudang
didapatlah 1195 data transaksi dari total 3269 data. konsolidasi menuju tempat penerima atau outgoing
Langkah ketiga adalah membagi dari total data transport, sehingga proses pengembangan model dan
transaksi yang ada menjadi dua bagian, yaitu data uji akurasinya akan dibedakan berdasarkan kedua
yang digunakan untuk training dan testing. proses tersebut.
Berdasarkan studi literatur yang ada, digunakan 80%
III.1.5 Evaluation (Evaluasi)
data atau sebanyak 856 data untuk training, dan 20%
data atau sebanyak 239 data digunakan sebagai data Pada tahap ini, dilakukan evaluasi berupa
testing. perbandingan tingkat akurasi dari ketiga metode
machine learning yang digunakan pada tahap
III.1.4 Modelling (Pengembangan Model)
pengembangan model, baik pada tahap incoming
Setelah data sudah melalui tahap pre-processing, transport maupun outgoing transport. Hasil akurasi
selanjutnya dilakukan pengembangan model prediksi rata-rata dari kedua proses tersebut untuk ketiga
dengan variabel masukan berupa durasi waktu yang metode juga diperbandingkan untuk mengetahui
direncanakan (planned time) untuk keempat aktivitas metode yang memiliki kinerja terbaik. Adapun hasil
pengiriman barang, guna memprediksi status dan pembahasan secara lebih detail dijelaskan pada
pengiriman barang (actual time) yang menjadi bagian IV.
variabel keluaran. Secara umum, diagram yang
III.1.6 Deployment (Implementasi)
menunjukkan variabel masukan dan keluaran, serta
menggambarkan model prediksi yang dibangun Setelah model sudah dievalusi dan dinyatakan
digambarkan dalam Gambar 3. layak untuk digunakan untuk memprediksi sebuah
proses bisinis, maka proses selanjutnya adalah
RCS Planned Time implementasi, yaitu penggunaan model di kondisi
nyata. Pada penelitian ini, tahapan implementasi tidak
dilakukan dan merupakan batasan dari penelitian.
105
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
106
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
menggunakan learning rate 0.05. Adapun untuk durasi waktu yang direncanakan dapat menjadi
semua metode pada proses outgoing transport, variabel masukan untuk memprediksi status
metode random forest masih memiliki performansi pengiriman yang bertindak sebagai variabel keluaran.
terbaik, yaitu mencapai 73,50%. Berikutnya regresi Dalam penelitian ini, digunakan tiga metode yang
logistik dengan 71,06% dan ANN dengan 69,11%. berbeda, yaitu regresi logistik, random forest, dan
artificial neural network (ANN).
Jika dibandingkan hasil tingkat akurasi antara
incoming transport dan outgoing transport, untuk Berdasarkan hasil percobaan yang dilakukan,
semua metode yang digunakan, terlihat bahwa nilai metode random forest menghasilkan nilai akurasi
akurasi untuk proses incoming transport lebih tinggi yang lebih baik jika dibandingkan dengan metode
dibandingkan nilai akurasi pada outgoing transport. regresi logistik dan ANN. Pada aktvitas incoming
Gambar 4 menyajikan data perbandingan tingkat transport maupun outgoing transport menunjukkan
akurasi dari ketiga metode untuk keseluruhan proses bahwa metode random forest dapat menghasilkan
pengiriman barang. Nilai akurasi yang ditampilkan akurasi terbaik sebesar 76,6%, sedangkan metode
merupakan rata-rata dari nilai akurasi pada proses ANN dan regresi logistik sebesar 73,81% dan
incoming transport dan outgoing transport untuk 72,84%.
masing-masing metode.
Penelitian ini memiliki potensi untuk
dikembangkan kedepan. Selain perlu menggunakan
data yang lebih lengkap, misalnya data kondisi
ekonomi dan lingkungan yang mempengaruhi
aktivitas logistik, peneliti merekomendasikan untuk
menggunakan metode machine learning yang lain,
atau gabungan dari beberapa metode machine
learning, guna meningkatkan tingkat akurasi prediksi.
REFERENSI
Gambar 4. Perbandingan Tingkat Akurasi Semua Aggarwal, C. C. (2018). Neural networks and deep
Metode learning. Springer, 10, 973–978.
Secara umum, baik untuk proses incoming Alpaydin, E. (2020). Introduction to machine
transport maupun outgoing transport, metode random learning. MIT press.
forest memiliki tingkat akurasi yang paling
dibandingkan metode yang lain, yaitu 76,6%. Amasyali, K., & El-Gohary, N. M. (2018). A review
Selanjutnya, metode ANN memiliki tingkat akurasi of data-driven building energy consumption
sebesar 73, 81% dan regresi logistik sebesar 72,84%. prediction studies. Renewable and Sustainable
Seperti halnya penelitian pada bidang machine Energy Reviews, 81, 1192–1205.
learning lainnya, tingkat akurasi sebuah model Asadi, A., Alsubaey, M., & Makatsoris, C. (2015). A
prediksi yang dikembangkan dengan metode tertentu machine learning approach for predicting delays
akan bergantung kepada jenis data yang digunakan in construction logistics. International Journal
sebagai kasus studi (study case), sehingga akan sangat of Advanced Logistics, 4(2), 115–130.
dimungkinkan jika metode yang memiliki tingkat
akurasi tertentu, tidak sepenuhnya akan mencapai Bevacqua, A., Carnuccio, M., Folino, F., Guarascio,
tingkat akurasi yang sama jika diaplikasikan untuk M., & Pontieri, L. (2013). A Data-adaptive
jenis data yang berbeda. Trace Abstraction Approach to the Prediction of
Business Process Performances. ICEIS (1), 56–
IV. KESIMPULAN DAN SARAN 65.
Model prediksi berbasis metode machine Carbonneau, R., Laframboise, K., & Vahidov, R.
learning dapat diaplikasikan dalam dunia logistik, (2008). Application of machine learning
khususnya dalam memprediksi status pengiriman techniques for supply chain demand forecasting.
barang pada perusahaan kargo. Data-data berupa European Journal of Operational Research,
107
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
108
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020
E-ISSN : 2407 – 3911
P-ISSN : 2686 - 0333
109
Hardian Kokoh Pambudi, Putu Giri Artha Kusuma, Femi Yulianti, Kevin Ahessa Julian
Jurnal Ilmiah Teknologi Informasi Terapan
Volume 6, No 2, 15 April 2020