Anda di halaman 1dari 9

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Tersedia online diwww.sciencedirect.com

ScienceDirect
Ilmu Komputer Procedia 179 (2021) 524–532

Konferensi Internasional ke-5 tentang Ilmu Komputer dan Kecerdasan Komputasi 2020

Analisis time series dan peramalan penyakit coronavirus di Indonesia menggunakan


Model ARIMA dan NABI

Christophorus Beneditto Aditya Satriosebuah,*, William Darmawansebuah, Bellatasya Unrica Nadiasebuah,


Novita Hanafiahb
sebuahJurusan Ilmu Komputer, Fakultas Ilmu Komputer, Universitas Bina Nusantara, Jakarta, Indonesia 11480
bJurusan Ilmu Komputer, BINUS Online Learning, Universitas Bina Nusantara, Jakarta, Indonesia 11480

Abstrak

Penyebaran COVID-19 telah menyebabkannya menjadi pandemi. Ini telah menyebabkan gangguan besar pada kehidupan kita sehari-hari, baik secara
langsung maupun tidak langsung. Kami bertujuan untuk menggunakan model Machine Learning dalam upaya meramalkan tren penyakit di Indonesia
dengan mengetahui perkiraan kapan normalitas akan kembali. Penelitian ini menggunakan Model Peramalan Nabi Facebook dan Model Peramalan
ARIMA untuk membandingkan kinerja dan akurasinya pada kumpulan data yang berisi kasus terkonfirmasi, kematian, dan angka sembuh, yang
diperoleh dari situs web Kaggle. Model perkiraan kemudian dibandingkan dengan data aktual 2 minggu terakhir untuk mengukur kinerjanya satu sama
lain. Hasilnya menunjukkan bahwa Nabi secara umum mengungguli ARIMA, meskipun jauh dari data aktual semakin banyak hari yang diramalkan.

© 2021 Para Penulis. Diterbitkan oleh Elsevier BV


Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND (https://creativecommons.org/licenses/by-nc-nd/4.0) Peer-
review di bawah tanggung jawab komite ilmiah Konferensi Internasional ke-5 tentang Ilmu Komputer dan Kecerdasan
Komputasi 2020

Kata kunci:COVID; Peramalan; Nabi; ARIMA

1. Perkenalan

Penyakit Coronavirus (COVID-19) adalah penyakit baru yang disebabkan oleh virus SARS-COV-2. Virus ini pertama kali berasal dari Wuhan,
provinsi Hubei pada Desember 2019. Awalnya hanya merupakan rangkaian pneumonia yang tidak diketahui penyebabnya di

* Penulis yang sesuai. Telp: +62-817-690-2964.


Alamat email:christophorus.satrio@binus.ac.id

1877-0509© 2021 Para Penulis. Diterbitkan oleh Elsevier BV


Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND (https://creativecommons.org/licenses/by-nc-nd/4.0) Peer-review di
bawah tanggung jawab komite ilmiah Konferensi Internasional ke-5 tentang Ilmu Komputer dan Kecerdasan Komputasi 2020

10.1016/j.procs.2021.01.036
Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532 525

Wuhan, dengan cepat menjadi krisis internasional dalam waktu kurang dari sebulan. Hampir enam juta orang telah terinfeksi
dengan lebih dari tiga ratus ribu kematian di seluruh dunia. Akibatnya, negara-negara dikunci, tempat-tempat umum ditutup, dan
berbagai kebijakan pembatasan aktivitas lainnya diterapkan untuk memperlambat penyebaran penyakit. Virus COVID-19 menyebar
terutama melalui droplet yang keluar dari mulut atau hidung seseorang saat bersin atau batuk. Mungkin kedengarannya tidak
mematikan jika orang bermain aman dan tidak sembarangan batuk atau bersin, tetapi fakta bahwa penyakit ini telah menyebar ke
seluruh dunia menyangkal fakta bahwa COVID-19 tidak dapat dianggap mematikan.
Pembelajaran Mesin telah memperluas bidangnya menjadi peramalan dan ada banyak penelitian yang dilakukan seputar ini.
Untuk mengetahui kira-kira kapan penyakit ini akan diberantas dan kapan kehidupan kita akan normal kembali, kami bertujuan
untuk meramalkan rangkaian waktu COVID-19 di Indonesia berdasarkan data yang ada yang tercatat dari 20 Januari 2020 hingga 21
Mei 2020 dan menunjukkan pola rangkaian waktu penyakit selama 4 minggu ke depan. Kami menerapkan dua pendekatan berbeda
yang memiliki kemampuan untuk menghasilkan hasil di masa depan. Mereka adalah model Auto Regressive Integrated Moving
Average (ARIMA) dan prosedur peramalan, NABI. Model ARIMA cukup populer dan telah diterapkan di berbagai bidang, seperti pasar
saham perbankan1dan permintaan pariwisata2,3. Sementara PROPHET dapat dianggap sebagai pendekatan baru seperti yang dirilis 3
tahun yang lalu, namun telah terkenal dengan kemudahan kegunaannya namun model yang kuat. Bagian makalah ini meninjau
literatur yang telah digunakan oleh orang-orang dalam menggunakan beberapa algoritma sebagai pendekatan untuk memprediksi,
mengklasifikasikan, dan meramalkan berbagai penyakit.

1.1. Model SIR (Klasifikasi dan Peramalan)

Beberapa penelitian dalam memprediksi penyakit berfokus pada model Scheme of Susceptible-Infectious-Recovered/
Death (SIRD). Kami menemukan studi4,5yang berfokus pada wabah influenza. Onset epidemi dapat dilacak dengan cepat, dan
variasi kejadian dapat ditangkap. Ada penelitian yang berfokus pada virus corona6,7,8Namun model untuk6
memiliki variasi yang tinggi4,5dan long range lowerbound dan upperbound yang menggambarkan ketidakpastian. Qihui Yang dkk7
Membatasi Filter Kalman ke dalam model SIR menggunakan algoritma Gilespie dan mensimulasikan penyebaran virus berdasarkan
proses Markovian dan non-Markovian. Namun, hal itu mengakibatkan ketidakkonsistenan yang tinggi. Louis Kim dkk8menangani
ketidakakuratan model SIRD dengan membandingkannya lebih lanjut dengan data dunia nyata yang menciptakan kecocokan terbaik
saat data penelitian sebenarnya dimasukkan. Cieo Anastassopoulou9juga menggunakan model SIRD untuk meramalkan wabah
COVID-19. Namun, itu tidak memperhitungkan faktor-faktor yang berperan penting dalam menentukan dinamika penyakit.

1.2. Klasifikasi

Sebuah penelitian10menggunakan beberapa algoritma klasifikasi untuk membandingkan sensitivitas, spesifisitas, dan metrik akurasi yang seimbang.
Sementara yang lain11menggunakan kombinasi RNN dan GRU yang dimodifikasi untuk mengklasifikasikan menggunakan SVM. Vijayarani dkk12
menggunakan SVM dengan Naive Bayes untuk memprediksi penyakit hati untuk membandingkan perbedaan kedua algoritma, sedangkan Kapoor et al13
menggunakan Pohon Keputusan J48 alih-alih SVM dengan alasan yang umumnya sama. Model Prediktif untuk infeksi MERS-
CoV14juga dibangun dengan Naive Bayes dan J48 Decision Tree. Carlos Sather15menguji kemampuan prediktif MultiLayer
Perceptron, Gated Recurrent Unit (GRU), LSTM dengan regresi bayesian ridge. GRU menunjukkan hasil terbaik. Minh Nguyen
menggunakan RNN untuk memprediksi tingkat perkembangan penyakit Alzheimer yang terbukti lebih unggul dari SVM
16

dan LSS.

1.3. Analisis Deret Waktu (Klasifikasi dan Peramalan)

Sebuah penelitian dari China menggunakan kueri mesin pencari sebagai kumpulan datanya untuk meramalkan epidemi AIDS di
China17. Pendekatan yang digunakan ternyata mengejutkan, Jaringan Syaraf Tiruan. Perceptron multilayer bekerja sangat baik
dengan perkiraan dan pilihan sempurna untuk ambang Koefisien Korelasi Pearson (PCC). Mahmood Akhtar dkk18
berhasil menunjukkan akurasi yang tinggi dalam melakukan forecasting virus zika dalam rentang waktu 4 minggu menggunakan Nonlinear
AutoRegression dengan eXogeneous inputs (NARX) Neural Network. Joceline Lega19mengusulkan model buatan sendiri yang disebut EpiGro
yang dapat memperkirakan urutan besarnya, puncak, dan ukuran akhir dari wabah yang sedang berlangsung. Hasilnya sangat memuaskan
karena model dapat menginterpolasi melalui data kejadian yang dilaporkan berosilasi secara luas, mengingat data tersebut sangat bising. Qi
Hui Yang7juga menggunakan Kalman Filter untuk menghasilkan peramalan jangka pendek yang hanya berlangsung selama 3 hari
526 Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532

tampaknya. Dennis Ndanguza dkk20menganalisis model Extended Kalman Filter bias dan tidak bias, yang tidak memiliki
perbedaan besar. Xianghei Zhu dkk21menggunakan RNN dengan LSTM dan mekanisme perhatian untuk meramalkan
epidemi influenza. Mekanisme perhatian dapat meningkatkan Mean Absolute Percentage Error dari model. Sangwon Chae
dkk22memprediksi penyakit menggunakan Big Data dengan LSTM dan ARIMA dengan data trend pencarian. LSTM terbukti
memberikan hasil yang lebih baik. Carsten Kirkeby dkk23mengusulkan evaluasi presisi model regresi Poisson, SIS dan
SIScom. Semua metode bekerja sama ketika interval pengambilan sampel besar, dan transmisi rendah. J.Zhang dan K.
Nawata24menggunakan LSTM prediksi Multi-Step untuk meramalkan wabah influenza.
Ada beberapa penelitian yang menggunakan Prosedur Ramalan Nabi Facebook. Kamu25gabungkan Prophet dan ARIMA untuk
membuat modelnya sendiri untuk membuat prakiraan cuaca, berfokus pada kualitas udara dengan polutannya dengan data dari 11
stasiun pemantauan kualitas udara di Shenzhen. Yenidoğan, dkk26bertujuan untuk membandingkan kinerja Nabi terhadap ARIMA
dalam meramalkan nilai Bitcoin. Sementara keduanya bekerja dengan baik dalam set pelatihan dan validasi, ARIMA jauh lebih buruk
daripada Nabi pada set pengujian mereka. Sementara Tyralis, dkk27menggunakan Nabi untuk peramalan aliran bulanan multi-
langkah ke depan, di mana mereka mengembangkan 4 model nabi, 2 model Naïve, model SES dan model ARIMA. Alabi, dkk28
memanfaatkan Nabi untuk meramalkan pertumbuhan kasus COVID-19 dengan tujuan menekankan pentingnya mengintegrasikan
pelonggaran penguncian dengan evaluasi yang cermat untuk mencegah gelombang kedua pandemi.

2. Persiapan Data

2.1. Dataset dan Pemrosesan awal data

Dataset COVID-19 diperoleh dari situs web Kaggle. Dataset terdiri dari 27618 baris dan 8 kolom. Fitur data ini adalah:
Nomor Seri, Tanggal Pengamatan, Provinsi/Negara Bagian, Negara/Wilayah, Pembaruan Terakhir, Terkonfirmasi, Meninggal,
dan Sembuh. Cap waktu terakhir untuk dataset adalah pada 21 Mei 2020 dan yang tertua pada 20 Januari 2020. Dataset
ditunjukkan pada Tabel 1.

Tabel 1. Gambaran Umum Set Data COVID-19

SNo Tanggal Pengamatan Provinsi/Negara Bagian Negara/Wilayah Pembaharuan Terakhir Dikonfirmasi Meninggal Pulih
1 1/22/2020 Anhui Cina Daratan 22/1/2020 17:00 1 0 0
2 1/22/2020 Beijing Cina Daratan 22/1/2020 17:00 14 0 0
3 1/22/2020 Chongqing Cina Daratan 22/1/2020 17:00 6 0 0
4 1/22/2020 Fujian Cina Daratan 22/1/2020 17:00 1 0 0
5 1/22/2020 Gansu Cina Daratan 22/1/2020 17:00 0 0 0
6 1/22/2020 Guangdong Cina Daratan 22/1/2020 17:00 26 0 0
7 1/22/2020 Guangxi Cina Daratan 22/1/2020 17:00 2 0 0
8 1/22/2020 Guizhou Cina Daratan 22/1/2020 17:00 1 0 0
9 1/22/2020 Hainan Cina Daratan 22/1/2020 17:00 4 0 0
10 1/22/2020 Hebei Cina Daratan 22/1/2020 17:00 1 0 0
11 1/22/2020 Heilongjiang Cina Daratan 22/1/2020 17:00 0 0 0
12 1/22/2020 Henan Cina Daratan 22/1/2020 17:00 5 0 0
13 1/22/2020 Hongkong Hongkong 22/1/2020 17:00 0 0 0
14 1/22/2020 Hubei Cina Daratan 22/1/2020 17:00 444 17 28
15 1/22/2020 Hunan Cina Daratan 22/1/2020 17:00 4 0 0
16 1/22/2020 Mongolia Dalam Cina Daratan 22/1/2020 17:00 0 0 0
17 1/22/2020 Jiangsu Cina Daratan 22/1/2020 17:00 1 0 0
18 1/22/2020 Jiangxi Cina Daratan 22/1/2020 17:00 2 0 0

Pembersihan dataset dilakukan untuk mengekstrak informasi yang tepat untuk diramalkan: Kolom 'Pembaruan Terakhir'
dihapus karena Tanggal Pengamatan dipilih sebagai stempel waktu. Baik NABI maupun ARIMA memilikinya
Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532 527

stempel waktu default, jadi konversi ke waktu diperlukan untuk memperkirakan. Kemudian, dataset baru dengan nama negara
Indonesia dibuat dengan memisahkan dari data asli COVID-19. Data COVID-19 Indonesia memiliki jumlah kolom yang sama namun
dengan total 81 baris, dimana setiap baris mewakili data yang tercatat dalam periode satu hari. Karena ARIMA hanya menerima data
univariat, pemisahan diperlukan untuk konfirmasi, kematian, dan pemulihan agar memiliki kerangka datanya sendiri dengan
stempel waktu sebagai indeksnya.

Tabel 2. Hasil pemisahan untuk membuat dataset univariat

Tanggal Dikonfirmasi Tanggal Meninggal Tanggal Pulih


3/2/2020 2 3/2/2020 0 3/2/2020 0
3/3/2020 2 3/3/2020 0 3/3/2020 0
3/4/2020 2 3/4/2020 0 3/4/2020 0
3/5/2020 2 3/5/2020 0 3/5/2020 0
3/6/2020 4 3/6/2020 0 3/6/2020 0
3/7/2020 4 3/7/2020 0 3/7/2020 0

2.2. Memeriksa stasioneritas (ARIMA)

Langkah pertama dalam menerapkan model ARIMA adalah memeriksa apakah time series stasioner atau tidak. ARIMA bekerja
paling baik ketika data kita memiliki pola yang stabil atau konsisten dari waktu ke waktu, yang berarti bahwa varian dan rata-rata
data harus tetap konstan dari waktu ke waktu. Dengan demikian, ketika data tersebut memiliki kecenderungan naik atau turun dan
memiliki pola tertentu (musiman), maka data tersebut tidak stasioner. Gambar 1. Menunjukkan bahwa kasus konfirmasi, kematian,
dan sembuh COVID-19 di Indonesia tidak bersifat musiman, namun memiliki kecenderungan naik dan varian serta rata-ratanya tidak
konstan, yang menunjukkan data tidak stasioner.

Gambar 1. Varians, Mean, dan tren dari COVID-19 dikonfirmasi, kematian, dan pulih data

Untuk mengkonfirmasi lebih lanjut kestasioneran data, kami menggunakan Uji Augmented Dickey Fuller (ADF) karena uji statistik
seperti ini membuat asumsi kuat tentang data kami. ADF menginformasikan sejauh mana hipotesis nol dapat ditolak atau tidak
ditolak untuk menentukan apakah data kita stasioner atau tidak. Ini ditafsirkan menggunakan ambang (0,05) yang akan
menyarankan jika kita menolak atau menerima hipotesis nol. Data hasil ADF ditunjukkan pada Gambar 2. Di bawah ini.
528 Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532

Gambar 2. Tes ADF untuk COVID-19 kasus terkonfirmasi, meninggal, dan sembuh di Indonesia.

Dari hasil tersebut dapat disimpulkan bahwa :

• Data kasus terkonfirmasi, meninggal, dan pulih memiliki nilai p lebih tinggi dari ambang batas, di mana mereka
gagal menolak hipotesis nol (data tidak stasioner).
• Statistik uji untuk data kasus terkonfirmasi, meninggal, dan sembuh tidak ada yang mendekati atau berada dalam wilayah nilai
kritis, yang menunjukkan bahwa data tidak stasioner.

2.3 Transformasi Data (ARIMA)

Gambar 3. Varians, Mean, Nilai Asli, dan Hasil Tes ADF dari Data Terkonfirmasi COVID-19, Kematian, dan Pemulihan Setelah
melakukan transformasi

Ada banyak metode yang dapat digunakan untuk mengubah data menjadi stasioner. Dalam hal ini, transformasi skala log dan
transformasi pergeseran waktu digunakan. Transformasi skala log dapat digunakan untuk menstabilkan deret yang memiliki varian
tidak konstan sehingga deret tersebut akan memiliki distribusi yang lebih normal. Ini dilakukan hanya dengan mengambil log dari
nilai numerik di dalam dataset. Setelah dilakukan log-scaling kami menemukan bahwa di dalam kumpulan data pulih dan mati,
terdapat data yang memiliki nilai tak terhingga negatif. Ini normal karena kematian dan pemulihan selalu dimulai dari 0 di awal dan
mengambil nilai log mendekati 0 akan mengakibatkan masalah seperti ini. Oleh karena itu, kita cukup mengganti nilai yang memiliki
infinity negatif menjadi 0. Langkah selanjutnya adalah proses transformasi Time-Shifting.
Diberikan satu set pengamatan pada deret waktux0, x1, x2,…, xn. Nilai-nilai akan digeser ke kanan, menghasilkan batal,x0, x1, x2,…,
xn.Dengan demikian, deret waktu dengan nilai yang bergeser ditunjukkan pada (1).

+ (1)

Hasil setelah transformasi terbukti cukup efektif. Seperti yang terlihat pada Gambar 3, meskipun terdapat noise,
grafiknya konstan dan tidak menunjukkan tren. Uji ADF juga membuktikan bahwa data telah berubah menjadi stasioner.
Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532 529

3. Model Peramalan

3.1. Peramalan dengan ARIMA

AR dalam ARIMA adalah singkatan dari AutoRegressive yang diwakili olehpdalam model. Ini mengacu pada jumlah kelambatanY
untuk digunakan sebagai prediktor. Model AR murni akan berada di manaYthanya bergantung pada nilai masa lalunya sendiri (Yt-1,
Yt-2,…) . Representasi umum dari model autoregresif order p dapat ditulis sebagai (2).

ϕ − ϕ − 2+⋯+ϕ − εt (2)

di manaεtmewakili white noise. Sedangkan MA dalam ARIMA adalah singkatan dari Moving Average, yang diwakili olehqdalam model. Tidak
seperti model AR yang menggunakan nilai masa lalu, model MA hanya bergantung pada kesalahan ramalan masa lalu. Representasi umum
dari model rata-rata bergerak dengan order q dapat ditulis sebagai berikut.

εt θ εt− θ εt−2+⋯+θqεt− (3)

di manaεtmewakili white noise, yang diikuti oleh kesalahan perkiraan. I dalam ARIMA adalah singkatan dari Integrated dan diwakili
olehddalam model. Ketika deret waktu dibedakan setidaknya satu kali untuk membuatnya stasioner dan digabungkan dengan model
AR dan MA, maka akan menghasilkan model ARIMA non-musiman, di mana dalam konteks ini, pembedaan adalah kebalikan dari
integrasi. Rumus untuk ARIMA dapat direpresentasikan sebagai

′ ϕ ′ −1+⋯+ϕ ′ − θ εt−1+⋯+θqεt− εt (4)

di manakamu tidakmewakili rangkaian perbedaan karena mungkin telah dibedakan beberapa kali, sedangkan sisi kanan rumus
menyertakan kedua nilai tertinggal dariytdari model AR dan kesalahan tertinggal dari model MA.Karena data kami telah berubah
menjadi stasioner, dapat dengan aman dikatakan bahwa pembedaan urutan (d) dalam model ARIMA kami memiliki nilai 1.

Mengidentifikasi istilah AR (p) dilakukan dengan memeriksa grafik Partial Autocorrelation (PACF). PACF adalah korelasi
antara dua titik mana pun dengan pergeseran waktu tertentu, yang disebut lag, di mana efek linear dari titik-titik di
antaranya dihilangkan29. Sederhananya, PACF memberikan korelasi antara time series dan lag setelah mengecualikan
kontribusi lag antara. Temuanpdapat dilakukan dengan melihat nilai darixyang melintasiyKapanyadalah 0 (ketika korelasi
berakhir dimulai dengan nilai negatif). Mengidentifikasi istilah MA (q) dilakukan dengan memeriksa grafik Autokorelasi (ACF).
ACF adalah korelasi antara dua nilai dalam deret waktu dengan lag tertentu29. Sama seperti menemukanp, menemukanq
dapat dilakukan dengan melihat nilai darixyang melintasiyKapanyadalah 0. Grafik PACF dan ACF dapat dilihat pada Gambar
4.

(sebuah) (b) (c)


Gambar 4. PACF dan plot ACF COVID-19 a) data terkonfirmasi; b) data kematian; c) data yang dipulihkan

Dari Gambar 4a terlihat dari grafik ACF yang bersinggungan dengan garisy=0,0 padax=22. Oleh karena ituq=22. Terlihat
dari grafik PACF bahwa garis tersebut bersinggungany=0,0 padax=5. Oleh karena itup=5. Sedangkan pada Gambar 4b
terlihat dari grafik ACF yang bersinggungan dengan garisy=0,0 padax=3. Oleh karena ituq=3. Terlihat dari grafik PACF
530 Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532

yang disentuh garisy=0,0 padax=3. Oleh karena itup=3. Dari Gambar 4 dapat dilihat dari grafik ACF yang bersinggungan dengan
garisy=0,0 padax=1. Oleh karena ituq=1. Terlihat dari grafik PACF bahwa garis tersebut bersinggungany=0,0 padax=1. Oleh karena
itup=1.

3.2. Ramalan dengan NABI

PROPHET adalah prosedur peramalan data time series yang dibuat oleh tim Core Data Science Facebook. Ini bertujuan untuk dapat
meramalkan 'pada skala', artinya NABI ingin menjadi alat peramalan yang bersifat otomatis, memberikan lebih banyak kemudahan
penggunaan dalam menyetel metode deret waktu dan memungkinkan analis dari latar belakang apa pun atau orang dengan sedikit
(mungkin) tidak ada pengetahuan sebelumnya dalam peramalan untuk dapat meramal dengan sukses.
Menurut Facebook, PROPHET “berfungsi paling baik dengan deret waktu yang memiliki efek musiman yang kuat dan data
historis beberapa musim serta kuat terhadap outlier dan pergeseran tren.” Dalam hal ini, data kami tidak bersifat musiman
tetapi berkinerja baik. Dan inilah yang baik untuk NABI. Sifatnya yang otomatis memberikan fleksibilitas pada data deret
waktu yang memiliki perubahan dramatis dan karenanya analis tidak perlu khawatir datanya tidak cocok untuk peramalan
dengan PROPHET30. NABI mudah digunakan. Analis perlu menyiapkan kumpulan data dan membuat bingkai data dengan
dua kolom: 'ds' atau stempel tanggal (dalam format datetime), dan 'y' atau pengukuran peramalan yang harus dalam nilai
numerik. Kemudian, analis perlu membuat objek dariNabi()kelas, di mana bingkai data dipasang ke objek. Setelah itu analis
dapat memilih periode yang diinginkan untuk diramalkan kemudian dilanjutkan ke peramalan. Hasil peramalan akan
memiliki beberapa kolom, di mana yang ingin dilihat oleh analis adalah 'ds' dan 'ya' kolom. 'ya' adalah kolom yang berisi
perkiraan hasil 'y' dalam bingkai data historis. 'ds' dan 'ya' dapat diplot untuk menampilkan fitur seperti tren mendatang
atau musiman.

4. Hasil dan Pembahasan

Menggunakan ARIMA dan PROPHET, kami memperkirakan kasus COVID-19 yang dikonfirmasi, meninggal, dan sembuh di
Indonesia dalam periode 30 hari. Kami mulai memprakirakan pada 22 April 2020 dan berakhir pada 21 Mei 2020. Untuk PROPHET,
kami menggunakan parameter default yang disetel secara otomatis dengan sendirinya. Sedangkan untuk ARIMA, satu-satunya
hyperparameter yang disetel adalah urutanp,d, danq.

Gambar 5. Visualisasi kasus konfirmasi COVID-19 di Indonesia Gambar 6. Visualisasi Kasus Kematian COVID-19 Indonesia

Gambar 7. Visualisasi Kasus Sembuh COVID-19 Indonesia


Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532 531

Tabel 3. Metrik Evaluasi Model ARIMA

ARIMA Set R2 MSE MAE MFE


Kasus terkonfirmasi 0,255996 9814486.067 2967 2967
Meninggal - 11.406655 388366.6667 617.6 617
Pulih 0,310856 1024253.9 961.1666667 961.166667

Tabel 4. Metrik Evaluasi Model Nabi

Nabi Set R2 MSE MAE MFE


Kasus terkonfirmasi 0,911158 1171958.567 686.3 671.766667

Meninggal 0,050148 29733.3 153.1 - 153.1

Pulih - 0,052854 1564826.033 955.833333 955.833333

Data ramalan dengan NABI menunjukkan akurasi yang tinggi di awal dengan hanya sedikit perbedaan antara data sebenarnya. Namun,
seiring berjalannya waktu, perbedaannya cenderung meningkat, menciptakan kesenjangan yang terlihat. Namun demikian, baik hasil aktual
maupun hasil NABI cenderung meningkat, meskipun pada kasus yang sembuh NABI menunjukkan kecenderungan yang lebih linier.
Kesenjangan yang paling terlihat antara data aktual dan prediksi NABI adalah pada bagian kasus sembuh. ARIMA agak rumit untuk
digunakan. Kuncinya terletak pada memilih yang paling cocok dengan penyetelan p,d, danqmemesan. Namun, kami berhasil membuat
dataset stasioner sehingga urutan d dapat dianggap 1 tetapi tetap saja ARIMA memiliki akurasi yang lebih rendah daripada PROPHET bahkan
sejak awal peramalan. Tabel 3 dan 4 menunjukkan bahwa kedua model tidak cocok dengan baik. Padahal dalam perbandingan PROPHET
masih lebih baik dari ARIMA meskipun tidak ada penyetelan yang dilakukan seperti yang terlihat pada Gambar 5, 6, dan 7.

5. Kesimpulan

Tujuan kami untuk penelitian ini adalah untuk membandingkan seberapa baik ARIMA dan PROPHET dapat menangani data deret
waktu tanpa musiman, memiliki pola acak, dan dengan pengamatan minimum dengan menggunakan data kasus COVID-19.
Peramalan dilakukan dalam periode waktu 30 hari untuk kedua model dari 22 April 2020 hingga 21 Mei 2020. ARIMA dan PROPHET
ditemukan kurang akurat dalam peramalan seiring berjalannya waktu.
Kedua model memiliki Mean Forecast Error (MFE) yang menunjukkan bahwa kedua model memiliki bias positif kecuali pada
bagian kematian NABI yang menunjukkan bias negatif. Bias positif menunjukkan bahwa model di bawah prakiraan, yang lebih sering
daripada tidak, prakiraan kurang dari data aktual. Bias negatif menunjukkan sebaliknya, yang lebih sering daripada tidak, ramalan
lebih dari data aktual.
PROPHET memiliki akurasi yang baik dalam memprediksi kasus terkonfirmasi dengan presisi 91%, sedangkan
ARIMA bahkan tidak melewati setengah presisi. Kedua model juga memiliki nilai R2 negatif. Artinya, Sum of Squared
Error dari regresi (jarak antara titik data aktual dengan garis regresi) sangat jauh bahkan lebih besar dari total Sum of
Squared Error. Dengan kata lain, garis regresi menuju ke arah yang tidak sesuai dengan keselarasan data
sebenarnya (melangkah lebih jauh dari data sebenarnya). Semakin besar angka negatif R2, semakin besar jarak
antara data aktual dan data prediksi, dan data prediksi akan semakin kurang akurat.

Referensi

1. Almasarweh M, Wadi SAL. Model ARIMA dalam Memprediksi Data Pasar Saham Perbankan. Sains Terapan Modern. 2018 Okt; 12: hal. 309.
2. Petrevska B. Memprediksi permintaan pariwisata dengan model ARIMA. Riset Ekonomi-Ekonomska Istraživanja. Januari 2017; 30: hal. 939–950.
3. Petrevska B. Meramal permintaan pariwisata internasional: Bukti Makedonia. Jurnal Ekonomi UTMS. 2012; 3: hal. 45–55.
532 Christophorus Beneditto Aditya Satrio dkk. / Ilmu Komputer Procedia 179 (2021) 524–532

4. Miranda GHB, Baetens JM, Bossuyt N, Bruno OM, Baets BD. Prediksi real-time wabah influenza di Belgia. Epidemi. 2019 September; 28: hal.
100341.
5. Yang W, Cowling BJ, Lau EHY, Dukun J. Meramal Epidemi Influenza di Hong Kong. Biologi Komputasi PLOS. Juli 2015; 11 : hal.
e1004383.
6. Yang Z, Zeng Z, Wang K, Wong SS, Liang W, Zanin M, dkk. Prediksi SEIR dan AI yang dimodifikasi dari tren epidemi COVID-19 di Tiongkok di bawah
intervensi kesehatan masyarakat. Jurnal Penyakit Toraks. Maret 2020; 12: hal. 165–174.
7. Yang Q, Yi C, Vajdi A, Cohnstaedt LW, Wu H, Guo X, dkk. Prakiraan jangka pendek dan evaluasi mitigasi jangka panjang untuk epidemi
COVID-19 di Provinsi Hubei, Tiongkok. 2020 Mar..
8. Kim L, Fast SM, Markuzon N. Memasukkan data media ke dalam model penularan penyakit menular. PLOS SATU. 2019 Februari b; 14: hal.
e0197646.
9. Anastassopoulou C, Russo L, Tsakris A, Siettos C. Analisis berbasis data, pemodelan dan peramalan wabah COVID-19. PLOS SATU. Maret
2020; 15: hal. e0230405.
10. Leo J, Luhanga E, Model Pembelajaran Mesin Michael K. untuk Kumpulan Data Kolera yang Tidak Seimbang di Tanzania. Jurnal Dunia Ilmiah. Juli 2019; 2019: hal. 1–
12.

11. Che C, Xiao C, Liang J, Jin B, Zho J, Wang F. Arsitektur RNN dengan Pencocokan Temporal Dinamis untuk Prediksi Penyakit Parkinson\textquotesingles
yang Dipersonalisasi. Dalam Prosiding Konferensi Internasional SIAM 2017 tentang Penambangan Data.: Masyarakat untuk Matematika Industri dan
Terapan; 2017. hal. 198–206.
12. Prediksi penyakit hati Vijayarani S, Dhayanand S. menggunakan algoritma SVM dan Naıv̈e Bayes. International Journal of Science, Engineering and
Technology Research (IJSETR). 2015; 4: hal. 816–820.
13. Mendeteksi Penyakit Ginjal Menggunakan Naïve Bayes dan Decision Tree di Machine Learning. International Journal of Innovative Technol ogy and Exploring
Engineering. November 2019; 9: hal. 498–501.

14. Al-Turaiki I, Alshahrani M, Almutairi T. Membangun model prediktif untuk infeksi MERS-CoV menggunakan teknik data mining. Jurnal Infeksi dan
Kesehatan Masyarakat. November 2016; 9: hal. 744–748.
15. Sathler C, Luciano J. Pemodelan prediktif epidemi demam berdarah: Pendekatan Jaringan Neural. 2017.
16. Nguyen M, Sun N, Alexander DC, Feng J, Yeo BTT. Memodelkan perkembangan penyakit Alzheimer menggunakan jaringan saraf berulang yang dalam. Pada
International Workshop on Pattern Recognition in Neuroimaging (PRNI) 2018; Juni 2018: IEEE.

17. Nan Y, Gao Y. Metode pembelajaran mesin untuk memantau epidemi AIDS di China dengan data dari tren Baidu. PLOS SATU. Juli 2018; 13 : hal.
e0199697.
18. Akhtar M, Kraemer MUG, Gardner LM. Model jaringan saraf dinamis untuk memprediksi risiko Zika secara real time. Kedokteran BMC. 2019 September;
17.
19. Lega J, Brown HE. Peramalan wabah berbasis data dengan model pertumbuhan nonlinier sederhana. Epidemi. Des 2016; 17: hal. 19–26.

20. Ndanguza D, Mbalawata IS, Haario H, Tchuenche JM. Analisis bias dalam model epidemi Ebola dengan pendekatan extended Kalman filter.
Matematika dan Komputer dalam Simulasi. Des 2017; 142: hal. 113–129.
21. Zhu X, Fu B, Yang Y, Ma Y, Hao J, Chen S, dkk. Jaringan saraf berulang berbasis perhatian untuk prediksi epidemi influenza. BMC
Bioinformatika. November 2019; 20.
22. Chae S, Kwon S, Lee D. Memprediksi Penyakit Menular Menggunakan Deep Learning dan Big Data. Jurnal Internasional Penelitian Lingkungan dan Kesehatan
Masyarakat. Juli 2018; 15: hal. 1596.

23. Kirkeby C, Halasa T, Gussmann M, Toft N, Græsbøll K. Metode untuk memperkirakan tingkat penularan penyakit: Mengevaluasi ketepatan regresi
Poisson dan dua metode baru. Laporan Ilmiah. 2017 Agustus; 7.
24. Zhang J, Nawata K. Prediksi multi-langkah untuk wabah influenza dengan memori jangka pendek yang disesuaikan. Epidemiologi dan Infeksi. April
2018; 146: hal. 809–816.
25. Ye Z. Prediksi Polutan Udara di Shenzhen Berdasarkan ARIMA dan Metode Nabi. Web Konferensi E3S. 2019; 136: hal. 05001.
26. Yenidogan I, Cayir A, Kozan O, Dag T, Arslan C. Peramalan Bitcoin Menggunakan ARIMA dan PROPHET. Pada 3rd International Conference on Computer Science
and Engineering (UBMK) Tahun 2018; September 2018: IEEE.

27. Tyralis H, Papacharalamous GA. Penilaian Nabi skala besar untuk peramalan aliran bulanan multi-langkah ke depan. Kemajuan dalam
Geosains. 2018 Agustus; 45: hal. 147–153.
28. Alabi RO, Siemuri A, Elmusrati M. COVID-19: Melonggarkan penguncian virus corona dengan hati-hati. 2020 Mei.
29. Bögl M, Aigner W, Filzmoser P, Lammarsch T, Miksch S, Rind A. Analisis visual untuk pemilihan model dalam analisis deret waktu. Transaksi
IEEE pada visualisasi dan grafik komputer. 2013 Okt; 19(12):2237-2246.
30. Taylor SJ, Letham B. Peramalan dalam skala besar. 2017 September

Anda mungkin juga menyukai