Oleh:
SALSABILA MAHDI
1708108010035
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SYIAH KUALA
DARUSSALAM, BANDA ACEH
2020
1. DESKRIPTIF DATA
Data : Jumlah kasus baru virus corona yang terlapor di Denmark setiap
hari dari tanggal 3 Maret 2020 hingga 14 April 2020.
Format : Data diambil dari grafik “Daily New Cases in Denmark” dan
“Total Coronavirus Cases in Denmark” pada sumber. Kemudian
data diketik dalam MS-Excel seperti pada Tabel 1 lalu diubah
menjadi format yang sesuai di RStudio.
Sumber : https://www.worldometers.info/coronavirus/country/denmark/
Data untuk membangun model dari 10 Maret hingga 9 April (31 hari) sementara
data untuk menguji model dari 10 April hingga 14 April (5 hari) sesuai
kesepakatan di kelas.
2. STATISTIKA DESKRIPTIF DAN EKSPLORASI DATA
Interpretasi:
Dapat dilihat bahwa data kasus baru corona di Denmark (10 Maret hingga 9
April) memiliki nilai paling kecil 28 kasus dan paling besar 390 kasus, dimana
pusat data atau rata-ratanya adalah 178,9 kasus. Kuartil 1 senilai 87 kasus, kuartil
2 senilai 160 kasus, dan kuartil 3 senilai 265,5 kasus.
Nilai-nilai tersebut berarti bahwa data cukup normal jika membandingkan
rata-rata hitung dan median dengan memperhitungkan jangkauan nilai yang
demikian. Lebih penting lagi untuk analisis deret waktu yang akan dilakukan,
sepertinya pada Gambar 2 fluktuasi data tidak cukup konstan terhadap mean yang
sekitar 180 kasus. Untuk mengetahui dengan lebih tepat, berikut dilakukan uji
formal terhadap stasioneritas.
3. UJI STASIONERITAS
a. Uji stasioner terhadap mean
1) Hipotesis
H0: Data tidak stasioner
H1: Data stasioner
3) Statistik Uji
4) Keputusan
Tolak H0 karena p-value lebih kecil daripada α.
5) Kesimpulan
Data stasioner.
Akan tetapi, apabila menggunakan α yang bernilai 0,01, p-value lebih besar dari α
yang berarti bahwa ada baiknya mencoba differencing.
Interpretasi:
Berdasarkan tabel tersebut, model ARIMA(0,2,5), ARIMA(5,0,0), dan model
ARIMA(0,0,5) merupakan model yang dapat dipertimbangkan sebagai yang
terbaik untuk data kasus baru corona harian di Denmark. Hal ini tidak sepenuhnya
sesuai plot ACF dan PACF karena model 2 dan 4 justru merupakan model MA.
Perbedaan model 2 dan model 4 terletak pada apakah data didifferencing atau
tidak. Sementara model 3 adalah model AR. Model 2 dikatakan lebih baik
menurut 2 kriteria, model 3 dikatakan lebih baik menurut 2 kriteria, dan model 4
lebih baik menurut 4 kriteria. Hal ini tidak dapat dilihat secara kuantitatif saja
karena kualitas masing-masing kriteria tidak dapat dibandingkan langsung.
Oleh karena itu, ada baiknya dilakukan uji signifikansi parameter terhadap kedua
model tersebut.
d. Signifikansi Parameter
Gambar 4.4. Perbandingan Visual Hasil Fitting Ketiga Model pada Data
Pemodelan (10 Maret hingga 9 April (31 hari))
Interpretasi:
Dapat dilihat bahwa secara grafik semua model kelihatan mendekati pola data
kasus baru corona di Denmark dengan cukup baik. Namun secara formal dan
secara grafik tampak bahwa model 4 dapat dikatakan sebagai model terbaik.
3) Statistik Uji
Gambar 4.5. Statistik Uji Ljung Box
Interpretasi:
Nilai p-value adalah 0,9337.
Nilai p-value lebih besar dari α yang ditentukan, yaitu 0,05.
4) Keputusan
Tidak dapat menolak H0 karena p-value lebih kecil daripada α.
5) Kesimpulan
Residual memenuhi syarat white noise (residual bersifat acak).
Oleh karena itu, dapat disimpulkan bahwa model ARIMA(0,0,5) adalah model
terbaik dan sesuai untuk meramalkan data kasus baru harian di Denmark.
5. PERAMALAN
Berikut peramalan yang memiliki confidence interval.
Gambar 5.1. Peramalan data harian corona di Denmark dengan package ‘forecast’
(atas) dibandingkan dengan data keseluruhan (bawah)
Interpretasi:
Dapat dilihat bahwa model ARIMA(0,0,5) dengan package ‘forecast’ menduga
dengan tepat bahwa kasus harian virus corona selama 5 hari ke depan akan
menurun lalu kembali meningkat sedikit. Namun fluktuasinya berbeda dengan
data sebenarnya.
Gambar 5.2. Peramalan data harian corona di Denmark vs data asli secara grafik
Gambar 5.3. Peramalan data harian corona di Denmark vs data asli secara angka
Interpretasi:
Dapat dilihat bahwa ARIMA(0,0,5) meramal data harian corona Denmark 10
April hingga 14 April 2020 akan bernilai secara berturut-turut 244, 229, 167, 130,
dan 150 kasus. Hal ini menunjukkan bahwa model terkadang relatif lebih baik
meramalkan jumlah kasus corona baru di Denmark seperti pada tanggal 12 April
yang hanya berbeda 11 kasus dibandingkan hari lain.
Hal tersebut wajar mengingat adanya residual yang acak karena ada hal-hal yang
tak dapat diduga oleh model. Terutama dalam permasalahan kesehatan yang
bersangkutan dengan manusia yang bisa beradaptasi atau sebaliknya tidak peduli.