Anda di halaman 1dari 12

Tugas Analisis Deret Waktu I

PERAMALAN KASUS COVID-19 PER HARI


DI NEGARA KASUS DENMARK

disusun untuk memenuhi


tugas mata kuliah Analisis Deret Waktu I

Oleh:

SALSABILA MAHDI
1708108010035

JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SYIAH KUALA
DARUSSALAM, BANDA ACEH
2020
1. DESKRIPTIF DATA
Data : Jumlah kasus baru virus corona yang terlapor di Denmark setiap
hari dari tanggal 3 Maret 2020 hingga 14 April 2020.
Format : Data diambil dari grafik “Daily New Cases in Denmark” dan
“Total Coronavirus Cases in Denmark” pada sumber. Kemudian
data diketik dalam MS-Excel seperti pada Tabel 1 lalu diubah
menjadi format yang sesuai di RStudio.
Sumber : https://www.worldometers.info/coronavirus/country/denmark/

Tabel 1. Data Jumlah Kasus Baru dan Total Kasus di Denmark


Kasus Total Kasus Total
No. Tanggal No. Tanggal
Baru Kasus Baru Kasus
1 < 3 Mar 4 4 23 24-Mar 131 1591
2 03-Mar 6 10 24 25-Mar 133 1724
3 04-Mar 4 14 25 26-Mar 153 1877
4 05-Mar 5 19 26 27-Mar 169 2046
5 06-Mar 2 21 27 28-Mar 155 2201
6 07-Mar 6 27 28 29-Mar 194 2395
7 08-Mar 8 35 29 30-Mar 182 2577
8 09-Mar 55 90 30 31-Mar 283 2860
9 10-Mar 172 262 31 01-Apr 247 3107
10 11-Mar 252 514 32 02-Apr 279 3386
11 12-Mar 160 674 33 03-Apr 371 3757
12 13-Mar 130 804 34 04-Apr 320 4077
13 14-Mar 32 836 35 05-Apr 292 4369
14 15-Mar 28 864 36 06-Apr 312 4681
15 16-Mar 50 914 37 07-Apr 390 5071
16 17-Mar 63 977 38 08-Apr 331 5402
17 18-Mar 80 1057 39 09-Apr 233 5635
18 19-Mar 94 1151 40 10-Apr 184 5819
19 20-Mar 104 1255 41 11-Apr 177 5996
20 21-Mar 71 1326 42 12-Apr 178 6174
21 22-Mar 69 1395 43 13-Apr 144 6318
22 23-Mar 65 1460 44 14-Apr 193 6511

Data untuk membangun model dari 10 Maret hingga 9 April (31 hari) sementara
data untuk menguji model dari 10 April hingga 14 April (5 hari) sesuai
kesepakatan di kelas.
2. STATISTIKA DESKRIPTIF DAN EKSPLORASI DATA

Gambar 2.1. Barchart Data Kasus Corona di Denmark per Hari

Gambar 2.2. Linechart Data Kasus Corona di Denmark per Hari


Interpretasi:
Dapat dilihat pada Gambar 2.1 untuk keseluruhan data kasus virus corona per hari
di Denmark (untuk pemodelan dan uji prediksi) bahwa terjadi lonjakan data pada
tanggal 10 Maret hingga 13 Maret. Setelah itu, kasus baru COVID-19 kembali
meningkat hingga menurun kembali pada tanggal 8 April.
Data yang digunakan untuk pemodelan (Gambar 2.2) menunjukkan pula
bahwa data untuk pemodelan tidak termasuk hari-hari dimana jumlah kasus baru
corona telah kembali menurun. Mungkin fluktuasi tersebut menyebabkan data
tidak stasioner.

Tabel 2. Statistika Deskriptif


Statistik Nilai
Minimum 28,0
Kuartil 1 87,0
Kuartil 2 160,0
Rata-rata 178,9
Kuartil 3 265,5
Maksimum 390,0
Varians 11041,58
Standar deviasi 105,0789

Interpretasi:
Dapat dilihat bahwa data kasus baru corona di Denmark (10 Maret hingga 9
April) memiliki nilai paling kecil 28 kasus dan paling besar 390 kasus, dimana
pusat data atau rata-ratanya adalah 178,9 kasus. Kuartil 1 senilai 87 kasus, kuartil
2 senilai 160 kasus, dan kuartil 3 senilai 265,5 kasus.
Nilai-nilai tersebut berarti bahwa data cukup normal jika membandingkan
rata-rata hitung dan median dengan memperhitungkan jangkauan nilai yang
demikian. Lebih penting lagi untuk analisis deret waktu yang akan dilakukan,
sepertinya pada Gambar 2 fluktuasi data tidak cukup konstan terhadap mean yang
sekitar 180 kasus. Untuk mengetahui dengan lebih tepat, berikut dilakukan uji
formal terhadap stasioneritas.
3. UJI STASIONERITAS
a. Uji stasioner terhadap mean
1) Hipotesis
H0: Data tidak stasioner
H1: Data stasioner

2) Taraf Nyata dan Daerah Penolakan


α = 0,05, statistik uji ≤ α

3) Statistik Uji

Gambar 3.1. Statistik Uji


Interpretasi:
Nilai p-value adalah 0,04411.
Nilai lebih kecil dari α yang ditentukan, yaitu 0,05.

4) Keputusan
Tolak H0 karena p-value lebih kecil daripada α.

5) Kesimpulan
Data stasioner.

Akan tetapi, apabila menggunakan α yang bernilai 0,01, p-value lebih besar dari α
yang berarti bahwa ada baiknya mencoba differencing.

b. Uji stasioner terhadap varians

Gambar 3.2. Lambda


Interpretasi:
Dapat dilihat nilai lambda mendekati 1 sehingga dapat dikatakan data stasioner.
4. PEMODELAN DAN PEMERIKSAAN DIAGNOSTIK MODEL
a. Plot ACF dan PACF

Gambar 4.1. Plot ACF dan Plot PACF


Dapat dilihat pada Gambar 4.1 bahwa plot ACF memiliki pola tails off dengan lag
ke-5 sebagai lag terakhir di luar garis Bartlett sementara plot PACF memiliki pola
cut off setelah lag 0. Hal ini berarti bahwa data ini menunjukkan adanya ciri-ciri
proses AR. Akan tetapi karena lebih dari 75% lag berada di luar garis Bartlett
pada plot ACF, data sebaiknya distasionerkan terlebih dahulu. Dikarenakan hasil
statistik uji stasioner mean tidak cukup baik, akan dilakukan differencing.

b. Mengatasi masalah stasioneritas

Gambar 4.2. Hasil differencing


Interpretasi:
Dapat dilihat pada Gambar 4.2. bahwa ketika differencing pertama, data justru
semakin tidak stasioner. Akan tetapi, setelah differencing kedua, data telah
stasioner. Oleh karena itu, akan dicoba menggunakan nilai i = 2 dan nilai p = 0
(dari interpretasi Gambar 4.1).

c. Pemodelan dan Kriteria Pemilihan Model Terbaik


Sesuai hasil sebelumnya, akan dicoba membentuk model ARIMA dari nilai i = 2
dan nilai 0. Akan dicoba juga nilai i = 0 karena data tidak sangat bermasalah
dalam stasioneritas terrhadap mean. Selain itu ada dilakukan proses trial and
error dengan auto.arima dan fungsi maupun metode lainnya. Berikut hasilnya.

Tabel 3. Kriteria Pemilihan Model Terbaik


Order AIC ME RMSE MAE MPE MAPE MASE ACF1
Model 1:
326 -3,93 50,56 40,33 -3,64 35,80 1,02 0,1673
ARIMA(5,2,0)
Model 2:
324 -3,32 44,84 34,86 -0,06 27,52 0,88 0,0383
ARIMA(0,2,5)
Model 3:
344 -0,52 48,03 36,63 -17,58 34,67 0,93 0,0103
ARIMA(5,0,0)
Model 4:
340 0,74 41,77 32,08 -10,92 26,84 0,81 -0,0142
ARIMA(0,0,5)
Note: Yang ditandai adalah nilai terkecil pada kolom tersebut. Nilai telah dibulatkan

Interpretasi:
Berdasarkan tabel tersebut, model ARIMA(0,2,5), ARIMA(5,0,0), dan model
ARIMA(0,0,5) merupakan model yang dapat dipertimbangkan sebagai yang
terbaik untuk data kasus baru corona harian di Denmark. Hal ini tidak sepenuhnya
sesuai plot ACF dan PACF karena model 2 dan 4 justru merupakan model MA.
Perbedaan model 2 dan model 4 terletak pada apakah data didifferencing atau
tidak. Sementara model 3 adalah model AR. Model 2 dikatakan lebih baik
menurut 2 kriteria, model 3 dikatakan lebih baik menurut 2 kriteria, dan model 4
lebih baik menurut 4 kriteria. Hal ini tidak dapat dilihat secara kuantitatif saja
karena kualitas masing-masing kriteria tidak dapat dibandingkan langsung.
Oleh karena itu, ada baiknya dilakukan uji signifikansi parameter terhadap kedua
model tersebut.

d. Signifikansi Parameter

Gambar 4.3. Hasil Uji Signifikansi Parameter


Interpretasi:
Dapat dilihat bahwa keseluruhan parameter model 4, sebanyak 5, signifikan pada
α = 0. Sementara model 2 hanya memiliki satu dari 5 parameter yang signifikan
pada α = 0,01 dan model 3 memiliki 2 dari 5 parameter yang signifikan pada α =
0. Oleh karena itu, dapat disimpulkan bahwa model 4, yaitu ARIMA (0,0,5)
adalah model yang terbaik untuk menggambarkan data harian virus corona di
negara Denmark.
Adapun visualisasi perbandingan fitting ketiga model sebagai berikut:

Gambar 4.4. Perbandingan Visual Hasil Fitting Ketiga Model pada Data
Pemodelan (10 Maret hingga 9 April (31 hari))
Interpretasi:
Dapat dilihat bahwa secara grafik semua model kelihatan mendekati pola data
kasus baru corona di Denmark dengan cukup baik. Namun secara formal dan
secara grafik tampak bahwa model 4 dapat dikatakan sebagai model terbaik.

e. Uji Residual Model


1) Hipotesis
H0: Residual memenuhi syarat white noise (residual bersifat acak)
H1: Residual tidak memenuhi syarat white noise (residual tidak bersifat
acak)

2) Taraf Nyata dan Daerah Penolakan


α = 0,05, statistik uji ≤ α

3) Statistik Uji
Gambar 4.5. Statistik Uji Ljung Box
Interpretasi:
Nilai p-value adalah 0,9337.
Nilai p-value lebih besar dari α yang ditentukan, yaitu 0,05.

4) Keputusan
Tidak dapat menolak H0 karena p-value lebih kecil daripada α.

5) Kesimpulan
Residual memenuhi syarat white noise (residual bersifat acak).
Oleh karena itu, dapat disimpulkan bahwa model ARIMA(0,0,5) adalah model
terbaik dan sesuai untuk meramalkan data kasus baru harian di Denmark.
5. PERAMALAN
Berikut peramalan yang memiliki confidence interval.

Gambar 5.1. Peramalan data harian corona di Denmark dengan package ‘forecast’
(atas) dibandingkan dengan data keseluruhan (bawah)
Interpretasi:
Dapat dilihat bahwa model ARIMA(0,0,5) dengan package ‘forecast’ menduga
dengan tepat bahwa kasus harian virus corona selama 5 hari ke depan akan
menurun lalu kembali meningkat sedikit. Namun fluktuasinya berbeda dengan
data sebenarnya.

Gambar 5.2. Peramalan data harian corona di Denmark vs data asli secara grafik

Gambar 5.3. Peramalan data harian corona di Denmark vs data asli secara angka

Interpretasi:
Dapat dilihat bahwa ARIMA(0,0,5) meramal data harian corona Denmark 10
April hingga 14 April 2020 akan bernilai secara berturut-turut 244, 229, 167, 130,
dan 150 kasus. Hal ini menunjukkan bahwa model terkadang relatif lebih baik
meramalkan jumlah kasus corona baru di Denmark seperti pada tanggal 12 April
yang hanya berbeda 11 kasus dibandingkan hari lain.

Hal tersebut wajar mengingat adanya residual yang acak karena ada hal-hal yang
tak dapat diduga oleh model. Terutama dalam permasalahan kesehatan yang
bersangkutan dengan manusia yang bisa beradaptasi atau sebaliknya tidak peduli.

Anda mungkin juga menyukai