Oleh:
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SYIAH KUALA
DARUSSALAM, BANDA ACEH
2020
Data Covid-19
Data yang digunakan adalah data Covid-19 pada rentang waktu 10 Maret 2020 hingga 9 April
2020 dengan studi kasus yaitu negara Brazil. Tujannya adalah untuk melihat model terbaik dan
peramalan 5 hari setelah data yang diambil (10-15 April 2020).
(Sumber : https://www.worldometers.info/coronavirus/country/brazil/)
Data tercatat per 10 maret 2020 hingga 9 April 2020 adalah sebagai berikut :
Cases Brazil
Hari ke- Tanggal
(Harian)
1 10/03/2020 34
2 11/03/2020 52
3 12/03/2020 77
4 13/03/2020 151
5 14/03/2020 151
6 15/03/2020 49
7 16/03/2020 34
8 17/03/2020 112
9 18/03/2020 183
10 19/03/2020 111
11 20/03/2020 330
12 21/03/2020 208
13 22/03/2020 368
14 23/03/2020 378
15 24/03/2020 323
16 25/03/2020 307
17 26/03/2020 431
18 27/03/2020 432
19 28/03/2020 487
20 29/03/2020 352
21 30/03/2020 374
22 31/03/2020 1087
23 01/04/2020 1163
24 02/04/2020 1164
25 03/04/2020 1150
26 04/04/2020 1166
27 05/04/2020 894
28 06/04/2020 929
29 07/04/2020 1851
30 08/04/2020 2154
31 09/04/2020 1957
Deskriptif Data
Untuk mengetahui apakah data sudah stasioner atau belum, dapat dilihat dengan Plot ACF dan
Plot PACF. Aplikasi yang digunakan adalah R-Studio.
Interpretasi:
Berdasarkan plot ACF dan PACF di atas, diduga data tidak stationer. Pada plot ACF
terdapat data pada lag 2, 3, 4, 5, 6, dan 7 yang melewati garis barlet (garis barlet : garis
yang berwarna biru) maka data tidak stationer. Sedangkan pada plot PACF tidak terdapat
data yang melewati garis barlet. Data yang pertama pada plot PACF tidak termasuk yang
melewati garis barlet karena data yang dilihat dimulai pada data kedua dan seterusnya.
Dikarenakan salah pada plot yaitu plot ACF terdapat data yang melewati batas garis barlet
maka data harus dilakukan transformasi.
Inferensia Data
Pada Analisis Deret Waktu (ADW) terdapat 2 jenis stasioner yaitu stasioner terhadap varian
dan stasioner terhadap mean. Untuk membuat model data harus memenuhi kedua asumsi
tersebut.
Interpretasi :
Berdasarkan output nilai Boxcox lamda sebelum transformasi adalah 0.2719643.
Nilai tersebut berada cukup jauh dari nilai 1. Sehingga data tidak stasioner terhadap
varian. Maka data tersebut harus ditransformasi hingga data stasioner.
Setelah ditransformasi :
Interpretasi :
Berdasarkan output, nilai Boxcox lamda setelah transformasi sebanyak 1 kali
adalah sebesar 1.230228. Nilai lamda hasil transformasi menunjukkan nilai yang
mendekati nilai 1. Sehingga dapat dikatakan data telah stasioner terhadap varian.
❖ Keputusan
Tidak dapat menolak H0, karena PValue (0.07291) > α (0.05)
❖ Kesimpulan
Karena keputusan tidak dapat menolak H0, maka dapat disimpulkan bahwa data
tidak stasioner.
Setelah differencing :
Uji Stasioneritas Terhadap Mean dari Data Differencing
❖ Hipotesis
H0 : Data tidak stasioner
H1 : Data stasioner
❖ Taraf Nyata
α = 0.05
❖ Daerah Penolakan
Tolak H0, jika PValue < α
❖ Statistik Uji
❖ Keputusan
Tolak H0, karena PValue (0.01) < α (0.05)
❖ Kesimpulan
Karena keputusan tolak H0, maka dapat disimpulkan bahwa data stasioner.
3. Plot ACF dan PACF Data Stasioner untuk menentukan model yang akan digunakan
Kriteria penentuan model :
Model ACF PACF
AR(p) Tails off (menurun mengikuti bentuk Cut off (terpotong) setelah lag ke-p
eksponensial)
MA(q) Cut off (terpotong) setelah lag ke-q Tails off (menurun mengikuti bentuk
eksponensial)
ARMA(pq) Taill s off (menurun) setelah lag (q-p) Tails off (menurun) setelah lag (q-p)
Interpretasi:
Berdasarkan Plot ACF dan PACF di atas dapat dilihat bahwa plot ACF menunjukkan
penurunan yang mengikuti bentuk eksponensial. Sedangkan pada plot PACF setelah lag
1, lag selanjutnya tidak menunjukkan bentuk yang mengikuti bentuk eksponensial
melaikan langsung terpotong. Sehingga model pada data tersebut adalah model AR(p).
Summary Model
a. Model 1
b. Model 2
c. Model 3
d. Model 4
Model terbaik dapat dilihat dari nilai AIC, ME, MAPE, MAE, MPE, RMSE dan MASE.
Apabila nilai AIC, ME, MAPE, MAE, MPE, RMSE dan MASE semakin kecil, maka
semakin baik model tersebut. Pada tabel diatas dapat dilihat bahwa model Arima (2,1,2)
adalah model terbaik . Hal ini dapat dilihat dari nilai AIC, ME, MAPE, MAE, MPE, RMSE
dan MASE yang lebih kecil dari model lainnya.
❖ Kesimpulan
Tolak H0 karena Pvalue pada model 4 adalah model terbanyak yang memiliki Pvalue < ɑ
yaitu, Pvalue (1.805e-13, 0.04044, <2.2e-16) < ɑ (0.05)
❖ Keputusan
Karena keputusan tolak H0, maka dapat disimpulkan bahwa parameter signifikan,
yaitu pada model 4.
❖ Keputusan
Tidak dapat menoolak H0, karena PValue (0.5906) > α (0.05)
❖ Kesimpulan
Karena keputusan tidak dapat menolak H0, maka dapat disimpulkan bahwa residual
memenuhi syarat white nose (residual bersifat acak).
(Kesimpulan yang dapat diambil adalah jika tidak dapat menolak H0 maka
model sudah cukup baik)
7. Peramalan
Interpretasi :
Berdasarkan output hasil ramalan dari model terbaik yaitu model 4 maka dapat diketahui
ramalan kasus Covid-19 di Negara Brazil untuk 5 hari kedepan (10-15 April 2020) adalah
7.698604, 7.803674, 7.998491 dan 8.092742.