Oleh:
AKHMAD FAJRI
1708108010026
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SYIAH KUALA
DARUSSALAM, BANDA ACEH
2020
Deskripsi data
Data yang digunakan merupakan data Kasus positif penderita COVID-19 di Negara India ,
dimana data yang diperoleh merupakan data harian, dimulai dari tanggal 10 Maret 2020 s/d 10
April 2020. Data yang digunakan sebagai berikut :
Sumber: https://www.worldometers.info/coronavirus/country/india/
CASES
1000
800
600
400
200
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Plot data
Grafik diatas menunjukkan bahwa data jumlah kasus positif di negara India pada
tanggal 10 Maret 2020 s/d 10 April 2020 tidak stationer. Dikarenakan nilai mean dan
varians tidak menyebar pada sumbu horizontal sepanjang sumbu waktu dan juga lebar
pita pada setiap data nilainya jauh dan pada plot terlihat adanya trend atau musiman data
yang meningkat.
Berdasarkan output plot ACF dan PACF di atas, dapat dilihat bahwa plot ACF
dan PACF dari data jumlah kasus positif di india pada tanggal 10 Maret 2020 s/d 10
April 2020 dengan jumlah kasus terdapat garis lag yang berada di atas garis barlett,
sehingga data tersebut tidak stasioner.
Output diatas menunjukkan bahwa data jumlah kasus positif COVID-19 di india
sudah stationer terhadap varian. Hal ini dapat dilihat dari nilai lamda 1,043 setelah
dilakukannya satu kali transformasi
• Statistik Uji
• Keputusan
Berdasarkan statsitik uji yang di peroleh, Karena Pvalue > α (0,478> 0,05), maka
keputusannya adalah Tidak dapat menolak H0.
• Kesimpulan
Karena keputusan tidak dapat menolak H0, maka dapat disimpulkan bahwa data tidak
stationer.
Karena data jumlah kasus positif COVID 19 di india pada tanggal 10 maret 2020 s/d
10 April 2020 tidak stationer terhadap mean maka perlu dilakukan differencing.
➢ Differences 1
• Hipotesis
H0 : Data tidak stationer
H1 : Data stationer
• Taraf nyata (α = 0,05)
• Kriteria penolakan
Tolak H0 jika Pvalue < α
• Statistik uji
• Keputusan
Berdasrkan statistik uji yang diperoleh, Karena Pvalue > α (0,05643 > 0,05) dapat
diputuskan Tidak dapat menolak H0.
• Kesimpulan
Berdasarkan keputusan di atas maka dapat disimpulkan bahwa data tidak stationer.
Karena setelah dilakukan differencing 1 data belum stationer, maka perlu dilakukan
differencing 2.
➢ Differencing 2
• Hipotesis
H0 : Data tidak stationer
H1 : Data stationer
• Taraf nyata (α = 0,05)
• Kriteria penolakan
Tolak H0 jika Pvalue < α
• Statistik uji
• Keputusan
Berdasarkan statistik uji yang di peroleh, Karena Pvalue < α (0,02272 < 0,05) dapat
diputuskan Tolak H0.
• Kesimpulan
Berdasarkan keputusan di atas maka dapat disimpulkan bahwa data stationer.
Menentukan model
Berdasarkan output di atas dapat dilihat bahwa pada plot ACF menurun secara cut off
setelah lag q . Sedangkan pada plot PACF menurun secara tails off oleh karena itu, model
yang akan digunakan adalah model MA(q).
Membuat Model
> #5. Penentuan order model
> model1 = arima(transformasidata, order = c(0,2,1))
> model2 = arima(transformasidata, order = c(0,2,2))
> model3 = arima(transformasidata, order = c(0,2,3))
> model4 = arima(transformasidata, order = c(0,2,4))
> model5 = arima(transformasidata, order = c(0,2,5))
> AIC(model1, model2, model3, model4, model5)
df AIC
model1 2 171.5096
model2 3 165.9631
model3 4 166.7916
model4 5 163.9295
model5 6 165.6715
> summary(model1)
Call:
arima(x = transformasidata, order = c(0, 2, 1))
Coefficients:
ma1
-1.000
s.e. 0.104
sigma^2 estimated as 13.89: log likelihood = -83.75, aic = 171.51
Call:
arima(x = transformasidata, order = c(0, 2, 2))
Coefficients:
ma1 ma2
-1.4450 0.4758
s.e. 0.1831 0.1659
Call:
arima(x = transformasidata, order = c(0, 2, 3))
Coefficients:
ma1 ma2 ma3
-1.4266 0.6541 -0.2274
s.e. 0.2640 0.2441 0.1991
Call:
arima(x = transformasidata, order = c(0, 2, 4))
Coefficients:
ma1 ma2 ma3 ma4
-1.5353 0.9843 -0.9370 0.5694
s.e. 0.2425 0.3559 0.4239 0.2980
Call:
arima(x = transformasidata, order = c(0, 2, 5))
Coefficients:
ma1 ma2 ma3 ma4 ma5
-1.5746 0.9617 -0.8891 0.4942 0.1063
s.e. 0.3783 0.4044 0.4234 0.4096 0.1894
sigma^2 estimated as 7.794: log likelihood = -76.84, aic = 165.67
Interpretasi:
Untuk mendapatkan model terbaik, maka dilakukan beberapa kali percobaan dengan
mengganti nilai q pada model. Berdasarkan output di atas, dapat dilihat nilai AIC, RMSE,
MAE, dan MASE dari masing-masing model yang telah dicoba. Model terbaik yang diperoleh
adalah model 5, karena berdasarkan 4 kriteria yang digunakan (AIC, MAE, RMSE dan MASE),
model 5 memiliki 3 dari 4 kriteria dengan nilai yang diperoleh paling kecil. Namun, perlu
diperhatikan dan diuji pendugaan parameter untuk semua model, dimana setiap parameter di
dalam model tersebut haruslah signifikan sehingga dapat dikatakan sebagai model terbaik
meskipun nilai AIC nya bukanlah yang paling terkecil.
coeftest(model1)
z test of coefficients:
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 -1.44505 0.18313 -7.8910 2.998e-15 ***
ma2 0.47578 0.16588 2.8683 0.004127 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> coeftest(model3)
z test of coefficients:
> coeftest(model4)
z test of coefficients:
> coeftest(model5)
z test of coefficients:
Interpretasi :
Berdasarkan keputusan diatas maka dapat disimpulkan bahwa model 5 adalah model
yang memiliki nilai signifikan lebih banyak dibandingkan dengan model yang lain.
• Keputusan
Tidak dapat menolak H0 karena nilai P-value > α (0,7418 > 0,05)
• Kesimpulan
Berdasarkan keputusan diatas maka dapat disimpulkan bahwa residual memenuhi syarat
White Noise
Peramalan
Dikarenakan semua asumsi telah terpenuhi, maka dapat dilakukan peramalan data jumlah
kasus positif COVID-19 di India pada tanggal 10 Maret 2020 s/d 10 April 2020 untuk periode
ke depan menggunakan model 5 diperoleh peramalan sebagai berikut:
ramalan1=predict(model5, n.ahead = 6)
> ramalan$pred
Time Series:
Start = 33
End = 38
Frequency = 1
[1] 32.73594 32.28637 34.54472 36.05663 37.56853 39.08043
> ramalan2=sqrt(ramalan$pred)
> ramalan2
Time Series:
Start = 33
End = 38
Frequency = 1
[1] 1123.722 1102.938 1264.696 1398.361 1525.439 1658.042
Berdasarkan output diatas dapat dilihat bahwa prediksi jumlah kasus positif di India
selama 10 hari kedepan pada April 2020. Hasil ramalan dapat dilihat pada tabel dibawah :
Tabel 3. Data hasil ramalan dan aktual
Tanggal Jumlah Kasus Ramalan Aktual
11 April 2020 1124 Orang 846 Orang
12 April 2020 1103 Orang 759 Orang
13 April 2020 1265 Orang 1248 Orang
14 April 2020 1398 Orang 1034 Orang
15 April 2020 1525 Orang 883 Orang
16 April 2020 1658 Orang 1060 Orang
1800
1600
1400
1200
1000
800
600
400
200
0
11-Apr-20 12-Apr-20 13-Apr-20 14-Apr-20 15-Apr-20 16-Apr-20
Brdasarkan grafik diatas dapat dilihat perbandingan hasil data ramalan dengan data
aktual terlihat perbedaannya.sehingga dapat diambil kesimpulan bahwa model terbaik belum
tentu mampu menghasilkan ramalan yang sesuai dengan data aktual.