Anda di halaman 1dari 12

Laporan Praktikum Analisis Deret Waktu I

PERAMALAN KASUS COVID19


DI NEGARA INDIA

disusun untuk memenuhi


tugas matakuliah Analisis Deret Waktu I

Oleh:

AKHMAD FAJRI
1708108010026

JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SYIAH KUALA
DARUSSALAM, BANDA ACEH
2020
Deskripsi data

Data yang digunakan merupakan data Kasus positif penderita COVID-19 di Negara India ,
dimana data yang diperoleh merupakan data harian, dimulai dari tanggal 10 Maret 2020 s/d 10
April 2020. Data yang digunakan sebagai berikut :

Sumber: https://www.worldometers.info/coronavirus/country/india/

Table 1 .Data Kasus Covid19 Harian Di India

NO Tanggal Cases NO Tanggal Cases


1 10/03/2020 15 17 26/03/2020 70
2 11/03/2020 0 18 27/03/2020 160
3 12/03/2020 12 19 28/03/2020 100
4 13/03/2020 8 20 29/03/2020 37
5 14/03/2020 18 21 30/03/2020 227
6 15/03/2020 14 22 31/03/2020 146
7 16/03/2020 15 23 01/04/2020 601
8 17/03/2020 14 24 02/04/2020 545
9 18/03/2020 26 25 03/04/2020 516
10 19/03/2020 25 26 04/04/2020 529
11 20/03/2020 55 27 05/04/2020 701
12 21/03/2020 83 28 06/04/2020 489
13 22/03/2020 64 29 07/04/2020 573
14 23/03/2020 103 30 08/04/2020 565
15 24/03/2020 37 31 09/04/2020 809
16 25/03/2020 121 32 10/04/2020 875

CASES
1000

800

600

400

200

0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

Grafik kasus positif covid19 di india


Grafik diatas menunjukkan bahwa jumlah kasus positif covid 19 di negara india setiap
harinya mengalami peningkatan dan juga terdapat penurunan. Peningkatan dan penurunan
ada yang siginifikan namun ada pula secara eksponensial

Plot data

Grafik diatas menunjukkan bahwa data jumlah kasus positif di negara India pada
tanggal 10 Maret 2020 s/d 10 April 2020 tidak stationer. Dikarenakan nilai mean dan
varians tidak menyebar pada sumbu horizontal sepanjang sumbu waktu dan juga lebar
pita pada setiap data nilainya jauh dan pada plot terlihat adanya trend atau musiman data
yang meningkat.

Plot Acf Dan Pacf

Berdasarkan output plot ACF dan PACF di atas, dapat dilihat bahwa plot ACF
dan PACF dari data jumlah kasus positif di india pada tanggal 10 Maret 2020 s/d 10
April 2020 dengan jumlah kasus terdapat garis lag yang berada di atas garis barlett,
sehingga data tersebut tidak stasioner.

Plot Acf Dan Pacf setelah di tranformasi

Uji kestasioneran suatu data dari varians

Output diatas menunjukkan bahwa data jumlah kasus positif COVID-19 di india
sudah stationer terhadap varian. Hal ini dapat dilihat dari nilai lamda 1,043 setelah
dilakukannya satu kali transformasi

Uji Stationer Terhadap Mean


• Hipotesis
H0: Data tidak stasioner
Ha: Data stasioner
• Taraf Nyata (α = 0,05)
• Daerah Penolakan
Tolak H0 jika Pvalue < α

• Statistik Uji

• Keputusan
Berdasarkan statsitik uji yang di peroleh, Karena Pvalue > α (0,478> 0,05), maka
keputusannya adalah Tidak dapat menolak H0.
• Kesimpulan
Karena keputusan tidak dapat menolak H0, maka dapat disimpulkan bahwa data tidak
stationer.
Karena data jumlah kasus positif COVID 19 di india pada tanggal 10 maret 2020 s/d
10 April 2020 tidak stationer terhadap mean maka perlu dilakukan differencing.

➢ Differences 1
• Hipotesis
H0 : Data tidak stationer
H1 : Data stationer
• Taraf nyata (α = 0,05)
• Kriteria penolakan
Tolak H0 jika Pvalue < α

• Statistik uji
• Keputusan
Berdasrkan statistik uji yang diperoleh, Karena Pvalue > α (0,05643 > 0,05) dapat
diputuskan Tidak dapat menolak H0.
• Kesimpulan
Berdasarkan keputusan di atas maka dapat disimpulkan bahwa data tidak stationer.
Karena setelah dilakukan differencing 1 data belum stationer, maka perlu dilakukan
differencing 2.

➢ Differencing 2
• Hipotesis
H0 : Data tidak stationer
H1 : Data stationer
• Taraf nyata (α = 0,05)
• Kriteria penolakan
Tolak H0 jika Pvalue < α

• Statistik uji

• Keputusan
Berdasarkan statistik uji yang di peroleh, Karena Pvalue < α (0,02272 < 0,05) dapat
diputuskan Tolak H0.
• Kesimpulan
Berdasarkan keputusan di atas maka dapat disimpulkan bahwa data stationer.

Menentukan model

Berdasarkan output di atas dapat dilihat bahwa pada plot ACF menurun secara cut off
setelah lag q . Sedangkan pada plot PACF menurun secara tails off oleh karena itu, model
yang akan digunakan adalah model MA(q).

Membuat Model
> #5. Penentuan order model
> model1 = arima(transformasidata, order = c(0,2,1))
> model2 = arima(transformasidata, order = c(0,2,2))
> model3 = arima(transformasidata, order = c(0,2,3))
> model4 = arima(transformasidata, order = c(0,2,4))
> model5 = arima(transformasidata, order = c(0,2,5))
> AIC(model1, model2, model3, model4, model5)
df AIC
model1 2 171.5096
model2 3 165.9631
model3 4 166.7916
model4 5 163.9295
model5 6 165.6715
> summary(model1)

Call:
arima(x = transformasidata, order = c(0, 2, 1))

Coefficients:
ma1
-1.000
s.e. 0.104
sigma^2 estimated as 13.89: log likelihood = -83.75, aic = 171.51

Training set error measures:


ME RMSE MAE MPE MAPE MASE ACF1
Training set 0.6060018 3.608838 2.533984 -Inf Inf 0.9399975 -0.5465966
> summary(model2)

Call:
arima(x = transformasidata, order = c(0, 2, 2))

Coefficients:
ma1 ma2
-1.4450 0.4758
s.e. 0.1831 0.1659

sigma^2 estimated as 10.71: log likelihood = -79.98, aic = 165.96

Training set error measures:


ME RMSE MAE MPE MAPE MASE ACF1
Training set 0.7118539 3.169414 2.154092 -Inf Inf 0.7990741 -0.1311732
> summary(model3)

Call:
arima(x = transformasidata, order = c(0, 2, 3))

Coefficients:
ma1 ma2 ma3
-1.4266 0.6541 -0.2274
s.e. 0.2640 0.2441 0.1991

sigma^2 estimated as 10.16: log likelihood = -79.4, aic = 166.79

Training set error measures:


ME RMSE MAE MPE MAPE MASE ACF1
Training set 0.6155061 3.085616 2.20001 -Inf Inf 0.8161075 -0.09470492
> summary(model4)

Call:
arima(x = transformasidata, order = c(0, 2, 4))

Coefficients:
ma1 ma2 ma3 ma4
-1.5353 0.9843 -0.9370 0.5694
s.e. 0.2425 0.3559 0.4239 0.2980

sigma^2 estimated as 8.464: log likelihood = -76.96, aic = 163.93

Training set error measures:


ME RMSE MAE MPE MAPE MASE ACF1
Training set 0.5883266 2.816833 2.003525 -Inf Inf 0.7432202 -0.01559166
> summary(model5)

Call:
arima(x = transformasidata, order = c(0, 2, 5))

Coefficients:
ma1 ma2 ma3 ma4 ma5
-1.5746 0.9617 -0.8891 0.4942 0.1063
s.e. 0.3783 0.4044 0.4234 0.4096 0.1894
sigma^2 estimated as 7.794: log likelihood = -76.84, aic = 165.67

Training set error measures:


ME RMSE MAE MPE MAPE MASE ACF1
Training set 0.5568331 2.703208 1.947943 -Inf Inf 0.7226016 -0.0556056

Tabel 2. Nilai Kriteria pemilihan model

Model Order AIC MAE RMSE MASE


1 0,2,1 171,5 2,53 3,60 0,93
2 0,2,2 165,96 2,15 3,16 0,79
3 0,2,3 166,79 2,20 3,08 0,816
4 0,2,4 163,92 2,00 2,81 0,74
5 0,2,5 165,67 1,94 2,70 0,72

Interpretasi:
Untuk mendapatkan model terbaik, maka dilakukan beberapa kali percobaan dengan
mengganti nilai q pada model. Berdasarkan output di atas, dapat dilihat nilai AIC, RMSE,
MAE, dan MASE dari masing-masing model yang telah dicoba. Model terbaik yang diperoleh
adalah model 5, karena berdasarkan 4 kriteria yang digunakan (AIC, MAE, RMSE dan MASE),
model 5 memiliki 3 dari 4 kriteria dengan nilai yang diperoleh paling kecil. Namun, perlu
diperhatikan dan diuji pendugaan parameter untuk semua model, dimana setiap parameter di
dalam model tersebut haruslah signifikan sehingga dapat dikatakan sebagai model terbaik
meskipun nilai AIC nya bukanlah yang paling terkecil.

Uji Signifikansi Parameter

coeftest(model1)

z test of coefficients:

Estimate Std. Error z value Pr(>|z|)


ma1 -1.00000 0.10403 -9.613 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> coeftest(model2)

z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 -1.44505 0.18313 -7.8910 2.998e-15 ***
ma2 0.47578 0.16588 2.8683 0.004127 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> coeftest(model3)

z test of coefficients:

Estimate Std. Error z value Pr(>|z|)


ma1 -1.42664 0.26405 -5.4030 6.554e-08 ***
ma2 0.65409 0.24406 2.6800 0.007362 **
ma3 -0.22741 0.19910 -1.1422 0.253369
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> coeftest(model4)

z test of coefficients:

Estimate Std. Error z value Pr(>|z|)


ma1 -1.53530 0.24247 -6.3318 2.423e-10 ***
ma2 0.98426 0.35587 2.7658 0.005679 **
ma3 -0.93703 0.42395 -2.2103 0.027087 *
ma4 0.56940 0.29805 1.9104 0.056077 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> coeftest(model5)

z test of coefficients:

Estimate Std. Error z value Pr(>|z|)


ma1 -1.57463 0.37826 -4.1629 3.143e-05 ***
ma2 0.96166 0.40437 2.3782 0.01740 *
ma3 -0.88905 0.42340 -2.0998 0.03575 *
ma4 0.49420 0.40956 1.2066 0.22757
ma5 0.10631 0.18945 0.5611 0.57470
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Interpretasi :
Berdasarkan keputusan diatas maka dapat disimpulkan bahwa model 5 adalah model
yang memiliki nilai signifikan lebih banyak dibandingkan dengan model yang lain.

Pemeriksaan diagnostik menggunakan White Noise


• Hipotesis
H0: Residual memenuhi syarat White Noise (residual bersifat acak)
Ha: Residual tidak memenuhi syarat White Noise (residual tidak bersifat acak)
• Taraf Nyata (α = 0,05)
• Daerah Penolakan
Tolak H0 jika Pvalue < α
• Statistik Uji

• Keputusan
Tidak dapat menolak H0 karena nilai P-value > α (0,7418 > 0,05)
• Kesimpulan
Berdasarkan keputusan diatas maka dapat disimpulkan bahwa residual memenuhi syarat
White Noise

Peramalan
Dikarenakan semua asumsi telah terpenuhi, maka dapat dilakukan peramalan data jumlah
kasus positif COVID-19 di India pada tanggal 10 Maret 2020 s/d 10 April 2020 untuk periode
ke depan menggunakan model 5 diperoleh peramalan sebagai berikut:

ramalan1=predict(model5, n.ahead = 6)
> ramalan$pred
Time Series:
Start = 33
End = 38
Frequency = 1
[1] 32.73594 32.28637 34.54472 36.05663 37.56853 39.08043
> ramalan2=sqrt(ramalan$pred)
> ramalan2
Time Series:
Start = 33
End = 38
Frequency = 1
[1] 1123.722 1102.938 1264.696 1398.361 1525.439 1658.042

Berdasarkan output diatas dapat dilihat bahwa prediksi jumlah kasus positif di India
selama 10 hari kedepan pada April 2020. Hasil ramalan dapat dilihat pada tabel dibawah :
Tabel 3. Data hasil ramalan dan aktual
Tanggal Jumlah Kasus Ramalan Aktual
11 April 2020 1124 Orang 846 Orang
12 April 2020 1103 Orang 759 Orang
13 April 2020 1265 Orang 1248 Orang
14 April 2020 1398 Orang 1034 Orang
15 April 2020 1525 Orang 883 Orang
16 April 2020 1658 Orang 1060 Orang

PERBANDINGAN DATA RAMALAN DAN DATA


AKTUAL COVID19 DI INDIA
jumlah kasus ramalan jumlah kasus faktual

1800
1600
1400
1200
1000
800
600
400
200
0
11-Apr-20 12-Apr-20 13-Apr-20 14-Apr-20 15-Apr-20 16-Apr-20

Brdasarkan grafik diatas dapat dilihat perbandingan hasil data ramalan dengan data
aktual terlihat perbedaannya.sehingga dapat diambil kesimpulan bahwa model terbaik belum
tentu mampu menghasilkan ramalan yang sesuai dengan data aktual.

Anda mungkin juga menyukai