Data diambil dari produk A, B, C, D dan E pada periode Januari-Juni 2018. Pada kasus ini data
dibagi menjadi data in sample (data yang digunakan untuk membentuk model) dan data out sample
(data yang digunakan untuk mencari model terbaik). Data in sample merupakan data dengan
periode Januari-Mei 2018 sedangkan data out sample merupakan data periode Juni 2018. Berikut
merupakan visualisasi data yang dilakukan forecasting.
100
50
Pada gambar menunjukkan bahwa terdapat data outlier pada produk B, sehingga metode ARIMA
tidak cocok digunakan untuk produk B. Pada paper ini, metode ARIMA digunakan pada produk
A, C, D, dan E. Tahapan yang dilakukan dalam melakukan forecasting sebagai berikut.
PRODUK A
1. Identifikasi pola data dengan time series plot
Time series plot merupakan cara menggambarkan persebaran data dengan sumbu X
berbasis waktu periode tertentu. Dari time series plot bisa terlihat bagaimana pola data,
apakah dia stasioner (lurus), trend (naik/turun) atau seasonal (berulang pada periode
tertentu. Berikut merupakan contoh time series plot untuk produk A.
Time Series Plot of A
0.8
0.7
0.6
A
0.5
0.4
1 15 30 45 60 75 90 105 120 135 150
Index
Dari gambar dapat terlihat secara visual bahwa produk A bersifat trend naik.
2. Cek stasioneritas dalam varians
Data yang hendak di forecasting harus stasioner dalam varians dan mean. Untuk melihat
data stasioner dalam varians bisa dilihat dari transformasi box cox menggunakan aplikasi
minitab. Dari transformasi box cox akan diketahui rounded value-nya. Dikatakan stasioner
dalam varians, rounded value nya bernilai 1. Apabila nilainya tidak 1, maka harus
ditransformasi. Berikut merupakan ketentuan transformasinya.
Rounded value Transformasi
2 Y2
0,5 √Y
0 Log Y/ ln Y
-0,5 1/√Y
-1 1/Y
Sebagai contoh bisa dilihat transformasi box cox pada produk A.
Box-Cox Plot of A
Lower CL Upper CL
0.040 Lambda
(using 95.0% confidence)
Lower CL -0.47
Upper CL 2.77
0.038
Rounded Value 1.00
StDev
0.037
0.036
0.035
Limit
0.034
-5.0 -2.5 0.0 2.5 5.0
Lambda
Pada gambar diatas telah terlihat bahwa rounded value sudah bernilai 1 sehingga produk
A telah stasioner dalam varians. Jika data terlihat trend, maka cenderung telah stasioner
dalam varians.
3. Cek stasioneritas dalam mean
Untuk melihat data stasioner dalam mean bisa dilihat dari plot ACF-nya. ACF
(Autocorrelation Function) merupakan nilai yang menunjukkan korelasi antar data dalam
tiap waktu secara kumulatif. Data dikatakan stasioner dalam varians apabila plot ACF
sedikit yang keluar pada batas. Berikut contoh plot ACF pada produk A.
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 10 20 30 40 50 60 70 80 90 100
Lag
Pada gambar diatas terlihat bahwa plot ACF banyak yang keluar batas sehingga dikatakan
bahwa produk A tidak stasioner dalam mean.
Untuk mengatasi hal tersebut, maka data harus di differencing. Differencing merupakan
selisih data pada waktu tertentu. Disini dilakukan differencing dengan lag 1, kemudian
dilakukan pengecekan plot ACF dan didapatkan hasil sebagai berikut.
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 10 20 30 40 50 60 70 80 90 100
Lag
Pada gambar diatas terlihat bahwa plot ACF keluar batas pada waktu tertentu, yaitu pada
waktu ke 7,14,21,28 dan 35 sehingga dikatakan bahwa produk A bersifat seasonal dalam
satuan kelipatan 7 (mingguan). Untuk membuat data stasioner dalam mean, maka harus
dilakukan differencing lagi dengan lag 7 (karena seasonal kelipatan 7) dan dilakukan
pengecekan plot ACF sebagai berikut.
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 10 20 30 40 50 60 70 80 90 100
Lag
Pada gambar sudah terlihat bahwa data produk A sudah stasioner dalam mean
4. Menduga Model
Dalam pendugaan model dilakukan dengan melihat plot ACF dan PACF. Model plot ACF
dan PACF dikategorikan menjadi dua bentuk, yaitu cut off dan dies down. Cut off
merupakan bentuk plot yang turun secara cepat pada lag p sementara dies down merupakan
bentuk plot yang turun secara lambat. Untuk memprediksi model dilakukan dengan
mempertimbangkan bentuk dari plot ACF dan PACF. Berikut merupakan kriteria dari
pendugaan model.
Model ACF PACF
AR(p) Dies down Cut off pada lag p
MA(q) Cut off pada lag q Dies down
ARMA(p,q) Dies down Dies down
AR(p) atau MA(q) Cut off pada lag q Cut off pada lag p
Berikut merupakan contoh dari plot ACF dan PACF dari produk A
Autocorrelation Function for diffS A Partial Autocorrelation Function for diffS A
(with 5% significance limits for the autocorrelations) (with 5% significance limits for the partial autocorrelations)
1.0 1.0
0.8 0.8
0.6 0.6
Partial Autocorrelation
0.4 0.4
Autocorrelation
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 10 20 30 40 50 60 70 80 90 100 1 10 20 30 40 50 60 70 80 90 100
Lag Lag
Terlihat pada gambar diatas, ACF berbentuk dies down sementara PACF berbentuk cut off
sehingga model diduga AR. Untuk menduga model lebih akurat maka dilakukan dengan
mencoba satu-satu model yang terbaik sehingga didapatkan sebagai berikut.
Tipe
Model P-value WN Normalitas Error
Model
AR 1 0,00
AR 2 0,002
AR 3 0,066
ARIMA(3,1,2)(0,1,1)7 Ya Tidak 0,000973
MA 1 0,00
MA 2 0,00
SMA 7 0,00
AR 1 0,00
AR 2 0,032
AR 3 0,002
ARIMA(3,1,0)(1,1,2)7 Ya Tidak 0,000985
SAR 7 0,00
SMA 7 0,00
SMA 14 0,00
Berikut merupakan contoh output pada model ARIMA (3,1,2)(0,0,1)7 dengan bantuan software
Minitab
Final Estimates of Parameters
Lag 12 24 36 48
Chi-Square 9.1 25.1 43.6 49.8
DF 7 19 31 43
P-Value 0.245 0.159 0.067 0.221
60
50
40
30
20
10
5
0.1
-0.10 -0.05 0.00 0.05 0.10 0.15 0.20
RESI24
ARIMA(3,1,0)(1,1,2)7
Aktual Out
No Ramalan (F) Zt-F (Zt-F)^2 abs(Zt-F)/Zt abs(Zt-F)
sample (Zt)
1 0.8521 0.6773 -0.1748 0.0305 0.2580 0.1748
2 0.8486 0.6445 -0.2042 0.0417 0.3168 0.2042
3 0.8540 0.5707 -0.2834 0.0803 0.4965 0.2834
4 0.8460 0.7495 -0.0965 0.0093 0.1287 0.0965
5 0.8255 0.7356 -0.0900 0.0081 0.1223 0.0900
6 0.7739 0.7498 -0.0242 0.0006 0.0322 0.0242
7 0.8683 0.7451 -0.1232 0.0152 0.1654 0.1232
8 0.8770 0.7633 -0.1137 0.0129 0.1489 0.1137
9 0.8731 0.7227 -0.1505 0.0226 0.2082 0.1505
10 0.8779 0.6912 -0.1867 0.0348 0.2700 0.1867
11 0.8701 0.7497 -0.1204 0.0145 0.1606 0.1204
12 0.8501 0.7561 -0.0939 0.0088 0.1242 0.0939
13 0.7984 0.7238 -0.0747 0.0056 0.1031 0.0747
14 0.8941 0.7386 -0.1555 0.0242 0.2106 0.1555
15 0.9049 0.6017 -0.3031 0.0919 0.5037 0.3031
16 0.9004 0.6319 -0.2685 0.0721 0.4248 0.2685
17 0.9035 0.6032 -0.3004 0.0902 0.4980 0.3004
18 0.8958 0.6370 -0.2588 0.0670 0.4063 0.2588
19 0.8771 0.6183 -0.2588 0.0670 0.4185 0.2588
20 0.8256 0.7197 -0.1059 0.0112 0.1472 0.1059
21 0.9261 0.6952 -0.2309 0.0533 0.3321 0.2309
22 0.9437 0.7163 -0.2274 0.0517 0.3175 0.2274
23 0.9370 0.6519 -0.2850 0.0812 0.4372 0.2850
24 0.9346 0.6202 -0.3144 0.0989 0.5070 0.3144
25 0.9275 0.7325 -0.1950 0.0380 0.2662 0.1950
26 0.9130 0.7352 -0.1778 0.0316 0.2419 0.1778
27 0.8621 0.6753 -0.1868 0.0349 0.2766 0.1868
28 0.9793 0.7220 -0.2573 0.0662 0.3563 0.2573
29 1.0210 0.7339 -0.2871 0.0824 0.3912 0.2871
30 1.0064 0.7146 -0.2918 0.0852 0.4084 0.2918
Jumlah 1.3319 8.6785 5.8404
Rata-Rata 0.0444 0.2893 0.1947
RMSE 0.2107
MAPE 28.9285
MAE 0.1947
Dari hasil RMSE diatas model yang memiliki nilai RMSE yang kecil adalah model
ARIMA(3,1,2)(0,1,1)7
6. Hasil forecast 100 periode kedepan
Hasil forecast yang didapatkan dari model ARIMA(3,1,2)(0,1,1)7 adalah sebagai berikut
Periode Forecast Periode Forecast Periode Forecast
1 0.69048 36 0.724561 71 0.71493
2 0.744981 37 0.714707 72 0.724325
3 0.732345 38 0.724547 73 0.714942
4 0.711603 39 0.71472 74 0.724312
5 0.716498 40 0.724534 75 0.714955
6 0.726492 41 0.714734 76 0.724299
7 0.714077 42 0.72452 77 0.714968
8 0.724598 43 0.714747 78 0.724286
9 0.714563 44 0.724507 79 0.714981
10 0.724752 45 0.71476 80 0.724274
11 0.714524 46 0.724494 81 0.714993
12 0.724723 47 0.714773 82 0.724261
13 0.714544 48 0.724481 83 0.715006
14 0.724711 49 0.714787 84 0.724249
15 0.714557 50 0.724467 85 0.715018
16 0.724697 51 0.7148 86 0.724236
17 0.714571 52 0.724454 87 0.715031
18 0.724683 53 0.714813 88 0.724223
19 0.714585 54 0.724441 89 0.715044
20 0.724669 55 0.714826 90 0.724211
21 0.714598 56 0.724428 91 0.715056
22 0.724656 57 0.714839 92 0.724198
23 0.714612 58 0.724415 93 0.715068
24 0.724642 59 0.714852 94 0.724186
25 0.714626 60 0.724402 95 0.715081
26 0.724628 61 0.714865 96 0.724174
27 0.714639 62 0.724389 97 0.715093
28 0.724615 63 0.714878 98 0.724161
29 0.714653 64 0.724376 99 0.715106
30 0.724601 65 0.714891 100 0.724149
31 0.714666 66 0.724363
32 0.724588 67 0.714904
33 0.71468 68 0.72435
34 0.724574 69 0.714917
35 0.714693 70 0.724337
Plot forecast
Time Series Plot for All A
(with forecasts and their 95% confidence limits)
1.75
1.50
1.25
1.00
All A
0.75
0.50
0.25
0.00
PRODUK C
1. Identifikasi pola data dengan time series plot
0.030
0.025
0.020
C
0.015
0.010
Pada gambar diatas terlihat pola data yang terlihat trend menaik.
2. Cek stasioneritas dalam varians
Box-Cox Plot of C
Lower CL Upper CL
0.011 Lambda
(using 95.0% confidence)
0.010
Estimate 2.28
StDev
0.007
0.006
0.005
0.004
Limit
0.003
-5.0 -2.5 0.0 2.5 5.0
Lambda
Pada gambar box cox terlihat bahwa nilai rounded value sebesar 2 sehingga data produk C
harus di transformasi.
3. Cek stasioneritas dalam mean
Untuk melihat stasioneritas dalam mean berikut merupakan ACF dari hasil transformasi
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 10 20 30 40 50 60 70 80 90 100
Lag
Terlihat bahwa plot ACF banyak keluar tetapi pada lag tertentu sehingga terindikasi bahwa
data menyebar secara seasonal, kemudian dilakukan differencing pada lag 7.
Autocorrelation Function for diff S
(with 5% significance limits for the autocorrelations)
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 10 20 30 40 50 60 70 80 90 100
Lag
4. Menduga Model
Autocorrelation Function for diff S Partial Autocorrelation Function for diff S C
(with 5% significance limits for the autocorrelations) (with 5% significance limits for the partial autocorrelations)
1.0 1.0
0.8 0.8
0.6 0.6
Partial Autocorrelation
0.4 0.4
Autocorrelation
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 10 20 30 40 50 60 70 80 90 100 1 10 20 30 40 50 60 70 80 90 100
Lag Lag
Pada gambar terlihat bahwa ACF bersifat dies down dan PACF cut off pada lag ke 1.
Berikut untuk penduga model yang lebih jelas.
Tipe
Model P-value WN Normalitas Error
Model
AR 1 0,000
SAR 7 0,000
ARIMA(1,0,1)(2,1,0)7 ya tidak 0,000
SAR 14 0,004
MA 1 0,018
AR 1 0,001
ARIMA(1,0,0)(2,1,0)7 SAR 7 0,000 ya tidak 0,000
SAR 14 0,000
AR 1 0,000
SAR 7 0,000
ARIMA(2,0,0)(1,1,0)7 SAR 14 0,000 tidak tidak 0,000
MA 1 0,000
MA 2 0,003
Contoh output
Final Estimates of Parameters (tidak normal)
Lag 12 24 36 48
Chi-Square 11.5 26.6 33.2 38.9
DF 8 20 32 44
P-Value 0.174 0.147 0.407 0.689
60
50
40
30
20
10
5
0.1
-0.0004 -0.0002 0.0000 0.0002 0.0004 0.0006
RESI1
ARIMA(1,0,0)(2,1,0)7
Aktual Out (Zt- abs(Zt-
No Ramalan (F) Zt-F abs(Zt-F)/Zt
sample (Zt) F)^2 F)
1 0.01486984 0.023398959 0.0085 0.0001 0.3645 0.0085
2 0.02168756 0.022297565 0.0006 0.0000 0.0274 0.0006
3 0.02003355 0.015246842 -0.0048 0.0000 0.3139 0.0048
4 0.0183653 0.028375179 0.0100 0.0001 0.3528 0.0100
5 0.01991039 0.027319280 0.0074 0.0001 0.2712 0.0074
6 0.01589979 0.026817172 0.0109 0.0001 0.4071 0.0109
7 0.01413685 0.026254926 0.0121 0.0001 0.4616 0.0121
8 0.01155239 0.029170401 0.0176 0.0003 0.6040 0.0176
9 0.01849945 0.025921558 0.0074 0.0001 0.2863 0.0074
10 0.01853877 0.018165964 -0.0004 0.0000 0.0205 0.0004
11 0.01602809 0.027343765 0.0113 0.0001 0.4138 0.0113
12 0.02192738 0.022989551 0.0011 0.0000 0.0462 0.0011
13 0.02117152 0.019850316 -0.0013 0.0000 0.0666 0.0013
14 0.01753898 0.016509051 -0.0010 0.0000 0.0624 0.0010
15 0.01336436 0.007834061 -0.0055 0.0000 0.7059 0.0055
16 0.02245477 0.009412152 -0.0130 0.0002 1.3857 0.0130
17 0.02129173 0.009092294 -0.0122 0.0001 1.3417 0.0122
18 0.01616815 0.011961753 -0.0042 0.0000 0.3517 0.0042
19 0.02159701 0.013605495 -0.0080 0.0001 0.5874 0.0080
20 0.01946027 0.016546057 -0.0029 0.0000 0.1761 0.0029
21 0.01705326 0.021409838 0.0044 0.0000 0.2035 0.0044
22 0.01334638 0.021855942 0.0085 0.0001 0.3893 0.0085
23 0.02053589 0.016761450 -0.0038 0.0000 0.2252 0.0038
24 0.01962712 0.012443549 -0.0072 0.0001 0.5773 0.0072
25 0.01712741 0.024221447 0.0071 0.0001 0.2929 0.0071
26 0.02096719 0.023138385 0.0022 0.0000 0.0938 0.0022
27 0.01852524 0.014194288 -0.0043 0.0000 0.3051 0.0043
28 0.01592054 0.022895469 0.0070 0.0000 0.3046 0.0070
29 0.0125384 0.021983980 0.0094 0.0001 0.4297 0.0094
30 0.02037752 0.019405282 -0.0010 0.0000 0.0501 0.0010
Jumlah 0.0018 11.1183 0.1952
Rata-Rata 0.0001 0.3706 0.0065
RMSE 0.007798
MAPE 37.0611
MAE 0.0065
Plot forecast
0.03
0.02
C All
0.01
0.00
1,6
1,5
1,4
D
1,3
1,2
1,1
1,0
Produk D memiliki trend yang cenderung turun dari waktu ke waktu, namun terdapat titik
outlier pada periode ke-3.
2. Cek stasioneritas dalam varians
Data yang memiliki trend naik ataupun turun akan cenderung stasioner dalam varians
karena tidak terdapat perbedaan dari waktu ke waktu.
3. Cek stasioneritas dalam mean
1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
0,1 0,8
0,6
0,4
Autocorrelation
diff 1
0,0 0,2
0,0
-0,2
-0,1 -0,4
-0,6
-0,8
-0,2
-1,0
Pada time series plot, data yang telah di differencing sebanyak satu kali telah terlihat
stasioner dalam mean. Namun apabila dilihat dari plot ACF, terdeteksi adanya seasonal
tiap periode kelipatan tujuh. Hal tersebut ditandai dengan garis pada lag kelipatan tujuh
yang menurun lambat. Sehingga dilakukan differencing pada lag ke ke-7 dan menghasilkan
plot ACF seperti di bawah ini.
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
Data hasil differencing pada lag ke-7 telah stasioner dalam mean, yang ditandai dengan
selisih garis antara lag kelipatan tujuh telah terpaut cukup jauh.
4. Menduga model
Partial Autocorrelation Function for diff 1 7 Autocorrelation Function for diff 1 7
(with 5% significance limits for the partial autocorrelations) (with 5% significance limits for the autocorrelations)
7 14 21 28 35 42 49 56 63 70 7 14 21 28 35 42 49 56 63 70
1,0 1,0
0,8 0,8
0,6 0,6
Partial Autocorrelation
0,4 0,4
Autocorrelation
0,2 0,2
0,0 0,0
-0,2 -0,2
-0,4 -0,4
-0,6 -0,6
-0,8 -0,8
-1,0 -1,0
1 10 20 30 40 50 60 70 80 90 100 110 120 130 140 1 10 20 30 40 50 60 70 80 90 100 110 120 130 140
Lag Lag
Siginifikansi Berdistribusi
MODEL White Noise Error
Parameter Normal
ARIMA (1,1,0)(1,1,0)7 Ya Tidak Tidak 0,009
ARIMA (1,1,0)(0,1,1)7 Ya Tidak Ya 0,0057
7,5
7,0
6,5
E
6,0
5,5
5,0
1 15 30 45 60 75 90 105 120 135 150
Index
Produk D memiliki pola yang tidak stasioner, serta terdapat titik outlier pada periode ke-3
dan 138.
2. Cek stasioneritas dalam varians
Box-Cox Plot of in
Lower CL
0,40 Lambda
(using 95,0% confidence)
Estimate 3,36
0,39 Lower CL 0,87
Upper CL *
0,37
0,36
Limit
0,35
Rounded value yang bernilai 3 menandakan bahwa produk E tidak stasioner dalam varians.
Maka dari itu, dilakukan transformasi dengan melakukan operasi kubik.
Box-Cox Plot of trans
Lower CL Upper CL
Lambda
90
(using 95,0% confidence)
Estimate 1,12
80 Lower CL 0,26
Upper CL 1,93
60
50
Limit
40
-5,0 -2,5 0,0 2,5 5,0
Lambda
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
Terdapat banyak garis biru pada lag kelipatan tujuh yang melewati batas, sehingga
dilakukan differencing pada lag ke-7 untuk menstasionerkan seasonal.
Time Series Plot of diff 7 Autocorrelation Function for diff 7
(with 5% significance limits for the autocorrelations)
100
7 14 21 28 35 42 49 56 63 70
50 1,0
0,8
0,6
0
0,4
Autocorrelation
diff 7
0,2
-50
0,0
-0,2
-100
-0,4
-0,6
-150
-0,8
-1,0
-200
1 15 30 45 60 75 90 105 120 135 150 1 10 20 30 40 50 60 70 80 90 100 110 120 130 140
Index Lag
Pada time series plot, data yang telah di differencing pada lag ke-7 terlihat seperti tidak
stasioner dalam mean. Namun apabila dilihat dari plot ACF, baik nonseasonal maupun
seasonal telah stasioner dalam mean.
4. Menduga model
Partial Autocorrelation Function for diff 7 Autocorrelation Function for diff 7
(with 5% significance limits for the partial autocorrelations) (with 5% significance limits for the autocorrelations)
7 14 21 28 35 42 49 56 63 70 7 14 21 28 35 42 49 56 63 70
1,0 1,0
0,8 0,8
0,6 0,6
Partial Autocorrelation
0,4 0,4
Autocorrelation
0,2 0,2
0,0 0,0
-0,2 -0,2
-0,4 -0,4
-0,6 -0,6
-0,8 -0,8
-1,0 -1,0
1 10 20 30 40 50 60 70 80 90 100 110 120 130 140 1 10 20 30 40 50 60 70 80 90 100 110 120 130 140
Lag Lag
Siginifikansi Berdistribusi
MODEL White Noise Error
Parameter Normal
ARIMA (2,0,0)(1,1,0)7 Ya Tidak Tidak 1441
ARIMA (0,0,2)(1,1,0)7 Ya Tidak Tidak 1481
ARIMA (0,0,2)(0,1,1)7 Ya Tidak Ya 925
ARIMA (2,0,0)(0,1,1)7 Ya Tidak Tidak 828
HASIL PERPOTONGAN
Chart Title
9.00000
8.00000
7.00000
6.00000
5.00000
4.00000
3.00000
2.00000
1.00000
-
1
11
21
31
41
51
61
71
81
91
201
251
101
111
121
131
141
151
161
171
181
191
211
221
231
241
261
271
281
291
301
311
321
331
Produk A c d e
Setelah dilakukan forecasting hingga 150 periode ke depan, tidak ditemukan adanya titik
perpotongan antara produk A, C, D, dan E. Hal ini dapat disebabkan masih belum tepatnya metode
forecasting yang digunakan. Diperlukan metode lain yang lebih mampu menangani kasus outlier.