Peramalan Data Menggunakan Metode SARIMA (Seasonal Autoregressive Integrated Moving Average)
Peramalan Data Menggunakan Metode SARIMA (Seasonal Autoregressive Integrated Moving Average)
Oleh :
Rauzan Sumara
135090501111014
Plotting Data
Pada Plot data diatas terlihat bahwa terdapat pola musiman pada data jumlah produksi coklat
(satuan ton) oleh suatu perusahaan coklat di Australia mulai bulan Juli tahun 1957 sampai bulan
Agustus tahun 1995. Produksi coklat dari Juli tahun 1957 sampai tahun 1987 cendrung naik
turun secara stabil, tetapi mulai tahun 1986 sampai tahun 1995 terjadi lonjakan atau
peningkatan produksi coklat yang diakibatkan oleh meningkatnya jumlah penduduk yang
berimplikasi pada jumlah permintaan coklat setiap bulannya.
Untuk lebih jelasnya dapat dilakukan dekomposisi, yaitu memisahkan unsur random, trend,
dan unsur musiman pada data. maka dapat dilihat bahwa variasi random akan membesar seiring
besarnya trend pada data. Karena adanya trend, ini mengindikasikan bahwa data belum
stasioner.
Uji Stasioneritas
10000
5000
Limit
0
-5.0 -2.5 0.0 2.5 5.0
λ
Nilai lambda yang baik Lower CL dan Upper CL 0.60 sampai 0.99 dimana nilai
lambda yang terbaik yaitu 0.79 dan "Rounded Value" yaitu 0.79. Sehingga transformasi
.
yang dilakukan yaitu 𝑌𝑡 .
Box-Cox Plot of C2
Lower CL Upper CL
1000 λ
(using 95.0% confidence)
Estimate 1.00
800 Lower CL 0.76
Upper CL 1.22
400
200
Limit
0
-5.0 -2.5 0.0 2.5 5.0
λ
Setelah dilakukan transformasi satu kali, didapat "Rounded Value" sebesar 1, Sehingga dapat
dikatakan bahwa data sudah stasioner terhadap ragam. Adapun plot data setelah dilakukan
transformasi Box-Cox sebagai berikut :
1400
1200
1000
C2
800
600
400
200
Year 1957 1963 1969 1975 1981 1987 1993
Pengaruh transformasi Box-Cox yang telah dilakukan berakibat pada besaran data menjadi
lebih kecil serta fluktuasi data yang tidak terlalu besar daripada sebelumnya.
2. Stasioner Terhadap Rata-rata
Untuk mengetahui apakah data sudah stasioner terhadap rata-rata adalah dengan menampilkan plot
nilai ACF (Autocorrelation Function) dan PACF (Partial Autocorrelation Function). Adapun plot
ACF sebagai berikut :
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35
Lag
Dari Correlogram, nilai ACF pada lag ke-1 sampai lag ke-5 turun lambat eksponensial yang
menunjukan data belum stasioner pada unsur trend. sedangkan nilai ACF pada lag
selebihnya menunjukan unsur musiman yang belum stasioner pula, sehingga perlu
dilakukan differensiasi untuk unsur trend dan musiman.
d=1
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35
Lag
Plot data setelah dilakukan differensiasi (d=1) :
500
250
C3
-250
-500
Setelah dilakukan differensiasi (d=1), terlihat bahwa nilai ACF cut of pada lag ke-3 sehingga
data sudah stasioner dalam trend. Selanjutnya dilakukan differensiasi untuk unsur musiman
(D=1).
D=1
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50
Lag
Plot data setelah dilakukan differensiasi (D=1) :
300
200
100
0
C4
-100
-200
-300
-400
-500
Year 1957 1963 1969 1975 1981 1987 1993
Setelah dilakukan differensiasi (D=1), dapat dilihat bahwa sudah tidak terdapat pola
musiman pada data sehingga dapat disimpulkan data sudah stasioner dalam musiman.
Penentuan Model
Untuk menentukan kandidat model yang akan diajukan sebagai model terbaik, dapat di
tentukan melalui correlogram, yaitu ACF untuk ordo MA(q) SMA(Q) s dan PACF untuk ordo
AR(p) SAR(P)s .
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50
Lag
Partial Autocorrelation Function for C4
(with 5% significance limits for the partial autocorrelations)
1.0
0.8
0.6
Partial Autocorrelation
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50
Lag
Plot ACF dan PACF data yang sudah stasioner menunjukkan bahwa pada lag‐lag nonmusiman
(lag 1‐10) ACF cut off pada lag ke-1 dan PACF cenderung dies down. Hal ini juga terjadi pada
lag‐lag musiman (lag 12, 24, 36) ACF cenderung cut off dan PACF cenderung dies down.
Berdasarkan petunjuk pada plot ACF dan PACF diatas, diduga ada 2 (dua) model yang
sesuaiuntuk data ini, yaitu :
SARIMA(0,1,1)(1,1,0)12
SARIMA(0,1,1)(0,1,1)12
SARIMA(0,1,1)(1,1,0)12
Pada estimasi parameter untuk model SARIMA(0,1,1)(0,1,1) 12, terlihat bahwa semua
parameter signifikan, sehingga model SARIMA(0,1,1)(0,1,1) 12 dapat digunakan.
(1 − 𝐵)(1 − 𝐵 )𝑌 = (1 − 𝜃𝐵)(1 − 𝛳𝐵 )𝑒
𝑌 =𝑌 +𝑌 −𝑌 + 𝑒 − 𝜃𝑒 − 𝛳𝑒 + 𝜃𝛳𝑒
.
Karena tadi dilakukan transformasi 𝑌 , maka dikembalikan ke nilai awal 𝑌 sebagai berikut:
. / .
𝑌 = 𝑌𝑡
𝑌 =𝑌 +𝑌 −𝑌 + 𝑒 − 0.7953𝑒 − 0.6825𝑒 + 0.5111𝑒
Diagnostik Model
Model dikatan baik untuk peramalan jika memenuhi kriteria sebagai berikut :
Sisaan menyebar normal
Sisaan bersifat White Noise
Tidak terjadi autokorelasi antar sisaan
1. Uji Normalitas Sisaan
Histogram
(response is C2)
90
80
70
60
Frequency
50
40
30
20
10
0
-225 -150 -75 0 75 150 225 300
Residual
60
50
40
30
20
10
5
0.1
-300 -200 -100 0 100 200 300 400
RESI1
Dari hasil pengujian diatas didapatkan nilai P-Value < 0.05, maka keputusan tolak H 0.
Jadi dengan taraf nyata 5% dapat disimpulkan bahwa sisaan tidak menyebar normal.
2. ACF dan PACF Sisaan
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 6 12 18 24 30 36 42 48 54 60 66
Lag
1.0
0.8
0.6
Partial Autocorrelation
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 6 12 18 24 30 36 42 48 54 60 66
Lag
Akibat dari sisaan yang tidak menyebar normal, maka berdampak pada asumsi
lainnya yaitu sisaan tidak bersifat white noise. Hal ini dapat diakibatkan oleh adanya
pencilan pada data.