Anda di halaman 1dari 15

ANALISIS DERET WAKTU

Peramalan Data Menggunakan Metode SARIMA (Seasonal Autoregressive


Integrated Moving Average)

Oleh :
Rauzan Sumara
135090501111014

PROGRAM STUDI STATISTIKA


JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
2016
Berikut ini merupakan data sekunder yang diambil dari datamarket (http://datamarket.com)
pada tanggal 12 Desember 2015. Yaitu data mengenai Jumlah produksi coklat (satuan ton) oleh
suatu perusahaan coklat di Australia mulai bulan Juli tahun 1957 sampai bulan Agustus tahun
1995. Karena data ini merupakan data deret waktu periode bulanan, maka ingin dilakukan
peramalan menggunakan Metode SARIMA (Seasonal Autoregressive Integrated Moving
Average).

MONTH CHOCOLATE MONTH CHOCOLATE MONTH CHOCOLATE MONTH CHOCOLATE

1957-07 2953 1967-03 4227 1976-11 4373 1986-07 8379


1957-08 2635 1967-04 4595 1976-12 3941 1986-08 6914
1957-09 2404 1967-05 5702 1977-01 2334 1986-09 6919
1957-10 2413 1967-06 4681 1977-02 4381 1986-10 7265
1957-11 2136 1967-07 4395 1977-03 5665 1986-11 6994
1957-12 1565 1967-08 4459 1977-04 4393 1986-12 5503
1958-01 1451 1967-09 4191 1977-05 5232 1987-01 3782
1958-02 2037 1967-10 3742 1977-06 5876 1987-02 7502
1958-03 2477 1967-11 3279 1977-07 5900 1987-03 8119
1958-04 2785 1967-12 2468 1977-08 5704 1987-04 7292
1958-05 2994 1968-01 1742 1977-09 4718 1987-05 6886
1958-06 2681 1968-02 3366 1977-10 4650 1987-06 7049
1958-07 3098 1968-03 3633 1977-11 4446 1987-07 7977
1958-08 2708 1968-04 3701 1977-12 3061 1987-08 8519
1958-09 2517 1968-05 4926 1978-01 2155 1987-09 6680
1958-10 2445 1968-06 4522 1978-02 4274 1987-10 7994
1958-11 2087 1968-07 5275 1978-03 4695 1987-11 7047
1958-12 1801 1968-08 4717 1978-04 4362 1987-12 5782
1959-01 1216 1968-09 4114 1978-05 4889 1988-01 3771
1959-02 2173 1968-10 3851 1978-06 5370 1988-02 7906
1959-03 2286 1968-11 3493 1978-07 5072 1988-03 8970
1959-04 3121 1968-12 2654 1978-08 4985 1988-04 6077
1959-05 3458 1969-01 2168 1978-09 3978 1988-05 7919
1959-06 3511 1969-02 3561 1978-10 4139 1988-06 7340
1959-07 3524 1969-03 4305 1978-11 3995 1988-07 7807
1959-08 2767 1969-04 4413 1978-12 3025 1988-08 7382
1959-09 2744 1969-05 5307 1979-01 1949 1988-09 8269
1959-10 2603 1969-06 5361 1979-02 4357 1988-10 7820
1959-11 2527 1969-07 4948 1979-03 4638 1988-11 7483
1959-12 1846 1969-08 4472 1979-04 3994 1988-12 6700
1960-01 1066 1969-09 3846 1979-05 6174 1989-01 4487
1960-02 2327 1969-10 3715 1979-06 5656 1989-02 8288
1960-03 3066 1969-11 3343 1979-07 4411 1989-03 8872
1960-04 3048 1969-12 2939 1979-08 5504 1989-04 8580
1960-05 3806 1970-01 1615 1979-09 4463 1989-05 9185
1960-06 4042 1970-02 3497 1979-10 4458 1989-06 8651
1960-07 3583 1970-03 3915 1979-11 4528 1989-07 8394
1960-08 3438 1970-04 4858 1979-12 2830 1989-08 9709
1960-09 2957 1970-05 4962 1980-01 1843 1989-09 7123
1960-10 2885 1970-06 4504 1980-02 5042 1989-10 9226
1960-11 2744 1970-07 4767 1980-03 5348 1989-11 8336
1960-12 1837 1970-08 4291 1980-04 5257 1989-12 7161
1961-01 1447 1970-09 4091 1980-05 6699 1990-01 3878
1961-02 2504 1970-10 4164 1980-06 5388 1990-02 7314
1961-03 3248 1970-11 3915 1980-07 6001 1990-03 8753
1961-04 3098 1970-12 3130 1980-08 5966 1990-04 7721
1961-05 4318 1971-01 1696 1980-09 4845 1990-05 8964
1961-06 3561 1971-02 3887 1980-10 4507 1990-06 7355
1961-07 3316 1971-03 4749 1980-11 4214 1990-07 7645
1961-08 3379 1971-04 4781 1980-12 3460 1990-08 8853
1961-09 2717 1971-05 5089 1981-01 1833 1990-09 8536
1961-10 2354 1971-06 5484 1981-02 4978 1990-10 9212
1961-11 2445 1971-07 5072 1981-03 6464 1990-11 8503
1961-12 1542 1971-08 4611 1981-04 5820 1990-12 7170
1962-01 1606 1971-09 4117 1981-05 6447 1991-01 3259
1962-02 2590 1971-10 3910 1981-06 6191 1991-02 8569
1962-03 3588 1971-11 4252 1981-07 6628 1991-03 9340
1962-04 3202 1971-12 3624 1981-08 5452 1991-04 7251
1962-05 4704 1972-01 1678 1981-09 5295 1991-05 8077
1962-06 4005 1972-02 3851 1981-10 5080 1991-06 8213
1962-07 3810 1972-03 5021 1981-11 5564 1991-07 8093
1962-08 3488 1972-04 4581 1981-12 3965 1991-08 10045
1962-09 2781 1972-05 6195 1982-01 2062 1991-09 7881
1962-10 2944 1972-06 5338 1982-02 5099 1991-10 8409
1962-11 2817 1972-07 4909 1982-03 6162 1991-11 8162
1962-12 1960 1972-08 4640 1982-04 5529 1991-12 8086
1963-01 1937 1972-09 3706 1982-05 6416 1992-01 4534
1963-02 2903 1972-10 4113 1982-06 6382 1992-02 7356
1963-03 3357 1972-11 3879 1982-07 5624 1992-03 8709
1963-04 3552 1972-12 3411 1982-08 5785 1992-04 8191
1963-05 4581 1973-01 2043 1982-09 4644 1992-05 8279
1963-06 3905 1973-02 3736 1982-10 5331 1992-06 8064
1963-07 4581 1973-03 4490 1982-11 5143 1992-07 9873
1963-08 4037 1973-04 3715 1982-12 4596 1992-08 9655
1963-09 3345 1973-05 5623 1983-01 2180 1992-09 9189
1963-10 3175 1973-06 4671 1983-02 5786 1992-10 9149
1963-11 2808 1973-07 5591 1983-03 5840 1992-11 8909
1963-12 2050 1973-08 5461 1983-04 5666 1992-12 8080
1964-01 1719 1973-09 4795 1983-05 6360 1993-01 5004
1964-02 3143 1973-10 4846 1983-06 6219 1993-02 8502
1964-03 3756 1973-11 4843 1983-07 6082 1993-03 9462
1964-04 4776 1973-12 3278 1983-08 5653 1993-04 8173
1964-05 4540 1974-01 2411 1983-09 5726 1993-05 9193
1964-06 4309 1974-02 4278 1983-10 5049 1993-06 9211
1964-07 4563 1974-03 4639 1983-11 5859 1993-07 8713
1964-08 3506 1974-04 4559 1983-12 4091 1993-08 10643
1964-09 3665 1974-05 6404 1984-01 2167 1993-09 9304
1964-10 3361 1974-06 4851 1984-02 6480 1993-10 10379
1964-11 3094 1974-07 6480 1984-03 7375 1993-11 10504
1964-12 2440 1974-08 6394 1984-04 6583 1993-12 9547
1965-01 1633 1974-09 5752 1984-05 7251 1994-01 8390
1965-02 2935 1974-10 4718 1984-06 6730 1994-02 9405
1965-03 4159 1974-11 4659 1984-07 6428 1994-03 9561
1965-04 4159 1974-12 3842 1984-08 5228 1994-04 7417
1965-05 4894 1975-01 2873 1984-09 4716 1994-05 8621
1965-06 4921 1975-02 5556 1984-10 6101 1994-06 9145
1965-07 4577 1975-03 5389 1984-11 5753 1994-07 8858
1965-08 4155 1975-04 6135 1984-12 4000 1994-08 10748
1965-09 3851 1975-05 6707 1985-01 2691 1994-09 10552
1965-10 3429 1975-06 5220 1985-02 5898 1994-10 9827
1965-11 3370 1975-07 6249 1985-03 6526 1994-11 10402
1965-12 2726 1975-08 5281 1985-04 5840 1994-12 9503
1966-01 1674 1975-09 4192 1985-05 6650 1995-01 5853
1966-02 3257 1975-10 4867 1985-06 5717 1995-02 9334
1966-03 4731 1975-11 3752 1985-07 7236 1995-03 9875
1966-04 4481 1975-12 3492 1985-08 6523 1995-04 6495
1966-05 5443 1976-01 1979 1985-09 5729 1995-05 8668
1966-06 5566 1976-02 4584 1985-10 6004 1995-06 9685
1966-07 5044 1976-03 5139 1985-11 5950 1995-07 10109
1966-08 4781 1976-04 5044 1985-12 4690 1995-08 11095
1966-09 4014 1976-05 5501 1986-01 3687
1966-10 3561 1976-06 5044 1986-02 7791
1966-11 3801 1976-07 5035 1986-03 7153
1966-12 2685 1976-08 5167 1986-04 6434
1967-01 1805 1976-09 4650 1986-05 7850
1967-02 3756 1976-10 5298 1986-06 6809

Model Seasonal Autoregresif Integrated Moving Average (SARIMA) merupakan salah


satu model yang digunakan untuk mengatasi pola musiman pada data time series. Motode ini
dipopulerkan oleh George Box dan Gwilym Jenskins. Model ini telah banyak dipejari secara
luas dan mengadopsi salah satu model yaitu ARIMA model.
Berikut langkah-langkah penentuan model SARIMA menggunakan data Jumlah
produksi coklat (satuan ton) oleh suatu perusahaan coklat di Australia mulai bulan Juli tahun
1957 sampai bulan Agustus tahun 1995 :

Plotting Data

Pada Plot data diatas terlihat bahwa terdapat pola musiman pada data jumlah produksi coklat
(satuan ton) oleh suatu perusahaan coklat di Australia mulai bulan Juli tahun 1957 sampai bulan
Agustus tahun 1995. Produksi coklat dari Juli tahun 1957 sampai tahun 1987 cendrung naik
turun secara stabil, tetapi mulai tahun 1986 sampai tahun 1995 terjadi lonjakan atau
peningkatan produksi coklat yang diakibatkan oleh meningkatnya jumlah penduduk yang
berimplikasi pada jumlah permintaan coklat setiap bulannya.
Untuk lebih jelasnya dapat dilakukan dekomposisi, yaitu memisahkan unsur random, trend,
dan unsur musiman pada data. maka dapat dilihat bahwa variasi random akan membesar seiring
besarnya trend pada data. Karena adanya trend, ini mengindikasikan bahwa data belum
stasioner.

Uji Stasioneritas

1. Stasioner Terhadap Ragam


Untuk menstasionerkan data terhadap ragam, dapat digunakan Metode transformasi Box-
Cox. Data dikatakan stasioner apabila rounded value bernilai 1. Adapaun proses transformasi
sebagai berikut :
Box-Cox Plot of Chocolate
Lower CL Upper CL
λ
20000
(using 95.0% confidence)
Estimate 0.79
Lower CL 0.60
15000 Upper CL 0.99

Rounded Value 0.79


StDev

10000

5000

Limit
0
-5.0 -2.5 0.0 2.5 5.0
λ

Dari plot tersebut dapat diketahui bahwa :


Estimate (λ) = 0.79
Rounded value = 0.79
Karena nilai Rounded value ≠ 1 maka dapat dikatakan bahwa data tersebut tidak
stasioner terhadap ragam, sehingga perlu dilakukan transformasi data. Pada tampilan chart
sebelah kiri menunjukkan hubungan antara lambda dan standar deviasi. lambda yang
dicoba dari 5 sampai -5. Terlihat pada gambar nilai standar deviasi semakin kecil berada
pada Lower CL dan Upper CL yang berupa garis vertikal. batas itulah yang
menunjukkan bahwa lambda yang terbaik berada pada garis tersebut karena nilai
standar deviasi yang kecil.

Nilai lambda yang baik Lower CL dan Upper CL 0.60 sampai 0.99 dimana nilai
lambda yang terbaik yaitu 0.79 dan "Rounded Value" yaitu 0.79. Sehingga transformasi
.
yang dilakukan yaitu 𝑌𝑡 .
Box-Cox Plot of C2
Lower CL Upper CL

1000 λ
(using 95.0% confidence)
Estimate 1.00
800 Lower CL 0.76
Upper CL 1.22

Rounded Value 1.00


600
StDev

400

200

Limit

0
-5.0 -2.5 0.0 2.5 5.0
λ

Setelah dilakukan transformasi satu kali, didapat "Rounded Value" sebesar 1, Sehingga dapat
dikatakan bahwa data sudah stasioner terhadap ragam. Adapun plot data setelah dilakukan
transformasi Box-Cox sebagai berikut :

Time Series Plot of C2


1600

1400

1200

1000
C2

800

600

400

200
Year 1957 1963 1969 1975 1981 1987 1993

Pengaruh transformasi Box-Cox yang telah dilakukan berakibat pada besaran data menjadi
lebih kecil serta fluktuasi data yang tidak terlalu besar daripada sebelumnya.
2. Stasioner Terhadap Rata-rata
Untuk mengetahui apakah data sudah stasioner terhadap rata-rata adalah dengan menampilkan plot
nilai ACF (Autocorrelation Function) dan PACF (Partial Autocorrelation Function). Adapun plot
ACF sebagai berikut :

Autocorrelation Function for _Chocolate


(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35
Lag

Dari Correlogram, nilai ACF pada lag ke-1 sampai lag ke-5 turun lambat eksponensial yang
menunjukan data belum stasioner pada unsur trend. sedangkan nilai ACF pada lag
selebihnya menunjukan unsur musiman yang belum stasioner pula, sehingga perlu
dilakukan differensiasi untuk unsur trend dan musiman.
d=1

Autocorrelation Function for C3


(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35
Lag
Plot data setelah dilakukan differensiasi (d=1) :

Time Series Plot of C3


750

500

250
C3

-250

-500

Year 1957 1963 1969 1975 1981 1987 1993

Setelah dilakukan differensiasi (d=1), terlihat bahwa nilai ACF cut of pada lag ke-3 sehingga
data sudah stasioner dalam trend. Selanjutnya dilakukan differensiasi untuk unsur musiman
(D=1).
D=1

Autocorrelation Function for C4


(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50
Lag
Plot data setelah dilakukan differensiasi (D=1) :

Time Series Plot of C4


400

300

200

100

0
C4

-100

-200

-300

-400

-500
Year 1957 1963 1969 1975 1981 1987 1993

Setelah dilakukan differensiasi (D=1), dapat dilihat bahwa sudah tidak terdapat pola
musiman pada data sehingga dapat disimpulkan data sudah stasioner dalam musiman.

Penentuan Model
Untuk menentukan kandidat model yang akan diajukan sebagai model terbaik, dapat di
tentukan melalui correlogram, yaitu ACF untuk ordo MA(q) SMA(Q) s dan PACF untuk ordo
AR(p) SAR(P)s .

Autocorrelation Function for C4


(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50
Lag
Partial Autocorrelation Function for C4
(with 5% significance limits for the partial autocorrelations)

1.0

0.8

0.6
Partial Autocorrelation
0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50
Lag

Plot ACF dan PACF data yang sudah stasioner menunjukkan bahwa pada lag‐lag nonmusiman
(lag 1‐10) ACF cut off pada lag ke-1 dan PACF cenderung dies down. Hal ini juga terjadi pada
lag‐lag musiman (lag 12, 24, 36) ACF cenderung cut off dan PACF cenderung dies down.
Berdasarkan petunjuk pada plot ACF dan PACF diatas, diduga ada 2 (dua) model yang
sesuaiuntuk data ini, yaitu :

 SARIMA(0,1,1)(1,1,0)12
 SARIMA(0,1,1)(0,1,1)12
SARIMA(0,1,1)(1,1,0)12

Pada estimasi parameter untuk model SARIMA(0,1,1)(1,1,0)12 , terlihat bahwa semua


parameter signifikan, sehingga model SARIMA(0,1,1)(1,1,0) 12 layak.
SARIMA(0,1,1)(0,1,1)12

Pada estimasi parameter untuk model SARIMA(0,1,1)(0,1,1) 12, terlihat bahwa semua
parameter signifikan, sehingga model SARIMA(0,1,1)(0,1,1) 12 dapat digunakan.

Perbandingan Kedua Model :

Kriteria SARIMA(0,1,1)(1,1,0)12 SARIMA(0,1,1)(0,1,1)12


SSE 2371445 2098848
MSE 5353 4037
Karena model SARIMA(0,1,1)(0,1,1)12 memiliki MSE terkecil, makan ditetapkan model
SARIMA(0,1,1)(0,1,1)12 sebagai model terbaik.

(1 − 𝐵)(1 − 𝐵 )𝑌 = (1 − 𝜃𝐵)(1 − 𝛳𝐵 )𝑒
𝑌 =𝑌 +𝑌 −𝑌 + 𝑒 − 𝜃𝑒 − 𝛳𝑒 + 𝜃𝛳𝑒
.
Karena tadi dilakukan transformasi 𝑌 , maka dikembalikan ke nilai awal 𝑌 sebagai berikut:
. / .
𝑌 = 𝑌𝑡
𝑌 =𝑌 +𝑌 −𝑌 + 𝑒 − 0.7953𝑒 − 0.6825𝑒 + 0.5111𝑒

Diagnostik Model
Model dikatan baik untuk peramalan jika memenuhi kriteria sebagai berikut :
 Sisaan menyebar normal
 Sisaan bersifat White Noise
 Tidak terjadi autokorelasi antar sisaan
1. Uji Normalitas Sisaan

Histogram
(response is C2)
90

80

70

60
Frequency

50

40

30

20

10

0
-225 -150 -75 0 75 150 225 300
Residual

Probability Plot of RESI1


Normal
99.9
Mean 0.5111
StDev 68.75
99
N 445
RJ 0.989
95 P-Value <0.010
90
80
70
Percent

60
50
40
30
20
10
5

0.1
-300 -200 -100 0 100 200 300 400
RESI1

H0 : Sisaan menyebar Normal


H1 : Sisaan tidak menyebar Normal

Dari hasil pengujian diatas didapatkan nilai P-Value < 0.05, maka keputusan tolak H 0.
Jadi dengan taraf nyata 5% dapat disimpulkan bahwa sisaan tidak menyebar normal.
2. ACF dan PACF Sisaan

ACF of Residuals for C2


(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 6 12 18 24 30 36 42 48 54 60 66
Lag

PACF of Residuals for C2


(with 5% significance limits for the partial autocorrelations)

1.0

0.8

0.6
Partial Autocorrelation

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 6 12 18 24 30 36 42 48 54 60 66
Lag

Akibat dari sisaan yang tidak menyebar normal, maka berdampak pada asumsi
lainnya yaitu sisaan tidak bersifat white noise. Hal ini dapat diakibatkan oleh adanya
pencilan pada data.

Anda mungkin juga menyukai