Anda di halaman 1dari 24

P

Pengenalan
l

Analisis Deret Waktu


(Time Series Analysis)
MA 2081 Statistika Dasar
29 November 2012
Utriweni Mukhaiyar

Ilustrasi
Berikut adalah data rata-rata curah hujan
bulanan yang diamati dari Stasiun Padaherang
pada tahun 2001 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu Medan Gravitasi

Tahun Jan

Feb

Mar

Apr

Mei

2001 278.59 279.78 355.29 241.34 115.9

Jun

Jul

Agust Sep

Okt

Nop

Des

176.9 55.32 29.08 43.82 313.68 508.49 267.82

2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78

32.4

26.09 169.05 461.62 415.73

2003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.02
2004 547.8 308.2

388

93

297

128

47

87

Apabila
A bil nilai
il i curah
hh
hujan
j saatt ini
i i di
dianggap

105

389

dipengaruhi oleh rata-rata curah hujan kemarin dst,


maka data rata-rata curah hujan di atas dapat
dikategorikan sebagai suatu deret waktu (time series).
series)

371.6

3
@ UM

Plot Data
berdasarkan waktu

Rata-rata curah hujan bulanan 2001 - 2004 di Stasiun


Padaherang
600

nilai curah hujan

500
5
400
300
200
100
0

10

15

20

25

30

waktu (bulan ke-)

35

40

45

P
Proses
Stokastik
St k tik
Proses stokastik adalah barisan peubah acak {Yt , t T }
Setiap proses stokastik memuat ruang keadaan S dan
indeks parameterT
S : semua nilai yang mungkin dari Yt
S danT
d T dapat
d
t bernilai
b
il i diskrit
di k it atau
t kontinu
k ti
Contoh proses stokastik:
g
a. Cuaca harian kota Bandung
b. Banyaknya trombosit/hari pasien demam berdarah
sejak ia terinfeksi
c. Laju pertumbuhan populasi orang utan (% per tahun)
d Waktu antara mekarnya bunga bangkai yang ke-n
d.
ke n
dengan bunga bangkai yang ke n+1
Misal yt nilai dari Yt maka barisan nilai {yt , t T } disebut
realisasi dari {Yt , t T }

Ti
Time
Series
S i

Jika T : waktu, maka {Yt , t T } disebut time series


Realisasinya disebut data TS
Studi berkaitan dengan TS disebut analisis TS
Permasalahan dalam analisis TS :
Bagaimana
Bagaimana menentukan model Yt sehingga model
tersebut dapat digunakan untuk forecasting (prakiraan
di waktu mendatang)??

Secara umum, model TS dapat ditulis


(1)
Yt = f (.) + et
Asumsi galat: et ~ N (0, 2) dan tidak berkorelasi
Jika f linier dalam parameter-parameternya maka
persamaan (1) disebut model linier TS
Koleksi semua model linier TS dinamakan model
ARIMA(p,d,q) (Box-Jenkins, 1976)

C t h Time
Contoh
Ti
Series
S i
Produksi Tembakau di AS

1500
10
000

Miliar pounds
M

6
5

500

4
3
0

20

40

60

80

100

120

1880

1900

1920

Kuartal

1940

1960

1980

Tahun

Data Penjualan lynx pelts di Canada

Ukuran partikel setelah


penyemprotan pengharum ruangan

110

112

114

116

118

20
0000 40000 6000
00 80000

Persen

2000

Tingkat Pengangguran di AS

1850

1860

1870

1880
Tahun

1890

1900

100

200

300
Menit

400

500

Manfaat dan Tujuan TS


Memodelkan
d lk d
data TS sehingga
hi
d
dapat dilih
dilihat
perilaku data lebih lanjut
Melakukan prediksi ke depan atau prakiraan
jangka pendek (short-time forecasting)

Beberapa Konsep Dasar dalam TS


Kestasioneran
TS {Yt , t T
T } stasioner
t i
jik untuk
jika
t k setiap
ti t,
t
1. E[Yt] = (konstan)
2 kov(Yt , Yt k) = k (tidak tergantung t )
2.
Secara visual,
visual data TS {Yt , t T } stasioner
jika data TS berfluktuasi di sekitar rataannya
dengan
g variansi konstan

Beberapa Konsep Dasar dalam TS


ACF fungsi autokorelasi
ACF,

ACF (fungsi autokorelasi) : fungsi antara lag


k dan k dengan,
dengan k = corr (Yt ,Y
Yt k).
)
n
ACF sampel:
(Y Y )(Y Y )

rk t k 1

t k

2
(

)
Y
Y
t
t 1

rk = 0 (secara signifikan) jika


1
1
1,96
1 96
rk 11,96
96
n
n

10

Beberapa Konsep Dasar dalam TS


PACF fungsi parsial autokorelasi
PACF,
PACF (fs. autokorelasi parsial) : fungsi antara lag k
dengan
g kk di mana kk = corr ((Yt , Yt kk) setelah p
pengaruh
g
Y1 , Y2, , Yk-1 ditiadakan.
PACF dapat didefinisikan juga sebagai koefiesien suku
terakhir dari regresi Yt dengan Y1 , Y2, , Yk.
Artinya, jika Yt = +1Yt-1 + 2Yt-2 + + kYt-kk maka PACF
Artinya
sampel untuk lag k = taksiran dari k.
atau kk k
1
1

kk = 0 (secara
(
signifikan)
i ifik ) jika
jik 1,96
1 96
kk 1,96
1 96

11

C t h ACF d
Contoh
dan PACF d
dengan
g SPSS
number of blowfly
8000
Coefficient

1.0

Upper Confidence Limit

0.5

6000

ACF

numb
ber of blowfly

Lower Confidence
Limit

0.0

4000
-0.5

-1.0

2000

10

11

12

13

14

15

16

Lag Number

number of blowfly

1 3 5 7 9 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8
1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1

Sequence number

Coefficient

1.0

Upper Confidence Limit


Lower Confidence
Limit

0.5

Partial ACF

Dari menu SPSS, pilih


p
Graphs
Time Series
Autocorrelations...
pilih variabel yang akan
dihit
dihitung
ACF dan
d PACF-nya
PACF
OK

0.0

-0.5

-1.0
1

10

Lag Number

11

12

13

14

15

16

12

Model-model
Model
model Time Series
Untuk TS Stasioner

1. Autoregresi (AR) : regresi terhadap TS yg lalu & galat


sekarang
sekarang
AR(1): Yt = +1Yt-1 +et , di mana 1<1<1
AR(2): Yt = +1Yt-1 + 2Yt-2 + et ,
di mana 1<2<1, 2+1<1, 2-1<1
AR(p): Yt = +1Yt-1 + 2Yt-2 + + pYt-p + et
2. Moving Average (MA) : regresi terhadap galat yang lalu
dan galat sekarang
MA(1): Yt = + et 1et -1 , di mana 1<1<1
MA(2): Yt = + et 1et -1 2et -2
di mana 1<2<1, 2+1<1, 2-1<1
(q) Yt = + et 1et-1
MA(q):
t 1 2et -2
2 - qet q
q

13

Model-model Time Series


Untuk TS Stasioner

3. Autoregresi-Moving Average (ARMA)


regresi
g
terhadap
p TS yyang
g lalu dan semua g
galat
ARMA(1,1): Yt = +1 Yt-1 +et 1et -1
ARMA(p,q):
Zt = +(1 Yt-1 + + p Yt-p ) +(et 1et -1 qet -q )
Catatan: AR(p) = ARMA(p,0), MA(q) = ARMA(0,q)

14

Model-model Time Series


Untuk TS tidak Stasioner

Misal TS {Yt } tidak stasioner.


Buat TS baru yg stasioner,
stasioner sebut {Zt } dengan cara
diferensi, yaitu Zt = Yt Yt-1, untuk setiap t.
Maka
ARMA(p,q) untuk {Zt} disebut ARIMA (p,1,q) untuk
{Zt }
Jika diferensi dilakukan d kali, ditulis ARIMA(p,d,q)
Catatan: ARMA(p,q) = ARIMA (p,0,q)

15

Metode Box Jenkins


Tahap awal:
Pemeriksaan kestasioneran:
- Plot TS
- Jika stasioner, lanjutkan ke tiga tahap iteratif.
Jika tidak lakukan transformasi atau diferensi
Tiga tahap iteratif :
1. Identifikasi
2 Penaksiran parameter
2.
3. Uji diagnostik (pemeriksaan asumsi sisa)
Jika pada uji diagnostik, ada asumsi yang dilanggar
ulangi
l
i lagi
l i 3 tahap
t h iteratif
it
tif

16

Id tifik i
Identifikasi
Model

ACF

PACF

AR(p)

Menurun secara
Cut off setelah lag p
eksponensial atau
membentuk gelombang sinus
teredam

MA(q)

Cut off setelah lag q

Menurun secara
eksponensial atau
membentuk gelombang sinus
teredam

Mengidentifikasi orde (p,q) model ARMA melalui kriteria


Akaike (AIC)
AIC n log

+ 2m ,

m = # parameter

Hitung nilai AIC untuk setiap (p,q). Orde yang dipilih adalah
(p,q) dengan nilai AIC yang paling kecil

17

P
Penaksiran
k i
P
Parameter
t
Metode: - Kuadrat terkecil (untuk model AR)
- Maksimum
M k i
lik lih d
likelihood
- Melard (digunakan SPSS)
C
Contoh
h penaksiran
k i
parameter melalui
l l i SPSS
Dari menu, pilih Analyze Forecasting Create Models ...
Pilih nama TS sebagai Dependent variable
Masukkan orde model ARIMA

18

Uji Diagnosis
Di g i
Ingat asumsi galat: et ~ N (0,2) dan tidak berkorelasi
Pengujian asumsi:
Cara 1:
Plot sisaan
berfluktuasi di sekitar 0 E[et ] = 0
2
nilai sisaan di sekitar 1,96 Var(et) = 2
plot ACF serta plot PACF-nya
rk dan kk signifikan
g
0 sisaan tidak berkorelasi
Cara 2: Uji Ljung-Box
Uji H0: korelasi antar sisaan = 0 dengan statistik Ljung-Box
2
r
Q* n(n 2) k
k 1 n k
h

Jika Q * > 2, dengan = h m dan m = # parameter, maka H0


ditolak

19

Contoh
Hasil produksi bulanan perkebunan teh di lokasi
PAL tahun 1992-2009
1992 2009 (T = 216)
300000

Produksi teh "PAL" 19922009


diferensi 1 kali

250000

150000

200000

100000
produksi te
eh

produ
uksi teh

Produksi teh "PAL" 19922009

150000
100000
50000
0

50000
0
0

50

100

-50000
0

50

100
bulan ke-

150

200
-100000

bulan ke-

150

200

20

Contoh
Sari Numerik Data
DataperkebunantehPAL
Mean
StandardError
Median
Mode
StandardDeviation
p
SampleVariance
Kurtosis
Skewness
Range
Mi i
Minimum
Maximum
Sum
Count

133793.6
2488.531
136781
#N/A
36573.79
1.34E+09
0.222436
0.07241
218458
36305
254763
28899412
216

Data perkebunan teh PAL (diff 1 kali)


DataperkebunantehPAL(diff1kali)
Mean
StandardError
Median
Mode
StandardDeviation
Sample Variance
SampleVariance
Kurtosis
Skewness
Range
Mi i
Minimum
Maximum
Sum
Count

455.7023
2407.674
1515
15033
35303.43
1.25E+09
1.25E
09
1.855309
0.701741
216395
81536
81536
134859
97976
215

21

Contoh
Identifikasi

ACF menurun
seperti gelombang
sinus teredam
sedangkan PACF cut
off setelah lag-1.
Model yang
mungkin adalah
AR(1)

ACF cut off setelah


lag-1 sedangkan
PACF juga seperti
cut off setelah lag-1.
lag 1
Ada beberapa
model yang
mungkin, seperti
ARIMA(1,1,1)
( , , )

Contoh
AR (1)

Penaksiran dan Uji Diagnostik

ARIMA (11,1,1)

Diperoleh AR(1) : Yt 134113, 420 0,535Yt 1 et

2
2 Diperoleh ARIMA(1,1,1) :

Z t 19, 205 0, 434 Z t 1 0,934et 1 et

23

Contoh
Kesimpulan

Berdasarkan hasil Ljung-Box, dimana pada model


AR(1) H0 ditolak (sisaan berkorelasi) untuk semua
1% 10%, sedangkan ARIMA(1,1,1) tidak ditolak
untuk <1,7%.
Oleh
Ol h karena
k
it
itu model
d l ARIMA(
ARIMA(1,1,1)) bisa
bi dianggap
di
lebih cocok (dengan sisaan yang tidak berkorelasi)
sehingga dapat digunakan untuk melakukan shortti
time
fforecastt dengan
d
menggunakan
k persamaan :

Z t 19,, 205 0,, 434 Z t 1 0,934


,
et 1 et

Yt 1 Yt 19, 205 0, 434(Yt Yt 1 ) 0,934et 1

Yt 1 19,
19 205 11, 434Yt 00, 434Yt 1 00,934
934et 1

Referensi

Box, G.
B
G E.
E P.
P dan
d Jenkins,
J ki
G
G. M
M. (1976):
(
) Time
Ti
S
Series
i
Analysis: Forecasting & Control, Holden-Day Inc.,
San Fransisco
Cryer, J. D. dan Chan, K. S. (2008): Time Series
Analysis with Applications in R, Springer, New York.

24