Analisis Deret Waktu Statdas 30.04.121 PDF

Anda mungkin juga menyukai

Anda di halaman 1dari 24

Pengenalan

Analisis Deret Waktu


((Time Series Analysis)
y )

MA 2081 Statistika Dasar


30 April 2012
Utriweni Mukhaiyar
Ilustrasi
 Berikut adalah data rata-rata curah hujan bulanan yang
diamati dari Stasiun Padaherang pada tahun 2001 – 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tahun
a u Ja
Jan Feb
eb Mar
a Apr
p Meie Ju
Jun Jul Agust
Ju gust Sep O Oktt Nopop Des es
2001 278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.73
2003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.02
2004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6

 Apabila
p nilai curah hujan
j saat ini dianggap
gg p dipengaruhi
p g oleh rata-
rata curah hujan kemarin dst, maka data rata-rata curah hujan di atas
dapat dikategorikan sebagai suatu deret waktu (time series).

2
Plot Data
berdasarkan waktu
Rata-rata curah hujan bulanan 2001 - 2004 di Stasiun Padaherang
600

500

400
urah hujan

300
nilai cu

200

100

0
0 5 10 15 20 25 30 35 40 45
waktu (bulan ke-)

3 @ UM
Proses Stokastik
 Proses stokastik adalah barisan peubah acak {Yt , t T }

 Setiap proses stokastik memuat ruang keadaan S dan


indeks parameterT
S : semua nilai yang mungkin dari Yt
S danT
d T dapat
d t bernilai
b il i diskrit
di k it atau
t kontinu
k ti

 Contoh proses stokastik:


a. Cuaca harian kota Bandungg
b. Banyaknya trombosit/hari pasien demam berdarah
sejak ia terinfeksi
c. Laju pertumbuhan populasi orang utan (% per tahun)
d Waktu antara mekarnya bunga bangkai yang ke-n
d. ke n
dengan bunga bangkai yang ke n+1

 Misal yt nilai dari Yt maka barisan nilai {yt , t T } disebut


realisasi dari {Yt , t T }
4
Time Series
 Jika T : waktu, maka {Yt , t T } disebut time series
 Realisasinya disebut data TS
 Studi berkaitan dengan TS disebut analisis TS
 Permasalahan dalam analisis TS :
“Bagaimana
Bagaimana menentukan model Yt sehingga model
tersebut dapat digunakan untuk forecasting (prakiraan
di waktu mendatang)?? ”

 Secara umum, model TS dapat ditulis


Yt = f (.) + et (1)
Asumsi galat: et ~ N (0, 2) dan tidak berkorelasi

 Jika f linier dalam parameter-parameternya maka


persamaan (1) disebut model linier TS
 Koleksi semua model linier TS dinamakan model
ARIMA(p,d,q) (Box-Jenkins, 1976)
5
Contoh Time Series
Tingkat Pengangguran di AS Produksi Tembakau di AS

2000
8
7

Miliar pounds
1500
Persen
6

000
5

10
M
4

500
3

0 20 40 60 80 100 120 1880 1900 1920 1940 1960 1980

Kuartal Tahun

Data Penjualan lynx pelts di Canada Ukuran partikel setelah


penyemprotan pengharum ruangan
00 80000

118
0000 40000 6000

116
114
112
20

110

1850 1860 1870 1880 1890 1900 0 100 200 300 400 500
6
Tahun Menit
Manfaat dan Tujuan TS
 Memodelkan
d lk ddata TS sehingga
h ddapat ddilihat
l h perilaku
l k ddata
lebih lanjut
 Melakukan prediksi ke depan atau prakiraan jangka pendek
(short-time forecasting)

7
Beberapa Konsep Dasar dalam TS
K t i
Kestasioneran

 TS {Yt , t T } stasioner jika untuk setiap t,


1. E[Yt] =  (konstan)
2. kov(Yt , Yt –k) = k (tidak tergantung t )

 Secara visual, data TS {Yt , t T } stasioner


jika data TS berfluktuasi di sekitar
rataannya dengan variansi konstan

8
Beberapa Konsep Dasar dalam TS
ACF fungsi
ACF, f i autokorelasi
t k l i
 ACF (fungsi autokorelasi) : fungsi antara
lag k dan k dengan, k = corr (Yt ,Yt –k).
ACF sampel:
n

 (Y  Y )(Y
t t k Y )
rk  t  k 1 n

 t
(Y
t 1
 Y ) 2

 rk = 0 (secara signifikan) jika


1 1
1,96
1 96  rk  11,96
96
n n
9
Beberapa Konsep Dasar dalam TS
PACF fungsi
PACF, f i parsial
i l autokorelasi
t k l i
 PACF (fs. autokorelasi parsial) : fungsi antara lag k
dengan kk di mana kk = corr (Yt , Yt –k) setelah
d t l h
pengaruh Y1 , Y2, …, Yk-1 ditiadakan.

 PACF dapat didefinisikan juga sebagai koefiesien suku


terakhir dari regresi Yt dengan Y1 , Y2, …, Yk.

Artinya, jika Yt =  +1Yt-1 + 2Yt-2 + … + kYt-k maka


PACF sampel untuk lag k = taksiran dari k.
atau
t ˆkk  ˆk
1 1
ˆkk
= 0 (secara signifikan) jika 1,96  kk  1,96
ˆ
n n
10
C t h ACF d
Contoh dan PACF d
dengan
g SPSS
number of blowfly
8000

1.0 Coefficient
Upper Confidence Limit
Lower Confidence
Limit
ber of blowfly

0.5
6000

ACF
0.0
numb

4000

-0.5

-1.0
2000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Lag Number

number of blowfly
1 3 5 7 9 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8
1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1

Sequence number Coefficient


1.0

Dari menu SPSS, pilih


Upper Confidence Limit
Lower Confidence
Limit

Graphs
p 0.5

Time Series
Partial ACF

0.0

Autocorrelations...
pilih variabel yang akan -0.5

dihit
dihitung ACF dan
d PACF-nya
PACF -1.0

OK 1 2 3 4 5 6 7 8

Lag Number
9 10 11 12 13 14 15 16

11
Model-model Time Series
Untuk TS Stasioner
1. Autoregresi (AR) : “regresi terhadap TS yg lalu & galat
sekarang
sekarang”
AR(1): Yt =  +1Yt-1 +et , di mana 1<1<1
AR(2): Yt =  +1Yt-1 + 2Yt-2 + et ,
di mana 1<2<1, 2+1<1, 2-1<1
AR(p): Yt =  +1Yt-1 + 2Yt-2 + … + pYt-p + et

2. Moving Average (MA) : “regresi terhadap galat yang lalu


dan galat sekarang”
MA(1) Yt =  + et – 1et -1 , di mana 1<
MA(1): 1 1<1 1
MA(2): Yt =  + et – 1et -1 – 2et -2
di mana 1<2<1,, 2+1<1,, 2-1<1
MA(q): Yt =  + et – 1et-1 – 2et -2 - … – qet –q
12
Model-model Time Series
Untuk TS Stasioner
3. Autoregresi-Moving Average (ARMA)

“regresi terhadap
h d TS S yang lalu
l l dan
d semua galat” l ”
ARMA(1,1): Yt =  +1 Yt-1 +et – 1et -1
ARMA(p,q):
Zt =  +(1 Yt-1 + … + p Yt-p ) +(et – 1et -1 –… – qet -q )

Catatan: AR(p) = ARMA(p,0), MA(q) = ARMA(0,q)

13
Model-model Time Series
Untuk TS tidak Stasioner
 Misal TS {Yt } tidak stasioner.
Buat TS baru yg stasioner, sebut {Zt } dengan cara
diferensi, yaitu Zt = Yt – Yt-1, untuk setiap t.
 Maka
“ARMA(p,q) untuk {Zt} disebut ARIMA (p,1,q)
untuk {Zt }”

 Jika diferensi dilakukan d kali, ditulis


ARIMA(p,d,q)
ARIMA( d )
 Catatan: ARMA(p,q) = ARIMA (p,0,q)

14
Metode Box Jenkins
Tahap awal:
Pemeriksaan kestasioneran:
- Plot TS
- Jika stasioner, lanjutkan ke “tiga tahap iteratif”.
Jik tidak
Jika tid k lakukan
l k k transformasi
t f i atau
t diferensi
dif i
Tiga tahap iteratif :
1 Identifikasi
1.
2. Penaksiran parameter
3. Uji diagnostik (pemeriksaan asumsi sisa)

Jika pada uji diagnostik, ada asumsi yang dilanggar


ulangi lagi 3 tahap iteratif

15
Identifikasi
Model ACF PACF
AR(p) Menurun secara Cut off setelah lag p
eksponensial atau
membentuk gelombang sinus
teredam
MA(q) Cut off setelah lag q Menurun secara
eksponensial atau
membentuk gelombang sinus
teredam

 Mengidentifikasi orde (p,q) model ARMA melalui kriteria


Akaike (AIC)
AIC  n log + 2m , m = # parameter
 Hitung nilai AIC untuk setiap (p,q). Orde yang dipilih adalah
16
(p,q) dengan nilai AIC yang paling kecil
Penaksiran Parameter
 Metode: - Kuadrat terkecil (untuk model AR)
- Maksimum
M k i lik lih d
likelihood
- Melard (digunakan SPSS)

 Contoh penaksiran parameter melalui SPSS


Dari menu, pilih Analyze  Forecasting  Create Models ...
Pilih nama TS sebagai Dependent variable
Masukkan orde model ARIMA

17
Uji Diagnosis
Ingat asumsi galat: et ~ N (0,2) dan tidak berkorelasi
P
Pengujian
ji asumsi:
i
Cara 1:
 Plot sisaan
berfluktuasi di sekitar 0  E[et ] = 0
nilai sisaan di sekitar  1,96ˆ  Var(et) = 2
2

 plot ACF serta plot PACF-nya


rk dan ˆkk signifikan 0  sisaan “tidak berkorelasi”
Cara 2: Uji Ljung-Box
 Uji
j “H0: korelasi antar sisaan = 0” dengan
g statistik Ljung-Box
j g
h 2
r
*
Q  n(n  2) k

k 1 n  k
 Jika Q * > 2, dengan  = h – m dan m = # parameter,
parameter maka H0
ditolak
18
Contoh
 Hasil produksi bulanan perkebunan teh di lokasi PAL tahun
1992-2009 (T = 216)

Produksi teh "PAL" 1992-2009


1992 2009
Produksi teh "PAL" 1992-2009 diferensi 1 kali
300000 150000

250000 100000

200000

produksi teh
produksi teh

50000
150000
0
100000
0 50 100 150 200
50000 -50000

0 -100000
0 50 100 150 200 bulan ke-

bulan ke-

19
Contoh
Sari Numerik Data
Data perkebunan teh PAL Data perkebunan teh PAL (diff 1 kali)
Data perkebunan teh PAL (diff 1 kali)

Mean 133793.6 Mean 455.7023


Standard Error 2488.531 Standard Error 2407.674
Median 136781 Median ‐1515
Mode #N/A Mode ‐15033
Standard Deviation 36573.79 Standard Deviation 35303.43
p
Sample Variance 1.34E+09 Sample Variance
Sample Variance 1.25E+09
1.25E 09
Kurtosis 0.222436 Kurtosis 1.855309
Skewness ‐0.07241 Skewness 0.701741
Range 218458 Range 216395
Mi i
Minimum 36305 Mi i
Minimum ‐81536
81536
Maximum 254763 Maximum 134859
Sum 28899412 Sum 97976
Count 216 Count 215

20
Contoh
Identifikasi

 ACF menurun seperti


gelombang sinus
teredam sedangkan
PACF cut off setelah
g
lag-1.
 Model yang mungkin
adalah AR(1)

 ACF cut off setelah


lag-1 sedangkan PACF
jjuga
g seperti
p cut offff
setelah lag-1.
 Ada beberapa model
yang
g
mungkin, seperti
ARIMA(1,1,1)

21
Contoh
Penaksiran dan Uji Diagnostik
AR (1)

Diperoleh AR(1) : Yt  134113, 420  0,535Yt 1  et


ARIMA (1,1,1)

22 Diperoleh ARIMA(1,1,1) : Z t  19, 205  0, 434 Z t 1  0,934et 1  et


Contoh
Kesimpulan
 Berdasarkan hasil Ljung-Box, dimana pada model AR(1) H0
ditolak
dit l k ((sisaan
i bberkorelasi) t k semua 1%    10%,
k l i) untuk 10%
sedangkan ARIMA(1,1,1) tidak ditolak untuk  <1,7%.
 Oleh karena itu model ARIMA(1,1,1)
( , , ) bisa dianggap
gg p lebih
cocok (dengan sisaan yang tidak berkorelasi) sehingga dapat
digunakan untuk melakukan short-time forecast dengan
menggunakan persamaan :

Z t  19,, 205  0,, 434 Z t 1  0,934


, et 1  et

Yt 1  Yt  19, 205  0, 434(Yt  Yt 1 )  0,934et 1

19 205  11, 434Yt  00, 434Yt 1  00,934
Yt 1  19, 934et 1
23
Referensi
• Box, G.
B G E.
E P.
P dan
d Jenkins,
J ki G
G. M
M. (1976):
( ) Time
Ti S
Series
i
Analysis: Forecasting & Control, Holden-Day Inc.,
San Fransisco
• Cryer, J. D. dan Chan, K. S. (2008): Time Series
Analysis with Applications in R, Springer, New York.

24

Anda mungkin juga menyukai