Pendahuluan
Sebagian besar pembahasan regresi linier yang telah dilakukan
mengasumsikan bahwa data yang digunakan adalah bersifat cross section.
Meskipun regresi linier juga dapat digunakan pada data time series, namun
karena karakteristik tertentu dari data semacam ini maka perlu
diperhatikan beberapa implikasi.
Kita dapat memandang suatu time series sebagai suatu proses yang random.
Realisasi pada saat t tidak akan pernah diketahui secara pasti pada saat t-1.
Dengan demikian serangkaian data time series: xt-h, xt-h+1, , xt-1, xt adalah
suatu proses random yang dikenal dengan istilah stochastic proses.
Salah satu karakteristik yang banyak ditemui pada data time series dan ia
berdampak penting bagi estimasi dengan OLS adalah keberadaan non
stasionaritas. Dalam artian luas, sifat ini berarti adanya keterkaitan erat
antara nilai data pada suatu titik waktu dengan titik waktu lainnya. Jelas
sifat ini merupakan pelanggaran bagi salah satu asumsi Gauss-Markov dan
estimator yang diperoleh dapat menjadi bias.
Dengan demikian dalam penelitian empiris yang mempergunakan data time
series, perlu diperhatikan implikasi karakteristik ini. Penerapan OLS tanpa
melakukan perlakuan yang memadai terhadap non staionaritas berpotensi
membawa peneliti kepada hasil yang salah.
II.
E (ut Xt ) = 0
1)
tergantung pada nilai variabel bebas pada observasi ke j (dimana i j). Kita
membicarakan dua individu berbeda.
Sedangkan pada time series sangat mungkin bahwa data pada suatu titik
waktu memiliki implikasi terhadap data pada titik waktu yang lain.
Fenomena ini dikenal sebagai sifat non stationarity atau persistensi pada
time series. Salah satu contoh yang populer adalah keberadaan trending
variabel, yakni variabel yang (secara rata-rata) adalah meningkat/menurun
dari waktu ke waktu.
Namun demikian terdapat juga data time series yang bersifat stationary.
Sebagai lawan dari non stationarity, stasioneritas berarti bahwa data pada
suatu titik waktu tidak berkorelasi dengan data pada titik waktu lain. Secara
formal suatu proses stochastic disebut sebagai stationary jika mean dan
varians (disebut juga sebagai momen pertama dan kedua dari data) diantara
dua periode hanya tergantung jarak antara kedua periode dan bukan posisi
waktu. Dengan kata lain rata-rata dan varians yang dihitung dari data (xt1,
xt2, xtm) adalah sama dengan yang dihitung dari data (xt1+h, xt2+h, xtm+h).
Terdapat banyak konsep terkait stasioneritas misalnya kondisi yang lebih
longgar seperti covariance stationary process dan weakly dependent. Kita
tidak akan membahasnya disini, Wooldrige (2005) memberikan uraian yang
lebih ekstensif. Data yang bersifat stasioner sering juga disebut sebagai
identically and independently distributed (iid).
Jika data memiliki sifat stasioner maka teknik OLS dapat
diimplementasikan secara langsung seperti halnya data cross section. Jika
asumsi Gauss-Markov terpenuhi maka estimator yang diperoleh adalah
BLUE.
Sedangkan jika data bersifat non stationary (sering disebut juga sebagai
random walk atau proses dengan unit root) suatu perlakuan khusus perlu
dilakukan sebelum menarik kesimpulan dari sampling data. Sifat perlakuan
akan tergantung dengan karakteristik non stasionaritas yang ada pada data.
Beberapa model proses stochastic non stasioner yang umum adalah
1. Pure Random Walk
yt = yt 1 + ut ; ut
IID (0, 2 )
2)
yt = + yt 1 + ut ; ut
IID (0, 2 )
3)
yt = 0 + 1t + yt 1 + ut ; ut
IID (0, 2 )
3)
yt = 0 + 1t + ut ; ut
IID (0, 2 )
4)
yt = 0 + 1t + yt 1 + ut
5)
<1
ut
IID (0, 2 )
Data dengan sifat non stationary memiliki salah satu momen (rata-rata atau
varians) yang tidak konstan antara satu periode dengan periode lainnya.
Kita akan menguraikan dua dari contoh proses non stationary diatas yakni
Pure Random Walk dan Random Walk With A Drift. Untuk pure random
walk dapat ditunjukkan dengan substitusi berulang dan nilai awal yo
tertentu maka nilai yt adalah jumlah dari yo dan residual, atau
yT = y0 + u1 + ... + uT
6)
= y0 + ut
1
Var ( yT ) = var( y0 + ut ) =t 2
7)
t =1
Dapat dilihat disini bahwa varians dari nilai yt adalah fungsi yang linier dari
waktu. Semakin jauh kedepan maka dispersi nilai y adalah semakin besar.
Grafik 1 menunjukkan suatu proses Random Walk dengan y0=0, t=50 dan
residual yang terdistribusi normal standar (0,1).
yT = t + y0 + ut
8)
E ( yT ) = y0 + t
9)
Var ( yT ) = t 2
Disini tidak hanya varians yang merupakan fungsi linier dari waktu tetapi
juga rata-ratanya. Secara grafis proses seperti ini dapat ditunjukkan oleh
grafik 2 untuk y0=0, =2, t=50, dan ut~N(0,1).
yt = + yt 1 + et ; et
NIID(0,1)
xt = + xt 1 + ut ; ut
NIID(0,1)
9)
Terlihat jelas bahwa kedua variabel ini adalah tidak ada hubungan.
Keduanya adalah series sintetis sebagai model Random Walk dengan drift.
Jika kita membuat data (t) hingga 1000 maka secara grafis kedua series
tersebut dapat digambarkan sebagai
50
40
30
20
10
0
-1 0
-2 0
-3 0
-4 0
250
5 00
Y
750
1000
Coefficient
Std. Error
t-Statistic
Prob.
C
X
-0.336553
-0.458689
0.734595
0.028001
-0.458148
-16.38119
0.6469
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.212072
0.211281
8.761888
76540.36
-3584.760
0.015893
-11.48036
9.865898
7.180700
7.190523
268.3435
0.000000
yt = yt 1 + et ; et
NIID(0,1)
.10)
Var ( yT ) = var( t ut ) =
t =1
1
u2
1
.11)
(y
y )( yt 1 y )
t =1
.12)
( yt y )2
t =1
k =
(y
t =1
y )( yt k y )
(y
t =1
y)
.13)
2
Q = T k
.14)
k =1
LB = T (T + 2)
k =1 n k
.15)
7
Nilai kritis bagi kedua statistik uji ini mengikuti distribusi 2 dengan df=m.
Software ekonometrika umumnya menghitung kedua statistik uji diatas
beserta confidence intervalnya. Hasil perhitungan biasa direpresentasikan
dalam bentuk grafik (disebut dengan correlogram). Yang dilakukan peneliti
adalah melihat apakah koefisien autokorelasi berada didalam range
penerimaan hipotesis null atau tidak. Jika koefisien dimaksud berada diluar
confidence interval, maka dapat disimpulkan bahwa terdapat autokorelasi
pada lag terkait.
Contoh 1.
File NYSE.raw memberikan data mingguan (penutupan hari rabu) indeks
NYSE periode 1976-1990. Kita akan melihat melalui correlogram apakah
series indeks mingguan adalah stasioner atau tidak. Dengan mengklik series
yang relevan kemudian mengklik view graph/line maka diperoleh hasil sbb:
200
180
160
140
120
100
80
60
40
1976
1978
1980
1982
1984
1986
1988
PRICE
Partial Correlation
.|********
.|.
|
.|.
|
AC
PAC
Q-Stat
Prob
.|********
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|*******|
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
.|.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0.978
0.973
0.967
0.962
0.955
0.949
0.944
0.939
0.934
0.929
0.924
0.920
0.916
0.911
0.907
0.903
0.899
0.012
0.049
-0.024
-0.049
-0.050
0.043
0.019
0.031
0.031
0.020
-0.004
-0.002
0.028
-0.032
0.013
0.047
0.021
2701.8
3361.1
4014.2
4660.5
5299.3
5931.2
6556.5
7175.9
7789.9
8398.8
9002.5
9600.9
10195.
10783.
11367.
11947.
12523.
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
yt = yt 1 + et ; et
NIID (0,1)
yt = ( 1) yt 1 + et = yt 1 + et
.16)
y t = a 0 + y t 1 + a 2 t + i y t i + 1 + t
i=2
17)
dimana
p
= 1 ai
i =1
i =
19)
aj
j =1
Jika =0, maka persamaan 17 diatas hanya akan berupa first difference dan
berarti terdapat suatu proses unit root. Nilai kritis tidak mengikuti test
yang standar (dalam hal ini nilai statistik t). Dalam eksperimen Monte
Carlonya Dickey-Fuller (1979) menunjukkan nilai kritis dari koefisien ini
tergantung pada bentuk model regresi (dalam hal ini apakah pure random
walk, with drift, atau dengan time trend). Statistik ini disebut dengan
statistik Dickey Fuller, selanjutnya dinotasikan dengan (model pure
random walk), u (random walk dengan drift) dan t(random walk dengan
linear time trend), nilai kritisnya dapat dilihat pada tabel DickeyFuller(1979).
Suatu pengujian unit root (sering disebut juga sebagai data berorde
integrasi 1: I(1)) yang komprehensif adalah permasalahan yang kompleks
dan diluar scope dari catatan kuliah ini. Pembaca dapat merujuk pada
Enders (1995) serta Mahadeva dan Robinson (2004).
Contoh 2.
Masih menggunakan File NYSE.raw, kali ini kita akan menggunakan
pengujian ADF untuk melihat non stasionaritas pada data. Dengan
mengasumsikan bahwa didalam series terdapat dampak trend dan drift
serta AR berorde 19, maka hasil diberikan sbb:
Null Hypothesis: PRICE has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 18 (Automatic based on AIC, MAXLAG=19)
t-Statistic
Prob.*
-2.176850
-3.971789
-3.416529
0.5012
10
10% level
-3.130590
Coefficient
Std. Error
t-Statistic
Prob.
PRICE(-1)
D(PRICE(-1))
D(PRICE(-2))
D(PRICE(-3))
D(PRICE(-4))
D(PRICE(-5))
D(PRICE(-6))
D(PRICE(-7))
D(PRICE(-8))
D(PRICE(-9))
D(PRICE(-10))
D(PRICE(-11))
D(PRICE(-12))
D(PRICE(-13))
D(PRICE(-14))
D(PRICE(-15))
D(PRICE(-16))
D(PRICE(-17))
D(PRICE(-18))
C
@TREND(1/01/1976)
-0.014551
0.116761
-0.015230
0.015377
-0.088802
0.037267
0.096337
0.062189
-0.113050
0.054720
-0.086373
-0.038408
-0.027383
0.025042
0.019957
-0.088962
0.050791
0.028298
-0.107674
0.421562
0.003098
0.006684
0.038961
0.039312
0.039281
0.039144
0.039302
0.039339
0.039525
0.039562
0.039706
0.039731
0.039574
0.039540
0.039404
0.039404
0.039217
0.039383
0.039433
0.039255
0.261630
0.001278
-2.176850
2.996851
-0.387420
0.391471
-2.268582
0.948221
2.448910
1.573406
-2.857565
1.378115
-2.173921
-0.970524
-0.692548
0.635504
0.506465
-2.268475
1.289667
0.717622
-2.742964
1.611290
2.423708
0.0299
0.0028
0.6986
0.6956
0.0236
0.3434
0.0146
0.1161
0.0044
0.1686
0.0301
0.3321
0.4888
0.5253
0.6127
0.0236
0.1976
0.4732
0.0063
0.1076
0.0156
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.087956
0.059894
2.267415
3341.762
-1490.748
2.004415
0.164441
2.338528
4.505954
4.647064
3.134262
0.000006
11
y = 0 + 1x1 + 2 x2 + ... + k xk + u
18)
yt = ( 1) yt 1 + et = yt 1 + et
19)
Jika ini terjadi maka regresi yang dilakukan akan berpotensi bias. Untuk itu
sangatlah kritikal untuk memastikan bahwa keseluruhan variabel yang
digunakan pada model adalah pada derajat integrasi yang sama. First
differencing dilakukan hanya pada data yang bersifat I(1).
Pemodelan kedua dilakukan dengan menggunakan teknik error correction
model (Engle dan Granger, 1987). Pemodelan ini tidak memerlukan first
differencing pada data. Teknik first differencing banyak diduga oleh
econometricians menyebabkan hilangnya informasi berharga pada data
sehingga termasuk metoda dengan biaya yang tinggi. Namun demikian
metoda ini terhitung kompleks sehingga akan dibahas pada bagian
tersendiri.
Pemodelan ketiga dilakukan jika sifat non stasioneritas data adalah trend
stasionary (persamaan 4 dan 5). Jika data bersifat seperti ini maka
pengujian unit root ADF dengan kondisi lengkap mungkin akan menolak
hipotesis null (data bersifat stasioner). Namun demikian implementasi OLS
12
Coefficient
Std. Error
t-Statistic
Prob.
C
LOUTPHR
-1.534398
0.689101
0.171663
0.039016
-8.938415
17.66201
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.888872
0.886023
0.055359
0.119522
61.49900
0.093161
1.493673
0.163977
-2.902390
-2.818802
311.9465
0.000000
Coefficient
Std. Error
t-Statistic
Prob.
C
D(LOUTPHR)
-0.003662
0.809315
0.004220
0.173454
-0.867802
4.665879
0.3910
0.0000
R-squared
Adjusted R-squared
0.364234
0.347503
0.011547
0.020984
13
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.016950
0.010918
107.3669
1.526380
-5.268344
-5.183900
21.77043
0.000037
yt = 0 + 1t + ut
20)
log( yt ) = 0 + 1t + et
21)
yt = 0 + 1t + 1t 2 + vt
22)
14
Linear time trend adalah bentuk yang paling sederhana dan umum
digunakan. Model eksponensial digunakan untuk menunjukkan kondisi
pertumbuhan tetap. Sedangkan kuadratik digunakan untuk memodelkan
kondisi diminishing effect (contoh produktivitas marginal).
Suatu trend dapat dideteksi dari data yang dimiliki dengan meregresikan
nilai variabel terhadap nilai trend (t, t=1,2,,T). Jika koefisien trend adalah
signifikan pada uji dua arah maka data dimaksud adalah memilki
karakteristik trend.
Variabel-variabel yang memiliki karakteristik semacam ini harus dilakukan
detrending terlebih dahulu sebelum digunakan dalam model regresi linier.
Detrending dapat dilakukan dengan memasukkan secara eksplisit koefisien
time trend dalam model regresi, sebagai contoh
yt = 0 + 1 x1t + 2 x2t + 3t + ut
23)
&&
yt = yt 0 1t
&&
x = x t
1t
1t
24)
&&
x2t = x2t 0 1t
x1t , &&
x2t
Regresi &y&t terhadap &&
akan memberikan hasil yang sama dengan
persamaan 23. Prosedur semacam ini dapat dilakukan terlepas dari
karakteristik trend (misalnya eksponensial dan kuadratik).
Suatu penyesuaian perlu dilakukan didalam menghitung koefisien
determinasi, R2, (Wooldridge, 2005, hal 239). Pertama kita menghitung
terlebih dahulu nilai &y&t seperti yang telah diberikan diatas. Selanjutnya kita
meregresikan nilai &y&t terhadap x1t, x2t dan t dan peroleh nilai Sum Square
Regression (SSR) nya. R2 untuk model time trend kemudian dapat dihitung
dengan formula
R2 =1
SSR
T
t =1
25)
&&
y t2
15
Contoh 4.
Dengan menggunakan data Hseinv.raw, kita mencoba mengstimasi
hubungan antara investasi sektor perumahan perkapita terhadap tingkat
harga rumah. Grafik dan regresi time trend menunjukkan bahwa variabel
investasi perumahan dan harga rumah memiliki pola trend (hasil tidak
dicantumkan). Regresi OLS langsung memberikan hasil sbb:
Dependent Variable: LOG(INVPC)
Method: Least Squares
Date: 07/03/08 Time: 21:18
Sample: 1 42
Included observations: 42
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(PRICE)
-0.550235
1.240943
0.043027
0.382419
-12.78824
3.244981
0.0000
0.0024
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.208390
0.188599
0.155423
0.966256
19.61651
0.814165
-0.666155
0.172543
-0.838881
-0.756135
10.52990
0.002376
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(PRICE)
T
-0.913060
-0.380961
0.009829
0.135613
0.678835
0.003512
-6.732814
-0.561198
2.798444
0.0000
0.5779
0.0079
R-squared
Adjusted R-squared
S.E. of regression
0.340765
0.306958
0.143641
-0.666155
0.172543
-0.974252
16
0.804675
23.45930
1.048727
Schwarz criterion
F-statistic
Prob(F-statistic)
-0.850133
10.07976
0.000296
&&
yt = yt 0 1 febt ... 11dect
2. Lakukan regresi dengan menggunakan deseasonalized data.
&&
yt = 0 + 1&&
x1t + ... + k &&
xkt + ut
Contoh 5.
Dengan menggunakan data Barium.raw akan diestimasi hubungan antara
impor barium dari Cina dengan berbagai variabel:chempi, gas, rtwex dan 3
17
variabel dummy: befile6, affile6 dan afdec6. Regresi pada bentuk log
memberikan hasil sbb:
Dependent Variable: LOG(CHNIMP)
Method: Least Squares
Date: 07/04/08 Time: 08:01
Sample: 1 131
Included observations: 131
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(CHEMPI)
LOG(GAS)
LOG(RTWEX)
BEFILE6
AFFILE6
AFDEC6
-17.80277
3.117194
0.196340
0.983016
0.059574
-0.032406
-0.565245
21.04537
0.479202
0.906617
0.400154
0.260970
0.264297
0.285835
-0.845923
6.504968
0.216564
2.456596
0.228281
-0.122613
-1.977520
0.3992
0.0000
0.8289
0.0154
0.8198
0.9026
0.0502
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.304862
0.271226
0.597354
44.24709
-114.7867
1.458414
6.174599
0.699738
1.859340
2.012976
9.063646
0.000000
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(CHEMPI)
LOG(GAS)
LOG(RTWEX)
BEFILE6
AFFILE6
AFDEC6
16.77923
3.265062
-1.278141
0.663045
0.139703
0.012632
-0.521300
32.42865
0.492930
1.389008
0.471304
0.266807
0.278687
0.301950
0.517420
6.623783
-0.920182
1.406832
0.523609
0.045328
-1.726446
0.6059
0.0000
0.3594
0.1622
0.6016
0.9639
0.0870
18
FEB
MAR
APR
MAY
JUN
JUL
AUG
SEP
OCT
NOV
DEC
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
-0.417711
0.059052
-0.451483
0.033309
-0.206331
0.003837
-0.157064
-0.134160
0.051693
-0.246260
0.132838
0.358328
0.261793
0.601207
40.84389
-109.5446
1.325306
0.304444
0.264731
0.268386
0.269242
0.269252
0.278767
0.277993
0.267656
0.266851
0.262827
0.271423
-1.372044
0.223065
-1.682212
0.123714
-0.766315
0.013763
-0.564995
-0.501243
0.193713
-0.936965
0.489411
0.1728
0.8239
0.0953
0.9018
0.4451
0.9890
0.5732
0.6172
0.8467
0.3508
0.6255
6.174599
0.699738
1.947246
2.342311
3.711902
0.000013
Value
0.855946
9.415406
df
Probability
(11, 113)
11
0.5852
0.5836
Value
Std. Err.
-0.417711
0.059052
-0.451483
0.033309
-0.206331
0.003837
-0.157064
-0.134160
0.051693
0.304444
0.264731
0.268386
0.269242
0.269252
0.278767
0.277993
0.267656
0.266851
19
C(17)
C(18)
-0.246260
0.132838
0.262827
0.271423
20