Anda di halaman 1dari 49

Topik Time series Tingkat Lanjut

Pada chapter ini, akan membahas beberapa topik lebih lanjut dalam ekonometrik time series.
Dalam chapter 10,11, dan 12, ditekankan di beberapa tempat yang menggunakan data deret
waktu dalam analisis regresi memerlukan perhatian karena kecenderungan, persisten dari banyak
rangkaian waktu ekonomi. Selain mempelajari topik seperti model lag terdistribusi tak terbatas
dan estimasi, juga membahas beberapa kemajuan terbaru dalam menganalisis proses deret waktu
dengan akar.

Pada Bagian 18-1, kami menjelaskan model lag terdistribusi tak terbatas, yang memungkinkan
perubahan dalam variabel penjelas untuk mempengaruhi semua nilai masa depan dari variabel
dependen. Secara konseptual, model-model ini merupakan perpanjangan langsung dari model lag
terdistribusi terbatas pada Chapter 10, tetapi memperkirakan model-model tersebut menimbulkan
beberapa tantangan menarik.

Pada Bagian 18-2, kami menunjukkan cara menguji secara formal untuk unit akar dalam proses
deret waktu. Ingat dari Chapter 11 bahwa kita mengecualikan proses akar untuk menerapkan
teori asimptotik yang biasa. Karena kehadiran unit akar menyiratkan bahwa guncangan hari ini
memiliki dampak yang bertahan lama, menentukan apakah proses memiliki unit akar menarik
bagi dirinya sendiri.

Kami membahas gagasan regresi palsu antara dua proses deret waktu, yang masing-masing
memiliki unit akar, dalam Bagian 18-3. Hasil utama adalah bahwa bahkan jika dua seri unit akar
independen, sangat mungkin bahwa regresi satu sama lain akan menghasilkan statistik t yang
signifikan secara statistik. Ini menekankan potensi konsekuensi serius dari penggunaan inferensi
standar ketika variabel dependen dan independen adalah proses terintegrasi.

Gagasan kointegrasi berlaku ketika dua seri adalah I (1), tetapi kombinasi linear dari mereka
adalah I (0); dalam hal ini, regresi satu sama lain tidak palsu, tetapi sebaliknya memberitahu kita
sesuatu tentang hubungan jangka panjang di antara mereka. Kointegrasi antara dua seri juga
menyiratkan jenis model tertentu, yang disebut model koreksi error, untuk dinamika jangka
pendek. Kami membahas model-model ini di Bagian 18-4. Dalam Bagian 18-5, kami
memberikan ikhtisar peprediksi dan menyatukan semua alat dalam chapter ini dan sebelumnya
untuk menunjukkan bagaimana metode regresi dapat digunakan untuk memperkirakan hasil seri
α waktu di masa depan. Literatur peprediksi sangat luas, jadi kami hanya fokus pada metode
berbasis regresi yang paling umum. Kami juga menyentuh pada topik terkait kausalitas Granger.

18-1 Model Lag Terdistribusi Tak Terbatas

Misalkan {( y t , z t): t = …., -2, -1, 0,1,2,…. } menjadi proses deret waktu bivariat (yang hanya
diamati sebagian). Model infinite distributed lag (IDL - lag terdistribusi tak terbatas) yang
menghubungkan y t dengan nilai saat ini dan semua nilai sebelumnya dari z adalah

y t =α + δ 0 z t +δ 1 z t−1 +δ 2 z t −2 +…+ ut , [18.1]

di mana jumlah pada z yang tertinggal memanjang kembali ke masa lalu yang tidak terbatas.
Model ini hanyalah sebuah torealitas estimasi, karena tidak ada proses ekonomi yang dimulai
jauh ke masa lalu. Dibandingkan dengan model lag terdistribusi terbatas, model IDL tidak
mengharuskan kita memotong lag pada nilai tertentu.

Agar model (18.1) masuk akal, koefisien lag,δ j , harus cenderung nol sebagai j → ∞. Ini bukan
untuk mengatakan bahwa δ 2lebih kecil dalam besarnya daripada δ 1; itu hanya berarti bahwa
dampak z t− jpada yt akhirnya harus menjadi kecil ketika j menjadi besar. Dalam sebagian besar
aplikasi, ini masuk akal secara ekonomi juga: masa lalu yang tahan dari z harus kurang penting
untuk menjelaskan y daripada masa lalu yang baru dari z.

Bahkan jika kita memutuskan bahwa (18.1) adalah model yang berguna, kita jelas tidak dapat
memperkirakannya tanpa hambatan. Untuk satu, kami hanya mengamati riwayat data yang
terbatas. Persamaan (18.1) melibatkan jumlah tak terbatas dari parameter, δ 0, δ 1, δ 2, ….., yang
tidak dapat diperkirakan tanpa batasan. Kemudian, kami membatasi batasan pada δ j yang
memungkinkan kami untuk memperkirakan (18.1).

Seperti dengan model lag terdistribusi terbatas (FDL), kecenderungan dampak dalam (18.1)
hanyalah δ 0 (lihat Chapter 10). Secara umum, δ hmemiliki interpretasi yang sama seperti dalam
FDL. Misalkan z s=0untuk semua, s < 0 dan z 0 = 1 dan z s=0 untuk semua s > 1; dengan kata
lain, pada waktu t = 0, z meningkat sementara oleh satu unit dan kemudian kembali ke level awal
nol. Untuk setiap h ≥ 0, kami memiliki y h=α +δ h +uhuntuk semua h ≥ 0, dan seterusnya

E ( y h ) =α + δ h, [18.2]
di mana kita menggunakan asumsi standar bahwa uh memiliki nol artinya. Oleh karena itu, δ h
adalah perubahan dalam E( y h)yang memberikan satu unit, perubahan sementara dalam z pada
waktu nol. Kami baru saja mengatakan bahwa dh harus cenderung ke nol abu menjadi besar agar
IDL masuk akal. Ini berarti bahwa perubahan sementara pada z tidak memiliki efek jangka
panjang yang diharapkan E( y h) = α +δ h → α sebagai h → ∞. Kami berasumsi bahwa proses z
dimulai pada z s=0dan bahwa kenaikan satu unit terjadi pada t = 0. Ini hanya untuk tujuan
ilustrasi. Lebih umum, jika z meningkat sementara oleh satu unit (dari tingkat awal apa pun)
pada waktu t, maka δ hmengukur perubahan nilai yang diharapkan dari y setelah periode h.
Distribusi lag, yang δ hdiplotkan sebagai fungsi h, menunjukkan jalur yang diharapkan bahwa
pendapatan di masa depan pada y mengikuti diberikan satu unit, peningkatan sementara dalam z.
Kecenderungan jangka panjang dalam model (18.1) adalah jumlah dari semua koefisien lag:

LRP=δ 0 +δ 1+ δ 2 +δ 3+ …, [18.3]

di mana kita mengasumsikan bahwa jumlah tak terbatas didefinisikan dengan baik. Karena δ j
harus konvergen ke nol, LRP sering dapat didekati dengan baik oleh jumlah terbatas dari bentuk
δ 0 +δ 1 + …+ δ p untuk cukup banyak p. Untuk menafsirkan LRP, anggaplah bahwa proses z t stabil
pada z s=0untuk s<0. Pada t=0, proses meningkat secara permanen sebesar satu unit. Sebagai
contoh, jika z t adalah persentase perubahan dalam persediaan uang dan y t adalah tingkat inflasi,
maka kami tertarik pada efek kenaikan satu titik persentase permanen dalam pertumbuhan
pasokan uang. Kemudian, dengan mengganti z s=0untuk s<0 dan z t=1untuk t ≥ 0, kita miliki

y h=α +δ 0 +δ 1+ …+δ h+u h,

di mana h ≥ 0 adalah horizon apa saja. Karena ut memiliki nol rata-rata untuk semua t, kita punya

E ( y h ) =α + δ 0 +δ 1+ …+δ h. [18.4]

[Sangat berguna untuk membandingkan (18.4) dan (18.2).] Ketika cakrawala meningkat, yaitu,
seperti h → ∞sisi kanan dari (18.4) adalah, menurut definisi, kecenderungan jangka panjang,
ditambah α. Dengan demikian, LRP mengukur perubahan jangka panjang dalam nilai yang
diharapkan dari y mengingat peningkatan satu unit, permanen di z.
Derivasi LRP dan interpretasi δ j sebelumnya menggunakan fakta bahwa error memiliki rata-rata
nol; seperti biasa, ini tidak banyak asumsi, asalkan intersep termasuk dalam model. Pemeriksaan
yang lebih dekat dari alasan kami menunjukkan bahwa kami mengasumsikan bahwa perubahan
dalam z selama periode waktu tidak berpengaruh pada nilai yang diharapkan dari ut . Ini adalah
versi lag terdistribusi tak terbatas dari asumsi eksogenitas ketat yang kami perkenalkan pada
Chapter 10 (khususnya, Asumsi TS.3).

E ¿, z t−2, z t−1, z t , z t +1,… ¿=0, [18.5]

sehingga nilai yang diharapkan dari ut tidak bergantung pada z dalam periode waktu apa pun.
Meskipun (18.5) alami untuk beberapa aplikasi, ia mengesampingkan kemungkinan penting
lainnya. Akibatnya, (18.5) tidak memungkinkan umpan balik dari y t ke z masa depan karena z t +h
harus tidak berkorelasi dengan ut untuk h> 0. Dalam contoh pertumbuhan suplai inflasi/uang, di
mana y t adalah inflasi dan zt adalah pertumbuhan suplai uang, (18.5) mengesampingkan
perubahan masa depan dalam pertumbuhan suplai uang yang terkait dengan perubahan dalam
tingkat inflasi saat ini. Mengingat bahwa kebijakan penawaran uang sering kali berupaya untuk
mempertahankan suku bunga dan inflasi pada tingkat tertentu, ini mungkin tidak realistis.

Salah satu pendekatan untuk mengestimasiδ j , yang kita bahas dalam subchapter berikutnya,
membutuhkan asumsi eksogenitas yang ketat untuk menghasilkan penduga yang konsisten dari
δ j . Asumsi yang lebih lemah adalah

E ¿ z t , z t−1,… ¿=0 [18.6]

Di bawah (18.6), error tidak berkorelasi dengan z saat ini dan masa lalu, tetapi mungkin
berkorelasi dengan z masa depan, ini memungkinkan z t menjadi variabel yang mengikuti aturan
kebijakan yang bergantung pada masa lalu y. Terkadang, (18.6) cukup untuk memperkirakan δ j ;
kami jelaskan ini di subbagian berikutnya.

Satu hal yang perlu diingat adalah bahwa (18.5) maupun (18.6) tidak mengatakan apa-apa
tentang properti korelasi serial {ut }. (Ini seperti dalam model lag terdistribusi terbatas.) Jika ada,
kita mungkin berharap {ut } dikorelasikan secara seri karena (18.1) umumnya tidak lengkap
secara dinamis dalam pengertian yang dibahas dalam Bagian 11-4. Kami akan mempelajari
masalah korelasi serial nanti.
Bagaimana kita menginterpretasikan koefisien lag dan LRP jika (18.6) berlaku tetapi (18.5)
tidak? Jawabannya adalah: sama seperti sebelumnya. Kita masih dapat melakukan eksperimen
pemikiran sebelumnya (atau kontrafaktual) meskipun data yang kami amati dihasilkan oleh
beberapa umpan balik antara y t dan z di masa mendatang. Sebagai contoh, kita tentu dapat
bertanya tentang efek jangka panjang dari peningkatan pasokan uang secara permanen pada
inflasi meskipun data tentang pertumbuhan pasokan uang tidak dapat dikategorikan sebagai
sampel yang benar-benar eksogen.

18-1a Lag yang didistribusikan secara Geometris (atau Koyck)

Karena umumnya ada jumlah tak terbatas δ j , kita tidak dapat secara konsisten
memperkirakannya tanpa beberapa pembatasan. Versi paling sederhana dari (18.1), yang masih
membuat model bergantung pada jumlah keterlambatan yang tak terbatas, adalah lag yang
didistribusikan secara geometris (atau Koyck). Dalam model ini, δ j hanya bergantung pada dua
parameter:

δ j=γρ j,|ρ|< 1, j=0 , 1, 2 , … [18.7]

Parameter γ dan ρ mungkin positif atau negatif, tetapi ρ harus kurang dari satu dalam nilai
absolut. Ini memastikan bahwa δ j →0 sebagai j → ∞. Bahkan, konvergensi ini terjadi pada
kecepatan yang sangat cepat. (Misalnya, dengan ρ = 5 dan j = 10, ρ j = 1/ 1.024 < .001)

Kecenderungan dampak (IP) dalam GDL hanya δ 0= γ , jadi tanda IP ditentukan oleh tanda γ . Jika
γ > 0, dan ρ > 0, maka semua koefisien lag bernilai positif. Jika ρ > 0, koefisien lag bergantian
dalam tanda ( ρ jnegatif untuk j ganjil ). Kecenderungan jangka panjang lebih sulit diperoleh,
tetapi kita dapat menggunakan hasil standar pada jumlah deret geometri:

|ρ|< 1, 1+ ρ+ ρ2 +…+ ρ j +…=1/(1−ρ),

dan seterusnya

LPR=γ / (1−ρ).

LRP punya tanda yang sama dengan γ


Jika kita memasukkan (18.7) ke (18.1), kita masih memiliki model yang bergantung pada z
kembali ke masa lalu. Namun demikian, pengurangan sederhana menghasilkan model yang dapat
diperkirakan. Tulis IDL pada waktu t dan t - 1 sebagai:

y t =α + γz t + γρz t−1 +γρ 2 z t−2 +…+u t [18.8]

dan

y t −1 =α + γzt−1 + γρzt −2+ γρ2 z t−3 +…+ut −1. [18.9]

Jika kita mengalikan persamaan kedua dengan r dan menguranginya dari yang pertama, semua
kecuali beberapa syarat membatalkan:

y t −ρy t−1=( 1− ρ ) α + yz t +u t−ρut −1,

Dimana kita bisa menulis

y t =α 0+ γzt + ρyt −1+u t− ρut −1, [18.10]

Di mana α 0=(1−ρ)α . Persamaan ini terlihat seperti model standar dengan variabel dependen
tertinggal, di mana z t muncul secara bersamaan. Karena γ adalah koefisien pada z t dan ρ adalah
koefisien pada y t −1 , tampaknya kita dapat memperkirakan parameter ini. [Jika, karena alasan
tertentu, kami tertarik pada α, kami selalu dapat memperoleh α^ =α^ 0 /(1− ^ρ) setelah
memperkirakan ρ dan α 0.]

Kesederhanaan (18.10) agak menyesatkan. Istilah error dalam persamaan ini, ut −ρ ut −1 ,


umumnya berkorelasi dengan y t −1. Dari (18.9), cukup jelas bahwa ut-1 dan yt-1 berkorelasi. Oleh
karena itu, jika kita menulis (18.10) sebagai

y t =α 0+ γz t + ρyt −1+ v t , [18.11]

dimana v t ≡ ut −ρ ut−1 maka kita umumnya memiliki korelasi antara v tdan y t −1 . Tanpa asumsi
lebih lanjut, estimasi OLS dari (18.11) menghasilkan estimasi γ dan ρ yang tidak konsisten.

Satu kasus di mana v tharus dikorelasikan dengan y t −1terjadi ketika ut tidak tergantung pada nilai
z t dan allpast dari z dan y. Kemudian, (18.8) secara dinamis selesai, jadi u t tidak berkorelasi
dengan y t −1. Dari (18.9), kovarians antara v tdan y t −1 adalah
−ρ Var ( ut−1 ) =−ρσ 2u,

yang nol hanya jika ρ=0. Kita dapat dengan mudah melihat bahwa v tadalah serial berkorelasi:
karena {ut }secara seri tidak berkorelasi

E ( v t v t−1 ) =E ( ut ut −1) −ρ E ( u2t −1) −ρ E ( ut ut −2 ) + ρ2 E ( u t−1 u t−2 )=−ρσ 2u.

Untuk

j>1, E ( v t v t−1 ) =0.

Dengan demikian, {ut } adalah proses rata-rata bergerak dari urutan satu (lihat Bagian 11-1). Ini,
dan persamaan (18.11), memberikan contoh model —yang diturunkan dari model asli— yang
memiliki variabel dependen tertinggal dan jenis korelasi serial tertentu.

Jika kita membuat asumsi eksogenitas yang ketat (18.5), maka z t tidak berkorelasi dengan ut dan
ut −1, dan karenanya dengan v t. Jadi, jika kita dapat menemukan variabel instrumental yang cocok

untuk y t −1, maka kita dapat memperkirakan (18.11) dengan IV. Apa kandidat IV yang baik untuk
y t −1 ? Dengan asumsi, ut dan ut −1 keduanya tidak berkorelasi dengan z t−1, jadi v t tidak berkorelasi
dengan z t−1. Jika γ ≠0dan y t −1 berkorelasi, bahkan setelah z t . Oleh karena itu, kita dapat
menggunakan instrumen ( z t , z t−1) untuk memperkirakan (18.11). Secara umum, standar error
perlu disesuaikan untuk korelasi serial pada ( v t), seperti yang kita bahas dalam Bagian 15-7.

ut =ρ ut −1 +e t [18.12]

E ( e t ∨zt , y t −1 , z t−1 , … )=0 . [18.13]

Penting untuk diperhatikan bahwa ρ yang muncul di (18.12) adalah parameter yang sama dengan
mengalikan y t −1 di (18.11). Jika (18.12) dan (18.13) berlaku, kita dapat menulis persamaan
(18.10) sebagai

y t =α 0+ γ z t + ρ y t −1 +e t , [18.14]

yang merupakan model lengkap dinamis di bawah (18.13). Dari Chapter 11, kita dapat
memperoleh penduga parameter yang konsisten dan asimptotik normal oleh OLS. Ini sangat
mudah, karena tidak perlu berurusan dengan korelasi serial dalam error. Jika e t memenuhi asumsi
2
homoskedasitas Var ( e t|z t , y t−1 )=σ e , kesimpulan biasa berlaku. Setelah kita memperkirakan γ dan
ρ, kita dapat dengan mudah memperkirakan LRP: ^
LRP= γ^ /(1− ρ^ ). Banyak paket ekonometrika
memiliki perintah sederhana yang memungkinkan untuk mendapatkan standar error untuk
estimasi LRP.

Kesederhanaan prosedur ini bergantung pada asumsi kuat yang berpotensi bahwa { ut } mengikuti
proses AR (1) denganρ yang sama muncul pada (18.7). Ini biasanya tidak lebih buruk daripada
mengasumsikan {ut } secara seri tidak berkorelasi. Namun demikian, karena konsistensi
estimator sangat bergantung pada asumsi ini, maka merupakan ide bagus untuk mengujinya. Uji
sederhana dimulai dengan menetapkan {ut } sebagai proses AR (1) dengan parameter yang
berbeda, katakanlah, ut =λ ut −1+ et .

McClain dan Wooldridge (1995) menyusun uji pengali Rentang Lag sederhana H 0 : λ= ρ yang
dapat dihitung setelah estimasi OLS dari (18.14).

Model lag terdistribusi geometrik meluas ke beberapa variabel penjelas —sehingga kita memiliki
DL tak terbatas dalam setiap variabel penjelas— tetapi kemudian kita harus mampu menulis
koefisien z t− j ,h. Sebagai γ h ρ j . Dengan kata lain, meskipun γ h berbeda untuk setiap variabel
penjelas, ρ adalah sama. Jadi, kita bisa menulis

y t =α 0+ γ 1 z t 1 +…+ γ k z tk + ρy t−1 + vt , [18.15]

Masalah yang sama yang muncul dalam kasus dengan satu z muncul dalam kasus dengan banyak
z. Di bawah ekstensi alami dari (18.12) dan (18.13) —hanya ganti z t dengan z t=¿, …, z tk ¿—
OLS konsisten dan asimptotik normal. Atau, metode IV dapat digunakan.

18-1b Model Lag Terdistribusi Rasional

DL geometris menyiratkan distribusi lag yang cukup ketat. Kapan γ > 0 dan ρ > 0, δ j positif dan
menurun secara monoton ke nol. Dimungkinkan untuk memiliki model distribusi terdistribusi tak
terbatas yang lebih umum. GDL adalah kasus khusus dari apa yang umumnya disebut model
rational distributed lag (RDL- lag terdistribusi rasional). Perlakuan umum berada di luar
jangkauan kami —Harvey (1990) adalah referensi yang bagus— tetapi kami membatalkan satu
ekstensi yang sederhana dan bermanfaat. Seperti model RDL yang paling mudah dijelaskan
dengan menambahkan lag z ke persamaan (18.11):

y t =α 0+ γ 0 z t + ρ y t −1 + γ 1 zt −1+ v t , [18.16]

di mana v t=ut −ρ ut −1, seperti sebelumnya. Dengan penggantian berulang, dapat ditunjukkan
bahwa (18.16) setara dengan model lag terdistribusi tak terbatas

y t =α + γ 0 ( z t + ρ z t −1+ ρ 2 z t−2 +… )

+ γ 1 ( z t−1 + ρ zt −2+ ρ2 z t −3 + … ) +ut

¿ α + γ 0 z t + ( ρ γ 0 + γ 1 ) z t−1+ ρ ( ρ γ 0 + γ 1 ) z t−2

+ ρ2 ( ρ γ 0 +γ 1 ) z t −3 + …+ut ,

di mana kita kembali memerlukan asumsi |ρ∨¿1. Dari persamaan terakhir ini, kita dapat
membaca distribusi lag. Secara khusus, kecenderungan dampak adalah γ 0, sedangkan koefisien

pada h adalah ρh−1 ( ρ γ 0 +γ 1) untuk h ≥ 1. Oleh karena itu, ini model memungkinkan
kecenderungan dampak berbeda dalam tanda dari koefisien lag lainnya, bahkan jika ρ>0.
Namun, jika ρ>¿ 0, δ hmemiliki tanda yang sama dengan ( ρ γ 0 +γ 1) untuk semua h ≥ 1. Distribusi
lag diplot pada Gambar 18.1 untuk ρ=0,5, γ 0=−1 , danγ 1=1.

Cara termudah untuk menghitung kecenderungan jangka panjang adalah dengan menetapkan y
dan z pada nilai jangka panjangnya untuk semua, katakanlah, y* dan z*, dan kemudian temukan
perubahan dalam y* sehubungan dengan z* (lihat juga Soal 3 dalam Chapter 10). Kami memiliki
y ¿ =α 0+ γ 0 z ¿ + ρ y ¿ + γ 1 z ¿ dan penyelesaiannya memberikan y ¿ =α 0 /(1− ρ)+( γ 0+ γ 1 )/(1−ρ) z ¿.
Sekarang, kami menggunakan fakta bahwa LRP=∆ y¿ /∆ z ¿.

LRP=(γ 0+ γ 1)/(1−ρ).

Karena |ρ∨¿1 LRP memiliki tanda yang sama dengan γ 0 +γ 1, dan LRP adalah nol jika, dan
hanya jika, γ 0 +γ 1=0 , seperti pada Gambar 18.1.

Contoh 18.1 Investasi Perumahan dan Inflasi Harga Perumahan


Kami memperkirakan geometri dasar dan model lag terdistribusi rasional dengan menerapkan
OLS untuk (18.14) dan (18.16), masing-masing. Variabel dependen adalah log (invpc) setelah
tren waktu linier telah dihapus [yaitu, kami linear detrend log (invpc)]. Untuk zt, kami
menggunakan pertumbuhan dalam indeks harga. Ini memungkinkan kami untuk
memperkirakan bagaimana inflasi harga perumahan mempengaruhi pergerakan investasi
perumahan di sekitar trennya. Hasil estimasi, menggunakan data dalam HSEINV, diberikan
pada Tabel 18.1.
Model lag terdistribusi geometris jelas ditolak oleh data, karena gprice21 sangat signifikan. R-
square yang disesuaikan juga menunjukkan bahwa model RDL jauh lebih baik. Kedua model
memberikan estimasi yang sangat berbeda dari kecenderungan jangka panjang. Jika kita salah
menggunakan GDL, estimasi LRP hampir lima: kenaikan satu persen permanen dalam inflasi
harga perumahan meningkatkan investasi perumahan jangka panjang sebesar 4,7% (di atas
nilai trennya). Secara ekonomi, ini tampaknya tidak masuk akal. LRP yang diperkirakan dari
model lag terdistribusi rasional berada di bawah satu. Faktanya, kita tidak dapat menolak
hipotesis nol H 0 :γ 0+ γ 1=0 pada tingkat signifikansi yang wajar (nilai p =.83), jadi tidak ada
bukti bahwa LRP berbeda. dari nol. Ini adalah contoh yang baik bagaimana error menentukan
dinamika model dengan menghilangkan lag yang relevan dapat menyechapterkan kesimpulan
yang salah.

18-2 Menguji Unit akar

Kami sekarang beralih ke masalah penting dalam pengujian apakah rangkaian waktu mengikuti
Unit akar. Dalam Chapter 11, kami memberikan beberapa panduan yang samar-samar dan perlu
informal untuk memutuskan apakah suatu seri adalah I (1) atau tidak. Dalam banyak kasus,
penting untuk memiliki uji formal untuk unit akar. Seperti yang akan kita lihat, uji seperti itu
harus diterapkan dengan hati-hati. Pendekatan paling sederhana untuk menguji unit akar dimulai
dengan model AR (1):

y t =α + ρ y t −1+ et , t=1, 2, …, [18.17]

di mana y 0 adalah nilai awal yang diamati. Sepanjang bagian ini, kita membiarkan { e t }
menunjukkan proses yang memiliki rata-rata nol, mengingat masa lalu yang diamati y:

E ( e t ∨ y t−1 , y t −2 , … , y 0 )=0. [18.18]

[Di bawah (18.18), {e t } dikatakan sebagai urutan perbedaan martingale sehubungan dengan (
y t −1 , y t−2 , …) Jika {e t } diasumsikan i.i.d. dengan nol rata-rata dan tidak bergantung pada y 0,
maka itu juga memuaskan (18.18).]

Jika { y t } mengikuti (18.17), ia memiliki unit akar jika, dan hanya jika, ρ = 1. Jika α = 0 dan ρ =
1, { y t } mengikuti jalan acak tanpa penyimpangan [dengan inovasi dan kepuasan (18,18)]. Jika
α ≠ 0dan ρ = 1 , { y t } adalah perjalanan acak , yang berarti bahwa E( y t ) adalah fungsi linier dari
t. Namun demikian, adalah umum untuk meninggalkan yang tidak ditentukan di bawah hipotesis
nol, dan ini adalah pendekatan yang kami ambil. Oleh karena itu, hipotesis nol adalah bahwa { y t
} memiliki unit akar:

H 0 : ρ=1. [18.19]

Dalam hampir semua kasus, kami tertarik pada alternatif sepihak

H 1 : ρ< 1. [18.20]

(Dalam praktiknya, ini berarti 0< ρ< 1<, sebagai ρ<1 untuk seri yang kami curigai memiliki unit
akar akan sangat jarang.) Alternatif H 1 : ρ> 1 biasanya tidak dipertimbangkan, karena ini
menyiratkan bahwa y t bersifat eksplosif. Padahal, jika α > 0, y t memiliki tren eksponensial
dalam rata-rata ketika ρ>1.

Ketika |ρ | < 1, { y t } adalah proses AR (1) yang stabil, yang berarti ia sangat tergantung atau
h
tidak terkait secara asimptotik. Ingat dari Chapter 11 bahwa Corr ( y t , y t+ h) =ρ → 0 ketika |ρ | <
1. Oleh karena itu, pengujian (18.19) dalam model (18.17), dengan alternatif yang diberikan oleh
(18.20), benar-benar merupakan uji apakah { y t } adalah I (1 ) terhadap alternatif yang { y t }
adalah I (0). [Kami tidak menganggap nol sebagai I (0) dalam pengaturan ini karena { y t } adalah
I (0) untuk setiap nilai γ yang ketat antara −1 dan 1, sesuatu yang tidak dapat ditangani dengan
mudah oleh pengujian hipotesis klasik. Ada uji di mana hipotesis nol adalah I (0) terhadap
alternatif I (1), tetapi ini mengambil pendekatan yang berbeda. Lihat, misalnya, Kwiatkowski,
Phillips, Schmidt, dan Shin (1992).] Persamaan yang mudah untuk melakukan uji unit akar
adalah mengurangi y t −1 dari kedua sisi (18.17) dan untuk mendefinisikan θ=ρ−1 :

∆ y t =α +θ y t−1 +e t. [18.21]

Di bawah (18.18), ini adalah model yang lengkap secara dinamis, dan sepertinya mudah untuk
menguji H 0 :θ=0 tentang H 1 :θ <0 Masalahnya adalah, di bawah H 0, y t −1 adalah I (1), dan begitu
biasanya pusat Batas teorema yang mendasari distribusi normal standar asimptotik untuk statistik
t tidak berlaku: statistik t tidak memiliki estimasi distribusi normal standar bahkan dalam ukuran
sampel yang besar. Distribusi asimptotik dari statistik t di bawah H 0 telah dikenal sebagai
distribusi Dickey-Fuller setelah Dickey dan Fuller (1979).

Meskipun kita tidak dapat menggunakan nilai kritis yang biasa, kita dapat menggunakan statistik
t biasa untuk θ^ (18,21), setidaknya sekali nilai kritis yang sesuai telah ditabulasi. Uji yang
dihasilkan dikenal sebagai uji DF-Fuller (DF) untuk unit akar. Teori yang digunakan untuk
mendapatkan nilai kritis asimptotik lebih rumit dan dibahas dalam teks-teks lanjutan tentang
ekonometrik deret waktu. [Lihat, misalnya, Banerjee, Dolado, Galbraith, dan Hendry (1993),
atau singkatnya BDGH.] Sebaliknya, menggunakan hasil ini sangat mudah. Nilai kritis untuk
statistik t telah ditabulasi oleh beberapa penulis, dimulai dengan karya asli oleh Dickey dan
Fuller (1979). Tabel 18.2 berisi nilai kritis sampel besar untuk berbagai tingkat signifikansi,
diambil dari BDGH (1993, Tabel 4.2). (Nilai kritis yang disesuaikan untuk ukuran sampel kecil
tersedia di BDGH.)

Kami menolak hipotesis nol H 0 :θ=0 terhadap H 1 :θ <0 jika t ^θ< c di mana c adalah salah satu dari
nilai negatif pada Tabel 18.2. Misalnya, untuk melakukan uji pada tingkat signifikansi 5%, kami
menolak iftu t ^θ<−¿2,86. Ini membutuhkan statistik t dengan besarnya jauh lebih besar daripada
jika kita menggunakan nilai kritis normal standar, yang akan menjadi -1,65. Jika kita
menggunakan nilai kritis normal standar untuk menguji unit akar, kita akan menolak H 0 lebih
sering daripada 5% dari waktu ketika H 0 benar.

Contoh 18.2 Unit Akar Test untuk T-Bill Tiga Bulan


Kami menggunakan data triwulanan di INTQRT untuk menguji unit akar dalam tarif T-bill
tiga bulan. Saat kami memperkirakan (18.20), kami memperoleh

∆ r^3t =.625−.091r 3t −1

( .261 ) (.037 ) [18.22]


n=123 , R 2=.048,

di mana kita tetap dengan konvensi kami melaporkan standar error dalam tanda kurung di
bawah estimasi ini. Kita harus ingat bahwa standar error ini tidak dapat digunakan untuk
membangun interval kepercayaan biasa atau untuk melakukan uji t tradisional karena ini tidak
berperilaku seperti biasa ketika ada unit akar. Koefisien pada r 3t −1 menunjukkan bahwa
^
estimasi ^ρ =1+ θ=.909 . Meskipun ini kurang dari satu, kita tidak tahu apakah secara statistik
kurang dari satu. Statistik t pada r 3t −1 is -.091 / .037 = -2.46. Dari Tabel 18.2, nilai kritis 10%
adalah 22,57; oleh karena itu, kami gagal menolak H 0 : ρ=1 terhadap H 1 : ρ< 1 pada tingkat
signifikansi 10%.

Seperti halnya uji hipotesis lainnya, ketika kita gagal menolak H 0, kita tidak mengatakan bahwa
kita menerima H 0. Mengapa? Misalkan kita menguji H 0 : ρ=9 dalam contoh sebelumnya
menggunakan uji t standar — yang secara asimptotis sah, karena y t adalah I (0) di bawah H0.
Kemudian, kita memperoleh t = .001 / .037, yang sangat kecil dan tidak memberikan bukti
terhadap ρ=9 Namun, tidak masuk akal untuk menerima ρ=1dan ρ=9.

Ketika kita gagal menolak unit akar, seperti pada contoh sebelumnya, kita hanya harus
menyimpulkan bahwa data tidak memberikan bukti kuat terhadap H 0. Dalam contoh ini, uji
memang memberikan beberapa bukti terhadap H 0 karena statistik t mendekati nilai kritis 10%.
(Idealnya, kami akan menghitung nilai-p, tetapi ini membutuhkan perangkat lunak khusus karena
distribusi tidak normal.) Selain itu, meskipun ^ρ ≈ .91 menyiratkan jumlah yang cukup dari
persistensi dalam {r 3t }, korelasi antara pengamatan yang terpisah 10 periode untuk AR. (1)
model dengan ρ=.9 adalah sekitar .35, daripada hampir satu jika ρ=1

Apa yang terjadi jika kita sekarang ingin menggunakanr 3t sebagai variabel penjelas dalam
analisis regresi? Hasil dari uji unit akar menyiratkan bahwa kita harus sangat berhati-hati: jika
r 3t memiliki unit akar, estimasi asimptotik yang biasa tidak perlu berlaku (seperti yang kita
bahas dalam Chapter 11). Satu solusi untuk menggunakan perbedaan pertama r 3t dalam analisis
apa pun. Seperti yang akan kita lihat di Bagian 18-4, itu bukan satu-satunya kemungkinan.

Kita juga perlu menguji unit akar dalam model dengan dinamika yang lebih rumit. Jika { y t }
mengikuti (18.17) dengan ρ=1, maka ∆yt secara seri tidak berkorelasi. Kita dapat dengan mudah
memungkinkan {∆ y t } untuk mengikuti model AR dengan menambah persamaan (18.21)
dengan lag tambahan. Sebagai contoh,
∆ y t =α +θ y t−1 +γ 1 ∆ y t−1 +e t, [18.23]

di mana |γ 1|<1. Ini memastikan bahwa, di bawah H 0 :θ=0 ,{∆ y t } mengikuti model AR (1) yang
stabil. Dalam alternative H 1 : θ <0, dapat ditunjukkan bahwa { y t } mengikuti model AR (2) yang
stabil. Lebih umum, kita dapat menambahkan p lag ∆ y t ke persamaan untuk memperhitungkan
dinamika dalam proses. Cara kita menguji nol hipotesis unit akar sangat mirip: kami
menjalankan regresi

∆ y t on y t −1, ∆ y t −1, …, ∆ y t − p [18.24]

dan lakukan uji t pada θ^ koefisien pada y t −1, sama seperti sebelumnya. Versi diperpanjang dari
uji Dickey-Fuller ini biasanya disebut uji augmented Dickey-Fuller karena regresi telah ditambah
dengan perubahan yang tertinggal, ∆ y t −h. Nilai kritis dan aturan penolakan sama seperti
sebelumnya. Dimasukkannya perubahan lagged di (18.24) dimaksudkan untuk membersihkan
setiap korelasi serial di ∆ y t Semakin banyak keterlambatan yang kita sertakan dalam (18.24),
semakin banyak observasi awal yang kita hilangkan. Jika kita termasuk terlalu banyak
keterlambatan, kekuatan sampel kecil dari uji umumnya menderita. Tetapi jika kita memasukkan
terlalu sedikit keterlambatan, ukuran pengujian akan salah, bahkan asimtotik, karena validitas
nilai kritis pada Tabel 18.2 bergantung pada dinamika yang sepenuhnya dimodelkan. Seringkali,
panjang lag ditentukan oleh frekuensi data (serta ukuran sampel). Untuk data tahunan, satu atau
dua jeda biasanya cukup. Data bulanan, kami mungkin menyertakan 12 lag. Tetapi tidak ada
aturan keras untuk diikuti dalam hal apapun

Menariknya, statistik t pada perubahan yang tertinggal memiliki estimasi distribusi t. Statistik F
untuk signifikansi bersama dari semua kelompok istilah ∆yt-h juga valid secara asimptotik. (Ini
mempertahankan asumsi homoskedastisitas dibahas dalam Bagian 11-5.) Oleh karena itu, kita
dapat menggunakan uji standar untuk menentukan apakah kita memiliki cukup perubahan lambat
dalam (18,24).

Contoh 18.3 Unit Akar Test untuk Inflasi tahunan A.S.


Kami menggunakan data tahunan tentang inflasi A.S., berdasarkan CPI, untuk menguji unit
akar dalam inflasi (lihat PHILLIPS), membatasi diri kami dari tahun 1948 hingga 1996.
Memungkinkan satu lag yang ditambah dengan regresi Dickey-Fuller yang diperbesar
memberikan
^ t=1.36−.310 inf t −1+ .138 ∆ inf t −1
∆ inf

( .517 ) ( .103 ) (.126)

n=47 , R2=.172 .

Statistik t untuk uji unit akar adalah -.310 / .103 = -3.01. Karena nilai kritis 5% adalah -2,86,
kami menolak hipotesis unit akar pada tingkat 5%. Estimasi ρ adalah sekitar 0,690. Bersama-
sama, ini adalah bukti kuat melawan unit akar dalam inflasi. Lag ∆ inf t−1memiliki statistik t
sekitar 1,10, jadi kita tidak perlu memasukkannya, tetapi kita tidak bisa mengetahui ini
sebelumnya. Jika kita menjatuhkan ∆ inf t−1, bukti terhadap unit akar sedikit lebih kuat:
^
θ=−.335( ^ρ =.665) dan t ^θ=−3.13.

Untuk seri yang memiliki tren waktu yang jelas, kita perlu memodifikasi uji untuk unit akar.
Proses tren-stasioner —yang memiliki tren linier dalam rerata tetapi I (0) tentang trennya—
dapat disalahartikan sebagai proses unit akar jika kita tidak mengendalikan tren waktu dalam
regresi Dickey-Fuller. Dengan kata lain, jika menghapus uji DF biasa atau augmented pada seri
trending tapi I (0), kita mungkin akan memiliki sedikit daya untuk menolak unit akar.

Untuk memungkinkan rangkaian dengan tren waktu, kami mengubah persamaan dasar menjadi

∆ y t =α +δ t +θ y t−1 +e t , [18.25]

di mana lagi hipotesis nol adalah H 0 :θ=0 dan alternatifnya adalah H 1 :θ <0. Di bawah alternatif,
5yt6 adalah proses tren-stasioner. Jika y t memiliki unit akar, maka ∆ y t =α +δt +e t , dan
perubahan y t memiliki linier rata-rata dalam t kecuali δ =0. [Dapat ditunjukkan bahwa E( y t )
sebenarnya adalah squareik di t.] Itu tidak biasa untuk perbedaan pertama dari rangkaian
ekonomi yang memiliki tren linier, maka hipotesis nol yang lebih tepat mungkin adalah H 0 :θ=0
, δ =0. Meskipun dimungkinkan untuk menguji hipotesis bersama ini dengan menggunakan uji F
— tetapi dengan nilai kritis yang dimodifikasi— adalah umum untuk menguji H 0 :θ=0 hanya
menggunakan pada tes. Kami mengikuti pendekatan itu di sini. [Lihat BDGH (1993, Bagian 4-4)
untuk detail lebih lanjut tentang uji gabungan.]
Ketika kami memasukkan tren waktu dalam regresi, nilai-nilai kritis dari perubahan tes. Secara
intuitif, ini terjadi karena proses detrending unit akar cenderung membuatnya lebih mirip proses I
(0). Oleh karena itu, kami memerlukan besaran yang lebih besar untuk statistik t untuk menolak
H 0. Nilai kritis Dickey-Fuller untuk uji t yang mencakup tren waktu diberikan pada Tabel 18.3;
mereka diambil dari BDGH (1993, Tabel 4.2).

Sebagai contoh, untuk menolak unit akar pada level 5%, kita perlu statistik t pada θ^ , menjadi
kurang dari − 3,41, dibandingkan dengan −2,86 tanpa tren waktu. Kita dapat menambah
persamaan (18,25) dengan lag ∆ y t untuk menghitung korelasi serial, seperti halnya dalam kasus
tanpa tren.

Contoh 18.4 Unit Akar dalam Log Produk Domestik Bruto AS


Kita dapat menerapkan uji unit akar dengan tren waktu ke data PDB A.S. di INVEN. Data
tahunan ini berasal dari tahun 1959 hingga 1995. Kami menguji apakah log( GDPt ) memiliki
unit akar. Seri ini memiliki tren yang terlihat linier. Kami menyertakan satu lag Δlog(GDPt ),
yang merupakan pertumbuhan PDB (dalam bentuk desimal), untuk menjelaskan dinamika:

^
gGDPt =1.65+.0059 t−.210 log ( GDP t−1 ) +.264 g GDPt−1

( .67 ) ( .0027 ) ( .087 ) (.165) [18.26]

n=35 , R 2=.268.

Dari persamaan ini, kita mendapatkan ^ρ =1−.21=.79, yang jelas kurang dari satu. Tetapi kita
tidak bisa menolak unit akar dalam log PDB: statistik t pada log(GDPt −1) adalah 2.210 / .087
= -2,41, yang jauh di atas nilai kritis 10% dari -3,12. Statistik t pada GDPt −1 adalah 1,60, yang
hampir signifikan pada tingkat 10% terhadap alternatif dua sisi.
Apa yang harus kita simpulkan tentang unit akar? Sekali lagi, kita tidak bisa menolak unit
akar, tetapi titik ρpaling tidak mendekati satu. Ketika kita memiliki ukuran sampel yang kecil
—dan n=35 dianggap cukup kecil— sangat sulit untuk menolak hipotesis nol dari unit akar
jika prosesnya memiliki sesuatu yang dekat dengan unit akar. Dengan menggunakan lebih
banyak data dalam periode waktu yang lebih lama, banyak peneliti menyimpulkan bahwa ada
sedikit bukti yang menentang hipotesis unit akar untuk log (GDP). Hal ini membuat sebagian
besar dari mereka menganggap bahwa pertumbuhan dalam PDB adalah I (0), yang berarti
bahwa log (PDB) adalah I (1). Sayangnya, mengingat ukuran sampel yang tersedia saat ini,
kami tidak dapat memiliki banyak kepercayaan pada kesimpulan ini.
^
Jika kita menghilangkan tren waktu, ada jauh lebih sedikit bukti terhadap H0, karena θ=−.023
dan t ^θ=1.92. Di sini, estimasi ρ jauh lebih dekat dengan satu, tetapi ini menyesatkan karena
tren waktu yang dihilangkan.

Sangat menggoda untuk membandingkan statistik t pada tren waktu di (18.26) dengan nilai kritis
dari standar normal atau distribusi t, untuk melihat apakah tren waktu signifikan. Sayangnya,
statistic t pada tren tidak memiliki distribusi normal standar asimptotik (kecuali |ρ∨¿ < 1).
Distribusi t asimptotik dari statistik ini diketahui, tetapi jarang digunakan. Biasanya, kami
mengandalkan intuisi (atau plot time series) untuk memutuskan apakah akan menyertakan tren
dalam uji DF.

Ada banyak varian lain pada uji unit akar. Dalam satu versi yang hanya berlaku untuk seri yang
jelas tidak sedang tren, intersep dihilangkan dari regresi; yaitu, α diatur ke nol pada (18.21).
Varian uji Dickey-Fuller ini jarang digunakan karena bias yang diinduksi jika α ≠ 0Juga, kita
dapat memungkinkan tren waktu yang lebih rumit, seperti squareik. Sekali lagi, ini jarang
digunakan. Kelas lain dari uji mencoba untuk menghitung korelasi serial dalam Δ y t dengan cara
yang berbeda daripada dengan memasukkan keterlambatan dalam (18.21) atau (18.25).
Pendekatan ini terkait dengan standar errors kuat-korelasi serial untuk penduga OLS yang kita
bahas dalam Bagian 12-5. Idenya adalah untuk menjadi agnostik yang mungkin tentang korelasi
serial dalam Δ y t . Dalam prakteknya, uji (ditambah) Dickey-Fuller telah berlangsung dengan
baik. [Lihat BDGH (1993, Bagian 4-3) untuk diskusi tentang uji lain.]

18-3 Regresi Palsu

Dalam lingkungan cross-sectional, kami menggunakan frase "korelasi palsu" untuk


menggambarkan situasi di mana dua variabel terkait melalui korelasinya dengan variabel ketiga.
Secara khusus, jika kita menekan y pada x, kita menemukan hubungan yang signifikan. Tetapi
ketika kita mengontrol variabel lain, katakanlah, z, efek parsial dari x pada y menjadi nol. Secara
alami, ini juga dapat terjadi dalam konteks deret waktu dengan variabel I (0).

Seperti yang kita bahas dalam Bagian 10-5, adalah mungkin untuk menemukan hubungan palsu
antara time series yang memiliki tren meningkat atau menurun. Asalkan seri ini sangat
tergantung pada jadwal mereka, masalahnya diselesaikan secara efektif dengan memasukkan tren
waktu dalam model regresi. Ketika kita berurusan dengan proses terintegrasi dari order satu, ada
komplikasi tambahan. Bahkan jika dua seri memiliki sarana yang tidak sedang tren, regresi
sederhana yang melibatkan dua seri independen (1) akan sering menghasilkan statistik t yang
signifikan.

Untuk lebih tepatnya, biarkan { x t } dan { y t } menjadi jalan acak yang dihasilkan oleh

x t=x t −1+ at , t = 1, 2, …, [18.27]

dan

y t = y t−1 +e t , t = 1, 2, …, [18.28]

di mana {a t} dan {e t } merupakan inovasi independen, terdistribusi secara identik, dengan rata-

rata nol dan varians σ 2a dan σ 2e, masing-masing. Untuk konkret, ambil nilai awal menjadi x 0 = y 0
= 0. Asumsikan lebih jauh bahwa {a t} dan {e t } adalah proses independen. Ini menyiratkan
bahwa { x t } dan { y t } juga independen. Tetapi bagaimana jika kita menjalankan regresi sederhana

^y t = ^β 0+ ^β1 x t [18.29]

dan dapatkan statistik t biasa untuk ^β 1 dan R-square biasa? Karena y t dan x t independen, kami

berharap bahwa ^β 1 = 0. Lebih penting lagi, jika kami menguji H 0 : β1 =0 melawan H 1 : β 1 ≠ 0

pada tingkat 5%, kami berharap t statistik untuk ^β 1 tidak signifikan 95% dari waktu. Melalui
sebuah simulasi, Granger dan Newbold (1974) menunjukkan bahwa ini tidak terjadi: walaupun
y t dan x t bersifat independen, regresi y t dan x t menghasilkan statistik t yang signifikan secara
statistik, persentase besar pada masa itu, jauh lebih besar daripada tingkat signifikansi nominal.
Granger dan Newbold menyebut ini masalah regresi palsu: tidak ada pengertian di mana y dan x
terkait, tetapi regresi OLS menggunakan statistik t biasanya akan sering menunjukkan hubungan.

Hasil simulasi terbaru diberikan oleh Davidson dan MacKinnon (1993, Tabel 19.1), di mana a t
dan e t dihasilkan sebagai independen, variabel acak normal yang terdistribusi secara identik, dan
10.000 sampel berbeda dihasilkan. Untuk ukuran sampel n=50 pada tingkat signifikansi 5%,
statistik standar untuk H 0 : β1 =0 terhadap alternatif dua sisi menolak H 0 sekitar 66,2% dari
waktu di bawah H 0, daripada 5% dari waktu. Ketika ukuran sampel meningkat, segalanya
menjadi lebih buruk: dengan n = 250, null dibatalkan 84,7% dari waktu! Berikut adalah salah
satu cara untuk melihat apa yang terjadi ketika kita meregresi tingkat y pada tingkat x. Tuliskan
model yang mendasarinya (18.29) sebagai

y t =β 0+ β1 x t +ut . [18.30]

Untuk statistik t dari ^β 1untuk memiliki estimasi distribusi normal standar dalam sampel besar,
minimal, {ut } harus menjadi rata-rata nol, proses serial tidak berkorelasi. Tetapi di bawah
H 0 : β1 =0, y t =β 0+ ut , dan, karena { y t } adalah jalan acak yang dimulai pada y 0=0, persamaan

t
(18.30) berlaku di bawah H 0 hanya jika β 0= 0 dan, yang lebih penting, jika ut = y t =∑ e j .
j=1

Dengan kata lain, {ut } adalah jalan acak di bawah H 0. Ini jelas melanggar bahkan versi asimtotik
asumsi Gauss-Markov dari Chapter 11.

Termasuk tren waktu tidak benar-benar mengubah kesimpulan. Jika y t atau x t adalah jalan acak
dengan tren waktu tidak termasuk, masalah regresi palsu bahkan lebih buruk. Kesimpulan
kualitatif yang sama berlaku jika 5at6 dan 5et6 adalah proses I (0) umum, bukan urutan i.i.d.

Selain statistik t biasa yang tidak memiliki standar distribusi normal yang terbatas — pada
kenyataannya, itu meningkat hingga tak terbatas sebagai n → ∞—R-square tidak standar. Dalam
konteks cross-sectional atau dalam regresi dengan I (0) variabel deret waktu, R-square
memadukan dalam prochapterilitas dengan populasi −square :1−σ 2u / σ 2y . Ini bukan kasus dalam
regresi palsu dengan proses I (1). Alih-alih R-square memiliki plim yang terdefinisi dengan baik,
ia sebenarnya konvergen ke variabel acak. Memformalkan gagasan ini jauh di luar cakupan teks
ini. [Diskusi tentang sifat asimptotik dari statistik t dan R-square dapat ditemukan dalam BDGH
(Bagian 3-1).] Implikasinya adalah bahwa R-square besar dengan prochapterilitas tinggi,
meskipun { y t } dan { x t } adalah proses deret waktu yang independen.

Pertimbangan yang sama muncul dengan beberapa variabel independen, yang masing-masing
mungkin I (1) atau beberapa di antaranya mungkin I (0). Jika { y t } adalah I (1) dan setidaknya
beberapa variabel penjelas adalah I (1), hasil regresi mungkin palsu. Kemungkinan regresi palsu
dengan variabel I (1) cukup penting dan telah mendorong ekonom untuk menguji kembali
banyak waktu agregat regresi seri yang t statistiknya sangat signifikan dan yang R-squarenya
sangat tinggi. Pada bagian berikutnya, kami menunjukkan bahwa regresi variabel I (1) dependen
pada variabel I (1) dapat informatif, tetapi hanya jika variabel-variabel ini terkait dalam arti yang
tepat.

18-4 Model Kointegrasi dan Koreksi Error

Pembahasan regresi palsu pada bagian sebelumnya tentu membuat orang waspada menggunakan
tingkat variabel I (1) dalam analisis regresi. Dalam chapter-chapter sebelumnya, kami
menyarankan bahwa I (1) variabel harus dibedakan sebelum mereka digunakan dalam model
regresi linier, apakah mereka diperkirakan oleh OLS atau variabel instrumental. Ini tentu saja
merupakan jalan yang aman untuk diikuti, dan ini adalah pendekatan yang digunakan dalam
banyak regresi deret waktu setelah makalah asli Granger dan Newbold pada masalah regresi
palsu. Sayangnya, selalu membedakan variabel I (1) membatasi ruang lingkup pertanyaan yang
dapat dijawab.

18-4a Kointegrasi

Gagasan kointegrasi, yang diberi perlakuan formal dalam Engle and Granger (1987), membuat
regresi yang melibatkan I (1) variabel berpotensi bermakna. Perlakuan penuh kointegrasi secara
matematis terlibat, tetapi kita dapat menggambarkan masalah dasar dan metode yang digunakan
dalam banyak aplikasi.

Jika { y t :t=0 ,1 , ...} dan {x t :t=0 , 1 ,... } adalah dua proses I (1), maka, secara umum, y t −β x t
adalah proses (1) anI untuk nomor apa pun b. Namun demikian, ada kemungkinan bahwa untuk
beberapa β ≠ 0 , y t −β x t adalah proses I (0), yang berarti memiliki rata-rata konstan, varians
konstan, dan korelasi otomatis yang hanya bergantung pada jarak waktu antara dua variabel
dalam rangkaian , dan itu asimtotik tidak berkorelasi. Jika b seperti itu ada, kita katakan bahwa y
dan x terkointegrasi, dan kita sebut b parameter kointegrasi.

Demi ilustrasi, ambil β = 1, anggaplah bahwa y 0=x 0 =0, dan tulis y t = y t−1 +r t , x t=x t −1+ v t , di
mana {r t , } dan { v t} adalah dua proses I (0) dengan nol berarti. Kemudian, y t dan x t memiliki
kecenderungan untuk berkeliaran dan tidak kembali ke nilai awal nol dengan keteraturan.
Sebaliknya, jika y t −x tadalah I (0), ia memiliki nol rata-rata dan kembali ke nol dengan
keteraturan.

Sebagai contoh khusus, r 6t menjadi suku bunga tahunan untuk tagihan-T enam bulan (pada
akhir kuartal t) dan biarkan r 3t menjadi suku bunga tahunan untuk tagihan-T-tiga bulan. (Ini
biasanya disebut imbal hasil setara obligasi, dan dilaporkan di halaman keuangan.) Dalam
Contoh 18.2, menggunakan data dalam INTQRT, kami menemukan sedikit bukti terhadap
hipotesis bahwa r 3t memiliki unit akar; yang sama adalah r 6t . Tentukan spread antara suku
bunga T-bill enam dan tiga bulan sebagai spr t =r 6t −r 3 t. Kemudian, menggunakan persamaan
(18.21), statistik t Dickey-Fuller untuk spr t adalah .77.71 (dengan θ=−.67
^ atau ^ρ =−.33). Oleh
karena itu, kami sangat menolak unit akar untuk sprt yang mendukung I (0). Hasilnya adalah
bahwa meskipun masing-masing r 6t dan r 3t tampaknya merupakan proses akar unit, perbedaan
di antara mereka adalah proses I (0). Dengan kata lain, r 6 dan r 3 dikointegrasi.

Kointegrasi dalam contoh ini, seperti dalam banyak contoh, memiliki interpretasi ekonomi. Jika
r 6 dan r 3 tidak terkointegrasi, perbedaan antara suku bunga bisa menjadi sangat besar, tanpa
kecenderungan bagi mereka untuk kembali bersama. Berdasarkan argumen arbitrase sederhana,
ini tampaknya tidak mungkin. Misalkan sprt spread terus tumbuh untuk beberapa periode waktu,
menjadikan T-bills enam bulan menjadi investasi yang jauh lebih diinginkan. Kemudian,
investor akan beralih dari T-bill tiga bulan dan menuju T-bill enam bulan, menaikkan harga T-
bill enam bulan, sambil menurunkan harga T-bill tiga bulan. Karena suku bunga terkait terbalik
dengan harga, ini akan menurunkan r 6 dan meningkatkan r 3, sampai spread berkurang. Oleh
karena itu, penyimpangan besar antara r 6 dan r 3 diperkirakan tidak akan berlanjut: penyebaran
memiliki kecenderungan untuk kembali ke nilai rata-rata. (Spread sebenarnya memiliki rata-rata
yang sedikit positif karena investor jangka panjang lebih dihargai relatif terhadap investor jangka
pendek.)
Ada cara lain untuk mengkarakterisasi fakta bahwa sprt tidak akan menyimpang untuk waktu
yang lama dari nilai rata-rata: r 6 dan r 3 memiliki hubungan jangka panjang. Untuk menjelaskan
apa yang kami maksud dengan ini, misalkan μ= E( spr t ) menunjukkan nilai yang diharapkan dari
spread. Lalu, kita bisa menulis

r 6t =r 3t + μ+ et ,

di mana {e t } adalah rata-rata nol, I (0) proses. Kesetimbangan atau hubungan jangka panjang
terjadi ketika e t =0, atau r 6¿ =r 3¿ + μ. Kapan pun, ada penyimpangan dari ekuilibrium, tetapi
akan bersifat sementara: ada kekuatan ekonomi yang mendorong r 6 dan r 3 kembali ke arah
hubungan ekuilibrium.

Pengujian untuk kointegrasi lebih sulit ketika parameter kointegrasi (potensial) β tidak diketahui.
Daripada menguji untuk unit akar di { st }, kita harus terlebih dahulu memperkirakan b. Jika y t
dan xt dikointegrasi, ternyata estimator OLS ^β dari regresi

y t =α^ + ^β x t [18.31]

konsisten untuk β. Masalahnya adalah bahwa hipotesis nol menyatakan bahwa dua seri tidak
terkointegrasi, yang berarti bahwa, di bawah H 0, kami menjalankan regresi palsu. Untungnya,
mungkin untuk mentabulasikan nilai-nilai kritis bahkan ketika β diperkirakan, di mana kami
menerapkan uji Dickey-Fuller atau augmented Dickey-Fuller ke residu, katakan, u^ t = y t −α^ + ^β x t
dari (18.31). Satu-satunya perbedaan adalah bahwa nilai-nilai kritis memperhitungkan estimasi β.
Uji yang dihasilkan disebut uji Engle-Granger, dan nilai kritis asimptotik diberikan pada Tabel
18.4. Ini diambil dari Davidson dan MacKinnon (1993, Tabel 20.2).

Tabel 18.4 Nilai Kritis Asimptotik untuk Uji Kointegrasi: Tidak Ada Tren Waktu

Tabel 18.5 Nilai Kritis Asimptotik untuk Uji Kointegrasi: Tren Waktu Linear
Dalam uji dasar, kami menjalankan regresi ∆ u^ t pada u^ t −1 dan membandingkan statistik t di u^ t −1
dengan nilai kritis yang diinginkan pada Tabel 18.4. Jika statistik t berada di bawah nilai kritis,
kami memiliki bukti bahwa y t −β x t adalah I (0) untuk beberapa β; yaitu, y t dan x t dikointegrasi.
Kita dapat menambahkan lag ∆ u^ t ke akun korelasi server. Jika kita membandingkan nilai-nilai
kritis pada Tabel 18.4 dengan nilai-nilai pada Tabel 18.2, kita harus mendapatkan statistik yang
jauh lebih besar untuk menemukan kointegrasi daripada jika kita menggunakan nilai kritis DF
yang biasa. Ini terjadi karena OLS, yang meminimalkan jumlah residu square, cenderung
menghasilkan residual yang terlihat seperti urutan I (0) bahkan jika y t dan x t tidak terkointegrasi
Seperti halnya uji Dickey-Fuller yang biasa, kita dapat menambah uji Engle-Granger dengan
memasukkan lag ∆ u^ t sebagai regresi tambahan.

Jika y t dan x t tidak terkointegrasi, regresi y t pada x t adalah palsu dan memberi tahu kita tidak
ada yang berarti: tidak ada hubungan jangka panjang antara y dan x. Kita masih dapat
menjalankan regresi yang melibatkan perbedaan pertama, Δ y t dan Δ x t , termasuk lag. Tetapi kita
harus menafsirkan regresi ini untuk apa mereka: mereka menjelaskan perbedaan dalam hal
perbedaan dalam x dan tidak ada hubungannya dengan hubungan di tingkat.

Jika y t dan x t dikointegrasi, kita dapat menggunakan ini untuk menentukan model dinamis yang
lebih umum, seperti yang akan kita lihat pada subchapter berikutnya

Diskusi sebelumnya mengasumsikan bahwa baik y t maupun x t tidak memiliki penyimpangan.


Ini masuk akal untuk suku bunga tetapi tidak untuk time series lainnya. Jika y t dan x t
mengandung istilah drift, E( y t ) dan E( x t ) adalah fungsi waktu linear (biasanya meningkat).
Definisi kointegrasi membutuhkan y t −β x t menjadi I (0) tanpa tren. Untuk melihat apa yang
diperlukan, y t =δt + gt dan x t= λt +h t, di mana { gt } dan {ht } adalah proses I (1), δ adalah drift di
y t [δ=E ( ∆ y t ) ], dan x t [ λ=E ( ∆ x t ) ] adalah drift. Sekarang, jika y t dan x t dikointegrasi, harus ada

β sehingga gt −β ht adalah I (0). Tapi kemudian

y t −β x t =( δ −βλ ) t+( gt −β h t ),

yang umumnya merupakan proses tren-stasioner. Bentuk kointegrasi yang ketat mensyaratkan
bahwa tidak ada tren, yang berarti δ =βλ 5 bl. Untuk proses I (1) dengan drift, ada kemungkinan
bahwa bagian stokastik —yaitu, gt dan ht — terkointegrasi, tetapi parameter β yang
menyechapterkan gt −β ht menjadi I (0) tidak menghilangkan tren waktu linier.
Kita dapat menguji kointegrasi antara gt dan ht , tanpa mengambil sikap pada bagian tren, dengan
menjalankan regresi

^y t =α^ + η^ t + ^β x t [18.32]

dan menerapkan uji DF biasa atau augmented DF ke residu u^ t . Nilai kritis asimptotik diberikan
pada Tabel 18.5 [dari Davidson dan MacKinnon (1993, Tabel 20.2)].

Temuan kointegrasi dalam kasus ini membuka kemungkinan bahwa y t −β x t memiliki tren linier.
Tapi setidaknya bukan I (1).

Contoh 18.5 Kointegrasi antara Fertilitas dan Pembebasan Pribadi

Dalam Chapter 10 dan 11, kami mempelajari berbagai model untuk memperkirakan hubungan
antara tingkat kesuburan umum (gfr) dan nilai riil dari pembebasan pajak pribadi (pe) di
Amerika Serikat. Hasil regresi statis dalam level dan perbedaan pertama sangat berbeda.
Regresi di tingkat, dengan tren α waktu termasuk, memberikan koefisien OLS pada pe sama
dengan 0,187 (se = 0,035) dan R2 = 0,500. Dalam perbedaan pertama (tanpa tren), koefisien
pada Δpe adalah -,043 (se = 0,0282) dan R2 = 0,032. Walaupun ada alasan lain untuk
perbedaan-perbedaan ini -seperti dinamika lag terdistribusi yang tidak ditentukan- perbedaan
antara level dan regresi perubahan menunjukkan bahwa kita harus menguji kointegrasi. Tentu
saja, ini mengasumsikan bahwa gfr dan pe adalah proses I (1). Ini tampaknya menjadi kasus:
uji DF yang ditambah, dengan perubahan lagged tunggal dan tren waktu linier, masing-masing
menghasilkan statistik t sekitar -1,47, dan estimasi koefisien AR (1) mendekati satu.
Ketika kami memperoleh residu dari regresi gfr pada t dan pe dan menerapkan uji DF yang
ditambah dengan satu lag, kami memperoleh statistik t pada u^ t −1 dari -2,43, yang jauh dari
nilai kritis 10%, 23,50. Oleh karena itu, kita harus menyimpulkan bahwa ada sedikit bukti
kointegrasi antara gfr dan pe, bahkan memungkinkan untuk tren terpisah. Berita baiknya
adalah, ketika kami menggunakan perbedaan pertama dan membiarkan dua lag — lihat
persamaan (11.27) —kami menemukan keseluruhan positif dan signifikan efek jangka panjang
dari Δpe pada Δgfr.
Jika kita berpikir dua seri terkointegrasi, kita sering ingin menguji hipotesis tentang parameter
kointegrasi. Sebagai contoh, sebuah teori dapat menyatakan bahwa parameter kointegrasi adalah
satu. Idealnya, kita dapat menggunakan statistik t untuk menguji hipotesis ini.

Kami secara eksplisit membahas kasus ini tanpa tren waktu, meskipun perpanjangan kasus tren
linier bersifat segera. Dengan y t dan x t adalah I (1) dan terkointegrasi, kita dapat menulis

y t =α + β x t +ut , [18.33]

di mana ut adalah rata-rata nol, I (0) proses. Secara umum, (u t) mengandung korelasi serial, tetapi
kita tahu dari Chapter 11 bahwa ini tidak mempengaruhi konsistensi OLS. Seperti yang
disebutkan sebelumnya, OLS yang diterapkan pada (18.33) secara konsisten memperkirakan b
(dan α). Sayangnya, karena x t adalah I (1), prosedur inferensi yang biasa tidak selalu berlaku:
OLS tidak terdistribusi secara asimptotik secara normal, dan statistik t untuk ^β tidak selalu
memiliki estimasi distribusi t. Kita tahu dari Chapter 10 bahwa, jika (x t x t ) benar-benar eksogen
— lihat Asumsi TS.3 — dan errornya homoskedastik, tidak berkorelasi seri, dan biasanya
terdistribusi, penduga OLS juga terdistribusi normal (tergantung pada variabel penjelas) dan
statistik t. memiliki distribusi t yang tepat. Sayangnya, asumsi ini terlalu kuat untuk diterapkan
pada sebagian besar situasi. Gagasan kointegrasi tidak menyiratkan apa pun tentang hubungan
antara ( x t ) dan (ut ) — memang, mereka dapat dikorelasikan secara sewenang-wenang. Lebih
jauh, kecuali untuk mensyaratkan bahwa 5ut6 adalah I (0), kointegrasi antara y t dan x t tidak
membatasi ketergantungan serial pada (ut ). Untungnya, fitur (18.33) yang menjadikan inferensi
paling sulit— kurangnya eksogenitas ketat { x t } — dapat diperbaiki. Karena x t adalah I (1),
gagasan yang tepat untuk eksogenitas yang ketat adalah bahwa ut tidak berkorelasi dengan Δ x s,
untuk semua t dan s. Kami selalu dapat mengatur ini untuk set error baru, setidaknya kira-kira,
dengan menulis ut sebagai fungsi dari Δ x s untuk semua yang dekat dengan t. Sebagai contoh.

ut =η+ ϕ0 ∆ xt +ϕ1 ∆ x t−1 +ϕ2 ∆ x t−2

+ γ 1 ∆ x t+1 + γ 2 ∆ x t+ 2+ et , [18.34]
di mana, dengan konstruksi, e t tidak berkorelasi dengan setiap Δ x s yang muncul dalam
persamaan. Harapannya adalah bahwa etis tidak berkorelasi dengan lag dan petunjuk lebih lanjut
dari Δ x s. Kita tahu bahwa, ketika |s – t| menjadi besar, korelasi antara e t dan Δx mendekati nol,
karena ini adalah proses I (0). Sekarang, jika kita memasukkan (18.34) ke (18.33), kita
memperoleh

y t =α 0+ β x t +ϕ 0 ∆ x t + ϕ1 ∆ xt −1+ ϕ2 ∆ x t−2

+ γ 1 ∆ x t+1 + γ 2 ∆ x t+ 2+ et , [18.35]

Persamaan ini terlihat agak aneh karena Δx masa depan muncul dengan Δ x t saat ini dan yang
tertinggal. Kuncinya adalah bahwa koefisien pada x t masih β, dan, dengan konstruksi, x t
sekarang benar-benar eksogen dalam persamaan ini. Asumsi eksogenitas yang ketat adalah
kondisi penting yang diperlukan untuk memperoleh statistik t yang mendekati normal untuk ^β.
Jika ut tidak berkorelasi dengan semua Δ x s, s ≠ t, maka kita dapat melepaskan kontrol dan lag
dari perubahan dan cukup memasukkan perubahan kontemporer, Δ x t . Lalu, persamaannya kami
memperkirakan terlihat lebih standar tetapi masih termasuk perbedaan pertama x t beserta
levelnya: y t =α 0+ β x t +ϕ 0 ∆ x t + et . Akibatnya, menambahkan Dxt memecahkan endogenitas
kontemporer antara x t dan ut . (Ingat, endogenitas apa pun tidak menyechapterkan
ketidakkonsistenan. Tetapi kami mencoba memperoleh statistik t asimtotik yang normal.)
Apakah kita perlu memasukkan lead dan lag dari perubahan, dan berapa banyak, itu benar-benar
masalah empiris. Setiap kali kita menambahkan lead atau lag tambahan, kita kehilangan satu
pengamatan, dan ini bisa mahal kecuali kita memiliki set data yang besar.

Estimator OLS dari β dari (18.35) disebut sebagai estimator lead dan lags dari βkarena caranya
menggunakan Δx. [Lihat, misalnya, Stock dan Watson (1993).] Satu-satunya masalah yang harus
kita khawatirkan dalam (18.35) adalah kemungkinan korelasi serial dalam { e t }. Ini dapat diatasi

dengan menghitung standar error seri korelasi-kuat untuk ^β (seperti yang dijelaskan dalam
Bagian 12-5) atau dengan menggunakan koreksi standar AR (1) (seperti Cochrane-Orcutt).

Contoh 18.6 Parameter Ko-integrasi untuk Suku Bunga

Sebelumnya, kami menguji kointegrasi antara r6 dan r3 — tarif T-bill enam dan tiga bulan —
dengan mengasumsikan bahwa parameter kointegrasi sama dengan satu. Ini mengarahkan
kami untuk menemukan kointegrasi dan, tentu saja, untuk menyimpulkan bahwa parameter
kointegrasi sama dengan kesatuan. Namun demikian, mari kita perkirakan parameter
kointegrasi secara langsung dan menguji H 0 : β=1. Kami menerapkan lead dan lag estimator

dengan dua lead dan dua lag Δr3, serta perubahan kontemporer. Estimasi β adalah ^β=¿1,038,
dan standar error OLS yang biasa adalah 0,0081. Oleh karena itu, statistik t untuk H 0 : β 5=1
adalah (1.038 – 1) /.0081 ≈4.69, yang merupakan penolakan statistik yang kuat dari H 0.
(Tentu saja, apakah 1.038 berbeda secara ekonomi dari1 adalah pertimbangan yang relevan.)
Ada sedikit bukti korelasi serial dalam residu, jadi kami dapat menggunakan statistik ini
sebagai memiliki estimasi distribusi normal. [Sebagai perbandingan, estimasi OLS β tanpa
lead, lag, atau istilah-istilah Δr3 kontemporer — dan menggunakan lima observasi lainnya —
adalah 1.026 (se = .0077). Tetapi statistik t dari (18,33) belum tentu valid.]

Ada banyak estimator lain dari parameter kointegrasi, dan ini terus menjadi bidang penelitian
yang sangat aktif. Gagasan kointegrasi berlaku untuk lebih dari dua proses, tetapi interpretasi,
pengujian, dan estimasi jauh lebih rumit. Salah satu masalah adalah bahwa, bahkan setelah kita
menormalkan koefisien menjadi satu, mungkin ada banyak hubungan kointegrasi. BDGH
menyediakan beberapa diskusi dan beberapa referensi.

18-4b Model Koreksi Error

Selain belajar tentang hubungan jangka panjang potensial antara dua seri, konsep kointegrasi
memperkaya jenis model dinamis yang kami miliki. Jika y t dan x t adalah proses I (1) dan tidak
terkointegrasi, kita dapat memperkirakan model dinamis dalam perbedaan pertama. Sebagai
contoh, perhatikan persamaannya

∆ y t =α 0 +α 1 ∆ y t −1+ γ 0 ∆ x t + γ 1 ∆ x t +1+u t, [18.36]

di mana ut memiliki rata-rata nol yang diberikan ∆ x t , ∆ y t −1, ∆ x t −1 , dan lag lebih lanjut. Ini pada
dasarnya persamaan (18.16), tetapi dalam perbedaan pertama daripada tingkat. Jika kita melihat
ini sebagai model lag terdistribusi rasional, kita dapat menemukan kecenderungan dampak,
kecenderungan jangka panjang, dan distribusi lag untuk Δy sebagai lag terdistribusi dalam Δx.
Jika y t dan x t dikointegrasi dengan parameter b, maka kita memiliki variabel I (0) tambahan
yang dapat kita sertakan dalam (18.36). Misalkan st = y t −β x t , jadi st adalah I (0), dan asumsikan
demi kesederhanaan bahwa st memiliki rata-rata nol. Sekarang, kita dapat memasukkan lag st
dalam persamaan. Dalam kasus paling sederhana, kami menyertakan satu lag dari st :

∆ y t =α 0 +α 1 ∆ y t −1+ γ 0 ∆ x t + γ 1 ∆ x t−1 +δ st −1+ ut

¿ α 0+ α 1 ∆ y t −1 + γ 0 ∆ x t + γ 1 ∆ x t−1 +δ ( y t−1−β xt −1)+ut , [18.37]

di mana E(u t∨I t −1 ), dan I t−1 berisi informasi tentang ∆ x t dan semua nilai sebelumnya dari x dan
y. δ ( y t−1− β x t−1) disebut istilah koreksi error, dan (18.37) adalah contoh model koreksi error.
(Dalam beberapa model koreksi error, perubahan kontemporer dalam x, ∆ x t , dihilangkan.
Apakah itu disertakan atau tidak tergantung sebagian pada tujuan persamaan. Dalam peprediksi,
∆ x t jarang termasuk, untuk alasan yang akan kita lihat di Bagian 18-5.)

Model koreksi error memungkinkan kita untuk mempelajari dinamika jangka pendek dalam
hubungan antara mereka dan x. Untuk kesederhanaan, pertimbangkan model tanpa lag ∆ y t dan
∆ xt:

∆ y t =α 0 +γ 0 ∆ xt +δ ( y t −1−β x t −1 ) +u t, [18.38]

Dimana δ <0. Jika y t −1 > β xt −1, maka y pada periode sebelumnya telah melampaui ekuilibrium;
karena δ <0istilah koreksi error berfungsi untuk mendorong y kembali ke arah keseimbangan.
Demikian pula, y t −1 < β xt −1, istilah koreksi error menginduksi perubahan positif pada y kembali
ke keseimbangan. Bagaimana kami memperkirakan parameter model koreksi error? Jika kita
tahu β, ini mudah. Sebagai contoh, pada (18.38), kita cukup meregresikan ∆ y t pada ∆ x t dan st −1,
di mana st −1=( y t −1−β x t −1 ).

Contoh 18.7 Model Koreksi Error untuk Hasil

Dalam Soal 6 dalam Chapter 11, kami mengalami kemunduran, hasil tiga bulan (dalam
persen) dari membeli T-tagihan enam bulan pada waktu t−1 dan menjualnya pada waktu t
sebagai T-tagihan tiga bulan, pada hy 3t −1, tiga bulan memegang hasil dari membeli T-bill tiga
bulan pada waktu t−1. Hipotesis ekspektasi menyiratkan bahwa koefisien kemiringan tidak
boleh berbeda secara statistik dari satu. Ternyata ada bukti akar unit di { hy 3t }, yang
mempertanyakan analisis regresi standar. Kami akan berasumsi bahwa kedua holding yield
adalah proses I (1). Hipotesis ekspektasi menyiratkan, setidaknya, bahwa hy 6t dan hy 3t −1
dikointegrasi dengan β sama dengan satu, yang tampaknya merupakan kasusnya (lihat
Komputasi r5 Latihan C5). Berdasarkan asumsi ini, model koreksi error adalah
∆ hy 6=α 0+ γ 0 ∆ hy 3t −1+ δ ( hy 6t −1 −hy 3 t−2 ) +ut ,

di mana ut memiliki nol rata-rata, mengingat semua hy 3 dan hy 6 bertanggal pada waktu t−1
dan sebelumnya. Lag pada variabel dalam model koreksi error ditentukan oleh hipotesis
ekspektasi. Menggunakan data dalam INTQRT memberi
∆^
hy 6t =.090+1.218 ∆ hy 3t −1−.840 ( ∆ hy 6t −1−∆ hy 3t −2 )
( .043 ) ( .264 ) ( .244 ) [18.39]
n=122 , R2 =.790.
Koefisien koreksi error adalah negatif dan sangat signifikan.

Dalam banyak contoh lain, parameter kointegrasi harus diestimasi. Kemudian, kami mengganti
st −1 dengan ^st −1= y t−1− β̈ x t−1, di mana ^β dapat berbagai estimator dari β. Kami telah membahas
estimator OLS standar serta estimator prospek dan keterlambatan. Ini menimbulkan masalah
tentang bagaimana variasi pengambilan sampel dalam memengaruhi inferensi pada parameter
lain dalam model koreksi error. Untungnya, seperti yang ditunjukkan oleh Engle dan Granger
(1987), kita dapat mengabaikan estimasi awal β (tanpa gejala). Properti ini sangat nyaman dan
menyiratkan bahwa efisiensi asimptotik dari penduga parameter dalam model koreksi error tidak
terpengaruh oleh apakah kita menggunakan penduga OLS atau arahan dan estimator
keterlambatan untuk ^β . Tentu saja, pilihan ^β umumnya akan berpengaruh pada estimasi
parameter koreksi error dalam sampel tertentu, tetapi kami tidak memiliki cara sistematis untuk
menentukan penduga awal β yang akan digunakan. Prosedur penggantian β dengan ^β disebut
prosedur dua langkah Engle-Granger.

18-5 Peprediksi
Memprediksi deret waktu ekonomi sangat penting di beberapa cabang ekonomi, dan merupakan
area yang terus dipelajari secara aktif. Pada bagian ini, kami fokus pada metode peprediksi
berbasis regresi. Diebold (2001) memberikan pengantar yang komprehensif untuk peprediksi,
termasuk perkembangan terkini.

Kami berasumsi dalam bagian ini bahwa fokus utama adalah pada peprediksi nilai masa depan
dari proses deret waktu dan tidak harus pada estimasi model ekonomi kausal atau struktural.

Berguna untuk pertama-tama membahas beberapa dasar-dasar peprediksi yang tidak bergantung
pada model tertentu. Misalkan pada waktu t kita ingin memprediksi hasil dari y pada waktu t + 1,
atau y t +1. Periode waktu bisa sesuai dengan satu tahun, seperempat, satu bulan, satu minggu, atau
bahkan satu hari. Biarkan Ini menunjukkan informasi yang dapat kita amati pada waktu t.
Kumpulan informasi ini mencakup y t , nilai y sebelumnya, dan seringkali variabel lain bertanggal
pada waktu t atau sebelumnya. Kami dapat menggabungkan informasi ini dalam berbagai cara
untuk memperkirakan y t +1. Apakah ada satu cara terbaik?

Jawabannya adalah ya, asalkan kami menentukan kerugian yang terkait dengan estimasi error .
Biarkan f t menunjukkan estimasi y t +1 yang dibuat pada waktu t. Kami menyebut f t prediksi satu
langkah di depan. Estimasi error adalah e t +1= y t +1−f t, yang kami amati begitu hasil pada y t −1
diamati. Ukuran kerugian yang paling umum adalah yang sama yang mengarah pada estimasi
square terkecil biasa dari model regresi linier berganda: error square, e 2t +1.

Estimasi error square memperlakukan prediksi errordan negatif secara simetris, dan estimasi
error yang lebih besar menerima bobot yang relatif lebih besar. Misalnya, error dari +2 dan -2
menghasilkan kerugian yang sama, dan kerugian empat kali lebih besar dari estimasi error +1
atau -1. Estimasi error square adalah contoh dari fungsi kerugian. Fungsi kerugian populer
lainnya adalah nilai absolut dari error prediksi,¿ e t−1∨¿ . Untuk alasan yang harus dilihat segera,
kami fokus sekarang pada hilangnya error square.

Dengan adanya fungsi hilangnya error square, kita dapat menentukan cara terbaik menggunakan
informasi pada waktu t untuk memprediksi y t +1. Tetapi kita harus mengakui bahwa pada waktu t,
kita tidak tahu e t +1: itu adalah variabel acak, karena y t +1 adalah variabel acak. Karena itu, setiap
kriteria yang berguna untuk memilih kaki harus didasarkan pada apa yang kita ketahui pada
waktu t. Adalah wajar untuk memilih prediksi untuk meminimalkan prediksi error square yang
diharapkan, mengingat:

2
E ( e2t +1|I t )= E[ ( y t +1−f t ) ∨I t ]. [18.40]

Fakta dasar dari prochapterilitas (lihat Properti CE.6 dalam Lampiran B) adalah bahwa harapan
bersyarat, E( yt +1∨I t ), meminimalkan (18.40). Dengan kata lain, jika kita ingin meminimalkan
estimasi error estimasi square yang diberikan pada waktu t, estimasi kita harus menjadi nilai
yang diharapkan dari variabel y t +1 yang diberikan yang kita tahu pada waktu t.

Untuk banyak proses deret waktu populer, harapan bersyarat mudah diperoleh. Anggaplah
{ y t :t=0 ,1 , … } adalah urutan perbedaan martingale (MDS) dan menganggapnya sebagai

{ y t , y t −1 , … , y 0 } masa lalu yang diamati dari y. Menurut definisi, E ( y t +1|I t )=0 untuk semua t;

prediksi terbaik y t +1 saat ini selalu nol! Ingat dari Bagian 18-2 bahwa i.i.d. urutan dengan rata -
rata nol adalah urutan perbedaan martingale.

Urutan perbedaan martingale adalah urutan di mana masa lalu tidak berguna untuk memprediksi
masa depan. Pengembalian saham secara luas dianggap baik sebagai MDS atau, mungkin,
dengan rata-rata positif. Kuncinya adalah bahwa E ( y t +1| y t , y t−1 , … )=E ( y t +1) rerata kondisional
sama dengan rerata tidak bersyarat, dalam hal ini hasil di masa lalu pada y tidak membantu
memprediksi y di masa depan.

Proses { y t } adalah martingale jika E ( y t +1| y t , y t−1 , … , y 0 ) = y t untuk semua t ≥ 0. [Jika { y t }


adalah martingale, maka {Δ y t } adalah urutan perbedaan martingale, yang merupakan asal nama
terakhir.] Nilai prediksi y untuk periode berikutnya selalu nilai y untuk periode ini. Contoh yang
lebih rumit adalah

E ( y t +1|I t )=α y t +α (1−α ) y t −1 +…+ α ( 1−α )t y 0, [18.41]

di mana 0> α >1 adalah parameter yang harus kita pilih. Metode peprediksi ini disebut pemulusan
eksponensial karena bobot pada y yang tertambat menurun menjadi nol secara eksponensial.

Alasan untuk menulis harapan seperti pada (18.41) adalah bahwa hal itu mengarah pada
hubungan pengulangan yang sangat sederhana. Set f 0= y 0. Kemudian, untuk t ≥ 1, estimasi dapat
diperoleh sebagai
f t=α y t +α (1−α ) f t−1.

Dengan kata lain, estimasi y t +1 adalah rata-rata tertimbang y t dan estimasi y t yang dibuat pada
waktu t−1. Perataan eksponensial hanya cocok untuk deret waktu yang sangat spesifik dan
mengharuskan pemilihan α. Metode regresi, yang akan kita bahas selanjutnya, lebih fleksibel.

Diskusi sebelumnya telah difokuskan pada peprediksi y hanya satu periode ke depan. Masalah
umum yang muncul dalam peprediksi y t +h pada waktu t, di mana h adalah bilangan bulat positif,
serupa. Secara khusus, jika kita menggunakan estimasi error square sebagai ukuran kerugian,
prediktor terbaik adalah E ( y t +h|I t ). Ketika berhadapan dengan estimasi beberapa langkah ke
depan, kita menggunakan notasi f t , h untuk menunjukkan estimasi y t +h waktu yang dibuat t

18-5a Jenis Model Regresi Digunakan untuk Peprediksi

Ada banyak model regresi yang dapat kita gunakan untuk memperkirakan nilai time series di
masa depan. Model regresi pertama untuk data deret waktu dari Chapter 10 adalah model statis.
Untuk melihat bagaimana kami dapat memprediksi dengan model ini, asumsikan bahwa kami
memiliki variabel penjelas tunggal:

y t =β 0+ β1 z t +ut . [18.42]

Misalkan, untuk saat ini, bahwa parameter β 0dan β 1 diketahui. Tulis persamaan ini pada waktu
t + 1 sebagai y t +1=β 0 + β 1 z t +1+u t +1. Sekarang, jika z t +1diketahui pada waktu t, sehingga itu adalah

elemen dari I t dan E ( ut +1|I t ), maka

E ( y t +1|I t )=β 0 + β 1 z t +1,

di mana I t ini berisi z t +1 , y t , z t , … , y 1 , z1.

Sayangnya, kapan saja, kita jarang tahu nilai variabel penjelas di periode waktu mendatang.
Pengecualian termasuk tren waktu dan variabel dummy musiman, yang kami bahas secara
eksplisit di bawah ini, tetapi sebaliknya pengetahuan tentang z t +1 pada waktu t jarang terjadi.
Terkadang, kami ingin menghasilkan estimasi bersyarat untuk beberapa nilai z t +1.

Masalah lain dengan (18.42) sebagai model untuk peprediksi adalah bahwa E ( ut +1|I t )=0 berarti
bahwa {ut } tidak dapat mengandung korelasi serial, sesuatu yang kami anggap salah dalam
sebagian besar model regresi statis. [Masalah 8 meminta Anda untuk mendapatkan estimasi
dalam suatu model lag terdistribusi sederhana dengan error AR (1).] Jika z t +1 tidak diketahui
pada waktu t, kita tidak dapat memasukkannya ke dalamnya. Lalu, kita punya

E ( y t +1|I t )=β 0 + β 1 E ( y t +1|I t ).

Ini berarti bahwa untuk memperkirakan y t +1, kita harus terlebih dahulu memperkirakan z t +1,
berdasarkan informasi yang sama. Ini biasanya disebut prediksi tanpa syarat karena kami tidak
mengasumsikan pengetahuan tentang z t +1. Sayangnya, ini agak keliru, karena estimasi kami
masih tergantung pada informasi di dalamnya. Tapi namanya sudah tertanam dalam literatur
peprediksi.

Untuk peprediksi, kecuali kita menggunakan model statis pada (18.42) karena alasan lain, lebih
masuk akal untuk menentukan model yang hanya bergantung pada nilai-nilai lag dari y dan z. Ini
menghemat kita langkah tambahan karena harus memprediksi variabel sisi kanan sebelum
memprediksi y. Jenis model yang kami pikirkan adalah

y t =δ 0+ α 1 y t−1 +γ 1 z t −1 +ut

E ( ut| I t −1 )=0 , [18.43]

kita hanya ingin menggunakan masa lalu y untuk memprediksi masa depan y, maka kita dapat
menghapus z t−1 dari (18.43). Secara alami, kita dapat menambahkan lebih banyak lag y atau z
dan lag variabel lainnya. Khusus untuk peprediksi satu langkah ke depan, model seperti itu bisa
sangat berguna.

18-5b Peprediksi Satu Langkah ke Depan

Memperoleh estimasi satu periode setelah sampel berakhir relatif mudah menggunakan model
seperti (18,43). Seperti biasa, biarkan n menjadi ukuran sampel. Estimasi y n+ 1 adalah

^f n=δ^ 0 + α^ 1 y n + γ^ 1 z n, [18.44]

di mana kami mengasumsikan bahwa parameter telah diperkirakan oleh OLS. Kami
menggunakan topi pada f n untuk menekankan bahwa kami telah memperkirakan parameter
dalam model regresi. (Jika kita tahu parameternya, tidak akan ada estimasi error dalam estimasi.)
Estimasi error — yang tidak akan kita ketahui sampai waktu n+1 — adalah

e^ n+1= y n+1− f^ n. [18.45]

Estimasi dari ^f n pada y n+ 1 biasanya disebut estimasi titik. Kami juga dapat memperoleh interval
estimasi. Interval estimasi pada dasarnya sama dengan interval prediksi, yang kami pelajari di
Bagian 6-4. Di sana kami menunjukkan bagaimana, di bawah asumsi model linear klasik, untuk
mendapatkan 95% prediksi prediksi yang tepat. Interval estimasi diperoleh dengan cara yang
persis sama. Jika model tersebut tidak memenuhi asumsi model linier klasik — misalnya, jika
memuat variabel dependen yang tertinggal, seperti pada (18.44) — interval estimasi masih
mendekati valid, asalkan It-1 biasanya didistribusikan dengan rata-rata nol dan varians konstan.

2 1/ 2
se ( e^ n+1 ) ={ se ( f^ n ) + σ^ 2 } ,
[ ] [18.46]

dan (estimasi) interval estimasi 95% adalah

^f n ± 1.96 ∙ se ( e^ n +1 ). [18.47]

Contoh 18.8 Memprakirakan Tingkat Pengangguran A.S.

Kami menggunakan data dalam PHILLIPS, tetapi hanya untuk tahun 1948 hingga 1996, untuk
memperkirakan tingkat pengangguran sipil A.S. untuk 1997. Kami menggunakan dua model.
Yang pertama adalah model AR (1) sederhana untuk unem:
u^
nemt=1.572+.732 unemt−1
( .577 ) ( .097 ) [18.48]
n=48 , Ŕ2=.544 , σ^ =1.049.
Dalam model kedua, kami menambahkan inflasi dengan jeda satu tahun:
u^
nemt=1.304 +.647 unem t−1+ .184 inf t −1
( .490 ) ( .084 ) (.041) [18.49]
n=48 , Ŕ2=.677 , σ^ =883 .
Tingkat inflasi yang lambat sangat signifikan pada (18.49) (t ≈ 4.5), dan R-square yang
disesuaikan dari persamaan kedua jauh lebih tinggi daripada yang dari yang pertama. Namun
demikian, ini tidak berarti bahwa persamaan kedua akan menghasilkan estimasi yang lebih
baik untuk tahun 1997. Yang dapat kita katakan sejauh ini adalah, dengan menggunakan data
hingga tahun 1996, jeda inflasi membantu menjelaskan variasi dalam tingkat pengangguran.

Untuk mendapatkan prediksi untuk tahun 1997, kita perlu mengetahui unem dan inf pada
tahun 1996. Masing-masing adalah 5.4 dan 3.0. Oleh karena itu, estimasi unem 1997 dari
persamaan (18.48) adalah 1.572 + .732 (5.4), atau sekitar 5.52. Estimasi dari persamaan
(18.49) adalah 1.304 + .647 (5.4) + .184 (3.0), atau sekitar 5.35. Tingkat pengangguran sipil
aktual untuk tahun 1997 adalah 4,9, sehingga kedua persamaan di atas memprediksi tingkat
aktual. Kondisi ini memberikan estimasi yang lebih baik.

Model dalam persamaan (18.43) adalah salah satu persamaan dalam apa yang dikenal sebagai
model vector autoregressive (VAR). Kita tahu apa model autoregresif dari Chapter 11: kita
memodelkan satu seri, { y t }, dalam hal masa lalunya sendiri. Dalam model autoregresif vektor,
kami memodelkan beberapa seri — yang, jika Anda akrab dengan aljabar linier, adalah tempat
kata “vector” berasal — dalam hal masa lalu mereka sendiri. Jika kita memiliki dua seri, y t dan
x t , autoregresi vektor terdiri dari persamaan yang terlihat seperti

y t =δ 0+ α 1 y t−1 +γ 1 z t −1 +α 2 y t −2+ γ 2 z t−2 +… [18.50]

an

z t=η0 + β 1 y t −1 + ρ1 z t−1 + β 2 y t −2 + ρ2 z t−2 +…,

di mana setiap persamaan berisi error yang memiliki nilai nol yang diharapkan diberikan
informasi masa lalu pada y dan z.Pada persamaan (18.43) —dan dalam contoh yang diestimasi
dalam (18.49) —kita berasumsi bahwa satu lag dari setiap variabel dapatmengambil semua
dinamika. (Uji F untuk signifikansi gabungan unemt−2dan inf t−2 mengkonfirmasi bahwa hanya
satu lag dari masing-masing diperlukan.)
Persamaan seperti (18.50) memungkinkan kita untuk menguji apakah, setelah mengendalikan
nilai-nilai masa lalu y, nilai-nilai masa lalu z membantu untuk memprediksi y t . Secara umum,
kita mengatakan bahwa z Granger menyechapterkan y jika

E ( y t|I t −1 ) ≠ E ( y t|J t −1 ), [18.51]

di mana I t−1 berisi informasi masa lalu tentang y dan z, dan J t −1 hanya berisi informasi tentang
masa lalu y. Ketika (18.51) berlaku, melewati z berguna, sebagai tambahan untuk melewati y,
untuk memprediksi y t . Istilah “penyechapter” dalam “penyechapter Granger” harus ditafsirkan
dengan hati-hati. Satu-satunya pengertian di mana z “menyechapter” y diberikan dalam (18.51).
Secara khusus, tidak ada yang mengatakan tentang kausalitas kontemporer antara y dan z,
sehingga tidak memungkinkan kita untuk menentukan apakah z t adalah variabel eksogen atau
endogen dalam suatu persamaan yang menghubungkan y t ke z t . (Ini juga mengapa gagasan
kausalitas Granger tidak berlaku dalam konteks cross-sectional murni.)

Setelah kita mengasumsikan model linier dan memutuskan berapa banyak keterlambatan y harus
dimasukkan dalam E ( y t| y t−1 , y t −2 , … ) , kita dapat dengan mudah menguji hipotesis nol bahwa z

tidak menyechapterkan Granger y. Untuk lebih spesifik, anggaplah bahwa E ( y t| y t−1 , y t −2 , … )


hanya bergantung pada tiga lag:

y t =δ 0+ α 1 y t−1 +α 2 y t −2 + α 3 y t−3 +ut

E ( ut| y t−1 , y t −2 , … )=0 .

Sekarang, di bawah hipotesis nol bahwa z tidak menyechapterkan Granger y, setiap lag z yang
kita tambahkan ke persamaan harus memiliki koefisien populasi nol. Jika kita menambahkan z t−1
, maka kita cukup melakukan uji t pada z t−1. Jika kita menambahkan dua lag z, maka kita dapat
melakukan uji F untuk signifikansi gabungan dari z t−1. dan 2. dalam persamaan

y t =δ 0+ α 1 y t−1 +α 2 y t −2 + α 3 y t−3 +γ 1 z t −1 + γ 2 z t −2+u t.

Sebagai hal yang praktis, bagaimana kita memutuskan keterlambatan y dan z untuk dimasukkan?
Pertama, kita mulai dengan memperkirakan model autoregresif untuk y dan melakukan uji t dan
F untuk menentukan berapa banyak keterlambatan y yang akan muncul. Dengan data tahunan,
jumlah lag biasanya kecil, katakanlah, satu atau dua. Dengan data triwulanan atau bulanan,
biasanya ada lebih banyak keterlambatan. Setelah model autoregresif untuk y telah dipilih, kita
dapat menguji lag z. Pilihan lag z kurang penting karena, ketika z tidak menyechapterkan error y,
tidak ada set lag z yang harus signifikan. Dengan data tahunan, 1 atau 2 lag biasanya digunakan;
dengan data triwulanan, biasanya 4 atau 8; dan dengan data bulanan, mungkin 6, 12, atau bahkan
24, diberikan data yang cukup.

Kami telah melakukan satu contoh pengujian untuk kausalitas Granger dalam persamaan (18.49).
Model autoregresif yang paling cocok dengan pengangguran adalah AR (1). Dalam persamaan
(18.49), kami menambahkan satu label inflasi, dan itu sangat signifikan. Karena itu, inflasi
Granger cause pengangguran.

18-5c Membandingkan Estimasi Satu Langkah ke Depan

Di hampir semua masalah peprediksi, ada beberapa metode bersaing untuk peprediksi. Bahkan
ketika kita membatasi perhatian pada model regresi, ada banyak kemungkinan. Variabel mana
yang harus dimasukkan, dan dengan berapa banyak keterlambatan? Haruskah kita menggunakan
log, level variabel, atau perbedaan pertama?

Untuk memutuskan metode estimasi, kita perlu cara untuk memilih mana yang paling cocok.
Secara luas, kita dapat membedakan antara kriteria in-sample dan out-of-sample. Dalam konteks
regresi, kriteria dalam sampel termasuk R-square dan disesuaikan-R square. Ada banyak statistik
pemilihan model lainnya, tetapi kami tidak akan membahasnya di sini [lihat, misalnya,
Ramanathan (1995, Chapter 4)].

Untuk peprediksi, lebih baik menggunakan kriteria out-of-sample, karena peprediksi pada
dasarnya merupakan masalah di luar sampel. Sebuah model mungkin memberikan kecocokan
yang baik untuk y dalam sampel yang digunakan untuk memperkirakan parameter. Tapi ini tidak
perlu diterjemahkan menjadi kinerja peprediksi yang baik. Perbandingan di luar sampel
melibatkan penggunaan bagian pertama sampel untuk memperkirakan parameter model dan
menyimpan bagian terakhir sampel untuk mengukur kemampuan estimasinya. Ini meniru apa
yang harus kita lakukan dalam praktik jika kita belum tahu nilai variabel di masa depan.

Misalkan kita memiliki pengamatan n+ m, di mana kita menggunakan pengamatan n pertama


untuk memperkirakan parameter dalam model kita dan menyimpan pengamatan m terakhir untuk
peprediksi. Biarkan ^f n+h menjadi estimasi satu langkah di depan y n+ h+1 selama h=0 , 1, … , m−1.
Estimasi error m adalah e^ n+h +1= y n +h+1− f^ n+ h. Bagaimana seharusnya kita mengukur seberapa baik
model kita memprediksi y ketika itu keluar dari sampel? Dua ukuran paling umum. Yang
pertama adalah root mean squared error (RMSE):

m−1 1 /2

(
RMSE= m −1 ∑ e^ 2n+h +1
h=0
) .

Ini pada dasarnya adalah standar deviasi sampel dari prediksi error(tanpa penyesuaian derajat
kebebasan). Jika kami menghitung RMSE untuk dua atau lebih metode peprediksi, maka kami
lebih memilih metode ini dengan RMSE

Ukuran umum kedua adalah error absolut rata-rata (MAE), yang merupakan rata-rata estimasi
error absolut:

m −1
MAE=m−1 ∑ |e^ 2n+h+1|. [18.53]
h=0

Sekali lagi, kami lebih suka MAE yang lebih kecil. Kriteria lain yang mungkin termasuk
meminimalkan nilai absolut terbesar dari estimasi error.

Contoh 18.9 Perbandingan di Luar Sampel dari Estimasi Pengangguran

Dalam Contoh 18.8, kami menemukan bahwa persamaan (18.49) cocok terutama lebih baik
selama tahun 1948 hingga 1996 daripada persamaan (18.48), dan, setidaknya untuk peprediksi
pengangguran pada tahun 1997, model yang memasukkan inflasi yang tertinggal berjalan lebih
baik. Sekarang, kami menggunakan dua model, masih diperkirakan menggunakan data hanya
sampai tahun 1996, untuk membandingkan estimasi satu langkah ke depan untuk tahun 1997
hingga 2003. Ini membuat tujuh pengamatan di luar sampel (n = 48 dan m = 7) menggunakan
dalam persamaan (18.52) dan (18.53). Untuk model AR (1), RMSE = .962 dan MAE = .778.
Untuk model yang menambahkan inflasi yang lambat (model VAR pesanan satu), RMSE = .673
dan MAE = .628. Jadi, dengan ukuran apa pun, model yang memasukkan inf t−1 menghasilkan
estimasi yang lebih baik untuk tahun 1997 hingga 2003. Dalam kasus ini, kriteria sampel dan
sampel yang keluar memilih model yang sama. Dalam Contoh 18.8, kami menemukan bahwa
persamaan (18.49) cocok terutama lebih baik selama tahun 1948 hingga 1996 daripada
persamaan (18.48), dan setidaknya untuk peprediksi pengangguran pada tahun 1997, model yang
memasukkan inflasi yang tertinggal berjalan lebih baik. Sekarang, kami menggunakan dua
model, masih diperkirakan menggunakan data hanya sampai tahun 1996, untuk membandingkan
estimasi satu langkah ke depan untuk tahun 1997 hingga 2003. Ini membuat tujuh pengamatan di
luar sampel (n = 48 dan m = 7) menggunakan dalam persamaan (18.52) dan (18.53). Untuk
model AR (1), RMSE = .962 dan MAE = .778. Untuk model yang menambahkan inflasi yang
lambat (model VAR pesanan satu), RMSE = .673 dan MAE = .628. Jadi, dengan ukuran apa
pun, model yang memasukkan inf t−1 menghasilkan estimasi yang lebih baik untuk tahun 1997
hingga 2003. Dalam kasus ini, kriteria sampel dan sampel yang keluar memilih model yang
sama.

Daripada hanya menggunakan pengamatan n pertama untuk memperkirakan parameter model,


kami dapat memperkirakan model setiap kali kami menambahkan pengamatan baru dan
menggunakan model baru untuk memperkirakan periode berikutnya.

18-5d Estimasi Beberapa Langkah Ke depan

Peprediksi lebih dari satu periode ke depan umumnya lebih sulit daripada estimasi satu periode
ke depan. Kita dapat memformalkan ini sebagai berikut. Misalkan kita mempertimbangkan
memprediksi y t −1 pada waktu t dan pada periode waktu sebelumnya s (sehingga s, t). Kemudian
[ y t+1 −E ( y t +1|I t ) ]≤ Var [ y t +1−E ( y t +1| I s ) ], di mana ketidaksetaraan biasanya ketat. Kami tidak
akan membuktikan hasil ini secara umum, tetapi, secara intuitif, masuk akal: varians prediksi
errordalam memprediksi y t −1 lebih besar ketika kami membuat prediksi itu berdasarkan
informasi yang lebih sedikit.

Jika { y t } mengikuti model AR (1) (yang mencakup jalan acak, mungkin dengan drift), kami
dapat dengan mudah menunjukkan bahwa varians error meningkat dengan horizon estimasi.
Modelnya adalah

y t =α + ρ y t −1+ ut

E ( ut| I t −1 )=0 , I t−1={ y t−1 , y t −2 , … },

dan {ut } memiliki varian σ 2 konstan yang bergantung pada I t−1. Pada waktu t+ h−1, estimasi
kami tentang y t +h adalah α + ρ y t+ h−1 , dan estimasi error hanyalah ut +h. Oleh karena itu, varian
estimasi selangkah lebih maju σ 2. Untuk menemukan estimasi beberapa langkah ke depan, kami,
dengan substitusi berulang,

y t +h=( 1+ ρ+ …+ ρh−1 ) α + ρh y t

+ ρ h−1 ut +1+ ρh−2 u t+2 +…+ ut +h.

Pada waktu t, nilai yang diharapkan dari ut + j, untuk semua j ≥ 1, adalah nol. Begitu

E ( y t +h|I t )= ( 1+ ρ+…+ ρ h−1 ) α + ρh y t, [18.54]

Persamaan (18.54) menunjukkan bahwa menggunakan model AR (1) untuk peprediksi itu
mudah, setelah kami memperkirakan r oleh OLS. Estimasi y n+ h pada waktu n adalah

^f = ( 1+ ^ρ +…+ ^ρh −1 ) α^ + ^ρ h y . [18.55]


n ,h n

Memperoleh interval estimasi lebih sulit, kecuali h=1, karena mendapatkan standar error ^f n ,h

sulit. Namun demikian, standar error ^f n ,h biasanya kecil dibandingkan dengan standar deviasi
istilah error, dan yang terakhir dapat diperkirakan sebagai σ 2 [ ^ρ2 ( h−1 )+ ^ρ2 (h−2) +…+ ρ^ 2+1]1 /2 , di
mana σ^ adalah standar error regresi dari estimasi AR (1). Kita bisa menggunakan ini untuk
mendapatkan estimasi interval kepercayaan. Misalnya, ketika h=2, estimasi interval
kepercayaan 95% (untuk n besar) adalah

^f n ,2 ±1.96 σ^ (1+ ^ρ2)1 /2. [18.56]

Karena kita meremehkan standar deviasi y n+ h, interval ini terlalu sempit, tetapi mungkin tidak
terlalu banyak, terutama jika n besar.

E ( y n +2|I n ) =α+ ρ1 E ( y n+ 1|I n ) + ρ2 y n.

Kita bisa menulis ini sebagai

f n ,2=α + ρ1 f n , 1+ ρ2 y n ,

sehingga prediksi dua langkah di depan pada waktu n dapat diperoleh setelah kami mendapatkan
prediksi satu langkah di depan. Jika parameter model AR (2) telah diperkirakan oleh OLS, maka
kami mengoperasikan ini sebagai
^f n ,2= α^ + ^ρ1 f^ n , 1+ ^ρ2 y n . [18.57]

Alasan yang sama dapat digunakan untuk mendapatkan estimasi beberapa langkah di depan
untuk model VAR. Sebagai ilustrasi, misalkan kita punya

y t =δ 0+ α 1 y t−1 +γ 1 z t −1 +ut [18.58]

Dan

z t=η0 + β 1 y t −1 + ρ1 z t−1 +v t .

Sekarang, jika kita ingin memprediksi y n+ 1pada waktu n, kita cukup menggunakan
^f = δ^ + α^ y + ^γ z . Demikian juga, estimasi z n+1 pada waktu n adalah (katakanlah)
n ,1 0 1 n 1 n

^gn , 1=η^ 0 + ^β 1 y n + ρ^ 1 z n. Sekarang, anggaplah kita ingin mendapatkan prediksi y dua langkah di
depan pada waktu n. Dari (18.58), kami punya

E ( y n +2|I n ) =δ 0 + α 1 E ( y n+1|I n )+ γ 1 E ( z n+1|I n )

[karena E ( un +2|I n ) =0] jadi kita bisa menulis prediksi sebagai

^f n ,2= δ^ 0 + α^ 1 ^f n ,1 + ^γ 1 g^ n ,1. [18.59]

Persamaan ini menunjukkan bahwa prediksi dua langkah ke depan untuk y tergantung pada
prediksi satu langkah ke depan untuk y dan z. Secara umum, kita dapat membangun estimasi
beberapa langkah di depan dengan menggunakan rumus rekursif

^f n ,h= δ^ 0 + α^ 1 f^ n , h−1 + γ^ 1 g^ n ,h−1, h ≥ 2.

Contoh 18.10 Estimasi Dua Tahun Ke Depan untuk Tingkat Pengangguran

Untuk menggunakan persamaan (18.49) untuk memperkirakan pengangguran dua tahun ke


depan — katakanlah, angka tahun 1998 menggunakan data selama tahun 1996 — kita
membutuhkan model untuk inflasi. Model terbaik untuk inf dalam hal keterlambatan unem dan
infappears menjadi model AR (1) sederhana (unem-1 tidak signifikan ketika ditambahkan ke
regresi):
^ t=1.277+.665 inf t−1
inf
( .558 ) ( .107 )
n=48 , R2=.457 , Ŕ2=.445 .
Jika kita memasukkan nilai inf pada 1996 ke dalam persamaan ini, kita mendapatkan estimasi
^ 1997=3.27. Sekarang, kita bisa menyambungkan inf ini, bersama dengan
inf untuk 1997 inf
u^
nem1997=5.35 (yang kita dapatkan sebelumnya), ke (18.59) hingga peprediksi unem1998:
u^
nem1998=1.304 +.647 ( 5.35 ) +.184(3.27) ≈ 5.37.
Ingat, prediksi ini hanya menggunakan informasi sampai tahun 1996. Estimasi satu langkah di
depan unem1998, yang diperoleh dengan memasukkan nilai-nilai unem dan inf ke 1997 (18,48),
sekitar 4,90. Pengangguran aktual pada tahun 1998 adalah 4,5%, yang berarti bahwa, dalam
hal ini, estimasi satu langkah di depan sedikit lebih baik daripada estimasi dua langkah di
depan.

18-5e Peprediksi Tren, musiman, dan Proses Terpadu

Kami sekarang beralih ke seri peprediksi yang menunjukkan tren, memiliki musim, atau
memiliki unit akar. Ingat dari Chapter 10 dan 11 bahwa salah satu pendekatan untuk menangani
tren variabel dependen atau independen dalam model regresi adalah dengan memasukkan tren
waktu, yang paling populer adalah tren linier. Tren dapat dimasukkan dalam estimasi persamaan
juga, meskipun harus digunakan dengan hati-hati

Dalam kasus yang paling sederhana, anggaplah bahwa { y t } memiliki tren linier tetapi tidak
dapat diprediksi di sekitar tren itu. Kemudian, kita dapat menulis

y t =α + βt +ut , E ( ut| I t −1 )=0 , t=1 , 2, …, [18.60]

di mana, seperti biasa, I t−1mberisi informasi yang diamati melalui waktu t - 1 (yang mencakup
setidaknya melewati y). Bagaimana kita memperkirakan y n+ h pada waktu n untuk setiap h ≥ 1? Ini

sederhana karena E ( y n +h|I n ) =α + β(n+h).Varian estimasi error hanya σ 2=Var (ut ) (dengan
asumsi varian konstan dari waktu ke waktu). Jika kita memperkirakan α dan β oleh OLS
menggunakan pengamatan n pertama, maka estimasi kita untuk y n+ h pada waktu n adalah
^f n ,h= α^ + β^ (n+ h).
Dengan kata lain, kita cukup memasukkan periode waktu yang sesuai dengan y ke fungsi tren
yang diperkirakan. Sebagai contoh, jika kita menggunakan pengamatan n = 131 di BARIUM
untuk memperkirakan impor bulanan barium klorida Cina ke Amerika Serikat dari Cina, kita
memperoleh α^ =249.56 dan ^β=5.15. Periode sampel berakhir pada Desember 1988, sehingga
estimasi impor barium klorida Tiongkok enam bulan kemudian adalah 249,56 + 5.15(137) =
955,11, diukur sebagai ton pendek. Sebagai perbandingan, nilai Desember 1988 adalah 1.087,81,
sehingga lebih besar dari nilai yang diperkirakan enam bulan kemudian. Serial dan estimasi garis
trennya ditunjukkan pada Gambar 18.2.

Seperti yang kita bahas di Chapter 10, sebagian besar deret waktu ekonomi lebih baik ditandai
memiliki, setidaknya sekitar, tingkat pertumbuhan konstan, yang menunjukkan bahwa log ( y t )
mengikuti tren waktu linier. Misalkan kita menggunakan n pengamatan untuk memperoleh
persamaan

log ( y t )=α^ + ^β t, t=1, 2, …, n. [18.61]


Kemudian, untuk memperkirakan log{y} pada periode waktu mendatang 1 jam, kita cukup
tancapkan 1 jam ke dalam persamaan tren, seperti sebelumnya. Tapi ini tidak memungkinkan
kita untuk memperkirakan y, yang biasanya kita inginkan. Sangat menggoda untuk secara
eksponensial α^ + ^β (n+h) untuk mendapatkan prediksi untuk y n+ h, tetapi ini tidak tepat, karena
alasan yang sama dengan yang kami berikan pada Bagian 6-4. Kita harus menghitung dengan
benar untuk error yang tersirat dalam (18.61). Cara paling sederhana untuk melakukan ini adalah
^ t ) tanpa intersep. Biarkan γ^ menjadi
dengan menggunakan observasi untuk regresi pada exp ⁡( logy
^ t ). Kemudian, estimasi y dalam periode n + h adalah
koefisien kemiringan pada exp ⁡( logy
sederhana

^f = γ^ exp [ α^ + ^β ( n+ h ) ]. [18.62]
n ,h

Meskipun model tren dapat berguna untuk prediksi, mereka harus digunakan dengan hati-hati,
terutama untuk peprediksi jauh ke seri terintegrasi di masa depan yang mengalami pergeseran.
Masalah potensial dapat dilihat dengan mempertimbangkan jalan acak dengan drift. Pada waktu
t+ h, kita dapat menulis y t +h sebagai

y t +h=βh+ yt +ut +1+ …+ut +h,

di mana β adalah istilah drift (biasanya β >0), dan setiap ut − j memiliki rata-rata nol yang
diberikan dan varians σ 2. Seperti yang kita lihat sebelumnya, estimasi y t +h pada waktu t adalah
E ( y n +h|I t )=βh+ y t , dan varians error σ 2 h. Apa yang terjadi jika kita menggunakan model tren

linier? Misalkan y 0 menjadi nilai awal dari proses, yang kita ambil sebagai bukan acak. Lalu,
kita juga bisa menulis

y t +h= y 0 + β ( t+ h )+ u1+ u2+ …+ut +h

¿ y 0 + β ( t +h ) + v t +h.

Tren deterministik juga dapat menghasilkan estimasi yang buruk jika parameter tren diestimasi
menggunakan data lama dan proses tersebut memiliki perubahan berikutnya dalam garis tren.
Terkadang, guncangan eksogen — seperti krisis minyak tahun 1970-an — dapat mengubah
lintasan variabel yang sedang tren. Jika garis tren lama digunakan untuk memprediksi jauh ke
masa depan, estimasi itu mungkin jauh. Masalah ini dapat dikurangi dengan menggunakan data
terbaru yang tersedia untuk mendapatkan parameter garis tren.

Tidak ada yang mencegah kami menggabungkan tren dengan model lain untuk estimasi.
Misalnya, kita dapat menambahkan tren linier ke model AR (1), yang dapat bekerja dengan baik
untuk seri peprediksi dengan tren lineart tetapi yang juga proses AR stabil di sekitar tren.

Ini juga mudah untuk memperkirakan proses dengan musiman deterministik (bulanan atau
triwulanan). Misalnya, file BARIUM berisi produksi bensin bulanan di Amerika Serikat dari
tahun 1978 hingga 1988. Seri ini tidak memiliki tren yang jelas, tetapi memiliki pola musim
yang kuat. (Produksi bensin lebih tinggi di bulan-bulan musim panas dan di bulan Desember.)
Dalam model yang paling sederhana, kita akan mengurangi gas (diukur dalam galon) pada
dummy tiruan 11 bulan, katakanlah, untuk Februari hingga Desember. Kemudian, estimasi untuk
bulan depan hanyalah intersep plus koefisien pada dummy bulan yang sesuai. (Untuk bulan
Januari, estimasi hanyalah intersep dalam regresi.) Kami juga dapat menambahkan lag variabel
dan tren waktu untuk memungkinkan rangkaian umum dengan musiman.

Proses peprediksi dengan unit akar juga patut mendapat perhatian khusus. Sebelumnya, kami
memperoleh nilai tak terduga dari jalan acak yang tergantung pada informasi sepanjang waktu n.
Untuk memperkirakan jalan acak, dengan kemungkinan drift α, h periode ke masa depan pada
waktu n, kami menggunakan ^f n ,h= α^ h + y n , di mana α^ adalah rata-rata sampel Δ y t naik hingga
t=n. (Jika tidak ada penyimpangan, kami menetapkan α^ =0). Pendekatan ini menerapkan unit
akar. Alternatifnya adalah memperkirakan model AR (1) untuk { y t } dan menggunakan rumus
prediksi (18.55). Pendekatan ini tidak memaksakan akar unit, tetapi jika ada, ^ρ konvergen
prochapterilitas menjadi satu ketika n bertambah besar. Namun demikian, ^ρ dapat sangat berbeda
dari satu, terutama jika ukuran sampel tidak terlalu besar. Masalah pendekatan mana yang
menghasilkan peprediksi sampel yang lebih baik di luar sampel merupakan masalah empiris. Jika
dalam model AR (1), ρ kurang dari satu, bahkan sedikit, model AR (1) akan cenderung
menghasilkan estimasi jangka panjang yang lebih baik.

Secara umum, ada dua pendekatan untuk menghasilkan estimasi untuk proses I (1). Yang
pertama adalah memaksakan akar unit. Untuk estimasi satu langkah di depan, kami memperoleh
model untuk memperkirakan perubahan dalam y, Δ y t +1, yang diberikan informasi melalui waktu
t. Kemudian, karena y t +1=Δ y t+1 + y t , E ( y t +1|I t )=E ( y n+h|I t ) + y t . Oleh karena itu, estimasi y n+ 1
kami pada saat n hanya

^f n= ^gn + y n .

di mana ^gnadalah estimasi Δ y n+1pada waktu n. Biasanya, model AR (yang harus stabil)
digunakan untuk Δ y t , atau vektor autoregresi.

Ini dapat diperluas ke estimasi beberapa langkah di depan dengan menuliskan y n+ hsebagai

y n+ h=( y n +h− y n+ h−1 ) + ( y n +h−1− y n+ h−2 ) + …+ ( y n+ 1− y n ) + y n,

Atau

y n+ h=Δ y n +h + Δ y n +h−1+ …+ Δ y n +1+ Δ y n.

Oleh karena itu, estimasi y n+ hpada waktu n adalah

^f n= ^gn , h+ g^ n ,h−1 +…+ g^ n ,1+ y n, [18.63]

Pendekatan kedua untuk variabel peprediksi I (1) adalah dengan menggunakan model AR atau
VAR umum untuk { y t }. Ini tidak memaksakan unit akar. Misalnya, jika kita menggunakan
model AR (2),

y t =α + ρ1 y t −1+ ρ2 y t −2 +ut , [18.64]

Kemudian ρ1 + ρ2=1. Jika kita menghubungkan ρ1=1−ρ2 dan mengatur ulang, kita memperoleh
Δ y t =α −ρ 2 Δ y t −1+u t , yang merupakan model AR (1) stabil dalam perbedaan yang membawa
kita kembali ke pendekatan pertama yang dijelaskan sebelumnya. . Tidak ada yang mencegah
kami memperkirakan (18.64) secara langsung oleh OLS. Satu hal yang menyenangkan tentang
regresi ini adalah kita dapat menggunakan statistik t biasa pada ^ρ2untuk menentukan apakah y t −2
signifikan. (Ini mengasumsikan bahwa asumsi homoskedasitas berlaku; jika tidak, kita dapat
menggunakan bentu heterskedasitias.) Kami tidak akan menunjukkan ini secara formal, tetapi,
secara intuitif, ia mengikuti dengan menulis ulang persamaan y t =α + γ y t −1−ρ2 Δ y t−1 +ut , di
mana γ = ρ1+ ρ2. Bahkan jika γ =1, ρ2 adalah minus koefisien pada stasioner, proses { Δ y t −1 }
sangat lemah. Karena hasil regresi akan identik dengan (18.64), kita dapat menggunakan (18.64)
secara langsung.

Sebagai contoh, mari kita perkirakan model AR (2) untuk tingkat kesuburan umum di FERTIL3,
menggunakan pengamatan sampai 1979. (Dalam Latihan Komputer C8, Anda diminta untuk
menggunakan model ini untuk peprediksi, itulah sechapternya kami menyimpan beberapa
pengamatan di akhir sampel.)

^
gfrt =3.22+1.272 gfr t−1−.311 gfr t−2

( 2.92 ) (.120 ) (.121) [18.49]

n=65 , R 2=.949 , Ŕ 2=.947.

Koefisien pada dua lag dalam (18,65) menambahkan hingga 0,961, yang dekat dengan dan tidak
berbeda secara statistik dari satu (seperti yang dapat diverifikasi dengan menerapkan uji Dickey-
Fuller yang diperbesar dengan persamaan Δ gfr t=α +θ gfr t −1+ δ 1 Δ gfrt −1+u t) . Meskipun kami
belum memberlakukan batasan akar unit, kami masih bisa menggunakan (18.65) untuk estimasi,
seperti yang kita bahas sebelumnya.

Sebelum mengakhiri bagian ini, kami menunjukkan satu potensi perbaikan dalam peprediksi
dalam konteks model autoregresif vektor dengan variabel I (1). Misalkan { y t } dan { z t } adalah
setiap proses I (1). Satu pendekatan untuk mendapatkan estimasi y adalah memperkirakan
autoregresi bivariat dalam variabel Δ y t dan Δ z t dan kemudian menggunakan (18,63) untuk
menghasilkan estimasi satu atau beberapa langkah ke depan; ini pada dasarnya adalah
pendekatan pertama yang kami jelaskan sebelumnya. Namun, jika y t dan z t dikointegrasi, kami
memiliki variabel yang lebih diam dan stabil dalam kumpulan informasi yang dapat digunakan
dalam peprediksi Δy: yaitu, lag y t =β z t , di mana β adalah parameter kointegrasi. Model koreksi
error sederhana adalah

Δ y t =α 0+ α 1 ∆ y t −1 + γ 1 z t −1+ δ 1 ( y t−1−β z t−1 ) +e t,

E ( e t|I t−1 ) =0.


Dengan mengatur ulang model koreksi error, kita dapat menulis

di mana , dan seterusnya, yang merupakan persamaan pertama dalam


model VAR untuk ytand zt. Perhatikan bahwa ini tergantung pada lima parameter, sama seperti
pada model koreksi error. Poinnya adalah bahwa, untuk keperluan peprediksi, model VAR di
level dan model koreksi error pada dasarnya sama. Ini tidak terjadi pada model koreksi error
yang lebih umum. Misalnya, misalkan dalam (18.66), tetapi kami memiliki istilah

koreksi error kedua, . Kemudian, model koreksi error hanya melibatkan empat
parameter, sedangkan (18.67) —yang memiliki urutan yang sama keterlambatan untuk y dan z
— berisi lima parameter. Dengan demikian, model koreksi error dapat menghemat onparameters;
yaitu, mereka umumnya lebih pelit dari VAR di tingkat. Jika yt dan zt adalah I (1) tetapi tidak
terkointegrasi, model yang sesuai adalah (18,66) tanpa istilah koreksi error. Ini dapat digunakan

untuk memprediksi , dan kami dapat menambahkan ini ke yn untuk memprediksi .

Anda mungkin juga menyukai