Regression With Lagged - En.id

8.
Regresi dengan lag

variabel penjelas
Sebagian besar aplikasi di bidang keuangan berkaitan dengan analisis data deret waktu.
Namun, sebagian besar contoh di Bab 3 sampai 7 menggunakan data cross-sectional.
Ini memungkinkan kami untuk membangun ide-ide dasar yang mendasari regresi,
termasuk konsep statistik seperti pengujian hipotesis dan interval kepercayaan, dengan
cara yang sederhana. Ketika bekerja dengan variabel deret waktu, pengetahuan tentang
ide-ide tersebut sangat penting. Namun, beberapa masalah tambahan muncul saat
bekerja dengan data deret waktu. Tujuan dari bab ini adalah untuk menawarkan
pengenalan masalah ini dan untuk membiasakan pembaca dengan beberapa konsep
dan notasi yang digunakan dengan model deret waktu. Setelah materi pengantar ini,
kami mengambil satu langkah ke arah pengembangan model dan metode yang
digunakan dengan deret waktu keuangan.
Tujuan peneliti yang bekerja dengan data deret waktu tidak terlalu berbeda dari peneliti
yang bekerja dengan data cross-sectional: keduanya bertujuan untuk mengembangkan
regresi yang menghubungkan variabel dependen dengan beberapa variabel penjelas.
Namun, analis yang menggunakan data deret waktu akan menghadapi dua masalah
yang tidak akan dihadapi oleh analis yang menggunakan data cross sectional: (1) satu
variabel deret waktu dapat mempengaruhi variabel lain dengan jeda waktu; dan (2) jika
variabel tidak stasioner, masalah yang dikenal sebagai regresi palsu mungkin muncul.
Pada tahap ini, Anda tidak diharapkan untuk memahami yang kedua dari masalah ini.
Istilah regresi nonstasioner, stasioner dan palsu akan dibahas secara rinci dalam bab-
bab selanjutnya dari buku ini. Namun perlu diingat aturan umum ini: Jika Anda memiliki
variabel deret waktu nonstasioner maka Anda tidak boleh memasukkannya ke dalam
model regresi. Rute yang tepat adalah mengubah variabel sebelum menjalankan regresi
untuk membuatnya stasioner. Ada satu pengecualian untuk aturan umum ini, yang akan
kita bahas nanti, dan yang terjadi di mana variabel dalam model regresi terkointegrasi.
Kami akan menguraikan apa yang kami maksud dengan istilah-istilah ini nanti. Jika
Anda merasa bingung untuk memperkenalkannya sekarang tanpa definisi, pikirkan saja
istilah-istilah berikut: Beberapa masalah muncul dengan data deret waktu yang tidak
muncul dengan data cross-sectional. Masalah-masalah ini membuat penggunaan
regresi berganda secara naif berisiko seperti Bab 4 sampai 7. Tujuan dari bab ini dan
bab-bab berikutnya adalah untuk menunjukkan kepada Anda bagaimana memodifikasi
teknik regresi dengan data deret waktu dengan benar.
Dalam bab ini, kita akan menganggap semua variabel dalam regresi adalah stasioner.
Bab berikutnya menjelaskan apa artinya ini. Pada titik ini, perhatikan hanya bahwa
masalah kedua tidak akan terjadi dan karena itu kita dapat fokus pada masalah
pertama. Masalah pertama dapat dipahami secara intuitif dengan beberapa contoh
sederhana. Ketika kami memperkirakan model regresi, kami tertarik untuk mengukur
pengaruh satu atau lebih variabel penjelas pada variabel dependen. Dalam kasus data
deret waktu, kita harus sangat berhati-hati dalam memilih variabel penjelas karena
pengaruhnya terhadap variabel terikat mungkin memerlukan waktu untuk terwujud.
Misalnya, dalam bab-bab sebelumnya kami bekerja dengan regresi cross-sectional yang
melibatkan data perusahaan. Dalam satu contoh, variabel dependen kami adalah
kapitalisasi pasar dan variabel penjelas adalah karakteristik perusahaan (misalnya
pendapatan, aset, penjualan, dll.). Di lain, variabel dependen kami adalah kompensasi
eksekutif yang kami coba jelaskan menggunakan variabel seperti laba dan utang.
Namun, semua variabel dependen dan penjelas kami mengacu pada tahun yang sama.
Dalam praktiknya, ini mungkin tidak masuk akal. Nilai yang ditempatkan pasar saham
pada suatu perusahaan mungkin tidak hanya bergantung pada pendapatan saat ini,
tetapi juga pada pendapatan historis. Lagi pula, pendapatan saat ini dapat dipengaruhi
oleh faktor jangka pendek dan mungkin bukan panduan yang sepenuhnya dapat
diandalkan untuk kinerja jangka panjang. Misalnya, sebuah perusahaan es krim
mungkin mengalami penurunan pendapatan jangka pendek karena musim panas yang
luar biasa dingin. Melihat data berdasarkan peristiwa yang tidak biasa ini dapat
memberikan pandangan yang tidak dapat diandalkan tentang potensi jangka panjang
perusahaan ini. Pertimbangan serupa berlaku untuk contoh kompensasi eksekutif kami
di mana kompensasi mungkin ditentukan tidak hanya pada keuntungan saat ini, tetapi
juga pada keuntungan masa lalu. Singkatnya, ada alasan bagus untuk memasukkan
tidak hanya nilai variabel penjelas saat ini, tetapi juga nilai masa lalu.
Untuk menempatkan konsep ini dalam bahasa regresi, kita katakan bahwa nilai variabel
dependen pada suatu titik waktu tertentu harus bergantung tidak hanya pada nilai
variabel penjelas pada periode waktu itu, tetapi juga pada nilai-nilai variabel penjelas
dalam masa lalu. Model sederhana untuk menggabungkan efek dinamis tersebut
memiliki bentuk:1
Ini persis sama dengan model regresi berganda pada Bab 6, dengan pengecualian
bahwa "variabel penjelas" tidak sepenuhnya berbeda (misalnya ukuran kavling, jumlah
kamar mandi, jumlah kamar tidur, dll.) tetapi hanya satu variabel penjelas yang diamati
pada periode waktu yang berbeda. Dalam model ini, variabel sisi kanan disebut sebagai
variabel tertinggal dan q, urutan lag atau panjang lag. Kami akan fokus pada kasus di
mana variabel dependen tergantung pada satu variabel penjelas dan lag-nya. Namun,
semua yang kami katakan dapat digeneralisasikan secara langsung ke beberapa
variabel penjelas, semuanya memiliki jeda waktu. Karena pengaruh variabel penjelas
1
Kita dapat, tentu saja, memberi label pada koefisien kita menggunakan konvensi apa pun yang
kita inginkan. Konvensi yang dipilih di sini berhubungan dengan subskrip padab dengan jumlah
periode lalu yang menjadi acuan variabel penjelas. Contohnya,b1 adalah koefisien pada Xt-1,
yang merupakan nilai variabel penjelas satu periode yang lalu.
terhadap variabel terikat tidak terjadi sekaligus, melainkan terdistribusi dalam beberapa
periode waktu,
Karena model regresi dengan jeda waktu adalah model regresi, semua yang kami
katakan di Bab 4 sampai 6 tentang regresi relevan di sini. Misalnya, paket komputer
seperti Excel dapat memberikan perkiraan koefisien OLS, interval kepercayaan, dan
nilai P untuk menguji apakah koefisien sama dengan nol. Koefisien dapat diartikan
sebagai ukuran pengaruh variabel penjelas terhadap variabel dependen. Dalam hal ini,
kita harus berhati-hati dengan waktu. Misalnya, kami menafsirkan hasil sebagai: “b2
mengukur pengaruh variabel penjelas dua periode lalu terhadap variabel terikat, ceteris
paribus”. Selain perbedaan kecil ini, baik metode statistik maupun interpretasinya sangat
mirip dengan alat yang kami jelaskan sebelumnya. Namun demikian, ada baiknya
membahas kelas model ini secara terpisah, karena ini akan membantu kita
mengembangkan beberapa terminologi deret waktu dan memperkenalkan ide-ide yang
akan kita kembangkan dalam bab-bab berikutnya.
Sebelum beralih ke contoh ilustratif tentang bagaimana bekerja dengan model regresi
dengan variabel tertinggal, kita akan membuat dua jalan memutar singkat. Salah
satunya menjelaskan apa itu variabel tertinggal dan bagaimana menghitungnya dalam
paket perangkat lunak spreadsheet. Yang lain menjelaskan notasi yang akan digunakan
dalam bab ini dan bab selanjutnya.
Selain pada variabel tertinggal
Konsep variabel tertinggal adalah dasar untuk data deret waktu, jadi kami akan
menjelaskan secara rinci apa artinya dan bagaimana membangun dan bekerja dengan
variabel tertinggal pada spreadsheet komputer. Kami melakukan ini sebagian besar
karena sangat membantu untuk memahami apa itu variabel tertinggal dengan melihat
bagaimana mereka dibangun. Namun, kami sebagian bekerja dengan spreadsheet
untuk mulai menunjukkan kepada Anda bahwa tidak nyaman bekerja dengan
spreadsheet bila Anda memiliki variabel deret waktu. Dimungkinkan untuk melakukan
hampir semua hal dalam buku ini (dengan pengecualian model yang melibatkan
volatilitas yang akan kita bahas nanti) dengan spreadsheet seperti Excel. Namun, jauh
lebih nyaman menggunakan paket komputer khusus untuk ekonometrik keuangan
seperti E-views, MicroFit, atau Stata.
Misalkan kita memiliki data deret waktu untuk t = 1, . . . , T periode pada variabel X.
Seperti sebelumnya, kami menyatakan pengamatan individu dengan Xt untuk t= 1, . . . ,
T. Pertimbangkan untuk membuat variabel baru W yang memiliki pengamatan Wt= Xt
untuk t = 2, . . . , T dan variabel baru Z yang memiliki pengamatan Zt= Xt-1 untuk t =
2, . . . , T. Mengapa kita menulis t= 2, . . . , T bukannya t= 1, . . . , T ? Jika kita telah
menulis t= 1, . . . , T maka pengamatan pertama variabel Z, Z1, akan diset sama dengan
X0. Namun kita tidak tahu apa itu X0 karena variabel X diamati hanya dari t= 1, . . . , T.
Dengan kata lain, W dan Z hanya memiliki T- 1 pengamatan. Perhatikan juga bahwa kita
telah menulis Zt= Xt-2 maka variabel baru Z akan memiliki pengamatan dari t = 3, . . . , T
dan hanya T- 2 pengamatan.
Variabel baru W dan Z keduanya memiliki T - 1 pengamatan. Jika kita membayangkan

W dan Z sebagai dua kolom yang berisi T- Masing-masing 1 angka (seperti dalam
spreadsheet Excel), kita dapat melihat bahwa elemen pertama dari W adalah X2 dan
elemen pertama dari Z adalah X1. Elemen kedua dari W dan Z adalah X3 dan X2, dst.
Dengan kata lain, kita katakan bahwa W berisi X dan Z berisi X satu periode yang lalu
atau tertinggal satu periode. Secara umum, kita dapat membuat variabel “X tertinggal
satu periode – atau singkatnya “tertinggal X” – “X tertinggal dua periode” – atau, secara
umum, “X tertinggal periode j”.
Anda dapat menganggap “X”, “X tertinggal satu periode”, “X tertinggal dua periode”, dll.
sebagai variabel penjelas yang berbeda dengan cara yang sama seperti “harga rumah”,
“ukuran lot”, atau “jumlah kamar tidur” sebagai variabel penjelas yang berbeda.
Namun, perhatikan bahwa jika Anda ingin memasukkan beberapa variabel penjelas
dalam model regresi berganda, semua variabel harus memiliki jumlah pengamatan yang
sama. Mari kita pertimbangkan implikasi dari pernyataan ini, dalam konteks sekarang.
Misalkan regresi mencakup X= tingkat bunga tertinggal j periode sebagai variabel
penjelas. Jika Anda mulai dengan t= 1, . . . , T pengamatan pada tingkat bunga, maka X
periode j tertinggal hanya akan berisi T- j pengamatan. Karena variabel ini hanya berisi
T-jpengamatan Anda harus memastikan bahwa semua variabel lain dalam model juga
mengandung T . yang tepat- j pengamatan. Dengan kata lain, setiap variabel dalam
regresi deret waktu harus berisi jumlah pengamatan yang sama dengan T dikurangi
jumlah lag maksimum yang dimiliki setiap variabel.
Banyak paket perangkat lunak statistik yang lebih canggih (misalnya E-views, Stata atau
MicroFit,) akan membuat variabel tertinggal secara otomatis dengan perintah
sederhana, tetapi tidak sebagian besar paket spreadsheet seperti Excel. Ini adalah
alasan utama mengapa, ketika bekerja dengan data deret waktu, Anda mungkin ingin
mempelajari paket perangkat lunak seperti itu dan tidak bekerja dengan spreadsheet
seperti Excel. Saat bekerja dengan spreadsheet, Anda harus membuat sendiri variabel
lag sebelum menjalankan regresi yang melibatkannya. Penjelasan singkat tentang
bagaimana melakukan ini akan berguna ketika Anda bekerja dengan spreadsheet dan
akan memberikan cara praktis untuk mengilustrasikan materi di atas.
Sebagai contoh, misalkan kita memiliki 10 observasi pada variabel Y dan X (yaitu
untuk = 1, . . . , 10) dan kami ingin menjalankan model regresi yang mencakup X, lag X,
X
tertinggal dua periode dan X tertinggal 3 periode. Artinya, kami ingin memperkirakan
regresi
model:
Tabel 8.1 menunjukkan bagaimana data akan terlihat dalam format spreadsheet.
Perhatikan bahwa spreadsheet melabeli setiap pengamatan menurut baris dan kolom,
seperti pada Tabel 8.1.
Setiap kolom berisi variabel (misalnya Kolom C berisi variabel X tertinggal satu
periode) dan setiap baris berisi pengamatan. Perhatikan bahwa masing-masing variabel
mengandung
7 pengamatan, yaitu T dikurangi jumlah lag maksimum (yaitu 10 - 3 = 7). mencari
di setiap baris (mis. Baris 4) Anda dapat melihat bahwa: (a) Y dan X berisi data pada titik
tertentu
Tabel 8.1 Membuat variabel tertinggal.
titik waktu (misalnya Y7 dan X7 atau t = 7); (b) Lagged X akan berisi pengamatan dari
satu periode sebelumnya (misalnya X6); (c) X tertinggal dua periode akan berisi
pengamatan
dari dua periode sebelumnya (misalnya X5); dan (d) X tertinggal tiga periode akan berisi
pengamatan dari tiga periode sebelumnya (misalnya X4).
Anda dapat membuat tabel ini di Excel. Pertama gunakan perintah Cut/Paste di
spreadsheet
berisi data asli pada Y dan X (yaitu yang berisi 10 asli
pengamatan pada dua variabel) untuk membuat spreadsheet yang terlihat seperti Tabel
8.1. Kemudian jalankan regresi dengan menggunakan menu regresi Excel dengan cara
standar
dan tentukan A1:A7 di kotak berlabel "Input Y-range", dan B1:E7 di kotak
berlabel "Input X-range".
Bagian tentang variabel tertinggal ini mungkin tampak sedikit relevansi langsung untuk
dipahami
dan menafsirkan hasil. Namun, penting untuk tidak melupakan materi ini
jika Anda berada di depan komputer, bekerja dengan spreadsheet.
Selain notasi
Penting juga untuk memastikan bahwa notasi kita jelas. Pertimbangkan sebuah variabel,
X (mis
kompensasi eksekutif). Setelah mengumpulkan data pada X kita akan melakukan

observasi Xi untuk
saya = 1, . . . , N untuk data penampang dan Xt untuk t= 1, . . . , T untuk data deret

waktu (lihat
Bab 2).
Dengan kata lain, X adalah notasi generik untuk variabel dan Xi atau Xt menunjukkan
tertentu
pengamatan variabel (misalnya Xi = kompensasi eksekutif di ith
perusahaan atau Xt = kompensasi eksekutif dalam periode waktu ke-t). Dalam diskusi
kita
regresi dalam Bab 4 sampai 7 kita sering menulis persamaan bentuk:
kamu = Sebuah + bX + e.
Dinyatakan dengan kata-kata, di atas menyiratkan bahwa "variabel dependen Y

tergantung pada"
variabel penjelas X secara linier”. Ketika kami memiliki data aktual, kami dapat
menulis,
Dinyatakan dengan kata-kata, "pengamatan i dari Y tergantung pada pengamatan i dari

X". Untuk
Misalnya, “kompensasi eksekutif di perusahaan i tergantung pada keuntungan di

perusahaan i”.
Kedua persamaan ini sepenuhnya benar. Tapi, karena subskrip i di yang terakhir
persamaan sedikit jelas (misalnya jelas bahwa kompensasi eksekutif di Perusahaan
A tergantung pada keuntungan di Perusahaan A – tentu tidak akan tergantung pada

keuntungan di
Perusahaan B), Anda sering melihat subskrip i keluar dari persamaan terakhir untuk
demi kesederhanaan.
Kami memperumit notasi kami bahkan lebih dalam Bab 6 dalam diskusi kami tentang
banyak
regresi, di mana X1, X2, . . . , Xk adalah k variabel penjelas yang berbeda. Sini
subskrip pada X menunjukkan variabel penjelas mana yang kami maksud, bukan
pengamatan yang mana. Dalam kasus yang jarang terjadi ketika kami ingin lebih
eksplisit, kami menulis,
misalnya, X2i, untuk menunjukkan pengamatan ke-i dari variabel penjelas kedua.
Namun, karena biasanya jelas dalam kasus regresi berganda bahwa Yi (mis
kompensasi di perusahaan i ) tergantung pada X1i (misalnya laba di perusahaan i ) dan
pada X2i (misalnya perubahan penjualan di perusahaan i ), subskrip i sering dihilangkan

dari
persamaan.
Singkatnya, di seluruh buku ini notasi subskrip kami, yang membedakan antara
variabel dan pengamatan tertentu dari variabel, telah sedikit longgar. Ini adalah
oke (dan umum di buku teks), karena artinya cukup jelas dari konteksnya
dan alternatifnya adalah mengacaukan persamaan dengan banyak subskrip. Pada

waktunya
bab seri buku ini, kami akan menunjukkan informalitas serupa, menggunakan notasi
Xt-j untuk menunjukkan kedua pengamatan tertentu (misalnya jika t = 1968 dan j = 3,
lalu Xt-j aku s
nilai variabel X tahun 1965) dan variabel X tertinggal periode j. Ini akan menjadi jelas
dari konteks yang mana. Sejujurnya, dalam hampir semua persamaan dalam buku ini
tidak masalah cara Anda menafsirkannya.
Yi Xi ei = Sebuah + b + .
128 Analisis data keuangan
Contoh: Prediksi jangka panjang dari indeks harga pasar saham
Masalah apakah pengembalian pasar saham dapat diprediksi adalah hal yang sangat
penting
satu di bidang keuangan. Lagi pula, jika seorang investor dapat memprediksi perilaku
pasar saham, dia
bisa menghasilkan banyak uang. Tentu saja, dalam praktiknya, memprediksi saham
mana yang akan
peningkatan nilai besok sangat sulit. Kami akan kembali ke masalah
prediksi jangka pendek harga saham di bab berikutnya, ketika kita membahas
perilaku berjalan acak. Dalam contoh ini, kami fokus pada prediksi jangka panjang dari
pasar saham.
Ini bukan buku tentang teori keuangan dan, karenanya, kami tidak akan menjelaskan
describe
model teoretis yang memotivasi regresi yang akan kita jalankan secara detail. Di
umum, banyak peneliti telah mempelajari hubungan antara harga saham,
dividen dan pengembalian. Persamaan dasar yang menghubungkan ketiga konsep ini
adalah
diberikan dalam Bab 2 sebagai:
di mana Rt adalah pengembalian memegang saham dari periode t - 1 sampai t, Pt

adalah
harga saham pada akhir periode t dan Dt adalah dividen yang diperoleh antara
periode ke - 1 dan t. Hubungan dasar ini, bersama dengan berbagai asumsi tentang
bagaimana variabel-variabel ini dapat berkembang di masa depan, dapat digunakan

untuk mengembangkan berbagai
model keuangan teoretis.2 Model seperti itu sangat berguna menyiratkan bahwa:
rasio dividen terhadap harga saham harus memiliki kekuatan prediksi untuk masa depan
pengembalian, terutama di cakrawala panjang.
Bagaimana teori semacam itu berhubungan dengan model regresi kami dengan
penjelasan yang tertinggal?
variabel? Ini menyiratkan model di mana variabel dependen (Y ) adalah total
pengembalian indeks pasar saham selama periode mendatang (katakanlah h bulan, di

mana
h menunjukkan cakrawala peramalan) tetapi variabel penjelas (X ) adalah
rasio harga dividen saat ini. Jadi, kami memiliki model regresi dalam bentuk:
dimana variabel terikat, Yt+h, dihitung menggunakan pengembalian Rt+1,
Rt+2, . . . , Rt+h. Atau, secara ekuivalen, kita dapat menulis regresi ini sebagai:
Ini adalah versi khusus dari regresi umum kami dengan penjelasan tertinggal
variabel yang dijelaskan di atas.
Teori yang dikembangkan oleh peneliti keuangan menunjukkan bahwa penjelasan
kekuatan untuk regresi ini harus miskin di cakrawala pendek (misalnya h = 1 atau 2) tapi
meningkat pada cakrawala yang lebih panjang. File LONGRUN.XLS berisi data bulanan
untuk
seratus tahun pada Y = pengembalian 12 bulan (yaitu h = 12) dari pasar saham
bersama
dengan X rasio harga dividen (12 bulan lalu).
Tabel 8.2 berisi hasil dari regresi. Karena nilai-P untuk koefisien
di Xt-12 kurang dari 0,05, koefisiennya signifikan. Kita dapat menyimpulkan
bahwa rasio harga dividen memang memiliki kekuatan penjelas untuk pengembalian 12
bulan.
Ini mendukung teori bahwa rasio harga dividen memang memiliki beberapa prediksi
kekuatan untuk pengembalian jangka panjang. Namun, kami juga menemukan R2=
0,019 menunjukkan
bahwa kekuatan prediksi ini lemah (walaupun signifikan secara statistik). Hanya
1,9% dari variasi pengembalian 12 bulan dapat dijelaskan oleh harga dividen
perbandingan.
Yt Xt h et = Sebuah + b - + .
Yt+h = Sebuah + bXt + et+h ,
Kembali = = - + ( )- \
PPD
Pt
ttt
untuk
100
Tabel 8.2 Contoh hasil regresi untuk prediksi jangka panjang pengembalian saham.
Contoh: Pengaruh berita buruk pada kapitalisasi pasar
Harga saham suatu perusahaan dapat sensitif terhadap berita buruk. Seandainya
Perusahaan B berada dalam industri yang sangat sensitif terhadap harga minyak.
Jika harga minyak naik, maka keuntungan Perusahaan B akan cenderung turun
dan beberapa investor, mengantisipasi hal ini, akan menjual saham mereka di
Perusahaan B mengemudi
harga (dan kapitalisasi pasar) turun. Namun, efek ini mungkin tidak
terjadi segera. Misalnya, jika Perusahaan B memiliki persediaan besar yang diproduksi
dengan minyak murah, ia dapat menjualnya dan mempertahankan keuntungannya untuk

sementara waktu. Tapi
ketika produksi baru diperlukan, harga minyak yang lebih tinggi akan menurunkan
keuntungan. Selanjutnya,
pengaruh harga minyak mungkin tidak berlangsung selamanya, karena Perusahaan B
juga memiliki beberapa fleksibilitas dalam proses produksinya dan secara bertahap
dapat menyesuaikan diri dengan
harga minyak yang lebih tinggi. Oleh karena itu, berita tentang harga minyak akan
mempengaruhi kapitalisasi pasar
Perusahaan B, tetapi efeknya mungkin tidak segera terjadi dan
mungkin tidak bertahan terlalu lama.
File BADNEWS.XLS berisi data yang dikumpulkan setiap bulan selama lima tahun
tahun (yaitu 60 bulan) pada variabel berikut:
• Y = kapitalisasi pasar Perusahaan B ($000)
• X = harga minyak (dolar per barel).3
Karena ini adalah data deret waktu4 dan kemungkinan berita bulan-bulan sebelumnya
tentang
harga minyak akan mempengaruhi kapitalisasi pasar saat ini, perlu untuk
memasukkan lag X dalam regresi. Tabel 8.3 berisi perkiraan OLS dari
koefisien dalam model lag terdistribusi di mana kapitalisasi pasar diperbolehkan
bergantung pada berita terkini tentang harga minyak dan berita hingga empat bulan lalu.
Itu adalah,
Apa yang dapat kita simpulkan tentang pengaruh berita tentang harga minyak terhadap
Perusahaan?
kapitalisasi pasar B? Menaikkan harga minyak sebesar satu dolar per barel di a
bulan tertentu dikaitkan dengan:
Tabel 8.3 Hasil regresi untuk pengaruh berita pada contoh kapitalisasi pasar.
1. Pengurangan segera dalam kapitalisasi pasar sebesar $145.000, ceteris paribus.
2. Penurunan kapitalisasi pasar sebesar $462.140 satu bulan kemudian, ceteris
paribus.
3. Penurunan kapitalisasi pasar sebesar $424,470 dua bulan kemudian, ceteris
paribus.
4. Pengurangan kapitalisasi pasar sebesar $199.550 tiga bulan kemudian, ceteris
paribus.
5. Pengurangan kapitalisasi pasar sebesar $36.900 empat bulan kemudian, ceteris
paribus.
Interval kepercayaan dapat ditafsirkan dengan cara standar. Misalnya, kita
adalah 95% yakin bahwa pengurangan langsung dalam kapitalisasi pasar adalah pada
paling sedikit $49.300 dan paling banyak $240.700, ceteris paribus.
Untuk memberikan beberapa intuisi tentang apa yang disiratkan oleh kondisi ceteris
paribus di
konteks ini perhatikan bahwa, misalnya, kami juga dapat mengungkapkan yang kedua
dari ini
pernyataan sebagai: “Meningkatkan harga minyak sebesar satu dolar pada bulan
tertentu akan cenderung
untuk mengurangi kapitalisasi pasar di bulan berikutnya sebesar $462.120, dengan

asumsi
bahwa tidak ada perubahan lain dalam harga minyak yang terjadi”.
Jika kita memeriksa hasil statistik pada tabel sebelumnya, kita dapat melihat bahwa
semua
dari koefisien signifikan secara statistik, kecuali untuk b4. Nilai-P untuk ini
koefisien terakhir adalah 0,44 yang tidak kurang dari 0,05. Juga kami mencatat bahwa
kepercayaan diri
interval untuk b4 termasuk nol. Oleh karena itu kita tidak dapat menolak hipotesis bahwa
b4 = 0. Dengan kata lain, kita tidak dapat menolak hipotesis bahwa perubahan harga
minyak
empat bulan lalu tidak berpengaruh pada kapitalisasi pasar saat ini.
Secara umum pengaruh perubahan harga minyak terhadap kapitalisasi pasar
menunjukkan pola berbentuk punuk dari waktu ke waktu: efek langsungnya cukup kecil
($145.000). Efeknya kemudian meningkat menjadi lebih dari $400.000 untuk masing-
masing dari dua berikutnya
bulan, turun menjadi sekitar $200.000 tiga bulan kemudian, dan kemudian turun
menjadi sekitar nol empat bulan kemudian. Jika kita menjumlahkan efek dari
peningkatan satu
dolar dalam harga minyak di setiap periode (yaitu $145.000 + $462.140 + $424,470 +
$199,550 + $36.900 = $1,268.060)5 kami menerima ukuran efek total dari
peningkatan kapitalisasi pasar ini. Dengan kata lain, kita dapat mengatakan bahwa:
“Setelah
empat bulan, efek menambahkan satu dolar ke harga minyak adalah menurun
kapitalisasi pasar sebesar $1.268.060”.
Dengan menghitung efek total ini dan memeriksa pola koefisien
Seiring waktu, perusahaan dan investor mendapatkan informasi penting. Seperti itu
hasil, bagaimanapun, asumsikan bahwa model lag terdistribusi tidak hilang
variabel penjelas. Misalnya, kita secara implisit mengasumsikan bahwa Xt-5 tidak
memiliki
mempengaruhi kapitalisasi pasar saat ini. Jika asumsi ini salah, perkiraan kami
dari total efek perubahan harga minyak mungkin salah. Masalah ini
berhubungan erat dengan masalah bias variabel yang dihilangkan yang dibahas dalam
Bab 6,
dan menekankan pentingnya pemilihan panjang lag yang benar (yaitu q dalam distribusi
model lag), topik yang sekarang kita bahas.
Latihan 8.1
Gunakan kumpulan data, BADNEWS.XLS, yang dibahas dalam contoh sebelumnya

untuk pertanyaan ini.
Kumpulan data ini berisi T = 60 pengamatan pada Y = kapitalisasi pasar
dan X = harga minyak.
(Sebuah) Buat variabel penjelas yang akan Anda gunakan dalam model lag terdistribusi
dengan panjang lag sama dengan 4. Berapa banyak pengamatan yang dilakukan
variabel penjelas?
memiliki?
(b) Menggunakan jawaban Anda untuk (a), buat kembali Tabel 8.3 pada contoh di atas.
(c) Buat variabel penjelas yang akan Anda gunakan dalam model lag terdistribusi
dengan panjang lag sama dengan 2. Berapa banyak pengamatan yang dilakukan
variabel penjelas?
memiliki?
(d) Menggunakan jawaban Anda untuk (c), perkirakan model lag terdistribusi dengan q =
2.
(e) Bandingkan jawaban Anda dengan bagian (d) dan bagian (b). Diskusikan mengapa
mereka berbeda,
memberikan perhatian khusus pada pertanyaan tentang bias variabel yang dihilangkan
(lihat
Bab 6 jika Anda lupa apa ini).
Pemilihan urutan lag
Saat bekerja dengan model lag terdistribusi, kita jarang mengetahui secara pasti berapa
banyak
lag yang harus kita sertakan. Pada contoh sebelumnya, mengapa kita mengasumsikan
bahwa kapitalisasi pasar
tergantung pergerakan harga minyak sampai empat bulan lalu? Kenapa tidak
tiga atau enam atau bahkan delapan? Artinya, tidak seperti kebanyakan model regresi
yang dipertimbangkan
di Bab 4 hingga 7, kita tidak tahu variabel penjelas mana dalam model lag terdistribusi
yang termasuk dalam regresi sebelum kita benar-benar duduk di depan komputer dan
mulai
bekerja dengan datanya. Dengan tepat, masalah pemilihan panjang lag menjadi basis
data
satu di mana kami menggunakan sarana statistik untuk memutuskan berapa banyak
kelambatan yang akan disertakan.
Ada banyak pendekatan berbeda untuk pemilihan panjang lag dalam ekonometrika
literatur. Di sini kami menguraikan yang umum yang tidak memerlukan statistik baru
teknik di luar yang dikembangkan dalam Bab 5. Metode ini menggunakan uji-t untuk
apakah bq = 0 untuk menentukan panjang lag. Strategi yang umum adalah: (a) Mulailah
dengan cara yang adil
panjang lag besar,6 qmax, dan uji apakah koefisien pada lag maksimum sama
ke nol (yaitu menguji apakah bqmaksimal = 0). (b) Jika ya, turunkan lag tertinggi dan
perkirakan ulang
model dengan lag maksimum sama dengan qmax - 1. (c) Jika Anda menemukan
bqmaksimal-1 = 0 di baru ini
regresi, lalu turunkan urutan lag satu per satu dan perkirakan kembali model. (d)
Teruskan
menjatuhkan urutan lag satu per satu dan memperkirakan kembali model sampai Anda
menolak hipotesis
bahwa koefisien pada lag terpanjang sama dengan nol.
Deskripsi informal pemilihan panjang lag ini dapat diformalkan sebagai berikut:
serangkaian langkah:
Langkah 1. Pilih panjang lag maksimum yang mungkin, qmax, yang menurut Anda
masuk akal.
Langkah 2. Perkirakan model lag terdistribusi:
Yt Xt Xt q Xt q et = Sebuah + b + b - + + b - + 0 1 1 . . . .
Jika nilai-P untuk pengujian bqmaksimal = 0 kurang dari tingkat signifikansi yang Anda
pilih
(misalnya 0,05) maka jangan melangkah lebih jauh. Gunakan qmax sebagai panjang
lag. Jika tidak, lanjutkan ke
langkah berikutnya.
Jika nilai-P untuk pengujian bqmaksimal-1 = 0 lebih kecil dari tingkat signifikansi Anda
pilih (misalnya 0,05) lalu jangan melangkah lebih jauh. Gunakan qmax- 1 sebagai
panjang lag. Jika tidak
lanjutkan ke langkah berikutnya.
Jika nilai-P untuk pengujian bqmaksimal-2 = 0 lebih kecil dari tingkat signifikansi Anda
pilih (misalnya 0,05) lalu jangan melangkah lebih jauh. Gunakan qmax- 2 sebagai
panjang lag. Jika tidak
lanjutkan ke langkah berikutnya, dll.
Selain relevansi praktis yang perlu diperhatikan saat Anda bekerja dengan spreadsheet,
jumlah pengamatan yang digunakan dalam model lag terdistribusi sama dengan aslinya
jumlah pengamatan, T, dikurangi panjang lag maksimum. Ini berarti bahwa, pada
Langkah
2, kami bekerja dengan T - qpengamatan maksimal; pada Langkah 3, dengan T-

qmaksimal + 1 pengamatan;
pada Langkah 4 dengan T - qmaksimal + 2, pengamatan; dll. Setiap langkah akan

membutuhkan beberapa pemotongan
dan tempel di spreadsheet untuk membuat variabel dengan jumlah yang sesuai
pengamatan. Atau, beberapa peneliti hanya menggunakanT - qpengamatan maksimal untuk semua
regresi. Ini memiliki keuntungan bahwa, pada setiap langkah, peneliti menggunakan langkah
yang sama
pengamatan. Namun, strategi ini mungkin berarti menggunakan kumpulan data yang lebih kecil
dari yang diperlukan.
Ingat dari Bab 5 bahwa memiliki lebih banyak pengamatan meningkatkan akurasi
dari perkiraan OLS.
Contoh: Pengaruh berita buruk pada kapitalisasi pasar
(sambungan dari halaman 132)
Misalkan kita telah memilih qmax = 4 dalam regresi kapitalisasi pasar pada
harga minyak. Dengan kata lain, kami percaya bahwa empat bulan adalah waktu
maksimum
periode di mana kita dapat mengharapkan berita tentang harga minyak berdampak pada
kapitalisasi pasar. Strategi yang diuraikan di atas mengatakan bahwa kita harus mulai
dengan memperkirakan
model lag terdistribusi dengan panjang lag sama dengan 4. Hasil diberikan dalam
Tabel 8.3. Karena nilai-P yang sesuai dengan variabel penjelas Xt-4 adalah
lebih besar dari 0,05 kita tidak dapat menolak hipotesis bahwa b4 = 0 pada tingkat 5%
dari
makna. Oleh karena itu, kami menghapus variabel ini dari model dan memperkirakan
ulang
dengan panjang lag ditetapkan sama dengan 3, menghasilkan hasil pada Tabel 8.4.
Nilai-P untuk pengujian b3 = 0 adalah 0,0003, yang jauh lebih kecil dari 0,05. Kita
oleh karena itu simpulkan bahwa variabel Xt-3 memang termasuk dalam terdistribusi
model ketinggalan. Oleh karena itu q= 3 adalah panjang lag yang kami pilih untuk model
ini. secara formal
laporan, kami akan menyajikan tabel hasil ini. Karena hasil ini mirip dengan
yang dibahas di atas, kami tidak akan mengulangi interpretasi mereka.
Latihan 8.2
Gunakan kumpulan data, BADNEWS.XLS. Misalkan Anda percaya bahwa enam bulan
adalah
waktu maksimum harga minyak dapat mempengaruhi kapitalisasi pasar dan karenanya,
Anda mengatur qmax = 6. Menggunakan strategi yang dijelaskan di atas, pilih panjang
jeda
dari model lag terdistribusi.
Tabel 8.4 Panjang lag ditetapkan sama dengan 3.
Nilai-P untuk pengujian b3 = 0 adalah 0,0003, yang jauh lebih kecil dari 0,05. Kita
oleh karena itu simpulkan bahwa variabel Xt-3 memang termasuk dalam terdistribusi
model ketinggalan. Oleh karena itu q= 3 adalah panjang lag yang kami pilih untuk model
ini. secara formal
laporan, kami akan menyajikan tabel hasil ini. Karena hasil ini mirip dengan
yang dibahas di atas, kami tidak akan mengulangi interpretasi mereka.
Latihan 8.2
Gunakan kumpulan data, BADNEWS.XLS. Misalkan Anda percaya bahwa enam bulan
adalah
waktu maksimum harga minyak dapat mempengaruhi kapitalisasi pasar dan karenanya,
Anda mengatur qmax = 6. Menggunakan strategi yang dijelaskan di atas, pilih panjang
jeda
dari model lag terdistribusi.
Ringkasan bab
1. Regresi dengan variabel deret waktu melibatkan dua masalah yang belum kami
tangani
dengan di masa lalu. Pertama, satu variabel dapat mempengaruhi variabel lain dengan
jeda waktu.
Kedua, jika variabel tidak stasioner, masalah regresi palsu
Bisa berakibat. Masalah terakhir akan dibahas dalam Bab 10.
2. Model lag terdistribusi memiliki variabel dependen tergantung pada
variabel penjelas dan jeda waktu dari variabel penjelas.
3. Jika variabel dalam model lag terdistribusi stasioner, maka estimasi OLS then
dapat diandalkan dan teknik statistik regresi berganda (mis
melihat nilai-P atau interval kepercayaan) dapat digunakan secara langsung
cara.
4. Panjang lag dalam model lag terdistribusi dapat dipilih secara berurutan
menggunakan uji-t yang dimulai dengan panjang jeda yang cukup besar.
Catatan akhir
1. Tentu saja, kita dapat melabeli koefisien kita menggunakan konvensi apa pun yang
kita inginkan. Konvensi yang dipilih di sini berhubungan dengan subskrip padab dengan
jumlah periode lalu yang menjadi acuan variabel penjelas. Contohnya,b1 adalah
koefisien pada Xt-1, yang merupakan nilai variabel penjelas satu periode yang lalu.
2. Pembaca yang tertarik dirujuk ke Bab 7 dari Campbell, Lo dan MacKinlay, The
Econometrics of Financial Markets, untuk perinciannya.
3. Secara formal, ini adalah harga relatif terhadap harga patokan yang
memperhitungkan nol dalam kumpulan data.
4. Perhatikan bahwa kita mengasumsikan data ini stasioner. Dalam latihan empiris nyata
yang melibatkan kapitalisasi pasar, ini mungkin asumsi yang buruk. Namun, kumpulan
data ini adalah fiktif, dibuat agar tetap, jadi kami tidak akan khawatir tentang masalah ini
di sini.
5. Nilai $1,268.060 adalah perkiraan dari efek total. Dimungkinkan untuk menghitung
interval kepercayaan juga, tetapi ini akan membutuhkan rumus yang lebih rumit dan
berada di luar cakupan buku ini.
6. Meski tidak terlalu besar! Ingatlah bahwa setiap variabel dalam model lag terdistribusi
akan memiliki jumlah pengamatan yang sama dengan T dikurangi jumlah lag
maksimum. Jika Anda menetapkan jumlah lag maksimum terlalu besar, Anda akan
mendapatkan sedikit pengamatan.

Regression With Lagged - En.id

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Regression With Lagged - En.id

Diunggah oleh

Hak Cipta:

Format Tersedia

8.

Regresi dengan lag

Selain pada variabel tertinggal

Variabel baru W dan Z keduanya memiliki T - 1 pengamatan. Jika kita membayangkan

7 pengamatan, yaitu T dikurangi jumlah lag maksimum (yaitu 10 - 3 = 7). mencari

Tabel 8.1 Membuat variabel tertinggal.

pengamatan dari tiga periode sebelumnya (misalnya X4).

berisi data asli pada Y dan X (yaitu yang berisi 10 asli

berlabel "Input X-range".

jika Anda berada di depan komputer, bekerja dengan spreadsheet.

kompensasi eksekutif). Setelah mengumpulkan data pada X kita akan melakukan

saya = 1, . . . , N untuk data penampang dan Xt untuk t= 1, . . . , T untuk data deret

pengamatan variabel (misalnya Xi = kompensasi eksekutif di ith

regresi dalam Bab 4 sampai 7 kita sering menulis persamaan bentuk:

Dinyatakan dengan kata-kata, di atas menyiratkan bahwa "variabel dependen Y

Dinyatakan dengan kata-kata, "pengamatan i dari Y tergantung pada pengamatan i dari

Misalnya, “kompensasi eksekutif di perusahaan i tergantung pada keuntungan di

persamaan sedikit jelas (misalnya jelas bahwa kompensasi eksekutif di Perusahaan

A tergantung pada keuntungan di Perusahaan A – tentu tidak akan tergantung pada

kompensasi di perusahaan i ) tergantung pada X1i (misalnya laba di perusahaan i ) dan

pada X2i (misalnya perubahan penjualan di perusahaan i ), subskrip i sering dihilangkan

dan alternatifnya adalah mengacaukan persamaan dengan banyak subskrip. Pada

tidak masalah cara Anda menafsirkannya.

128 Analisis data keuangan

Contoh: Prediksi jangka panjang dari indeks harga pasar saham

peningkatan nilai besok sangat sulit. Kami akan kembali ke masalah

umum, banyak peneliti telah mempelajari hubungan antara harga saham,

diberikan dalam Bab 2 sebagai:

di mana Rt adalah pengembalian memegang saham dari periode t - 1 sampai t, Pt

bagaimana variabel-variabel ini dapat berkembang di masa depan, dapat digunakan

pengembalian, terutama di cakrawala panjang.

variabel? Ini menyiratkan model di mana variabel dependen (Y ) adalah total

pengembalian indeks pasar saham selama periode mendatang (katakanlah h bulan, di

h menunjukkan cakrawala peramalan) tetapi variabel penjelas (X ) adalah

dimana variabel terikat, Yt+h, dihitung menggunakan pengembalian Rt+1,

variabel yang dijelaskan di atas.

Teori yang dikembangkan oleh peneliti keuangan menunjukkan bahwa penjelasan

dengan X rasio harga dividen (12 bulan lalu).

di Xt-12 kurang dari 0,05, koefisiennya signifikan. Kita dapat menyimpulkan

Yt+h = Sebuah + bXt + et+h ,

Contoh: Pengaruh berita buruk pada kapitalisasi pasar

dengan minyak murah, ia dapat menjualnya dan mempertahankan keuntungannya untuk

pengaruh harga minyak mungkin tidak berlangsung selamanya, karena Perusahaan B

Perusahaan B, tetapi efeknya mungkin tidak segera terjadi dan

mungkin tidak bertahan terlalu lama.

tahun (yaitu 60 bulan) pada variabel berikut:

• Y = kapitalisasi pasar Perusahaan B ($000)

• X = harga minyak (dolar per barel).3

bulan tertentu dikaitkan dengan:

1. Pengurangan segera dalam kapitalisasi pasar sebesar $145.000, ceteris paribus.

2. Penurunan kapitalisasi pasar sebesar $462.140 satu bulan kemudian, ceteris

3. Penurunan kapitalisasi pasar sebesar $424,470 dua bulan kemudian, ceteris

4. Pengurangan kapitalisasi pasar sebesar $199.550 tiga bulan kemudian, ceteris

5. Pengurangan kapitalisasi pasar sebesar $36.900 empat bulan kemudian, ceteris

Interval kepercayaan dapat ditafsirkan dengan cara standar. Misalnya, kita

paling sedikit $49.300 dan paling banyak $240.700, ceteris paribus.

untuk mengurangi kapitalisasi pasar di bulan berikutnya sebesar $462.120, dengan

Secara umum pengaruh perubahan harga minyak terhadap kapitalisasi pasar

$199,550 + $36.900 = $1,268.060)5 kami menerima ukuran efek total dari

kapitalisasi pasar sebesar $1.268.060”.

Dengan menghitung efek total ini dan memeriksa pola koefisien

hasil, bagaimanapun, asumsikan bahwa model lag terdistribusi tidak hilang