Guja - Chap 16.en - Id PDF

Bab 16
Regresi Data Panel

Model
Pada Bab 1 kita membahas secara singkat jenis data yang umumnya tersedia untuk analisis empiris, yaitu, deret waktu,
penampang, dan panel. Dalam data deret waktu, kami mengamati nilai satu atau lebih variabel selama periode waktu tertentu
(misalnya, PDB untuk beberapa kuartal atau tahun). Dalam data penampang, nilai satu atau lebih variabel dikumpulkan untuk
beberapa unit sampel, atau subjek, pada titik waktu yang sama (misalnya, tingkat kejahatan di 50 negara bagian di Amerika
Serikat untuk tahun tertentu). Dalam data panel, unit penampang yang sama (misalnya keluarga atau perusahaan atau negara
bagian) disurvei dari waktu ke waktu. Singkatnya, data panel memiliki dimensi ruang dan waktu.
Kita telah melihat contoh dari tabel 1.1 ini, yang memberikan data tentang telur yang diproduksi dan harganya untuk 50
negara bagian di Amerika Serikat selama tahun 1990 dan 1991. Untuk tahun tertentu, data tentang telur dan harganya
mewakili cross-sectional Sampel. Untuk negara bagian tertentu, ada dua pengamatan deret waktu terhadap telur dan
harganya. Jadi, kami memiliki semua 100 (kumpulan) pengamatan tentang telur yang diproduksi dan harganya.
Contoh lain dari data panel diberikan pada Tabel 1.2, yang memberikan data tentang investasi, nilai perusahaan, dan
persediaan modal untuk empat perusahaan selama periode 1935–1954. Data untuk setiap perusahaan selama periode
1935–1954 merupakan data deret waktu, dengan 20 observasi; data, untuk keempat perusahaan pada tahun tertentu adalah
contoh data penampang, dengan hanya empat pengamatan; dan data untuk semua perusahaan selama bertahun-tahun adalah
contohnya
data panel, dengan total 80 observasi.
Ada nama lain untuk data panel, seperti data yang dikumpulkan ( pengumpulan pengamatan deret waktu dan
cross-sectional), kombinasi data deret waktu dan penampang, data mikropanel, data longitudinal ( studi dari waktu
ke waktu dari variabel atau kelompok mata pelajaran),
analisis riwayat peristiwa ( mempelajari pergerakan subjek dari waktu ke waktu melalui keadaan atau kondisi yang
berurutan), dan analisis kohort ( misalnya mengikuti jalur karir lulusan sekolah bisnis tahun 1965). Meskipun ada variasi halus,
semua nama ini pada dasarnya berkonotasi dengan pergerakan unit lintas bagian dari waktu ke waktu. Oleh karena itu, kami
akan menggunakan istilah data panel dalam arti umum untuk menyertakan satu atau lebih istilah ini. Dan kami akan
memanggil model regresi berdasarkan data tersebut model regresi data panel.
Data panel sekarang semakin banyak digunakan dalam penelitian ekonomi. Beberapa dari kumpulan data panel yang terkenal
adalah:
1. Itu Studi Panel Dinamika Pendapatan (PSID) dilakukan oleh Institute of Social
Penelitian di Universitas Michigan. Dimulai pada tahun 1968, setiap tahun Institut mengumpulkan data
tentang 5.000 keluarga tentang berbagai variabel sosial ekonomi dan demografis.
591
592 Bagian ketiga Topik dalam Ekonometrika
2. Biro Sensus Departemen Perdagangan melakukan survei serupa dengan PSID, yang disebut Survei
Pendapatan dan Partisipasi Program (SIPP). Empat kali setahun responden diwawancarai tentang
kondisi ekonomi mereka.
3. Itu Panel Sosial Ekonomi Jerman (GESOEP) mempelajari 1.761 orang setiap tahun
antara 1984 dan 2002. Informasi tentang tahun lahir, jenis kelamin, kepuasan hidup, status perkawinan, pendapatan
tenaga kerja individu, dan jam kerja tahunan dikumpulkan untuk setiap individu untuk periode 1984 hingga 2002.
Masih banyak juga survey lain yang dilakukan oleh berbagai instansi pemerintah, seperti:
Rumah Tangga, Pendapatan dan Dinamika Tenaga Kerja di Australia Survey (HILDA) British Rumah
Tangga Panel Survey (BHPS)
Studi Panel Tenaga Kerja dan Pendapatan Korea (KLIPS)
Pada awalnya ada peringatan: Topik regresi data panel sangat luas, dan beberapa matematika dan statistik yang
terlibat cukup rumit. Kami hanya berharap untuk menyentuh beberapa hal penting dari model regresi data panel,
meninggalkan detailnya sebagai referensi. 1 Namun perlu diingat bahwa beberapa referensi ini sangat teknis.
Untungnya, paket perangkat lunak yang mudah digunakan seperti LIMDEP, PC-GIVE, SAS, STATA, SHAZAM, dan EViews,
antara lain, telah membuat tugas menerapkan regresi data panel menjadi cukup mudah.
16.1 Mengapa Data Panel?
Apa keunggulan data panel dibandingkan data penampang atau deret waktu? Baltagi mencantumkan keuntungan dari
data panel berikut: 2
1. Karena data panel berhubungan dengan individu, perusahaan, negara bagian, negara, dll., Dari waktu ke waktu, pasti ada heterogenitas
di unit ini. Teknik estimasi data panel dapat memperhitungkan heterogenitas tersebut secara eksplisit dengan memungkinkan
variabel khusus subjek, seperti yang akan kami tunjukkan sebentar lagi. Kami menggunakan istilah tersebut subyek dalam arti
umum untuk memasukkan unit mikro seperti individu, perusahaan, negara bagian, dan negara.
2. Dengan menggabungkan rangkaian waktu pengamatan penampang, data panel memberikan "data yang lebih informatif, lebih banyak
variabilitas, lebih sedikit kolinearitas antar variabel, lebih banyak derajat kebebasan dan lebih banyak efisiensi."
3. Dengan mempelajari pengamatan penampang berulang, data panel lebih cocok untuk mempelajari dinamika perubahan.
Mantra pengangguran, pergantian pekerjaan, dan mobilitas tenaga kerja dipelajari lebih baik dengan data panel.
4. Data panel dapat mendeteksi dan mengukur efek dengan lebih baik yang tidak dapat diamati dalam data cross-section atau data
deret waktu murni. Misalnya, dampak dari undang-undang upah minimum
1 Beberapa rujukannya adalah G. Chamberlain, "Panel Data," di Buku Pegangan Ekonometrika, vol. II;
Z. Griliches dan MD Intriligator, eds., North-Holland Publishers, 1984, Bab 22; C. Hsiao,
Analisis Data Panel, Cambridge University Press, 1986; GG Judge, RC Hill, WE Griffths,
H. Lutkepohl, dan TC Lee, Pengantar Teori dan Praktek Ekonometrika, Edisi ke-2, John Wiley & Sons, New York, 1985, Bab
11; WH Greene, Analisis Ekonometrik, Edisi ke-6, Prentice-Hall, Englewood Cliffs, NJ, 2008, Bab 9; Badi H. Baltagi, Analisis
Ekonometrik Data Panel, John Wiley dan Sons, New York, 1995; dan JM Wooldridge, Analisis Ekonometrik Data Penampang
dan Panel, MIT Press, Cambridge, Mass., 1999. Untuk pembahasan rinci tentang subjek dengan aplikasi empiris, lihat Edward
W. Frees, Data Longitudinal dan Panel: Analisis dan Aplikasi dalam Ilmu Sosial, Cambridge University Press, New York, 2004.
2 Baltagi, op. cit., hlm. 3–6.

Bab 16 Model Regresi Data Panel 593
tentang pekerjaan dan pendapatan dapat dipelajari dengan lebih baik jika kita memasukkan gelombang kenaikan upah minimum
berturut-turut dalam upah minimum federal dan / atau negara bagian.
5. Data panel memungkinkan kita mempelajari model perilaku yang lebih rumit. Misalnya, fenomena seperti skala ekonomi dan
perubahan teknologi dapat ditangani dengan lebih baik oleh data panel daripada dengan data penampang melintang atau
rangkaian waktu murni.
6. Dengan menyediakan data untuk beberapa ribu unit, data panel dapat meminimalkan bias yang mungkin timbul jika kita
menggabungkan individu atau perusahaan menjadi agregat luas.
Singkatnya, data panel dapat memperkaya analisis empiris dengan cara yang mungkin tidak dapat dilakukan jika kita hanya
menggunakan data cross-section atau time series. Ini tidak berarti bahwa tidak ada masalah dengan pemodelan data panel. Kita akan
membahasnya setelah kita membahas beberapa teori dan membahas beberapa contoh.
16.2 Data Panel: Contoh Ilustratif

Untuk mengatur panggung, mari kita pertimbangkan contoh konkret. Pertimbangkan data yang diberikan sebagai Tabel 16.1 di
situs web buku teks, yang awalnya dikumpulkan oleh Profesor Moshe Kim dan direproduksi dari William Greene. 3 Data tersebut
menganalisis biaya enam perusahaan penerbangan selama periode 1970–1984, dengan total 90 observasi data panel.
Variabel didefinisikan sebagai: Saya = id maskapai; T = tahun id; Q = keluaran, dalam mil penumpang pendapatan, nomor
indeks; C = biaya total, dalam $ 1.000; PF = harga bahan bakar; dan LF = faktor beban, pemanfaatan kapasitas rata-rata dari
armada.
Misalkan kita tertarik untuk mengetahui berapa total biaya ( C) berperilaku dalam kaitannya dengan keluaran ( Q),
harga bahan bakar ( PF), dan faktor beban ( LF). Singkatnya, kami ingin memperkirakan fungsi biaya maskapai penerbangan.
Bagaimana cara kita memperkirakan fungsi ini? Tentu saja, kami dapat memperkirakan fungsi biaya untuk setiap maskapai
penerbangan menggunakan data untuk tahun 1970–1984 (yaitu, regresi deret waktu). Ini dapat dilakukan dengan prosedur biasa
kuadrat terkecil (OLS) biasa. Kami akan memiliki keenam fungsi biaya, satu untuk setiap maskapai penerbangan. Tapi kemudian
kami mengabaikan informasi tentang maskapai lain yang beroperasi di lingkungan (peraturan) yang sama.
Kami juga dapat memperkirakan fungsi biaya penampang (yaitu, regresi penampang). Kami akan memiliki semua 15
regresi lintas-bagian, satu untuk setiap tahun. Tetapi ini tidak masuk akal dalam konteks sekarang, karena kami hanya
memiliki enam pengamatan per tahun dan ada tiga variabel penjelas (ditambah istilah intersep); kita akan memiliki sedikit
sekali derajat kebebasan untuk melakukan analisis yang berarti. Selain itu, kami tidak akan "mengeksploitasi" sifat panel dari
data kami.
Secara kebetulan, data panel dalam contoh kita disebut a panel seimbang; sebuah panel dikatakan seimbang jika setiap
subjek (perusahaan, individu, dll.) memiliki jumlah observasi yang sama. Jika setiap entitas memiliki jumlah observasi yang
berbeda, maka kami memiliki sebuah panel tidak seimbang. Untuk sebagian besar bab ini, kita akan membahas panel seimbang.
Dalam literatur data panel Anda juga akan menemukan istilah-istilah tersebut panel pendek dan panel panjang. Dalam panel
pendek jumlah mata pelajaran cross-sectional, N, lebih besar dari jumlah periode waktu, T. Di panel panjang, ya T itu lebih besar
dari N. Seperti yang akan kita bahas nanti, teknik estimasi dapat bergantung pada apakah kita memiliki panel pendek atau panel
panjang.
Lalu, apa pilihannya? Ada empat kemungkinan:
1. Model OLS yang dikumpulkan. Kami hanya mengumpulkan 90 observasi dan memperkirakan "grand"
regresi, mengabaikan sifat penampang dan deret waktu dari data kami.
2. Itu efek tetap model variabel dummy kuadrat terkecil (LSDV). Di sini kami mengumpulkan semua 90
pengamatan, tetapi mengizinkan setiap unit penampang (yaitu, maskapai penerbangan dalam contoh kita) untuk memiliki variabel
dummy sendiri (mencegat).
3 William H. Greene, Analisis Ekonometrik, 6th ed., 2008. Data terletak di http://pages.stern.nyu.edu/ ~ wgreen / Text /
econometricanalysis.htm.
3. Itu efek tetap dalam model kelompok. Di sini juga kami mengumpulkan 90 observasi, tetapi untuk
setiap maskapai kami mengekspresikan setiap variabel sebagai penyimpangan dari nilai rata-rata dan kemudian memperkirakan
regresi OLS pada variabel tersebut berarti dikoreksi atau nilai-nilai yang "direndahkan".
4. Itu model efek acak (REM). Berbeda dengan model LSDV, di mana kami mengizinkan masing-masing
maskapai penerbangan untuk memiliki nilai intersep (tetap) sendiri, kami mengasumsikan bahwa nilai intersep adalah gambar acak
dari populasi maskapai penerbangan yang jauh lebih besar.
Kami sekarang membahas masing-masing metode ini menggunakan data yang diberikan pada Tabel 16.1. (Lihat situs web buku teks.)
16.3 Model Regresi OLS Gabungan atau Koefisien Konstan

Pertimbangkan model berikut:
C itu = β 1 + β 2 Q itu + β 3 PF itu + β 4 LF itu + u Itu (16.3.1)
i = 1, 2,. . . , 6
t = 1, 2,. . . , 15
dimana saya adalah saya subjek th dan t adalah periode waktu untuk variabel yang kita definisikan sebelumnya. Kita telah memilih
fungsi biaya linier untuk tujuan ilustrasi, tetapi dalam Latihan 16.10 Anda diminta untuk mengestimasi fungsi log-linier, atau fungsi
log-ganda, dalam hal ini koefisien kemiringan akan memberikan estimasi elastisitas.
Perhatikan bahwa kami telah mengumpulkan semua 90 observasi, tetapi perhatikan bahwa kami mengasumsikan koefisien regresi
adalah sama untuk semua maskapai penerbangan. Artinya, tidak ada perbedaan antara maskapai penerbangan — satu maskapai
penerbangan sebaik yang lain, sebuah asumsi yang mungkin sulit dipertahankan.
Diasumsikan bahwa variabel penjelas adalah nonstochastic. Jika mereka stokastik, mereka tidak berkorelasi dengan
istilah kesalahan. Kadang-kadang diasumsikan bahwa variabel penjelas adalah sangat eksogen. Suatu variabel
dikatakan sangat eksogen jika tidak bergantung padanya
nilai saat ini, masa lalu, dan masa depan dari istilah kesalahan u Itu .
Diasumsikan juga bahwa istilah kesalahannya adalah u Itu ∼ saya id ( 0, σ 2 u), yaitu, secara mandiri dan
didistribusikan secara identik dengan mean nol dan varians konstan. Untuk tujuan pengujian hipotesis, dapat
diasumsikan bahwa istilah kesalahan juga terdistribusi normal. Perhatikan notasi langganan ganda di Persamaan.
(16.3.1), yang seharusnya sudah cukup jelas.
Pertama-tama, mari kita sajikan hasil perkiraan persamaan (16.3.1) dan kemudian diskusikan beberapa
masalah dengan model ini. Hasil regresi berdasarkan EViews, Versi 6 disajikan pada Tabel 16.2.
Jika Anda memeriksa hasil dari regresi yang dikumpulkan dan menerapkan kriteria konvensional, Anda akan melihat
bahwa semua koefisien regresi tidak hanya signifikan secara statistik tetapi juga sesuai dengan harapan sebelumnya dan
bahwa R 2 nilainya sangat tinggi. Satu-satunya “y dalam salep” adalah perkiraan statistik Durbin-Watson yang cukup rendah,
menunjukkan bahwa mungkin ada autokorelasi dan / atau korelasi spasial dalam data. Tentu saja, seperti yang kita ketahui,
rendahnya Durbin-Watson juga bisa disebabkan oleh kesalahan spesifikasi.
Masalah utama dengan model ini adalah bahwa model ini tidak membedakan antara berbagai maskapai penerbangan juga tidak
memberi tahu kita apakah respons biaya total terhadap variabel penjelas dari waktu ke waktu adalah sama untuk semua maskapai
penerbangan. Dengan kata lain, dengan menyatukan maskapai yang berbeda pada waktu yang berbeda kita usia camou itu heterogenitas
( individualitas atau keunikan) yang mungkin ada di antara maskapai penerbangan. Cara lain untuk menyatakan ini adalah individualitas
masing-masing
subjek dimasukkan dalam istilah gangguan u Itu . Akibatnya, sangat mungkin bahwa istilah kesalahan mungkin
berkorelasi dengan beberapa regresi yang termasuk dalam model. Jika itu
adalah kasusnya, estimasi koefisien dalam Persamaan. (16.3.1) mungkin bias dan juga tidak konsisten.
TABEL 16.2
Variabel tak bebas: C
Metode: Kotak Terkecil
Pengamatan yang termasuk: 90
Koefisien Std. Kesalahan t Statistik Masalah.
C ( mencegat) 1158559. 360592.7 3.212930 0,0018

Q 2026114. 61806,95 32.78134 0.0000
PF 1.225348 0.103722 11.81380 0.0000
LF - 3065753. 696327.3 - 4.402747 0.0000
R- kuadrat 0,946093 Berarti tergantung var. 1122524.

Disesuaikan R- kuadrat 0,944213 Variabel tergantung SD. 1192075.
SE dari regresi 281559.5 Jumlah kuadrat resid. F- statistik 503.1176
6.82E + 12 Masalah. ( F- statistik) 0.000000
Durbin – Watson 0.434162
Ingatlah bahwa salah satu asumsi penting dari model regresi linier klasik adalah bahwa tidak ada korelasi
antara regressor dan gangguan atau istilah kesalahan.
Untuk melihat bagaimana istilah kesalahan dapat berkorelasi dengan regressor, mari kita pertimbangkan revisi model
berikut (16.3.1):
C itu = β 1 + β 2 PF itu + β 3 LF itu + β 4 M itu + u Itu (16.3.2)
dimana variabel tambahan M = filosofi manajemen atau kualitas manajemen. Dari variabel yang termasuk dalam Persamaan.
(16.3.2), hanya variabelnya M adalah waktu-invariant ( atau waktu-konstan)
karena bervariasi di antara subjek tetapi konstan dari waktu ke waktu untuk subjek tertentu (maskapai penerbangan).
Meskipun itu invarian waktu, variabel M tidak dapat diamati secara langsung dan oleh karena itu kami tidak dapat mengukur
kontribusinya terhadap fungsi biaya. Kita bisa, bagaimanapun, melakukan ini secara tidak langsung jika kita menulis Persamaan.
(16.3.2) sebagai
C itu = β 1 + β 2 PF itu + β 3 LF itu + α i + u Itu (16.3.3)
dimana α saya, disebut tidak teramati, atau heterogenitas, efek, mencerminkan dampak dari M pada biaya. Perhatikan bahwa untuk
kesederhanaan kami hanya menunjukkan efek yang tidak teramati M pada biaya, tapi
pada kenyataannya mungkin ada lebih banyak efek yang tidak teramati, misalnya, sifat kepemilikan (milik
pribadi atau milik publik), apakah itu perusahaan milik minoritas, apakah CEO-nya laki-laki atau perempuan, dll.
berbeda di antara subjek (maskapai penerbangan), mereka mungkin akan tetap sama untuk subjek tertentu
selama periode sampel.
Sejak α saya tidak dapat diamati secara langsung, mengapa tidak menganggapnya acak dan memasukkannya ke dalam kesalahan
istilah u Itu , dan dengan demikian pertimbangkan istilah kesalahan komposit v itu = α i + u Itu ? Kami sekarang menulis Persamaan. (16.3.3)
sebagai:
C itu = β 1 + β 2 PF itu + β 3 LF itu + v Itu (16.3.4)
Tetapi jika α saya istilah yang termasuk dalam istilah kesalahan v Itu berkorelasi dengan salah satu regressor di Persamaan.
(16.3.4), kami memiliki pelanggaran salah satu asumsi utama dari re- linier klasik
model regresi — yaitu, istilah kesalahan tidak berkorelasi dengan regressor. Seperti yang kita ketahui dalam
situasi ini, perkiraan OLS tidak hanya bias tetapi juga tidak konsisten.
Ada kemungkinan nyata bahwa hal itu tidak dapat diamati α saya berkorelasi dengan satu atau lebih regressor. Misalnya, manajemen
satu maskapai penerbangan mungkin cukup cerdik untuk membeli masa depan
kontrak harga bahan bakar untuk menghindari fluktuasi harga yang parah. Ini akan berdampak pada penurunan biaya
layanan maskapai penerbangan. Hasil dari korelasi ini dapat ditunjukkan bahwa
cov ( v Itu , v adalah) = σ 2 u; t = s, yang bukan nol, dan oleh karena itu, heterogen (tidak teramati )-
ity menginduksi autokorelasi dan kami harus memperhatikannya. Kami akan menunjukkan nanti bagaimana masalah ini dapat
ditangani.
Pertanyaannya, oleh karena itu, adalah bagaimana kita memperhitungkan efek yang tidak dapat diobservasi, atau heterogenitas,
sehingga kita dapat memperoleh estimasi yang konsisten dan / atau efisien dari parameter variabel yang menjadi kepentingan utama,
yaitu output, harga bahan bakar, dan faktor beban. dalam kasus kami. Kepentingan utama kami mungkin tidak mendapatkan pengaruh
dari variabel yang tidak dapat diobservasi karena variabel tersebut tetap sama untuk subjek tertentu. Itulah mengapa efek yang tidak
dapat diamati, atau heterogenitas, disebut
parameter gangguan. Lalu bagaimana kita melanjutkan? Untuk pertanyaan inilah kita sekarang beralih.
16.4 Model Fixed Effect Least-Squares Dummy Variable

(LSDV)
Model variabel dummy kuadrat terkecil (LSDV) memungkinkan adanya heterogenitas antar subjek dengan memungkinkan setiap entitas
memiliki nilai intersepnya sendiri, seperti yang ditunjukkan dalam model (16.4.1). Sekali lagi, kami melanjutkan dengan contoh
maskapai penerbangan kami.
C itu = β 1 i + β 2 Q itu + β 3 PF itu + β 4 LF itu + u Itu (16.4.1)

i = 1, 2. . . , 6
t = 1, 2,. . . , 15
Perhatikan bahwa kita telah meletakkan subskrip saya pada istilah intersep untuk menunjukkan bahwa intersepsi dari enam maskapai
penerbangan mungkin berbeda. Perbedaan tersebut mungkin disebabkan oleh fitur-fitur khusus dari setiap maskapai, seperti gaya
manajerial, filosofi manajerial, atau jenis pasar yang dilayani oleh setiap maskapai.
Dalam literatur, model (16.4.1) dikenal sebagai model efek tetap (regresi) (FEM). Istilah "efek tetap" disebabkan
oleh fakta bahwa, meskipun intersep mungkin berbeda antar subjek (di sini enam maskapai penerbangan), intersep
setiap entitas tidak bervariasi dari waktu ke waktu, itu
adalah, itu dia waktu-invariant. Perhatikan bahwa jika kita menulis intersep sebagai β 1 Itu , itu akan menunjukkan bahwa
intersep setiap entitas atau individu Variasi Waktu. Dapat dicatat bahwa
FEM diberikan dalam Persamaan. (16.4.1) mengasumsikan bahwa koefisien (kemiringan) dari regressor tidak bervariasi antar individu
atau dari waktu ke waktu.
Sebelum melangkah lebih jauh, mungkin berguna untuk memvisualisasikan perbedaan antara model regresi gabungan dan model
LSDV. Untuk kesederhanaan, asumsikan bahwa kita ingin menurunkan biaya total pada keluaran saja. Pada Gambar 16.1 kami
menunjukkan fungsi biaya yang diperkirakan untuk dua perusahaan penerbangan secara terpisah, serta fungsi biaya jika kami
menggabungkan data untuk keduanya.
GAMBAR 16.1 Y Itu
Bias karena mengabaikan
efek tetap.
Kelompok 2
E (Y itu | X itu) = α 2 + β X Itu
Kemiringan bias saat

efek tetap diabaikan
α2
E (Y itu | X itu) = α 1 + β X Itu
Grup 1
α1
Total biaya
X Itu
Keluaran
perusahaan; ini sama dengan mengabaikan efek tetap. 4 Anda dapat melihat dari Gambar 16.1 bagaimana regresi gabungan dapat
membiaskan perkiraan kemiringan.
Bagaimana sebenarnya kita memungkinkan intersep (efek tetap) bervariasi di antara maskapai penerbangan? Kita dapat dengan
mudah melakukan ini dengan menggunakan teknik variabel dummy, terutama teknik dummy intersep diferensial, yang kita pelajari di
Bab 9. Sekarang kita menulis Persamaan. (16.4.1) sebagai:
C itu = α 1 + α 2 D 2 i + α 3 D 3 i + α 4 D 4 i + α 5 D 5 i + α 6 D 6 saya
+ β 2 Q itu + β 3 PF itu + β 4 LF itu + u Itu (16.4.2)
dimana D 2 i = 1 untuk maskapai 2, 0 sebaliknya; D 3 i = 1 untuk maskapai 3, 0 sebaliknya; dan seterusnya. Perhatikan bahwa karena kami
memiliki enam maskapai penerbangan, kami hanya memasukkan lima variabel dummy ke
hindari jatuh ke perangkap variabel-dummy ( yaitu, situasi collinearity sempurna). Di sini kami memperlakukan maskapai
1 sebagai basis, atau referensi, kategori. Tentu saja, Anda bisa memilih
maskapai penerbangan sebagai titik referensi. Akibatnya, intersep α 1 adalah nilai intersep maskapai 1 dan lainnya α Koefisien
diwakili oleh seberapa banyak nilai intersep dari maskapai lain
berbeda dari nilai intersep maskapai pertama. Jadi, α 2 memberitahu seberapa banyak intersep
nilai dari maskapai kedua berbeda dari α 1. Jumlah ( α 1 + α 2) memberikan nilai sebenarnya dari intersep untuk maskapai 2.
Nilai intersep dari maskapai lain dapat dihitung dengan cara yang sama.
Ingatlah bahwa jika Anda ingin memperkenalkan boneka untuk setiap maskapai, Anda harus menghentikan intersep (umum);
jika tidak, Anda akan jatuh ke dalam perangkap variabel-dummy.
Hasil model (16.4.2) untuk data kami disajikan pada Tabel 16.3.
Hal pertama yang perlu diperhatikan tentang hasil ini adalah bahwa semua koefisien intersep diferensial secara individual
sangat signifikan secara statistik, menunjukkan bahwa mungkin enam maskapai penerbangan itu heterogen dan, oleh karena itu,
hasil regresi yang dikumpulkan yang diberikan pada Tabel 16.2 dapat dicurigai. Nilai koefisien kemiringan yang diberikan pada
Tabel 16.2 dan 16.3 juga berbeda, sekali lagi menimbulkan keraguan pada hasil yang diberikan pada Tabel 16.2. Tampaknya
model (16.4.1) lebih baik daripada model (16.3.1). Secara sepintas, perhatikan bahwa OLS yang diterapkan ke model efek tetap
menghasilkan estimator yang disebut penduga efek tetap.
TABEL 16.3
Variabel Terikat: TC
Contoh: 1–90
C (= α 1) - 131236.0 350777.1 - 0,374129 0.7093

Q 3319023. 171354.1 19.36939 0.0000
PF 0.773071 0,097319 7.943676 0.0000
LF - 3797368. 613773.1 - 6.186924 0.0000
DUM2 601733.2 100895.7 5.963913 0.0000
DUM3 1337180. 186171.0 7.182538 0.0000
DUM4 1777592. 213162.9 8.339126 0.0000
DUM5 1828252. 231229.7 7.906651 0.0000
DUM6 1706474. 228300.9 7.474672 0.0000
R- kuadrat 0,971642 Berarti tergantung var. 1122524.

Disesuaikan R- kuadrat 0,968841 Variabel tergantung SD. 1192075.
SE regresi 210422.8 F- statistik 346.9188
Jumlahkan sisa kuadrat. 3.59E + 12 Masalah. ( F- statistik) 0.000000
Kemungkinan log - 1226.082 Statistik Durbin-Watson. 0,693288
4 Diadaptasi dari catatan Alan Duncan yang tidak diterbitkan.

Kami dapat memberikan tes formal dari kedua model tersebut. Dalam kaitannya dengan model (16.4.1), model (16.3.1) adalah a terbatas
model yang memberlakukan intersepsi umum untuk semua maskapai penerbangan. Oleh karena itu, kita dapat menggunakan file terbatas
F uji dibahas dalam Bab 8. Dengan menggunakan rumus (8.6.10), pembaca dapat memeriksa bahwa dalam kasus ini file F nilainya
adalah:
F = ( 0,971642 - 0,946093) / 5 ≈ 14.99 (1 - 0,971642)

/ 81
catatan: Yang dibatasi dan tidak dibatasi R 2 nilai diperoleh dari Tabel 16.1 dan 16.2. Perhatikan juga bahwa jumlah
batasannya adalah 5 (mengapa?).
Hipotesis nol di sini adalah bahwa semua penyadapan diferensial sama dengan nol. Penghitung F nilai untuk 5
pembilang dan 81 penyebut df sangat signifikan secara statistik. Oleh karena itu, kami menolak hipotesis nol bahwa
semua penyadapan (diferensial) adalah nol. Jika
F nilai tidak signifikan secara statistik, kami akan menyimpulkan bahwa tidak ada perbedaan dalam intersep dari enam maskapai
penerbangan. Dalam kasus ini, kami akan mengumpulkan semua 90 observasi, seperti yang kami lakukan dalam regresi gabungan
yang diberikan pada Tabel 16.2.
Model (16.4.1) dikenal sebagai a efek tetap satu arah model karena kami telah mengizinkan penyadapan berbeda di antara
maskapai penerbangan. Tapi kita juga bisa mengizinkan efek waktu jika kami yakin bahwa fungsi biaya berubah dari waktu ke waktu
karena faktor-faktor seperti perubahan teknologi, perubahan peraturan pemerintah dan / atau kebijakan perpajakan, dan efek lainnya.
Efek waktu seperti itu dapat dengan mudah dihitung jika kita memperkenalkan boneka waktu, satu untuk setiap tahun dari 1970 hingga
1984. Karena kita memiliki data selama 15 tahun, kita dapat memperkenalkan 14 boneka waktu (mengapa?) Dan memperluas model
(16.4.1) dengan menambahkan variabel ini. Jika kita melakukan itu, model yang muncul disebut a model efek tetap dua arah karena
kita telah mengizinkan efek individu dan waktu.
Dalam contoh ini, jika kita menambahkan time dummies, kita akan memiliki 23 koefisien untuk memperkirakan — intersep
umum, lima boneka maskapai, 14 boneka waktu, dan tiga koefisien kemiringan. Seperti yang Anda lihat, kita akan mengkonsumsi
beberapa derajat kebebasan. Lebih jauh, jika kita memutuskan untuk membiarkan koefisien kemiringan berbeda di antara
perusahaan, kita dapat berinteraksi lima boneka perusahaan (maskapai) dengan masing-masing dari tiga variabel penjelas dan
memperkenalkan
koefisien dummy kemiringan diferensial. Kemudian kita harus memperkirakan 15 koefisien tambahan (lima boneka
berinteraksi dengan tiga variabel penjelas). Seolah ini tidak cukup, jika kita berinteraksi 14 boneka waktu dengan tiga
variabel penjelas, kita akan memiliki 42 koefisien tambahan untuk diestimasi. Seperti yang Anda lihat, kami tidak akan
memiliki derajat kebebasan yang tersisa.
Perhatian dalam Penggunaan Model LSDV Efek Tetap

Seperti yang ditunjukkan pada diskusi sebelumnya, model LSDV memiliki beberapa masalah yang perlu diingat:
Pertama, jika Anda memasukkan terlalu banyak variabel dummy, Anda akan menghadapi masalah derajat
kebebasan. Artinya, Anda akan kekurangan pengamatan untuk melakukan analisis statistik yang berarti. Kedua, dengan
banyak variabel dummy dalam model, baik individu maupun interaktif atau multiplikatif, selalu ada kemungkinan
multikolinieritas, yang mungkin mempersulit estimasi yang tepat dari satu atau lebih parameter.
Ketiga, dalam beberapa situasi, LSDV mungkin tidak dapat mengidentifikasi dampak variabel varian waktu. Misalkan kita
ingin memperkirakan fungsi upah untuk sekelompok pekerja menggunakan data panel. Selain upah, fungsi pengupahan
dapat mencakup usia, pengalaman, dan pendidikan sebagai variabel penjelas. Misalkan kita juga memutuskan untuk
menambahkan jenis kelamin, warna kulit, dan etnis sebagai variabel tambahan dalam model. Karena variabel ini tidak akan
berubah dari waktu ke waktu untuk subjek individu, pendekatan LSDV mungkin tidak dapat mengidentifikasi dampak variabel
varian waktu tersebut terhadap upah. Dengan kata lain, intersep khusus subjek menyerap semua heterogenitas yang
mungkin ada dalam variabel dependen dan penjelas. Secara kebetulan, variabel invarian waktu terkadang dipanggil variabel
gangguan atau variabel tersembunyi.
Keempat, kita harus memikirkan dengan hati-hati tentang istilah kesalahan u Itu . Hasil yang telah kami sajikan di Persamaan.
(16.3.1) dan (16.4.1) didasarkan pada asumsi bahwa istilah kesalahan mengikuti
asumsi klasik, yaitu, u Itu ∼ N ( 0, σ 2). Sejak indeks saya mengacu pada penampang
observasi dan t untuk pengamatan deret waktu, asumsi klasik untuk u Itu mungkin harus dimodifikasi. Ada
beberapa kemungkinan, antara lain:
1. Kita dapat mengasumsikan bahwa varian kesalahan adalah sama untuk semua unit penampang atau kita dapat mengasumsikan
bahwa varians kesalahan adalah heteroskedastis. 5
2. Untuk setiap entitas, kita dapat mengasumsikan bahwa tidak ada autokorelasi dari waktu ke waktu. Jadi, dalam contoh ilustratif kita,
kita dapat mengasumsikan bahwa istilah kesalahan fungsi biaya untuk maskapai penerbangan # 1 adalah non-autocorrelated, atau
kita dapat mengasumsikan bahwa itu adalah autokorelasi, katakanlah, dari tipe AR (1).
3. Untuk waktu tertentu, ada kemungkinan bahwa istilah kesalahan untuk maskapai penerbangan # 1 berkorelasi dengan istilah
kesalahan untuk, katakanlah, maskapai # 2. 6 Atau kita dapat berasumsi bahwa tidak ada korelasi seperti itu.
Ada juga kombinasi dan permutasi lain dari istilah kesalahan. Seperti yang akan segera Anda sadari, membiarkan satu atau
lebih dari kemungkinan ini akan membuat analisis menjadi jauh lebih rumit. (Ruang dan tuntutan matematika menghalangi
kita untuk mempertimbangkan semua kemungkinan. Referensi pada catatan kaki 1 membahas beberapa topik ini.) Namun,
beberapa masalah ini dapat dikurangi jika kita mempertimbangkan alternatif yang dibahas dalam dua bagian berikutnya.
16.5 Estimator Efek Tetap Dalam Grup (WG)

Salah satu cara untuk memperkirakan regresi gabungan adalah dengan menghilangkan efek tetap, β 1 saya, dengan mengungkapkan nilai
variabel dependen dan penjelas untuk setiap maskapai penerbangan sebagai deviasi dari
nilai rata-rata mereka masing-masing. Jadi, untuk maskapai # 1 kita akan mendapatkan nilai rata-rata sampel
TC, Q, PF, dan LF, (TC, Q, PF, dan LF, masing-masing) dan kurangi dari nilai individual variabel ini. Nilai yang
dihasilkan disebut "de-meaned" atau diperbaiki nilai-nilai. Kami melakukan ini untuk e ac h udara baris a nd lalu
kumpulkan semua (90) nilai rata-rata yang dikoreksi dan jalankan regresi OLS.
Membiarkan tc Itu , q Itu , pf Itu , dan lf Itu mewakili nilai rata-rata yang dikoreksi, sekarang kita menjalankan regresi:
tc itu = β 2 q itu + β 3 pf itu + β 4 lf itu + u Itu (16.5.1)
dimana i = 1, 2,. . ., 6, dan t = 1, 2,. . ., 15. Perhatikan bahwa Persamaan. (16.5.1) tidak memiliki istilah intersep (mengapa?).
Kembali ke contoh kita, kita mendapatkan hasil pada Tabel 16.4. catatan: Prefix DM berarti bahwa nilai
dikoreksi mean atau dinyatakan sebagai deviasi dari mean sampelnya.
Perhatikan perbedaan antara regresi gabungan yang diberikan pada Tabel 16.2 dan regresi gabungan pada Tabel 16.4. Yang
pertama mengabaikan heterogenitas di antara enam maskapai penerbangan, sedangkan yang kedua memperhitungkannya, bukan
dengan metode variabel dummy, tetapi dengan menghilangkannya dengan membedakan pengamatan sampel di sekitar sarana
sampel mereka. Perbedaan antara keduanya jelas terlihat, seperti yang ditunjukkan pada Gambar 16.2.
Dapat ditunjukkan bahwa penduga WG menghasilkan perkiraan yang konsisten koefisien kemiringan, sedangkan
regresi gabungan biasa mungkin tidak. Namun, itu harus ditambahkan,
5 STATA memberikan kesalahan standar yang dikoreksi heteroskedastisitas dalam model regresi data panel.
6 Ini mengarah pada apa yang disebut model regresi yang tampaknya tidak terkait (SURE), awalnya diusulkan oleh Arnold Zellner.
Lihat A. Zellner, “Metode Efisien untuk Memperkirakan Regresi dan Tes yang Tampak Tidak Terkait untuk Bias Agregasi,” Jurnal
Asosiasi Statistik Amerika, vol. 57, 1962, hlm. 348–368.
TABEL 16.4
Variabel Terikat: DMTC
Contoh: 1–90
DMQ 3319023. 165339.8 20.07396 0.0000

DMPF 0.773071 0,093903 8.232630 0.0000
DMLF - 3797368. 592230,5 - 6.411976 0.0000
R- kuadrat 0,929366 Berarti tergantung var. 2.59E-11

Disesuaikan R- kuadrat 0,927743 Variabel tergantung SD. 755325.8 Statistik
SE regresi 203037.2 Jumlah kuadrat resid. Durbin – Watson. 0,693287
3.59E + 12
GAMBAR 16.2 Y * Itu
Di dalam grup
penduga.
Sumber: Alan Duncan, “CrossSection

and Panel Data
Ekonometrika, ”tidak diterbitkan
catatan kuliah (diadaptasi).
α2
E (Y * itu | X * itu) = β X * Itu

α1
Total biaya
X * Itu
Keluaran
bahwa penaksir WG, meskipun konsisten, tidak efisien (yaitu, memiliki varian yang lebih besar) dibandingkan
dengan hasil regresi gabungan biasa. 7 Amati bahwa koefisien kemiringan dari Q, PF, dan LF identik pada Tabel
16.3 dan 16.4. Ini karena secara matematis kedua model itu identik. Secara kebetulan, koefisien regresi yang
diperkirakan dengan metode WG dipanggil Penduga WG.
Salah satu kelemahan penduga WG dapat dijelaskan dengan model regresi upah berikut:
W itu = β 1 i + β 2 Pengalaman itu + β 3 Usia itu + β 4 Jenis kelamin itu + β 5 pendidikan itu + β 6 Ras Itu
(16.5.2)
Dalam fungsi pengupahan ini, variabel seperti jenis kelamin, pendidikan, dan ras tidak berubah-ubah waktu. Jika kita
menggunakan estimator WG, variabel invarian waktu ini akan dihapuskan (karena
7 Alasannya adalah bahwa ketika kita menyatakan variabel sebagai penyimpangan dari nilai rata-ratanya, variasi dalam nilai
yang dikoreksi rata-rata ini akan jauh lebih kecil daripada variasi nilai asli dari
variabel. Dalam hal ini, variasi istilah gangguan u Itu mungkin relatif besar, sehingga mengarah ke kesalahan standar yang lebih
tinggi dari koefisien yang diperkirakan.
perbedaan). Akibatnya, kita tidak akan tahu bagaimana upah bereaksi terhadap variabel yang tidak berubah-ubah-waktu ini. 8 Tapi ini
harga yang harus kita bayar untuk menghindari korelasi antara istilah kesalahan
( α saya termasuk dalam v Itu ) dan variabel penjelas.
Kerugian lain dari penaksir WG adalah bahwa, “. . . itu dapat merusak parameter val-
dan pasti dapat menghilangkan efek jangka panjang. " 9 Secara umum, saat kami membedakan variabel, kami menghapus
komponen jangka panjang dari variabel itu. Yang tersisa adalah nilai jangka pendek dari variabel itu. Kita akan membahas ini
lebih jauh ketika kita membahas ekonometrik deret waktu nanti di buku ini.
Dalam menggunakan LSDV kami memperoleh perkiraan langsung dari intersep untuk setiap maskapai penerbangan. Bagaimana
kita bisa mendapatkan perkiraan penyadapan dengan menggunakan metode WG? Untuk contoh maskapai diperoleh sebagai berikut:
α̂ i = C saya - β̂ 2 Q saya - β̂ 3 PF saya - β̂ 4 LF (16.5.3)
di mana batang di atas variabel menunjukkan nilai rata-rata sampel dari variabel untuk saya maskapai penerbangan th.
Artinya, kami memperoleh nilai intersep dari saya maskapai penerbangan dengan mengurangkan dari nilai rata-rata variabel
dependen nilai rata-rata variabel penjelas untuk maskapai tersebut dikalikan koefisien kemiringan yang diperkirakan dari
penduga WG. Perhatikan bahwa koefisien kemiringan yang diperkirakan tetap sama untuk semua maskapai, seperti yang
ditunjukkan pada Tabel 16.4. Dapat dicatat bahwa intersep diperkirakan dalam Persamaan. (16.5.3) mirip dengan intersep yang
kami perkirakan dalam model regresi linier standar, yang dapat dilihat dari Persamaan. (7.4.21). Kita biarkan pembaca
menemukan intersep dari enam maskapai dengan cara yang ditunjukkan dan memverifikasi bahwa mereka sama dengan nilai
intersep yang diturunkan pada Tabel 16.3, kecuali kesalahan pembulatan.
Perlu dicatat bahwa perkiraan intersep masing-masing maskapai mewakili subjek-spesifik

karakteristik masing-masing maskapai penerbangan, tetapi kami tidak akan dapat mengidentifikasi karakteristik ini
secara individual. Jadi, α 1 intercept untuk maskapai penerbangan # 1 mewakili filosofi manajemen maskapai
tersebut, komposisi dewan direksi, kepribadian CEO, jenis kelamin
CEO, dll. Semua karakteristik heterogenitas ini dimasukkan ke dalam nilai intersep. Seperti yang akan kita lihat nanti,
karakteristik seperti itu dapat dimasukkan dalam file model efek acak.
Secara sepintas, kami mencatat bahwa alternatif penduga WG adalah metode perbedaan pertama. Dalam metode WG,
kami menyatakan setiap variabel sebagai penyimpangan dari nilai rata-rata variabel itu. Dalam metode perbedaan pertama, untuk
setiap subjek kami mengambil perbedaan variabel yang berurutan. Jadi, untuk maskapai penerbangan # 1 kita mengurangi
observasi pertama TC dari pengamatan kedua TC, pengamatan kedua TC dari pengamatan ketiga TC, dan seterusnya. Kami
melakukan ini untuk setiap variabel yang tersisa dan mengulangi proses ini untuk lima maskapai penerbangan yang tersisa.
Setelah proses ini, kami hanya memiliki 14 pengamatan untuk setiap maskapai, karena pengamatan pertama tidak memiliki nilai
sebelumnya. Hasilnya, kami sekarang memiliki 84 observasi, bukan 90 observasi asli. Kami kemudian meregresikan nilai-nilai
yang dibedakan pertama dari TC variabel pada nilai-nilai yang dibedakan pertama dari variabel penjelas sebagai berikut:
TC itu = β 2 Q itu + β 3 PF itu + β 4 LF itu + ( u Itu - u Itu - 1)

i = 1, 2,. . . , 6 (16.5.4)
t = 1, 2,. . . , 84
dimana = ( TC Itu - TC Itu - 1). Sebagaimana dicatat di Bab 11, disebut perbedaan pertama
operator. 10
8 Ini juga berlaku untuk model LSDV.

9 Dimitrios Asteriou dan Stephen G. Hall, Ekonometrika Terapan: Pendekatan Modern, Palgrave Macmillan, New York,
2007, hal. 347.

10 Perhatikan bahwa Persamaan. (16.5.3) tidak memiliki istilah intersep (mengapa?), Tetapi kita dapat memasukkannya jika ada variabel tren dalam model
aslinya.
Secara sepintas, perhatikan bahwa suku gangguan awal sekarang digantikan oleh selisih antara nilai suku
gangguan saat ini dan sebelumnya. Jika istilah gangguan asli tidak berkorelasi otomatis, gangguan yang
ditransformasikan adalah, dan karena itu menimbulkan jenis masalah estimasi yang telah kita bahas di Bab 11.
Namun, jika variabel penjelasnya sangat eksogen, penduga perbedaan pertama tidak bias, mengingat nilai
variabel penjelas. Juga perhatikan bahwa metode perbedaan pertama memiliki kelemahan yang sama dengan
metode WG di mana variabel penjelas yang tetap tetap dari waktu ke waktu untuk individu dihapuskan dalam
transformasi perbedaan pertama.
Dapat ditunjukkan bahwa perbedaan pertama dan penaksir efek tetap adalah sama ketika kita hanya memiliki dua
periode waktu, tetapi jika ada lebih dari dua periode, penduga ini berbeda. Alasan untuk ini agak terlibat dan pembaca yang
tertarik dapat berkonsultasi dengan referensi. 11 Hal ini dibiarkan sebagai latihan bagi pembaca untuk menerapkan metode
perbedaan pertama pada contoh maskapai kami dan membandingkan hasilnya dengan penaksir efek tetap lainnya.
16.6 Model Efek Acak (REM)

Mengomentari efek tetap, atau LSDV, pemodelan, Kmenta menulis: 12
Pertanyaan yang jelas terkait dengan model kovarian [yaitu, LSDV] adalah apakah penyertaan variabel dummy — dan
konsekuensi hilangnya jumlah derajat kebebasan — benar-benar diperlukan. Alasan yang mendasari model kovarian adalah
bahwa dalam menentukan model regresi kami telah gagal memasukkan variabel penjelas yang relevan yang tidak berubah
dari waktu ke waktu (dan mungkin yang lain yang berubah seiring waktu tetapi memiliki nilai yang sama untuk semua unit
penampang), dan bahwa dimasukkannya variabel dummy adalah a menutupi ketidaktahuan kita.
Jika variabel dummy memang mewakili kurangnya pengetahuan tentang model (benar), mengapa tidak mengungkapkan
ketidaktahuan ini melalui istilah gangguan? Inilah pendekatan yang disarankan oleh para pendukung yang disebut model
komponen kesalahan (ECM) atau model efek acak (REM), yang sekarang akan kami ilustrasikan dengan fungsi biaya
penerbangan kami.
Ide dasarnya adalah memulai dengan Persamaan. (16.4.1):
TC itu = β 1 i + β 2 Q itu + β 3 PF itu + β 4 LF itu + u Itu (16.6.1)
Bukannya mengobati β 1 saya sebagaimana tetap, kami berasumsi bahwa ini adalah variabel acak dengan nilai rata-rata β 1 ( tidak ada
subskrip saya di sini). Nilai intersep untuk masing-masing perusahaan dapat dinyatakan sebagai
β 1 i = β 1 + ε saya (16.6.2)
dimana ε saya adalah istilah kesalahan acak dengan nilai rata-rata nol dan varians σ 2 ε.
Apa yang pada dasarnya kami katakan adalah bahwa enam perusahaan yang termasuk dalam sampel kami adalah gambar
dari dunia perusahaan yang jauh lebih besar dan bahwa mereka memiliki nilai rata-rata yang sama
untuk intersep (= β 1). Perbedaan individu dalam nilai intersep masing-masing perusahaan
direfleksikan dalam istilah kesalahan ε i.
Mengganti Persamaan. (16.6.2) ke Persamaan. (16.6.1), kami memperoleh:
TC itu = β 1 + β 2 Q itu + β 3 PF itu + β 4 LF itu + ε i + u Itu

(16.6.3)
= β 1 + β 2 Q itu + β 3 PF itu + β 4 LF itu + w Itu
dimana
w itu = ε i + u Itu (16.6.4)
11 Lihat khususnya Jeffrey M. Wooldridge, Analisis Ekonometrik Data Penampang dan Panel, MIT Press, Cambridge, Mass.,
2002, hlm. 279–283.

12 Jan Kmenta, Elemen Ekonometrika, 2d ed., Macmillan, New York, 1986, hal. 633.
Istilah kesalahan gabungan w Itu terdiri dari dua komponen: ε saya, yang merupakan penampang,
atau individu-spesifik, komponen kesalahan, dan u Itu , yang merupakan gabungan deret waktu dan komponen
kesalahan penampang dan terkadang disebut istilah istimewa karena itu
bervariasi lintas bagian (yaitu, subjek) serta waktu. Itu model komponen kesalahan ( ECM) dinamai demikian karena
istilah kesalahan komposit terdiri dari dua (atau lebih) komponen kesalahan.
Asumsi umum yang dibuat oleh ECM adalah seperti itu
ε saya ∼ N (( 0, σ 2 ε))
u Itu ∼ N 0, σ 2 u
(16.6.5)
E ( ε saya u itu) = 0; E ( ε saya ε j) = 0 ( i = j)
E (u Itu u adalah) = E (u aku j u ij) = E (u Itu u js) = 0 ( i = j; t = s)
Artinya, komponen kesalahan individu tidak berkorelasi satu sama lain dan tidak autocor-
terkait di kedua unit penampang dan deret waktu. Juga sangat penting untuk dicatat bahwa w Itu
tidak berkorelasi dengan variabel penjelas apa pun yang termasuk dalam model. Sejak ε saya adalah com-
ponent dari w Itu , ada kemungkinan bahwa yang terakhir berkorelasi dengan variabel penjelas. Jika memang demikian,
ECM akan menghasilkan estimasi koefisien regresi yang tidak konsisten.
Singkatnya, kami akan membahas Tes Hausman, yang akan memberi tahu kami dalam aplikasi tertentu jika w Itu berkorelasi
dengan variabel penjelas, yaitu apakah ECM adalah model yang sesuai.
Perhatikan baik-baik perbedaan antara FEM dan ECM. Dalam FEM setiap unit penampang memiliki nilai
intersep (tetap) sendiri, secara keseluruhan N nilai-nilai tersebut untuk N unit penampang. Di ECM, di sisi lain,
intersep (umum) mewakili nilai rata-rata dari semua
(cross-sectional) penyadapan dan komponen kesalahan ε saya mewakili penyimpangan (acak)
intersepsi individu dari nilai rata-rata ini. Ingatlah, bagaimanapun, itu ε saya tidak dapat diamati secara langsung; itu yang dikenal
sebagai file tidak dapat diamati, atau laten, variabel.
Sebagai hasil dari asumsi yang dinyatakan dalam Persamaan. (16.6.5), maka itu
E (w itu) = 0 (16.6.6)
var ( w itu) = σ 2 ε+σ2 u (16.6.7)
Sekarang jikaε σ= 20, tidak ada perbedaan antara model (16.3.1) dan (16.6.3) dan kami bisa
cukup kumpulkan semua observasi (cross-sectional dan time series) dan jalankan regresi-
sion, seperti yang kita lakukan di Persamaan. (16.3.1). Ini benar karena dalam situasi ini tidak ada efek khusus
subjek atau semuanya telah diperhitungkan dalam variabel penjelas.
Sebagai Persamaan. (16.6.7) menunjukkan, istilah kesalahannya homoscedastic. Namun, hal itu dapat ditunjukkan w Itu
dan w adalah( t = s) berkorelasi; artinya, istilah kesalahan dari unit penampang tertentu pada dua titik waktu yang berbeda
berkorelasi. Koefisien korelasi, kor ( w Itu , w adalah ), adalah sebagai berikut:
σ ε2
ρ = koreksi ( w Itu , w adalah) = ;t=s (16.6.8)
σ ε2 + σ 2 u
Perhatikan dua fitur khusus dari koefisien korelasi sebelumnya. Pertama, untuk setiap unit penampang tertentu,
nilai korelasi antara istilah kesalahan pada dua waktu yang berbeda tetap sama tidak peduli seberapa jauh dua
periode waktu tersebut, seperti yang jelas dari Persamaan. (16.6.8). Hal ini sangat kontras dengan skema orde
pertama [AR (1)] yang telah kita bahas di Bab 12, di mana kami menemukan bahwa korelasi antar periode menurun
seiring waktu.
Kedua, struktur korelasi yang diberikan dalam Persamaan. (16.6.8) tetap sama untuk semua unit penampang; artinya, ini
identik untuk semua mata pelajaran.
Jika kita tidak memperhitungkan struktur korelasi ini, dan perkirakan Persamaan. (16.6.3) oleh OLS, estimator
yang dihasilkan akan menjadi tidak efisien. Metode yang paling tepat disini adalah metode kuadrat terkecil umum
(GLS).
TABEL 16.5
Variabel Terikat: TC
Metode: Panel EGLS (Efek acak penampang)
Contoh: 1–15
Periode termasuk: 15
Penampang melintang termasuk: 6
Pengamatan panel total (seimbang): 90
Estimator Swamy dan Arora dari varian komponen
C 107429.3 303966.2 3.534251 0,0007

Q 2288588. 88172.77 25.95572 0.0000
PF 1.123591 0,083298 13.48877 0.0000
LF - 3084994. 584373.2 - 5.279151 0.0000
Spesifikasi Efek
SD Rho
Penampang acak 107411.2 0,2067

Acak idiosinkratik 210422.8 0.7933
Perusahaan Efek
1 1.000000 - 270615.0
2 2.000000 - 87061.32
3 3.000000 - 21338.40
4 4.000000 187142.9
5 5.000000 134488.9
6 6.000000 57383,00
Kami tidak akan membahas matematika GLS dalam konteks sekarang karena kompleksitasnya. 13 Karena sebagian besar paket
perangkat lunak statistik modern sekarang memiliki rutinitas untuk memperkirakan ECM (serta FEM), kami akan menyajikan hasil
hanya untuk contoh ilustratif kami. Tetapi sebelum kita melakukan itu, perlu dicatat bahwa kita dapat dengan mudah memperluas
Persamaan. (16.4.2) untuk memungkinkan komponen kesalahan acak memperhitungkan variasi dari waktu ke waktu (lihat Latihan
16.6).
Hasil estimasi ECM dari fungsi biaya penerbangan disajikan pada Tabel 16.5. Perhatikan fitur-fitur REM ini. Nilai
intersep (rata-rata) adalah 107429,3. Nilai intersep (diferensial) dari enam entitas diberikan di bagian bawah hasil
regresi. Perusahaan nomor 1, misalnya, memiliki nilai intersep yaitu 270615 unit lebih rendah dari nilai intersep
umum 107429,3; nilai sebenarnya dari intersep untuk maskapai ini adalah - 163185.7. Di sisi lain, nilai intersep dari
perusahaan nomor 6 lebih tinggi sebesar 57383 unit daripada nilai intersep umum; nilai intersep sebenarnya untuk
maskapai ini adalah (107429,3 + 57383), atau 164812,3. Nilai intersep untuk maskapai lain dapat diturunkan dengan
cara yang sama. Namun, perhatikan bahwa jika Anda menambahkan nilai intersep (diferensial) dari semua enam
maskapai penerbangan, jumlahnya adalah 0, sebagaimana mestinya (mengapa?).
Jika Anda membandingkan hasil regresi efek tetap dan efek acak, Anda akan melihat bahwa ada perbedaan
substansial di antara keduanya. Pertanyaan penting sekarang adalah: Hasil mana yang dapat diandalkan? Atau, dengan
kata lain, mana yang seharusnya menjadi pilihan di antara kedua model? Kita bisa menerapkan Tes Hausman untuk
menjelaskan pertanyaan ini.
Hipotesis nol yang mendasari uji Hausman adalah bahwa penaksir FEM dan ECM tidak berbeda secara
substansial. Statistik uji yang dikembangkan oleh Hausman bersifat asimtotik χ 2
13 Lihat Kmenta, op. cit., hlm. 625–630.

TABEL 16.6
Efek Acak Berkorelasi — Persamaan Tes Hausman: Tanpa
Judul
Uji efek acak penampang
Chi-Sq.
Ringkasan Tes Statistik Chi-Sq. df Masalah.
Penampang acak 49.619687 3 0.0000
Perbandingan uji efek acak lintas bagian: Variabel

Tetap Acak Var (Selisih) Masalah.
Q 3319023.28 2288587,95 21587779733. 0.0000

PF 0.773071 1.123591 0,002532 0.0000
LF - 3797367.59 - 3084994.0 35225469544. 0,0001
distribusi. Jika hipotesis nol ditolak, kesimpulannya adalah ECM tidak sesuai karena efek acak
mungkin berkorelasi dengan satu atau lebih regressor. Dalam hal ini, FEM lebih disukai daripada
ECM. Untuk contoh kami, hasil uji Hausman ditunjukkan pada Tabel 16.6.
Tes Hausman dengan jelas menolak hipotesis nol, untuk perkiraan χ 2 nilai untuk 3 df sangat signifikan; jika
hipotesis nol benar, probabilitas untuk memperoleh nilai chisquare sebanyak 49,62 atau lebih besar akan praktis
nol. Akibatnya, kami dapat menolak ECM (REM) demi FEM. Secara kebetulan, bagian terakhir dari tabel
sebelumnya membandingkan koefisien fixed-effect dan random-effect dari masing-masing variabel dan, seperti
yang ditunjukkan pada kolom terakhir, dalam contoh ini perbedaannya signifikan secara statistik.
Uji Pengganda Breusch dan Pagan Lagrange 14

Selain tes Hausman, kami juga dapat menggunakan tes Breusch-Pagan (BP) untuk menguji hipotesis-
bahwa tidak ada efek acak, yaitu, σ 2 u dalam Persamaan. (16.6.7) adalah nol. Tes ini sudah terpasang
paket perangkat lunak seperti STATA. Di bawah hipotesis nol, BP mengikuti distribusi chi-kuadrat dengan
1 df; hanya ada 1 df karena kami menguji hipotesis tunggal itu
σ u2 = 0. Kami tidak akan menyajikan rumus yang mendasari pengujian tersebut, karena ini agak rumit. Beralih ke contoh
maskapai penerbangan kami, penerapan uji BP menghasilkan nilai chi-kuadrat
dari 0,61. Dengan 1 df, maka p nilai untuk memperoleh nilai chi-kuadrat 0,61 atau lebih besar adalah sekitar 43
persen. Oleh karena itu, kami tidak menolak hipotesis nol. Dengan kata lain, model efek acak tidak sesuai dalam
contoh ini. Tes BP memperkuat tes Hausman, yang juga menemukan bahwa model efek acak tidak sesuai untuk
contoh penerbangan kami.
16.7 Properti Berbagai Estimator 15

Kita telah membahas beberapa metode untuk memperkirakan model regresi panel (linier), yaitu, penaksir yang
dikumpulkan, penaksir efek tetap yang mencakup penaksir variabel dummy kuadrat terkecil (LSDV), penaksir efek
tetap dalam kelompok, penaksir perbedaan pertama, dan penaksir efek randome. Apa sifat statistiknya? Karena data
panel umumnya melibatkan sejumlah besar pengamatan, kami akan berkonsentrasi pada properti konsistensi
penduga ini.
14 T. Breusch dan AR Pagan, “Uji Pengganda Lagrange dan Aplikasinya pada Spesifikasi Model dalam Ekonometrika,” Review
Studi Ekonomi, vol. 47, 1980, hlm. 239–253.

15 Pembahasan berikut mengacu pada A. Colin Cameron dan Pravin K. Trivedi, Mikroekonometrik: Metode dan Aplikasi, Cambridge
University Press, Cambridge, New York, 2005, Bab 21.

Estimator yang Dikumpulkan
Dengan asumsi koefisien kemiringan konstan di semua subjek, jika istilah kesalahan dalam Persamaan. (16.3.1) tidak berkorelasi
dengan regressor, estimator yang dikumpulkan konsisten. Namun, seperti disebutkan sebelumnya, istilah kesalahan cenderung
berkorelasi dari waktu ke waktu untuk subjek tertentu. Karena itu,
kesalahan standar yang dikoreksi panel harus digunakan untuk pengujian hipotesis. Pastikan paket statistik yang Anda
gunakan memiliki fasilitas ini, jika tidak kesalahan standar yang dihitung dapat dianggap remeh. Perlu dicatat bahwa jika
model efek tetap sesuai tetapi kita menggunakan penaksir yang dikumpulkan, koefisien yang diperkirakan akan menjadi tidak
konsisten.
Estimator Efek Tetap

Bahkan jika diasumsikan bahwa model yang mendasari dikumpulkan atau acak, penaksir efek tetap selalu
konsisten.
Estimator Efek Acak

Model efek acak konsisten meskipun model sebenarnya adalah penaksir yang dikumpulkan. Namun, jika model
yang benar adalah efek tetap, penduga efek acak tidak konsisten.
Untuk bukti dan detail lebih lanjut tentang properti ini, lihat buku teks Cameron dan Trivedi, Greene, dan
Wooldridge yang dikutip di catatan kaki.
16.8 Model Efek Tetap versus Efek Acak: Beberapa Panduan

Tantangan yang dihadapi seorang peneliti adalah: Model mana yang lebih baik, FEM atau ECM? Jawaban atas pertanyaan ini
bergantung pada asumsi yang kami buat tentang kemungkinan korelasi di antara keduanya
komponen kesalahan individu, atau penampang melintang tertentu ε saya dan X regressor.
Jika diasumsikan demikian ε saya dan X Tidak berkorelasi, ECM mungkin sesuai, sedangkan jika ε saya dan X itu
berkorelasi, FEM mungkin sesuai.
Asumsi yang mendasari ECM adalah bahwa ε saya adalah gambar acak dari populasi yang jauh lebih besar,
tetapi terkadang tidak demikian. Misalnya, kita ingin mempelajari file
tingkat kejahatan di 50 negara bagian di Amerika Serikat. Jelas, dalam kasus ini, asumsi bahwa 50 negara bagian adalah
sampel acak tidak dapat dipertahankan.
Dengan mengingat perbedaan mendasar dalam dua pendekatan ini, apa lagi yang dapat kami katakan tentang pilihan
antara FEM dan ECM? Berikut observasi yang dilakukan oleh Judge et al. semoga bermanfaat: 16
1. Jika T ( jumlah data deret waktu) besar dan N ( jumlah unit penampang)
kecil, mungkin ada sedikit perbedaan dalam nilai parameter yang diperkirakan oleh FEM dan ECM. Karenanya,
pilihan di sini didasarkan pada kenyamanan komputasi. Pada skor ini, FEM mungkin lebih disukai.
2. Kapan N besar dan T kecil (yaitu, panel pendek), perkiraan diperoleh oleh twometh-
ods bisa berbeda secara signifikan. Ingatlah bahwa di ECM β 1 i = β 1 + ε saya, dimana ε saya adalah salib-
komponen acak bagian, sedangkan di FEMwe mengobati β 1 saya sebagai tetap dan tidak acak. Dalam kasus terakhir,
inferensi statistik bergantung pada unit penampang yang diamati di
contoh. Ini sesuai jika kami sangat yakin bahwa unit individu, atau penampang, dalam sampel kami
bukanlah gambar acak dari sampel yang lebih besar. Dalam hal ini, FEM sesuai. Jika unit penampang
dalam sampel dianggap sebagai gambar acak, maka ECM sesuai, karena dalam kasus ini inferensi
statistik tidak bersyarat.
3. Jika komponen kesalahan individu ε saya dan satu atau lebih regressor dikorelasikan, kemudian
Estimator ECM bias, sedangkan yang diperoleh dari FEM tidak bias.
16 Hakim dkk., Op. cit., hlm. 489–491.

4. Jika N besar dan T kecil, dan jika asumsi yang mendasari ECM berlaku, ECM memperkirakan
torsi lebih efisien daripada FEM.
5. Tidak seperti FEM, ECM dapat memperkirakan koefisien variabel invarian waktu seperti jenis kelamin dan etnis. FEM tidak
mengontrol variabel invarian waktu seperti itu, tetapi tidak dapat memperkirakannya secara langsung, seperti yang jelas dari
LSDV atau model penduga dalam kelompok. Di sisi lain, FEM mengontrol semua variabel time-invariant (mengapa?),
sedangkan ECM hanya dapat memperkirakan variabel time-invariant seperti yang secara eksplisit diperkenalkan dalam
model.
Meskipun tes Hausman, penting untuk diingat peringatan yang dibunyikan oleh Johnston dan DiNardo. Dalam
memutuskan antara efek tetap atau model efek acak, mereka berpendapat bahwa, ". . . tidak ada aturan
sederhana untuk membantu peneliti menavigasi melewati efek tetap Scylla dan Charybdis kesalahan pengukuran
dan pemilihan dinamis. Meskipun ini merupakan peningkatan dari data penampang, data panel tidak memberikan
solusi untuk semua masalah ahli ekonometri. " 17
16.9 Regresi Data Panel: Beberapa Komentar Penutup

Seperti disebutkan di awal, topik pemodelan data panel sangat luas dan kompleks. Kami baru saja menyentuh
permukaan. Berikut ini adalah di antara banyak topik yang belum kami bahas.
1. Pengujian hipotesis dengan data panel.
2. Heteroskedastisitas dan autokorelasi dalam ECM.
3. Data panel tidak seimbang.
4. Model data panel dinamis di mana nilai tertinggal dari regresi dan muncul sebagai variabel penjelas.
5. Persamaan simultan yang melibatkan data panel.
6. Variabel dependen kualitatif dan data panel.

7. Unit akar dalam data panel (pada akar unit, lihat Bab 21).
Satu atau lebih dari topik ini dapat ditemukan dalam referensi yang dikutip dalam bab ini, dan pembaca didorong untuk
berkonsultasi dengan mereka untuk mempelajari lebih lanjut tentang topik ini. Referensi ini juga mengutip beberapa studi
empiris di berbagai bidang bisnis dan ekonomi yang telah menggunakan model regresi data panel. Pemula disarankan untuk
membaca beberapa aplikasi ini untuk mengetahui bagaimana para peneliti benar-benar menerapkan model tersebut. 18
16.10 Beberapa Contoh Ilustrasi
CONTOH 16.1 Untuk mengetahui mengapa produktivitas menurun dan apa peran investasi publik, Alicia Munnell mempelajari data
Produktivitas dan produktivitas di 48 benua Amerika Serikat selama 17 tahun dari tahun 1970 hingga
1986, dengan total 816 observasi. 19 Dengan menggunakan data ini, kami memperkirakan regresi yang dikumpulkan pada Tabel
Publik
16.7. Perhatikan bahwa regresi ini tidak memperhitungkan sifat panel data.
Investasi Variabel dependen dalam model ini adalah GSP (gross state product), dan variabel penjelasnya adalah:
PRIVCAP (modal swasta), PUBCAP (modal publik), WATER (modal utilitas air), dan UNEMP (tingkat
pengangguran). catatan: L singkatan dari log alami.
( Lanjutan)
17 Jack Johnston dan John DiNardo, Metode Ekonometrik, Edisi ke-4, McGraw-Hill, 1997, hal. 403.
18 Untuk detail lebih lanjut dan aplikasi konkret, lihat Paul D. Allison, Metode Regresi Efek Tetap untuk Data Longitudinal,
Menggunakan SAS, Institut SAS, Cary, Carolina Utara, 2005.

19 Data Munnell dapat ditemukan di www.aw-bc.com/murray.
CONTOH 16.1 TABEL 16.7

( Lanjutan)
Variabel Terikat: LGSP
Metode: Panel Kotak Terkecil
Contoh: 1970–1986
C 0,907604 0,091328 9.937854 0.0000

L PRIVCAP 0,376011 0,027753 13.54847 0.0000
L PUBCAP 0,351478 0,016162 21.74758 0.0000
L AIR 0,312959 0,018739 16.70062 0.0000
L UNEMP - 0,069886 0,015092 - 4.630528 0.0000
R- kuadrat 0,981624 Berarti tergantung var. 10.50885

Disesuaikan R- kuadrat 0,981533 Variabel tergantung SD. 1.021132
SE regresi 0.138765 F- statistik. 10830.51
Jumlahkan sisa kuadrat. 15.61630 Masalah. ( F- statistik) 0.000000
Kemungkinan log 456.2346 Statistik Durbin – Watson. 0,063016
Semua variabel memiliki tanda yang diharapkan dan semuanya secara individual, serta secara kolektif,
signifikan secara statistik, dengan asumsi semua asumsi model regresi linier klasik berlaku.
Untuk memperhitungkan dimensi panel data, pada Tabel 16.8 kami memperkirakan model efek tetap menggunakan 47
boneka untuk 48 negara bagian untuk menghindari jatuh ke variabel dummy
TABEL 16.8
Contoh: 1970–1986
C - 0,033235 0.208648 - 0,159286 0.8735

L PRIVCAP 0,267096 0,037015 7.215864 0.0000
L PUBCAP 0.714094 0,026520 26.92636 0.0000
L AIR 0,088272 0,021581 4.090291 0.0000
L UNEMP - 0.138854 0,007851 - 17,68611 0.0000
Spesifikasi Efek
Penampang tetap (variabel dummy)
R- kuadrat 0.997634 Berarti tergantung var. 10.50885

Disesuaikan R- kuadrat 0.997476 Variabel tergantung SD. 1.021132
SE regresi 0,051303 F- statistik 6315.897
Jumlahkan sisa kuadrat. 2.010854 Masalah. ( F- statistik) 0.000000
Kemungkinan log 1292.535 Statistik Durbin – Watson. 0,520682

( Lanjutan)
Contoh: 1970–1986
C - 0,046176 0.161637 - 0,285680 0.7752

L PRIVCAP 0.313980 0,029740 10.55760 0.0000
L PUBCAP 0.641926 0,023330 27.51514 0.0000
L AIR 0.130768 0,020281 6.447875 0.0000
LUNEMP - 0.139820 0,007442 - 18,78669 0.0000
Spesifikasi Efek
SD Rho
Penampang acak 0,130128 0.8655

Acak idiosinkratik 0,051303 0.1345
perangkap. Untuk menghemat ruang, kami hanya menyajikan estimasi koefisien regresi dan bukan koefisien dummy individu.
Tetapi harus ditambahkan bahwa semua dari 47 boneka negara bagian secara individual sangat signifikan secara statistik.
Anda dapat melihat bahwa ada perbedaan substansial antara regresi gabungan dan regresi efek tetap,
menimbulkan keraguan pada hasil regresi gabungan.
Untuk melihat apakah model efek acak lebih sesuai dalam kasus ini, kami menyajikan hasil model regresi
efek acak pada Tabel 16.9.
Untuk memilih di antara kedua model, kami menggunakan uji Hausman, yang memberikan hasil yang ditunjukkan pada Tabel
16.10.
Karena estimasi nilai chi-square sangat signifikan secara statistik, kami menolak hipotesis bahwa tidak ada
perbedaan yang signifikan dalam estimasi koefisien dari kedua model. Tampaknya ada korelasi antara istilah
kesalahan dan satu atau lebih regressor. Oleh karena itu, kita dapat menolak model efek acak yang mendukung model
efek tetap. Perhatikan, bagaimanapun, seperti yang ditunjukkan pada bagian terakhir Tabel 16.10, tidak semua
koefisien berbeda dalam kedua model. Misalnya, tidak ada perbedaan yang signifikan secara statistik dalam nilai dari
L Koefisien UNEMP dalam dua model.
TABEL 16.10
Chi-Sq.
Penampang acak 42.458353 4 0.0000
L PRIVCAP 0,267096 0.313980 0,000486 0,0334

L PUBCAP 0.714094 0.641926 0,000159 0.0000
L AIR 0,088272 0.130768 0,000054 0.0000
L UNEMP - 0.138854 - 0.139820 0,000006 0,6993
CONTOH 16.2 Dalam artikel mereka, Maddala et al. mempertimbangkan permintaan listrik perumahan dan gas alam di 49 negara
Permintaan untuk bagian di AS untuk periode 1970–1990; Hawaii tidak dimasukkan dalam analisis. 20 Mereka mengumpulkan data pada
beberapa variabel; data ini dapat ditemukan di situs web buku tersebut. Dalam contoh ini, kami hanya akan
Listrik
mempertimbangkan permintaan listrik perumahan. Kami pertama-tama menyajikan hasil berdasarkan estimasi efek
di Amerika Serikat tetap (Tabel 16.11) dan kemudian estimasi efek acak (Tabel 16.12), diikuti dengan perbandingan kedua model.
TABEL 16.11
Variabel Dependen: Log (ESRCBPC)
Contoh: 1971–1990
C - 12.55760 0,363436 - 34.55249 0.0000

Log (RESRCD) - 0,628967 0,029089 - 21.62236 0.0000
Log (YDPC) 1.062439 0,040280 26.37663 0.0000
Spesifikasi Efek
Penampang tetap (variabel dummy)
R- kuadrat 0.757600 Berarti tergantung var. - 4.536187

Disesuaikan R- kuadrat 0.744553 Variabel tergantung SD. 0,316205
SE regresi 0.159816 Kriteria info Akaike -0.778954
Jumlahkan sisa kuadrat. 23.72762 Kriteria Schwarz - 0,524602
Kemungkinan log 432.6876 Kriteria Hannan-Quinn. - 0,682188
F- statistik 58.07007 Statistik Durbin – Watson. 0.404314
Masalah. ( F- statistik) 0,000000
dimana Log (ESRCBPC) = log alami dari konsumsi listrik perumahan per kapita (dalam miliar btu), Log
(RESRCD) = log alami dari harga listrik riil tahun 1987, dan Log (YDPC) = log alami dari pendapatan nyata per
kapita tahun 1987.
Karena ini adalah model log ganda, koefisien kemiringan yang diperkirakan mewakili elastisitas. Jadi,
dengan menganggap hal lain yang sama, jika pendapatan per kapita riil naik 1 persen, rata-rata konsumsi listrik
naik sekitar 1 persen. Begitu pula dengan hal-hal lain yang tetap, jika harga listrik riil naik 1 persen, rata-rata
konsumsi listrik turun sekitar 0,6 persen. Semua elastisitas yang diperkirakan secara statistik signifikan.
Hasil dari model random error ditunjukkan pada Tabel 16.12.

Nampaknya tidak banyak perbedaan pada kedua model tersebut. Tapi kita bisa menggunakan tes Hausman untuk mencari
tahu apakah memang demikian. Hasil pengujian ini ditunjukkan pada Tabel 16.13.
Meskipun koefisien dari dua model pada Tabel 16.11 dan 16.12 terlihat sangat mirip, uji Hausman
menunjukkan bahwa tidak demikian. Nilai chi-kuadrat sangat signifikan secara statistik. Oleh karena itu, kita
dapat memilih model efek tetap daripada model acak
20 GS Maddala, Robert P. Trost, Hongyi Li, dan Frederick Joutz, "Estimasi Elastisitas Permintaan Jangka Pendek dan Jangka
Panjang dari Data Panel Menggunakan Estimator Shrikdage", Jurnal Statistik Bisnis dan Ekonomi, vol. 15, tidak. 1, Januari 1997,
hlm. 90–100.

( Lanjutan) Variabel Dependen: Log (ESRCBPC)
Contoh: 1971–1990
C - 11.68536 0,353285 - 33.07631 0.0000

Log (RESRCD) - 0.665570 0,028088 - 23.69612 0.0000
Log (YDPC) 0.980877 0,039257 24.98617 0.0000
Spesifikasi Efek
SD Rho
Penampang acak 0.123560 0.3741

Acak idiosinkratik 0.159816 0,6259
Statistik Tertimbang
R- kuadrat 0.462591 Berarti tergantung var. -1,260296

Disesuaikan R- kuadrat 0.461491 Variabel tergantung SD. 0,229066
SE regresi 0.168096 Jumlahkan sisa kuadrat. 27.60641
F- statistik 420.4906 Statistik Durbin – Watson. 0,345453
Masalah. ( F- statistik) 0,000000
Statistik Tidak Berbobot
R- kuadrat 0,267681 Berarti tergantung var. - 4.536187

Jumlahkan sisa kuadrat. 71.68384 Statistik Durbin – Watson. 0.133039
TABEL 16.13
Efek Acak Berkorelasi — Persamaan Tes Hausman: Tanpa
Judul
Uji efek acak penampang
Chi-Sq.
Penampang acak 105.865216 2 0.0000
Log (RESRCD) - 0,628967 - 0.665570 0,000057 0.0000

Log (YDPC) 1.062439 0.980877 0,000081 0.0000
model efek. Contoh ini menunjukkan poin penting bahwa ketika ukuran sampel besar, dalam kasus kami 980
observasi, bahkan perbedaan kecil dalam estimasi koefisien dari kedua model dapat menjadi signifikan secara
statistik. Dengan demikian, koefisien variabel Log (RESRCD) di kedua model terlihat cukup dekat, tetapi secara
statistik tidak.
CONTOH 16.3 Untuk menilai dampak pajak bir pada konsumsi bir, Philip Cook menyelidiki hubungan antara keduanya, setelah
Bir memperhitungkan pengaruh pendapatan. 21 Datanya berkaitan dengan 50 negara bagian dan Washington, DC, untuk
periode 1975–2000. Dalam contoh ini kami mempelajari hubungan penjualan bir per kapita dengan tarif pajak dan
Konsumsi,
pendapatan, semua di tingkat negara bagian. Kami menyajikan hasil OLS yang dikumpulkan, efek tetap, dan model efek
Pendapatan dan acak dalam bentuk tabel pada Tabel 16.14. Variabel terikatnya adalah penjualan bir per kapita.
Pajak Bir
Hasil ini menarik. Sesuai teori ekonomi, kami mengharapkan hubungan negatif antara konsumsi bir dan
pajak bir, yang merupakan kasus untuk ketiga model. Pengaruh pendapatan negatif pada konsumsi bir
menunjukkan bahwa bir adalah
barang inferior. Barang inferior adalah barang yang permintaannya menurun saat pendapatan konsumen meningkat. Mungkin saat
pendapatan mereka naik, konsumen lebih memilih sampanye!
Untuk tujuan kami, yang menarik adalah perbedaan estimasi koefisien. Ternyata tidak banyak perbedaan
dalam koefisien estimasi antara FEM dan ECM. Faktanya, uji Hausman menghasilkan nilai chi-kuadrat 3,4,
yang tidak signifikan untuk 2 df pada tingkat 5 persen; itu p nilainya adalah 0,1783.
Namun, hasil berdasarkan OLS sangat berbeda. Koefisien variabel pajak bir, dalam nilai absolut, jauh lebih
kecil daripada yang diperoleh dari FEM atau ECM. Variabel pendapatan, meskipun bertanda negatif, secara
statistik tidak signifikan, sedangkan dua model lainnya menunjukkan sangat signifikan.
Contoh ini menunjukkan dengan sangat jelas apa yang bisa terjadi jika kita mengabaikan struktur panel data dan
memperkirakan regresi gabungan.
TABEL 16.14
Variabel OLS FEM REM
Konstan 1.4192 1.7617 1.7542

(24,37) (52.23) (39,22)
Pajak bir - 0,0067 - 0,0183 - 0,0181
( - 2.13) ( - 9,67) ( - 9,69)
Pendapatan - 3.54 (e - 6) - 0,000020 - 0,000019
( - 1,12) ( - 9.17) ( - 9.10)
R2 0,0062 0,0052 0,0052
Catatan: Angka dalam tanda kurung adalah perkiraan t rasio. - 3.54 (e - 6) = - 0,00000354.
Ringkasan dan 1. Model regresi panel didasarkan pada data panel. Data panel terdiri dari pengamatan pada unit penampang yang
sama, atau individu, selama beberapa periode waktu.
Kesimpulan
2. Ada beberapa keuntungan menggunakan data panel. Pertama, mereka meningkatkan ukuran sampel secara signifikan.
Kedua, dengan mempelajari observasi penampang berulang, data panel lebih cocok untuk mempelajari dinamika
perubahan. Ketiga, data panel memungkinkan kita mempelajari model perilaku yang lebih rumit.
3. Terlepas dari keunggulan substansial mereka, data panel menimbulkan beberapa masalah estimasi dan
inferensi. Karena data tersebut melibatkan dimensi penampang dan waktu, masalah yang mengganggu data
penampang (misalnya, heteroskedastisitas) dan data deret waktu (misalnya, autokorelasi) perlu ditangani. Ada
beberapa masalah tambahan juga, seperti korelasi silang dalam unit individu pada titik waktu yang sama.
21 Data yang digunakan di sini diperoleh dari situs Michael P. Murphy, Ekonometrika: Pengantar Modern, Pearson / Addison
Wesley, Boston, 2006, tetapi data asli dikumpulkan oleh Philip Cook untuk bukunya, Membayar Tab: Biaya dan Manfaat
Pengendalian Alkohol, Princeton University Press, Princeton, New Jersey, 2007.
4. Ada beberapa teknik estimasi untuk mengatasi satu atau lebih masalah ini. Dua yang paling menonjol
adalah (1) model efek tetap (FEM) dan (2) model efek acak (REM), atau model komponen kesalahan
(ECM).
5. Dalam FEM, intersep dalam model regresi diperbolehkan untuk berbeda antar individu dalam pengakuan fakta bahwa
setiap individu, atau unit penampang, mungkin memiliki beberapa karakteristik khusus sendiri. Untuk
memperhitungkan intersep yang berbeda, seseorang dapat menggunakan variabel dummy. FEM yang
menggunakan variabel dummy dikenal sebagai model variabel dummy kuadrat terkecil (LSDV). FEM sesuai dalam
situasi di mana intersep spesifik individu dapat berkorelasi dengan satu atau lebih regressor. Kerugian dari LSDV
adalah ia mengkonsumsi banyak derajat kebebasan ketika jumlah unit penampang, N, sangat besar, dalam hal ini
kami harus memperkenalkan N boneka (tapi tekan istilah intersep umum).
6. Alternatif untuk FEM adalah ECM. Dalam ECM diasumsikan bahwa intersep unit individu adalah gambar acak dari
populasi yang jauh lebih besar dengan nilai rata-rata konstan. Intercept individu kemudian dinyatakan sebagai deviasi
dari nilai rata-rata konstan ini. Salah satu keuntungan ECM dibandingkan FEM adalah ekonomis dalam derajat
kebebasan, karena kami tidak perlu memperkirakan N penyadapan cross-sectional. Kita hanya perlu memperkirakan
nilai rata-rata intersep dan variansnya. ECM sesuai dalam situasi di mana intersep (acak) dari setiap unit penampang
tidak berkorelasi dengan regressor. Keuntungan lain dari ECM adalah kami dapat memperkenalkan variabel seperti
jenis kelamin, agama, dan etnis, yang tetap konstan untuk subjek tertentu. Dalam FEMwe tidak dapat melakukan itu
karena semua variabel seperti itu kolinear dengan intersep khusus subjek. Selain itu, jika kita menggunakan penaksir
dalam-kelompok atau penaksir perbedaan pertama, semua invarian waktu tersebut akan dihapuskan.
7. Tes Hausman dapat digunakan untuk memutuskan antara FEM dan ECM. Kami juga dapat menggunakan tes Breusch – Pagan
untuk melihat apakah ECM sesuai.
8. Meskipun popularitasnya meningkat dalam penelitian terapan, dan meskipun ketersediaan data seperti itu meningkat, regresi data
panel mungkin tidak selalu tepat dalam setiap situasi. Seseorang harus menggunakan beberapa pertimbangan praktis dalam
setiap kasus.
9. Ada beberapa masalah khusus dengan data panel yang perlu diingat. Yang paling serius adalah masalah atrisi, di
mana, karena satu dan lain alasan, subjek panel keluar dari waktu ke waktu sehingga selama survei berikutnya
(atau penampang lintang) lebih sedikit subjek asli yang tersisa di panel. Meskipun tidak ada atrisi, lama kelamaan
subjek mungkin menolak atau tidak mau menjawab beberapa pertanyaan.
LATIHAN Pertanyaan
16.1. Apa sajakah fitur khusus dari ( Sebuah) data penampang, ( b) data deret waktu, dan
( c) data panel?
16.2. Apa yang dimaksud dengan model efek tetap (FEM)? Karena data panel memiliki dimensi waktu dan ruang, bagaimana FEM
memungkinkan untuk kedua dimensi tersebut?
16.3. Apa yang dimaksud dengan model komponen kesalahan (ECM)? Apa bedanya dengan FEM?
Kapan ECM cocok? Dan kapan FEM cocok?
16.4. Apakah ada perbedaan antara LSDV, dalam-estimator, dan model-model perbedaan-pertama?
16.5. Kapan model regresi data panel tidak sesuai? Berikan contoh.
16.6. Bagaimana Anda memperluas model (16.4.2) untuk memungkinkan komponen kesalahan waktu? Tuliskan modelnya secara
eksplisit.
16.7. Mengacu pada data telur yang diproduksi dan harga yang diberikan pada Tabel 1.1. Model mana yang mungkin cocok di sini,
FEM atau ECM? Mengapa?
16.8. Untuk data investasi yang diberikan dalam Tabel 1.2, model mana yang akan Anda pilih — FEM atau REM? Mengapa?
16.9. Berdasarkan Studi Dinamika Pendapatan Michigan, Hausman berusaha untuk memperkirakan upah, atau
pendapatan, model menggunakan sampel dari 629 lulusan sekolah menengah, yang diikuti selama enam tahun,
sehingga memberikan semua 3.774 pengamatan. Variabel terikat dalam penelitian ini adalah logaritma upah, dan
variabel penjelasnya adalah: umur (dibagi dalam beberapa kelompok umur); pengangguran pada tahun
sebelumnya; kesehatan yang buruk di tahun sebelumnya; wirausaha; wilayah tempat tinggal (untuk lulusan dari
Selatan, Selatan = 1 dan 0 sebaliknya) dan wilayah tempat tinggal (untuk lulusan dari daerah pedesaan, Pedesaan
= 1 dan 0 sebaliknya). Hausman menggunakan FEM dan ECM. Hasilnya diberikan dalam Tabel 16.15 (kesalahan
standar dalam tanda kurung).
TABEL 16.15 Variabel Efek Tetap Efek Acak

Persamaan Upah
1. Usia 1 (20–35) 0,0557 (0,0042) 0,0393 (0,0033)
(Variabel tak bebas:
2. Usia 2 (35–45) 0,0351 (0,0051) 0,0092 (0,0036)
LogWage)
3. Usia 3 (45–55) 0,0209 (0,0055) - 0,0007 (0,0042)
Sumber: Direproduksi dari 4. Usia 4 (55–65) 0,0209 (0,0078) - 0,0097 (0,0060)
Cheng Hsiao, Analisis Data Panel, Universitas 5. Usia 5 (65–) - 0,0171 (0,0155) - 0,0423 (0,0121)
Cambridge
Press, 1986, hal. 42. Sumber asli:
6. Menganggur tahun sebelumnya - 0,0042 (0,0153) - 0,0277 (0,0151)
JA Hausman, “Tes Spesifikasi 7. Kesehatan yang buruk tahun sebelumnya - 0,0204 (0,0221) - 0,0250 (0,0215)
dalam
8. Wirausaha - 0,2190 (0,0297) - 0,2670 (0,0263)
Ekonometrika, " Econometrica,
vol. 46, 1978, hlm. 1251–1271. 9. Selatan - 0,1569 (0,0656) - 0,0324 (0,0333)
10. Pedesaan - 0,0101 (0,0317) - 0,1215 (0,0237)
11. Konstan -- 0,8499 (0,0433)
S2 0.0567 0,0694
Derajat kebebasan 3.135 3.763
Sebuah. Apakah hasilnya masuk akal secara ekonomi?
b. Apakah ada perbedaan besar dalam hasil yang dihasilkan oleh kedua model tersebut? Jika ya, apa
mungkin menjelaskan perbedaan ini?
c. Berdasarkan data yang diberikan dalam tabel, model mana, jika ada, yang akan Anda pilih?
Latihan Empiris
16.10. Lihat contoh maskapai penerbangan yang dibahas dalam teks. Alih-alih model linier yang diberikan dalam Persamaan.
(16.4.2), perkirakan model regresi log-linear dan bandingkan hasil Anda dengan yang diberikan pada Tabel 16.2.
16.11. Mengacu pada data pada Tabel 1.1.
Sebuah. Membiarkan Y = telur diproduksi (dalam jutaan) dan X = harga telur (sen per lusin).
Perkirakan model untuk tahun 1990 dan 1991 secara terpisah.
b. Kumpulkan pengamatan selama dua tahun dan perkirakan regresi yang dikumpulkan. Apa
asumsi yang Anda buat dalam mengumpulkan data?
c. Gunakan model efek tetap, bedakan dua tahun, dan tampilkan

hasil regresi.
d. Dapatkah Anda menggunakan model efek tetap, membedakan 50 status? Mengapa atau mengapa tidak?
e. Apakah masuk akal untuk membedakan pengaruh negara dan pengaruh tahun? Jika begitu,
berapa banyak variabel dummy yang harus Anda perkenalkan?
f. Apakah model komponen kesalahan sesuai dengan model produksi

telur? Mengapa atau mengapa tidak? Lihat apakah Anda dapat memperkirakan model seperti itu menggunakan, katakanlah, EViews.
16.12. Lanjutkan dengan Latihan 16.11. Sebelum memutuskan untuk menjalankan regresi gabungan, Anda ingin mengetahui apakah
datanya "dapat dikumpulkan". Untuk tujuan ini, Anda memutuskan untuk menggunakan uji Chow yang dibahas di Bab 8.
Tunjukkan kalkulasi yang diperlukan yang terlibat dan tentukan apakah regresi yang dikumpulkan masuk akal.
16.13. Gunakan data investasi yang diberikan pada Tabel 1.6.
Sebuah. Perkirakan fungsi investasi Grunfeld untuk setiap perusahaan secara individual.
b. Sekarang kumpulkan data untuk semua perusahaan dan perkirakan investasi Grunfeld
fungsi dengan OLS.
c. Gunakan LSDV untuk memperkirakan fungsi investasi dan bandingkan hasilnya

regresi gabungan diperkirakan dalam ( b).
d. Bagaimana Anda memutuskan antara regresi gabungan dan regresi LSDV?

Tunjukkan kalkulasi yang diperlukan.
16.14. Tabel 16.16 memberikan data tentang tingkat kompensasi per jam di bidang manufaktur dalam dolar AS, Y
(%), dan tingkat pengangguran sipil, X ( index, 1992 = 100), untuk Kanada, Inggris Raya, dan Amerika
Serikat untuk periode 1980–2006. Pertimbangkan modelnya:
Y itu = β 1 + β 2 X itu + u Itu (1)
TABEL 16.16 Tahun COMP_U.S. UN_U.S. COMP_CAN UN_CAN COMP_U.K. UN_U.K.

Tingkat pengangguran
1980 55.9 7.1 49.0 7.3 47.1 6.9
dan Setiap Jam
1981 61.6 7.6 53.8 7.3 47.5 9.7
Kompensasi dalam
1982 67.2 9.7 60.1 10.7 45.1 10.8
Manufaktur, dalam
1983 69.3 9.6 64.3 11.6 41.9 11.5
Amerika Serikat,
1984 71.6 7.5 65.0 10.9 39.8 11.8
Kanada, dan
1985 75.3 7.2 65.0 10.2 42.3 11.4
Britania Raya,
1986 78.8 7.0 64.9 9.3 52.0 11.4
1980–2006.
1987 81.3 6.2 69.6 8.4 64.5 10.5
Sumber: Laporan Ekonomi Presiden, Januari 1988 84.1 5.5 78.5 7.4 74.8 8.6
2008,
Tabel B-109.
1989 86.6 5.3 85.5 7.1 73.5 7.3
5.6
1990 90.5 92.4 7.7 89.6 7.1
1991 95.6 6.8 100.7 9.8 99.9 8.9
1992 100.0 7.5 100.0 10.6 100.0 10.0
1993 102.0 6.9 94.8 10.8 88.8 10.4
6.1
1994 105.3 92.1 9.6 92.8 8.7
1995 107.3 5.6 93.9 8.6 97.3 8.7
1996 109.3 5.4 95.9 8.8 96.0 8.1
1997 112.2 4.9 96.7 8.4 104.1 7.0
1998 118.7 4.5 94.9 7.7 113.8 6.3
1999 123.4 4.2 96.8 7.0 117.5 6.0
2000 134.7 4.0 100.0 6.1 114.8 5.5
2001 137.8 4.7 98.9 6.5 114.7 5.1
2002 147.8 5.8 101.0 7.0 126.8 5.2
2003 158.2 6.0 116.7 6.9 145.2 5.0
2004 161.5 5.5 127.1 6.4 171.4 4.8
2005 168.3 5.1 141.8 6.0 177.4 4.8
2006 172.4 4.6 155.5 5.5 192.3 5.5
Catatan: UN = Tingkat pengangguran%.

COMP = Indeks kompensasi per jam dalam dolar AS, 1992-100.
CAN = Kanada.
Sebuah. A priori, apa hubungan yang diharapkan antara Y dan X? Mengapa?
b. Perkirakan model yang diberikan dalam Persamaan. (1) untuk setiap negara.
c. Perkirakan modelnya, kumpulkan semua 81 observasi.

d. Perkirakan model efek tetap.
e. Perkirakan model komponen kesalahan.
f. Mana model yang lebih baik, FEM atau ECM? Ratakan jawaban Anda ( Petunjuk: Terapkan
Tes Hausman).
16.15. Baltagi dan Griffin mempertimbangkan fungsi permintaan bensin berikut: *
ln Y itu = β 1 + β 2 ln X 2 itu + β 3 ln X 3 itu + β 4 ln X 4 itu + u Itu
Dimana Y = konsumsi bensin per mobil; X 2 = pendapatan riil per kapita, X 3 = nyata
harga bensin, X 4 = jumlah mobil per kapita, i = kode negara, di semua 18 negara OECD, dan t = waktu
(pengamatan tahunan dari 1960–1978). catatan: Nilai dalam
tabel sudah dicatat.
Sebuah. Perkirakan fungsi permintaan di atas yang mengumpulkan data untuk semua 18 negara
(total 342 observasi).
b. Perkirakan model efek tetap menggunakan data yang sama.
c. Perkirakan model komponen acak menggunakan data yang sama.
d. Dari analisis Anda, model mana yang paling menggambarkan permintaan bensin di
18 negara OECD? Ratakan jawaban Anda.
16.16. Artikel oleh Subhayu Bandyopadhyay dan Howard J. Wall, "Penentu Bantuan di Era Pasca Perang
Dingin", Ulasan, Federal Reserve Bank of St. Louis, November / Desember 2007, vol. 89, nomor 6, hlm.
533–547, menggunakan data panel untuk memperkirakan daya tanggap bantuan terhadap kebutuhan
ekonomi dan fisik negara penerima, hak sipil / politik, dan efektivitas pemerintah. Data untuk 135
negara selama tiga tahun. Artikel dan data dapat ditemukan di: http: //
research.stlouisfed.org/publications/review/past/2007 pada November / Desember Vol. 89, bagian No.
10. Data tersebut juga dapat ditemukan di situs web buku teks pada Tabel 16.18. Perkirakan model
penulis (diberikan pada halaman 534 artikel mereka) menggunakan pengukur efek acak. Bandingkan
hasil Anda dengan penaksir efek gabungan dan tetap yang diberikan oleh penulis dalam Tabel 2 artikel
mereka. Model mana yang cocok di sini, efek tetap atau efek acak? Mengapa?
16.17. Lihat contoh maskapai penerbangan yang dibahas dalam teks. Untuk setiap maskapai penerbangan, perkirakan fungsi
biaya logaritmik deret waktu. Bagaimana regresi ini dibandingkan dengan model efek tetap dan efek acak yang dibahas
dalam bab ini? Apakah Anda juga akan memperkirakan 15 fungsi biaya logaritmik penampang? Mengapa atau
mengapa tidak?
*
BH Baltagi dan JM Griffin, "Permintaan Bensin di OECD: Penerapan Prosedur Pengumpulan dan Pengujian," Tinjauan
Ekonomi Eropa, vol. 22, 1983, hlm. 117–137. Data untuk 18 negara OECD untuk tahun 1960–1978 dapat diperoleh dari:
http://www.wiley.com/legacy/wileychi/baltagi/ supp / Gasoline.dat, atau dari situs web buku teks, Tabel 16.17.

Guja - Chap 16.en - Id PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Guja - Chap 16.en - Id PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Bab 16

Regresi Data Panel

Tangga Panel Survey (BHPS)

Studi Panel Tenaga Kerja dan Pendapatan Korea (KLIPS)

16.1 Mengapa Data Panel?

2 Baltagi, op. cit., hlm. 3–6.

berturut-turut dalam upah minimum federal dan / atau negara bagian.

16.2 Data Panel: Contoh Ilustratif

Lalu, apa pilihannya? Ada empat kemungkinan:

dummy sendiri (mencegat).

dari populasi maskapai penerbangan yang jauh lebih besar.

16.3 Model Regresi OLS Gabungan atau Koefisien Konstan

Koefisien Std. Kesalahan t Statistik Masalah.

C ( mencegat) 1158559. 360592.7 3.212930 0,0018

R- kuadrat 0,946093 Berarti tergantung var. 1122524.

C itu = β 1 + β 2 PF itu + β 3 LF itu + β 4 M itu + u Itu (16.3.2)

C itu = β 1 + β 2 PF itu + β 3 LF itu + α i + u Itu (16.3.3)

C itu = β 1 + β 2 PF itu + β 3 LF itu + v Itu (16.3.4)

dapat diamati, atau heterogenitas, disebut

16.4 Model Fixed Effect Least-Squares Dummy Variable

maskapai penerbangan kami.

C itu = β 1 i + β 2 Q itu + β 3 PF itu + β 4 LF itu + u Itu (16.4.1)

atau dari waktu ke waktu.

GAMBAR 16.1 Y Itu

Bias karena mengabaikan

Kemiringan bias saat

Bab 9. Sekarang kita menulis Persamaan. (16.4.1) sebagai:

+ β 2 Q itu + β 3 PF itu + β 4 LF itu + u Itu (16.4.2)

Koefisien Std. Kesalahan t Statistik Masalah.

C (= α 1) - 131236.0 350777.1 - 0,374129 0.7093

R- kuadrat 0,971642 Berarti tergantung var. 1122524.

4 Diadaptasi dari catatan Alan Duncan yang tidak diterbitkan.

F = ( 0,971642 - 0,946093) / 5 ≈ 14.99 (1 - 0,971642)

Perhatian dalam Penggunaan Model LSDV Efek Tetap

16.5 Estimator Efek Tetap Dalam Grup (WG)

tc itu = β 2 q itu + β 3 pf itu + β 4 lf itu + u Itu (16.5.1)

Koefisien Std. Kesalahan t Statistik Masalah.

DMQ 3319023. 165339.8 20.07396 0.0000

R- kuadrat 0,929366 Berarti tergantung var. 2.59E-11

GAMBAR 16.2 Y * Itu

Sumber: Alan Duncan, “CrossSection

E (Y * itu | X * itu) = β X * Itu

α̂ i = C saya - β̂ 2 Q saya - β̂ 3 PF saya - β̂ 4 LF (16.5.3)

Perlu dicatat bahwa perkiraan intersep masing-masing maskapai mewakili subjek-spesifik

TC itu = β 2 Q itu + β 3 PF itu + β 4 LF itu + ( u Itu - u Itu - 1)

8 Ini juga berlaku untuk model LSDV.

2007, hal. 347.

16.6 Model Efek Acak (REM)

TC itu = β 1 i + β 2 Q itu + β 3 PF itu + β 4 LF itu + u Itu (16.6.1)

Mengganti Persamaan. (16.6.2) ke Persamaan. (16.6.1), kami memperoleh:

TC itu = β 1 + β 2 Q itu + β 3 PF itu + β 4 LF itu + ε i + u Itu

w itu = ε i + u Itu (16.6.4)

2002, hlm. 279–283.

E (u Itu u adalah) = E (u aku j u ij) = E (u Itu u js) = 0 ( i = j; t = s)

var ( w itu) = σ 2 ε+σ2 u (16.6.7)

Koefisien Std. Kesalahan t Statistik Masalah.

C 107429.3 303966.2 3.534251 0,0007

Penampang acak 107411.2 0,2067

13 Lihat Kmenta, op. cit., hlm. 625–630.

Penampang acak 49.619687 3 0.0000

Perbandingan uji efek acak lintas bagian: Variabel

Q 3319023.28 2288587,95 21587779733. 0.0000

Uji Pengganda Breusch dan Pagan Lagrange 14