Heteroskedastisitas:
Apa Yang Terjadi Jika
Varians Kesalahan
Tidak konstan?
Asumsi penting dari model regresi linier klasik (Asumsi 4) adalah itu
gangguan u saya muncul dalam fungsi regresi populasi yang homoscedastic; artinya, semuanya memiliki varian
yang sama. Dalam bab ini kami memeriksa validitas asumsi ini-
dan cari tahu apa yang terjadi jika asumsi ini tidak dipenuhi. Seperti di Bab 10, kami mencari jawaban atas
pertanyaan-pertanyaan berikut:
Secara diagramatik, dalam model regresi dua variabel, homoskedastisitas dapat ditunjukkan seperti pada Gambar 3.4, yang,
untuk memudahkan, direproduksi seperti Gambar 11.1. Seperti Gambar 11.1
menunjukkan, varian bersyarat dari Y saya ( yang sama dengan u i), bergantung pada yang diberikan X saya, tetap
sama terlepas dari nilai yang diambil oleh variabel X.
Sebaliknya, perhatikan Gambar 11.2, yang menunjukkan bahwa varians bersyarat Y saya
meningkat sebagai X meningkat. Di sini, varian dari Y saya tidak sama. Oleh karena itu, terjadi heteroskedastisitas. Secara
simbolis,
()
E u 2i = σ 2 saya
(11.1.2)
365
366 Bagian kedua Melonggarkan Asumsi Model Klasik
GAMBAR 11.1
Homoskedastik
gangguan.
Tabungan Y
Massa jenis
β 1 + β β 2 X saya
Pend
apata
n X
GAMBAR 11.2
Heteroskedastik
gangguan.
Tabungan Y
Massa jenis
β β 1 +ββ2 X saya
Pend
apata
n
X
varians meningkat seiring dengan pendapatan. Tampaknya pada Gambar 11.2, keluarga berpenghasilan tinggi rata-rata menabung
lebih banyak daripada keluarga berpenghasilan rendah, tetapi ada juga lebih banyak variabilitas dalam tabungan mereka.
Ada beberapa alasan mengapa varians u saya mungkin variabel, beberapa di antaranya adalah sebagai berikut. 1
1. Mengikuti model pembelajaran kesalahan, sebagai orang belajar, kesalahan perilaku mereka menjadi
lebih kecil dari waktu ke waktu atau jumlah kesalahan menjadi lebih konsisten. Pada kasus ini, σ 2 saya adalah
diperkirakan akan menurun. Sebagai contoh, perhatikan Gambar 11.3, yang menghubungkan jumlah kesalahan pengetikan yang
dilakukan dalam periode waktu tertentu dalam ujian dengan jam yang digunakan dalam praktik mengetik. Seperti yang ditunjukkan
Gambar 11.3, saat jumlah jam praktik mengetik meningkat, jumlah rata-rata kesalahan pengetikan serta variansnya menurun.
2. Saat pendapatan tumbuh, orang memiliki lebih banyak pendapatan diskresioner 2 dan karenanya lebih banyak ruang lingkup
untuk pilihan tentang disposisi pendapatan mereka. Karenanya, σ 2 saya cenderung meningkat dengan
1 Lihat Stefan Valavanis, Ekonometrika, McGraw-Hill, New York, 1959, hal. 48.
2 Seperti yang dikatakan Valavanis, “Pendapatan tumbuh, dan orang-orang sekarang hampir tidak dapat membedakan dolar sedangkan sebelumnya mereka melihat
GAMBAR 11.3
Ilustrasi
heteroskedastisitas.
n
pengetika Y
Kesalahan
Massa jenis
Jam
latih
an m
enge β β 1 + β β 2 X saya
tik
pendapatan. Jadi, dalam regresi tabungan atas pendapatan, orang mungkin akan menemukannya σ 2 saya meningkat
dengan pendapatan (seperti pada Gambar 11.2) karena masyarakat memiliki lebih banyak pilihan tentang perilaku menabung mereka.
Demikian pula, perusahaan dengan laba lebih besar umumnya diharapkan menunjukkan variabilitas yang lebih besar dalam kebijakan
dividen mereka daripada perusahaan dengan laba lebih rendah. Juga, berorientasi pada pertumbuhan perusahaan cenderung
menunjukkan lebih banyak variabilitas dalam rasio pembayaran dividen mereka daripada perusahaan mapan.
3. Seiring dengan peningkatan teknik pengumpulan data, σ 2 saya cenderung menurun. Jadi, bank yang punya
peralatan pemrosesan data yang canggih cenderung melakukan lebih sedikit kesalahan dalam laporan bulanan atau
triwulanan pelanggan mereka daripada bank tanpa fasilitas tersebut.
4. Heteroskedastisitas juga bisa timbul sebagai akibat adanya pencilan. Pengamatan terluar, atau pencilan,
adalah pengamatan yang jauh berbeda (baik sangat kecil atau sangat besar) dalam kaitannya dengan pengamatan
dalam sampel. Lebih tepatnya, pencilan adalah pengamatan dari populasi yang berbeda yang menghasilkan
pengamatan sampel yang tersisa. 3
Dimasukkan atau dikeluarkannya observasi semacam itu, terutama jika ukuran sampelnya kecil, secara substansial
dapat mengubah hasil analisis regresi.
Sebagai contoh, perhatikan sebar yang diberikan pada Gambar 11.4. Berdasarkan data yang diberikan dalam Tabel 11.9
dalam Latihan 11.22, angka ini memplot tingkat persentase perubahan harga saham ( Y) dan harga konsumen ( X) untuk periode
pasca-Perang Dunia II hingga 1969 untuk 20 negara. Dalam gambar ini, pengamatan tentang Y dan X untuk Chile bisa dianggap
sebagai outlier karena diberikan Y
dan X nilainya jauh lebih besar daripada negara-negara lain. Dalam situasi seperti ini, asumsi
homoskedastisitas akan sulit dipertahankan. Dalam Latihan 11.22, Anda diminta untuk mencari tahu apa
yang terjadi pada hasil regresi jika observasi untuk Chili dikeluarkan dari analisis.
3 Saya berhutang budi kepada Michael McAleer karena telah menunjukkan hal ini kepada saya.
368 Bagian kedua Melonggarkan Asumsi Model Klasik
GAMBAR 11.4
25
Hubungan
antara harga saham Chile
dan harga konsumen.
15
10
5
Harga saham (% perubahan)
1
1 2 3 4 5 6 7 8 9 10 26
Sebagai contoh konkret, ingat kembali studi kami tentang tayangan iklan yang dipertahankan ( Y) dalam kaitannya dengan
pengeluaran iklan ( X). ( Lihat Latihan 8.32.) Jika Anda mengalami kemunduran Y di X hanya dan mengamati residual dari regresi ini,
Anda akan melihat satu pola, tetapi jika Anda mengalami regresi Y di X
dan X 2, Anda akan melihat pola lain, yang dapat dilihat dengan jelas dari Gambar 11.5. Kami telah melihat itu X 2 termasuk
dalam model. (Lihat Latihan 8.32.)
6. Sumber heteroskedastisitas lainnya adalah kecondongan dalam distribusi satu atau lebih regressor yang termasuk
dalam model. Contohnya adalah variabel ekonomi seperti pendapatan, kekayaan, dan pendidikan. Diketahui bahwa distribusi
pendapatan dan kekayaan di sebagian besar masyarakat tidak merata, dengan sebagian besar pendapatan dan kekayaan
dimiliki oleh beberapa orang di atas.
7. Sumber lain heteroskedastisitas: Seperti yang dicatat oleh David Hendry, heteroskedastisitas bisa
juga muncul karena (1) transformasi data yang salah (misalnya, rasio atau transformasi perbedaan pertama) dan (2) bentuk
fungsional yang salah (misalnya, model linier versus model log-linier). 4
GAMBAR 11.5 60 40
Sisa dari
40
regresi
20
( Sebuah) tayangan
20
iklan
pengeluaran dan 0 0
( b) kesan pada
- 20
Adexp dan Adexp 2. - 20
- 40
- 60 - 40
2 4 6 8 10 12 14 16 18 20 22 2 4 6 8 10 12 14 16 18 20 22
( Sebuah) ( b)
4 David F. Hendry, Ekonometrika Dinamis, Oxford University Press, 1995, hal. 45.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 369
Perhatikan bahwa masalah heteroskedastisitas cenderung lebih sering terjadi pada cross-sectional daripada pada data deret
waktu. Dalam data cross-sectional, seseorang biasanya berurusan dengan anggota populasi pada titik waktu tertentu, seperti
konsumen individu atau keluarganya, perusahaan, industri, atau subdivisi geografis seperti negara bagian, negara, kota, dll. Selain
itu, anggota ini mungkin memiliki ukuran yang berbeda, seperti perusahaan kecil, sedang, atau besar atau perusahaan
berpenghasilan rendah, sedang, atau tinggi. Di sisi lain, dalam data deret waktu, variabel cenderung memiliki urutan besaran yang
serupa karena seseorang biasanya mengumpulkan data untuk entitas yang sama selama periode waktu tertentu. Contohnya
adalah produk nasional bruto (GNP), pengeluaran konsumsi, tabungan, atau pekerjaan di Amerika Serikat, katakanlah, untuk
periode 1955–2005.
Sebagai ilustrasi heteroskedastisitas yang mungkin ditemui dalam analisis cross-sectional, perhatikan Tabel 11.1. Tabel ini
memberikan data tentang kompensasi per karyawan di 10 industri manufaktur barang tidak tahan lama, yang diklasifikasikan
menurut ukuran lapangan kerja perusahaan atau pendirian untuk tahun 1958. Juga diberikan dalam tabel tersebut adalah angka
produktivitas rata-rata untuk sembilan kelas pekerjaan.
Meskipun industri memiliki komposisi output yang berbeda, Tabel 11.1 menunjukkan dengan jelas bahwa rata-rata perusahaan
besar membayar lebih banyak daripada perusahaan kecil. Sebagai contoh, perusahaan yang mempekerjakan satu sampai empat
karyawan membayar rata-rata sekitar $ 3.396, sedangkan perusahaan yang mempekerjakan 1.000 untuk
Rata-rata 2.499 karyawan digaji sekitar $ 4.843. Tetapi perhatikan bahwa ada variabilitas pendapatan yang cukup besar
di antara berbagai kelas pekerjaan seperti yang ditunjukkan oleh estimasi
TABEL 11.1 Kompensasi per Karyawan ($) di Industri Manufaktur Tidak Tahan Lama Menurut Ketenagakerjaan
Ukuran Pendirian, 1958
Industri 1–4 5–9 10–19 20–49 50–99 100–249 250–499 500–999 1.000–2.499
produk 2.994 3.295 3.565 3.907 4.189 4.486 4.676 4.968 5.342
Produk tembakau 1.721 2.057 3.336 3.320 2.980 2.848 3.072 2.969 3.822
Pabrik tekstil
produk 3.600 3.657 3.674 3.437 3,340 3.334 3.225 3.163 3.168
Pakaian dan
Produk-produk terkait 3.494 3.787 3.533 3.215 3.030 2.834 2.750 2.967 3.453
Kertas dan sekutu
produk 3.498 3.847 3.913 4.135 4.445 4.885 5.132 5.342 5,326
Mencetak dan
penerbitan 3.611 4.206 4.695 5.083 5.301 5.269 5.182 5.395 5.552
Bahan kimia dan
produk terkait 3.875 4.660 4.930 5,005 5.114 5.248 5.630 5.870 5.876
Minyak bumi dan
produk batubara 4.616 5.181 5,317 5.337 5,421 5.710 6,316 6.455 6.347
Karet dan
produk plastik 3.538 3.984 4.014 4.287 4.221 4.539 4.721 4.905 5,481
Kulit dan
produk kulit 3.016 3.196 3.149 3.317 3.414 3.254 3.177 3.346 4.067
Rata-rata
kompensasi 3.396 3.787 4.013 4.104 4.146 4.241 4.388 4.538 4.843
Simpangan baku 742.2 851.4 727.8 805.06 929.9 1.080.6 1.241.2 1.307.7 1.110.7
Rata-rata
produktifitas 9.355 8.584 7.962 8.275 8.389 9.418 9.795 10.281 11.750
Sumber: Sensus Produsen, Departemen Perdagangan AS, 1958 (dihitung oleh penulis).
370 Bagian kedua Melonggarkan Asumsi Model Klasik
1000
800
Simpangan baku
600
3000 3500 4000 4500 5.000
deviasi standar pendapatan. Hal ini dapat dilihat juga dari Gambar 11.6 yang memplotkan deviasi
standar kompensasi dan kompensasi rata-rata di setiap kelas pekerjaan. Seperti yang terlihat jelas,
rata-rata deviasi standar kompensasi meningkat dengan nilai rata-rata kompensasi.
Y i = β 1 + β 2 X i + u saya
βˆ 2 = ∑ x saya y saya
saya
∑ x2 ∑
X saya Y saya - ∑ Y saya
=n∑ ∑ X saya (11.2.1)
n X 2saya - ( X 2i)
tetapi variansnya sekarang diberikan oleh berikut ini ∑ ekspresi g (lihat Lampiran 11A, Bagian 11A.1):
2
x2
var ( β̂ 2) = ( ∑ saya σ) saya (11.2.2)
x saya
22
yang jelas berbeda dari rumus varians biasa yang diperoleh dengan asumsi homoskedastisitas, yaitu,
σ2
var ( β̂ 2) = ∑ (11.2.3)
x saya
2
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 371
Tentu saja jika σ 2 i = σ 2 untuk setiap saya, kedua rumus tersebut akan sama. (Mengapa?)
Ingat itu β̂ 2 adalah estimator tak bias linier (BLUE) terbaik jika asumsi model klasik, termasuk
homoskedastisitas, berlaku. Apakah masih BIRU ketika kita hanya menjatuhkan
asumsi homoskedastisitas dan menggantinya dengan asumsi heteroskedastisitas? ini
mudah untuk membuktikannya β̂ 2 masih linier dan tidak bias. Faktanya, seperti yang ditunjukkan dalam Lampiran 3A,
Bagian 3A.2, untuk menetapkan ketidakberpihakan β̂ 2 tidak perlu gangguan itu
( u saya) menjadi homoscedastic. Faktanya, varian u saya, homoscedastic atau heteroscedastic, tidak berperan dalam
penentuan properti tidak bias. Ingatlah bahwa dalam Lampiran 3A, Bagian-
bagian 3A.7, kami menunjukkan itu β̂ 2 adalah penduga yang konsisten dengan asumsi klasik
model regresi linier Meskipun kami tidak akan membuktikannya, hal itu dapat ditunjukkan β̂ 2 adalah penduga yang konsisten
meskipun ada heteroskedastisitas; yaitu, karena ukuran sampel meningkat tanpa batas,
perkiraan β 2 menyatu dengan nilai aslinya. Selain itu, dapat juga ditunjukkan bahwa dalam kondisi tertentu
(disebut kondisi keteraturan), β̂ 2 adalah terdistribusi normal tanpa gejala.
Tentu saja, apa yang telah kami katakan β̂ 2 juga berlaku untuk parameter lain dari model regresi berganda.
Memang benar β̂ 2 masih linier tidak bias dan konsisten, apakah itu "efisien" atau "terbaik"? Artinya, apakah ia
memiliki varian minimum di kelas penduga yang tidak bias? Dan seminimal itu
varians yang diberikan oleh Persamaan. (11.2.2)? Jawabannya adalah tidak untuk kedua pertanyaan tersebut: β̂ 2 tidak lagi terbaik dan
varian minimum tidak diberikan oleh Persamaan. (11.2.2). Lalu apa yang BIRU di hadapannya
variabilitas pendapatan yang jelas di antara kelas-kelas pekerjaan. Jika kami menurunkan kompensasi per karyawan
pada ukuran pekerjaan, kami ingin menggunakan pengetahuan bahwa ada cukup banyak variabilitas antar kelas dalam
pendapatan. Idealnya, kami ingin merancang skema estimasi sedemikian rupa sehingga pengamatan yang berasal dari
populasi dengan variabilitas lebih besar diberi bobot lebih sedikit daripada yang berasal dari populasi dengan
variabilitas lebih kecil. Meninjau Tabel 11.1, kami ingin membobotkan pengamatan yang berasal dari kelas pekerjaan
10–19 dan 20–49 lebih banyak daripada yang berasal dari kelas pekerjaan seperti 5–9 dan 250–499, karena yang
pertama lebih dekat berkerumun di sekitar nilai rata-rata mereka daripada yang terakhir, sehingga memungkinkan kita
untuk memperkirakan fungsi regresi populasi (PRF) dengan lebih akurat.
Sayangnya, metode OLS biasa tidak mengikuti strategi ini dan oleh karena itu tidak menggunakan "informasi" yang
terkandung dalam variabilitas variabel dependen yang tidak sama. Y, katakanlah, kompensasi karyawan pada Tabel 11.1:
Ini memberikan bobot atau kepentingan yang sama untuk setiap observasi. Tetapi metode estimasi, yang dikenal sebagai kuadrat
terkecil umum (GLS), mempertimbangkan informasi tersebut secara eksplisit dan oleh karena itu mampu menghasilkan
penduga yang BIRU. Untuk melihat bagaimana ini dicapai, mari kita lanjutkan dengan model dua variabel yang sekarang
sudah dikenal:
Y i = β 1 + β 2 X i + u saya (11.3.1)
Y i = β 1 X 0 i + β 2 X i + u saya (11.3.2)
dimana X 0 i = 1 untuk masing-masing saya. Pembaca dapat melihat bahwa kedua formulasi ini identik.
372 Bagian kedua Melonggarkan Asumsi Model Klasik
Sekarang asumsikan bahwa varians heteroskedastis σ 2 saya adalah dikenal. Bagi Persamaan. (11.3.2)
melalui oleh σ saya untuk memperoleh
( ) () ()
Yi=β1 X 0 saya X saya u saya
+ β2 + (11.3.3)
σ saya σ saya σ saya σ saya
Y i∗= β ∗ 1 X ∗0 i + β ∗ 2 X ∗i + u ∗ saya
(11.3.4)
di mana variabel yang dibintangi, atau diubah, adalah variabel asli dibagi dengan (yang diketahui)
σ i. Kami menggunakan notasi β ∗ 1 dan β∗ 2, parameter model yang ditransformasikan, untuk membedakan
mereka dari parameter OLS biasa β 1 dan β 2.
Apa tujuan mengubah model aslinya? Untuk melihat ini, perhatikan berikut-
ing fitur dari te kesalahan yang ditransformasikan (rm u ∗ saya:
) 2
u saya
var ( u ∗i) = E (u ∗ i) 2 = E sejak E (u ∗ i)= 0
σ saya
()
= 1 () saya
sejak E u 2 i = σ 2 saya
σ saya
2σ2
=1
yang merupakan konstanta. Artinya, varian dari suku gangguan yang ditransformasikan u ∗ saya sekarang ho-
moscedastic. Karena kita masih mempertahankan asumsi lain dari model klasik, maka itulah yang ditemukan u ∗ Artinya
homoscedastic menunjukkan bahwa jika kita menerapkan OLS ke transformasi
model (11.3.3) ini akan menghasilkan penduga yang BIRU. Singkatnya, perkiraan β ∗ 1 dan β∗ 2
sekarang BIRU dan bukan penaksir OLS β̂ 1 dan β̂ 2.
Prosedur ini mengubah variabel asli sedemikian rupa sehingga ditransformasikan
variabel memenuhi asumsi model klasik dan kemudian menerapkan OLS ke mereka dikenal sebagai
metode kuadrat terkecil umum (GLS). Singkatnya, GLS adalah OLS pada variabel yang diubah yang
memenuhi asumsi kuadrat terkecil standar. Estimator yang diperoleh dikenal sebagai Penduga GLS, dan
penduga inilah yang BIRU.
Mekanika estimasi yang sebenarnya β ∗ 1 dan β∗ 2 adalah sebagai berikut. Pertama, kami menuliskan
fungsi regresi sampel (SRF) o (Persamaan f.) (11.3.3) () ()
Y i = β̂ ∗ X 0 saya û saya
1
+ β̂ ∗2X saya +
σ saya σ saya σ saya σ saya
atau
∗∗ ∗ ∗
Y i∗= β̂ 1 X 0 i + 2 β̂ ∗ X i + û saya (11.3.6)
itu adalah,
() ( ) ()] 2
∑ () 2 = û saya ∑[ Y saya saya
- β̂ ∗ X 10 saya - β̂ ∗ X
2
(11.3.7)
σ saya σ saya σ saya σ saya
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 373
(∑) (∑ ) (∑ ) (∑ )
w ( saya ∑ w X saya Y saya -) ( ∑ w saya X saya w saya Y saya
β̂ 2∗ = ) ( saya ∑ )2 (11.3.8)
w saya w 2saya X saya - w saya X saya
∑
w) saya ( ∑
var ( β̂ ∗2) = ( ∑) (∑ )2 (11.3.9)
w saya w saya Xsaya
2
- w saya X saya
dimana w i = 1 / σ 2 i.
û 2i = ( Y saya - βˆ 1 - β̂ 2 X i) 2 (11.3.10)
tetapi di GLS kami meminimalkan ekspresi (11.3.7), yang juga bisa ditulis sebagai
∑ ∑
w saya ( Y saya - ˆβ 1 X 0 saya - β̂ ∗ 2 X 2 i)
∗
w 2saya û i = (11.3.11)
dimana w i = 1 / σ 2 saya ( memverifikasi Persamaan itu. [11.3.11] dan Persamaan. [11.3.7] identik).
Jadi, dalam GLS kami meminimalkan a jumlah tertimbang kotak sisa dengan w i = 1 / σ 2 saya akting
sebagai bobot, tetapi di OLS kami meminimalkan jumlah kuadrat (RSS) yang tidak tertimbang atau (yang jumlahnya
sama). Sebagai Persamaan. (11.3.7) menunjukkan, di GLS beratnya
ditugaskan untuk setiap pengamatan berbanding terbalik dengan nya σ saya, Artinya, observasi yang berasal dari populasi dengan jumlah
yang lebih besar σ saya akan mendapatkan bobot yang relatif lebih kecil dan dari
populasi dengan lebih kecil σ saya akan mendapatkan bobot yang lebih besar secara proporsional dalam meminimalkan RSS (11.3.11).
Untuk melihat perbedaan antara OLS dan GLS dengan jelas, pertimbangkan hipotesis-
Di OLS (tidak tertimbang), masing-masing û 2 saya terkait dengan poin A, B, dan C akan menerima
bobot yang sama dalam meminimalkan RSS. Jelas, dalam hal ini file û 2 saya terkait dengan titik C
akan mendominasi RSS. Tapi di GLS observasi ekstrim C akan mendapatkan bobot yang relatif lebih kecil dibandingkan
dua pengamatan lainnya. Seperti disebutkan sebelumnya, ini adalah strategi yang tepat, karena dalam mengestimasi
fungsi regresi populasi (PRF) secara lebih andal, kami ingin memberikan bobot lebih pada pengamatan yang berkerumun
dekat di sekitar rata-rata (populasi) mereka daripada yang tersebar luas.
Sejak Persamaan. (11.3.11) meminimalkan RSS berbobot, yang dikenal sebagai kotak terkecil tertimbang (WLS), dan
penduga sehingga diperoleh dan diberikan dalam Persamaan. (11.3.8) dan (11.3.9) dikenal sebagai Estimator WLS. ButWLS
hanyalah kasus khusus dari teknik estimasi yang lebih umum, GLS. Dalam konteks heteroskedastisitas, kita dapat
memperlakukan dua istilah WLS dan GLS secara bergantian. Di bab-bab selanjutnya kita akan menemukan kasus khusus GLS
lainnya.
Secara sepintas, perhatikan bahwa jika w i = w, sebuah konstanta untuk semua saya, β̂ ∗
2 identik dengan β̂ 2 dan var ( β̂ ∗ 2)
identik dengan biasa (yaitu, homoscedastic) var ( β̂ 2) diberikan dalam Persamaan. (11.2.3), yang seharusnya tidak mengherankan.
(Mengapa?) (Lihat Latihan 11.8.)
374 Bagian kedua Melonggarkan Asumsi Model Klasik
GAMBAR 11.7 Y
Hipotetis
C
scattergram.
Y i = β 1 + β 2 X saya
u
SEBUAH u
kamu { B
X
0
rata-rata, β̂ ∗ 2 dan β̂ 2 akan sama dengan yang sebenarnya β 2; artinya, keduanya adalah penduga yang tidak bias. Tapi
kami tahu itu β̂ ∗ 2 yang efisien, yaitu memiliki varian terkecil. Apa yang terjadi pada kami
interval kepercayaan, pengujian hipotesis, dan prosedur lain jika kita terus menggunakan OLS
penduga β̂ 2? Kami membedakan dua kasus.
diberikan dalam Persamaan. (11.2.3) adalah a bias penduga dari var ( β̂ 2) diberikan dalam Persamaan. (11.2.2), yaitu di
New York, 1978, hlm. 110–111. Secara sepintas, perhatikan bahwa hilangnya efisiensi β̂ 2 ( yaitu, seberapa banyak
var [ β̂ 2] melebihi var [ β̂ ∗ 2]) tergantung pada nilai sampel dari X variabel dan nilai σ 2 i.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 375
rata-rata itu melebih-lebihkan atau meremehkan yang terakhir, dan secara umum kita tidak bisa membedakan apakah
biasnya positif (overestimation) atau negatif (underestimation) karena tergantung
sifat hubungan antara σ 2 saya dan v alues diambil oleh variabel penjelas
X, seperti dapat dilihat dengan jelas dari Persamaan. (11.2.2) (lihat Exer ∑ cise 11.9). Bias muncul dari fakta
bahwa σ̂ 2, penaksir konvensional σ 2, yaitu, û 2i / ( n - 2) tidak lagi berisi
penduga yang terakhir ketika ada heteroskedastisitas (lihat Lampiran 11A.3). Akibatnya, kita tidak dapat lagi mengandalkan
interval kepercayaan yang dihitung secara konvensional dan yang digunakan secara konvensional t dan F tes. 6 Singkatnya, jika
kita tetap menggunakan prosedur pengujian biasa meskipun ada heteroskedastisitas, kesimpulan apa pun yang kita tarik
atau kesimpulan yang kita buat mungkin sangat menyesatkan.
Untuk menjelaskan lebih lanjut tentang topik ini, kami mengacu pada a Monte Carlo studi yang dilakukan oleh Davidson dan
MacKinnon. 7 Mereka menganggap model sederhana berikut, yang dalam notasi kami adalah
Y i = β 1 + β 2 X i + u saya (11.4.1)
Mereka berasumsi demikian β 1 = 1, β 2 = 1, dan u saya ∼ N ( 0, X α i). Seperti yang ditunjukkan ekspresi terakhir, mereka
berasumsi bahwa varian kesalahan adalah heteroskedastis dan terkait dengan nilai regressor X
dengan kekuatan α. Jika, misalnya, α = 1, varian kesalahan sebanding dengan nilai X; jika
α = 2, varian kesalahan sebanding dengan kuadrat dari nilai X, dan seterusnya. Pada Bagian 11.6 kita akan membahas logika di
balik prosedur semacam itu. Berdasarkan 20.000 ulangan dan memungkinkan berbagai nilai untuk α, mereka memperoleh
kesalahan standar dari dua koefisien regresi menggunakan OLS (lihat Persamaan [11.2.3]), OLS memungkinkan untuk
heteroskedastisitas (lihat Persamaan [11.2.2]), dan GLS (lihat Persamaan [11.3.9]) . Kami mengutip hasil mereka untuk nilai yang
dipilih dari α:
Nilai dari SEBUAH OLS OLS dia T GLS OLS OLS dia T GLS
Fitur yang paling mencolok dari hasil ini adalah bahwa OLS, dengan atau tanpa koreksi untuk heteroskedastisitas, secara
konsisten melebih-lebihkan kesalahan standar yang sebenarnya yang diperoleh oleh prosedur GLS (benar), terutama untuk
nilai-nilai besar dari α, sehingga membangun keunggulan GLS.
Hasil ini juga menunjukkan bahwa jika kita tidak menggunakan GLS dan bergantung pada OLS — mengizinkan atau tidak mengizinkan
heteroskedastisitas — gambar akan tercampur. Kesalahan standar OLS biasa terlalu besar (untuk intersep) atau umumnya terlalu kecil
(untuk koefisien kemiringan) dalam kaitannya dengan yang diperoleh oleh OLS memungkinkan terjadinya heteroskedastisitas.
Pesannya jelas: Jika ada heteroskedastisitas, gunakan GLS. Namun, untuk alasan yang akan dijelaskan nanti di bab ini, dalam
praktiknya tidak selalu mudah untuk menerapkan GLS. Juga, seperti yang akan kita bahas nanti, kecuali heteroskedastisitas sangat
parah, seseorang tidak boleh meninggalkan OLS demi GLS atau WLS.
Dari pembahasan sebelumnya, jelas bahwa heteroskedastisitas berpotensi menjadi masalah yang serius dan peneliti
perlu mengetahui apakah heteroskedastisitas ada dalam situasi tertentu. Jika itu
6 Dari Persamaan. (5.3.6) kita tahu bahwa 100 (1 - α)% interval kepercayaan untuk β 2 adalah [ β ˆ 2 ± t α / 2 se ( β̂ 2)]. Tapi
jika se ( βˆ2) tidak dapat diperkirakan tanpa bias, kepercayaan apa yang dapat kita berikan pada interval kepercayaan yang dihitung secara konvensional?
7 Russell Davidson dan James G. MacKinnon, Estimasi dan Inferensi dalam Ekonometrika, Oxford University Press, New
kehadiran terdeteksi, kemudian seseorang dapat mengambil tindakan korektif, seperti menggunakan regresi weighted
leastsquares atau beberapa teknik lainnya. Namun, sebelum kita beralih ke pemeriksaan berbagai prosedur korektif, kita
harus terlebih dahulu menemukan apakah ada heteroskedastisitas atau kemungkinan ada dalam kasus tertentu. Topik ini
dibahas di bagian berikut.
Catatan Teknis
Meskipun kami telah menyatakan bahwa, dalam kasus heteroskedastisitas, GLS-nya, bukan OLS, yang BIRU, ada contoh
di mana OLS bisa menjadi BIRU, meskipun ada heteroskedastisitas. 8 Tetapi contoh seperti itu jarang dalam praktiknya.
Dan tidak mungkin ada yang tahu σ 2 saya dari satu Y pengamatan. Oleh karena itu, dalam banyak kasus
melibatkan penyelidikan ekonometrik, heteroskedastisitas mungkin merupakan masalah intuisi, tebakan terpelajar,
pengalaman empiris sebelumnya, atau spekulasi belaka.
Dengan mengingat peringatan sebelumnya, mari kita periksa beberapa metode informal dan formal untuk mendeteksi
heteroskedastisitas. Seperti pembahasan berikut akan mengungkapkan, sebagian besar
metode ini didasarkan pada pemeriksaan sisa OLS û saya karena merekalah orangnya
kami mengamati, dan bukan gangguannya u i. Satu harapan bahwa itu adalah perkiraan yang baik u saya, harapan yang mungkin
terpenuhi jika ukuran sampel cukup besar.
Metode Informal
Sifat Masalah
Seringkali sifat masalah yang dipertimbangkan menunjukkan apakah heteroskedastisitas kemungkinan besar akan
ditemui. Misalnya, mengikuti karya perintis Prais dan Houthakker pada studi anggaran keluarga, di mana mereka
menemukan bahwa varian sisa di sekitar regresi konsumsi pendapatan meningkat dengan pendapatan, orang sekarang
umumnya mengasumsikan bahwa dalam survei serupa seseorang dapat mengharapkan perbedaan yang tidak setara di
antara gangguan . 9
Faktanya, dalam data cross-sectional yang melibatkan unit-unit heterogen, heteroskedastisitas mungkin menjadi aturan daripada
pengecualian. Jadi, dalam analisis cross-sectional yang melibatkan pengeluaran investasi dalam kaitannya dengan penjualan,
tingkat bunga, dll., Heteroskedastisitas umumnya diharapkan jika perusahaan berukuran kecil, menengah, dan besar dijadikan
sampel bersama.
8 Alasan untuk ini adalah bahwa teorema Gauss-Markov memberikan kondisi yang cukup (tapi tidak perlu) agar OLS menjadi efisien.
Kondisi yang diperlukan dan mencukupi untuk OLS menjadi BIRU diberikan oleh
Teorema Kruskal. Namun topik ini berada di luar cakupan buku ini. Saya berhutang budi kepada Michael McAleer karena memberitahukan hal
ini kepada saya. Untuk detail lebih lanjut, lihat Denzil G. Fiebig, Michael McAleer, dan Robert Bartels, "Properties of Ordinary Least Squares
Estimators dalam Model Regresi dengan Gangguan Nonspherical", Jurnal Ekonometrika, vol. 54, No. 1–3, Okt. – Des., 1992, hlm. 321–334.
Untuk siswa yang cenderung matematis, saya membahas topik ini lebih lanjut Lampiran C, menggunakan aljabar matriks.
9 SJ Prais dan HS Houthakker, Analisis Anggaran Keluarga, Cambridge University Press, New York, 1955.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 377
Faktanya, kami telah menemukan contohnya. Dalam Bab 2 kita membahas hubungan antara upah
rata-rata, atau rata-rata, per jam dalam kaitannya dengan tahun sekolah di Amerika Serikat. Dalam bab itu
kita juga membahas hubungan antara pengeluaran untuk makanan dan total pengeluaran untuk 55 keluarga
di India (lihat Latihan 11.16).
Metode Grafis
Jika tidak ada informasi apriori atau empiris tentang sifat heteroskedastisitas, dalam prakteknya dapat
dilakukan analisis regresi dengan asumsi tidak ada heteroskedastisitas.
ticity kemudian dilakukan pemeriksaan postmortem terhadap sisa kuadrat û 2 saya untuk melihat apakah mereka memamerkan
pola sistematis apa pun. Meskipun û 2 sama dengan u 2
saya tidak saya, mereka dapat digunakan sebagai prox-
terutama jika ukuran sampel cukup besar. 10 Pemeriksaan û 2 saya mungkin mengungkapkan
pola seperti yang ditunjukkan pada Gambar 11.8.
Pada Gambar 11.8, û 2 saya diplot melawan Ŷ saya, perkiraan Y saya dari garis regresi, idenya
sedang untuk mengetahui apakah perkiraan nilai rata-rata Y secara sistematis terkait dengan sisa kuadrat. Pada Gambar
11.8 Sebuah kami melihat bahwa tidak ada pola sistematis antara kedua variabel, menunjukkan bahwa mungkin tidak ada
heteroskedastisitas dalam data. Angka 11.8 b
untuk e, namun, menunjukkan pola yang pasti. Misalnya, Gambar 11.8 c menyarankan hubungan linier-
kapal, sedangkan Gambar 11.8 d dan e menunjukkan hubungan kuadrat antara û 2 saya dan Ŷ i. Menggunakan
pengetahuan semacam itu, meskipun informal, seseorang dapat mengubah data sedemikian rupa sehingga data yang
ditransformasikan tidak menunjukkan heteroskedastisitas. Dalam Bagian 11.6 kita akan memeriksa beberapa transformasi seperti itu.
Alih-alih merencanakan û 2 saya melawan Ŷ saya, seseorang dapat memplotnya dengan salah satu penjelasan
variabel, terutama jika merencanakan û 2 saya melawan Ŷ saya menghasilkan pola yang ditunjukkan pada Gambar 11.8 Sebuah.
Plot seperti itu, yang ditunjukkan pada Gambar 11.9, dapat mengungkapkan pola yang serupa dengan yang diberikan pada
Gambar 11.8. (Dalam kasus model dua-variabel, membuat plot û 2 saya melawan Ŷ saya setara dengan
GAMBAR 11.8 u2 u2 u2
Pola hipotetis
dari perkiraan kuadrat
residu.
Y Y Y
0 0 0
( Sebuah) ( b) ( c)
u2 u2
Y Y
0 0
( d) ( e)
10 Untuk hubungan antar û saya dan u saya, lihat E. Malinvaud, Metode Statistik Ekonometrika, North Holland Publishing Company,
GAMBAR 11.9 u2 u2 u2
Scattergram dari
perkiraan kuadrat
residu terhadap X.
X X X
0 0 0
( Sebuah) ( b) ( c)
u2 u2
X X
0 0
( d) ( e)
merencanakannya melawan X saya, dan oleh karena itu Gambar 11.9 mirip dengan Gambar 11.8. Tapi ini bukanlah situasi ketika kita
mempertimbangkan model yang melibatkan dua atau lebih X variabel; dalam hal ini, û 2
saya
dapat diplot terhadap apa pun X variabel yang termasuk dalam model.)
Pola seperti yang ditunjukkan pada Gambar 11.9 c, misalnya, menunjukkan bahwa varians dari suku gangguan
berhubungan secara linier dengan X variabel. Jadi, jika dalam regresi tabungan atas pendapatan ditemukan pola seperti
yang ditunjukkan pada Gambar 11.9 c, itu menunjukkan bahwa varians heteroskedastis mungkin sebanding dengan nilai
variabel pendapatan. Pengetahuan ini dapat membantu kita dalam mentransformasikan data kita sedemikian rupa
sehingga dalam regresi pada data yang ditransformasi varians gangguannya homoscedastic. Kita akan kembali ke topik ini
di bagian selanjutnya.
Metode Formal
Tes Taman 11
Park memformalkan metode grafis dengan menyarankan itu σ 2 saya adalah beberapa fungsi dari
variabel penjelas X i. Bentuk fungsional yang dia sarankan adalah
σ i2= σ 2 X β saya e vi
atau
ln σ 2i = ln σ 2 + β ln X i + v saya (11.5.1)
11 RE Park, “Estimation with Heteroscedastic Error Terms, '' Econometrica, vol. 34, tidak. 4, Oktober
1966, hal. 888. Uji Park adalah kasus khusus dari uji umum yang diajukan oleh AC Harvey dalam "Estimasi Model Regresi
dengan Heteroskedastisitas Multiplikatif, '' Econometrica, vol. 44, tidak. 3,
1976, hlm. 461–465.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 379
Sejak σ 2 saya umumnya tidak diketahui, Park menyarankan untuk menggunakan û 2 saya sebagai proxy dan menjalankan
regresi berikut:
ln û 2i = ln σ 2 + β ln X i + v saya
(11.5.2)
= +α β ln X i + v saya
Jika β ternyata signifikan secara statistik, itu akan menunjukkan bahwa heteroskedastisitas hadir dalam data. Jika
ternyata tidak signifikan, kita boleh menerima asumsi homoskedastisitas. Tes Park dengan demikian merupakan
prosedur dua tahap. Pada tahap pertama kami menjalankan
Regresi OLS mengabaikan pertanyaan heteroskedastisitas. Kami mendapatkan û saya dari regresi ini, kemudian pada
tahap kedua kita menjalankan regresi (11.5.2).
Meskipun menarik secara empiris, uji Park memiliki beberapa masalah. Goldfeld dan Quandt
berpendapat bahwa istilah kesalahan v saya masuk ke Persamaan. (11.5.2) mungkin tidak memenuhi asumsi OLS dan mungkin
heteroskedastis. 12 Meskipun demikian, sebagai metode eksplorasi yang ketat, satu
dapat menggunakan tes Park.
CONTOH 11.1 Untuk mengilustrasikan pendekatan Taman, kami menggunakan data yang diberikan pada Tabel 11.1 untuk menjalankan regresi berikut:
Hubungan
antara Y i = β 1 + β 2 X i + u saya
Kompensasi dimana Y = kompensasi rata-rata dalam ribuan dolar, X = produktivitas rata-rata dalam ribuan dolar, dan i = i ukuran
dan Produktivitas lapangan kerja perusahaan. Hasil regresi adalah sebagai berikut:
Hasilnya menunjukkan bahwa koefisien kemiringan yang diperkirakan signifikan pada tingkat 5 persen berdasarkan satu sisi. t uji.
Persamaan tersebut menunjukkan bahwa ketika produktivitas tenaga kerja meningkat, katakanlah, satu dolar, kompensasi tenaga
kerja meningkat rata-rata sekitar 23 sen.
Residual yang diperoleh dari regresi (11.5.3) kemudian diregresikan X saya seperti yang disarankan dalam Persamaan. (11.5.2),
memberikan hasil sebagai berikut:
Jelas, tidak ada hubungan yang signifikan secara statistik antara kedua variabel. Setelah uji Park, seseorang
dapat menyimpulkan bahwa tidak ada heteroskedastisitas dalam varian kesalahan. 13
Tes Glejser 14
Tes Glejser memiliki semangat yang mirip dengan tes Park. Setelah mendapatkan residu û saya dari regresi OLS,
Glejser menyarankan regresi nilai absolut û saya di X variabel itu
12 Stephen M. Goldfeld dan Richard E. Quandt, Metode Nonlinier dalam Ekonometrika, North Holland Publishing Company,
dianggap terkait erat dengan σ 2 i. Dalam eksperimennya, Glejser menggunakan yang berikut ini
bentuk fungsional:
| û i | = β 1 + β 2 √ | ûX ii +| =v saya
β 1 + β 2 X i + v saya
1 + v saya
| û i | = β 1 + β 2 X saya
1+v
| ûi|= β1+β2 √ saya
X saya
√
| û i | = √ β 1 + β 2 X i + v saya
Sekali lagi sebagai masalah empiris atau praktis, seseorang dapat menggunakan pendekatan Glejser. Tapi Emas-
feld dan Quandt menunjukkan bahwa istilah kesalahan v saya memiliki beberapa masalah di mana nilai yang diharapkan adalah
bukan nol, itu berkorelasi serial (lihat Bab 12), dan, ironisnya, itu adalah het-
eroscedastic. 15 Perbedaan tambahan √ lty dengan metode Glejser adalah model seperti
| û i | = β 1 + β 2 X i + v saya
dan
√
| ûi|= β1+β2 X2 i + v saya
tidak linier dalam parameter dan oleh karena itu tidak dapat diperkirakan dengan prosedur OLS biasa.
Glejser telah menemukan bahwa untuk sampel yang besar, empat model pertama dari model sebelumnya secara umum
memberikan hasil yang memuaskan dalam mendeteksi heteroskedastisitas. Oleh karena itu, sebagai masalah praktis, teknik Glejser
dapat digunakan untuk sampel besar dan dapat digunakan dalam sampel kecil secara ketat sebagai perangkat kualitatif untuk
mempelajari sesuatu tentang heteroskedastisitas.
CONTOH 11.2 Melanjutkan dengan Contoh 11.1, nilai absolut dari residu yang diperoleh dari regresi (11.5.3) diregresikan
Hubungan pada produktivitas rata-rata ( X), memberikan hasil sebagai berikut:
d saya
2
rs=1 - 6 (11.5.6)
n (n 2 - 1)
dimana d i = perbedaan peringkat yang diberikan untuk dua karakteristik berbeda dari saya individu atau fenomena
dan n = jumlah individu atau peringkat fenomena. Sebelumnya-
Koefisien korelasi rank dapat digunakan untuk mendeteksi heteroskedastisitas sebagai berikut: Asumsikan
Y i = β 0 + β 1 X i + u i.
dan X saya ( atau Ŷ i) menurut urutan naik atau turun dan menghitung koefisien korelasi peringkat Spearman
yang diberikan sebelumnya.
LANGKAH 3. Dengan asumsi bahwa koefisien korelasi peringkat populasi ρ s adalah nol dan
n> 8, pentingnya sampel r s dapat diuji oleh t tes sebagai berikut: 16
√
sn -2
t=r√ (11.5.7)
1 - r2 s
dengan df = n - 2.
Jika dihitung t nilai melebihi kritis t nilai, kami dapat menerima hipotesis heteroskedastisitas; jika tidak,
kami dapat menolaknya. Jika model regresi melibatkan lebih dari
satu X variabel, r s dapat dihitung antara | û i | dan masing-masing X variabel secara terpisah dan dapat diuji untuk signifikansi statistik
oleh t tes yang diberikan dalam Persamaan. (11.5.7).
CONTOH 11.3 Untuk menggambarkan uji korelasi peringkat, pertimbangkan data yang diberikan pada Tabel 11.2. Data tersebut berkaitan dengan
Ilustrasi dari pengembalian tahunan rata-rata ( E,%) dan deviasi standar pengembalian tahunan
( σ i,%) dari 10 reksa dana.
Korelasi Peringkat
Uji
E saya, σ saya, d,
Rata-rata Standar Perbedaan
Tahunan Deviasi | ûi|‡ antara
Nama dari Kembali, Tahunan Residu, Pangkat Pangkat Dua
Reksa Dana % Kembali,% Ê saya
†
| ( E saya - Ê i) | dari | û i | dari σ saya Peringkat d2
Total 0 110
16 Lihat G. Udny Yule dan MG Kendall, Pengantar Teori Statistik, Charles Griffin & Company, London, 1953, hal. 455.
382 Bagian kedua Melonggarkan Asumsi Model Klasik
CONTOH 11.3 Garis pasar modal (CML) teori portofolio mendalilkan hubungan linier
antara hasil yang diharapkan ( E i) dan risiko (yang diukur dengan standar deviasi, σ) dari portofolio sebagai berikut:
( Lanjutan)
E i = β i + β 2 σ saya
Menggunakan data pada Tabel 11.2, model sebelumnya diestimasi dan residual dari model ini dihitung. Karena data terkait
dengan 10 reksa dana dengan ukuran dan tujuan investasi yang berbeda, orang yang apriori mungkin mengharapkan
heteroskedastisitas. Untuk menguji hipotesis ini, kami menerapkan uji korelasi peringkat. Perhitungan yang diperlukan
diberikan pada Tabel 11.2.
Menerapkan rumus (11.5.6), kami dapatkan
110
rs=1 - 6
10 (100 - 1) (11.5.8)
= 0.3333
= 0,9998
Untuk 8 df ini t nilai tidak signifikan bahkan pada tingkat signifikansi 10 persen; itu p
nilainya 0,17. Dengan demikian, tidak ada bukti hubungan sistematis antara variabel penjelas dan nilai absolut
dari residual, yang mungkin menunjukkan bahwa tidak ada heteroskedastisitas.
berhubungan positif dengan satu variabel penjelas dalam model regresi. Untuk kesederhanaan, pertimbangkan model dua
variabel yang biasa:
Y i = β 1 + β 2 X i + u saya
σ i2= σ 2 X 2 saya
(11.5.10)
dimana σ 2 adalah sebuah konstanta. 18
Asumsi (11.5.10) mendalilkan itu σ 2 saya sebanding dengan kuadrat dari X variabel.
Asumsi seperti itu telah ditemukan cukup berguna oleh Prais dan Houthakker dalam studi mereka tentang anggaran keluarga.
(Lihat Bagian 11.5, metode informal.)
Jika Persamaan. (11.5.10) sesuai, artinya σ 2 saya akan lebih besar, semakin besar nilainya
dari X saya. Jika itu yang terjadi, heteroskedastisitas kemungkinan besar akan muncul dalam model. Untuk menguji ini secara
eksplisit, Goldfeld dan Quandt menyarankan langkah-langkah berikut:
Langkah 1. Urutkan atau rangking pengamatan menurut nilai X saya, dimulai dari yang terendah X nilai.
Langkah 2. Menghilangkan c observasi pusat, dimana c ditentukan secara apriori, dan bagi sisanya ( n - c) pengamatan
menjadi dua kelompok masing-masing ( n - c) 2 observasi.
LANGKAH 3. Pasangkan regresi OLS terpisah ke yang pertama ( n - c) 2 observasi dan yang terakhir ( n - c) 2
pengamatan, dan dapatkan jumlah sisa masing-masing dari kotak RSS 1 dan
RSS 2, RSS 1 mewakili RSS dari regresi yang sesuai dengan yang lebih kecil X saya
nilai (grup varian kecil) dan RSS 2 bahwa dari yang lebih besar X saya nilai-nilai (kelompok varians besar). RSS ini
masing-masing memiliki
( )
( n - c) - k n-c-2k
atau df
2 2
dimana k adalah jumlah parameter yang akan diestimasi, termasuk intersep. (Mengapa?) Untuk kasus dua
variabel k tentu saja 2.
λ = RSS 2 / df (11.5.11)
RSS 1 / df
Jika kami menganggap Anda saya didistribusikan secara normal ( yang biasanya kami lakukan), dan jika asumsi homoskedastisitas
valid, maka dapat ditunjukkan itu λ dari Persamaan. (11.5.10) mengikuti F
distribusi dengan pembilang dan penyebut df masing-masing ( n - c - 2 k) / 2.
Jika dalam aplikasi dihitung λ (= F) lebih besar dari kritis F pada tingkat signifikansi yang dipilih, kita dapat menolak
hipotesis homoskedastisitas, yaitu, kita dapat mengatakan bahwa heteroskedastisitas sangat mungkin terjadi.
Sebelum mengilustrasikan tes, satu kata tentang menghilangkan c observasi pusat sudah beres. Pengamatan ini
dihilangkan untuk mempertajam atau menonjolkan perbedaan antara yang kecil
kelompok varian (yaitu, RSS 1) dan grup varian besar (yaitu, RSS 2). Tetapi kemampuan tes Goldfeld – Quandt untuk
melakukan ini dengan sukses bergantung pada caranya c terpilih. 19 Untuk dua-
model variabel percobaan Monte Carlo yang dilakukan oleh Goldfeld dan Quandt menunjukkan bahwa c
adalah sekitar 8 jika ukuran sampel sekitar 30, dan sekitar 16 jika ukuran sampel sekitar 60. Tetapi Judge et al. catat itu c
= 4 jika n = 30 dan c = 10 jika n sekitar 60 telah ditemukan memuaskan dalam praktiknya. 20
Sebelum pindah, mungkin diketahui bahwa jika ada lebih dari satu X variabel dalam model, peringkat observasi, langkah
pertama dalam pengujian, dapat dilakukan sesuai dengan salah satunya.
Jadi dalam model: Y i = β 1 + β 2 X 2 i + β 3 X 3 i + β 4 X 4 i + u saya, kami dapat menyusun peringkat data sesuai dengan salah satu dari ini X
's. Jika apriori kita tidak yakin yang mana X variabel sesuai, kita bisa
melakukan pengujian pada masing-masing X variabel, atau melalui uji Park, pada gilirannya, pada masing-masing X.
CONTOH 11.4 Untuk mengilustrasikan uji Goldfeld-Quandt, kami menyajikan dalam Tabel 11.3 data tentang pengeluaran konsumsi dalam
Itu kaitannya dengan pendapatan untuk 30 keluarga secara silang. Misalkan kita mendalilkan bahwa pengeluaran konsumsi secara
linier berhubungan dengan pendapatan tetapi heteroskedastisitas ada dalam data. Kami selanjutnya mendalilkan bahwa sifat
Goldfeld – Quandt
heteroskedastisitas seperti yang diberikan dalam Persamaan. (11.5.10). Penyusunan ulang data yang diperlukan untuk penerapan
Uji pengujian juga disajikan pada Tabel 11.3.
Dengan menghilangkan 4 observasi tengah, regresi OLS berdasarkan observasi 13 pertama dan 13 terakhir dan
jumlah residu kuadrat terkait seperti yang ditunjukkan berikutnya (stan-
kesalahan dard dalam tanda kurung).
( Lanjutan)
19 Secara teknis, file kekuasaan tes tergantung bagaimana c terpilih. Dalam statistik, file kekuatan ujian diukur dengan probabilitas
menolak hipotesis nol jika salah (yaitu, dengan 1 - Prob [kesalahan tipe II]). Hipotesis nol disini adalah varians dari kedua kelompok
adalah sama, yaitu homoskedastisitas. Untuk pembahasan lebih lanjut, lihat MM Ali dan C. Giaccotto, "Sebuah Studi dari Beberapa
Tes Baru dan Yang Ada untuk Heteroskedastisitas dalam Model Linier Umum, '' Jurnal Ekonometrika, vol. 26, 1984, hlm. 355–373.
20 George G. Judge, R. Carter Hill, William E. Griffths, Helmut Lütkepohl, dan Tsoung-Chao Lee,
Pengantar Teori dan Praktek Ekonometrika, John Wiley & Sons, New York, 1982, hal. 422.
384 Bagian kedua Melonggarkan Asumsi Model Klasik
CONTOH 11.4 TABEL 11.3 Data Hipotesis tentang Pengeluaran Konsumsi Y ($) dan Pendapatan X ($) untuk
55 80 55 80
65 100 70 85
70 85 75 90
80 110 65 100
79 120 74 105
84 115 80 110
98 130 84 115
95 140 79 120
90 125 90 125
75 90 98 130
74 105 95 140
110 160 108 145
113 150 113 150
125 165 110 160
108 145 125 165 4 tengah
115 180 115 180 observasi
140 225 130 185
120 200 135 190
145 240 120 200
130 185 140 205
152 220 144 210
144 210 152 220
175 245 140 225
180 260 137 230
135 190 145 240
140 205 175 245
178 265 189 250
191 270 180 260
137 230 178 265
189 250 191 270
λ = RSS 2 / df = 1536,8 / 11
RSS 1 / df 377.17 / 11
λ = 4.07
Yang kritis F nilai 11 pembilang dan 11 penyebut df pada tingkat 5 persen adalah 2.82. Sejak diperkirakan F (= λ) melebihi
nilai kritisnya, maka dapat disimpulkan bahwa terdapat heteroskedastisitas pada error variance. Namun, jika tingkat
signifikansi ditetapkan pada 1 persen, kita tidak boleh menolak asumsi homoskedastisitas. (Mengapa?) Perhatikan
bahwa file p
nilai yang diamati λ adalah 0,014.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 385
Y i = β 1 + β 2 X 2 i + · · · + β k X ki + u saya (11.5.12)
σ i2= α 1 + α 2 Z 2 i + · · · + α m Z mi (11.5.14)
itu adalah, σ 2saya adalah fungsi linier dari Z 's. Jika α 2 = α 3 = · · · = α m = 0, σ 2 i = α 1, yang mana
konstan. Oleh karena itu, untuk menguji apakah σ 2 saya adalah homoscedastic, orang dapat menguji hipotesis itu
α 2 = α 3 = · · · = α m = 0. Ini adalah ide dasar di balik tes Breusch – Pagan – Godfrey. Prosedur pengujian yang sebenarnya adalah
sebagai berikut.
(11.5.12)
Langkah 1. Perkiraan Persamaan. ∑ oleh OLS dan dapatkan residu ˆ
Langkah 2. Memperoleh σ̃ 2 = û 2saya / n. Ingat dari Bab 4 bahwa ini ∑ u 1, û adalah
2,. . . , ûmaksimal
n.
penduga likelihood (ML) dari σ 2. ( catatan: Estimator OLS adalah û 2i / [ n - k].)
LANGKAH 3. Buat variabel p saya didefinisikan sebagai
2
p i = ˆ / u 2saya σ̃
p i = α 1 + α 2 Z 2 i + · · · + α m Z mi + v saya (11.5.15)
= 1 (ESS) (11.5.16)
2
Asumsi u saya berdistribusi normal, dapat ditunjukkan bahwa jika ada homoskedastisitas dan jika ukuran sampel n
meningkat tanpa batas, lalu
∼ χ 2m - 1 (11.5.17)
asy
21 T. Breusch dan A. Pagan, "Tes Sederhana untuk Heteroskedastisitas dan Variasi Koefisien Acak, ''
Econometrica, vol. 47, 1979, hlm. 1287–1294. Lihat juga L. Godfrey, “Testing for Multiplicative Heteroscedasticity, '' Jurnal
Ekonometrika, vol. 8, 1978, hlm. 227–236. Karena kesamaan, tes ini dikenal sebagai tes heteroskedastisitas Breusch –
Pagan-Godfrey.
386 Bagian kedua Melonggarkan Asumsi Model Klasik
Oleh karena itu, jika dalam suatu aplikasi dihitung (= χ 2) melebihi kritis χ 2 nilai pada tingkat signifikansi yang dipilih,
seseorang dapat menolak hipotesis homoskedastisitas; jika tidak, seseorang tidak akan menolaknya.
CONTOH 11.5 Sebagai contoh, mari kita lihat kembali data (Tabel 11.3) yang digunakan untuk mengilustrasikan uji heteroskedastisitas
(BPG) Tes
Ŷ i = 9,2903 + 0,6378 X saya
se = (5,2314) (0,0286) RSS = 2361.153 R 2 = 0,9466 (11.5.18)
Langkah 2. ∑
σ̃ 2 = û saya
2
/ 30 = 2361.153 / 30 = 78.7051
LANGKAH 3. Bagilah sisa kuadrat û saya diperoleh dari regresi (11.5.18) sebesar 78.7051 untuk membangun variabel p saya.
LANGKAH 4. Berasumsi bahwa p saya berhubungan linier dengan X i (= Z i) sesuai Persamaan. (11.5.14), kami memperoleh regresi
LANGKAH 5.
3,8414 dan 1 persen kritis χ 2 nilainya adalah 6.6349. Jadi, nilai chi-kuadrat yang diamati sebesar 5,2140 signifikan
pada tingkat 5 persen tetapi tidak pada tingkat signifikansi 1 persen. Oleh karena itu, kami mencapai kesimpulan
yang sama dengan tes Goldfeld – Quandt. Namun perlu diingat bahwa, secara tegas, tes BPG adalah tes
asimtotik, atau sampel besar, dan dalam contoh ini 30 observasi mungkin bukan sampel besar. Itu juga harus
ditunjukkan
bahwa dalam sampel kecil pengujian sensitif terhadap asumsi gangguan u saya didistribusikan secara normal.
Tentu saja, kita dapat menguji asumsi normalitas dengan pengujian
dibahas dalam Bab 5. 23
22 Lihat Adrian C. Darnell, Kamus Ekonometrika, Edward Elgar, Cheltenham, Inggris, 1994, hlm. 178–179.
23 Tentang ini, lihat R. Koenker, “Catatan tentang Pelajarilah Tes untuk Heteroskedastisitas,” Jurnal Ekonometrika, vol. 17,
tidak mengandalkan asumsi normalitas dan mudah diterapkan. 24 Sebagai ilustrasi dari ide dasar,
pertimbangkan model regresi tiga variabel berikut (generalisasi ke k- model variabel langsung):
Y i = β 1 + β 2 X 2 i + β 3 X 3 i + u saya (11.5.21)
Langkah 1. Mengingat data, kami memperkirakan Persamaan. (11.5.21) dan dapatkan residu, û i.
Artinya, sisa kuadrat dari regresi asli diregresikan pada aslinya X variabel atau regresi, nilai
kuadratnya, dan produk silang dari regresi. Kekuatan regressor yang lebih tinggi juga dapat
diperkenalkan. Perhatikan bahwa ada suku konstan dalam persamaan ini meskipun regresi asli
mungkin berisi atau tidak mengandungnya. Dapatkan R 2 dari regresi (tambahan) ini.
LANGKAH 3. Berdasarkan hipotesis nol bahwa tidak terdapat heteroskedastisitas, dapat ditunjukkan bahwa ukuran
sampel ( n) kali R 2 diperoleh dari regresi tambahan tanpa gejala
mengikuti distribusi chi-kuadrat dengan df sama dengan jumlah regresi (tidak termasuk suku konstanta)
dalam regresi tambahan. Itu adalah,
n · R2∼ χ2 df (11.5.23)
asy
dengan df seperti yang didefinisikan sebelumnya. Dalam contoh kita, ada 5 df karena ada 5 regressor
dalam regresi tambahan.
LANGKAH 4. Jika diperoleh nilai chi-square pada Persamaan. (11.5.23) melebihi nilai chi-square
kritis pada tingkat signifikansi yang dipilih, kesimpulannya adalah terdapat heteroskedastisitas. Jika
tidak melebihi nilai chi-square kritis, tidak ada heteroskedastisitas, artinya pada regresi tambahan
(11.5.22),
α 2 = α 3 = α 4 = α 5 = α 6 = 0 (lihat catatan kaki 25).
CONTOH 11.6 Dari data cross-sectional di 41 negara, Stephen Lewis memperkirakan model regresi sebagai berikut: 26
Putih
Heteroskedastisitas ln Y i = β 1 + β 2 ln X 2 i + β 3 ln X 3 i + u saya (11.5.24)
Uji
dimana Y = rasio pajak perdagangan (pajak impor dan ekspor) terhadap total pendapatan pemerintah,
X 2 = rasio jumlah ekspor ditambah impor terhadap GNP, dan X 3 = GNP per kapita; dan ln singkatan dari natural log.
Hipotesisnya adalah itu Y dan X 2 akan terkait secara positif (semakin tinggi volume perdagangan, semakin tinggi pendapatan
pajak perdagangan) dan itu Y dan X 3 akan menjadi
( Lanjutan)
24 H. White, "Estimator Matriks Kovarian yang Konsisten dengan Heteroskedastisitas dan Uji Langsung Heteroskedastisitas, '' Econometrica,
CONTOH 11.6 berhubungan negatif (dengan meningkatnya pendapatan, pemerintah menemukan bahwa lebih mudah untuk memungut pajak langsung —
Hasil empiris mendukung hipotesis. Untuk tujuan kami, poin pentingnya adalah apakah ada
heteroskedastisitas dalam data. Karena datanya adalah cross-sectional yang melibatkan heterogenitas negara,
yang apriori diharapkan heteroskedastisitas dalam varian kesalahan. Dengan menerapkan uji
heteroskedastisitas White terhadap residual yang diperoleh dari regresi (11.5.24) diperoleh hasil sebagai
berikut: 27
catatan: Kesalahan standar tidak diberikan, karena tidak relevan untuk tujuan kita di sini.
Sekarang n · R 2 = 41 (0.1148) = 4.7068, yang secara asimtotik memiliki distribusi chi-square dengan 5 df
(mengapa?). Nilai chi-square kritis 5 persen untuk 5 df adalah 11,0705, nilai kritis 10 persen adalah 9,2363, dan
nilai kritis 25 persen adalah 6,62568. Untuk semua tujuan praktis, seseorang dapat menyimpulkan, berdasarkan
uji Putih, bahwa tidak ada heteroskedastisitas.
Ada komentar tentang Tes Putih. Jika suatu model memiliki beberapa regressor, maka memasukkan semua regressor, istilah
kuadratnya (atau yang bertenaga lebih tinggi), dan produk silang mereka dapat dengan cepat mengkonsumsi derajat kebebasan.
Oleh karena itu, seseorang harus berhati-hati dalam menggunakan tes. 28
Dalam kasus di mana statistik uji Putih diberikan dalam Persamaan. (11.5.25) secara statistik signifikan,
heteroskedastisitas belum tentu menjadi penyebabnya, tetapi kesalahan spesifikasi, yang akan dibahas lebih lanjut dalam
Bab 13 (ingat poin 5 dari Bagian 11.1). Dengan kata lain, theWhite test bisa menjadi tes (murni) heteroskedastisitas atau
kesalahan spesifikasi atau keduanya. Telah diperdebatkan bahwa jika tidak ada istilah produk silang dalam prosedur uji
White, maka itu adalah uji heteroskedastisitas murni. Jika terdapat istilah produk silang, maka ini adalah pengujian untuk
heteroskedastisitas dan bias spesifikasi. 29
Y i = β 1 + β 2 X 2 i + β 3 X 3 i + · · · + β k X ki + u saya (11.5.26)
27 Hasil ini, dengan perubahan notasi, direproduksi dari William F. Lott dan Subhash C.Ray,
Ekonometrika Terapan: Masalah dengan Kumpulan Data, Manual Instruktur, Bab 22, hlm. 137–140.
28 Kadang-kadang tes dapat dimodifikasi untuk menjaga derajat kebebasan. Lihat Latihan 11.18.
29 Lihat Richard Harris, Menggunakan Analisis Kointegrasi dalam Pemodelan Ekonometrika, Prentice Hall & Harvester Wheatsheaf, Inggris, 1995,
hal. 68.
30 Lihat MJ Harrison dan BP McCabe, "Tes untuk Heteroskedastisitas Berdasarkan Residual Kuadrat Terkecil Biasa", Jurnal
Asosiasi Statistik Amerika, vol. 74, 1979, hlm. 494–499; J. Szroeter, "Kelas Tes Parametrik untuk Heteroskedastisitas dalam
Model Ekonometrik Linear, '' Econometrica,
vol. 46, 1978, hlm. 1311–1327; MA Evans dan ML King, "Kelas Pengujian Lebih Lanjut untuk Heteroskedastisitas, '' Jurnal
Ekonometrika, vol. 37, 1988, hlm. 265–276; dan R. Koenker dan G. Bassett, "Uji Kuat untuk Heteroskedastisitas Berdasarkan
Kuantil Regresi", Econometrica, vol. 50, 1982, hlm. 43–61.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 389
Anda memperkirakan model ini, dapatkan û saya dari model ini, dan kemudian estimasi
û 2i = α 1 + α 2 ( Ŷ i) 2 + v saya (11.5.27)
dimana Ŷ saya adalah nilai perkiraan dari model (11.5.26). Hipotesis nol adalah itu
α 2 = 0. Jika tidak ditolak, maka dapat disimpulkan bahwa tidak ada heteroskedastisitas. Hipotesis nol dapat
diuji dengan biasa t tes atau F uji. (Perhatikan itu F 1, k = t 2 e
k.) Jika th
model (11.5.26) adalah log ganda, kemudian residu kuadrat diregresikan (log ˆ Y i) 2. Yang lainnya
keuntungan dari tes KB adalah bahwa itu berlaku bahkan jika istilah kesalahan dalam model aslinya
(11.5.26) tidak terdistribusi normal. Jika Anda menerapkan uji KB ke Contoh 11.1, Anda akan menemukan bahwa koefisien
kemiringan dalam regresi kuadrat residual yang diperoleh dari Persamaan. (11.5.3)
tentang perkiraan Ŷ 2 saya dari Persamaan. (11.5.3) secara statistik tidak berbeda dari nol, sehingga memperkuat
tes Park. Hasil ini tidak mengherankan karena saat ini kami hanya memiliki satu regressor. Tetapi tes
KB berlaku jika ada satu atau banyak regressor.
Demikian pula, uji Breusch-Pagan-Godfrey sensitif terhadap asumsi normalitas. Sebaliknya, pengujian
Koenker-Bassett tidak bergantung pada asumsi normalitas dan oleh karena itu mungkin lebih kuat. 31 Dalam uji
Goldfeld-Quandt jika kita menghilangkan terlalu banyak observasi, kita dapat mengurangi kekuatan pengujian.
Ini berada di luar cakupan teks ini untuk memberikan analisis komparatif dari berbagai tes heteroskedastisitas.
Tetapi pembaca yang tertarik dapat merujuk ke artikel oleh John Lyon dan Chin-Ling Tsai untuk mendapatkan
gambaran tentang kekuatan dan kelemahan dari berbagai tes heteroskedastisitas. 32
31 Untuk detailnya, lihat William H.Green, Analisis Ekonometrik, Edisi ke-6, Pearson / Prentice-Hall, New Jersey,
CONTOH 11.7 Untuk mengilustrasikan metode ini, misalkan kita ingin mempelajari hubungan antara kompensasi dan ukuran pekerjaan
Ilustrasi dari untuk data yang disajikan pada Tabel 11.1. Untuk kesederhanaan, kami mengukur ukuran pekerjaan dengan 1 (1-4
karyawan), 2 (5-9 karyawan),. . . , 9 (1.000–2499 karyawan), meskipun kami juga dapat mengukurnya dengan titik tengah
Metode dari
dari berbagai kelas pekerjaan yang diberikan dalam tabel.
Tertimbang Paling Sedikit
Kotak Sekarang biarkan Y mewakili kompensasi rata-rata per karyawan ($) dan X ukuran lapangan kerja, kami menjalankan
regresi berikut (lihat Persamaan [11.3.6]):
dimana σ saya adalah deviasi standar dari upah seperti yang dilaporkan pada Tabel 11.1. Data mentah yang diperlukan untuk menjalankan
regresi ini diberikan pada Tabel 11.4.
TABEL 11.4
Kompensasi, Ukuran Pekerjaan,
Ilustrasi
Y X σ saya Y saya/ σ saya X saya/ σ saya
ofWeighted Least-
Regresi Kuadrat 3.396 1 742.2 4.5664 0,0013
3.787 2 851.4 4.4480 0,0023
Sumber: Data di Y dan σ saya
(deviasi standar
4.013 3 727.8 5.5139 0,0041
kompensasi) berasal 4.104 4 805.06 5.0978 0,0050
Tabel 11.1. Ukuran pekerjaan: 1 =
4.146 5 929.9 4.4585 0,0054
1–4 karyawan, 2 = 5–9 karyawan, dll.
Data terakhir juga berasal dari Tabel
4.241 6 1.080.6 3.9247 0,0055
11.1. 4.387 7 1.241.2 3.5288 0,0056
4.538 8 1.307.7 3.4702 0,0061
4.843 9 1.110.7 4.3532 0,0081
catatan: Dalam regresi (11.6.2), variabel dependennya adalah ( Y saya / σ i) dan variabel independen adalah ( 1 / σ i) dan ( X saya / σ i).
Sebelum melanjutkan ke hasil regresi, perhatikan bahwa Persamaan. (11.6.1) tidak memiliki istilah intersep. (Mengapa?)
Oleh karena itu, seseorang harus menggunakan model regresi-melalui-asal untuk
memperkirakan β ∗
1 dan β ∗ 2, topik yang dibahas dalam Bab 6. Tetapi kebanyakan komputer mengemasnya
hari memiliki opsi untuk menekan istilah intersep (lihat Minitab atau EViews, sebagai contoh). Perhatikan juga fitur
menarik lainnya dari Persamaan. (11.6.1): Ini memiliki dua variabel penjelas,
(1 / σ i) dan ( X saya / σ i), sedangkan jika kita menggunakan OLS, menurunkan kompensasi pada karyawan
ukuran ment, regresi itu akan memiliki variabel penjelas tunggal, X i. ( Mengapa?)
Hasil regresi WLS adalah sebagai berikut:
Sebagai perbandingan, kami memberikan hasil regresi OLS biasa atau tidak berbobot:
Dalam Latihan 11.7 Anda diminta untuk membandingkan kedua regresi ini.
33 Seperti dicatat dalam catatan kaki 3 dari Bab 6, file R 2 regresi melalui asal tidak secara langsung sebanding dengan R 2 dari
model intersep-sekarang. Dilaporkan R 2 dari 0,9993 memperhitungkan perbedaan ini. (Lihat berbagai paket untuk detail lebih
lanjut tentang cara R 2 dikoreksi untuk memperhitungkan tidak adanya istilah intersep. Lihat juga Lampiran 6A, Sec. 6A1.)
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 391
Putih telah menunjukkan bahwa perkiraan ini dapat dilakukan sehingga tanpa gejala kesimpulan statistik yang valid
(yaitu, sampel besar) dapat dibuat tentang nilai parameter yang sebenarnya. 34 Kami tidak akan menyajikan detail
matematisnya, karena itu di luar cakupan buku ini. Namun, Lampiran 11A.4 menguraikan prosedur White. Saat ini,
beberapa paket komputer menyajikan varians yang dikoreksi heteroskedastisitas White dan kesalahan standar
bersama dengan varian OLS biasa dan kesalahan standar. 35 Kebetulan, kesalahan standar yang dikoreksi
heteroskedastisitas White juga dikenal sebagai kesalahan standar yang kuat.
CONTOH 11.8 Sebagai contoh, kami mengutip hasil berikut karena Greene: 36
Ilustrasi
Ŷ i = 832.91 - 1834.2 (Pendapatan) + 1587.04 (Pendapatan) 2
Prosedur White
OLS se = (327.3) (829.0) (519.1)
t= (2.54) (2.21) (3.06) (11.6.4)
Putih se = (460.9) (1243,0) (830,0)
t= (1.81) ( - 1,48) (1,91)
dimana Y = Pengeluaran per kapita di sekolah umum menurut negara bagian pada tahun 1979 dan Pendapatan = pendapatan per kapita menurut
negara bagian pada tahun 1979. Sampel terdiri dari 50 negara bagian ditambah Washington, DC.
Seperti yang ditunjukkan hasil sebelumnya, kesalahan standar koreksi heteroskedastisitas (White) jauh lebih besar
daripada kesalahan standar OLS dan oleh karena itu t nilai jauh lebih kecil daripada yang diperoleh oleh OLS. Atas dasar
yang terakhir ini, kedua regressor secara statistik signifikan pada tingkat 5 persen, sedangkan menurut White estimator
mereka tidak signifikan. Namun, harus ditunjukkan bahwa kesalahan standar yang dikoreksi oleh heteroskedastisitas
White bisa lebih besar atau lebih kecil daripada kesalahan standar yang tidak dikoreksi.
Karena penduga varians yang konsisten heteroskedastisitas White sekarang tersedia dalam paket regresi yang
telah ditetapkan, disarankan agar pembaca melaporkannya. Sebagai catatan Wallace dan Silver:
Secara umum, mungkin ide yang baik untuk menggunakan opsi PUTIH [tersedia dalam program regresi] secara rutin, mungkin
membandingkan output dengan output OLS biasa sebagai pemeriksaan untuk melihat apakah heteroskedastisitas merupakan
masalah serius dalam kumpulan data tertentu. 37
36 William H. Greene, Analisis Ekonometrik, 2d ed., Macmillan, New York, 1993, hal. 385.
37 T. Dudley Wallace dan J. Lew Silver, Ekonometrika: Pengantar, Addison-Wesley, Membaca, Mass.,
mengubah data untuk mencerminkan jenis heteroskedastisitas tertentu. Untuk menggambarkan hal ini, mari kita kembali ke model
regresi dua variabel:
Y i = β 1 + β 2 X i + u saya
2
E u 2i = σ 2 X saya (11.6.5) 38
Jika, sebagai masalah "spekulasi," metode grafis, atau pendekatan Park dan Glejser, ya
percaya bahwa varian u saya sebanding dengan kuadrat dari variabel penjelas X
(lihat Gambar 11.10), seseorang dapat mengubah model aslinya sebagai berikut. Bagilah yang asli
model melalui oleh X saya:
Yi=β1+β2+ u saya
dimana v saya adalah istilah gangguan yang ditransformasikan, sama dengan u saya / X i. Sekarang mudah untuk memverifikasi itu
( ) 2=
() u saya 1 ()
E v 2i = E 2
E u 2 saya
X saya X saya
= σ2 menggunakan (11.6.5)
Oleh karena itu varian dari v saya sekarang homoscedastic, dan seseorang dapat melanjutkan untuk menerapkan OLS ke persamaan
yang ditransformasikan (11.6.6), regresi Y saya / X saya pada 1 / X i.
GAMBAR 11.10
σ
σ 2saya
Varians kesalahan
sebanding dengan X 2.
38 Ingatlah bahwa kita telah menemukan asumsi ini dalam diskusi kita tentang uji Goldfeld – Quandt.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 393
Perhatikan bahwa dalam regresi yang ditransformasikan, istilah intersep β 2 adalah koefisien kemiringan dalam
persamaan asli dan koefisien kemiringan β 1 adalah istilah intersep dalam model aslinya. Oleh karena itu,
untuk kembali ke model semula kita harus mengalikan perkiraannya
Persamaan. (11.6.6) oleh X i. Penerapan transformasi ini diberikan dalam Latihan 11.20.
ASUMSI 2 Varians kesalahan sebanding dengan X saya. ( Itu) transformasi akar kuadrat:
E u 2 =saya
σ 2 X saya (11.6.7)
Jika diyakini bahwa varians u saya, bukannya proporsional dengan kuadrat X saya,
sebanding dengan X saya itu sendiri, maka model aslinya dapat diubah sebagai berikut (lihat Gambar 11.11):
√ u saya
√ Yi=√ β1+β Xi+√ 2
X saya X saya X saya
(11.6.8)
√
√1
= β 1 X saya + β2 Xi+ v saya
√
dimana v i = u saya / X saya dan dimana X i> 0.
Dengan asumsi 2, seseorang dapat dengan mudah memverifikasi itu E (v 2 i) = σ 2, sebuah homosce √ situa dastic √tion.
Ada √Sebelumnya, seseorang dapat melanjutkan ed untuk menerapkan OLS ke Persamaan. (11.6.8), mundur Y saya / X saya pada 1 / X saya
dan X i.
Perhatikan fitur penting dari model yang ditransformasikan: Ini tidak memiliki istilah intersep. Sana fo kembali,
seseorang harus menggunakan model regresi-melalui-asal untuk memperkirakan β 1 dan β 2. Memiliki
Lari √ Persamaan. (11.6.8), seseorang dapat kembali ke model aslinya hanya dengan mengalikan Persamaan. (11.6.8) oleh X i.
Kasus yang menarik adalah model intersep nol, yaitu, Y i = β 2 X i + u i. Dalam hal ini, Persamaan. (11.6.8) b ec omes:
Y i = β 2 X saya√
√ + √ u saya (11.6.8a)
X saya X saya
GAMBAR 11.11 σ σ2
saya
Varians kesalahan
sebanding dengan X.
X
394 Bagian kedua Melonggarkan Asumsi Model Klasik
•
βˆ 2 = (11.6.8b)
X̄
Artinya, penduga kuadrat-terkecil tertimbang hanyalah rasio dari rata-rata variabel dependen dan penjelas. (Untuk
membuktikan Persamaan. [11.6.8b], cukup gunakan rumus regresi-melalui-asal yang diberikan dalam Persamaan.
[6.1.6].)
ASUMSI 3 Varians kesalahan sebanding dengan t (he) kuadrat dari nilai rata-rata Y.
E u 2 saya
= σ 2 [ E (Y i)] 2 (11.6.9)
Persamaan (11.6.9) mendalilkan bahwa varians u saya sebanding dengan kuadrat dari nilai yang diharapkan dari Y ( lihat
Gambar 11.8 e). Sekarang
E (Y i) = β 1 + β 2 X saya
Oleh karena itu, jika kita mengubah persamaan aslinya sebagai berikut,
dimana v i = u saya / E (Y i), itu bisa dilihat E (v 2 i) = σ 2; yaitu gangguan v saya adalah ho-
moscedastic. Oleh karena itu, regresi (11.6.10) yang akan memenuhi asumsi homoskedastisitas
model regresi linier klasik.
Transformasi (11.6.10), bagaimanapun, tidak dapat beroperasi karena E (Y i) tergantung pada β 1
dan β 2, yang tidak diketahui. Tentu saja kami tahu Ŷ i = β̂ 1 + β̂ 2 X saya, yang merupakan penduga
E (Y i). Oleh karena itu, kami dapat melanjutkan dalam dua langkah: Pertama, kami menjalankan regresi OLS biasa,
mengenai masalah heteroskedastisitas, dan memperoleh Ŷ i. Kemudian, gunakan perkiraan Ŷ saya, kami mengubah model kami sebagai
berikut:
() ()
Yi=β1 1 + β2 X saya
+ v saya (11.6.11)
Ŷ saya Ŷ saya Ŷ saya
dimana v i = ( u saya / Ŷ i). Pada Langkah 2, kami menjalankan th e regresi io n (11.6.11 ). Meskipun Ŷ saya tidak persis
E (Y i), mereka adalah penduga yang konsisten; yaitu, karena ukuran sampel meningkat tanpa batas, mereka
bertemu dengan true E (Y i). Oleh karena itu, transformasi (11.6.11) akan bekerja dengan memuaskan dalam praktik jika
ukuran sampel cukup besar.
ln Y i = β 1 + β 2 ln X i + u saya (11.6.12)
Hasil ini muncul karena transformasi log memampatkan skala di mana variabel-variabel diukur, sehingga
mengurangi perbedaan sepuluh kali lipat antara dua nilai menjadi perbedaan dua kali lipat. Jadi, angka 80 adalah
10 kali angka 8, tetapi ln 80 (= 4,3280) kira-kira dua kali lebih besar dari ln 8 (= 2.0794).
Keuntungan tambahan dari transformasi log adalah koefisien kemiringan β 2 mengukur elastisitas Y dengan
hormat X, yaitu, persentase perubahan Y untuk satu persen-
perubahan usia X. Misalnya, jika Y adalah konsumsi dan X adalah pendapatan, β 2 dalam Persamaan. (11.6.12) akan
mengukur elastisitas pendapatan, sedangkan pada model aslinya β 2 mengukur hanya tingkat perubahan konsumsi rata-rata
untuk perubahan unit pendapatan. Itu adalah salah satu alasan mengapa log
model cukup populer di ekonometrik empiris. (Untuk beberapa masalah yang terkait dengan transformasi
log, lihat Latihan 11.4.)
Untuk menyimpulkan diskusi kami tentang langkah-langkah perbaikan, kami menekankan kembali bahwa semua transformasi
yang dibahas sebelumnya bersifat ad hoc; kami pada dasarnya berspekulasi tentang
sifat dari σ 2 i. Transformasi mana yang dibahas sebelumnya yang akan berhasil akan bergantung
pada sifat masalah dan tingkat keparahan heteroskedastisitas. Ada beberapa masalah tambahan dengan
transformasi yang telah kami pertimbangkan yang harus selalu diingat:
1. Ketika kita melampaui model dua-variabel, kita mungkin tidak tahu apriori mana dari
X variabel harus dipilih untuk mengubah data. 39
2. Transformasi log seperti yang dibahas dalam Asumsi 4 tidak dapat diterapkan jika beberapa Y
dan X nilainya nol atau negatif. 40
3. Lalu ada masalah korelasi palsu. Istilah ini, menurut Karl Pearson, mengacu pada situasi di
mana ditemukan korelasi antara rasio variabel meskipun variabel aslinya tidak berkorelasi atau acak. 41
Jadi, di dalam model
Y i = β 1+ β 2 X i + u saya, Y dan X mungkin tidak berkorelasi tetapi dalam model yang diubah
Y saya / X i = β 1 ( 1 / X i) + β 2, Y saya / X saya dan 1/ X saya sering ditemukan berkorelasi.
4. Kapan σ 2 saya tidak langsung diketahui dan diperkirakan dari satu atau lebih trans-
formasi yang telah kita bahas sebelumnya, semua prosedur pengujian kita menggunakan t tes,
F tes, dll., adalah, tegasnya, hanya valid dalam sampel besar. Oleh karena itu, seseorang harus berhati-hati dalam
menafsirkan hasil berdasarkan berbagai transformasi dalam sampel kecil atau terbatas. 42
X menjadi positif.
41 Misalnya, jika X 1, X 2, dan X 3 saling tidak berkorelasi r 12 = r 13 = r 23 = 0 dan kami menemukan bahwa file
(nilai) rasio X 1 / X 3 dan X 2 / X 3 berkorelasi, maka ada korelasi palsu. “Secara lebih umum, korelasi dapat dikatakan palsu jika
disebabkan oleh metode penanganan data dan
tidak ada dalam materi aslinya. " MG Kendall dan WR Buckland, Kamus Istilah Statistik, Hafner Publishing, New York,
1972, hal. 143.
42 Untuk detail lebih lanjut, lihat George G. Judge et al., Op. cit., Bagian 14.4, hlm. 415–420.
396 Bagian kedua Melonggarkan Asumsi Model Klasik
CONTOH 11.9 Marilah kita kembali ke contoh kematian anak yang telah kita bahas dalam beberapa kesempatan. Dari data untuk 64 negara, kami
Kematian Anak memperoleh hasil regresi yang ditunjukkan pada Persamaan. (8.1.4). Karena datanya bersifat cross-sectional, yang melibatkan
berbagai negara dengan pengalaman kematian anak yang berbeda, kemungkinan besar kita akan menjumpai heteroskedastisitas.
Ditinjau kembali
Untuk mengetahui hal ini, pertama-tama mari kita pertimbangkan residual yang diperoleh dari Persamaan. (8.1.4). Residu ini diplot
pada Gambar 11.12. Dari gambar tersebut terlihat bahwa residual tidak menunjukkan adanya pola yang berbeda yang dapat
menunjukkan adanya heteroskedastisitas. Meski demikian, penampilan bisa menipu. Jadi, mari kita terapkan tes Park, Glejser, dan
White untuk melihat apakah ada bukti heteroskedastisitas.
Tes Taman. Karena ada dua regressor, GNP dan FLR, kita dapat meregresi kuadrat residual dari regresi (8.1.4)
pada salah satu variabel ini. Atau, kita dapat meregresinya berdasarkan estimasi nilai CM (= C ̂
M̂) dari regresi (8.1.4). Dengan menggunakan yang terakhir, kami memperoleh berikut
Catatan: û saya adalah residual yang diperoleh dari regresi (8.1.4) dan C. ̂ M̂ adalah nilai perkiraan
CM dari regresi (8.1.4).
Seperti yang ditunjukkan oleh regresi ini, tidak ada hubungan sistematis antara residu kuadrat dan nilai CM
yang diperkirakan (mengapa?), Menunjukkan bahwa asumsi homoskedastisitas mungkin valid. Kebetulan, log
dari nilai sisa kuadrat mengalami regresi pada log C ̂
M̂ tidak mengubah kesimpulannya.
Tes Glejser. Nilai absolut dari sisa yang diperoleh dari Persamaan. (8.1.4), ketika diregresikan pada estimasi
nilai CM dari regresi yang sama, memberikan hasil sebagai berikut:
Sekali lagi, tidak ada banyak hubungan sistematis antara nilai absolut dari residu dan nilai CM yang
diperkirakan, seperti t nilai koefisien kemiringan tidak signifikan secara statistik.
Tes Putih. Menerapkan uji heteroskedastisitas White dengan dan tanpa istilah produk silang, kami tidak menemukan bukti
heteroskedastisitas. Kami juga memperkirakan kembali Persamaan. (8.1.4) untuk mendapatkan kesalahan standar konsisten
heteroskedastisitas White dan t nilai-nilai, tetapi hasilnya sangat mirip dengan yang diberikan dalam Persamaan. (8.1.4), yang
seharusnya tidak mengherankan mengingat berbagai uji heteroskedastisitas yang kami lakukan sebelumnya.
Singkatnya, tampaknya regresi kematian anak kita (8.1.4) tidak mengalami heteroskedastisitas.
- 50
- 100
5 10 15 20 25 30 35 40 45 50 55 60 65
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 397
CONTOH 11.10 Tabel 11.5 memberikan data tentang pengeluaran penelitian dan pengembangan (R&D), penjualan, dan laba untuk 14
R&D kelompok industri di Amerika Serikat (semua angka dalam jutaan dolar). Karena data cross-sectional yang disajikan dalam
tabel ini cukup heterogen, dalam regresi R&D penjualan, kemungkinan terjadi heteroskedastisitas. Hasil regresi adalah
Pengeluaran,
sebagai berikut:
Penjualan, dan Keuntungan
̂ & ̂D i = 1338 +
di 14 Industri R 0,0437 Penjualan saya
TABEL 11.5
Industri Penjualan R&D Keuntungan
Penjualan dan
Untuk melihat apakah regresi (11.7.3) menderita heteroskedastisitas, kami memperoleh resid-
uals, û saya, dan sisa kuadrat, û 2 saya, dari model dan diplotkan terhadap penjualan, sebagai
ditunjukkan pada Gambar 11.13. Tampak dari gambar ini bahwa ada pola sistematis antara residual dan residu kuadrat
dan penjualan, mungkin menunjukkan adanya heteroskedastisitas. Untuk mengujinya secara formal, kami
menggunakan tes Park, Glejser, dan White, yang memberikan hasil sebagai berikut:
Tes Taman
Uji Park menunjukkan bahwa ada hubungan positif yang signifikan secara statistik antara sisa kuadrat dan
penjualan.
( Lanjutan)
398 Bagian kedua Melonggarkan Asumsi Model Klasik
CONTOH 11.10 GAMBAR 11.13 Sisa ( Sebuah) dan residu kuadrat ( b) pada penjualan.
( Lanjutan) 30.000
20.000
10.000
- 10.000
- 20.000
0 100.000 200.000 300.000 400.000
Sisa
Penjualan
500.000.000
400.000.000
300.000.000
200.000.000
100.000.000
0
0 100.000 200.000 300.000 400.000
Sisa kuadrat
Penjualan
Tes Glejser
Uji Glejser juga menunjukkan bahwa ada hubungan sistematis antara nilai absolut dari residual dan penjualan,
meningkatkan kemungkinan bahwa regresi (11.7.3) mengalami heteroskedastisitas.
Tes Putih
Menggunakan R 2 nilai dan n = 14, kami dapatkan nR 2 = 6.090. Di bawah hipotesis nol tentang tidak adanya
heteroskedastisitas, ini harus mengikuti distribusi chi-kuadrat dengan 2 df (karena ada dua regresi dalam Persamaan
[11.7.6]). Itu p nilai memperoleh nilai chi-kuadrat sebanyak
6.090 atau lebih besar adalah sekitar 0,0476. Karena ini adalah nilai yang rendah, uji Putih juga menunjukkan adanya
heteroskedastisitas.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 399
CONTOH 11.10 Singkatnya, berdasarkan grafik sisa dan uji Park, Glejser, dan White, tampaknya regresi R&D kami (11.7.3)
mengalami heteroskedastisitas. Karena varian kesalahan sebenarnya tidak diketahui, kita tidak dapat menggunakan
( Lanjutan)
metode kuadrat terkecil tertimbang untuk mendapatkan kesalahan standar yang dikoreksi heteroskedastisitas dan t nilai-nilai.
Oleh karena itu, kita harus membuat beberapa tebakan tentang sifat varian kesalahan.
Untuk menyimpulkan contoh kami, kami menyajikan di bawah kesalahan standar konsisten-heteroskedastisitas White, seperti yang
dibahas dalam Bagian 11.6.
Membandingkan Persamaan. (11.7.7) dengan Persamaan. (11.7.3) (yang terakhir tidak dikoreksi untuk
heteroskedastisitas), kita melihat bahwa estimasi parameter tidak berubah (seperti yang kita harapkan),
kesalahan standar dari koefisien intersep telah sedikit berkurang, dan kesalahan standar lereng koefisien
meningkat sedikit. Tapi ingat bahwa prosedur Putih adalah prosedur sampel besar, sedangkan kami hanya
memiliki 14 pengamatan.
CONTOH 11.11 Tabel 11.6 di situs web buku teks memberikan gaji dan data terkait di 94 distrik sekolah di Northwest Ohio.
Awalnya, regresi berikut diperkirakan dari data ini:
Dimana Gaji = gaji rata-rata guru kelas ($), famincome = pendapatan keluarga rata-rata di kabupaten ($), dan
propvalue = nilai rata-rata properti di kabupaten ($).
Karena ini adalah model log ganda, semua koefisien kemiringan adalah elastisitas. Berdasarkan berbagai uji
heteroskedastisitas yang dibahas dalam teks, ditemukan bahwa model sebelumnya mengalami heteroskedastisitas.
Oleh karena itu, kami memperoleh kesalahan standar yang kuat (White). Tabel berikut memberikan hasil regresi
sebelumnya dengan dan tanpa kesalahan standar yang kuat.
Meskipun nilai koefisien dan R 2 tetap sama apakah kita menggunakan metode OLS atau White, kesalahan
standar telah berubah; perubahan yang paling dramatis adalah dalam kesalahan standar koefisien ln (propvalue).
OLS biasa akan menyarankan bahwa estimasi koefisien variabel ini sangat signifikan secara statistik, sedangkan
kesalahan standar kuat White menunjukkan bahwa koefisien ini tidak signifikan bahkan pada level 10 persen. Inti
dari contoh ini adalah bahwa jika terjadi heteroskedastisitas, hal itu harus diperhitungkan dalam mengestimasi
suatu model.
400 Bagian kedua Melonggarkan Asumsi Model Klasik
Kembali ke contoh R & D yang dibahas di bagian sebelumnya, kita melihat bahwa ketika kita menggunakan transformasi akar
kuadrat untuk mengoreksi heteroskedastisitas dalam model asli (11.7.3), kesalahan standar koefisien kemiringan menurun
dan t nilai meningkat. Apakah perubahan ini begitu signifikan sehingga dalam praktiknya orang harus mengkhawatirkannya?
Dengan kata lain, kapan kita harus benar-benar mengkhawatirkan masalah heteroskedastisitas? Seperti yang dikatakan
seorang penulis, "heteroskedastisitas tidak pernah menjadi alasan untuk membuang model yang sebaliknya baik". 43
Di sini mungkin berguna untuk mengingat peringatan yang disuarakan oleh John Fox:
. . . varian kesalahan yang tidak sama layak untuk diperbaiki hanya jika masalahnya parah.
Dampak varian kesalahan tidak konstan pada efisiensi penduga kuadrat-terkecil biasa dan pada validitas
inferensi kuadrat-terkecil bergantung pada beberapa faktor, termasuk
ing ukuran sampel, tingkat variasi dalam σ 2 saya, konfigurasi file X [ yaitu,
regressor], dan hubungan antara varian error dan X 's. Oleh karena itu, tidak mungkin untuk mengembangkan
kesimpulan yang sepenuhnya umum tentang kerugian yang ditimbulkan oleh heteroskedastisitas. 44
Kembali ke model (11.3.1), kita telah melihat sebelumnya bahwa varians dari penduga lereng, var
( β̂ 2), diberikan oleh rumus biasa yang ditunjukkan pada (11.2.3). Di bawah GLS, varian kemiringan
penaksir, var ( β̂ ∗ 2), diberikan oleh (11.3.9). Kita tahu bahwa yang terakhir lebih efisien daripada
bekas. Tapi seberapa besar varian sebelumnya (yaitu, OLS) harus dikaitkan dengan varian GLS sebelum orang
benar-benar mengkhawatirkannya? Sebagai aturan praktis, Fox menyarankan agar kami khawatir tentang
masalah ini “. . . saat varian kesalahan terbesar lebih dari sekitar 10 kali terkecil. " 45 Jadi, kembali ke hasil
simulasi Monte Carlo dari Davidson dan MacKinnon yang disajikan di Bagian 11.4, pertimbangkan nilai dari α = 2.
Varians file
diperkirakan β 2 adalah 0,04 di bawah OLS dan 0,012 di bawah GLS, sehingga rasio mantan ke yang terakhir menjadi
sekitar 3,33. 46 Menurut aturan Fox, parahnya heteroskedastisitas dalam hal ini
casing mungkin tidak cukup besar untuk dikhawatirkan.
Juga ingat bahwa, meskipun terdapat heteroskedastisitas, estimator OLS tidak bias linier dan (dalam kondisi
umum) secara asimtotik (yaitu, dalam sampel besar) terdistribusi normal.
Seperti yang akan kita lihat ketika kita membahas pelanggaran lain dari asumsi model regresi linier klasik,
peringatan yang disuarakan di bagian ini sesuai sebagai aturan umum. Jika tidak, seseorang bisa berlebihan.
Ringkasan dan 1. Asumsi kritis dari model regresi linier klasik adalah bahwa gangguan-
bances u saya memiliki semua varian yang sama, σ 2. Jika asumsi ini tidak terpenuhi maka terjadi heteroskedastisitas.
Kesimpulan
3. Tetapi estimator ini tidak lagi varian minimum atau efisien. Artinya, mereka tidak BIRU.
43 N. Gregory Mankiw, “Kursus Penyegaran Singkat dalam Ekonomi Makro,” Jurnal Sastra Ekonomi,
46 Perhatikan bahwa kami telah mengkuadratkan kesalahan standar untuk mendapatkan varians.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 401
6. Mendokumentasikan konsekuensi heteroskedastisitas lebih mudah daripada mendeteksinya. Ada beberapa tes diagnostik
yang tersedia, tetapi tidak ada yang tahu pasti mana yang akan berhasil dalam situasi tertentu.
7. Sekalipun heteroskedastisitas dicurigai dan dideteksi, tidaklah mudah untuk memperbaiki masalah. Jika sampelnya besar,
seseorang dapat memperoleh kesalahan standar terkoreksi heteroskedastisitas White dari penduga OLS dan melakukan
inferensi statistik berdasarkan kesalahan standar ini.
8. Jika tidak, berdasarkan residual OLS, seseorang dapat membuat tebakan terpelajar tentang kemungkinan pola
heteroskedastisitas dan mengubah data asli sedemikian rupa sehingga dalam data yang ditransformasikan tidak ada
heteroskedastisitas.
LATIHAN Pertanyaan
11.1. Negara dengan alasan singkat apakah pernyataan berikut benar, salah, atau tidak pasti:
f. Jika model regresi salah dispesifikasikan (misalnya, variabel penting dihilangkan), maka
Residu OLS akan menunjukkan pola yang berbeda.
g. Jika regressor yang memiliki varian tidak konstan (salah) dihilangkan dari a
model, residual (OLS) akan menjadi heteroskedastis.
11.2. Dalam regresi upah rata-rata ( W, $) tentang jumlah karyawan ( N) untuk sebuah
sampel acak dari 30 perusahaan, diperoleh hasil regresi berikut: *
Ŵ = 7,5 + 0,009 N t = na
(1)
(16.10) R 2 = 0.90
Ŵ / N = 0,008 + 7,8 (1 / N)
(2)
t = ( 14.43) (76,58) R 2 = 0,99
b. Apa yang penulis asumsikan dalam pergi dari Persamaan. (1) ke Persamaan. (2)? Apakah dia khawatir
tentang heteroskedastisitas? Bagaimana Anda tahu?
d. Bisakah Anda membandingkan R 2 nilai dari dua model? Mengapa atau mengapa tidak?
*
Lihat Dominick Salvatore, Ekonomi Manajerial, McGraw-Hill, New York, 1989, hal. 157.
402 Bagian kedua Melonggarkan Asumsi Model Klasik
| ûi|= √
√ β 1 + β 2 X i + v saya
| ûi|= β1+β2 X2 i + v saya
b. Jika tidak, dapatkah Anda menyarankan metode, informal atau formal, untuk memperkirakan parame-
ters model seperti itu? (Lihat Bab 14.)
11.4. Meskipun model log seperti yang ditunjukkan pada Persamaan. (11.6.12) sering mengurangi heteroskedastisitas,
seseorang harus memperhatikan sifat-sifat istilah gangguan model tersebut. Misalnya saja modelnya
ln Y i = ln β 1 + β 2 ln X i + ln u saya (2)
Sebuah. Jika ln u saya adalah memiliki harapan nol, apa yang harus menjadi distribusinya u saya?
c. Jika E ( ln u saya) bukan nol, apa yang bisa dilakukan untuk menjadikannya nol?
11.5. Menunjukkan bahwa β2 ∗dari Persamaan. (11.3.8) bisa juga o∑diekspresikan sebagai
saya x ∗
β 2∗ = ∑ w saya y ∗ ∗ saya
w saya saya
x2
dan var ( β ∗ 2) diberikan dalam Persamaan. (11.3.9) juga bisa expresse d sebagai
var ( β ∗2) = ∑ 1
w saya saya
x2∗
∑ /∑
• ∗= w saya Y saya / ∑ w saya
∑
X̄ ∗ = w saya X saya w saya
11.6. Untuk tujuan pedagogik, Hanushek dan Jackson memperkirakan model berikut:
dimana C t = agregat pengeluaran konsumsi swasta dalam setahun t, GNP t = produk nasional bruto pada tahun t, dan
D = pengeluaran pertahanan nasional dalam setahun t, itu
Tujuan dari analisis adalah untuk mempelajari pengaruh pengeluaran pertahanan terhadap pengeluaran lain dalam
perekonomian.
Mendalilkan itu σ 2 t=σ2( GNP t) 2, mereka mengubah (1) dan memperkirakan
Hasil empiris berdasarkan data untuk tahun 1946–1975 adalah sebagai berikut (kesalahan standar dalam tanda
kurung): *
Sebuah. Asumsi apa yang dibuat oleh penulis tentang sifat heteroskedastisitas?
Bisakah Anda membenarkannya?
tidak?
c. Bisakah Anda membandingkan keduanya R 2 nilai? Mengapa atau mengapa tidak? ( Petunjuk: Periksa
Variabel dependen.)
11.7. Lihat estimasi regresi dalam Persamaan. (11.6.2) dan (11.6.3). Hasil regresi sangat mirip. Apa
yang dapat menjelaskan hasil ini?
11.8. Buktikan jika w i = w, konstanta, untuk masing-masing saya, β ∗ 2 dan β̂ 2 serta variansnya
identik.
11.9. Lihat rumus (11.2.2) dan (11.2.3). Menganggap
σ i2= σ 2 k saya
dimana σ 2 adalah konstanta dan di mana k saya adalah dikenal bobot, belum tentu semuanya sama.
Dengan menggunakan asumsi ini, tunjukkan bahwa varians yang diberikan dalam Persamaan. (11.2.2) bisa
diekspresikan sebagai
∑
saya k saya
var ( β̂ 2) = ∑ σ 2 ∑ x 22
x 2saya
· x saya
Suku pertama di sisi kanan adalah rumus varians yang diberikan dalam Persamaan. (11.2.3), itu
adalah, var ( β̂ 2) di bawah homoskedastisitas. Apa yang dapat Anda katakan tentang sifat rela-
hubungan antara var ( β̂ 2) di bawah heteroskedastisitas dan di bawah homoskedastisitas? ( Petunjuk: Periksa
suku kedua di sisi kanan rumus sebelumnya.) Bisa
Anda menarik kesimpulan umum tentang hubungan antara Persamaan. (11.2.2) dan (11.2.3)?
11.10. Di model
2
X 4saya
var ( β̂ 2) = ( σ ∑ )
X saya
22
*
Eric A. Hanushek dan John E. Jackson, Metode Statistik untuk Ilmuwan Sosial, Academic, New York,
1977, hal. 160.
404 Bagian kedua Melonggarkan Asumsi Model Klasik
Latihan Empiris
11.11. Untuk data yang diberikan pada Tabel 11.1, kompensasi rata-rata regresi Y rata-rata
produktifitas X, memperlakukan ukuran lapangan kerja sebagai unit observasi. Interpretasikan hasil Anda, dan lihat apakah
b. Plot nilai rata-rata terhadap deviasi standar seperti yang dihitung dalam ( Sebuah), menggunakan aset
ukuran sebagai unit observasi.
c. Melalui model regresi yang sesuai memutuskan apakah standar deviasi dari
rasio meningkat dengan nilai rata-rata. Jika tidak, bagaimana Anda merasionalisasi hasilnya?
d. Jika ada hubungan yang signifikan secara statistik antara keduanya, bagaimana Anda akan melakukannya
mengubah data sehingga tidak terjadi heteroskedastisitas?
11.13. Uji homogenitas-of-varians Bartlett. * Misalkan ada k sampel independen
varians s 2 1, s 2 2,. . . , s 2 k dengan f 1, f 2,. . . , f k df, masing-masing dari populasi yang ada
terdistribusi normal dengan mean µ dan varians σ 2 i. Misalkan lebih jauh yang kita inginkan
untuk menguji hipotesis nol H. 0: σ 2 1=σ2 2=· · · = σ2 k = σ 2; yaitu, setiap variabel sampel
ance adalah perkiraan varians populasi yang sama σ 2.
Jika hipotesis nol benar ∑ e, lalu
k
i=
∑
f saya
2 s saya
s 2 = i = 1 ∑ f saya s 2
f saya f
TABEL 11.6
Tahun dan
Ukuran Aset (jutaan
Perempat 1–10 10–25 25–50 50–100 100–250 250–1.000 1.000
dolar)
1971-I 6.696 6.929 6.858 6.966 7.819 7.557 7.860
Sumber: Keuangan Kuartalan
- II 6.826 7.311 7.299 7.081 7.907 7.685 7.351
Laporan untuk Manufaktur
Korporasi, Perdagangan Federal 6.338
- AKU AKU AKU 7.035 7.082 7.145 7.691 7.309 7.088
Komisi dan Komisi Sekuritas dan - IV 6.272 6.265 6.874 6.485 6.778 7.120 6.765
Bursa,
Pemerintah AS, berbagai masalah 1972-I 6.692 6.236 7.101 7.060 7.104 7.584 6.717
(dihitung).
- II 6.818 7.010 7.719 7.009 8.064 7.457 7.280
6.783
- AKU AKU AKU 6.934 7.182 6.923 7.784 7.142 6.619
- IV 6.779 6.988 6.531 7.146 7.279 6.928 6.919
1973 – I 7.291 7.428 7.272 7.571 7.583 7.053 6.630
- II 7.766 9.071 7.818 8.692 8.608 7.571 6.805
7.733
- AKU AKU AKU 8.357 8.090 8.357 7.680 7.654 6.772
- IV 8.316 7.621 7.766 7.867 7.666 7.380 7.072
*
Lihat "Sifat Uji Kecukupan dan Statistik," Prosiding Royal Society of London A,
vol. 160, 1937, hal. 268.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 405
i = 1 f i.
Bartlett telah menunjukkan bahwa hipotesis nol dapat diuji dengan rasio A / B,
yang kira-kira didistribusikan sebagai t ∑ dia χ ( 2 distribusi dengan k - 1 df, dimana
)
A = f ln s 2 - f saya ln ssaya
2
dan
[∑ () ]
1 1- 1
B=1+
3 ( k - 1) f saya f
Terapkan uji Bartlett ke data Tabel 11.1 dan verifikasi bahwa hipotesis bahwa variasi populasi dari
kompensasi karyawan adalah sama di setiap ukuran lapangan kerja dari perusahaan tidak dapat
ditolak pada tingkat signifikansi 5 persen.
Catatan: f saya, df untuk setiap varians sampel, adalah 9, karena n saya untuk setiap sampel (yaitu, kelas pekerjaan)
adalah 10.
Y i = β X i + u saya, untuk i = 1, 2
11.15. Tabel 11.7 memberikan data tentang 81 mobil tentang MPG (rata-rata mil per galon), HP (tenaga kuda mesin), VOL
(kaki kubik ruang kabin), SP (kecepatan tertinggi, mil per jam), dan WT (berat kendaraan dalam 100 lbs. ).
MPG i = β 1 + β 2 SP i + β 3 HP i + β 4 WT i + u saya
Perkirakan parameter model ini dan tafsirkan hasilnya. Apakah mereka masuk akal secara ekonomi?
b. Apakah Anda mengharapkan varian kesalahan dalam model sebelumnya menjadi heteroskedas-
tic? Mengapa?
c. Gunakan uji Putih untuk mengetahui apakah varian kesalahan adalah heteroskedastis.
e. Jika heteroskedastisitas ditetapkan, bagaimana Anda akan mengubah data sehingga masuk
data yang ditransformasikan varians kesalahan homoscedastic? Tunjukkan kalkulasi yang diperlukan.
11.16. Pengeluaran makanan di India. Pada Tabel 2.8 kami telah memberikan data tentang pengeluaran untuk makanan
Sebuah. Atur kembali pengeluaran untuk makanan pada total pengeluaran, dan periksa sisa-sisanya
diperoleh dari regresi ini.
b. Plot residu yang diperoleh di ( Sebuah) terhadap total pengeluaran dan lihat apakah Anda mengamati
pola sistematis apa pun.
*
Diadaptasi dari FAF Seber, Analisis Regresi Linier, John Wiley & Sons, New York, 1977, hal. 64.
406 Bagian kedua Melonggarkan Asumsi Model Klasik
catatan:
VOL = kaki kubik ruang kabin. HP =
tenaga kuda mesin.
MPG = rata-rata mil per galon.
SP = kecepatan tertinggi, mil per jam.
WT = berat kendaraan, ratusan pound.
Pengamatan = nomor pengamatan mobil (Nama mobil tidak diungkapkan).
Sumber: Badan Perlindungan Lingkungan AS, 1991, Laporan EPA / AA / CTAB / 91-02.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 407
11.17. Ulangi Latihan 11.16, tetapi kali ini turunkan logaritma pengeluaran makanan ke dalam logaritma pengeluaran
total. Jika Anda mengamati heteroskedastisitas dalam model linier Latihan 11.16 tetapi tidak dalam model
log-linier, kesimpulan apa yang Anda tarik? Tunjukkan semua kalkulasi yang diperlukan.
11.18. Jalan pintas ke tes White. Seperti disebutkan dalam teks, tes Putih dapat memakan derajat
kebebasan jika ada beberapa regressor dan jika kita memperkenalkan semua regressor, istilah kuadratnya, dan
produk persilangannya. Oleh karena itu, alih-alih memperkirakan regresi seperti Persamaan. (11.5.22), mengapa
tidak menjalankan saja regresi berikut:
2 + ν saya
û 2i = α 1 + α 2 Ŷ i + α 2 Ŷ saya
dimana Ŷ saya adalah perkiraannya Y ( yaitu, regresi dan) nilai dari model apa pun Anda
memperkirakan? Lagipula, Ŷ saya hanyalah rata-rata tertimbang dari para regressor, dengan estimasi
koefisien regresi berfungsi sebagai bobot.
Dapatkan R 2 nilai dari regresi sebelumnya dan gunakan Persamaan. (11.5.22) untuk menguji hipotesis bahwa
tidak terdapat heteroskedastisitas.
Terapkan tes sebelumnya pada contoh pengeluaran makanan dari Latihan 11.16.
11.19. Kembali ke contoh R&D yang dibahas dalam Bagian 11.7 (Latihan 11.10). Ulangi contoh yang menggunakan laba sebagai
regressor. A priori, apakah Anda mengharapkan hasil Anda berbeda dari yang menggunakan penjualan sebagai
regressor? Mengapa atau mengapa tidak?
11.20. Tabel 11.8 memberikan data tentang gaji median profesor penuh statistik di universitas riset di Amerika
Serikat untuk tahun akademik 2007.
Sebuah. Buat grafik gaji rata-rata terhadap tahun dalam peringkat (sebagai ukuran tahun pengalaman).
Untuk tujuan perencanaan, asumsikan bahwa gaji median mengacu pada titik tengah tahun dalam peringkat. Jadi,
gaji $ 124.578 dalam kisaran 4–5 mengacu pada pangkat 4,5 tahun, dan seterusnya. Untuk kelompok terakhir,
asumsikan bahwa kisarannya adalah 31–33.
Y i = α 1 + α 2 X i + u saya (1)
TABEL 11.8
Tahun dalam Peringkat Menghitung Median
Gaji Median untuk
Profesor Penuh di 0 sampai 1 40 $ 101.478
Statistik, 2007 2 sampai 3 24 102.400
4 sampai 5 35 124.578
Sumber: Statistik Amerika
6 sampai 7 34 122.850
Association, “2007 Gaji
Melaporkan." 8 sampai 9 33 116.900
10 sampai 14 73 119.465
15 sampai 19 69 114.900
20 hingga 24 54 129.072
25 sampai 30 44 131.704
31 atau lebih 25 143.000
408 Bagian kedua Melonggarkan Asumsi Model Klasik
dimana Y = gaji rata-rata, X = tahun dalam peringkat (diukur di titik tengah kisaran), dan u dan v adalah istilah
kesalahan. Bisakah Anda berdebat mengapa model (2) mungkin lebih disukai daripada model (1)? Dari data yang
diberikan, perkirakan kedua model tersebut.
c. Jika Anda mengamati heteroskedastisitas dalam model (1) tetapi tidak dalam model (2), apa kontra
klusi yang akan kamu gambar? Tunjukkan perhitungan yang diperlukan.
d. Jika heteroskedastisitas diamati dalam model (2), bagaimana Anda akan mentransformasikan data
sehingga dalam model yang ditransformasikan tidak ada heteroskedastisitas?
11.22. Tabel 11.9 memberikan data perubahan persen per tahun untuk harga saham ( Y) dan konsumen
harga ( X) untuk penampang 20 negara.
Sebuah. Plot data dalam sebar.
b. Regresi Y di X dan memeriksa residual dari regresi ini. Apa yang kamu
mengamati?
c. Karena data untuk Chili tampak tidak umum (pencilan?), Ulangi regresi di ( b),
menjatuhkan data di Chili. Sekarang periksa residual dari regresi ini. Apa yang Anda
amati?
d. Jika berdasarkan hasil di ( b) Anda menyimpulkan bahwa ada heteroskedastis-
ity dalam varian kesalahan tetapi berdasarkan hasil di ( c) Anda membalikkan kesimpulan Anda, kesimpulan
umum apa yang Anda tarik?
TABEL 11.9
Tingkat Perubahan,% per Tahun Harga
Stok dan Konsumen
Harga, Post – World Saham, Harga Konsumen,
Periode Perang II Negara Y X
(sampai 1969)
1. Australia 5.0 4.3
Sumber: Phillip Cagan, Nilai dan 2. Austria 11.1 4.6
Inflasi Saham Biasa: Catatan Sejarah
3. Belgia 3.2 2.4
Banyak Negara, Biro Riset Ekonomi
Nasional, Suppl., 4. Kanada 7.9 2.4
5. Chili 25.5 26.4
Maret 1974, Tabel 1, hal. 4.
6. Denmark 3.8 4.2
7. Finlandia 11.1 5.5
8. Prancis 9.9 4.7
9. Jerman 13.3 2.2
10. India 1.5 4.0
11. Irlandia 6.4 4.0
12. Israel 8.9 8.4
13. Italia 8.1 3.3
14. Jepang 13.5 4.7
15. Meksiko 4.7 5.2
16. Belanda 7.5 3.6
17. Selandia Baru 4.7 3.6
18. Swedia 8.0 4.0
19. Inggris Raya 7.5 3.9
20. Amerika Serikat 9.0 2.1
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 409
11.23. Tabel 11.10 dari website memberikan gaji dan data terkait pada 447 eksekutif perusahaan Fortune 500. Data
termasuk gaji = gaji 1999 dan bonus; totcomp = kompensasi total CEO 1999; masa kerja = jumlah tahun
sebagai CEO (0 jika kurang dari 6 bulan); usia = usia CEO; penjualan = total pendapatan penjualan tahun 1998
dari perusahaan; laba = laba 1998 bagi perusahaan; dan aset = total aset perusahaan pada tahun 1998.
Sebuah. Perkirakan regresi berikut dari data ini dan dapatkan Breusch–
Statistik Pagan – Godfrey untuk memeriksa heteroskedastisitas:
b. Sekarang buat model kedua menggunakan ln (Gaji) sebagai variabel dependen. Disana
ada peningkatan dalam heteroskedastisitas?
Lampiran 11A
= E k2 1 u 12 + k 2 2 u2 + · · · + k 2 n u n2
karena ekspektasi istilah produk silang adalah nol karena asumsi tidak ada korelasi serial,
() () ()
2
var ( β̂ 2) = k 2 1E u2 1+k2 2E u2 2+· · · + k2 nE un
2
var ( β̂ 2) = k 2 1 σ 12 + k 2 σ 2 2+· · · + k2 n σ n2
sejak E (u 2 i) = σ 2 i.
∑
var ( β̂ 2) = k22
[ saya σ ) ]
∑ ( saya 2
= ∑ x saya σ saya
2 sejak k i = ∑ x saya (11.2.2)
x saya
2 x saya
2
∑
saya σ)
= ( ∑ x2
saya
2
2
x saya
2
Untuk mengilustrasikan metode, kami menggunakan model dua variabel Y i = β 1 + β 2 X i + u i. Meminimalkan metode kuadrat terkecil tak berbobot
∑ ∑
û i2= ( Y saya - β̂ 1 - β̂ 2 X 2 i) (1)
410 Bagian kedua Melonggarkan Asumsi Model Klasik
untuk mendapatkan perkiraan, sedangkan metode kuadrat terkecil tertimbang meminimalkan jumlah sisa kuadrat tertimbang:
∑ ∑
w saya ûi =2
∗
w saya ( Y saya - β̂ 1 - β 2 ˆ ∗ X i) 2 (2)
dimana β ∗ 1 dan β∗ 2 adalah penaksir kuadrat terkecil tertimbang dan di mana bobotnya w saya seperti itu
wi=1 (3)
σ saya
2
Artinya, bobot berbanding terbalik dengan varians u saya atau Y saya bergantung pada yang diberikan X saya,
dipahami bahwa var ( u i | X i) = var ( Y i | X i) = σ 2 i.
Membedakan Persamaan. (2) sehubungan dengan β̂ ∗ 1 dan β̂ ∗ 2, kami dapatkan
∑
∂ w saya ûi =2 ∑
2 w saya ( Ysaya
-∗ β̂ 1- β ˆ ∗ 2 X i) ( - 1)
∂β ∗
∑1
∂ w saya ûi =2 ∑
∗- 2
2 w saya ( Y saya - β̂ 1 β̂ ∗ X i) ( - X i)
∂β ∗2
Mengatur ekspresi sebelumnya ∑ s sama dengan nol, kita mendapatkan dua persamaan normal berikut:
∗ ∑ ∗ ∑
w i + β̂ 2 w saya X saya (4)
∑ w saya Y i = β̂ 1 ∑ ∑
∗
w saya X saya Y i = β̂ 1 w saya X i + β̂ ∗ 2
w saya Xsaya
2 (5)
Perhatikan persamaan antara persamaan normal ini dan persamaan normal kuadrat terkecil tidak berbobot.
β̂ 1∗ = • ∗ - β̂ ∗ ¯ 2X∗
(6)
dan (∑) (∑ ) (∑ ) (∑ )
w saya w saya X saya Y saya -) ( ∑ w saya X saya w saya Y saya
β̂ 2∗ = (∑) (∑ ) (11.3.8) = (7)
2
2
w saya w saya X saya - w saya X saya
Y i = β 1 + β 2 X i + u saya (1)
Sekarang
∑ ∑ ∑ 2
û2= ( Y saya- Y)ˆ2saya
= [ β 1 + β 2 X i + u saya - β̂ 1 - β̂ 2 X saya]
σ̂ 2 = - saya
n2 n-2
(2)
∑n-2
[ - ( 1β̂- β 1) - ( β̂ 2 - β 2) X i + u saya] 2
=
n-2
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 411
Memperhatikan itu ( β̂ 1 - β 1) = - ( β̂ 2 - β 2) X̄ + ū, dan menggantikan ini menjadi Persamaan. (2) dan mengambil ekspektasi di kedua sisi, kita
mendapatkan:
[∑ ]}
E ( ˆσ)2 = 1 { ∑ - x 2 var () β̂+2E ( u - ū) 2
n 2-[ ∑ saya
∑ ] saya (3)
saya σ
( n - 1) σ saya
2
- ∑ x2
saya
+
2
=1
n-2 x saya
2 n
Untuk memberi Anda gambaran tentang kesalahan standar yang dikoreksi heteroskedastisitas White, pertimbangkan model regresi dua
variabel:
Sejak σ 2 saya tidak dapat diamati secara langsung, White menyarankan untuk menggunakan û 2 kuadrat untuk masing-masing saya, di tempat
saya, sisa
dari σ saya
2
dan memperkirakan var ( β 2) sebagai berikut ∑ s:
x saya
2
û)
var ( β̂ 2) = ( ∑
saya
2
2
(3)
x saya
2
Putih telah menunjukkan Persamaan itu. (3) adalah penduga yang konsisten dari Persamaan. (2), yaitu, sebagai ukuran sampel meningkat tanpa
batas, Persamaan. (3) konvergen ke Persamaan. (2). 2
Secara kebetulan, perhatikan bahwa jika paket perangkat lunak Anda tidak berisi prosedur kesalahan standar kuat White, Anda dapat
melakukannya seperti yang ditunjukkan pada Persamaan. (3) dengan terlebih dahulu menjalankan regresi OLS biasa, mendapatkan residual dari
Y i = β 1 + β 2 X 2 i + β 3 X 3 i + · · · + β k X ki + u saya (4)
Varians dari koefisien regresi parsial ∑ efisien, katakanlah β̂ j, diperoleh sebagai berikut:
Ji û 2
var ()βˆ j= ( ∑ ŵ 2) saya 2
(5)
ŵ 2Ji
dimana û saya adalah residual yang diperoleh dari regresi (asli) (4) dan ŵ j adalah residu
diperoleh dari regresi (tambahan) regressor X j pada regressor yang tersisa di Persamaan. (4).
Jelas, ini adalah prosedur yang memakan waktu, karena Anda harus memperkirakan Persamaan. (5) untuk masing-masing X
variabel. Tentu saja, semua persalinan ini dapat dihindari jika Anda memiliki paket statistik yang melakukan ini secara rutin. Paket seperti
PC-GIVE, EViews, MICROFIT, SHAZAM, STATA, dan LIMDEP sekarang mendapatkan kesalahan standar kuat heteroskedastisitas White
dengan sangat mudah.
1 Rincian lebih lanjut dapat diperoleh dari Jan Kmenta, Elemen Ekonometrika, 2d. ed., Macmillan, New York, 1986, hlm. 276–278.