Pengujian Heteroskedastisitas
Kesalahan standar heteroskedastisitas-kuat memberikan metode sederhana untuk
menghitung statistik t itu yang asimtotik t didistribusikan apakah atau tidak
heteroskedastisitas hadir. Kami juga telah melihat itu Tersedia statistik F dan LM yang kuat
dengan heteroskedastisitas . Menerapkan tes ini tidak membutuhkan mengetahui apakah ada
heteroskedastisitas atau tidak. Meski demikian, masih ada beberapa alasan bagus karena
memiliki tes sederhana yang dapat mendeteksi keberadaannya. Pertama, seperti yang kami
sebutkan di bagian sebelumnya, statistik t biasa memiliki distribusi t yang tepat di bawah asumsi
model linier klasik. Untuk ini alasannya, banyak ekonom masih lebih suka melihat kesalahan
standar OLS biasa dan statistik pengujian dilaporkan, kecuali ada bukti
heteroskedastisitas. Kedua, jika ada heteroskedastisitas, perkiraan OLS mator bukan lagi
penduga tak bias linier terbaik. Seperti yang akan kita lihat di Bagian 8-4, itu mungkin
mendapatkan estimator yang lebih baik dari OLS bila diketahui bentuk heteroskedastisitasnya.
Banyak tes untuk heteroskedastisitas telah disarankan selama bertahun tahun. Beberapa dari
mereka, sementara memiliki-Untuk kemampuan mendeteksi heteroskedastisitas, tidak secara
langsung menguji asumsi bahwa varians kesalahan tidak bergantung pada variabel
independen. Kami akan membatasi diri pada yang lebih modern tes, yang mendeteksi jenis
heteroskedastisitas yang membuat statistik OLS biasa tidak valid. Ini juga memiliki keuntungan
menempatkan semua pengujian dalam kerangka yang sama. Seperti biasa, kita mulai dengan
model linier
y = β0 + β1 x1 + β2x2 +…+ βk xk + u,
[8.10]
Di mana Asumsi MLR.1 hingga MLR.4 dipertahankan di bagian ini. Secara khusus, kami
berasumsi bahwa E(ulx1, x2 ,…, xk) = 0, sehingga OLS tidak bias dan konsisten. Kami
mengambil hipotesis nol menjadi Asumsi MLR.5 benar:
H0 : Var(ux 2lx1, x2,…, xk ) = σ 2.
[8.11]
Artinya, kami berasumsi bahwa asumsi ideal homoskedastisitas berlaku, dan kami memerlukan
datanya untuk memberi tahu kami sebaliknya. Jika kami tidak dapat menolak (8.11) pada tingkat
signifikansi yang cukup kecil, kami biasanya menyimpulkan bahwa heteroskedastisitas tidak
menjadi masalah. Namun, ingatlah bahwa kami tidak pernah menerima H0 ; kita gagal begitu saja
untuk menolaknya.
Karena kita mengasumsikan bahwa u memiliki ekspektasi bersyarat nol, Var(ulx) = E(u x 2
lx), dan seterusnya. hipotesis nol dari homoskedastisitas sama dengan
Hal ini menunjukkan bahwa untuk menguji pelanggaran asumsi homoskedastisitas, kami ingin
menguji apakah u2 terkait (dalam nilai yang diharapkan) dengan satu atau lebih variabel
penjelas. Jika H0 salah, maka nilai yang diharapkan dari u 2 , mengingat variabel independen,
dapat menjadi hampir semua fungsi dari x j . Sederhana pendekatannya adalah dengan
mengasumsikan fungsi linier:
u2= ẟ0 + ẟ1 x1 + ẟ2 x2 + … + ẟk xk + v,
[8.12]
Seperti yang telah kami tekankan sebelumnya, kami tidak pernah mengetahui kesalahan
sebenarnya dalam model populasi, tetapi kami memiliki perkiraan mereka: sisa OLS, u^ i , adalah
perkiraan kesalahan ui untuk observasi i . Jadi, kita bisa memperkirakan persamaannya
u^ 2=δ 0 + δ 1 x 1 +δ 2 x 2+ ⋯+ δ k x k + ⅇrror
[8.14]
Dan hitung statistik F atau LM untuk signifikansi gabungan dari x 1 , … , x k ⋅. Ternyata
menggunakan Residual OLS sebagai pengganti kesalahan tidak mempengaruhi distribusi sampel
yang besar dari statistik F atau LM statistik, meskipun menunjukkan ini cukup rumit.
The F dan LM statistik baik tergantung pada R-squared dari regresi (8.14); sebut ini R2u^ 2 untuk
membedakan dengan R -squared dalam persamaan taksiran (8.10). Maka, statistik F adalah
R2u^ 2 ∕ k
F= ,
( 1−R2u^ 2 ) ∕ ( n−k−1 )
[8.15]
Di mana k adalah jumlah regressor dalam (8.14); ini adalah jumlah yang sama dari
variabel independen di (8.10). Menghitung (8.15) dengan tangan jarang diperlukan, karena
sebagian besar paket regresi secara otomatis menghitung statistik F untuk signifikansi
keseluruhan regresi. Statistik F ini memiliki (perkiraan) distribusi F k , n -k -1 bawah hipotesis
nol homoskedastisitas. The LM statistik untuk heteroskedastisitas hanya kali ukuran sampel R -
squared dari (8.14):
2
LM = n . Ru^ 2
[8.16]
2
Di bawah hipotesis nol, LM didistribusikan secara asimtotik sebagai X . Ini juga sangat mudah
1^
didapat setelah menjalankan regresi (8.14).
Uji versi LM ini biasanya disebut uji Breusch-Pagan untuk heteroskedastisitas (Tes
BP) . Breusch dan Pagan (1979) menyarankan bentuk tes yang berbeda yang mengasumsikan
kesalahannya terdistribusi normal. Koenker (1981) menyarankan bentuk statistik LM di (8.16),
dan itu umum lebih disukai sekutu karena penerapannya yang lebih besar.
Kami merangkum langkah-langkah pengujian heteroskedastisitas menggunakan uji BP:
Dalam Bab 6, kami menyebutkan bahwa salah satu manfaat menggunakan bentuk
fungsional logaritmik untuk variabel dependen adalah heteroskedastisitas yang sering
berkurang. Dalam aplikasi saat ini, mari kita beri harga , lotsize , dan sqrft dalam bentuk
logaritma, sehingga elastisitas harga , sehubungan dengan LotSize dan sqrft , konstan. Persamaan
yang diperkirakan adalah
^
log ( price )=−1.30+.168 log ( lotsize ) +.700 log ( sqrft ) +0.37 bdrms
(.65) (.038) (.093) (.028)
n = 88, R2 = .643.
[8.18]
.
Regresi sisa OLS kuadrat dari regresi ini pada log ( lotsize ), log ( sqrft ),
dan bdrms memberikan X 2u^ 2 = .0480. Jadi, F = 1.41 ( nilai- p = .245), dan LM = 4.22 ( nilai- p 5 .
239). Oleh karena itu, kami gagal untuk menolak hipotesis nol dari homoskedastisitas dalam
model dengan fungsional logaritmik formulir. Terjadinya heteroskedastisitas yang kurang
dengan variabel terikat dalam bentuk logaritmik telah diperhatikan dalam banyak aplikasi
empiris.
Jika kita menduga bahwa heteroskedastisitas hanya bergantung pada variabel independen
tertentu, kita dapat dengan mudah memodifikasi ify tes Breusch-Pagan: kita hanya mundur ^u2
pada variabel independen apa pun yang kami pilih dan bawa keluar dari uji F atau LM
yang sesuai . Ingatlah bahwa derajat kebebasan yang sesuai tergantung pada jumlah ber variabel
bebas dalam regresi dengan ^u2 sebagai variabel terikat; jumlah independent variabel yang
muncul dalam persamaan (8.10) tidak relevan. Jika residu kuadrat diregresikan hanya pada
Pertimbangkan persamaan upah (7.11), di mana
Anda berpikir bahwa varians bersyarat log
( upah ) tidak tergantung pada educ , exper ,
atau kepemilikan . Namun,Anda khawatir itu
varians log( upah ) berbeda di seluruh empat
kelompok demografis pria kawin, wanita
menikah, pria lajang, dan lajang
wanita. Regresi apa yang akan Anda jalankan
tes untuk heteroskedastisitas? Apa itu derajat
kebebasan dalam uji F ?
Dalam Bab 5, kami menunjukkan bahwa kesalahan standar OLS dan statistik pengujian biasanya
asimtotik valid, asalkan semua asumsi Gauss-Markov berlaku. Ternyata homoskedastisitas
sebagai asumsi, Var( u1lx1,…, xk ) = σ 2, dapat diganti dengan asumsi yang lebih lemah bahwa
kesalahan kuadrat, u2 , tidak berkorelasi dengan semua variabel independen (xj), kuadrat dari
variabel independent ( x 2j ) dan semua produk silang ( xj xh untuk j ≠ h ). Pengamatan ini
memotivasi White (1980) untuk mengusulkan tes untuk heteroskedastisitas yang menambahkan
produk kuadrat dan silang dari semua variabel independent ke persamaan (8.14). Pengujian
secara eksplisit dimaksudkan untuk menguji bentuk-bentuk heteroskedastisitas yang tidak valid
kesalahan standar OLS biasa dan statistik pengujian.
^y i= β^ 0 + ^β 1 x i + B
1
^ 2 x i + …+ ^β k X i
2 k
Ini hanyalah fungsi linier dari variabel independen. Jika kita mengkuadratkan nilai pas, kita
mendapatkan fungsi tertentu dari semua kuadrat dan produk silang dari variabel independen. Ini
menyarankan
menguji heteroskedastisitas dengan mengestimasi persamaan
u^ 2=δ 0 + δ 1 ^y + δ 2 ^y 2 error
[8,20]
Dimana ^y adalah singkatan dari nilai yang dipasang. Penting untuk tidak
mengacaukan ^y dan y dalam persamaan ini. Kami menggunakan nilai yang dipasang karena
mereka adalah fungsi dari variabel independen (dan parameter yang diperkirakan);
menggunakan y dalam (8.20) tidak menghasilkan uji yang valid untuk heteroskedastisitas. Kita
dapat menggunakan statistik F atau LM untuk hipotesis nol H0 : δ 1 = 0,δ 2 = 0 dalam persamaan
(8.20). Hal ini menghasilkan dua batasan dalam menguji nol homoskedastisitas, berapapun
jumlahnya variabel independen dalam model aslinya. Mempertahankan derajat kebebasan
dengan cara ini sering kali ide bagus, dan juga membuat pengujian mudah diterapkan. Karena ^y
adalah perkiraan nilai yang diharapkan dari y , mengingat xj , menggunakan (8.20) untuk
menguji heteroskedastisitas berguna dalam kasus di mana varians dianggap berubah dengan
tingkat yang diharapkan nilai, E(yl x). Tes dari (8,20) dapat dipandang sebagai kasus khusus dari
uji Putih, karena persamaan (8.20) dapat ditunjukkan untuk memberlakukan batasan pada
parameter dalam persamaan (8.19).
Kasus Khusus Uji Putih untuk Heteroskedastisitas:
1. Perkirakan model (8.10) oleh OLS, seperti biasa. Dapatkan sisa OLS ^u dan nilai yang
dipasang ^y . Hitung kuadrat sisa OLS ^u2 dan nilai pas kuadrat ^y 2.
2. Jalankan regresi pada persamaan (8.20). Jauhkan R -squared dari regresi ini, R22
3. Bentuk statistik F atau LM dan hitung nilai p (menggunakan distribusi F 2, n -3 di kasus
sebelumnya dan x 22distribusi dalam kasus terakhir).
Sebelum meninggalkan bagian ini, kita harus membahas satu peringatan penting. Kami
telah menafsirkan penolakan Peneliti menggunakan salah satu uji heteroskedastisitas sebagai
bukti adanya heteroskedastisitas. Ini tepat asalkan kami mempertahankan Asumsi MLR.1
melalui MLR.4. Tapi, jika MLR.4 dilanggar — khususnya, jika bentuk fungsional dari E(ylx)
salah spesifikasi — maka pengujian heteroskedastisitas dapat menolak H 0 , bahkan jika var(ylx)
konstan. Misalnya, jika kita menghilangkan satu atau lebih istilah kuadrat dalam model regresi
atau gunakan model level ketika kita harus menggunakan log, pengujian heteroskedastisitas bisa
signifikan. Hal ini membuat beberapa ekonom memandang pengujian heteroskedastisitas sebagai
pengujian kesalahan spesifikasi umum. Namun, ada pengujian yang lebih baik dan lebih
langsung untuk kesalahan spesifikasi bentuk fungsional, dan kami akan membahasnya beberapa
di antaranya ada di Bagian 9-1. Lebih baik menggunakan tes eksplisit untuk bentuk fungsional
terlebih dahulu, karena fungsional bentuk kesalahan spesifikasi lebih penting daripada
heteroskedastisitas. Kemudian, setelah kami puas dengan file bentuk fungsional, kita dapat
menguji heteroskedastisitas.