Anda di halaman 1dari 6

 

Pengujian Heteroskedastisitas
Kesalahan standar heteroskedastisitas-kuat memberikan metode sederhana untuk
menghitung statistik t itu yang asimtotik t didistribusikan apakah atau tidak
heteroskedastisitas hadir. Kami juga telah melihat itu Tersedia statistik F dan LM yang kuat
dengan heteroskedastisitas  . Menerapkan tes ini tidak membutuhkan mengetahui apakah ada
heteroskedastisitas atau tidak. Meski demikian, masih ada beberapa alasan bagus karena
memiliki tes sederhana yang dapat mendeteksi keberadaannya. Pertama, seperti yang kami
sebutkan di bagian sebelumnya, statistik t biasa memiliki distribusi t yang tepat di bawah asumsi
model linier klasik. Untuk ini alasannya, banyak ekonom masih lebih suka melihat kesalahan
standar OLS biasa dan statistik pengujian dilaporkan, kecuali ada bukti
heteroskedastisitas. Kedua, jika ada heteroskedastisitas, perkiraan OLS mator bukan lagi
penduga tak bias linier terbaik. Seperti yang akan kita lihat di Bagian 8-4, itu mungkin
mendapatkan estimator yang lebih baik dari OLS bila diketahui bentuk heteroskedastisitasnya.
Banyak tes untuk heteroskedastisitas telah disarankan selama bertahun tahun. Beberapa dari
mereka, sementara memiliki-Untuk kemampuan mendeteksi heteroskedastisitas, tidak secara
langsung menguji asumsi bahwa varians kesalahan tidak bergantung pada variabel
independen. Kami akan membatasi diri pada yang lebih modern tes, yang mendeteksi jenis
heteroskedastisitas yang membuat statistik OLS biasa tidak valid. Ini juga memiliki keuntungan
menempatkan semua pengujian dalam kerangka yang sama. Seperti biasa, kita mulai dengan
model linier
y = β0 + β1 x1 + β2x2 +…+ βk xk + u,
[8.10]
Di mana Asumsi MLR.1 hingga MLR.4 dipertahankan di bagian ini. Secara khusus, kami
berasumsi bahwa E(ulx1, x2 ,…, xk) = 0, sehingga OLS tidak bias dan konsisten. Kami
mengambil hipotesis nol menjadi Asumsi MLR.5 benar:

H0 : Var(ux 2lx1, x2,…, xk ) = σ 2.
[8.11]
Artinya, kami berasumsi bahwa asumsi ideal homoskedastisitas berlaku, dan kami memerlukan
datanya untuk memberi tahu kami sebaliknya. Jika kami tidak dapat menolak (8.11) pada tingkat
signifikansi yang cukup kecil, kami biasanya menyimpulkan bahwa heteroskedastisitas tidak
menjadi masalah. Namun, ingatlah bahwa kami tidak pernah menerima H0 ; kita gagal begitu saja
untuk menolaknya.
Karena kita mengasumsikan bahwa u memiliki ekspektasi bersyarat nol, Var(ulx) = E(u x 2
lx), dan seterusnya. hipotesis nol dari homoskedastisitas sama dengan

H0 : E(u2lx1, x2,…, xk) = E(u x 2) = σ 2 .

Hal ini menunjukkan bahwa untuk menguji pelanggaran asumsi homoskedastisitas, kami ingin
menguji apakah u2 terkait (dalam nilai yang diharapkan) dengan satu atau lebih variabel
penjelas. Jika H0 salah, maka nilai yang diharapkan dari u  2 , mengingat variabel independen,
dapat menjadi hampir semua fungsi dari x j . Sederhana pendekatannya adalah dengan
mengasumsikan fungsi linier:
u2= ẟ0 + ẟ1 x1 +  ẟ2 x2 + … + ẟk xk + v,
[8.12]

Di mana v adalah suku kesalahan dengan mean nol diberikan xj . Perhatikan variabel dependen di


persamaan ini: itu adalah kuadrat dari kesalahan dalam persamaan regresi asli, (8.10). Hipotesis
nol-esis dari homoskedastisitas adalah

H0 : ẟ1 = ẟ2 =…= ẟk = 0.


[8.13]
Di bawah hipotesis nol, sering masuk akal untuk mengasumsikan bahwa kesalahan dalam
(8.12), v , adalah independen dari x 1 , x 2 ,…, x k . Kemudian, kita tahu dari Bagian 5-2
bahwa statistik F atau LM secara keseluruhan signifikansi dari variabel independen dalam
menjelaskan u2 dapat digunakan untuk menguji (8.13). Keduanya statistik akan memiliki
pembenaran asimtotik, meskipun u2 tidak dapat didistribusikan secara normal. (Misalnya, jika
u terdistribusi normal, maka u2/σ 2 didistribusikan sebagaiX 21 .) Jika kita bisa mengamati u2 dalam
sampel, maka kita dapat dengan mudah menghitung statistik ini dengan menjalankan regresi
OLS dari u2 pada x1, x  2,…, xk, menggunakan semua observasi n .

Seperti yang telah kami tekankan sebelumnya, kami tidak pernah mengetahui kesalahan
sebenarnya dalam model populasi, tetapi kami memiliki perkiraan mereka: sisa OLS, u^ i  , adalah
perkiraan kesalahan ui untuk observasi i . Jadi, kita bisa memperkirakan persamaannya

u^ 2=δ 0 + δ 1 x 1 +δ 2 x 2+ ⋯+ δ k x k + ⅇrror
[8.14]
Dan hitung statistik F atau LM untuk signifikansi gabungan dari   x 1 , … , x k ⋅. Ternyata
menggunakan Residual OLS sebagai pengganti kesalahan tidak mempengaruhi distribusi sampel
yang besar dari statistik F atau LM statistik, meskipun menunjukkan ini cukup rumit.
The F dan LM statistik baik tergantung pada R-squared dari regresi (8.14); sebut ini R2u^ 2 untuk
membedakan dengan R -squared dalam persamaan taksiran (8.10). Maka, statistik F adalah
R2u^ 2 ∕ k
F= ,
( 1−R2u^ 2 ) ∕ ( n−k−1 )
[8.15]
Di mana k adalah jumlah regressor dalam (8.14); ini adalah jumlah yang sama dari
variabel independen di (8.10). Menghitung (8.15) dengan tangan jarang diperlukan, karena
sebagian besar paket regresi secara otomatis menghitung statistik F untuk signifikansi
keseluruhan regresi. Statistik F ini memiliki (perkiraan) distribusi F k , n -k -1  bawah hipotesis
nol homoskedastisitas. The LM statistik untuk heteroskedastisitas hanya kali ukuran sampel R -
squared dari (8.14):
2
LM  = n . Ru^ 2
[8.16]
2
Di bawah hipotesis nol, LM didistribusikan secara asimtotik sebagai X . Ini juga sangat mudah
1^
didapat setelah menjalankan regresi (8.14).
Uji versi LM ini biasanya disebut uji Breusch-Pagan untuk heteroskedastisitas (Tes
BP) . Breusch dan Pagan (1979) menyarankan bentuk tes yang berbeda yang mengasumsikan
kesalahannya terdistribusi normal. Koenker (1981) menyarankan bentuk statistik LM di (8.16),
dan itu umum lebih disukai sekutu karena penerapannya yang lebih besar.
Kami merangkum langkah-langkah pengujian heteroskedastisitas menggunakan uji BP:

Uji Breusch-Pagan untuk Heteroskedastisitas:


1. Perkirakan model (8.10) oleh OLS, seperti biasa. Dapatkan sisa OLS kuadrat,u^ 2 (satu untuk
masing-masing pengamatan).
2
2. Jalankan regresi di (8.14). Jauhkan R -squared dari regresi ini,  Ru^ 2
3. Bentuklah statistik F atau statistik LM dan hitung nilai- p (menggunakan distribusi F k , n -k -1
distribusi dalam kasus sebelumnya dan x 2k distribusi dalam kasus terakhir). Jika nilai p cukup
kecil, yaitu, di bawah tingkat signifikansi yang dipilih, maka kami menolak hipotesis nol
homoskedastisitas
Jika tes BP menghasilkan nilai p yang cukup kecil , beberapa tindakan korektif harus
diambil. Satu kemungkinannya adalah dengan hanya menggunakan kesalahan standar
heteroskedastisitas-kuat dan statistik uji yang dibahas dalam bagian sebelumnya. Kemungkinan
lain dibahas dalam Bagian 8-4.
Contoh 8.4
Heteroskedastisitas dalam Persamaan Harga Perumahan
Kami menggunakan data di HPRICE1 untuk menguji heteroskedastisitas dalam persamaan harga
rumah sederhana. Itu
persamaan perkiraan menggunakan level semua variabel adalah

price=21.77 +.00207 lostsize+.123 sqrft + 12.85bdrms


^
( 29.48 ) ( .00064 ) ( .013 ) ( 9.01 )
n=88. R2=.672

Persamaan ini memberitahu kita apa-apa tentang apakah kesalahan dalam model populasi


heteroskedastic. Kita perlu meregresi residual OLS kuadrat pada variabel independen. R-
squared dari regresi ^u2 pada lotsize , sqrft , dan bdrms adalah R2u^ 2 = .1601. Dengan n = 88
dan k = 3, ini menghasilkan sebuah Statistik F untuk signifikansi variabel independen dari F =
[.1601/(1-.1601)](84/3) ≈ 5.34. Nilai- p yang terkait adalah .002, yang merupakan bukti kuat
terhadap nol. The LM statistik adalah 88(.1601) ≈14.09; ini memberikan p - value ≈0,0028
(menggunakan X 23  distribusi), yang pada dasarnya memberikan kesimpulan yang sama
dengan statistik F. Ini berarti bahwa kesalahan standar biasa yang dilaporkan di (8.17) tidak
dapat diandalkan.

Dalam Bab 6, kami menyebutkan bahwa salah satu manfaat menggunakan bentuk
fungsional logaritmik untuk variabel dependen adalah heteroskedastisitas yang sering
berkurang. Dalam aplikasi saat ini, mari kita beri harga , lotsize , dan sqrft dalam bentuk
logaritma, sehingga elastisitas harga , sehubungan dengan LotSize dan sqrft , konstan. Persamaan
yang diperkirakan adalah
^
log ( price )=−1.30+.168 log ( lotsize ) +.700 log ( sqrft ) +0.37 bdrms
(.65) (.038) (.093) (.028)
n = 88, R2 = .643.
[8.18]
.
Regresi sisa OLS kuadrat dari regresi ini pada log ( lotsize ), log ( sqrft ),
dan bdrms memberikan X 2u^ 2 = .0480. Jadi, F = 1.41 ( nilai- p = .245), dan LM = 4.22 ( nilai- p 5 .
239). Oleh karena itu, kami gagal untuk menolak hipotesis nol dari homoskedastisitas dalam
model dengan fungsional logaritmik formulir. Terjadinya heteroskedastisitas yang kurang
dengan variabel terikat dalam bentuk logaritmik telah diperhatikan dalam banyak aplikasi
empiris.

Jika kita menduga bahwa heteroskedastisitas hanya bergantung pada variabel independen
tertentu, kita dapat dengan mudah memodifikasi ify tes Breusch-Pagan: kita hanya mundur ^u2
pada variabel independen apa pun yang kami pilih dan bawa keluar dari uji F atau LM
yang sesuai . Ingatlah bahwa derajat kebebasan yang sesuai tergantung pada jumlah ber variabel
bebas dalam regresi dengan ^u2 sebagai variabel terikat; jumlah independent variabel yang
muncul dalam persamaan (8.10) tidak relevan. Jika residu kuadrat diregresikan hanya pada
Pertimbangkan persamaan upah (7.11), di mana
Anda berpikir bahwa varians bersyarat log
( upah ) tidak tergantung pada educ , exper ,
atau kepemilikan . Namun,Anda khawatir itu
varians log( upah ) berbeda di seluruh empat
kelompok demografis pria kawin, wanita
menikah, pria lajang, dan lajang
wanita. Regresi apa yang akan Anda jalankan
tes untuk heteroskedastisitas? Apa itu derajat
kebebasan dalam uji F ?

variabel independen tunggal, uji heteroskedastisitas hanyalah statistik t biasa pada


variabel. Sebuah statistik t signifikan menunjukkan bahwa heteroskedastisitas adalah sebuah
masalah.

8-3a Tes Putih untuk Heteroskedastisitas

Dalam Bab 5, kami menunjukkan bahwa kesalahan standar OLS dan statistik pengujian biasanya
asimtotik valid, asalkan semua asumsi Gauss-Markov berlaku. Ternyata homoskedastisitas
sebagai asumsi, Var( u1lx1,…, xk ) = σ 2, dapat diganti dengan asumsi yang lebih lemah bahwa
kesalahan kuadrat, u2 , tidak berkorelasi dengan semua variabel independen (xj), kuadrat dari
variabel independent ( x 2j ) dan semua produk silang ( xj xh  untuk j ≠ h ). Pengamatan ini
memotivasi White (1980) untuk mengusulkan tes untuk heteroskedastisitas yang menambahkan
produk kuadrat dan silang dari semua variabel independent ke persamaan (8.14). Pengujian
secara eksplisit dimaksudkan untuk menguji bentuk-bentuk heteroskedastisitas yang tidak valid
kesalahan standar OLS biasa dan statistik pengujian.

Ketika model berisi k = 3 variabel independen, uji Putih didasarkan pada


Perkiraan
u^ 2=δ 0 + δ 1 x 1 +δ 2 x 2+ δ 3 x 3 t δ 4 x 21 +δ 5 x 22+ δ 6 x 23
+ δ 7 x 1 x2 + δ 8 x1 x 3+ δ 9 x 2 x 3+ error
[8.19]
Dibandingkan dengan uji Breusch-Pagan, persamaan ini memiliki enam regressor lagi. The uji
Putih untuk heteroskedastisitas adalah statistik LM untuk menguji bahwa semua ẟj  dalam
persamaan (8.19) adalah nol, kecuali untuk mencegat. Jadi, sembilan pembatasan sedang diuji
dalam kasus ini. Kami juga dapat menggunakan uji F ini hipotesa; kedua tes memiliki justifikasi
asimtotik.
Dengan hanya tiga variabel independen dalam model asli, persamaan (8.19) memiliki
sembilan variabel independen. variabel ent. Dengan enam variabel independen dalam model asli,
regresi putih akan menghasilkan sekutu melibatkan 27 regressor (kecuali beberapa
berlebihan). Kelimpahan regressor ini adalah sebuah kelemahan dalam bentuk murni Tes Putih:
menggunakan banyak derajat kebebasan untuk model hanya dengan moderat jumlah variabel
independen.
Mungkin saja mendapatkan pengujian yang lebih mudah diterapkan daripada pengujian
Putih dan lebih hemat pada derajat kebebasan. Untuk membuat tes, ingatlah bahwa perbedaan
antara White dan Breusch- Tes pagan adalah bahwa yang pertama mencakup produk kuadrat dan
silang dari variabel independen. Kami dapat mempertahankan semangat uji Putih sambil
mempertahankan derajat kebebasan dengan menggunakan OLS nilai yang dipasang dalam uji
heteroskedastisitas. Ingatlah bahwa nilai yang sesuai ditentukan, untuk masing-masing
observasi i , oleh

^y i= β^ 0 + ^β 1 x i + B
1
^ 2 x i + …+ ^β k X i
2 k

Ini hanyalah fungsi linier dari variabel independen. Jika kita mengkuadratkan nilai pas, kita
mendapatkan fungsi tertentu dari semua kuadrat dan produk silang dari variabel independen. Ini
menyarankan
menguji heteroskedastisitas dengan mengestimasi persamaan

u^ 2=δ 0 + δ 1 ^y + δ 2 ^y 2 error

[8,20]
Dimana ^y adalah singkatan dari nilai yang dipasang. Penting untuk tidak
mengacaukan ^y dan y dalam persamaan ini. Kami menggunakan nilai yang dipasang karena
mereka adalah fungsi dari variabel independen (dan parameter yang diperkirakan);
menggunakan y dalam (8.20) tidak menghasilkan uji yang valid untuk heteroskedastisitas. Kita
dapat menggunakan statistik F atau LM untuk hipotesis nol H0 : δ 1 = 0,δ 2 = 0 dalam persamaan
(8.20). Hal ini menghasilkan dua batasan dalam menguji nol homoskedastisitas, berapapun
jumlahnya variabel independen dalam model aslinya. Mempertahankan derajat kebebasan
dengan cara ini sering kali ide bagus, dan juga membuat pengujian mudah diterapkan. Karena ^y
adalah perkiraan nilai yang diharapkan dari y , mengingat xj , menggunakan (8.20) untuk
menguji heteroskedastisitas berguna dalam kasus di mana varians dianggap berubah dengan
tingkat yang diharapkan nilai, E(yl x). Tes dari (8,20) dapat dipandang sebagai kasus khusus dari
uji Putih, karena persamaan (8.20) dapat ditunjukkan untuk memberlakukan batasan pada
parameter dalam persamaan (8.19).
Kasus Khusus Uji Putih untuk Heteroskedastisitas:
1. Perkirakan model (8.10) oleh OLS, seperti biasa. Dapatkan sisa OLS ^u dan nilai yang
dipasang ^y . Hitung kuadrat sisa OLS ^u2 dan nilai pas kuadrat ^y 2.
2. Jalankan regresi pada persamaan (8.20). Jauhkan R -squared dari regresi ini, R22
3. Bentuk statistik F atau LM dan hitung nilai p (menggunakan distribusi F 2, n -3 di kasus
sebelumnya dan x 22distribusi dalam kasus terakhir).

Bentuk Khusus Tes Putih di log Persamaan harga rumah


Kami menerapkan kasus khusus dari uji Putih ke persamaan (8.18), di mana kami
menggunakan bentuk LM dari statistik. Hal penting untuk diingat adalah bahwa distribusi
chikuadrat selalu memiliki dua df. Itu ^ ,^
regresi ^u2 pada lprice (lprice), di
2
mana lprice menunjukkan nilai yang dipasang dari (8.18), menghasilkan R2= .0392; dengan
demikian, LM = 88(.0392) <3.45, dan nilai- p = .178. Ini adalah bukti yang lebih kuat dari
heteroskedastisitas daripada yang diberikan oleh uji Breusch-Pagan, tetapi kami masih gagal
menolak homoskedas- ticity bahkan pada tingkat 15%.

Sebelum meninggalkan bagian ini, kita harus membahas satu peringatan penting. Kami
telah menafsirkan penolakan Peneliti menggunakan salah satu uji heteroskedastisitas sebagai
bukti adanya heteroskedastisitas. Ini tepat asalkan kami mempertahankan Asumsi MLR.1
melalui MLR.4. Tapi, jika MLR.4 dilanggar — khususnya, jika bentuk fungsional dari E(ylx)
salah spesifikasi — maka pengujian heteroskedastisitas dapat menolak H 0 , bahkan jika var(ylx)
konstan. Misalnya, jika kita menghilangkan satu atau lebih istilah kuadrat dalam model regresi
atau gunakan model level ketika kita harus menggunakan log, pengujian heteroskedastisitas bisa
signifikan. Hal ini membuat beberapa ekonom memandang pengujian heteroskedastisitas sebagai
pengujian kesalahan spesifikasi umum. Namun, ada pengujian yang lebih baik dan lebih
langsung untuk kesalahan spesifikasi bentuk fungsional, dan kami akan membahasnya beberapa
di antaranya ada di Bagian 9-1. Lebih baik menggunakan tes eksplisit untuk bentuk fungsional
terlebih dahulu, karena fungsional bentuk kesalahan spesifikasi lebih penting daripada
heteroskedastisitas. Kemudian, setelah kami puas dengan file bentuk fungsional, kita dapat
menguji heteroskedastisitas.

Anda mungkin juga menyukai