Anda di halaman 1dari 76

405 Ekonometrika

Bab # 11: Heteroskedastisitas: APA YANG TERJADI JIKA


ERROR VARIANS nonconstant?
Dengan Domodar N. Gujarati

Prof. M. El-Sakka
Departemen Ekonomi Universitas
Kuwait
• Seperti dalam Bab 10, kita mencari jawaban pertanyaan-pertanyaan
berikut:
• 1. Apakah sifat heteroskedastisitas?
• 2. Apa konsekuensinya?
• 3. Bagaimana seseorang mendeteksinya?
• 4. Apa langkah-langkah perbaikan?
SIFAT heteroskedastisitas

• Salah satu asumsi penting dari model regresi linear klasik adalah bahwa
varians dari setiap gangguan jangka usaya, Tergantung pada nilai-nilai yang
dipilih dari variabel penjelas, adalah beberapa nomor konstan sebesar σ2. Ini
adalah asumsi homoscedasticity, atau sama (homo) penyebaran
(Scedasticity), yaitu, varians sama. Secara simbolis,
• eu2saya = σ2 saya = 1, 2, . . .. n
(11.1.1)
• Lihatlah Gambar 11.1. Sebaliknya, perhatikan Gambar 11.2, varians
dariYsaya tidak sama. Oleh karena itu, ada heteroskedastisitas. Secara
simbolis,
• eu2saya = σ2saya
(11.1.2)
• Perhatikan subscript dari σ2, Yang mengingatkan kita bahwa varians
bersyarat dari usaya (= Bersyarat varians Ysaya) Tidak lagi konstan.
• Asumsikan bahwa dalam model dua-variabel Ysaya = β1 + β2Xsaya + usaya . Y
merupakan tabungan dan X merupakan pendapatan. Gambar 11.1 dan 11.2
menunjukkan bahwa dengan meningkatnya pendapatan, penghematan
rata-rata juga meningkat. Tapi pada Gambar 11.1 varians tabungan tetap
sama di semua tingkat pendapatan, sedangkan pada Gambar 11.2
meningkat dengan pendapatan. Tampaknya pada Gambar 11.2
yangkeluarga berpenghasilan lebih tinggi rata-rata menyimpan lebih dari
keluarga berpenghasilan rendah, Namun ada juga lebih variabilitas di
tabungan mereka.

• Ada beberapa alasan mengapa varians dari usaya mungkin variabel,


beberapa di antaranya adalah sebagai berikut.

• 1. Mengikuti model kesalahan-learning, Seperti orang belajar, kesalahan


perilaku mereka menjadi lebih kecil dari waktu ke waktu. Pada kasus
ini,σ2saya diperkirakan menurun. Sebagai contoh, perhatikan Gambar 11.3,
yang berkaitan jumlah kesalahan pengetikan dibuat dalam jangka waktu
tertentu pada tes ke jam dimasukkan ke dalam mengetik praktek.
• 2. Sebagai pendapatan tumbuh, orang memiliki lebih pendapatan
tambahandan ruang lingkup karenanya lebih untuk pilihan tentang
disposisi dari pendapatan mereka. Karenanya,σ2saya cenderung meningkat
dengan pendapatan. Demikian pula, perusahaan dengan keuntungan yang
lebih besar umumnya diharapkan untuk menunjukkan variabilitas yang
lebih besar dalam kebijakan dividen dari perusahaan dengan keuntungan
yang lebih rendah.

• 3. Sebagai pengumpulan data teknik meningkatkan, σ2saya cenderung


menurun. Dengan demikian, bank-bank yang memiliki peralatan
pengolahan data yang canggih cenderung untuk melakukankesalahan yang
lebih sedikit dalam laporan bulanan atau kuartalan dari pelanggan mereka
dari bank tanpa fasilitas tersebut.

• 4. Heteroscedasticity juga dapat timbul sebagai akibat dari kehadiran


outlier, (Sangat kecil atau sangat besar) dalam kaitannya dengan
pengamatan dalam sampel Gambar 11.4. Dimasukkannya atau
pengecualian dari pengamatan tersebut, terutama jika ukuran sampel kecil,
secara substansial dapat mengubah hasil analisis regresi. Chili dapat
• 5. Sumber lain heteroskedastisitas muncul dari melanggar Asumsi 9 dari
CLRM, yaitu, bahwa model regresi ditentukan dengan benar, Sangat sering
apa yang tampak seperti heteroskedastisitas mungkin karena fakta bahwa
beberapa variabel penting dihilangkan dari model. Tetapi jika variabel
dihilangkan termasuk dalam model, yaitu kesan mungkin hilang.

• 6. Sumber lain heteroskedastisitas adalah kecondongandalam distribusi satu


atau lebih regressors termasuk dalam model. Contohnya adalah variabel-
variabel ekonomi seperti pendapatan, kekayaan, dan pendidikan. Hal ini
juga diketahui bahwa distribusi pendapatan dan kekayaan di sebagian
besar masyarakat adalahganjil, Dengan sebagian besar pendapatan dan
kekayaan makhluk dimiliki oleh beberapa di bagian atas.

• 7. Sumber-sumber lain dari heteroskedastisitas: Sebagai catatan David


Hendry, heteroskedastisitas juga dapat timbul karena:
– (1) transformasi data yang tidak benar (Misalnya, rasio atau transformasi
Perbedaan pertama)
– (2) bentuk fungsional yang salah (Model misalnya, linear vs log-linear).
• Perhatikan bahwa masalah heteroskedastisitas cenderung lebih umum di
cross-sectional dari data time series. Dalam data cross-sectional, anggota
mungkin ukuran yang berbeda, seperti kecil, menengah, atau perusahaan
besar atau rendah, sedang, atau berpenghasilan tinggi. Dalam data time
series, di sisi lain, variabel cenderung pesanan yang sama besarnya.
Contohnya adalah GNP, pengeluaran konsumsi, tabungan.
METODE Generalized Least Squares (GLS)

• Jika kamusaya adalah hetroschedastic, β2 tidak lagi terbaik, meskipun masih


berisi. Secara intuitif, kita bisa melihat alasan dari Tabel 11.1. Seperti yang
ditunjukkan tabel, ada variabilitas yang cukup besar dalam pendapatan
antara kelas kerja. Jika kita mundur kompensasi per-karyawan pada
ukuran lapangan kerja, kami ingin memanfaatkan pengetahuan bahwa ada
cukup variabilitas antar kelas laba. Idealnya, kami ingin untuk merancang
skema memperkirakan sedemikian rupa bahwa pengamatan yang berasal
dari populasi dengan variabilitas yang lebih besar diberikan kurang berat
badan dibandingkan mereka yang berasal dari populasi dengan variabilitas
yang lebih kecil. Meneliti Tabel 11.1, kami ingin berat pengamatan yang
berasal dari kelas kerja 10-19 dan 20-49 lebih berat daripada mereka yang
berasal dari kelas kerja seperti 5-9 dan 250-499, untuk mantan yang
berkerumun lebih erat di sekitar nilai rata-rata mereka dari yang terakhir,
varians yang lebih kecil
• Sayangnya, metode OLS biasa tidak mengikuti strategi ini, tetapi metode
estimasi, yang dikenal sebagai umum kuadrat terkecil (GLS), Mengambil
informasi tersebut memperhitungkan secara eksplisit dan karena itu
mampu menghasilkan estimator yang BIRU. Untuk melihat bagaimana hal
ini tercapai, mari kita lanjutkan dengan model dua variabel sekarang-
akrab:
• Ysaya = β1 + β2Xsaya + usaya
(11.3.1)
• yang untuk kemudahan manipulasi aljabar kita tulis sebagai
• Ysaya = β1X0saya + β2Xsaya + usaya
(11.3.2)
• dimana X0saya = 1 untuk setiap saya. Sekarang asumsikan bahwa varians
heteroscedasticσ2saya dikenal. Membagi melalui oleh σsaya untuk
memperoleh:
• Kami menggunakan notasi β*1 dan β*2, Parameter model berubah, untuk
membedakan mereka dari parameter OLS biasa β1 dan β2. Apakah
yangTujuan dari transformasi model asli? Untuk melihat ini, perhatikan
fitur berikut istilah kesalahan berubah:

• yang konstan. Itu adalah,varians dari istilah gangguan berubah u *saya


sekarang homoscedastic.
• Temuan bahwa itu adalah u* Yang homoscedastic menunjukkan bahwa jika
kita menerapkan OLS dengan model berubah (11.3.3) akan menghasilkan
estimator yang BIRU. Prosedur ini mengubah variabel asli sedemikian rupa
bahwa variabel berubah memenuhi asumsi model klasik dan kemudian
menerapkan OLS kepada mereka dikenal sebagaimetode umum kuadrat
(GLS). Pendeknya, GLS adalah OLS pada variabel berubah yang memenuhi
standar kuadrat-asumsi. Estimator yang diperoleh dikenal sebagai GLS
estimator, dan itu adalah estimator ini yang BIRU.
• Sebenarnya mekanika memperkirakan β*1 dan β*2adalah sebagai berikut.
Pertama kita menuliskan SRF dari (11.3.3)
• Ysaya/ σsaya = β*1 X0saya/ σsaya + β*2 Xsaya/ σsaya + uˆsaya/ σsaya
• atau
• Y*saya = β*1X*0saya + β*2X*saya + u*saya
(11.3.6)
• Sekarang, untuk mendapatkan estimator GLS, kita meminimalkan
• Σuˆ2*saya = Σ(Y*saya - β*1X*0saya - β*2X*saya )2
• itu adalah,

• Mekanisme sebenarnya meminimalkan (11.3.7) mengikuti teknik kalkulus


standar GLS estimator β*2 aku s
• dan varians yang diberikan oleh

• dimana wsaya = 1/ σ2saya .


• Perbedaan antara OLS dan GLS
• Ingat dari Bab 3 bahwa dalam OLS kita meminimalkan:
• Σuˆ2saya =Σ(Ysaya - βˆ1 - βˆ2Xsaya)2
(11.3.10)
• tapi di GLS kita meminimalkan ekspresi (11.3.7), yang juga dapat ditulis
sebagai
• Σwsayauˆ2saya = Σwsaya(Ysaya - β*1X0saya - β*2Xsaya)2
(11.3.11)
• dimana wsaya = 1/ σ2saya
• Demikian, di GLS kita meminimalkan jumlah tertimbang kuadrat residual
dengan wsaya = 1/ σ2saya bertindak sebagai beban, tapi di OLS kita
meminimalkan sebuah tertimbang atau (apa sebesar hal yang sama) RSS
berbobot sama.
• Seperti (11.3.7) menunjukkan, di GLS berat ditugaskan untuk setiap
pengamatan berbanding terbalik dengan σ nyasaya , Yaitu, observasi berasal
dari populasi dengan lebih besar σsaya akan mendapatkan relatif lebih kecil
berat badan dan orang-orang dari populasi dengan lebih kecil σsaya akan
mendapatkan secara proporsional berat badan yang lebih besar dalam
meminimalkan RSS (11.3.11).
• Dalam (tertimbang) OLS, masing-masing uˆ2saya terkait dengan poin A, B,
dan C akan menerima berat yang sama dalam meminimalkan RSS. Jelas,
dalam hal iniuˆ2saya terkait dengan titik C akan mendominasi RSS. Namun
dalam GLS pengamatan ekstrimC akan mendapatkan berat badan relatif
lebih kecil dari dua pengamatan lainnya.
• Sejak (11.3.11) meminimalkan RSS tertimbang, itu tepat dikenal sebagai
tertimbang kuadrat (WLS), dan estimator yang diperoleh dan diberikan
dalam (11.3.8) dan (11.3.9) dikenal sebagai estimator WLS. Tapi WLS
hanya kasus khusus dari teknik memperkirakan lebih umum, GLS. Dalam
konteks heteroskedastisitas, seseorang dapat mengobati dua istilah WLS
dan GLS bergantian.
KONSEKUENSI DARI MENGGUNAKAN OLS DI KEHADIRAN
heteroskedastisitas

• Sebagaimana telah kita lihat, baik β*2 dan βˆ2 adalah (linear) berisi
estimator: Dalam pengambilan sampel diulang, rata-rata, β*2 dan βˆ2 akan
sama dengan benar β2; yaitu, mereka berdua berisi estimator. Tapi kita
tahu bahwa itu adalahβ*2yang efisien, yaitu, memiliki varians terkecil. Apa
yang terjadi dengan interval kepercayaan kami, hipotesis pengujian, dan
prosedur lain jika kita terus menggunakan estimator OLSβˆ2? Kami
membedakan dua kasus.

• OLS Estimasi Memungkinkan untuk Heteroscedasticity


• Misalkan kita menggunakan βˆ2dan menggunakan rumus varians yang
diberikan dalam (11.2.2), yang memperhitungkan heteroskedastisitas
eksplisit. Menggunakan varian ini, dan dengan asumsiσ2saya yang dikenal,
bisa kita membangun kepercayaan intervals dan uji hipotesis dengan biasa t
dan F tes? jawabannyaumumnya ada karena dapat ditampilkan var bahwa
(β*2) ≤ var (βˆ2), Yang berarti bahwa interval keyakinan berdasarkan yang
terakhir akan tidak perlu lebih besar. Sebagai hasilnya,t dan F tes cenderung
memberi kita hasil yang tidak akurat.
• OLS Estimasi Mengesampingkan Heteroscedasticity
• Situasi dapat menjadi serius jika kita tidak hanya menggunakan βˆ2 tetapi
juga terus menggunakan biasa rumus (homoscedastic) varians diberikan
dalam (11.2.3) bahkan jika heteroskedastisitas hadir atau dicurigai,
kesimpulan apa pun yang kita menggambar atau kesimpulan yang kita
buat mungkin sangat menyesatkan.
DETEKSI heteroskedastisitas

• Dalam kebanyakan kasus yang melibatkan investigasi ekonometrik,


heteroskedastisitas mungkin masalah intuisi, dugaan berpendidikan,
pengalaman empiris sebelumnya, atau spekulasi belaka. Beberapa metode
informal dan formal digunakan untuk mendeteksi heteroskedastisitas.
Kebanyakan dari metode ini didasarkan padapemeriksaan residual OLS
usaya karena mereka adalah orang-orang yang kita amati, dan bukan
gangguan usaya. Satu harapan bahwa mereka adalah perkiraan yang baik
dariusaya, Harapan yang mungkin terpenuhi jika ukuran sampel cukup
besar.

• Metode Informal
• Sifat Masalah. Sangat sering sifat dari masalah yang sedang
dipertimbangkan menunjukkan apakah heteroskedastisitas adalah
mungkin ditemui. Dalam data cross-sectional yang
melibatkanheterogenunit, heteroskedastisitas mungkin aturan daripada
pengecualian. Dengan demikian, dalam analisis cross-sectional yang
melibatkan pengeluaran investasi dalam kaitannya dengan penjualan, suku
bunga, dll, heteroskedastisitas umumnya diharapkan jika kecil, menengah,
• Metode grafis
• Jika tidak ada apriori atau informasi empiris tentang sifat
heteroskedastisitas, dalam prakteknya satu dapat melakukan analisis
regresi pada asumsi bahwa tidak ada heteroskedastisitas dan kemudian
melakukan pemeriksaan kuadrat residual uˆ2saya untuk melihat apakah
mereka menunjukkan pola yang sistematis.
• Meskipun uˆ2saya tidak sama dengan u2saya . mereka dapat digunakan sebagai
proxyterutama jika ukuran sampel cukup besar. Pemeriksaanuˆ2saya dapat
mengungkapkan pola seperti yang ditunjukkan pada Gambar 11.8. Pada
Gambar 11.8Sebuah kita melihat bahwa tidak ada pola yang sistematis
antara dua variabel, menunjukkan bahwa mungkin ada heteroskedastisitas
hadir dalam data. Gambar 11.8b untuk eNamun, pameran pola yang pasti.
Misalnya, Gambar 11.8c menunjukkan hubungan linear, sedangkan
Gambar 11.8d dan e menunjukkan hubungan kuadrat antara uˆ2saya dan
Yˆsaya. Menggunakan pengetahuan tersebut, meskipun tidak resmi, salah
satu mungkin mengubah data sedemikian rupa bahwa data
ditransformasikan tidak menunjukkan heteroskedastisitas.
• Alih-alih merencanakan uˆ2saya melawan Yˆsaya, Salah satu mungkin plot
mereka terhadap salah satu variabel penjelas Xsaya.
• Pola seperti yang ditunjukkan pada Gambar 11.9c, Misalnya, menunjukkan
bahwa varians dari istilah gangguan adalah linear terkait dengan X
variabel. Dengan demikian, jika dalam regresi tabungan atas penghasilan
orang menemukan pola seperti yang ditunjukkan pada Gambar 11.9c, Ini
menunjukkan bahwa varians heteroscedastic mungkin sebanding dengan
nilai variabel pendapatan. Pengetahuan ini bisa membantu kita dalam
mengubah data kami sedemikian rupa bahwa dalam regresi pada data
ditransformasikan varians gangguan adalah homoscedastic.
• Metode Formal
• Taman Test. Taman menunjukkan bahwa σ2saya beberapa fungsi dari
variabel penjelas Xsaya. Bentuk fungsional ia menyarankan
• σ2saya = σ2Xβsaya evi
• atau
• ln σ2saya = ln σ2 + β ln Xsaya + vsaya
(11.5.1)
• dimana vsaya adalah istilah gangguan stokastik. Sejakσ2saya umumnya tidak
diketahui, Taman menyarankan menggunakan uˆ2saya sebagai proxy dan
menjalankan regresi berikut:
• ln uˆ2saya = ln σ2 + β ln Xsaya + vsaya = α + β ln Xsaya + vsaya
(11.5.2)
• Jika β ternyata menjadi signifikan secara statistik, Itu akan menunjukkan
bahwa heteroskedastisitashadir dalam data. Jika ternyata tidak signifikan,
kita dapat menerima asumsi homoscedasticity. The Park tes adalah
prosedur dua tahap. Pada tahap pertama kita menjalankan regresi OLS
mengabaikan pertanyaan heteroskedastisitas. Kami memperolehuˆsaya dari
• Meskipun secara empiris menarik, tes Park memiliki beberapa masalah.
Goldfeld dan Quandt berpendapat bahwa istilah errorvsaya masuk ke dalam
(11.5.2) mungkin tidak memenuhi asumsi OLS dan mungkin itu sendiri
heteroscedastic.
• CONTOH 11.1 Hubungan antara kompensasi dan produktivitas
• menggunakan data yang diberikan dalam Tabel 11.1 untuk menjalankan
regresi berikut:
• Ysaya = β1 + β2Xsaya + usaya
• dimana Y = Rata-rata kompensasi dalam ribuan dolar, X = Rata-rata
produktivitas dalam ribuan dolar, dan saya = sayathUkuran kerja dari
pembentukan. Itu
• Hasil regresi adalah sebagai berikut:
• Y ˆsaya = 1992.3452 + 0,2329Xsaya
• se = (936.4791) (0,0998) (11.5.3)
• t = (2,1275) (2,333) R2 = 0,4375
• Residual yang diperoleh dari regresi (11.5.3) yang kemunduran pada Xi
seperti yang disarankan dalam Persamaan. (11.5.2), memberikan hasil
sebagai berikut:
• ln uˆ2saya = 35,817-2,8099 ln Xsaya
• se = (38,319) (4,216) (11.5.4)
• t = (0,934) (-0,667) R2 = 0,0595
• Jelas, tidak ada hubungan yang signifikan secara statistik antara dua
variabel. Setelah uji Park, salah satu mungkinmenyimpulkan bahwa tidak
ada heteroskedastisitas di varians error
• Glejser Uji. Memiliki semangat yang sama tes Park. Glejser menunjukkan
kemunduran|uˆsaya| pada X variabel yang diduga berhubungan erat dengan
σ2saya . Dia menggunakan bentuk-bentuk fungsional berikut (vsaya adalah
istilah error)
• CONTOH 11.2 Hubungan Antara Kompensasi dan Produktivitas:
• THE GLEJSER UJI
• Melanjutkan Contoh 11.1, nilai absolut dari residual yang diperoleh dari
regresi (11.5.3) yang kemunduran pada produktivitas rata-rata (X),
Memberikan hasil sebagai berikut:
• |uˆsaya| = 407.2783 - ,0203Xsaya
• se = (633.1621) (0,0675) r2 = 0,0127 (11.5.5)
• t = (0,6432) (-0,3012)
• Seperti yang dapat Anda lihat dari regresi ini, tidak ada hubungan antara
nilai absolut dari residual dan regressors, rata-rata produktivitas. Ini
memperkuat kesimpulan berdasarkan pada tes Park.
• Goldfeld dan Quandt menunjukkan bahwa istilah error vsaya memiliki
beberapa masalah di bahwa yang nilai yang diharapkan adalah nol, Itu serial
berkorelasi dan ironisnya itu heteroscedastic. Kesulitan tambahan dengan
metode Glejser adalah bahwa model seperti

• adalah nonlinear dalam parameter dan karena itu tidak dapat diperkirakan
dengan prosedur OLS biasa.
• Glejser telah menemukan bahwa untuk sampel besarempat pertama dari
model sebelumnya memberikan hasil yang umumnya memuaskan dalam
mendeteksi heteroskedastisitas. Sebagai masalah praktis, oleh karena
itu,teknik Glejser dapat digunakan untuk sampel besar dan dapat digunakan
pada sampel kecil ketat sebagai perangkat kualitatif untuk belajar sesuatu
tentang heteroskedastisitas.
• Spearman Korelasi Rank Test.
• rs = 1 - 6 (Σd2saya/ (N(n2 - 1))) (11.5.6)
• dimana dsaya = Perbedaan di jajaran ditugaskan untuk dua karakteristik
yang berbeda dari sayath individu atau fenomena dan n = Jumlah individu
atau fenomena peringkat. heteroskedastisitas dengan asumsiYsaya = β0 +
β1Xsaya + usaya , aku s
• Langkah 1. Regresi data pada Y dan X dan mendapatkan residual uˆsaya.
• Langkah 2. Peringkat kedua |uˆsaya| danXsaya (atau Yˆsaya) Menurut sebuah
menaik atau menurun dan menghitung rs diberikan sebelumnya.
• Langkah 3. Dengan asumsi bahwa koefisien korelasi peringkat populasiρs
adalah nol dan n> 8, pentingnya sampel rs dapat diuji oleh t tes sebagai
berikut: dengan df = n - 2.

• Jika dihitung t Nilai melebihi kritis t nilai, kita dapat menerimahipotesis


heteroskedastisitas; kalau tidak kita bisa menolaknya.
• Untuk model lebih dari satu X variabel, rs dapat dihitung antara |uˆsaya| dan
masing-masingXsaya dan tes untuk signifikansi oleh t Tes yang diberikan
dalam (11.5.7).
• CONTOH 11.3
• Garis pasar modal (CML) dari teori portofolio mendalilkan hubungan
linear antara return yang diharapkan (Esaya) Dan risiko (yang diukur
dengan standar deviasi, σ ) Dari portofolio sebagai berikut:
• Esaya = βsaya + β2σsaya
• Menggunakan data pada Tabel 11.2, model sebelumnya diperkirakan dan
residual dari model ini dihitung. Karena data berhubungan dengan 10
reksa dana dari ukuran dan tujuan investasi yang berbeda, satu apriori
harapkan heteroskedastisitas. Untuk menguji hipotesis ini, kami
menerapkan uji korelasi rank. Perhitungan yang diperlukan diberikan
dalam Tabel 11.2. Menerapkan rumus (11.5.6), kita memperoleh
• rs = 1 - 6 (110 / (10 (100 - 1)) = 0,3333 (11.5.8)
• menerapkan t Tes yang diberikan dalam (11.5.7), kita memperoleh
• t = (0.3333) (√8) / √1 - 0.1110 = 0,9998 (11.5.9)
• Untuk 8 df ini t nilai tidak signifikan bahkan pada 10%tingkat signifikansi;
itup nilai adalah 0,17. Dengan demikian, tidak ada bukti hubungan
sistematis antara variabel penjelas dan nilai absolut dari residual, yang
mungkin menunjukkan bahwa adaada heteroskedastisitas.
• Goldfeld-Quandt Test.
• Untuk mempermudah, mempertimbangkan dua variabel Model biasa:
• Ysaya = β1 + β2Xsaya + usaya
• Seharusnya σ2saya berhubungan positif dengan Xsaya sebagai:
• σ2saya = σ2X2saya
(11.5.10)
• dimana σ2 adalah konstan.
• Asumsi (11.5.10) mendalilkan bahwa σ2saya sebanding dengan kuadrat dari
X variabel. Jika (11.5.10) yang tepat, itu berartiσ2saya akan lebih besar,
semakin besar nilai-nilai Xsaya. Jika itu ternyata menjadi kasus,
heteroskedastisitas kemungkinan besar akan hadir dalam model. Untuk
menguji ini secara eksplisit, Goldfeld dan Quandt menyarankan langkah-
langkah berikut:
• Langkah 1. Memesan atau peringkat pengamatan sesuai dengan nilai-nilai
Xsaya, Dimulai dengan yang terendah X nilai.
• Langkah 2. Menghilangkan c pengamatan pusat, di mana c ditentukan
apriori, dan membagi sisanya (n - c) pengamatan menjadi dua kelompok
masing-masing (n - c) / 2 pengamatan.
• Langkah 3. Fit OLS terpisah regresi untuk pertama (n - c) / 2 pengamatan
dan yang terakhir (n - c) / 2 pengamatan, dan mendapatkan jumlah sisa
masing-masing kotak RSS1 dan RSS2, RSS1 mewakili RSS dari regresi
sesuai dengan yang lebih kecil Xsaya nilai-nilai (kelompok varians kecil) dan
RSS2 bahwa dari yang lebih besar Xsaya nilai-nilai (kelompok varians besar).
RSS tersebut masing-masing memiliki((C n) / 2) - k atau ((n-c - 2k) / 2) df.
dimana k adalah jumlah parameter yang akan diestimasi, termasuk
mencegat.
• Langkah 4. Menghitung rasio
• λ = RSS2/df / RSS1/df (11.5.11)
• λ dari (11.5.10) mengikuti distribusi F dengan pembilang dan penyebut df
masing-masing (n- c - 2k)/2.
• Jika dalam sebuah aplikasi dihitung λ (= F) Lebih besar dari kritis F pada
tingkat yang dipilih signifikansi, kita dapat menolak hipotesis
homoscedasticity, yaitu, kita dapat mengatakan bahwa heteroskedastisitas
sangat mungkin.
• CONTOH 11.4
• Untuk menggambarkan tes Goldfeld-Quandt, kami sajikan dalam Tabel
11.3 data tentang pengeluaran konsumsi dalam kaitannya dengan
pendapatan untuk penampang 30 keluarga. Misalkan kita mendalilkan
bahwa pengeluaran konsumsi berhubungan linier dengan penghasilan tapi
itu heteroskedastisitas hadir dalam data. Kami selanjutnya mendalilkan
bahwa sifat heteroskedastisitas adalah seperti yang diberikan dalam
(11.5.10). Penataan kembali diperlukan data untuk penerapan tes ini juga
disajikan dalam Tabel 11.3.
• Menjatuhkan tengah 4 pengamatan, regresi OLS berdasarkan pertama 13
dan 13 pengamatan terakhir dan jumlah sisa terkait dari kotak yang seperti
yang ditunjukkan berikutnya (kesalahan standar dalam kurung). Regresi
didasarkan pada 13 pengamatan pertama:
• Yˆsaya = 3,4094 + 0,6968Xsaya
• (8,7049) (0,0744) r2 = 0,8887 RSS1 = 377,17 df = 11
• Regresi didasarkan pada 13 pengamatan terakhir:
• Yˆsaya = - 28,0272 + 0,7941Xi
• (30,6421) (0,1319) r2 = 0,7681 RSS2 = 1536,8 df = 11
• Dari hasil ini kita memperoleh
• λ = (RSS2/df) / (RSS1/df) = (1536.8/11) / (377.17/11)
• λ = 4.07
• kritis F nilai untuk 11 pembilang dan penyebut 11 df di 5 persen tingkat
adalah 2,82. Karena estimasiF (= λ) nilainya melebihi nilai kritis, kita dapat
menyimpulkan bahwa ada heteroskedastisitasdalam varians kesalahan.
Namun, jika tingkat signifikansi adalah tetap pada 1 persen, kita mungkin
tidak menolak asumsi homoscedasticity. Perhatikan bahwaitu p nilai yang
diamati λ adalah 0.014.
• Breusch-Pagan-Godfrey Test. Keberhasilan uji Goldfeld-Quandt tidak hanya
tergantung pada nilai c (Jumlah pengamatan pusat untuk dihilangkan) tetapi
juga pada identifikasi yang benar X variabel yang dapat digunakan untuk
memesan pengamatan. Keterbatasan ini dari tes ini dapat dihindari jika kita
mempertimbangkan Breusch-Pagan-Godfrey (BPG) tes. Untuk
menggambarkan tes ini, mempertimbangkankmodel regresi linier -variable
• Ysaya = β1 + β2X2saya + ·· · +βkXki + usaya
(11.5.12)
• Asumsikan bahwa varians error σ2saya digambarkan sebagai
• σ2saya = f (α1 + α2Z2saya + ·· · +αmZmi)
(11.5.13)
• itu adalah, σ2saya beberapa fungsi dari variabel non-stokastik Z'S; beberapa
atau semuaX'S dapat berfungsi sebagai Z'S. Secara khusus, menganggap
bahwa:
• σ2saya = α1 + α2Z2saya + · +αmZmi (11.5.14)
• itu adalah, σ2saya adalah fungsi linier dari Z'S. Jika α2 = α3 = · = Αm = 0, σ2saya =
α1, Yang merupakan konstan. Oleh karena itu, untuk menguji apakahσ2saya
adalah homoscedastic, Satu dapat menguji hipotesis bahwa α2 = α3 = · = αm =
• Langkah 1. Estimasi (11.5.12) oleh OLS dan mendapatkan residual uˆ1. uˆ2.
. .. uˆn.
• Langkah 2. Memperoleh σ~2 = Σuˆ2saya / n.
• Langkah 3. membangun variabel psaya didefinisikan sebagai
• psaya = uˆ2saya / σ~2
• yang hanya setiap residual kuadrat dibagi dengan σ~2.
• Langkah 4. Regresi psaya pada Z'S sebagai
• psaya = α1 + α2Z2saya + · +αmZmi + vsaya
(11.5.15)
• dimana vsaya adalah istilah residual dari regresi ini.
• Langkah 5. Mendapatkan ESS (menjelaskan jumlah kuadrat) dari (11.5.15)
dan mendefinisikan Θ = 1/2 (ESS)
(11.5.16)
• Asumsi usaya biasanya didistribusikan, seseorang dapat menunjukkan
bahwa jika ada homoscedasticity dan jika ukuran sampel n meningkat
tanpa batas waktu, maka
2
• bahwa berikut chi-square distribusi dengan (m - 1) derajat kebebasan.
• Karena itu, jika dihitung Θ (= Χ2) Melebihi χ kritis2nilai pada tingkat yang
dipilih signifikansi, satu dapat menolak hipotesis dari homoscedasticity;
jika salah satu tidak menolaknya.
• CONTOH 11.5
• THE Breusch-Pagan-GODFREY (BPG) UJI
• Kembali Tabel 11.3. kemunduranY di X, Kita memperoleh berikut:
• Langkah 1. Yˆsaya = 9,2903 + 0,6378Xsaya
• se = (5,2314) (0,0286) (11.5.18)
• RSS = 2361.153 R2 = 0,9466
• Langkah 2. menghitung σ~2 =Σuˆ2saya /30 = 2361.153/30 = 78.7051
• Langkah 3. Bagilah residual kuadrat uˆsaya 2 diperoleh dari regresi (11.5.18)
oleh 78,7051 untuk membangun variabel psaya.
• Langkah 4. Berasumsi bahwa psaya secara linear berhubungan dengan Xsaya
(= Zsaya ) Per (11.5.14), kita memperoleh regresi
• psaya = -0,7426 + 0.0101Xsaya
• se = (0,7529) (0,0041) ESS = 10,4280 R2 = 0,18 (11.5.19)
• Langkah 5. Θ = ½ (ESS) = 5.2140
(11.5.20)
• Di bawah asumsi dari uji BPG di (11.5.20) asimtotik mengikuti distribusi
chisquare dengan 1 df. Sekarang dari tabel chi-square kita menemukan
bahwa untuk 1 df yang5 persen kritis nilai chi-square adalah 3,8414 dan 1
persen kritis χ2 Nilai adalah 6,6349. Dengan demikian, nilai chi-square
diamati dari 5,2140 signifikan pada 5 persen tetapi tidak tingkat 1 persen
signifikansi. Oleh karena itu, kita mencapai kesimpulan yang sama seperti
tes Goldfeld-Quandt. Namun perlu diingat bahwa, tegasnya, tes BPG
adalah asimtotik,atau tes besar sampeldan dalam contoh ini 30 pengamatan
mungkin bukan merupakan sampel yang besar. Hal ini juga harus
menunjukkan bahwa dalam sampel kecil tes ini sensitif terhadap asumsi
bahwa gangguanusaya biasanya didistribusikan. Tentu saja, kita dapat
menguji normalitas asumsi oleh tes dibahas dalam Bab 5.
• White Umum Heteroscedasticity Test. Putih tidak bergantung pada asumsi
normalitas dan mudah diterapkan. Sebagai ilustrasi dari ide dasar,
mempertimbangkan tiga variabel model regresi berikut (generalisasi
kekModel -variable sangat mudah):
• Ysaya = β1 + β2X2saya + β3X3saya + usaya
(11.5.21)
• Tes Putih hasil sebagai berikut:
• Langkah 1. Mengingat data, kami memperkirakan (11.5.21) dan
mendapatkan residual, uˆsaya .
• Langkah 2. Kami kemudian jalankan berikut (bantu) Regresi:
• uˆ2saya = α1 + α2X2saya + α3X3saya + α4X2saya2 + α5X3saya2 + α6X2saya X3saya + vsaya
(11.5.22)
• Perhatikan bahwa ada istilah konstan dalam persamaan ini meskipun
regresi asli mungkin atau mungkin tidak mengandung itu. mendapatkanR2
dari ini (tambahan) regresi.
• Langkah 3. Di bawah hipotesis nol bahwa tidak ada heteroskedastisitas,
dapat ditunjukkan bahwa sampel Ukuran (n) kali R2 diperoleh dari regresi
auxiliary asimtotik mengikuti distribusi chi-kuadrat dengan df sama dengan
jumlah regressors (tidak termasuk istilah konstan) Di regresi tambahan. Itu
adalah,
• n · R2 ~asy χ2 df (11.5.23)
• dimana df adalah seperti yang didefinisikan sebelumnya. Dalam contoh
kita, ada 5 df karena ada 5 regressors dalam regresi tambahan.
• Langkah 4. Jika nilai chi-square diperoleh (11.5.23) melebihi nilai chi-square
kritis pada tingkat yang dipilih signifikansi, kesimpulannya adalah bahwa ada
heteroskedastisitas. Jika tidak melebihi nilai kritis chi-square, tidak ada
heteroskedastisitas, yang mengatakan bahwa dalam regresi auxiliary
(11.5.21),α2 = α3 = α4 = α5 = α6 = 0.
• CONTOH 11.6
• CONTOH Dari data cross-sectional pada 41 negara, Stephen Lewis
memperkirakan model regresi berikut:
• lnYsaya = β1 + β2 ln X2saya + β3 ln X3saya + usaya
(11.5.24)
• dimana
• Y = Rasio pajak perdagangan (impor dan ekspor pajak) terhadap total
pendapatan pemerintah,
• X2 = Rasio jumlah ekspor ditambah impor untuk GNP, dan X3= GNP per
kapita; dan ln singkatan log alami.
• hipotesis yang Y dan X2 akan terkait secara positif (semakin tinggi volume
perdagangan, semakin tinggi penerimaan pajak perdagangan) dan bahwa Y
dan X3 akan menjadi negatif terkait (seperti pendapatan meningkat,
pemerintah menemukan lebih mudah untuk mengumpulkan pajak-
misalnya langsung, pendapatan pajak dari bergantung pada pajak
perdagangan).
• Hasil empiris mendukung hipotesis. Untuk tujuan kita, yang penting adalah
apakah ada heteroskedastisitas dalam data. Karena data cross-sectional
• Dengan menerapkan uji heteroskedastisitas Putih untuk residual yang
diperoleh dari regresi (11.5.24), hasil sebagai berikut diperoleh:
• uˆ2saya = -5,8417 + 2,5629 ln Dagangsaya + 0,6918 ln GNPsaya -0,4081 (Dagang
lnsaya)2 - 0,0491 (ln GNPsaya)2 + 0,0015 (Dagang lnsaya) (Ln GNPsaya) R2
= 0,1148 (11.5.25)

• Sekarang n · R2 = 41 (0.1148) = 4,7068.

• yang memiliki, asimtotik, distribusi chi-square dengan 5 df. The 5 persen


kritis chi-square nilai 5 df adalah11,0705, nilai kritis 10 persen adalah
9,2363, dan nilai kritis 25 persen adalah 6,62568. Untuk semua tujuan
praktis, kita dapat menyimpulkan, atas dasar tes Putih, bahwa tidak ada
heteroskedastisitas.
• Sebuah komentar adalah dalam rangka mengenai tes Putih. Jika model
memiliki beberapa regressors, kemudian memperkenalkan semua
regressors, kuadrat (atau higherpowered) istilah mereka, dan produk lintas
mereka dapat dengan cepat mengkonsumsi derajat kebebasan. Oleh karena
itu, kita harus berhati-hati dalam menggunakan tes.
• Dalam kasus di mana statistik uji Putih diberikan dalam (11.5.25) adalah
signifikan secara statistik, heteroskedastisitas belum tentu menjadi
penyebab, tetapi kesalahan spesifikasi, tentang yang lebih akan dikatakan
dalam Bab 13 (recall angka 5 Bagian 11.1). Dengan kata lain, tes Putih bisa
menjadi ujian (murni) heteroskedastisitas atau kesalahan spesifikasi atau
keduanya. Telah berpendapat bahwa jika tidak ada istilah cross-produk
yang hadir dalam prosedur tes Putih, maka itu adalah ujian
heteroskedastisitas murni. Jika hal cross-produk yang hadir, maka itu
adalah ujian kedua heteroskedastisitas dan spesifikasi bias.29
11,6 langkah-langkah perbaikan

• Sebagaimana telah kita lihat, heteroskedastisitas tidak merusak sifat


unbiasedness dan konsistensi estimator OLS, tetapi mereka tidak lagi
efisien, bahkan tidak asimtotik (yaitu, ukuran sampel yang besar).
Kurangnya efisiensi membuat biasa prosedur pengujian hipotesis nilai
meragukan. Oleh karena itu, langkah-langkah perbaikan dapat disebut
untuk. Ada dua pendekatan untuk remediasi:
• kapan σ2saya adalah dikenal dan ketika σ2saya tidak diketahui.
• Kapan σ2saya Dikenal: Metode Weighted Least Squares
• Sebagaimana telah kita lihat dalam Bagian 11.3, jika σ2saya diketahui,
metode yang paling sederhana mengoreksi heteroskedastisitas adalah
dengan cara tertimbang kuadrat, untuk estimator yang diperoleh adalah
BIRU.
• CONTOH 11,7
• Kapan σi2 Apakah Tidak dikenal
• Seperti disebutkan sebelumnya, jika benar σ2saya diketahui, kita dapat
menggunakan metode WLS untuk mendapatkan estimator BIRU. Karena
benarσ2saya jarang diketahui, apakah ada cara untuk memperoleh konsisten
(Dalam arti statistik) perkiraan varians dan covariances dari OLS
estimator bahkan jika ada heteroskedastisitas? Jawabannya iya.
• White Heteroscedasticity-Konsisten Varians dan Kesalahan Standard. Putih
telah menunjukkan bahwa perkiraan ini dapat dilakukan sehingga
asimtotik valid (yaitu, besar sampel) kesimpulan statistik dapat dibuat
tentang nilai-nilai parameter yang benar. Saat ini, beberapa paket
komputer hadirWhite varians heteroskedastisitas-dikoreksi dan kesalahan
standar bersama dengan OLS varians dan errors.33 standar Kebetulan
biasa, heteroskedastisitas-dikoreksi kesalahan standar White juga dikenal
sebagai kesalahan standar yang kuat.
• CONTOH 11.8
• Sebagai hasil sebelumnya menunjukkan, kesalahan standar
heteroskedastisitas-dikoreksi (White) yang jauh lebih besar dari OLS
kesalahan standar dan oleh karena itu estimasi t nilai-nilai yang jauh lebih
kecil dari yang diperoleh oleh OLS. Atas dasar yang terakhir, baik
regressors secara statistik signifikan pada tingkat 5 persen, sedangkan atas
dasar estimator Putih mereka tidak.
• Namun, harus ditunjukkan bahwa heteroskedastisitas-dikoreksi kesalahan
standar White bisa lebih besar atau lebih kecil dari standar error tidak
dikoreksi.
• Sejak estimator heteroskedastisitas-konsisten White dari varians sekarang
tersedia dalam paket regresi didirikan, dianjurkan bahwa pembaca laporan
mereka. Sebagai Wallace dan Silver catatan:
• Secara umum, itu mungkin ide yang baik untuk menggunakan opsi PUTIH
[program regresi availablein] secara rutin, mungkin membandingkan
output dengan output OLS biasa sebagai cek untuk melihat apakah
heteroskedastisitas adalah masalah serius dalam satu set tertentu data.3
• Asumsi yang masuk akal tentang Pola Heteroscedasticity. Selain menjadi
prosedur besar sampel, salah satu kelemahan dari prosedur Putih adalah
bahwa estimator yang diperoleh mungkin tidak begitu efisien seperti yang
diperoleh dengan metode yang mengubah data untuk mencerminkan jenis
tertentu heteroskedastisitas.
• Untuk menggambarkan hal ini, mari kita kembali ke model regresi dua
variabel:
• Yi = β1 + β2Xi + ui
• Kami sekarang mempertimbangkan beberapa asumsi tentang pola
heteroskedastisitas.
• Asumsi 1: varians error sebanding dengan X 2saya :
• E u2saya = σ2X 2saya (11.6.5) 36
• Jika, sebagai masalah “spekulasi,” metode grafis, atau pendekatan Taman
dan Glejser, diyakini bahwa varians dari ui sebanding dengan kuadrat dari
variabel penjelas X (Lihat Gambar 11.10), salah satu dapat mengubah
model asli sebagai berikut. Bagilah model asli melalui olehXi :
• Yi Xi = β1 Xi + β2 + ui Xi = β1 1 Xi + β2 + vi (11.6.6)
• dimana vi adalah istilah gangguan berubah, sama dengan ui / Xi . Sekarang
mudah untuk memverifikasi bahwa
• Oleh karena itu varian vi sekarang homoscedastic, dan satu dapat
melanjutkan untuk menerapkan OLS untuk persamaan berubah (11.6.6),
regresi Yi / Xi atas 1/ Xi.
• Perhatikan bahwa dalam regresi mengubah jangka intercept β2 adalah
koefisien kemiringan dalam persamaan asli dan koefisien slope β1 adalah
istilah mencegat dalam model asli. Oleh karena itu, untuk kembali ke model
asli kita harus memperbanyak diperkirakan (11.6.6) olehXi. Sebuah
aplikasi dari transformasi ini diberikan dalam latihan 11.20.
• Asumsi 2: The varians error sebanding dengan Xi. Akar kuadrat
transformasi:
• eu 2 saya = σ2Xi (11.6.7)
• Jika diyakini bahwa varians dari ui, Bukannya sebanding dengan kuadrat
Xi, Sebanding dengan Xi itu sendiri, maka model asli dapat diubah sebagai
berikut (lihat Gambar 11.11):
• Yi √Xi = β1 √Xi + β2Xi + ui √Xi = β1 1 √Xi + β2Xi + vi (11.6.8)
• dimana vi = ui /√Xi dan dimana Xi> 0.
• Mengingat asumsi 2, salah satu dapat dengan mudah memverifikasi bahwa
E(v2 saya ) = σ2, situasi homoscedastic. Oleh karena itu, salah satu dapat
melanjutkan untuk menerapkan OLS ke (11.6.8), regresiYi /√Xi atas 1/√Xi
dan √Xi.
• Catatan fitur penting dari model berubah: Tidak memiliki jangka intercept.
Oleh karena itu, salah satu harus menggunakan model regresi-melalui-the-
asal untuk memperkirakanβ1 dan β2. Memiliki run (11.6.8), satu dapat
kembali ke model asli hanya dengan mengalikan (11.6.8) oleh √Xi.
• Asumsi 3: The varians kesalahan adalah sebanding dengan kuadrat dari
nilai rata-rata Y.
• eu2saya = σ2 [E(Yi )] 2 (11.6.9)
• Persamaan (11.6.9) mendalilkan bahwa varians dari ui adalah sebanding
dengan kuadrat dari nilai yang diharapkan dari Y (Lihat Gambar 11.8e).
Sekarang
• E(Yi) = β1 + β2Xi
• Oleh karena itu, jika kita mengubah persamaan asli sebagai berikut,
• Yi E(Yi) = β1 E(Yi) + β2 Xi E(Yi) + ui E(Yi) = β1 1 E(Yi) + β2 Xi E(Yi) + vi
• dimana vi = ui / E(Yi), Dapat dilihat bahwa E(v2saya ) = σ2; yaitu, gangguanvi
adalah homoscedastic. Oleh karena itu, regresi (11.6.10) yang akan memenuhi
asumsi homoskedastisitas dari model regresi linier klasik.
• Transformasi (11.6.10), bagaimanapun, inoperational karena E(Yi) tergantung pada
β1 dan β2, yang tidak diketahui. Tentu saja, kita tahuYˆsaya = β1 + β2Xi , Yang
merupakan estimator dari E(Yi). Oleh karena itu, kita dapat melanjutkan dalam
dua langkah:
• Pertama, kita menjalankan biasa OLS regresi, mengabaikan masalah
heteroskedastisitas, dan memperoleh Yˆi. Kemudian, menggunakan estimasi Yˆsaya,
Kami mengubah model kami sebagai berikut:
• Yi Yˆsaya = β1 1 Yˆsaya + β2 Xi Yˆsaya + vi (11.6.11)
• dimana vi = (ui / Yˆsaya). Pada Langkah 2, kita menjalankan regresi (11.6.11).
MeskipunYˆsaya tidak persis E(Yi), mereka estimator yang konsisten; yaitu, dengan
meningkatnya ukuran sampel tanpa batas waktu, mereka berkumpul untuk benar
E(Yi). Oleh karena itu, transformasi (11.6.11) akan melakukan memuaskan dalam
praktek jika ukuran sampel cukup besar.
• Asumsi 4: Sebuah log transformasi seperti
• lnYi = β1 + β2 ln Xi + ui (11.6.12)
• sangat sering mengurangi heteroskedastisitas jika dibandingkan dengan regresi Yi =
• Hasil ini muncul karena transformasi log kompres timbangan di mana
variabel diukur, sehingga mengurangi perbedaan sepuluh kali lipat antara
dua nilai untuk perbedaan dua kali lipat. Dengan demikian, jumlah 80
adalah 10 kali angka 8, tapi ln 80 (= 4.3280) adalah sekitar dua kali lebih
besar
• ln 8 (= 2.0794).
• Keuntungan tambahan dari transformasi log adalah bahwa koefisien slope
β2 mengukur elastisitas Y dengan hormat X, yaitu, persentase perubahan Y
untuk persentase perubahan X. Sebagai contoh, jikaY adalah konsumsi dan
X adalah pendapatan, β2 di (11.6.12) akan mengukur elastisitas
pendapatan, sedangkan pada model asli β2 hanya mengukur tingkat
perubahan konsumsi rata-rata untuk suatu unit perubahan dalam
pendapatan. Ini adalah salah satu alasan mengapa model log yang cukup
populer di ekonometri empiris. (Untuk beberapa masalah yang terkait
dengan transformasi log, lihat latihan 11.4.)
• Untuk menyimpulkan diskusi kita tentang langkah-langkah perbaikan,
kami menekankan kembali bahwa semua transformasi dibahas sebelumnya
adalah ad hoc; kita pada dasarnya berspekulasi tentang sifatσ2 saya .
Manakah dari transformasi dibahas sebelumnya akan bekerja akan
tergantung pada sifat masalah dan tingkat keparahan heteroskedastisitas.
• 1. Ketika kita melampaui model dua variabel, kita mungkin tidak tahu
apriori yang mana dari X variabel harus dipilih untuk mengubah data.37
yang
• 2. Masuk transformasi seperti yang dibahas di Asumsi 4 tidak berlaku jika
beberapa Y dan X nilai-nilai nol atau negative.38
• 3. Lalu ada masalah korelasi palsu. Istilah ini, karena Karl Pearson,
mengacu pada situasi di mana korelasi ditemukan untuk hadir antara rasio
variabel meskipun variabel asli tidak berkorelasi atau random.39 demikian,
dalam modelYi = β1+ β2Xi + ui . Y dan X mungkin tidak berkorelasi tetapi
dalam model berubah Yi / Xi = β1 (1/ Xi) + β2, Yi / Xi dan 1/ Xi sering
ditemukan berkorelasi.
• 4. Ketika σ2saya tidak langsung diketahui dan diperkirakan dari satu atau
lebih dari transformasi yang telah kita bahas sebelumnya, semua prosedur
pengujian kami menggunakan t tes, F tes, dll, ketat berbicara hanya berlaku
dalam sampel yang besar. Oleh karena itu, kita harus berhati-hati dalam
menafsirkan hasil berdasarkan berbagai transformasi dalam samples.40
kecil atau terbatas
• Apa yang terjadi dengan OLS estimator dan varians mereka jika kami
memperkenalkan heteroskedastisitas dengan membiarkan E(u2saya ) = σ2saya
tapi mempertahankan semua asumsi lain dari model klasik? Mari kita
kembali ke model dua variabel:
• Ysaya = β1 + β2Xsaya + usaya
• Menerapkan rumus biasa, OLS estimator β2 aku s

• namun varian yang sekarang diberikan oleh ekspresi berikut:


• yang jelas berbeda dari yang biasa rumus varians diperoleh berdasarkan asumsi
homoscedasticity, yaitu,

• Tentu saja jika σ2saya = σ2 untuk setiap saya, Dua rumus akan sama. ingat
bahwaβ2 yang terbaik adalah linear berisi estimator (BLUE) jika asumsi model
klasik, termasuk homoscedasticity, tahan. Apakah masih BIRU ketika kita
menjatuhkan hanya asumsi homoskedastisitas dan menggantinya dengan asumsi
heteroskedastisitas? Sangat mudah untuk membuktikan bahwaβ2 masih linear dan
berisi. Sebagai soal fakta, seperti yang ditunjukkan dalam Lampiran 3A, Bagian
3A.2, untuk mendirikan unbiasedness dariβ2 tidak perlu bahwa gangguan (ui)
Menjadi homoscedastic. Bahkan, variansiui , Homoscedastic atau heteroscedastic,
tidak memainkan bagian dalam penentuan properti unbiasedness.
• Ingat bahwa dalam Lampiran 3A, Bagian 3A.7, kami menunjukkan bahwa β2
adalah estimator yang konsisten di bawah asumsi dari model regresi linier klasik.
Meskipun kami tidak akan membuktikannya, dapat ditunjukkan bahwaβ2 adalah
estimator yang konsisten meskipun heteroskedastisitas; yaitu, dengan meningkatnya
ukuran sampel tanpa batas waktu, perkiraanβ2 konvergen ke nilai yang
sebenarnya. Selain itu juga dapat menunjukkan bahwa dalam kondisi tertentu
(disebut kondisi keteraturan),β2 adalah asimtotik terdistribusi normal. Tentu saja,
apa yang kita telah mengatakan tentangβ2 juga berlaku parameter lain dari model
regresi berganda.
• Memang bahwa β2 masih linear berisi dan konsisten, itu “efisien” atau
“terbaik”; yaitu, apakah itu memiliki varians minimum di kelas berisi
penduga? Dan adalah bahwa varians minimum yang diberikan oleh
Persamaan. (11.2.2)? Jawabannya adalahtidak untuk kedua pertanyaan: β2
tidak lagi terbaik dan varians minimum tidak diberikan oleh (11.2.2). Lalu
apa BLUE di hadapan heteroskedastisitas? Jawabannya diberikan dalam
bagian berikut.
• Untuk membuang lebih banyak cahaya pada topik ini, kami mengacu pada
studi Monte Carlo dilakukan oleh Davidson dan MacKinnon. Mereka
menganggap model sederhana berikut, yang dalam notasi kami adalah
• Ysaya = β1 + β2Xsaya + usaya
(11.4.1)
• Mereka menganggap bahwa β1 = 1, β2 = 1, dan usaya ~ N(0, Xαi ). Sebagai
ekspresi terakhir menunjukkan, mereka menganggap bahwa varians
kesalahan heteroscedastic dan berkaitan dengan nilai regressor yangX
dengan kekuatan α. Jika, misalnya,α = 1, varians error sebanding dengan
nilai X; jikaα = 2, varians kesalahan sebanding dengan kuadrat dari nilai X,
dan seterusnya. Dalam Bagian 11.6 kita akan mempertimbangkan logika di
balik prosedur tersebut. Berdasarkan 20.000 ulangan dan memungkinkan
untuk berbagai nilai untukα, Mereka mendapatkan kesalahan standar dari
dua koefisien regresi menggunakan OLS [lihat Persamaan. (11.2.3)], OLS
memungkinkan untuk heteroskedastisitas [lihat Persamaan. (11.2.2)], dan
GLS [lihat Persamaan. (11.3.9)]. Kami mengutip hasil mereka untuk nilai-
nilai yang dipilih dariα:
• Fitur yang paling mencolok dari hasil ini adalah bahwa OLS, dengan atau tanpa
koreksi untuk heteroskedastisitas, konsisten overestimates standard error yang benar
diperoleh dengan prosedur GLS (benar), terutama untuk nilai-nilai besar α. sehingga
membentuk keunggulan GLS. Hasil ini juga menunjukkan bahwa jika kita tidak
menggunakan GLS dan bergantung pada OLS-memungkinkan untuk atau tidak
memungkinkan untuk heteroscedasticity- gambar dicampur. OLS biasa kesalahan
standar yang baik terlalu besar (untuk mencegat) atau terlalu kecil (untuk koefisien
slope) dalam kaitannya dengan yang diperoleh oleh OLS memungkinkan untuk
heteroskedastisitas. Pesan ini sangat jelas: Di hadapan heteroskedastisitas,
menggunakan GLS. Namun, untuk alasan dijelaskan nanti dalam bab ini, dalam
prakteknya tidak selalu mudah untuk menerapkan GLS.
• Juga, seperti yang kita bahas nanti, kecuali heteroskedastisitas sangat parah,
seseorang mungkin tidak meninggalkan OLS mendukung GLS atau WLS. Dari
pembahasan sebelumnya jelaslah bahwaheteroskedastisitas berpotensi masalah
serius dan peneliti perlu tahu apakah itu hadir dalam situasi tertentu. Jika
kehadirannya terdeteksi, maka salah satu dapat mengambil tindakan korektif,
seperti menggunakan tertimbang kuadrat-regresi atau beberapa teknik lainnya.
Sebelum kita beralih ke memeriksa berbagai prosedur korektif, bagaimanapun, kita
harus terlebih dahulu mencari tahu apakah heteroskedastisitas hadir atau
kemungkinan akan hadir dalam kasus tertentu. Topik ini dibahas dalam bagian
• Catatan Teknis
• Meskipun kami telah menyatakan bahwa, dalam kasus-kasus
heteroskedastisitas, itu adalah GLS, bukan OLS, yaitu BIRU, ada contoh di
mana OLS dapat BIRU, meskipun heteroscedasticity.8 Tapi contoh tersebut
jarang terjadi dalam praktek.