Anda di halaman 1dari 47

Bab 11

Heteroskedastisitas:
Apa Yang Terjadi Jika
Varians Kesalahan
Tidak konstan?
Asumsi penting dari model regresi linier klasik (Asumsi 4) adalah itu
gangguan u saya muncul dalam fungsi regresi populasi yang homoscedastic; artinya, semuanya memiliki varian
yang sama. Dalam bab ini kami memeriksa validitas asumsi ini-
dan cari tahu apa yang terjadi jika asumsi ini tidak dipenuhi. Seperti di Bab 10, kami mencari jawaban atas
pertanyaan-pertanyaan berikut:

1. Bagaimana sifat heteroskedastisitas?


2. Apa konsekuensinya?
3. Bagaimana seseorang mendeteksinya?

4. Apa tindakan perbaikannya?

11.1 Sifat Heteroskedastisitas


Seperti disebutkan dalam Bab 3, salah satu asumsi penting dari regresi linier klasik
model adalah varian dari setiap istilah gangguan u saya, tergantung pada nilai yang dipilih dari variabel penjelas,
adalah beberapa bilangan konstan sama dengan σ 2. Ini adalah asumsi-
tion dari homoskedastisitas, atau sama ( homo) sebaran ( skedastisitas), yaitu, varian yang sama.
Secara simbolis,
()
E u 2i = σ 2 i = 1, 2,. . . , n (11.1.1)

Secara diagramatik, dalam model regresi dua variabel, homoskedastisitas dapat ditunjukkan seperti pada Gambar 3.4, yang,
untuk memudahkan, direproduksi seperti Gambar 11.1. Seperti Gambar 11.1
menunjukkan, varian bersyarat dari Y saya ( yang sama dengan u i), bergantung pada yang diberikan X saya, tetap
sama terlepas dari nilai yang diambil oleh variabel X.
Sebaliknya, perhatikan Gambar 11.2, yang menunjukkan bahwa varians bersyarat Y saya
meningkat sebagai X meningkat. Di sini, varian dari Y saya tidak sama. Oleh karena itu, terjadi heteroskedastisitas. Secara
simbolis,
()
E u 2i = σ 2 saya
(11.1.2)

365
366 Bagian kedua Melonggarkan Asumsi Model Klasik

GAMBAR 11.1
Homoskedastik
gangguan.

Tabungan Y

Massa jenis
β 1 + β β 2 X saya

Pend
apata
n X

GAMBAR 11.2
Heteroskedastik
gangguan.

Tabungan Y
Massa jenis

β β 1 +ββ2 X saya

Pend
apata
n
X

Perhatikan subskrip σ 2, yang mengingatkan kita bahwa varians bersyarat u saya


(= varians bersyarat dari Y i) tidak lagi konstan.
Untuk membuat perbedaan antara homoskedastisitas dan heteroskedastisitas jelas, asumsikan
bahwa dalam model dua variabel Y i = β 1 + β 2 X i + u saya, Y mewakili tabungan dan X mewakili pendapatan. Gambar 11.1 dan 11.2
menunjukkan bahwa dengan meningkatnya pendapatan, tabungan juga rata-rata
meningkatkan. Namun pada Gambar 11.1 varians tabungan tetap sama di semua tingkat pendapatan, sedangkan pada Gambar 11.2

varians meningkat seiring dengan pendapatan. Tampaknya pada Gambar 11.2, keluarga berpenghasilan tinggi rata-rata menabung
lebih banyak daripada keluarga berpenghasilan rendah, tetapi ada juga lebih banyak variabilitas dalam tabungan mereka.

Ada beberapa alasan mengapa varians u saya mungkin variabel, beberapa di antaranya adalah sebagai berikut. 1

1. Mengikuti model pembelajaran kesalahan, sebagai orang belajar, kesalahan perilaku mereka menjadi

lebih kecil dari waktu ke waktu atau jumlah kesalahan menjadi lebih konsisten. Pada kasus ini, σ 2 saya adalah

diperkirakan akan menurun. Sebagai contoh, perhatikan Gambar 11.3, yang menghubungkan jumlah kesalahan pengetikan yang
dilakukan dalam periode waktu tertentu dalam ujian dengan jam yang digunakan dalam praktik mengetik. Seperti yang ditunjukkan
Gambar 11.3, saat jumlah jam praktik mengetik meningkat, jumlah rata-rata kesalahan pengetikan serta variansnya menurun.

2. Saat pendapatan tumbuh, orang memiliki lebih banyak pendapatan diskresioner 2 dan karenanya lebih banyak ruang lingkup

untuk pilihan tentang disposisi pendapatan mereka. Karenanya, σ 2 saya cenderung meningkat dengan

1 Lihat Stefan Valavanis, Ekonometrika, McGraw-Hill, New York, 1959, hal. 48.

2 Seperti yang dikatakan Valavanis, “Pendapatan tumbuh, dan orang-orang sekarang hampir tidak dapat membedakan dolar sedangkan sebelumnya mereka melihat

uang receh, '' ibid., Hal. 48.


Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 367

GAMBAR 11.3
Ilustrasi
heteroskedastisitas.

n
pengetika Y
Kesalahan

Massa jenis
Jam
latih
an m
enge β β 1 + β β 2 X saya
tik

pendapatan. Jadi, dalam regresi tabungan atas pendapatan, orang mungkin akan menemukannya σ 2 saya meningkat

dengan pendapatan (seperti pada Gambar 11.2) karena masyarakat memiliki lebih banyak pilihan tentang perilaku menabung mereka.

Demikian pula, perusahaan dengan laba lebih besar umumnya diharapkan menunjukkan variabilitas yang lebih besar dalam kebijakan

dividen mereka daripada perusahaan dengan laba lebih rendah. Juga, berorientasi pada pertumbuhan perusahaan cenderung

menunjukkan lebih banyak variabilitas dalam rasio pembayaran dividen mereka daripada perusahaan mapan.

3. Seiring dengan peningkatan teknik pengumpulan data, σ 2 saya cenderung menurun. Jadi, bank yang punya
peralatan pemrosesan data yang canggih cenderung melakukan lebih sedikit kesalahan dalam laporan bulanan atau
triwulanan pelanggan mereka daripada bank tanpa fasilitas tersebut.

4. Heteroskedastisitas juga bisa timbul sebagai akibat adanya pencilan. Pengamatan terluar, atau pencilan,
adalah pengamatan yang jauh berbeda (baik sangat kecil atau sangat besar) dalam kaitannya dengan pengamatan
dalam sampel. Lebih tepatnya, pencilan adalah pengamatan dari populasi yang berbeda yang menghasilkan
pengamatan sampel yang tersisa. 3

Dimasukkan atau dikeluarkannya observasi semacam itu, terutama jika ukuran sampelnya kecil, secara substansial
dapat mengubah hasil analisis regresi.
Sebagai contoh, perhatikan sebar yang diberikan pada Gambar 11.4. Berdasarkan data yang diberikan dalam Tabel 11.9
dalam Latihan 11.22, angka ini memplot tingkat persentase perubahan harga saham ( Y) dan harga konsumen ( X) untuk periode
pasca-Perang Dunia II hingga 1969 untuk 20 negara. Dalam gambar ini, pengamatan tentang Y dan X untuk Chile bisa dianggap
sebagai outlier karena diberikan Y
dan X nilainya jauh lebih besar daripada negara-negara lain. Dalam situasi seperti ini, asumsi
homoskedastisitas akan sulit dipertahankan. Dalam Latihan 11.22, Anda diminta untuk mencari tahu apa
yang terjadi pada hasil regresi jika observasi untuk Chili dikeluarkan dari analisis.

5. Sumber heteroskedastisitas lain muncul dari pelanggaran Asumsi 9 klasifikasi


cal linear regression model (CLRM), yaitu model regresi ditentukan dengan benar. Meskipun kita akan membahas topik
kesalahan spesifikasi lebih lengkap dalam Bab 13, seringkali apa yang tampak seperti heteroskedastisitas mungkin
disebabkan oleh fakta bahwa beberapa variabel penting dihilangkan dari model. Jadi, dalam fungsi permintaan untuk
suatu komoditas, jika kita tidak memasukkan harga komoditas yang melengkapi atau bersaing dengan komoditas yang
dimaksud (bias variabel yang dihilangkan), residu yang diperoleh dari regresi dapat memberikan kesan yang berbeda
bahwa kesalahan varians mungkin tidak konstan. Tetapi jika variabel yang dihilangkan disertakan dalam model, kesan
itu mungkin hilang.

3 Saya berhutang budi kepada Michael McAleer karena telah menunjukkan hal ini kepada saya.
368 Bagian kedua Melonggarkan Asumsi Model Klasik

GAMBAR 11.4
25
Hubungan
antara harga saham Chile
dan harga konsumen.
15

10

5
Harga saham (% perubahan)

1
1 2 3 4 5 6 7 8 9 10 26

Harga konsumen (% perubahan)

Sebagai contoh konkret, ingat kembali studi kami tentang tayangan iklan yang dipertahankan ( Y) dalam kaitannya dengan

pengeluaran iklan ( X). ( Lihat Latihan 8.32.) Jika Anda mengalami kemunduran Y di X hanya dan mengamati residual dari regresi ini,

Anda akan melihat satu pola, tetapi jika Anda mengalami regresi Y di X

dan X 2, Anda akan melihat pola lain, yang dapat dilihat dengan jelas dari Gambar 11.5. Kami telah melihat itu X 2 termasuk
dalam model. (Lihat Latihan 8.32.)

6. Sumber heteroskedastisitas lainnya adalah kecondongan dalam distribusi satu atau lebih regressor yang termasuk
dalam model. Contohnya adalah variabel ekonomi seperti pendapatan, kekayaan, dan pendidikan. Diketahui bahwa distribusi
pendapatan dan kekayaan di sebagian besar masyarakat tidak merata, dengan sebagian besar pendapatan dan kekayaan
dimiliki oleh beberapa orang di atas.

7. Sumber lain heteroskedastisitas: Seperti yang dicatat oleh David Hendry, heteroskedastisitas bisa
juga muncul karena (1) transformasi data yang salah (misalnya, rasio atau transformasi perbedaan pertama) dan (2) bentuk
fungsional yang salah (misalnya, model linier versus model log-linier). 4

GAMBAR 11.5 60 40
Sisa dari
40
regresi
20
( Sebuah) tayangan
20
iklan
pengeluaran dan 0 0

( b) kesan pada
- 20
Adexp dan Adexp 2. - 20
- 40

- 60 - 40
2 4 6 8 10 12 14 16 18 20 22 2 4 6 8 10 12 14 16 18 20 22

( Sebuah) ( b)

4 David F. Hendry, Ekonometrika Dinamis, Oxford University Press, 1995, hal. 45.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 369

Perhatikan bahwa masalah heteroskedastisitas cenderung lebih sering terjadi pada cross-sectional daripada pada data deret
waktu. Dalam data cross-sectional, seseorang biasanya berurusan dengan anggota populasi pada titik waktu tertentu, seperti
konsumen individu atau keluarganya, perusahaan, industri, atau subdivisi geografis seperti negara bagian, negara, kota, dll. Selain
itu, anggota ini mungkin memiliki ukuran yang berbeda, seperti perusahaan kecil, sedang, atau besar atau perusahaan
berpenghasilan rendah, sedang, atau tinggi. Di sisi lain, dalam data deret waktu, variabel cenderung memiliki urutan besaran yang
serupa karena seseorang biasanya mengumpulkan data untuk entitas yang sama selama periode waktu tertentu. Contohnya
adalah produk nasional bruto (GNP), pengeluaran konsumsi, tabungan, atau pekerjaan di Amerika Serikat, katakanlah, untuk
periode 1955–2005.

Sebagai ilustrasi heteroskedastisitas yang mungkin ditemui dalam analisis cross-sectional, perhatikan Tabel 11.1. Tabel ini
memberikan data tentang kompensasi per karyawan di 10 industri manufaktur barang tidak tahan lama, yang diklasifikasikan
menurut ukuran lapangan kerja perusahaan atau pendirian untuk tahun 1958. Juga diberikan dalam tabel tersebut adalah angka
produktivitas rata-rata untuk sembilan kelas pekerjaan.

Meskipun industri memiliki komposisi output yang berbeda, Tabel 11.1 menunjukkan dengan jelas bahwa rata-rata perusahaan

besar membayar lebih banyak daripada perusahaan kecil. Sebagai contoh, perusahaan yang mempekerjakan satu sampai empat

karyawan membayar rata-rata sekitar $ 3.396, sedangkan perusahaan yang mempekerjakan 1.000 untuk
Rata-rata 2.499 karyawan digaji sekitar $ 4.843. Tetapi perhatikan bahwa ada variabilitas pendapatan yang cukup besar
di antara berbagai kelas pekerjaan seperti yang ditunjukkan oleh estimasi

TABEL 11.1 Kompensasi per Karyawan ($) di Industri Manufaktur Tidak Tahan Lama Menurut Ketenagakerjaan
Ukuran Pendirian, 1958

Ukuran Pekerjaan (jumlah rata-rata karyawan)

Industri 1–4 5–9 10–19 20–49 50–99 100–249 250–499 500–999 1.000–2.499

Makanan dan kerabat

produk 2.994 3.295 3.565 3.907 4.189 4.486 4.676 4.968 5.342
Produk tembakau 1.721 2.057 3.336 3.320 2.980 2.848 3.072 2.969 3.822
Pabrik tekstil
produk 3.600 3.657 3.674 3.437 3,340 3.334 3.225 3.163 3.168
Pakaian dan
Produk-produk terkait 3.494 3.787 3.533 3.215 3.030 2.834 2.750 2.967 3.453
Kertas dan sekutu
produk 3.498 3.847 3.913 4.135 4.445 4.885 5.132 5.342 5,326
Mencetak dan
penerbitan 3.611 4.206 4.695 5.083 5.301 5.269 5.182 5.395 5.552
Bahan kimia dan
produk terkait 3.875 4.660 4.930 5,005 5.114 5.248 5.630 5.870 5.876
Minyak bumi dan
produk batubara 4.616 5.181 5,317 5.337 5,421 5.710 6,316 6.455 6.347
Karet dan
produk plastik 3.538 3.984 4.014 4.287 4.221 4.539 4.721 4.905 5,481
Kulit dan
produk kulit 3.016 3.196 3.149 3.317 3.414 3.254 3.177 3.346 4.067
Rata-rata
kompensasi 3.396 3.787 4.013 4.104 4.146 4.241 4.388 4.538 4.843
Simpangan baku 742.2 851.4 727.8 805.06 929.9 1.080.6 1.241.2 1.307.7 1.110.7
Rata-rata
produktifitas 9.355 8.584 7.962 8.275 8.389 9.418 9.795 10.281 11.750

Sumber: Sensus Produsen, Departemen Perdagangan AS, 1958 (dihitung oleh penulis).
370 Bagian kedua Melonggarkan Asumsi Model Klasik

GAMBAR 11.6 1400


Simpangan baku dari
kompensasi dan
berarti kompensasi.
1200

1000

800

Simpangan baku

600
3000 3500 4000 4500 5.000

Kompensasi yang berarti

deviasi standar pendapatan. Hal ini dapat dilihat juga dari Gambar 11.6 yang memplotkan deviasi
standar kompensasi dan kompensasi rata-rata di setiap kelas pekerjaan. Seperti yang terlihat jelas,
rata-rata deviasi standar kompensasi meningkat dengan nilai rata-rata kompensasi.

11.2 Estimasi OLS dengan adanya Heteroskedastisitas


Apa yang terjadi pada penaksir kuadrat terkecil biasa (OLS) dan variansinya jika kita
mengurangi heteroskedastisitas dengan membiarkan E (ui)2= σ 2 saya tetapi pertahankan semua asumsi lain dari kelas-
model sical? Untuk menjawab pertanyaan ini, mari kita kembali ke model dua variabel:

Y i = β 1 + β 2 X i + u saya

Menerapkan rumus biasa, OLS ∑ penduga dari β 2 adalah

βˆ 2 = ∑ x saya y saya
saya
∑ x2 ∑
X saya Y saya - ∑ Y saya
=n∑ ∑ X saya (11.2.1)
n X 2saya - ( X 2i)

tetapi variansnya sekarang diberikan oleh berikut ini ∑ ekspresi g (lihat Lampiran 11A, Bagian 11A.1):

2
x2
var ( β̂ 2) = ( ∑ saya σ) saya (11.2.2)
x saya
22

yang jelas berbeda dari rumus varians biasa yang diperoleh dengan asumsi homoskedastisitas, yaitu,

σ2
var ( β̂ 2) = ∑ (11.2.3)
x saya
2
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 371

Tentu saja jika σ 2 i = σ 2 untuk setiap saya, kedua rumus tersebut akan sama. (Mengapa?)
Ingat itu β̂ 2 adalah estimator tak bias linier (BLUE) terbaik jika asumsi model klasik, termasuk
homoskedastisitas, berlaku. Apakah masih BIRU ketika kita hanya menjatuhkan
asumsi homoskedastisitas dan menggantinya dengan asumsi heteroskedastisitas? ini
mudah untuk membuktikannya β̂ 2 masih linier dan tidak bias. Faktanya, seperti yang ditunjukkan dalam Lampiran 3A,
Bagian 3A.2, untuk menetapkan ketidakberpihakan β̂ 2 tidak perlu gangguan itu
( u saya) menjadi homoscedastic. Faktanya, varian u saya, homoscedastic atau heteroscedastic, tidak berperan dalam
penentuan properti tidak bias. Ingatlah bahwa dalam Lampiran 3A, Bagian-
bagian 3A.7, kami menunjukkan itu β̂ 2 adalah penduga yang konsisten dengan asumsi klasik
model regresi linier Meskipun kami tidak akan membuktikannya, hal itu dapat ditunjukkan β̂ 2 adalah penduga yang konsisten
meskipun ada heteroskedastisitas; yaitu, karena ukuran sampel meningkat tanpa batas,
perkiraan β 2 menyatu dengan nilai aslinya. Selain itu, dapat juga ditunjukkan bahwa dalam kondisi tertentu
(disebut kondisi keteraturan), β̂ 2 adalah terdistribusi normal tanpa gejala.
Tentu saja, apa yang telah kami katakan β̂ 2 juga berlaku untuk parameter lain dari model regresi berganda.

Memang benar β̂ 2 masih linier tidak bias dan konsisten, apakah itu "efisien" atau "terbaik"? Artinya, apakah ia
memiliki varian minimum di kelas penduga yang tidak bias? Dan seminimal itu
varians yang diberikan oleh Persamaan. (11.2.2)? Jawabannya adalah tidak untuk kedua pertanyaan tersebut: β̂ 2 tidak lagi terbaik dan

varian minimum tidak diberikan oleh Persamaan. (11.2.2). Lalu apa yang BIRU di hadapannya

heteroskedastisitas? Jawabannya diberikan di bagian berikut.

11.3 Metode Generalized Least Squares (GLS)


Mengapa penaksir OLS biasa β 2 diberikan dalam Persamaan. (11.2.1) bukan yang terbaik, meskipun masih tidak bias? Secara intuitif
kita dapat melihat alasannya dari Tabel 11.1. Seperti yang ditunjukkan tabel, ada pertimbangan-

variabilitas pendapatan yang jelas di antara kelas-kelas pekerjaan. Jika kami menurunkan kompensasi per karyawan
pada ukuran pekerjaan, kami ingin menggunakan pengetahuan bahwa ada cukup banyak variabilitas antar kelas dalam
pendapatan. Idealnya, kami ingin merancang skema estimasi sedemikian rupa sehingga pengamatan yang berasal dari
populasi dengan variabilitas lebih besar diberi bobot lebih sedikit daripada yang berasal dari populasi dengan
variabilitas lebih kecil. Meninjau Tabel 11.1, kami ingin membobotkan pengamatan yang berasal dari kelas pekerjaan
10–19 dan 20–49 lebih banyak daripada yang berasal dari kelas pekerjaan seperti 5–9 dan 250–499, karena yang
pertama lebih dekat berkerumun di sekitar nilai rata-rata mereka daripada yang terakhir, sehingga memungkinkan kita
untuk memperkirakan fungsi regresi populasi (PRF) dengan lebih akurat.

Sayangnya, metode OLS biasa tidak mengikuti strategi ini dan oleh karena itu tidak menggunakan "informasi" yang
terkandung dalam variabilitas variabel dependen yang tidak sama. Y, katakanlah, kompensasi karyawan pada Tabel 11.1:
Ini memberikan bobot atau kepentingan yang sama untuk setiap observasi. Tetapi metode estimasi, yang dikenal sebagai kuadrat
terkecil umum (GLS), mempertimbangkan informasi tersebut secara eksplisit dan oleh karena itu mampu menghasilkan
penduga yang BIRU. Untuk melihat bagaimana ini dicapai, mari kita lanjutkan dengan model dua variabel yang sekarang
sudah dikenal:

Y i = β 1 + β 2 X i + u saya (11.3.1)

yang untuk kemudahan manipulasi aljabar kami tulis sebagai

Y i = β 1 X 0 i + β 2 X i + u saya (11.3.2)

dimana X 0 i = 1 untuk masing-masing saya. Pembaca dapat melihat bahwa kedua formulasi ini identik.
372 Bagian kedua Melonggarkan Asumsi Model Klasik

Sekarang asumsikan bahwa varians heteroskedastis σ 2 saya adalah dikenal. Bagi Persamaan. (11.3.2)
melalui oleh σ saya untuk memperoleh
( ) () ()
Yi=β1 X 0 saya X saya u saya
+ β2 + (11.3.3)
σ saya σ saya σ saya σ saya

yang untuk kemudahan eksposisi kami tulis sebagai

Y i∗= β ∗ 1 X ∗0 i + β ∗ 2 X ∗i + u ∗ saya
(11.3.4)

di mana variabel yang dibintangi, atau diubah, adalah variabel asli dibagi dengan (yang diketahui)
σ i. Kami menggunakan notasi β ∗ 1 dan β∗ 2, parameter model yang ditransformasikan, untuk membedakan
mereka dari parameter OLS biasa β 1 dan β 2.
Apa tujuan mengubah model aslinya? Untuk melihat ini, perhatikan berikut-
ing fitur dari te kesalahan yang ditransformasikan (rm u ∗ saya:

) 2
u saya
var ( u ∗i) = E (u ∗ i) 2 = E sejak E (u ∗ i)= 0
σ saya

= 1 () E u 2saya s ince σ 2 saya dikenal (11.3.5)


σ saya
2

()
= 1 () saya
sejak E u 2 i = σ 2 saya
σ saya
2σ2

=1

yang merupakan konstanta. Artinya, varian dari suku gangguan yang ditransformasikan u ∗ saya sekarang ho-
moscedastic. Karena kita masih mempertahankan asumsi lain dari model klasik, maka itulah yang ditemukan u ∗ Artinya
homoscedastic menunjukkan bahwa jika kita menerapkan OLS ke transformasi
model (11.3.3) ini akan menghasilkan penduga yang BIRU. Singkatnya, perkiraan β ∗ 1 dan β∗ 2
sekarang BIRU dan bukan penaksir OLS β̂ 1 dan β̂ 2.
Prosedur ini mengubah variabel asli sedemikian rupa sehingga ditransformasikan
variabel memenuhi asumsi model klasik dan kemudian menerapkan OLS ke mereka dikenal sebagai
metode kuadrat terkecil umum (GLS). Singkatnya, GLS adalah OLS pada variabel yang diubah yang
memenuhi asumsi kuadrat terkecil standar. Estimator yang diperoleh dikenal sebagai Penduga GLS, dan
penduga inilah yang BIRU.
Mekanika estimasi yang sebenarnya β ∗ 1 dan β∗ 2 adalah sebagai berikut. Pertama, kami menuliskan
fungsi regresi sampel (SRF) o (Persamaan f.) (11.3.3) () ()

Y i = β̂ ∗ X 0 saya û saya
1
+ β̂ ∗2X saya +
σ saya σ saya σ saya σ saya

atau

∗∗ ∗ ∗
Y i∗= β̂ 1 X 0 i + 2 β̂ ∗ X i + û saya (11.3.6)

Sekarang, untuk mendapatkan GLS es ∑


pengatur waktu, w
e meminimalkan

û i2=∗ ∗ - β 1ˆX∗ 0∗saya - 2


( Ysaya β̂ ∗ X i)∗ 2

itu adalah,

() ( ) ()] 2
∑ () 2 = û saya ∑[ Y saya saya
- β̂ ∗ X 10 saya - β̂ ∗ X
2
(11.3.7)
σ saya σ saya σ saya σ saya
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 373

Mekanika sebenarnya meminimalkan Persamaan. (11.3.7) mengikuti teknik kalkulus standar


dan diberikan dalam Lampiran 11A, Bagian 11A.2. Seperti yang ditunjukkan di sana, penduga GLS β ∗ 2 adalah

(∑) (∑ ) (∑ ) (∑ )
w ( saya ∑ w X saya Y saya -) ( ∑ w saya X saya w saya Y saya
β̂ 2∗ = ) ( saya ∑ )2 (11.3.8)
w saya w 2saya X saya - w saya X saya

dan variansnya diberikan oleh


w) saya ( ∑
var ( β̂ ∗2) = ( ∑) (∑ )2 (11.3.9)
w saya w saya Xsaya
2
- w saya X saya

dimana w i = 1 / σ 2 i.

Perbedaan antara OLS dan GLS


Ingat dari Bab 3 bahwa dalam ∑ OLS kami ∑
memperkecil

û 2i = ( Y saya - βˆ 1 - β̂ 2 X i) 2 (11.3.10)

tetapi di GLS kami meminimalkan ekspresi (11.3.7), yang juga bisa ditulis sebagai

∑ ∑
w saya ( Y saya - ˆβ 1 X 0 saya - β̂ ∗ 2 X 2 i)

w 2saya û i = (11.3.11)

dimana w i = 1 / σ 2 saya ( memverifikasi Persamaan itu. [11.3.11] dan Persamaan. [11.3.7] identik).
Jadi, dalam GLS kami meminimalkan a jumlah tertimbang kotak sisa dengan w i = 1 / σ 2 saya akting

sebagai bobot, tetapi di OLS kami meminimalkan jumlah kuadrat (RSS) yang tidak tertimbang atau (yang jumlahnya
sama). Sebagai Persamaan. (11.3.7) menunjukkan, di GLS beratnya
ditugaskan untuk setiap pengamatan berbanding terbalik dengan nya σ saya, Artinya, observasi yang berasal dari populasi dengan jumlah
yang lebih besar σ saya akan mendapatkan bobot yang relatif lebih kecil dan dari

populasi dengan lebih kecil σ saya akan mendapatkan bobot yang lebih besar secara proporsional dalam meminimalkan RSS (11.3.11).

Untuk melihat perbedaan antara OLS dan GLS dengan jelas, pertimbangkan hipotesis-

Scattergram ical diberikan pada Gambar 11.7.

Di OLS (tidak tertimbang), masing-masing û 2 saya terkait dengan poin A, B, dan C akan menerima
bobot yang sama dalam meminimalkan RSS. Jelas, dalam hal ini file û 2 saya terkait dengan titik C
akan mendominasi RSS. Tapi di GLS observasi ekstrim C akan mendapatkan bobot yang relatif lebih kecil dibandingkan
dua pengamatan lainnya. Seperti disebutkan sebelumnya, ini adalah strategi yang tepat, karena dalam mengestimasi
fungsi regresi populasi (PRF) secara lebih andal, kami ingin memberikan bobot lebih pada pengamatan yang berkerumun
dekat di sekitar rata-rata (populasi) mereka daripada yang tersebar luas.

Sejak Persamaan. (11.3.11) meminimalkan RSS berbobot, yang dikenal sebagai kotak terkecil tertimbang (WLS), dan
penduga sehingga diperoleh dan diberikan dalam Persamaan. (11.3.8) dan (11.3.9) dikenal sebagai Estimator WLS. ButWLS
hanyalah kasus khusus dari teknik estimasi yang lebih umum, GLS. Dalam konteks heteroskedastisitas, kita dapat
memperlakukan dua istilah WLS dan GLS secara bergantian. Di bab-bab selanjutnya kita akan menemukan kasus khusus GLS
lainnya.
Secara sepintas, perhatikan bahwa jika w i = w, sebuah konstanta untuk semua saya, β̂ ∗
2 identik dengan β̂ 2 dan var ( β̂ ∗ 2)
identik dengan biasa (yaitu, homoscedastic) var ( β̂ 2) diberikan dalam Persamaan. (11.2.3), yang seharusnya tidak mengherankan.
(Mengapa?) (Lihat Latihan 11.8.)
374 Bagian kedua Melonggarkan Asumsi Model Klasik

GAMBAR 11.7 Y
Hipotetis
C
scattergram.

Y i = β 1 + β 2 X saya
u

SEBUAH u
kamu { B

X
0

11.4 Konsekuensi Penggunaan OLS dengan


Heteroskedastisitas
Seperti yang telah kita lihat, keduanya β̂ ∗
2 dan β̂ 2 adalah penduga (linier) yang tidak bias: Dalam pengambilan sampel berulang, aktif

rata-rata, β̂ ∗ 2 dan β̂ 2 akan sama dengan yang sebenarnya β 2; artinya, keduanya adalah penduga yang tidak bias. Tapi

kami tahu itu β̂ ∗ 2 yang efisien, yaitu memiliki varian terkecil. Apa yang terjadi pada kami
interval kepercayaan, pengujian hipotesis, dan prosedur lain jika kita terus menggunakan OLS
penduga β̂ 2? Kami membedakan dua kasus.

Estimasi OLS yang Memungkinkan adanya Heteroskedastisitas


Misalkan kita gunakan β̂ 2 dan gunakan rumus varians yang diberikan dalam Persamaan. (11.2.2), yang memperhitungkan
memperhitungkan heteroskedastisitas secara eksplisit. Menggunakan varians ini, dan dengan asumsi σ 2 saya diketahui, bisa
kami menetapkan interval kepercayaan dan menguji hipotesis dengan biasa t dan F tes? Itu
jawaban umumnya tidak karena dapat ditunjukkan bahwa var ( β̂ ∗ 2) ≤ var ( β̂ 2), 5 yang artinya
interval kepercayaan yang didasarkan pada yang terakhir tidak perlu lebih besar. Akibatnya, file t dan F
tes cenderung memberi kami hasil yang tidak akurat di var itu ( β̂ 2) terlalu besar dan apa yang tampak sebagai koefisien yang
secara statistik tidak signifikan (karena t nilainya lebih kecil dari yang sebenarnya
sesuai) sebenarnya mungkin menjadi signifikan jika interval kepercayaan yang benar ditetapkan atas dasar
prosedur GLS.

Estimasi OLS Dengan Mengabaikan Heteroskedastisitas


Situasi bisa menjadi serius jika kita tidak hanya menggunakan β̂ 2 tetapi juga terus menggunakan rumus varian biasa (homoscedastic)
yang diberikan dalam Persamaan. (11.2.3) bahkan jika ada heteroskedastisitas
atau dicurigai: Perhatikan bahwa ini adalah kasus yang lebih mungkin dari dua yang kita diskusikan di sini, karena
menjalankan paket regresi OLS standar dan mengabaikan (atau mengabaikan)
heteroskedastisitas akan menghasilkan varians β̂ 2 seperti yang diberikan dalam Persamaan. (11.2.3). Pertama-tama, var ( β̂ 2)

diberikan dalam Persamaan. (11.2.3) adalah a bias penduga dari var ( β̂ 2) diberikan dalam Persamaan. (11.2.2), yaitu di

5 Bukti resmi dapat ditemukan di Phoebus J. Dhrymes, Ekonometrika Pengantar, Springer-Verlag,

New York, 1978, hlm. 110–111. Secara sepintas, perhatikan bahwa hilangnya efisiensi β̂ 2 ( yaitu, seberapa banyak
var [ β̂ 2] melebihi var [ β̂ ∗ 2]) tergantung pada nilai sampel dari X variabel dan nilai σ 2 i.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 375

rata-rata itu melebih-lebihkan atau meremehkan yang terakhir, dan secara umum kita tidak bisa membedakan apakah
biasnya positif (overestimation) atau negatif (underestimation) karena tergantung
sifat hubungan antara σ 2 saya dan v alues diambil oleh variabel penjelas
X, seperti dapat dilihat dengan jelas dari Persamaan. (11.2.2) (lihat Exer ∑ cise 11.9). Bias muncul dari fakta
bahwa σ̂ 2, penaksir konvensional σ 2, yaitu, û 2i / ( n - 2) tidak lagi berisi
penduga yang terakhir ketika ada heteroskedastisitas (lihat Lampiran 11A.3). Akibatnya, kita tidak dapat lagi mengandalkan
interval kepercayaan yang dihitung secara konvensional dan yang digunakan secara konvensional t dan F tes. 6 Singkatnya, jika
kita tetap menggunakan prosedur pengujian biasa meskipun ada heteroskedastisitas, kesimpulan apa pun yang kita tarik
atau kesimpulan yang kita buat mungkin sangat menyesatkan.

Untuk menjelaskan lebih lanjut tentang topik ini, kami mengacu pada a Monte Carlo studi yang dilakukan oleh Davidson dan

MacKinnon. 7 Mereka menganggap model sederhana berikut, yang dalam notasi kami adalah

Y i = β 1 + β 2 X i + u saya (11.4.1)

Mereka berasumsi demikian β 1 = 1, β 2 = 1, dan u saya ∼ N ( 0, X α i). Seperti yang ditunjukkan ekspresi terakhir, mereka
berasumsi bahwa varian kesalahan adalah heteroskedastis dan terkait dengan nilai regressor X
dengan kekuatan α. Jika, misalnya, α = 1, varian kesalahan sebanding dengan nilai X; jika
α = 2, varian kesalahan sebanding dengan kuadrat dari nilai X, dan seterusnya. Pada Bagian 11.6 kita akan membahas logika di
balik prosedur semacam itu. Berdasarkan 20.000 ulangan dan memungkinkan berbagai nilai untuk α, mereka memperoleh
kesalahan standar dari dua koefisien regresi menggunakan OLS (lihat Persamaan [11.2.3]), OLS memungkinkan untuk
heteroskedastisitas (lihat Persamaan [11.2.2]), dan GLS (lihat Persamaan [11.3.9]) . Kami mengutip hasil mereka untuk nilai yang
dipilih dari α:

Kesalahan standar saya 1 Kesalahan standar saya 2

Nilai dari SEBUAH OLS OLS dia T GLS OLS OLS dia T GLS

0,5 0,164 0.134 0.110 0.285 0,277 0.243


1.0 0.142 0.101 0,048 0.246 0.247 0.173
2.0 0.116 0,074 0,0073 0,200 0.220 0.109
3.0 0.100 0,064 0,0013 0.173 0.206 0,056
4.0 0,089 0,059 0,0003 0.154 0.195 0,017

catatan: OLS dia T artinya OLS memungkinkan terjadinya heteroskedastisitas.

Fitur yang paling mencolok dari hasil ini adalah bahwa OLS, dengan atau tanpa koreksi untuk heteroskedastisitas, secara
konsisten melebih-lebihkan kesalahan standar yang sebenarnya yang diperoleh oleh prosedur GLS (benar), terutama untuk
nilai-nilai besar dari α, sehingga membangun keunggulan GLS.
Hasil ini juga menunjukkan bahwa jika kita tidak menggunakan GLS dan bergantung pada OLS — mengizinkan atau tidak mengizinkan
heteroskedastisitas — gambar akan tercampur. Kesalahan standar OLS biasa terlalu besar (untuk intersep) atau umumnya terlalu kecil
(untuk koefisien kemiringan) dalam kaitannya dengan yang diperoleh oleh OLS memungkinkan terjadinya heteroskedastisitas.
Pesannya jelas: Jika ada heteroskedastisitas, gunakan GLS. Namun, untuk alasan yang akan dijelaskan nanti di bab ini, dalam
praktiknya tidak selalu mudah untuk menerapkan GLS. Juga, seperti yang akan kita bahas nanti, kecuali heteroskedastisitas sangat
parah, seseorang tidak boleh meninggalkan OLS demi GLS atau WLS.

Dari pembahasan sebelumnya, jelas bahwa heteroskedastisitas berpotensi menjadi masalah yang serius dan peneliti
perlu mengetahui apakah heteroskedastisitas ada dalam situasi tertentu. Jika itu

6 Dari Persamaan. (5.3.6) kita tahu bahwa 100 (1 - α)% interval kepercayaan untuk β 2 adalah [ β ˆ 2 ± t α / 2 se ( β̂ 2)]. Tapi

jika se ( βˆ2) tidak dapat diperkirakan tanpa bias, kepercayaan apa yang dapat kita berikan pada interval kepercayaan yang dihitung secara konvensional?

7 Russell Davidson dan James G. MacKinnon, Estimasi dan Inferensi dalam Ekonometrika, Oxford University Press, New

York, 1993, hlm. 549–550.


376 Bagian kedua Melonggarkan Asumsi Model Klasik

kehadiran terdeteksi, kemudian seseorang dapat mengambil tindakan korektif, seperti menggunakan regresi weighted
leastsquares atau beberapa teknik lainnya. Namun, sebelum kita beralih ke pemeriksaan berbagai prosedur korektif, kita
harus terlebih dahulu menemukan apakah ada heteroskedastisitas atau kemungkinan ada dalam kasus tertentu. Topik ini
dibahas di bagian berikut.

Catatan Teknis
Meskipun kami telah menyatakan bahwa, dalam kasus heteroskedastisitas, GLS-nya, bukan OLS, yang BIRU, ada contoh
di mana OLS bisa menjadi BIRU, meskipun ada heteroskedastisitas. 8 Tetapi contoh seperti itu jarang dalam praktiknya.

11.5 Deteksi Heteroskedastisitas


Seperti multikolinearitas, pertanyaan praktis yang penting adalah: Bagaimana seseorang mengetahui bahwa heteroskedastisitas
hadir dalam situasi tertentu? Sekali lagi, seperti dalam kasus multikolinearitas, tidak ada aturan yang tegas untuk mendeteksi
heteroskedastisitas, hanya beberapa aturan ibu jari. Tapi
situasi ini tidak bisa dihindari karena σ 2 saya dapat diketahui hanya jika kita memiliki keseluruhannya Y populasi
sesuai dengan yang dipilih X seperti populasi yang ditunjukkan pada Tabel 2.1 atau Tabel 11.1. Tetapi data semacam
itu adalah pengecualian daripada aturan di sebagian besar investigasi ekonomi. Dalam hal ini ahli ekonometri berbeda
dengan ilmuwan di bidang seperti pertanian dan biologi, di mana peneliti memiliki banyak kendali atas subjek mereka.
Lebih sering daripada tidak, dalam studi ekonomi hanya ada satu sampel Y nilai yang sesuai dengan nilai tertentu X.

Dan tidak mungkin ada yang tahu σ 2 saya dari satu Y pengamatan. Oleh karena itu, dalam banyak kasus

melibatkan penyelidikan ekonometrik, heteroskedastisitas mungkin merupakan masalah intuisi, tebakan terpelajar,
pengalaman empiris sebelumnya, atau spekulasi belaka.
Dengan mengingat peringatan sebelumnya, mari kita periksa beberapa metode informal dan formal untuk mendeteksi
heteroskedastisitas. Seperti pembahasan berikut akan mengungkapkan, sebagian besar
metode ini didasarkan pada pemeriksaan sisa OLS û saya karena merekalah orangnya
kami mengamati, dan bukan gangguannya u i. Satu harapan bahwa itu adalah perkiraan yang baik u saya, harapan yang mungkin
terpenuhi jika ukuran sampel cukup besar.

Metode Informal
Sifat Masalah
Seringkali sifat masalah yang dipertimbangkan menunjukkan apakah heteroskedastisitas kemungkinan besar akan
ditemui. Misalnya, mengikuti karya perintis Prais dan Houthakker pada studi anggaran keluarga, di mana mereka
menemukan bahwa varian sisa di sekitar regresi konsumsi pendapatan meningkat dengan pendapatan, orang sekarang
umumnya mengasumsikan bahwa dalam survei serupa seseorang dapat mengharapkan perbedaan yang tidak setara di
antara gangguan . 9

Faktanya, dalam data cross-sectional yang melibatkan unit-unit heterogen, heteroskedastisitas mungkin menjadi aturan daripada
pengecualian. Jadi, dalam analisis cross-sectional yang melibatkan pengeluaran investasi dalam kaitannya dengan penjualan,
tingkat bunga, dll., Heteroskedastisitas umumnya diharapkan jika perusahaan berukuran kecil, menengah, dan besar dijadikan
sampel bersama.

8 Alasan untuk ini adalah bahwa teorema Gauss-Markov memberikan kondisi yang cukup (tapi tidak perlu) agar OLS menjadi efisien.

Kondisi yang diperlukan dan mencukupi untuk OLS menjadi BIRU diberikan oleh
Teorema Kruskal. Namun topik ini berada di luar cakupan buku ini. Saya berhutang budi kepada Michael McAleer karena memberitahukan hal
ini kepada saya. Untuk detail lebih lanjut, lihat Denzil G. Fiebig, Michael McAleer, dan Robert Bartels, "Properties of Ordinary Least Squares
Estimators dalam Model Regresi dengan Gangguan Nonspherical", Jurnal Ekonometrika, vol. 54, No. 1–3, Okt. – Des., 1992, hlm. 321–334.
Untuk siswa yang cenderung matematis, saya membahas topik ini lebih lanjut Lampiran C, menggunakan aljabar matriks.

9 SJ Prais dan HS Houthakker, Analisis Anggaran Keluarga, Cambridge University Press, New York, 1955.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 377

Faktanya, kami telah menemukan contohnya. Dalam Bab 2 kita membahas hubungan antara upah
rata-rata, atau rata-rata, per jam dalam kaitannya dengan tahun sekolah di Amerika Serikat. Dalam bab itu
kita juga membahas hubungan antara pengeluaran untuk makanan dan total pengeluaran untuk 55 keluarga
di India (lihat Latihan 11.16).

Metode Grafis
Jika tidak ada informasi apriori atau empiris tentang sifat heteroskedastisitas, dalam prakteknya dapat
dilakukan analisis regresi dengan asumsi tidak ada heteroskedastisitas.
ticity kemudian dilakukan pemeriksaan postmortem terhadap sisa kuadrat û 2 saya untuk melihat apakah mereka memamerkan
pola sistematis apa pun. Meskipun û 2 sama dengan u 2
saya tidak saya, mereka dapat digunakan sebagai prox-
terutama jika ukuran sampel cukup besar. 10 Pemeriksaan û 2 saya mungkin mengungkapkan
pola seperti yang ditunjukkan pada Gambar 11.8.
Pada Gambar 11.8, û 2 saya diplot melawan Ŷ saya, perkiraan Y saya dari garis regresi, idenya
sedang untuk mengetahui apakah perkiraan nilai rata-rata Y secara sistematis terkait dengan sisa kuadrat. Pada Gambar
11.8 Sebuah kami melihat bahwa tidak ada pola sistematis antara kedua variabel, menunjukkan bahwa mungkin tidak ada
heteroskedastisitas dalam data. Angka 11.8 b
untuk e, namun, menunjukkan pola yang pasti. Misalnya, Gambar 11.8 c menyarankan hubungan linier-
kapal, sedangkan Gambar 11.8 d dan e menunjukkan hubungan kuadrat antara û 2 saya dan Ŷ i. Menggunakan
pengetahuan semacam itu, meskipun informal, seseorang dapat mengubah data sedemikian rupa sehingga data yang

ditransformasikan tidak menunjukkan heteroskedastisitas. Dalam Bagian 11.6 kita akan memeriksa beberapa transformasi seperti itu.

Alih-alih merencanakan û 2 saya melawan Ŷ saya, seseorang dapat memplotnya dengan salah satu penjelasan
variabel, terutama jika merencanakan û 2 saya melawan Ŷ saya menghasilkan pola yang ditunjukkan pada Gambar 11.8 Sebuah.
Plot seperti itu, yang ditunjukkan pada Gambar 11.9, dapat mengungkapkan pola yang serupa dengan yang diberikan pada

Gambar 11.8. (Dalam kasus model dua-variabel, membuat plot û 2 saya melawan Ŷ saya setara dengan

GAMBAR 11.8 u2 u2 u2
Pola hipotetis
dari perkiraan kuadrat
residu.

Y Y Y
0 0 0
( Sebuah) ( b) ( c)

u2 u2

Y Y
0 0
( d) ( e)

10 Untuk hubungan antar û saya dan u saya, lihat E. Malinvaud, Metode Statistik Ekonometrika, North Holland Publishing Company,

Amsterdam, 1970, hlm. 88–89.


378 Bagian kedua Melonggarkan Asumsi Model Klasik

GAMBAR 11.9 u2 u2 u2
Scattergram dari
perkiraan kuadrat
residu terhadap X.

X X X
0 0 0
( Sebuah) ( b) ( c)

u2 u2

X X
0 0
( d) ( e)

merencanakannya melawan X saya, dan oleh karena itu Gambar 11.9 mirip dengan Gambar 11.8. Tapi ini bukanlah situasi ketika kita
mempertimbangkan model yang melibatkan dua atau lebih X variabel; dalam hal ini, û 2
saya

dapat diplot terhadap apa pun X variabel yang termasuk dalam model.)
Pola seperti yang ditunjukkan pada Gambar 11.9 c, misalnya, menunjukkan bahwa varians dari suku gangguan
berhubungan secara linier dengan X variabel. Jadi, jika dalam regresi tabungan atas pendapatan ditemukan pola seperti
yang ditunjukkan pada Gambar 11.9 c, itu menunjukkan bahwa varians heteroskedastis mungkin sebanding dengan nilai
variabel pendapatan. Pengetahuan ini dapat membantu kita dalam mentransformasikan data kita sedemikian rupa
sehingga dalam regresi pada data yang ditransformasi varians gangguannya homoscedastic. Kita akan kembali ke topik ini
di bagian selanjutnya.

Metode Formal
Tes Taman 11

Park memformalkan metode grafis dengan menyarankan itu σ 2 saya adalah beberapa fungsi dari
variabel penjelas X i. Bentuk fungsional yang dia sarankan adalah

σ i2= σ 2 X β saya e vi

atau

ln σ 2i = ln σ 2 + β ln X i + v saya (11.5.1)

dimana v saya adalah istilah gangguan stokastik.

11 RE Park, “Estimation with Heteroscedastic Error Terms, '' Econometrica, vol. 34, tidak. 4, Oktober

1966, hal. 888. Uji Park adalah kasus khusus dari uji umum yang diajukan oleh AC Harvey dalam "Estimasi Model Regresi
dengan Heteroskedastisitas Multiplikatif, '' Econometrica, vol. 44, tidak. 3,
1976, hlm. 461–465.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 379

Sejak σ 2 saya umumnya tidak diketahui, Park menyarankan untuk menggunakan û 2 saya sebagai proxy dan menjalankan
regresi berikut:

ln û 2i = ln σ 2 + β ln X i + v saya
(11.5.2)
= +α β ln X i + v saya

Jika β ternyata signifikan secara statistik, itu akan menunjukkan bahwa heteroskedastisitas hadir dalam data. Jika
ternyata tidak signifikan, kita boleh menerima asumsi homoskedastisitas. Tes Park dengan demikian merupakan
prosedur dua tahap. Pada tahap pertama kami menjalankan
Regresi OLS mengabaikan pertanyaan heteroskedastisitas. Kami mendapatkan û saya dari regresi ini, kemudian pada
tahap kedua kita menjalankan regresi (11.5.2).
Meskipun menarik secara empiris, uji Park memiliki beberapa masalah. Goldfeld dan Quandt
berpendapat bahwa istilah kesalahan v saya masuk ke Persamaan. (11.5.2) mungkin tidak memenuhi asumsi OLS dan mungkin
heteroskedastis. 12 Meskipun demikian, sebagai metode eksplorasi yang ketat, satu
dapat menggunakan tes Park.

CONTOH 11.1 Untuk mengilustrasikan pendekatan Taman, kami menggunakan data yang diberikan pada Tabel 11.1 untuk menjalankan regresi berikut:

Hubungan
antara Y i = β 1 + β 2 X i + u saya
Kompensasi dimana Y = kompensasi rata-rata dalam ribuan dolar, X = produktivitas rata-rata dalam ribuan dolar, dan i = i ukuran
dan Produktivitas lapangan kerja perusahaan. Hasil regresi adalah sebagai berikut:

Ŷ i = 1992.3452 + 0.2329 X saya


se = (936,4791) (0,0998) (11.5.3)
t= (2.1275) (2.333) R 2 = 0.4375

Hasilnya menunjukkan bahwa koefisien kemiringan yang diperkirakan signifikan pada tingkat 5 persen berdasarkan satu sisi. t uji.
Persamaan tersebut menunjukkan bahwa ketika produktivitas tenaga kerja meningkat, katakanlah, satu dolar, kompensasi tenaga
kerja meningkat rata-rata sekitar 23 sen.
Residual yang diperoleh dari regresi (11.5.3) kemudian diregresikan X saya seperti yang disarankan dalam Persamaan. (11.5.2),
memberikan hasil sebagai berikut:

l n̂̂ û 2i = 35.817 - 2.8099 ln X saya

se = (38,319) (4.216) (11.5.4)

t = ( 0,934) ( - 0,667) R 2 = 0.0595

Jelas, tidak ada hubungan yang signifikan secara statistik antara kedua variabel. Setelah uji Park, seseorang
dapat menyimpulkan bahwa tidak ada heteroskedastisitas dalam varian kesalahan. 13

Tes Glejser 14
Tes Glejser memiliki semangat yang mirip dengan tes Park. Setelah mendapatkan residu û saya dari regresi OLS,
Glejser menyarankan regresi nilai absolut û saya di X variabel itu

12 Stephen M. Goldfeld dan Richard E. Quandt, Metode Nonlinier dalam Ekonometrika, North Holland Publishing Company,

Amsterdam, 1972, hlm. 93–94.


13 Bentuk fungsional tertentu yang dipilih oleh Park hanya bersifat sugestif. Bentuk fungsional yang berbeda mungkin terungkap

hubungan yang signifikan. Misalnya, seseorang dapat menggunakan û 2


saya bukannya ln û 2 saya sebagai variabel terikat.
14 H. Glejser, "Tes Baru untuk Heteroskedastisitas, '' Jurnal Asosiasi Statistik Amerika, vol. 64,

1969, hlm. 316–323.


380 Bagian kedua Melonggarkan Asumsi Model Klasik

dianggap terkait erat dengan σ 2 i. Dalam eksperimennya, Glejser menggunakan yang berikut ini
bentuk fungsional:

| û i | = β 1 + β 2 √ | ûX ii +| =v saya
β 1 + β 2 X i + v saya

1 + v saya
| û i | = β 1 + β 2 X saya

1+v
| ûi|= β1+β2 √ saya
X saya

| û i | = √ β 1 + β 2 X i + v saya

| ûi|= β1+β2 X2 i + v saya

dimana v saya adalah istilah kesalahan.

Sekali lagi sebagai masalah empiris atau praktis, seseorang dapat menggunakan pendekatan Glejser. Tapi Emas-

feld dan Quandt menunjukkan bahwa istilah kesalahan v saya memiliki beberapa masalah di mana nilai yang diharapkan adalah
bukan nol, itu berkorelasi serial (lihat Bab 12), dan, ironisnya, itu adalah het-
eroscedastic. 15 Perbedaan tambahan √ lty dengan metode Glejser adalah model seperti

| û i | = β 1 + β 2 X i + v saya

dan

| ûi|= β1+β2 X2 i + v saya

tidak linier dalam parameter dan oleh karena itu tidak dapat diperkirakan dengan prosedur OLS biasa.

Glejser telah menemukan bahwa untuk sampel yang besar, empat model pertama dari model sebelumnya secara umum

memberikan hasil yang memuaskan dalam mendeteksi heteroskedastisitas. Oleh karena itu, sebagai masalah praktis, teknik Glejser

dapat digunakan untuk sampel besar dan dapat digunakan dalam sampel kecil secara ketat sebagai perangkat kualitatif untuk
mempelajari sesuatu tentang heteroskedastisitas.

CONTOH 11.2 Melanjutkan dengan Contoh 11.1, nilai absolut dari residu yang diperoleh dari regresi (11.5.3) diregresikan
Hubungan pada produktivitas rata-rata ( X), memberikan hasil sebagai berikut:

antara | û̂̂ i | = 407.2783 - 0,0203 X saya

Kompensasi se = (633.1621) (0,0675) r 2 = 0,0127 (11.5.5)


dan Produktivitas: t= (0,6432) ( - 0,3012)
Tes Glejser
Seperti yang dapat Anda lihat dari regresi ini, tidak ada hubungan antara nilai absolut residual dan regressor,
produktivitas rata-rata. Ini memperkuat kesimpulan berdasarkan uji Taman.

Uji Korelasi Peringkat Spearman


Dalam Latihan 3.8 kita mendefinisikan ra [nk] Spearman ∑ korelat] koefisien ion sebagai

d saya
2
rs=1 - 6 (11.5.6)
n (n 2 - 1)

15 Untuk detailnya, lihat Goldfeld dan Quandt, op. cit., Bab 3.


Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 381

dimana d i = perbedaan peringkat yang diberikan untuk dua karakteristik berbeda dari saya individu atau fenomena
dan n = jumlah individu atau peringkat fenomena. Sebelumnya-
Koefisien korelasi rank dapat digunakan untuk mendeteksi heteroskedastisitas sebagai berikut: Asumsikan
Y i = β 0 + β 1 X i + u i.

Langkah 1. Paskan regresi ke data di Y dan X dan dapatkan residu û i.


Langkah 2. Mengabaikan tanda û saya, yaitu, mengambil nilai absolutnya | û i |, peringkat keduanya | û i |

dan X saya ( atau Ŷ i) menurut urutan naik atau turun dan menghitung koefisien korelasi peringkat Spearman
yang diberikan sebelumnya.
LANGKAH 3. Dengan asumsi bahwa koefisien korelasi peringkat populasi ρ s adalah nol dan
n> 8, pentingnya sampel r s dapat diuji oleh t tes sebagai berikut: 16

sn -2
t=r√ (11.5.7)
1 - r2 s

dengan df = n - 2.

Jika dihitung t nilai melebihi kritis t nilai, kami dapat menerima hipotesis heteroskedastisitas; jika tidak,
kami dapat menolaknya. Jika model regresi melibatkan lebih dari
satu X variabel, r s dapat dihitung antara | û i | dan masing-masing X variabel secara terpisah dan dapat diuji untuk signifikansi statistik
oleh t tes yang diberikan dalam Persamaan. (11.5.7).

CONTOH 11.3 Untuk menggambarkan uji korelasi peringkat, pertimbangkan data yang diberikan pada Tabel 11.2. Data tersebut berkaitan dengan

Ilustrasi dari pengembalian tahunan rata-rata ( E,%) dan deviasi standar pengembalian tahunan
( σ i,%) dari 10 reksa dana.
Korelasi Peringkat
Uji

TABEL 11.2 Uji Korelasi Rank Heteroskedastisitas

E saya, σ saya, d,
Rata-rata Standar Perbedaan
Tahunan Deviasi | ûi|‡ antara
Nama dari Kembali, Tahunan Residu, Pangkat Pangkat Dua
Reksa Dana % Kembali,% Ê saya

| ( E saya - Ê i) | dari | û i | dari σ saya Peringkat d2

Dana Boston 12.4 12.1 11.37 1.03 9 4 5 25


Delaware Fund 14.4 21.4 15.64 1.24 10 9 1 1
Dana Ekuitas 14.6 18.7 14.40 0.20 4 7 -3 9
Investor Fundamental 16.0 21.7 15.78 0.22 5 10 -5 25
Investor Mutual 11.3 12.5 11.56 0.26 6 5 1 1
Reksa Dana Loomis-Sales 10.0 10.4 10.59 0,59 7 2 5 25
Massachusetts Investors Trust 16.2 20.8 15.37 0.83 8 8 0 0
Dana New England 10.4 10.2 10.50 0.10 3 1 2 4
Putnam Fund dari Boston 13.1 16.0 13.16 0,06 2 6 -4 16
Wellington Fund 11.3 12.0 11.33 0,03 1 3 -2 4

Total 0 110

† Diperoleh dari regresi: Ê i = 5,8194 + 0,4590 σ saya.


‡ Nilai absolut dari residu.
catatan: Pemeringkatannya dalam urutan nilai menaik. ( Lanjutan)

16 Lihat G. Udny Yule dan MG Kendall, Pengantar Teori Statistik, Charles Griffin & Company, London, 1953, hal. 455.
382 Bagian kedua Melonggarkan Asumsi Model Klasik

CONTOH 11.3 Garis pasar modal (CML) teori portofolio mendalilkan hubungan linier
antara hasil yang diharapkan ( E i) dan risiko (yang diukur dengan standar deviasi, σ) dari portofolio sebagai berikut:
( Lanjutan)

E i = β i + β 2 σ saya

Menggunakan data pada Tabel 11.2, model sebelumnya diestimasi dan residual dari model ini dihitung. Karena data terkait
dengan 10 reksa dana dengan ukuran dan tujuan investasi yang berbeda, orang yang apriori mungkin mengharapkan
heteroskedastisitas. Untuk menguji hipotesis ini, kami menerapkan uji korelasi peringkat. Perhitungan yang diperlukan
diberikan pada Tabel 11.2.
Menerapkan rumus (11.5.6), kami dapatkan

110
rs=1 - 6
10 (100 - 1) (11.5.8)

= 0.3333

Menerapkan t tes yang diberikan dalam Persamaan. (11.5.7), kami dapatkan



0,3333) (8)
t=(√
1 - 0.1110 (11.5.9)

= 0,9998

Untuk 8 df ini t nilai tidak signifikan bahkan pada tingkat signifikansi 10 persen; itu p
nilainya 0,17. Dengan demikian, tidak ada bukti hubungan sistematis antara variabel penjelas dan nilai absolut
dari residual, yang mungkin menunjukkan bahwa tidak ada heteroskedastisitas.

Tes Goldfeld – Quandt 17


Metode populer ini berlaku jika diasumsikan bahwa varians heteroskedastis, σ 2 saya, adalah

berhubungan positif dengan satu variabel penjelas dalam model regresi. Untuk kesederhanaan, pertimbangkan model dua
variabel yang biasa:

Y i = β 1 + β 2 X i + u saya

Seharusnya σ 2 saya berhubungan positif dengan X saya sebagai

σ i2= σ 2 X 2 saya
(11.5.10)
dimana σ 2 adalah sebuah konstanta. 18

Asumsi (11.5.10) mendalilkan itu σ 2 saya sebanding dengan kuadrat dari X variabel.
Asumsi seperti itu telah ditemukan cukup berguna oleh Prais dan Houthakker dalam studi mereka tentang anggaran keluarga.
(Lihat Bagian 11.5, metode informal.)
Jika Persamaan. (11.5.10) sesuai, artinya σ 2 saya akan lebih besar, semakin besar nilainya

dari X saya. Jika itu yang terjadi, heteroskedastisitas kemungkinan besar akan muncul dalam model. Untuk menguji ini secara
eksplisit, Goldfeld dan Quandt menyarankan langkah-langkah berikut:

Langkah 1. Urutkan atau rangking pengamatan menurut nilai X saya, dimulai dari yang terendah X nilai.

Langkah 2. Menghilangkan c observasi pusat, dimana c ditentukan secara apriori, dan bagi sisanya ( n - c) pengamatan
menjadi dua kelompok masing-masing ( n - c) 2 observasi.

LANGKAH 3. Pasangkan regresi OLS terpisah ke yang pertama ( n - c) 2 observasi dan yang terakhir ( n - c) 2
pengamatan, dan dapatkan jumlah sisa masing-masing dari kotak RSS 1 dan

17 Goldfeld dan Quandt, op. cit., Bab 3.


18 Ini hanya satu asumsi yang masuk akal. Sebenarnya yang dibutuhkan adalah itu σ 2
saya menjadi monoton
berhubungan dengan X saya.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 383

RSS 2, RSS 1 mewakili RSS dari regresi yang sesuai dengan yang lebih kecil X saya
nilai (grup varian kecil) dan RSS 2 bahwa dari yang lebih besar X saya nilai-nilai (kelompok varians besar). RSS ini
masing-masing memiliki
( )
( n - c) - k n-c-2k
atau df
2 2

dimana k adalah jumlah parameter yang akan diestimasi, termasuk intersep. (Mengapa?) Untuk kasus dua
variabel k tentu saja 2.

LANGKAH 4. Hitung rasionya

λ = RSS 2 / df (11.5.11)
RSS 1 / df

Jika kami menganggap Anda saya didistribusikan secara normal ( yang biasanya kami lakukan), dan jika asumsi homoskedastisitas
valid, maka dapat ditunjukkan itu λ dari Persamaan. (11.5.10) mengikuti F
distribusi dengan pembilang dan penyebut df masing-masing ( n - c - 2 k) / 2.

Jika dalam aplikasi dihitung λ (= F) lebih besar dari kritis F pada tingkat signifikansi yang dipilih, kita dapat menolak
hipotesis homoskedastisitas, yaitu, kita dapat mengatakan bahwa heteroskedastisitas sangat mungkin terjadi.

Sebelum mengilustrasikan tes, satu kata tentang menghilangkan c observasi pusat sudah beres. Pengamatan ini
dihilangkan untuk mempertajam atau menonjolkan perbedaan antara yang kecil
kelompok varian (yaitu, RSS 1) dan grup varian besar (yaitu, RSS 2). Tetapi kemampuan tes Goldfeld – Quandt untuk
melakukan ini dengan sukses bergantung pada caranya c terpilih. 19 Untuk dua-
model variabel percobaan Monte Carlo yang dilakukan oleh Goldfeld dan Quandt menunjukkan bahwa c
adalah sekitar 8 jika ukuran sampel sekitar 30, dan sekitar 16 jika ukuran sampel sekitar 60. Tetapi Judge et al. catat itu c
= 4 jika n = 30 dan c = 10 jika n sekitar 60 telah ditemukan memuaskan dalam praktiknya. 20

Sebelum pindah, mungkin diketahui bahwa jika ada lebih dari satu X variabel dalam model, peringkat observasi, langkah
pertama dalam pengujian, dapat dilakukan sesuai dengan salah satunya.
Jadi dalam model: Y i = β 1 + β 2 X 2 i + β 3 X 3 i + β 4 X 4 i + u saya, kami dapat menyusun peringkat data sesuai dengan salah satu dari ini X
's. Jika apriori kita tidak yakin yang mana X variabel sesuai, kita bisa
melakukan pengujian pada masing-masing X variabel, atau melalui uji Park, pada gilirannya, pada masing-masing X.

CONTOH 11.4 Untuk mengilustrasikan uji Goldfeld-Quandt, kami menyajikan dalam Tabel 11.3 data tentang pengeluaran konsumsi dalam

Itu kaitannya dengan pendapatan untuk 30 keluarga secara silang. Misalkan kita mendalilkan bahwa pengeluaran konsumsi secara
linier berhubungan dengan pendapatan tetapi heteroskedastisitas ada dalam data. Kami selanjutnya mendalilkan bahwa sifat
Goldfeld – Quandt
heteroskedastisitas seperti yang diberikan dalam Persamaan. (11.5.10). Penyusunan ulang data yang diperlukan untuk penerapan
Uji pengujian juga disajikan pada Tabel 11.3.

Dengan menghilangkan 4 observasi tengah, regresi OLS berdasarkan observasi 13 pertama dan 13 terakhir dan
jumlah residu kuadrat terkait seperti yang ditunjukkan berikutnya (stan-
kesalahan dard dalam tanda kurung).
( Lanjutan)

19 Secara teknis, file kekuasaan tes tergantung bagaimana c terpilih. Dalam statistik, file kekuatan ujian diukur dengan probabilitas
menolak hipotesis nol jika salah (yaitu, dengan 1 - Prob [kesalahan tipe II]). Hipotesis nol disini adalah varians dari kedua kelompok
adalah sama, yaitu homoskedastisitas. Untuk pembahasan lebih lanjut, lihat MM Ali dan C. Giaccotto, "Sebuah Studi dari Beberapa
Tes Baru dan Yang Ada untuk Heteroskedastisitas dalam Model Linier Umum, '' Jurnal Ekonometrika, vol. 26, 1984, hlm. 355–373.

20 George G. Judge, R. Carter Hill, William E. Griffths, Helmut Lütkepohl, dan Tsoung-Chao Lee,

Pengantar Teori dan Praktek Ekonometrika, John Wiley & Sons, New York, 1982, hal. 422.
384 Bagian kedua Melonggarkan Asumsi Model Klasik

CONTOH 11.4 TABEL 11.3 Data Hipotesis tentang Pengeluaran Konsumsi Y ($) dan Pendapatan X ($) untuk

( Lanjutan) Gambarkan Tes Goldfeld – Quandt

Data Diurutkan oleh


X Nilai
Y X Y X

55 80 55 80
65 100 70 85
70 85 75 90
80 110 65 100
79 120 74 105
84 115 80 110
98 130 84 115
95 140 79 120
90 125 90 125
75 90 98 130
74 105 95 140
110 160 108 145
113 150 113 150
125 165 110 160
108 145 125 165 4 tengah
115 180 115 180 observasi
140 225 130 185
120 200 135 190
145 240 120 200
130 185 140 205
152 220 144 210
144 210 152 220
175 245 140 225
180 260 137 230
135 190 145 240
140 205 175 245
178 265 189 250
191 270 180 260
137 230 178 265
189 250 191 270

Regresi berdasarkan 13 observasi pertama:


Ŷ i = 3.4094 + 0.6968 X saya
(8,7049) (0,0744) r 2 = 0.8887 RSS 1 = 377.17 df = 11
Regresi berdasarkan 13 pengamatan terakhir:
Ŷ i = - 28,0272 + 0,7941 X saya
(30,6421) (0,1319) r 2 = 0.7681 RSS 2 = 1536.8 df = 11
Dari hasil tersebut kami peroleh

λ = RSS 2 / df = 1536,8 / 11
RSS 1 / df 377.17 / 11
λ = 4.07
Yang kritis F nilai 11 pembilang dan 11 penyebut df pada tingkat 5 persen adalah 2.82. Sejak diperkirakan F (= λ) melebihi
nilai kritisnya, maka dapat disimpulkan bahwa terdapat heteroskedastisitas pada error variance. Namun, jika tingkat
signifikansi ditetapkan pada 1 persen, kita tidak boleh menolak asumsi homoskedastisitas. (Mengapa?) Perhatikan
bahwa file p
nilai yang diamati λ adalah 0,014.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 385

Tes Breusch – Pagan – Godfrey 21


Keberhasilan tes Goldfeld – Quandt tidak hanya bergantung pada nilai c ( jumlah observasi pusat yang harus
dihilangkan) tetapi juga pada identifikasi yang benar X variabel yang digunakan untuk memesan pengamatan.
Batasan tes ini dapat dihindari jika kita mempertimbangkan tes Breusch – Pagan – Godfrey (BPG).

Untuk mengilustrasikan tes ini, pertimbangkan k- model regresi linier variabel

Y i = β 1 + β 2 X 2 i + · · · + β k X ki + u saya (11.5.12)

Asumsikan bahwa kesalahan varians σ 2 saya digambarkan sebagai

σ i2= f ( α 1 + α 2 Z 2 i + · · · + α m Z mi) (11.5.13)

itu adalah, σ saya


2
adalah beberapa fungsi nonstochastic Z variabel; beberapa atau semua X bisa disajikan
sebagai Z 's. Secara khusus, asumsikan itu

σ i2= α 1 + α 2 Z 2 i + · · · + α m Z mi (11.5.14)

itu adalah, σ 2saya adalah fungsi linier dari Z 's. Jika α 2 = α 3 = · · · = α m = 0, σ 2 i = α 1, yang mana
konstan. Oleh karena itu, untuk menguji apakah σ 2 saya adalah homoscedastic, orang dapat menguji hipotesis itu
α 2 = α 3 = · · · = α m = 0. Ini adalah ide dasar di balik tes Breusch – Pagan – Godfrey. Prosedur pengujian yang sebenarnya adalah
sebagai berikut.

(11.5.12)
Langkah 1. Perkiraan Persamaan. ∑ oleh OLS dan dapatkan residu ˆ
Langkah 2. Memperoleh σ̃ 2 = û 2saya / n. Ingat dari Bab 4 bahwa ini ∑ u 1, û adalah
2,. . . , ûmaksimal
n.
penduga likelihood (ML) dari σ 2. ( catatan: Estimator OLS adalah û 2i / [ n - k].)
LANGKAH 3. Buat variabel p saya didefinisikan sebagai

2
p i = ˆ / u 2saya σ̃

yang hanya setiap sisa kuadrat dibagi σ̃ 2.


LANGKAH 4. Regresi p saya sehingga dibangun di atas Z sebagai

p i = α 1 + α 2 Z 2 i + · · · + α m Z mi + v saya (11.5.15)

dimana v saya adalah istilah sisa dari regresi ini.


LANGKAH 5. Dapatkan ESS (menjelaskan jumlah kuadrat) dari Persamaan. (11.5.15) dan definisi

= 1 (ESS) (11.5.16)
2

Asumsi u saya berdistribusi normal, dapat ditunjukkan bahwa jika ada homoskedastisitas dan jika ukuran sampel n
meningkat tanpa batas, lalu

∼ χ 2m - 1 (11.5.17)
asy

itu adalah, mengikuti distribusi chi-kuadrat dengan ( m - 1) derajat kebebasan.


( catatan: asy berarti asimtotik.)

21 T. Breusch dan A. Pagan, "Tes Sederhana untuk Heteroskedastisitas dan Variasi Koefisien Acak, ''

Econometrica, vol. 47, 1979, hlm. 1287–1294. Lihat juga L. Godfrey, “Testing for Multiplicative Heteroscedasticity, '' Jurnal
Ekonometrika, vol. 8, 1978, hlm. 227–236. Karena kesamaan, tes ini dikenal sebagai tes heteroskedastisitas Breusch –
Pagan-Godfrey.
386 Bagian kedua Melonggarkan Asumsi Model Klasik

Oleh karena itu, jika dalam suatu aplikasi dihitung (= χ 2) melebihi kritis χ 2 nilai pada tingkat signifikansi yang dipilih,
seseorang dapat menolak hipotesis homoskedastisitas; jika tidak, seseorang tidak akan menolaknya.

Pembaca mungkin bertanya-tanya mengapa BPG memilih 1


2 ESS sebagai statistik uji. Alasannya sedikit
terlibat dan ditinggalkan untuk referensi. 22

CONTOH 11.5 Sebagai contoh, mari kita lihat kembali data (Tabel 11.3) yang digunakan untuk mengilustrasikan uji heteroskedastisitas

Breusch– Goldfeld-Quandt. Menyesal Y di X, kami mendapatkan yang berikut:

Pagan – Godfrey Langkah 1.

(BPG) Tes
Ŷ i = 9,2903 + 0,6378 X saya
se = (5,2314) (0,0286) RSS = 2361.153 R 2 = 0,9466 (11.5.18)

Langkah 2. ∑

σ̃ 2 = û saya
2
/ 30 = 2361.153 / 30 = 78.7051

LANGKAH 3. Bagilah sisa kuadrat û saya diperoleh dari regresi (11.5.18) sebesar 78.7051 untuk membangun variabel p saya.

LANGKAH 4. Berasumsi bahwa p saya berhubungan linier dengan X i (= Z i) sesuai Persamaan. (11.5.14), kami memperoleh regresi

p̂ i = - 0,7426 + 0,0101 X saya


se = (0,7529) (0,0041) ESS = 10,4280 R 2 = 0.18 (11.5.19)

LANGKAH 5.

= 1 (ESS) = 5.2140 (11.5.20)


2

Berdasarkan asumsi distribusi chi-square uji BPG dengandalam ( catatan: (11.5.20)


1 df.Persamaan. Hanya ada satu
secara regressor
asimtotik di Persamaan.
mengikuti
[11.5.19].) Sekarang dari tabel chi-kuadrat kita menemukan bahwa untuk 1 df nilai chi-kuadrat kritis 5 persen adalah

3,8414 dan 1 persen kritis χ 2 nilainya adalah 6.6349. Jadi, nilai chi-kuadrat yang diamati sebesar 5,2140 signifikan
pada tingkat 5 persen tetapi tidak pada tingkat signifikansi 1 persen. Oleh karena itu, kami mencapai kesimpulan
yang sama dengan tes Goldfeld – Quandt. Namun perlu diingat bahwa, secara tegas, tes BPG adalah tes
asimtotik, atau sampel besar, dan dalam contoh ini 30 observasi mungkin bukan sampel besar. Itu juga harus
ditunjukkan
bahwa dalam sampel kecil pengujian sensitif terhadap asumsi gangguan u saya didistribusikan secara normal.
Tentu saja, kita dapat menguji asumsi normalitas dengan pengujian
dibahas dalam Bab 5. 23

Uji Heteroskedastisitas Umum White


Berbeda dengan tes Goldfeld – Quandt, yang membutuhkan pengurutan ulang observasi terkait dengan X Variabel
yang diduga menyebabkan heteroskedastisitas, atau uji BPG, yang sensitif terhadap asumsi normalitas, uji umum
heteroskedastisitas yang dikemukakan oleh White

22 Lihat Adrian C. Darnell, Kamus Ekonometrika, Edward Elgar, Cheltenham, Inggris, 1994, hlm. 178–179.

23 Tentang ini, lihat R. Koenker, “Catatan tentang Pelajarilah Tes untuk Heteroskedastisitas,” Jurnal Ekonometrika, vol. 17,

1981, hlm. 1180–1200.


Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 387

tidak mengandalkan asumsi normalitas dan mudah diterapkan. 24 Sebagai ilustrasi dari ide dasar,
pertimbangkan model regresi tiga variabel berikut (generalisasi ke k- model variabel langsung):

Y i = β 1 + β 2 X 2 i + β 3 X 3 i + u saya (11.5.21)

Tes Putih berlangsung sebagai berikut:

Langkah 1. Mengingat data, kami memperkirakan Persamaan. (11.5.21) dan dapatkan residu, û i.

Langkah 2. Kami kemudian menjalankan yang berikut ini ( bantu) regresi:

û 2i = α 1 + α 2 X 2 i + α 3 X 3 i + α 4 X 2 2i+α5 X 2 3 i + α 6 X 2 saya X 3 i + v saya


(11.5.22) 25

Artinya, sisa kuadrat dari regresi asli diregresikan pada aslinya X variabel atau regresi, nilai
kuadratnya, dan produk silang dari regresi. Kekuatan regressor yang lebih tinggi juga dapat
diperkenalkan. Perhatikan bahwa ada suku konstan dalam persamaan ini meskipun regresi asli
mungkin berisi atau tidak mengandungnya. Dapatkan R 2 dari regresi (tambahan) ini.

LANGKAH 3. Berdasarkan hipotesis nol bahwa tidak terdapat heteroskedastisitas, dapat ditunjukkan bahwa ukuran
sampel ( n) kali R 2 diperoleh dari regresi tambahan tanpa gejala
mengikuti distribusi chi-kuadrat dengan df sama dengan jumlah regresi (tidak termasuk suku konstanta)
dalam regresi tambahan. Itu adalah,

n · R2∼ χ2 df (11.5.23)
asy

dengan df seperti yang didefinisikan sebelumnya. Dalam contoh kita, ada 5 df karena ada 5 regressor
dalam regresi tambahan.

LANGKAH 4. Jika diperoleh nilai chi-square pada Persamaan. (11.5.23) melebihi nilai chi-square
kritis pada tingkat signifikansi yang dipilih, kesimpulannya adalah terdapat heteroskedastisitas. Jika
tidak melebihi nilai chi-square kritis, tidak ada heteroskedastisitas, artinya pada regresi tambahan
(11.5.22),
α 2 = α 3 = α 4 = α 5 = α 6 = 0 (lihat catatan kaki 25).

CONTOH 11.6 Dari data cross-sectional di 41 negara, Stephen Lewis memperkirakan model regresi sebagai berikut: 26
Putih
Heteroskedastisitas ln Y i = β 1 + β 2 ln X 2 i + β 3 ln X 3 i + u saya (11.5.24)
Uji
dimana Y = rasio pajak perdagangan (pajak impor dan ekspor) terhadap total pendapatan pemerintah,
X 2 = rasio jumlah ekspor ditambah impor terhadap GNP, dan X 3 = GNP per kapita; dan ln singkatan dari natural log.
Hipotesisnya adalah itu Y dan X 2 akan terkait secara positif (semakin tinggi volume perdagangan, semakin tinggi pendapatan
pajak perdagangan) dan itu Y dan X 3 akan menjadi

( Lanjutan)

24 H. White, "Estimator Matriks Kovarian yang Konsisten dengan Heteroskedastisitas dan Uji Langsung Heteroskedastisitas, '' Econometrica,

vol. 48, 1980, hlm. 817–818.


25 Tersirat dalam prosedur ini adalah asumsi bahwa varian kesalahan u saya, σ 2
saya, terkait secara fungsional
kepada para regressor, kotak mereka, dan produk silang mereka. Jika semua koefisien kemiringan parsial dalam regresi ini secara
simultan sama dengan nol, maka varian kesalahannya adalah konstanta homoskedastis.
sama dengan α 1.
26 Stephen R. Lewis, “Pendapatan Pemerintah dari Perdagangan Luar Negeri, '' Sekolah Ekonomi dan Studi Sosial Manchester, vol. 31,

1963, hlm. 39–47.


388 Bagian kedua Melonggarkan Asumsi Model Klasik

CONTOH 11.6 berhubungan negatif (dengan meningkatnya pendapatan, pemerintah menemukan bahwa lebih mudah untuk memungut pajak langsung —

( Lanjutan) misalnya, pajak pendapatan — daripada bergantung pada pajak perdagangan).

Hasil empiris mendukung hipotesis. Untuk tujuan kami, poin pentingnya adalah apakah ada
heteroskedastisitas dalam data. Karena datanya adalah cross-sectional yang melibatkan heterogenitas negara,
yang apriori diharapkan heteroskedastisitas dalam varian kesalahan. Dengan menerapkan uji
heteroskedastisitas White terhadap residual yang diperoleh dari regresi (11.5.24) diperoleh hasil sebagai
berikut: 27

û̂ i2= - 5.8417 + 2.5629 Dalam Perdagangan i + 0,6918 dalam GNP saya


- 0,4081 (Dalam Perdagangan saya) 2 - 0,0491 (dalam GNP saya) 2 (11.5.25)
+ 0,0015 (dalam perdagangan saya)( Dalam GNP saya) R 2 = 0.1148

catatan: Kesalahan standar tidak diberikan, karena tidak relevan untuk tujuan kita di sini.
Sekarang n · R 2 = 41 (0.1148) = 4.7068, yang secara asimtotik memiliki distribusi chi-square dengan 5 df
(mengapa?). Nilai chi-square kritis 5 persen untuk 5 df adalah 11,0705, nilai kritis 10 persen adalah 9,2363, dan
nilai kritis 25 persen adalah 6,62568. Untuk semua tujuan praktis, seseorang dapat menyimpulkan, berdasarkan
uji Putih, bahwa tidak ada heteroskedastisitas.

Ada komentar tentang Tes Putih. Jika suatu model memiliki beberapa regressor, maka memasukkan semua regressor, istilah
kuadratnya (atau yang bertenaga lebih tinggi), dan produk silang mereka dapat dengan cepat mengkonsumsi derajat kebebasan.
Oleh karena itu, seseorang harus berhati-hati dalam menggunakan tes. 28

Dalam kasus di mana statistik uji Putih diberikan dalam Persamaan. (11.5.25) secara statistik signifikan,
heteroskedastisitas belum tentu menjadi penyebabnya, tetapi kesalahan spesifikasi, yang akan dibahas lebih lanjut dalam
Bab 13 (ingat poin 5 dari Bagian 11.1). Dengan kata lain, theWhite test bisa menjadi tes (murni) heteroskedastisitas atau
kesalahan spesifikasi atau keduanya. Telah diperdebatkan bahwa jika tidak ada istilah produk silang dalam prosedur uji
White, maka itu adalah uji heteroskedastisitas murni. Jika terdapat istilah produk silang, maka ini adalah pengujian untuk
heteroskedastisitas dan bias spesifikasi. 29

Tes Heteroskedastisitas Lainnya


Ada beberapa tes heteroskedastisitas lainnya, masing-masing didasarkan pada asumsi tertentu. Pembaca yang
tertarik mungkin ingin melihat referensi. 30 Kami menyebutkan salah satu dari tes ini karena kesederhanaannya. Ini
adalah Tes Koenker – Bassett (KB). Seperti uji heteroskedastisitas di Taman, Breusch – Pagan – Godfrey, dan
White, uji KB didasarkan pada
sisa kuadrat, û 2 saya, tetapi bukannya diregressi pada satu atau lebih regressor, file
kuadrat residual diregresikan pada nilai estimasi kuadrat dari regresi dan. Secara khusus, jika model aslinya
adalah:

Y i = β 1 + β 2 X 2 i + β 3 X 3 i + · · · + β k X ki + u saya (11.5.26)

27 Hasil ini, dengan perubahan notasi, direproduksi dari William F. Lott dan Subhash C.Ray,

Ekonometrika Terapan: Masalah dengan Kumpulan Data, Manual Instruktur, Bab 22, hlm. 137–140.
28 Kadang-kadang tes dapat dimodifikasi untuk menjaga derajat kebebasan. Lihat Latihan 11.18.

29 Lihat Richard Harris, Menggunakan Analisis Kointegrasi dalam Pemodelan Ekonometrika, Prentice Hall & Harvester Wheatsheaf, Inggris, 1995,

hal. 68.
30 Lihat MJ Harrison dan BP McCabe, "Tes untuk Heteroskedastisitas Berdasarkan Residual Kuadrat Terkecil Biasa", Jurnal
Asosiasi Statistik Amerika, vol. 74, 1979, hlm. 494–499; J. Szroeter, "Kelas Tes Parametrik untuk Heteroskedastisitas dalam
Model Ekonometrik Linear, '' Econometrica,
vol. 46, 1978, hlm. 1311–1327; MA Evans dan ML King, "Kelas Pengujian Lebih Lanjut untuk Heteroskedastisitas, '' Jurnal
Ekonometrika, vol. 37, 1988, hlm. 265–276; dan R. Koenker dan G. Bassett, "Uji Kuat untuk Heteroskedastisitas Berdasarkan
Kuantil Regresi", Econometrica, vol. 50, 1982, hlm. 43–61.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 389

Anda memperkirakan model ini, dapatkan û saya dari model ini, dan kemudian estimasi

û 2i = α 1 + α 2 ( Ŷ i) 2 + v saya (11.5.27)

dimana Ŷ saya adalah nilai perkiraan dari model (11.5.26). Hipotesis nol adalah itu
α 2 = 0. Jika tidak ditolak, maka dapat disimpulkan bahwa tidak ada heteroskedastisitas. Hipotesis nol dapat
diuji dengan biasa t tes atau F uji. (Perhatikan itu F 1, k = t 2 e
k.) Jika th

model (11.5.26) adalah log ganda, kemudian residu kuadrat diregresikan (log ˆ Y i) 2. Yang lainnya
keuntungan dari tes KB adalah bahwa itu berlaku bahkan jika istilah kesalahan dalam model aslinya
(11.5.26) tidak terdistribusi normal. Jika Anda menerapkan uji KB ke Contoh 11.1, Anda akan menemukan bahwa koefisien
kemiringan dalam regresi kuadrat residual yang diperoleh dari Persamaan. (11.5.3)
tentang perkiraan Ŷ 2 saya dari Persamaan. (11.5.3) secara statistik tidak berbeda dari nol, sehingga memperkuat
tes Park. Hasil ini tidak mengherankan karena saat ini kami hanya memiliki satu regressor. Tetapi tes
KB berlaku jika ada satu atau banyak regressor.

Catatan Mengenai Pengujian Heteroskedastisitas


Kami telah membahas beberapa tes heteroskedastisitas di bagian ini. Jadi, bagaimana kita memutuskan tes mana yang terbaik?
Ini bukanlah pertanyaan yang mudah untuk dijawab, karena tes ini didasarkan pada berbagai asumsi. Dalam membandingkan
pengujian, kita perlu memperhatikan ukuran (atau tingkat signifikansi), kekuatan (kemungkinan menolak hipotesis yang salah),
dan kepekaan terhadap pencilan.
Kami telah menunjukkan beberapa batasan dari uji heteroskedastisitas White yang populer dan mudah diterapkan.
Sebagai akibat dari keterbatasan ini, mungkin memiliki daya yang rendah terhadap alternatif. Selain itu, pengujian tersebut
sedikit membantu dalam mengidentifikasi faktor atau variabel penyebab heteroskedastisitas.

Demikian pula, uji Breusch-Pagan-Godfrey sensitif terhadap asumsi normalitas. Sebaliknya, pengujian
Koenker-Bassett tidak bergantung pada asumsi normalitas dan oleh karena itu mungkin lebih kuat. 31 Dalam uji
Goldfeld-Quandt jika kita menghilangkan terlalu banyak observasi, kita dapat mengurangi kekuatan pengujian.

Ini berada di luar cakupan teks ini untuk memberikan analisis komparatif dari berbagai tes heteroskedastisitas.
Tetapi pembaca yang tertarik dapat merujuk ke artikel oleh John Lyon dan Chin-Ling Tsai untuk mendapatkan
gambaran tentang kekuatan dan kelemahan dari berbagai tes heteroskedastisitas. 32

11.6 Tindakan Perbaikan


Seperti yang telah kita lihat, heteroskedastisitas tidak menghancurkan sifat tidak bias dan konsistensi dari penduga
OLS, tetapi mereka tidak lagi efisien, bahkan tidak asimtotik (yaitu, ukuran sampel yang besar). Kurangnya efisiensi ini
membuat prosedur pengujian hipotesis biasa memiliki nilai yang meragukan. Oleh karena itu, tindakan perbaikan
mungkin diperlukan. Ada dua
pendekatan untuk remediasi: kapan σ 2 saya diketahui dan kapan σ 2 saya Tidak diketahui.

Kapan SAYA 2 saya Diketahui: Metode Weighted Least Squares


Seperti yang telah kita lihat di Bagian 11.3, if σ 2 saya diketahui, metode paling mudah
mengoreksi heteroskedastisitas dilakukan dengan menggunakan weighted least squares, karena penduga yang diperoleh adalah BIRU.

31 Untuk detailnya, lihat William H.Green, Analisis Ekonometrik, Edisi ke-6, Pearson / Prentice-Hall, New Jersey,

2008, hlm. 165–167.


32 Lihat artikel mereka, "Perbandingan Pengujian Heteroskedastisitas", Ahli Statistik, vol. 45, tidak. 3,

1996, hlm. 337–349.


390 Bagian kedua Melonggarkan Asumsi Model Klasik

CONTOH 11.7 Untuk mengilustrasikan metode ini, misalkan kita ingin mempelajari hubungan antara kompensasi dan ukuran pekerjaan

Ilustrasi dari untuk data yang disajikan pada Tabel 11.1. Untuk kesederhanaan, kami mengukur ukuran pekerjaan dengan 1 (1-4
karyawan), 2 (5-9 karyawan),. . . , 9 (1.000–2499 karyawan), meskipun kami juga dapat mengukurnya dengan titik tengah
Metode dari
dari berbagai kelas pekerjaan yang diberikan dalam tabel.
Tertimbang Paling Sedikit

Kotak Sekarang biarkan Y mewakili kompensasi rata-rata per karyawan ($) dan X ukuran lapangan kerja, kami menjalankan
regresi berikut (lihat Persamaan [11.3.6]):

Y saya / σ i = β̂ ∗ 1 ( 1 / σ i) + β̂ ∗ 2( X saya / σ i) + ( û saya / σ i) (11.6.1)

dimana σ saya adalah deviasi standar dari upah seperti yang dilaporkan pada Tabel 11.1. Data mentah yang diperlukan untuk menjalankan
regresi ini diberikan pada Tabel 11.4.

TABEL 11.4
Kompensasi, Ukuran Pekerjaan,
Ilustrasi
Y X σ saya Y saya/ σ saya X saya/ σ saya
ofWeighted Least-
Regresi Kuadrat 3.396 1 742.2 4.5664 0,0013
3.787 2 851.4 4.4480 0,0023
Sumber: Data di Y dan σ saya

(deviasi standar
4.013 3 727.8 5.5139 0,0041
kompensasi) berasal 4.104 4 805.06 5.0978 0,0050
Tabel 11.1. Ukuran pekerjaan: 1 =
4.146 5 929.9 4.4585 0,0054
1–4 karyawan, 2 = 5–9 karyawan, dll.
Data terakhir juga berasal dari Tabel
4.241 6 1.080.6 3.9247 0,0055
11.1. 4.387 7 1.241.2 3.5288 0,0056
4.538 8 1.307.7 3.4702 0,0061
4.843 9 1.110.7 4.3532 0,0081

catatan: Dalam regresi (11.6.2), variabel dependennya adalah ( Y saya / σ i) dan variabel independen adalah ( 1 / σ i) dan ( X saya / σ i).

Sebelum melanjutkan ke hasil regresi, perhatikan bahwa Persamaan. (11.6.1) tidak memiliki istilah intersep. (Mengapa?)
Oleh karena itu, seseorang harus menggunakan model regresi-melalui-asal untuk
memperkirakan β ∗
1 dan β ∗ 2, topik yang dibahas dalam Bab 6. Tetapi kebanyakan komputer mengemasnya
hari memiliki opsi untuk menekan istilah intersep (lihat Minitab atau EViews, sebagai contoh). Perhatikan juga fitur
menarik lainnya dari Persamaan. (11.6.1): Ini memiliki dua variabel penjelas,
(1 / σ i) dan ( X saya / σ i), sedangkan jika kita menggunakan OLS, menurunkan kompensasi pada karyawan
ukuran ment, regresi itu akan memiliki variabel penjelas tunggal, X i. ( Mengapa?)
Hasil regresi WLS adalah sebagai berikut:

( Ŷ̂ saya / σ i) = 3406.639 (1 / σ i) + 154.153 ( X saya / σ i)


(80,983) (16,959) (11.6.2)
t = ( 42,066) (9.090)
R 2 = 0,9993 33

Sebagai perbandingan, kami memberikan hasil regresi OLS biasa atau tidak berbobot:

Ŷ i = 3417.833 + 148.767 X saya


(81.136) (14,418) (11.6.3)
t = ( 42,125) (10,318) R 2 = 0,9383

Dalam Latihan 11.7 Anda diminta untuk membandingkan kedua regresi ini.

33 Seperti dicatat dalam catatan kaki 3 dari Bab 6, file R 2 regresi melalui asal tidak secara langsung sebanding dengan R 2 dari
model intersep-sekarang. Dilaporkan R 2 dari 0,9993 memperhitungkan perbedaan ini. (Lihat berbagai paket untuk detail lebih
lanjut tentang cara R 2 dikoreksi untuk memperhitungkan tidak adanya istilah intersep. Lihat juga Lampiran 6A, Sec. 6A1.)
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 391

Kapan σ 2 saya Tidak diketahui


Seperti disebutkan sebelumnya, jikasaya
benar σ2
diketahui, kita dapat menggunakan metodeWLS untuk mendapatkan pendugaBLUE.
Sejak itu benar σ 2 saya jarang diketahui, apakah ada cara untuk mendapatkannya konsisten ( dalam statistik
sense) perkiraan varians dan kovarian dari penaksir OLS bahkan jika ada heteroskedastisitas?
Jawabannya iya.

Varians dan Kesalahan Standar yang Konsisten dengan Heteroskedastisitas White

Putih telah menunjukkan bahwa perkiraan ini dapat dilakukan sehingga tanpa gejala kesimpulan statistik yang valid
(yaitu, sampel besar) dapat dibuat tentang nilai parameter yang sebenarnya. 34 Kami tidak akan menyajikan detail
matematisnya, karena itu di luar cakupan buku ini. Namun, Lampiran 11A.4 menguraikan prosedur White. Saat ini,
beberapa paket komputer menyajikan varians yang dikoreksi heteroskedastisitas White dan kesalahan standar
bersama dengan varian OLS biasa dan kesalahan standar. 35 Kebetulan, kesalahan standar yang dikoreksi
heteroskedastisitas White juga dikenal sebagai kesalahan standar yang kuat.

CONTOH 11.8 Sebagai contoh, kami mengutip hasil berikut karena Greene: 36
Ilustrasi
Ŷ i = 832.91 - 1834.2 (Pendapatan) + 1587.04 (Pendapatan) 2
Prosedur White
OLS se = (327.3) (829.0) (519.1)
t= (2.54) (2.21) (3.06) (11.6.4)
Putih se = (460.9) (1243,0) (830,0)
t= (1.81) ( - 1,48) (1,91)

dimana Y = Pengeluaran per kapita di sekolah umum menurut negara bagian pada tahun 1979 dan Pendapatan = pendapatan per kapita menurut

negara bagian pada tahun 1979. Sampel terdiri dari 50 negara bagian ditambah Washington, DC.

Seperti yang ditunjukkan hasil sebelumnya, kesalahan standar koreksi heteroskedastisitas (White) jauh lebih besar
daripada kesalahan standar OLS dan oleh karena itu t nilai jauh lebih kecil daripada yang diperoleh oleh OLS. Atas dasar
yang terakhir ini, kedua regressor secara statistik signifikan pada tingkat 5 persen, sedangkan menurut White estimator
mereka tidak signifikan. Namun, harus ditunjukkan bahwa kesalahan standar yang dikoreksi oleh heteroskedastisitas
White bisa lebih besar atau lebih kecil daripada kesalahan standar yang tidak dikoreksi.

Karena penduga varians yang konsisten heteroskedastisitas White sekarang tersedia dalam paket regresi yang
telah ditetapkan, disarankan agar pembaca melaporkannya. Sebagai catatan Wallace dan Silver:

Secara umum, mungkin ide yang baik untuk menggunakan opsi PUTIH [tersedia dalam program regresi] secara rutin, mungkin
membandingkan output dengan output OLS biasa sebagai pemeriksaan untuk melihat apakah heteroskedastisitas merupakan
masalah serius dalam kumpulan data tertentu. 37

Asumsi yang Masuk Akal tentang Pola Heteroskedastisitas


Selain sebagai prosedur sampel besar, satu kelemahan dari prosedur White adalah bahwa estimator yang
diperoleh mungkin tidak seefisien yang diperoleh dengan metode itu.

34 Lihat H. White, op. cit.


35 Secara lebih teknis, mereka dikenal sebagai penduga matriks kovarians yang heteroskedastisitas-konsisten.

36 William H. Greene, Analisis Ekonometrik, 2d ed., Macmillan, New York, 1993, hal. 385.
37 T. Dudley Wallace dan J. Lew Silver, Ekonometrika: Pengantar, Addison-Wesley, Membaca, Mass.,

1988, hal. 265.


392 Bagian kedua Melonggarkan Asumsi Model Klasik

mengubah data untuk mencerminkan jenis heteroskedastisitas tertentu. Untuk menggambarkan hal ini, mari kita kembali ke model
regresi dua variabel:

Y i = β 1 + β 2 X i + u saya

Kami sekarang mempertimbangkan beberapa asumsi tentang pola heteroskedastisitas.

ASUMSI 1 Varians kesalahan sebanding dengan X 2 saya (:)

2
E u 2i = σ 2 X saya (11.6.5) 38

Jika, sebagai masalah "spekulasi," metode grafis, atau pendekatan Park dan Glejser, ya
percaya bahwa varian u saya sebanding dengan kuadrat dari variabel penjelas X
(lihat Gambar 11.10), seseorang dapat mengubah model aslinya sebagai berikut. Bagilah yang asli
model melalui oleh X saya:

Yi=β1+β2+ u saya

X saya X saya X saya


(11.6.6)
1 + β 2 + v saya
= β 1 X saya

dimana v saya adalah istilah gangguan yang ditransformasikan, sama dengan u saya / X i. Sekarang mudah untuk memverifikasi itu

( ) 2=
() u saya 1 ()
E v 2i = E 2
E u 2 saya
X saya X saya

= σ2 menggunakan (11.6.5)

Oleh karena itu varian dari v saya sekarang homoscedastic, dan seseorang dapat melanjutkan untuk menerapkan OLS ke persamaan
yang ditransformasikan (11.6.6), regresi Y saya / X saya pada 1 / X i.

GAMBAR 11.10
σ
σ 2saya
Varians kesalahan

sebanding dengan X 2.

38 Ingatlah bahwa kita telah menemukan asumsi ini dalam diskusi kita tentang uji Goldfeld – Quandt.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 393

Perhatikan bahwa dalam regresi yang ditransformasikan, istilah intersep β 2 adalah koefisien kemiringan dalam
persamaan asli dan koefisien kemiringan β 1 adalah istilah intersep dalam model aslinya. Oleh karena itu,
untuk kembali ke model semula kita harus mengalikan perkiraannya
Persamaan. (11.6.6) oleh X i. Penerapan transformasi ini diberikan dalam Latihan 11.20.

ASUMSI 2 Varians kesalahan sebanding dengan X saya. ( Itu) transformasi akar kuadrat:

E u 2 =saya
σ 2 X saya (11.6.7)

Jika diyakini bahwa varians u saya, bukannya proporsional dengan kuadrat X saya,
sebanding dengan X saya itu sendiri, maka model aslinya dapat diubah sebagai berikut (lihat Gambar 11.11):

√ u saya
√ Yi=√ β1+β Xi+√ 2
X saya X saya X saya
(11.6.8)

√1
= β 1 X saya + β2 Xi+ v saya


dimana v i = u saya / X saya dan dimana X i> 0.
Dengan asumsi 2, seseorang dapat dengan mudah memverifikasi itu E (v 2 i) = σ 2, sebuah homosce √ situa dastic √tion.
Ada √Sebelumnya, seseorang dapat melanjutkan ed untuk menerapkan OLS ke Persamaan. (11.6.8), mundur Y saya / X saya pada 1 / X saya
dan X i.
Perhatikan fitur penting dari model yang ditransformasikan: Ini tidak memiliki istilah intersep. Sana fo kembali,
seseorang harus menggunakan model regresi-melalui-asal untuk memperkirakan β 1 dan β 2. Memiliki
Lari √ Persamaan. (11.6.8), seseorang dapat kembali ke model aslinya hanya dengan mengalikan Persamaan. (11.6.8) oleh X i.

Kasus yang menarik adalah model intersep nol, yaitu, Y i = β 2 X i + u i. Dalam hal ini, Persamaan. (11.6.8) b ec omes:

Y i = β 2 X saya√
√ + √ u saya (11.6.8a)
X saya X saya

GAMBAR 11.11 σ σ2
saya
Varians kesalahan

sebanding dengan X.

X
394 Bagian kedua Melonggarkan Asumsi Model Klasik

Dan itu bisa dibuktikan


βˆ 2 = (11.6.8b)

Artinya, penduga kuadrat-terkecil tertimbang hanyalah rasio dari rata-rata variabel dependen dan penjelas. (Untuk
membuktikan Persamaan. [11.6.8b], cukup gunakan rumus regresi-melalui-asal yang diberikan dalam Persamaan.
[6.1.6].)

ASUMSI 3 Varians kesalahan sebanding dengan t (he) kuadrat dari nilai rata-rata Y.

E u 2 saya
= σ 2 [ E (Y i)] 2 (11.6.9)

Persamaan (11.6.9) mendalilkan bahwa varians u saya sebanding dengan kuadrat dari nilai yang diharapkan dari Y ( lihat
Gambar 11.8 e). Sekarang

E (Y i) = β 1 + β 2 X saya

Oleh karena itu, jika kita mengubah persamaan aslinya sebagai berikut,

Y saya X saya u saya


= β1+β 2) E (Y i) +
E (Y i) E ((Y i) E (Y i)
(11.6.10)
1 X saya
= β1 + β 2 E (Y i) + v saya
E (Y i)

dimana v i = u saya / E (Y i), itu bisa dilihat E (v 2 i) = σ 2; yaitu gangguan v saya adalah ho-
moscedastic. Oleh karena itu, regresi (11.6.10) yang akan memenuhi asumsi homoskedastisitas
model regresi linier klasik.
Transformasi (11.6.10), bagaimanapun, tidak dapat beroperasi karena E (Y i) tergantung pada β 1
dan β 2, yang tidak diketahui. Tentu saja kami tahu Ŷ i = β̂ 1 + β̂ 2 X saya, yang merupakan penduga
E (Y i). Oleh karena itu, kami dapat melanjutkan dalam dua langkah: Pertama, kami menjalankan regresi OLS biasa,
mengenai masalah heteroskedastisitas, dan memperoleh Ŷ i. Kemudian, gunakan perkiraan Ŷ saya, kami mengubah model kami sebagai
berikut:

() ()
Yi=β1 1 + β2 X saya
+ v saya (11.6.11)
Ŷ saya Ŷ saya Ŷ saya

dimana v i = ( u saya / Ŷ i). Pada Langkah 2, kami menjalankan th e regresi io n (11.6.11 ). Meskipun Ŷ saya tidak persis
E (Y i), mereka adalah penduga yang konsisten; yaitu, karena ukuran sampel meningkat tanpa batas, mereka
bertemu dengan true E (Y i). Oleh karena itu, transformasi (11.6.11) akan bekerja dengan memuaskan dalam praktik jika
ukuran sampel cukup besar.

ASUMSI 4 Transformasi log seperti

ln Y i = β 1 + β 2 ln X i + u saya (11.6.12)

sangat sering mengurangi heteroskedastisitas jika dibandingkan dengan regresi


Y i = β 1 + β 2 X i + u i.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 395

Hasil ini muncul karena transformasi log memampatkan skala di mana variabel-variabel diukur, sehingga
mengurangi perbedaan sepuluh kali lipat antara dua nilai menjadi perbedaan dua kali lipat. Jadi, angka 80 adalah
10 kali angka 8, tetapi ln 80 (= 4,3280) kira-kira dua kali lebih besar dari ln 8 (= 2.0794).

Keuntungan tambahan dari transformasi log adalah koefisien kemiringan β 2 mengukur elastisitas Y dengan
hormat X, yaitu, persentase perubahan Y untuk satu persen-
perubahan usia X. Misalnya, jika Y adalah konsumsi dan X adalah pendapatan, β 2 dalam Persamaan. (11.6.12) akan

mengukur elastisitas pendapatan, sedangkan pada model aslinya β 2 mengukur hanya tingkat perubahan konsumsi rata-rata
untuk perubahan unit pendapatan. Itu adalah salah satu alasan mengapa log
model cukup populer di ekonometrik empiris. (Untuk beberapa masalah yang terkait dengan transformasi
log, lihat Latihan 11.4.)
Untuk menyimpulkan diskusi kami tentang langkah-langkah perbaikan, kami menekankan kembali bahwa semua transformasi
yang dibahas sebelumnya bersifat ad hoc; kami pada dasarnya berspekulasi tentang
sifat dari σ 2 i. Transformasi mana yang dibahas sebelumnya yang akan berhasil akan bergantung
pada sifat masalah dan tingkat keparahan heteroskedastisitas. Ada beberapa masalah tambahan dengan
transformasi yang telah kami pertimbangkan yang harus selalu diingat:

1. Ketika kita melampaui model dua-variabel, kita mungkin tidak tahu apriori mana dari
X variabel harus dipilih untuk mengubah data. 39
2. Transformasi log seperti yang dibahas dalam Asumsi 4 tidak dapat diterapkan jika beberapa Y
dan X nilainya nol atau negatif. 40
3. Lalu ada masalah korelasi palsu. Istilah ini, menurut Karl Pearson, mengacu pada situasi di
mana ditemukan korelasi antara rasio variabel meskipun variabel aslinya tidak berkorelasi atau acak. 41
Jadi, di dalam model
Y i = β 1+ β 2 X i + u saya, Y dan X mungkin tidak berkorelasi tetapi dalam model yang diubah
Y saya / X i = β 1 ( 1 / X i) + β 2, Y saya / X saya dan 1/ X saya sering ditemukan berkorelasi.
4. Kapan σ 2 saya tidak langsung diketahui dan diperkirakan dari satu atau lebih trans-
formasi yang telah kita bahas sebelumnya, semua prosedur pengujian kita menggunakan t tes,
F tes, dll., adalah, tegasnya, hanya valid dalam sampel besar. Oleh karena itu, seseorang harus berhati-hati dalam
menafsirkan hasil berdasarkan berbagai transformasi dalam sampel kecil atau terbatas. 42

11.7 Contoh Penutup


Dalam menyimpulkan diskusi kita tentang heteroskedastisitas, kami menyajikan tiga contoh yang menggambarkan poin utama yang
dibuat dalam bab ini.

39 Namun, sebagai masalah praktis, seseorang dapat merencanakan û 2


saya terhadap setiap variabel dan memutuskan yang mana X variabel
dapat digunakan untuk mengubah data. (Lihat Gambar 11.9.)
40 Terkadang kita bisa menggunakan ln ( Y i + k) atau ln ( X i + k), dimana k adalah bilangan positif yang dipilih sedemikian rupa sehingga semua nilai Y dan

X menjadi positif.
41 Misalnya, jika X 1, X 2, dan X 3 saling tidak berkorelasi r 12 = r 13 = r 23 = 0 dan kami menemukan bahwa file

(nilai) rasio X 1 / X 3 dan X 2 / X 3 berkorelasi, maka ada korelasi palsu. “Secara lebih umum, korelasi dapat dikatakan palsu jika
disebabkan oleh metode penanganan data dan
tidak ada dalam materi aslinya. " MG Kendall dan WR Buckland, Kamus Istilah Statistik, Hafner Publishing, New York,
1972, hal. 143.
42 Untuk detail lebih lanjut, lihat George G. Judge et al., Op. cit., Bagian 14.4, hlm. 415–420.
396 Bagian kedua Melonggarkan Asumsi Model Klasik

CONTOH 11.9 Marilah kita kembali ke contoh kematian anak yang telah kita bahas dalam beberapa kesempatan. Dari data untuk 64 negara, kami

Kematian Anak memperoleh hasil regresi yang ditunjukkan pada Persamaan. (8.1.4). Karena datanya bersifat cross-sectional, yang melibatkan
berbagai negara dengan pengalaman kematian anak yang berbeda, kemungkinan besar kita akan menjumpai heteroskedastisitas.
Ditinjau kembali
Untuk mengetahui hal ini, pertama-tama mari kita pertimbangkan residual yang diperoleh dari Persamaan. (8.1.4). Residu ini diplot
pada Gambar 11.12. Dari gambar tersebut terlihat bahwa residual tidak menunjukkan adanya pola yang berbeda yang dapat
menunjukkan adanya heteroskedastisitas. Meski demikian, penampilan bisa menipu. Jadi, mari kita terapkan tes Park, Glejser, dan
White untuk melihat apakah ada bukti heteroskedastisitas.

Tes Taman. Karena ada dua regressor, GNP dan FLR, kita dapat meregresi kuadrat residual dari regresi (8.1.4)
pada salah satu variabel ini. Atau, kita dapat meregresinya berdasarkan estimasi nilai CM (= C ̂
M̂) dari regresi (8.1.4). Dengan menggunakan yang terakhir, kami memperoleh berikut

hasil yang rendah.

û̂ 2i = 854.4006 + 5.7016 C ̂ M̂ saya


(11.7.1)
t = ( 1,2010) (1,2428) r 2 = 0,024

Catatan: û saya adalah residual yang diperoleh dari regresi (8.1.4) dan C. ̂ M̂ adalah nilai perkiraan
CM dari regresi (8.1.4).
Seperti yang ditunjukkan oleh regresi ini, tidak ada hubungan sistematis antara residu kuadrat dan nilai CM
yang diperkirakan (mengapa?), Menunjukkan bahwa asumsi homoskedastisitas mungkin valid. Kebetulan, log
dari nilai sisa kuadrat mengalami regresi pada log C ̂
M̂ tidak mengubah kesimpulannya.

Tes Glejser. Nilai absolut dari sisa yang diperoleh dari Persamaan. (8.1.4), ketika diregresikan pada estimasi
nilai CM dari regresi yang sama, memberikan hasil sebagai berikut:

| û̂̂ i | = 22,3127 + 0,0646 C ̂ M̂ saya


(11.7.2)
t = ( 2.8086) (1.2622) r 2 = 0,0250

Sekali lagi, tidak ada banyak hubungan sistematis antara nilai absolut dari residu dan nilai CM yang
diperkirakan, seperti t nilai koefisien kemiringan tidak signifikan secara statistik.

Tes Putih. Menerapkan uji heteroskedastisitas White dengan dan tanpa istilah produk silang, kami tidak menemukan bukti
heteroskedastisitas. Kami juga memperkirakan kembali Persamaan. (8.1.4) untuk mendapatkan kesalahan standar konsisten
heteroskedastisitas White dan t nilai-nilai, tetapi hasilnya sangat mirip dengan yang diberikan dalam Persamaan. (8.1.4), yang
seharusnya tidak mengherankan mengingat berbagai uji heteroskedastisitas yang kami lakukan sebelumnya.

Singkatnya, tampaknya regresi kematian anak kita (8.1.4) tidak mengalami heteroskedastisitas.

GAMBAR 11.12 100


Sisa dari
regresi (8.1.4).
50

- 50

- 100
5 10 15 20 25 30 35 40 45 50 55 60 65
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 397

CONTOH 11.10 Tabel 11.5 memberikan data tentang pengeluaran penelitian dan pengembangan (R&D), penjualan, dan laba untuk 14

R&D kelompok industri di Amerika Serikat (semua angka dalam jutaan dolar). Karena data cross-sectional yang disajikan dalam
tabel ini cukup heterogen, dalam regresi R&D penjualan, kemungkinan terjadi heteroskedastisitas. Hasil regresi adalah
Pengeluaran,
sebagai berikut:
Penjualan, dan Keuntungan
̂ & ̂D i = 1338 +
di 14 Industri R 0,0437 Penjualan saya

Pengelompokan di se = (5015) (0,0277) (11.7.3)

Amerika Serikat, t = ( 0,27) (1,58) r 2 = 0.172


2005
Tidak mengherankan, ada hubungan positif antara R&D dan penjualan, meskipun secara statistik tidak signifikan
pada tingkat tradisional.

TABEL 11.5
Industri Penjualan R&D Keuntungan
Penjualan dan

Pekerjaan 1 Makanan 374.342 2.716 234.662


untuk Perusahaan 2 Tekstil, pakaian jadi, dan kulit 3 Bahan 51.639 816 53.510
Pertunjukan kimia dasar 109.899 2.277 75.168
R&D Industri 4 Resin, karet sintetis, serat,
di Amerika Serikat, dan meratap 132.934 2.294 34.645
berdasarkan Industri, 2005 5 Farmasi dan obat-obatan 6 Plastik dan 273.377 34.839 127.639
(nilai dalam produk karet 7 Produk logam fabrikasi 8 90.176 1.760 96.162
jutaan dolar) Mesin 174.165 1.375 155.801
230.941 8.531 143.472
Sumber: Sains Nasional
9 Komputer dan peralatan periferal 10 91.010 4.955 34.004
Yayasan, Divisi
Statistik Sumber Daya Sains, Semikonduktor dan lainnya
Survei Penelitian dan komponen elektronik 176.054 18.724 81.317
Pengembangan Industri: 2005 dan
11 Navigasi, pengukuran, elektromedis,
Biro Sensus AS
Survei Tahunan dan instrumen kontrol 118.648 15.204 73.258
Produsen, 2005. 12 Peralatan listrik, perkakas,
dan komponen 101.398 2.424 54.742
13 Produk dan suku cadang dirgantara 14 227.271 15.005 72.090
Peralatan dan persediaan medis 56.661 4.374 52.443

Untuk melihat apakah regresi (11.7.3) menderita heteroskedastisitas, kami memperoleh resid-
uals, û saya, dan sisa kuadrat, û 2 saya, dari model dan diplotkan terhadap penjualan, sebagai
ditunjukkan pada Gambar 11.13. Tampak dari gambar ini bahwa ada pola sistematis antara residual dan residu kuadrat
dan penjualan, mungkin menunjukkan adanya heteroskedastisitas. Untuk mengujinya secara formal, kami
menggunakan tes Park, Glejser, dan White, yang memberikan hasil sebagai berikut:

Tes Taman

û̂ i2= - 72.493.719 + 916.1 Penjualan saya

se = (54.940.238) (303,9) (11.7.4)

t= ( - 1,32) (3.01) r 2 = 0.431

Uji Park menunjukkan bahwa ada hubungan positif yang signifikan secara statistik antara sisa kuadrat dan
penjualan.

( Lanjutan)
398 Bagian kedua Melonggarkan Asumsi Model Klasik

CONTOH 11.10 GAMBAR 11.13 Sisa ( Sebuah) dan residu kuadrat ( b) pada penjualan.
( Lanjutan) 30.000

20.000

10.000

- 10.000

- 20.000
0 100.000 200.000 300.000 400.000
Sisa

Penjualan

500.000.000

400.000.000

300.000.000

200.000.000

100.000.000

0
0 100.000 200.000 300.000 400.000
Sisa kuadrat

Penjualan

Tes Glejser

| û̂̂ i | = - 1003 + 0,04639 Penjualan saya


se = (2316) (0,0128) (11.7.5)
t = ( - 0,43) (3.62) r 2 = 0,522

Uji Glejser juga menunjukkan bahwa ada hubungan sistematis antara nilai absolut dari residual dan penjualan,
meningkatkan kemungkinan bahwa regresi (11.7.3) mengalami heteroskedastisitas.

Tes Putih

û iˆ=2- 46,746,325 + 578 Penjualan i + 0.000846 Penjualan 2 saya

se = (112.224.348) (1308) (0,003171)


(11.7.6)
t= ( - 0,42) (0.44) (0,27)
R 2 = 0.435

Menggunakan R 2 nilai dan n = 14, kami dapatkan nR 2 = 6.090. Di bawah hipotesis nol tentang tidak adanya
heteroskedastisitas, ini harus mengikuti distribusi chi-kuadrat dengan 2 df (karena ada dua regresi dalam Persamaan
[11.7.6]). Itu p nilai memperoleh nilai chi-kuadrat sebanyak
6.090 atau lebih besar adalah sekitar 0,0476. Karena ini adalah nilai yang rendah, uji Putih juga menunjukkan adanya
heteroskedastisitas.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 399

CONTOH 11.10 Singkatnya, berdasarkan grafik sisa dan uji Park, Glejser, dan White, tampaknya regresi R&D kami (11.7.3)
mengalami heteroskedastisitas. Karena varian kesalahan sebenarnya tidak diketahui, kita tidak dapat menggunakan
( Lanjutan)
metode kuadrat terkecil tertimbang untuk mendapatkan kesalahan standar yang dikoreksi heteroskedastisitas dan t nilai-nilai.
Oleh karena itu, kita harus membuat beberapa tebakan tentang sifat varian kesalahan.

Untuk menyimpulkan contoh kami, kami menyajikan di bawah kesalahan standar konsisten-heteroskedastisitas White, seperti yang
dibahas dalam Bagian 11.6.

R ̂& ̂ D i = 1337,87 + 0,0437 Penjualan saya

se = (4892.447) (0,0411) (11.7.7)

t= (0,27) (1,06) r 2 = 0.172

Membandingkan Persamaan. (11.7.7) dengan Persamaan. (11.7.3) (yang terakhir tidak dikoreksi untuk
heteroskedastisitas), kita melihat bahwa estimasi parameter tidak berubah (seperti yang kita harapkan),
kesalahan standar dari koefisien intersep telah sedikit berkurang, dan kesalahan standar lereng koefisien
meningkat sedikit. Tapi ingat bahwa prosedur Putih adalah prosedur sampel besar, sedangkan kami hanya
memiliki 14 pengamatan.

CONTOH 11.11 Tabel 11.6 di situs web buku teks memberikan gaji dan data terkait di 94 distrik sekolah di Northwest Ohio.
Awalnya, regresi berikut diperkirakan dari data ini:

ln (Gaji) i = β 1 + β 2 ln (Famincome) + β 3 ln (Propvalue) + u saya

Dimana Gaji = gaji rata-rata guru kelas ($), famincome = pendapatan keluarga rata-rata di kabupaten ($), dan
propvalue = nilai rata-rata properti di kabupaten ($).
Karena ini adalah model log ganda, semua koefisien kemiringan adalah elastisitas. Berdasarkan berbagai uji
heteroskedastisitas yang dibahas dalam teks, ditemukan bahwa model sebelumnya mengalami heteroskedastisitas.
Oleh karena itu, kami memperoleh kesalahan standar yang kuat (White). Tabel berikut memberikan hasil regresi
sebelumnya dengan dan tanpa kesalahan standar yang kuat.

Variabel Koefisien OLS se Se kuat

Mencegat 7.0198 0.8053 0.7721


(8,7171) (9.0908)
ln (famincome) 0.2575 0,0799 0.1009
(3.2230) (2.5516)
ln (propvalue) 0,0704 0,0207 0,0460
(3,3976) (1,5311)
R2 0,2198

catatan: Angka dalam tanda kurung adalah perkiraan t rasio.

Meskipun nilai koefisien dan R 2 tetap sama apakah kita menggunakan metode OLS atau White, kesalahan
standar telah berubah; perubahan yang paling dramatis adalah dalam kesalahan standar koefisien ln (propvalue).
OLS biasa akan menyarankan bahwa estimasi koefisien variabel ini sangat signifikan secara statistik, sedangkan
kesalahan standar kuat White menunjukkan bahwa koefisien ini tidak signifikan bahkan pada level 10 persen. Inti
dari contoh ini adalah bahwa jika terjadi heteroskedastisitas, hal itu harus diperhitungkan dalam mengestimasi
suatu model.
400 Bagian kedua Melonggarkan Asumsi Model Klasik

11.8 Perhatian tentang Bereaksi Berlebihan terhadap Heteroskedastisitas

Kembali ke contoh R & D yang dibahas di bagian sebelumnya, kita melihat bahwa ketika kita menggunakan transformasi akar
kuadrat untuk mengoreksi heteroskedastisitas dalam model asli (11.7.3), kesalahan standar koefisien kemiringan menurun
dan t nilai meningkat. Apakah perubahan ini begitu signifikan sehingga dalam praktiknya orang harus mengkhawatirkannya?
Dengan kata lain, kapan kita harus benar-benar mengkhawatirkan masalah heteroskedastisitas? Seperti yang dikatakan
seorang penulis, "heteroskedastisitas tidak pernah menjadi alasan untuk membuang model yang sebaliknya baik". 43

Di sini mungkin berguna untuk mengingat peringatan yang disuarakan oleh John Fox:

. . . varian kesalahan yang tidak sama layak untuk diperbaiki hanya jika masalahnya parah.
Dampak varian kesalahan tidak konstan pada efisiensi penduga kuadrat-terkecil biasa dan pada validitas
inferensi kuadrat-terkecil bergantung pada beberapa faktor, termasuk
ing ukuran sampel, tingkat variasi dalam σ 2 saya, konfigurasi file X [ yaitu,
regressor], dan hubungan antara varian error dan X 's. Oleh karena itu, tidak mungkin untuk mengembangkan
kesimpulan yang sepenuhnya umum tentang kerugian yang ditimbulkan oleh heteroskedastisitas. 44

Kembali ke model (11.3.1), kita telah melihat sebelumnya bahwa varians dari penduga lereng, var
( β̂ 2), diberikan oleh rumus biasa yang ditunjukkan pada (11.2.3). Di bawah GLS, varian kemiringan
penaksir, var ( β̂ ∗ 2), diberikan oleh (11.3.9). Kita tahu bahwa yang terakhir lebih efisien daripada
bekas. Tapi seberapa besar varian sebelumnya (yaitu, OLS) harus dikaitkan dengan varian GLS sebelum orang
benar-benar mengkhawatirkannya? Sebagai aturan praktis, Fox menyarankan agar kami khawatir tentang
masalah ini “. . . saat varian kesalahan terbesar lebih dari sekitar 10 kali terkecil. " 45 Jadi, kembali ke hasil
simulasi Monte Carlo dari Davidson dan MacKinnon yang disajikan di Bagian 11.4, pertimbangkan nilai dari α = 2.
Varians file
diperkirakan β 2 adalah 0,04 di bawah OLS dan 0,012 di bawah GLS, sehingga rasio mantan ke yang terakhir menjadi
sekitar 3,33. 46 Menurut aturan Fox, parahnya heteroskedastisitas dalam hal ini
casing mungkin tidak cukup besar untuk dikhawatirkan.

Juga ingat bahwa, meskipun terdapat heteroskedastisitas, estimator OLS tidak bias linier dan (dalam kondisi
umum) secara asimtotik (yaitu, dalam sampel besar) terdistribusi normal.
Seperti yang akan kita lihat ketika kita membahas pelanggaran lain dari asumsi model regresi linier klasik,
peringatan yang disuarakan di bagian ini sesuai sebagai aturan umum. Jika tidak, seseorang bisa berlebihan.

Ringkasan dan 1. Asumsi kritis dari model regresi linier klasik adalah bahwa gangguan-
bances u saya memiliki semua varian yang sama, σ 2. Jika asumsi ini tidak terpenuhi maka terjadi heteroskedastisitas.
Kesimpulan

2. Heteroskedastisitas tidak merusak sifat bias dan konsistensi penduga OLS.

3. Tetapi estimator ini tidak lagi varian minimum atau efisien. Artinya, mereka tidak BIRU.

43 N. Gregory Mankiw, “Kursus Penyegaran Singkat dalam Ekonomi Makro,” Jurnal Sastra Ekonomi,

vol. XXVIII, Desember 1990, hal. 1648.


44 John Fox, Analisis Regresi Terapan, Model Linear, dan Metode Terkait, Sage Publications, California, 1997, hal. 306.

45 Ibid., Hal. 307.

46 Perhatikan bahwa kami telah mengkuadratkan kesalahan standar untuk mendapatkan varians.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 401

4. Estimator BIRU disediakan dengan metode kuadrat terkecil tertimbang, disediakan


varians kesalahan heteroskedastis, σ 2 saya, dikenal.
5. Dengan adanya heteroskedastisitas, varians dari estimator OLS tidak disediakan oleh rumus OLS biasa.
Tetapi jika kita tetap menggunakan rumus OLS biasa, file t dan
F pengujian yang didasarkan padanya bisa sangat menyesatkan, sehingga menghasilkan kesimpulan yang salah.

6. Mendokumentasikan konsekuensi heteroskedastisitas lebih mudah daripada mendeteksinya. Ada beberapa tes diagnostik
yang tersedia, tetapi tidak ada yang tahu pasti mana yang akan berhasil dalam situasi tertentu.

7. Sekalipun heteroskedastisitas dicurigai dan dideteksi, tidaklah mudah untuk memperbaiki masalah. Jika sampelnya besar,
seseorang dapat memperoleh kesalahan standar terkoreksi heteroskedastisitas White dari penduga OLS dan melakukan
inferensi statistik berdasarkan kesalahan standar ini.

8. Jika tidak, berdasarkan residual OLS, seseorang dapat membuat tebakan terpelajar tentang kemungkinan pola
heteroskedastisitas dan mengubah data asli sedemikian rupa sehingga dalam data yang ditransformasikan tidak ada
heteroskedastisitas.

LATIHAN Pertanyaan

11.1. Negara dengan alasan singkat apakah pernyataan berikut benar, salah, atau tidak pasti:

Sebuah. Dengan adanya heteroskedastisitas, penduga OLS juga bias


tidak efisien.

b. Jika ada heteroskedastisitas, yang konvensional t dan F tes tidak valid.


c. Dengan adanya heteroskedastisitas, metode OLS biasa selalu berlebihan.
sobat kesalahan standar penduga.
d. Jika residual diperkirakan dari regresi OLS menunjukkan pola sistematis, itu
berarti heteroskedastisitas hadir dalam data.
e. Tidak ada uji umum heteroskedastisitas yang bebas dari asumsi apapun
variabel mana yang berhubungan dengan istilah kesalahan.

f. Jika model regresi salah dispesifikasikan (misalnya, variabel penting dihilangkan), maka
Residu OLS akan menunjukkan pola yang berbeda.

g. Jika regressor yang memiliki varian tidak konstan (salah) dihilangkan dari a
model, residual (OLS) akan menjadi heteroskedastis.

11.2. Dalam regresi upah rata-rata ( W, $) tentang jumlah karyawan ( N) untuk sebuah
sampel acak dari 30 perusahaan, diperoleh hasil regresi berikut: *

Ŵ = 7,5 + 0,009 N t = na
(1)
(16.10) R 2 = 0.90
Ŵ / N = 0,008 + 7,8 (1 / N)
(2)
t = ( 14.43) (76,58) R 2 = 0,99

Sebuah. Bagaimana Anda menafsirkan dua regresi?

b. Apa yang penulis asumsikan dalam pergi dari Persamaan. (1) ke Persamaan. (2)? Apakah dia khawatir
tentang heteroskedastisitas? Bagaimana Anda tahu?

c. Dapatkah Anda menghubungkan kemiringan dan perpotongan kedua model tersebut?

d. Bisakah Anda membandingkan R 2 nilai dari dua model? Mengapa atau mengapa tidak?

*
Lihat Dominick Salvatore, Ekonomi Manajerial, McGraw-Hill, New York, 1989, hal. 157.
402 Bagian kedua Melonggarkan Asumsi Model Klasik

11.3. Sebuah. Bisakah Anda memperkirakan parameter model

| ûi|= √
√ β 1 + β 2 X i + v saya
| ûi|= β1+β2 X2 i + v saya

dengan metode kuadrat terkecil biasa? Mengapa atau mengapa tidak?

b. Jika tidak, dapatkah Anda menyarankan metode, informal atau formal, untuk memperkirakan parame-
ters model seperti itu? (Lihat Bab 14.)
11.4. Meskipun model log seperti yang ditunjukkan pada Persamaan. (11.6.12) sering mengurangi heteroskedastisitas,
seseorang harus memperhatikan sifat-sifat istilah gangguan model tersebut. Misalnya saja modelnya

Y i = β 1 X β 2saya u saya (1)

dapat ditulis sebagai

ln Y i = ln β 1 + β 2 ln X i + ln u saya (2)

Sebuah. Jika ln u saya adalah memiliki harapan nol, apa yang harus menjadi distribusinya u saya?

b. Jika E (u i) = 1, akan E ( ln u i) = 0? Mengapa atau mengapa tidak?

c. Jika E ( ln u saya) bukan nol, apa yang bisa dilakukan untuk menjadikannya nol?

11.5. Menunjukkan bahwa β2 ∗dari Persamaan. (11.3.8) bisa juga o∑diekspresikan sebagai

saya x ∗
β 2∗ = ∑ w saya y ∗ ∗ saya
w saya saya
x2

dan var ( β ∗ 2) diberikan dalam Persamaan. (11.3.9) juga bisa expresse d sebagai

var ( β ∗2) = ∑ 1
w saya saya
x2∗

dimana y ∗ i = Y saya - • ∗ dan x ∗ i = X saya - X̄ ∗ mewakili penyimpangan dari yang tertimbang


cara • ∗ dan X̄ ∗ didefinisikan sebagai

∑ /∑
• ∗= w saya Y saya / ∑ w saya


X̄ ∗ = w saya X saya w saya

11.6. Untuk tujuan pedagogik, Hanushek dan Jackson memperkirakan model berikut:

C t = β 1 + β 2 GNP t + β 3 D t + u saya (1)

dimana C t = agregat pengeluaran konsumsi swasta dalam setahun t, GNP t = produk nasional bruto pada tahun t, dan
D = pengeluaran pertahanan nasional dalam setahun t, itu
Tujuan dari analisis adalah untuk mempelajari pengaruh pengeluaran pertahanan terhadap pengeluaran lain dalam
perekonomian.
Mendalilkan itu σ 2 t=σ2( GNP t) 2, mereka mengubah (1) dan memperkirakan

C t / GNP t = β 1 ( 1 / GNP t) + β 2 + β 3 ( D t / GNP t) + u t / GNP t (2)


Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 403

Hasil empiris berdasarkan data untuk tahun 1946–1975 adalah sebagai berikut (kesalahan standar dalam tanda
kurung): *

Ĉ t = 26.19 + 0,6248 GNP t - 0.4398 D t

(2.73) (0,0060) (0,0736) R 2 = 0,999


̂ Ĉ t / GNP t = 25.92 (1 / GNP t) + 0,6246 - 0,4315 ( D t / GNP t)

(2.22) (0,0068) (0,0597) R 2 = 0.875

Sebuah. Asumsi apa yang dibuat oleh penulis tentang sifat heteroskedastisitas?
Bisakah Anda membenarkannya?

b. Bandingkan hasil dari dua regresi. Memiliki transformasi yang asli


model akhir meningkatkan hasil, yaitu mengurangi kesalahan standar yang diperkirakan? Mengapa atau mengapa

tidak?

c. Bisakah Anda membandingkan keduanya R 2 nilai? Mengapa atau mengapa tidak? ( Petunjuk: Periksa
Variabel dependen.)
11.7. Lihat estimasi regresi dalam Persamaan. (11.6.2) dan (11.6.3). Hasil regresi sangat mirip. Apa
yang dapat menjelaskan hasil ini?
11.8. Buktikan jika w i = w, konstanta, untuk masing-masing saya, β ∗ 2 dan β̂ 2 serta variansnya
identik.
11.9. Lihat rumus (11.2.2) dan (11.2.3). Menganggap

σ i2= σ 2 k saya

dimana σ 2 adalah konstanta dan di mana k saya adalah dikenal bobot, belum tentu semuanya sama.

Dengan menggunakan asumsi ini, tunjukkan bahwa varians yang diberikan dalam Persamaan. (11.2.2) bisa
diekspresikan sebagai


saya k saya
var ( β̂ 2) = ∑ σ 2 ∑ x 22
x 2saya
· x saya

Suku pertama di sisi kanan adalah rumus varians yang diberikan dalam Persamaan. (11.2.3), itu
adalah, var ( β̂ 2) di bawah homoskedastisitas. Apa yang dapat Anda katakan tentang sifat rela-
hubungan antara var ( β̂ 2) di bawah heteroskedastisitas dan di bawah homoskedastisitas? ( Petunjuk: Periksa
suku kedua di sisi kanan rumus sebelumnya.) Bisa
Anda menarik kesimpulan umum tentang hubungan antara Persamaan. (11.2.2) dan (11.2.3)?

11.10. Di model

Y i = β 2 X i + u saya ( catatan: tidak ada intersepsi)

Anda diberitahu bahwa var ( u i) = σ 2 X 2 i. Tunjukkan t ∑topi

2
X 4saya
var ( β̂ 2) = ( σ ∑ )
X saya
22

*
Eric A. Hanushek dan John E. Jackson, Metode Statistik untuk Ilmuwan Sosial, Academic, New York,
1977, hal. 160.
404 Bagian kedua Melonggarkan Asumsi Model Klasik

Latihan Empiris
11.11. Untuk data yang diberikan pada Tabel 11.1, kompensasi rata-rata regresi Y rata-rata
produktifitas X, memperlakukan ukuran lapangan kerja sebagai unit observasi. Interpretasikan hasil Anda, dan lihat apakah

hasil Anda sesuai dengan yang diberikan dalam Persamaan. (11.5.3).

Sebuah. Dari regresi sebelumnya diperoleh residual û i.


b. Setelah uji Park, regresi ln û 2 saya di ln X saya dan verifikasi regresi
Persamaan. (11.5.4).

c. Mengikuti pendekatan Glejser, regresi | û i | di X saya dan kemudian mundur | û i | di X saya
dan mengomentari hasil Anda.
d. Temukan korelasi peringkat antara | û i | dan X saya dan mengomentari sifat dari dia T-

eroscedasticity, jika ada, hadir dalam data.


11.12. Tabel 11.6 memberikan data tentang rasio penjualan / kas dalam industri manufaktur AS yang diklasifikasikan
berdasarkan ukuran aset perusahaan untuk periode 1971 – I hingga 1973 – IV. (Data dibuat setiap tiga
bulan.) Rasio penjualan / kas dapat dianggap sebagai ukuran kecepatan pendapatan di sektor korporasi,
yaitu berapa kali dolar berbalik.
Sebuah. Untuk setiap ukuran aset, hitung tema dan deviasi standar dari rasio penjualan / kas.

b. Plot nilai rata-rata terhadap deviasi standar seperti yang dihitung dalam ( Sebuah), menggunakan aset
ukuran sebagai unit observasi.
c. Melalui model regresi yang sesuai memutuskan apakah standar deviasi dari
rasio meningkat dengan nilai rata-rata. Jika tidak, bagaimana Anda merasionalisasi hasilnya?

d. Jika ada hubungan yang signifikan secara statistik antara keduanya, bagaimana Anda akan melakukannya
mengubah data sehingga tidak terjadi heteroskedastisitas?
11.13. Uji homogenitas-of-varians Bartlett. * Misalkan ada k sampel independen
varians s 2 1, s 2 2,. . . , s 2 k dengan f 1, f 2,. . . , f k df, masing-masing dari populasi yang ada
terdistribusi normal dengan mean µ dan varians σ 2 i. Misalkan lebih jauh yang kita inginkan

untuk menguji hipotesis nol H. 0: σ 2 1=σ2 2=· · · = σ2 k = σ 2; yaitu, setiap variabel sampel
ance adalah perkiraan varians populasi yang sama σ 2.
Jika hipotesis nol benar ∑ e, lalu
k

i=

f saya
2 s saya
s 2 = i = 1 ∑ f saya s 2
f saya f
TABEL 11.6
Tahun dan
Ukuran Aset (jutaan
Perempat 1–10 10–25 25–50 50–100 100–250 250–1.000 1.000
dolar)
1971-I 6.696 6.929 6.858 6.966 7.819 7.557 7.860
Sumber: Keuangan Kuartalan
- II 6.826 7.311 7.299 7.081 7.907 7.685 7.351
Laporan untuk Manufaktur
Korporasi, Perdagangan Federal 6.338
- AKU AKU AKU 7.035 7.082 7.145 7.691 7.309 7.088
Komisi dan Komisi Sekuritas dan - IV 6.272 6.265 6.874 6.485 6.778 7.120 6.765
Bursa,
Pemerintah AS, berbagai masalah 1972-I 6.692 6.236 7.101 7.060 7.104 7.584 6.717
(dihitung).
- II 6.818 7.010 7.719 7.009 8.064 7.457 7.280
6.783
- AKU AKU AKU 6.934 7.182 6.923 7.784 7.142 6.619
- IV 6.779 6.988 6.531 7.146 7.279 6.928 6.919
1973 – I 7.291 7.428 7.272 7.571 7.583 7.053 6.630
- II 7.766 9.071 7.818 8.692 8.608 7.571 6.805
7.733
- AKU AKU AKU 8.357 8.090 8.357 7.680 7.654 6.772
- IV 8.316 7.621 7.766 7.867 7.666 7.380 7.072

*
Lihat "Sifat Uji Kecukupan dan Statistik," Prosiding Royal Society of London A,
vol. 160, 1937, hal. 268.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 405

memberikan perkiraan dari perkiraan umum (gabungan) dari varians populasi


σ 2, dimana f i = ( n saya - 1), n saya menjadi jumlah pengamatan di saya kelompok th dan dimana f = ∑ k

i = 1 f i.
Bartlett telah menunjukkan bahwa hipotesis nol dapat diuji dengan rasio A / B,
yang kira-kira didistribusikan sebagai t ∑ dia χ ( 2 distribusi dengan k - 1 df, dimana
)
A = f ln s 2 - f saya ln ssaya
2

dan
[∑ () ]
1 1- 1
B=1+
3 ( k - 1) f saya f

Terapkan uji Bartlett ke data Tabel 11.1 dan verifikasi bahwa hipotesis bahwa variasi populasi dari
kompensasi karyawan adalah sama di setiap ukuran lapangan kerja dari perusahaan tidak dapat
ditolak pada tingkat signifikansi 5 persen.
Catatan: f saya, df untuk setiap varians sampel, adalah 9, karena n saya untuk setiap sampel (yaitu, kelas pekerjaan)
adalah 10.

11.14. Pertimbangkan model regresi-melalui-asal berikut:

Y i = β X i + u saya, untuk i = 1, 2

Anda diberitahu itu u 1 ∼ N ( 0, σ 2) dan u 2 ∼ N ( 0, 2 σ 2) dan secara statistik


independen. Jika X 1 = + 1 dan X 2 = - 1, dapatkan tertimbang Estimasi kuadrat terkecil (WLS) sebesar β dan
variasinya. Jika dalam situasi ini Anda salah mengira itu
dua varian kesalahan itu sama (katakanlah, sama dengan σ 2), apa yang akan menjadi penaksir OLS β? Dan
variasinya? Bandingkan perkiraan ini dengan perkiraan yang diperoleh dengan metode WLS. Kesimpulan
umum apa yang Anda buat? *

11.15. Tabel 11.7 memberikan data tentang 81 mobil tentang MPG (rata-rata mil per galon), HP (tenaga kuda mesin), VOL
(kaki kubik ruang kabin), SP (kecepatan tertinggi, mil per jam), dan WT (berat kendaraan dalam 100 lbs. ).

Sebuah. Pertimbangkan model berikut:

MPG i = β 1 + β 2 SP i + β 3 HP i + β 4 WT i + u saya

Perkirakan parameter model ini dan tafsirkan hasilnya. Apakah mereka masuk akal secara ekonomi?

b. Apakah Anda mengharapkan varian kesalahan dalam model sebelumnya menjadi heteroskedas-
tic? Mengapa?

c. Gunakan uji Putih untuk mengetahui apakah varian kesalahan adalah heteroskedastis.

d. Dapatkan kesalahan standar konsisten heteroskedastisitas White dan t nilai dan


bandingkan hasil Anda dengan yang diperoleh dari OLS.

e. Jika heteroskedastisitas ditetapkan, bagaimana Anda akan mengubah data sehingga masuk
data yang ditransformasikan varians kesalahan homoscedastic? Tunjukkan kalkulasi yang diperlukan.

11.16. Pengeluaran makanan di India. Pada Tabel 2.8 kami telah memberikan data tentang pengeluaran untuk makanan

dan total pengeluaran untuk 55 keluarga di India.

Sebuah. Atur kembali pengeluaran untuk makanan pada total pengeluaran, dan periksa sisa-sisanya
diperoleh dari regresi ini.
b. Plot residu yang diperoleh di ( Sebuah) terhadap total pengeluaran dan lihat apakah Anda mengamati
pola sistematis apa pun.

*
Diadaptasi dari FAF Seber, Analisis Regresi Linier, John Wiley & Sons, New York, 1977, hal. 64.
406 Bagian kedua Melonggarkan Asumsi Model Klasik

TABEL 11.7 Data Jarak Tempuh Mobil Penumpang

Pengamatan MPG SP HP VOL WT Pengamatan MPG SP HP VOL WT

1 65.4 96 49 89 17.5 42 32.2 106 95 106 30.0


2 56.0 97 55 92 20.0 43 32.2 109 102 92 30.0
3 55.9 97 55 92 20.0 44 32.2 106 95 88 30.0
4 49.0 105 70 92 20.0 45 31.5 105 93 102 30.0
5 46.5 96 53 92 20.0 46 31.5 108 100 99 30.0
6 46.2 105 70 89 20.0 47 31.4 108 100 111 30.0
7 45.4 97 55 92 20.0 48 31.4 107 98 103 30.0
8 59.2 98 62 50 22.5 49 31.2 120 130 86 30.0
9 53.3 98 62 50 22.5 50 33.7 109 115 101 35.0
10 43.4 107 80 94 22.5 51 32.6 109 115 101 35.0
11 41.1 103 73 89 22.5 52 31.3 109 115 101 35.0
12 40.9 113 92 50 22.5 53 31.3 109 115 124 35.0
13 40.9 113 92 99 22.5 54 30.4 133 180 113 35.0
14 40.4 103 73 89 22.5 55 28.9 125 160 113 35.0
15 39.6 100 66 89 22.5 56 28.0 115 130 124 35.0
16 39.3 103 73 89 22.5 57 28.0 102 96 92 35.0
17 38.9 106 78 91 22.5 58 28.0 109 115 101 35.0
18 38.8 113 92 50 22.5 59 28.0 104 100 94 35.0
19 38.2 106 78 91 22.5 60 28.0 105 100 115 35.0
20 42.2 109 90 103 25.0 61 27.7 120 145 111 35.0
21 40.9 110 92 99 25.0 62 25.6 107 120 116 40.0
22 40.7 101 74 107 25.0 63 25.3 114 140 131 40.0
23 40.0 111 95 101 25.0 64 23.9 114 140 123 40.0
24 39.3 105 81 96 25.0 65 23.6 117 150 121 40.0
25 38.8 111 95 89 25.0 66 23.6 122 165 50 40.0
26 38.4 110 92 50 25.0 67 23.6 122 165 114 40.0
27 38.4 110 92 117 25.0 68 23.6 122 165 127 40.0
28 38.4 110 92 99 25.0 69 23.6 122 165 123 40.0
29 46.9 90 52 104 27.5 70 23.5 148 245 112 40.0
30 36.3 112 103 107 27.5 71 23.4 160 280 50 40.0
31 36.1 103 84 114 27.5 72 23.4 121 162 135 40.0
32 36.1 103 84 101 27.5 73 23.1 121 162 132 40.0
33 35.4 111 102 97 27.5 74 22.9 110 140 160 45.0
34 35.3 111 102 113 27.5 75 22.9 110 140 129 45.0
35 35.1 102 81 101 27.5 76 19.5 121 175 129 45.0
36 35.1 106 90 98 27.5 77 18.1 165 322 50 45.0
37 35.0 106 90 88 27.5 78 17.2 140 238 115 45.0
38 33.2 109 102 86 30.0 79 17.0 147 263 50 45.0
39 32.9 109 102 86 30.0 80 16.7 157 295 119 45.0
40 32.3 120 130 92 30.0 81 13.2 130 236 107 55.0
41 32.2 106 95 113 30.0

catatan:
VOL = kaki kubik ruang kabin. HP =
tenaga kuda mesin.
MPG = rata-rata mil per galon.
SP = kecepatan tertinggi, mil per jam.
WT = berat kendaraan, ratusan pound.
Pengamatan = nomor pengamatan mobil (Nama mobil tidak diungkapkan).

Sumber: Badan Perlindungan Lingkungan AS, 1991, Laporan EPA / AA / CTAB / 91-02.
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 407

c. Jika plot di ( b) menunjukkan bahwa ada heteroskedastisitas, terapkan Park, Glejser,


dan tes White untuk mengetahui apakah kesan heteroskedastisitas diamati pada ( b)
didukung oleh tes ini.
d. Dapatkan kesalahan standar konsisten heteroskedastisitas White dan bandingkan itu
dengan kesalahan standar OLS. Putuskan apakah perlu untuk mengoreksi heteroskedastisitas dalam contoh
ini.

11.17. Ulangi Latihan 11.16, tetapi kali ini turunkan logaritma pengeluaran makanan ke dalam logaritma pengeluaran
total. Jika Anda mengamati heteroskedastisitas dalam model linier Latihan 11.16 tetapi tidak dalam model
log-linier, kesimpulan apa yang Anda tarik? Tunjukkan semua kalkulasi yang diperlukan.

11.18. Jalan pintas ke tes White. Seperti disebutkan dalam teks, tes Putih dapat memakan derajat
kebebasan jika ada beberapa regressor dan jika kita memperkenalkan semua regressor, istilah kuadratnya, dan
produk persilangannya. Oleh karena itu, alih-alih memperkirakan regresi seperti Persamaan. (11.5.22), mengapa
tidak menjalankan saja regresi berikut:

2 + ν saya
û 2i = α 1 + α 2 Ŷ i + α 2 Ŷ saya

dimana Ŷ saya adalah perkiraannya Y ( yaitu, regresi dan) nilai dari model apa pun Anda
memperkirakan? Lagipula, Ŷ saya hanyalah rata-rata tertimbang dari para regressor, dengan estimasi
koefisien regresi berfungsi sebagai bobot.
Dapatkan R 2 nilai dari regresi sebelumnya dan gunakan Persamaan. (11.5.22) untuk menguji hipotesis bahwa
tidak terdapat heteroskedastisitas.
Terapkan tes sebelumnya pada contoh pengeluaran makanan dari Latihan 11.16.

11.19. Kembali ke contoh R&D yang dibahas dalam Bagian 11.7 (Latihan 11.10). Ulangi contoh yang menggunakan laba sebagai
regressor. A priori, apakah Anda mengharapkan hasil Anda berbeda dari yang menggunakan penjualan sebagai
regressor? Mengapa atau mengapa tidak?

11.20. Tabel 11.8 memberikan data tentang gaji median profesor penuh statistik di universitas riset di Amerika
Serikat untuk tahun akademik 2007.
Sebuah. Buat grafik gaji rata-rata terhadap tahun dalam peringkat (sebagai ukuran tahun pengalaman).
Untuk tujuan perencanaan, asumsikan bahwa gaji median mengacu pada titik tengah tahun dalam peringkat. Jadi,
gaji $ 124.578 dalam kisaran 4–5 mengacu pada pangkat 4,5 tahun, dan seterusnya. Untuk kelompok terakhir,
asumsikan bahwa kisarannya adalah 31–33.

b. Pertimbangkan model regresi berikut:

Y i = α 1 + α 2 X i + u saya (1)

Yi=β1+β2 Xi+β3 X2 i + ν saya


(2)

TABEL 11.8
Tahun dalam Peringkat Menghitung Median
Gaji Median untuk
Profesor Penuh di 0 sampai 1 40 $ 101.478
Statistik, 2007 2 sampai 3 24 102.400
4 sampai 5 35 124.578
Sumber: Statistik Amerika
6 sampai 7 34 122.850
Association, “2007 Gaji
Melaporkan." 8 sampai 9 33 116.900
10 sampai 14 73 119.465
15 sampai 19 69 114.900
20 hingga 24 54 129.072
25 sampai 30 44 131.704
31 atau lebih 25 143.000
408 Bagian kedua Melonggarkan Asumsi Model Klasik

dimana Y = gaji rata-rata, X = tahun dalam peringkat (diukur di titik tengah kisaran), dan u dan v adalah istilah
kesalahan. Bisakah Anda berdebat mengapa model (2) mungkin lebih disukai daripada model (1)? Dari data yang
diberikan, perkirakan kedua model tersebut.

c. Jika Anda mengamati heteroskedastisitas dalam model (1) tetapi tidak dalam model (2), apa kontra
klusi yang akan kamu gambar? Tunjukkan perhitungan yang diperlukan.

d. Jika heteroskedastisitas diamati dalam model (2), bagaimana Anda akan mentransformasikan data
sehingga dalam model yang ditransformasikan tidak ada heteroskedastisitas?

11.21. Anda diberi data berikut:

RSS 1 berdasarkan 30 observasi pertama = 55, df = 25 RSS 2 berdasarkan

30 observasi terakhir = 140, df = 25

Lakukan uji heteroskedastisitas Goldfeld-Quandt pada tingkat signifikansi 5 persen.

11.22. Tabel 11.9 memberikan data perubahan persen per tahun untuk harga saham ( Y) dan konsumen
harga ( X) untuk penampang 20 negara.
Sebuah. Plot data dalam sebar.
b. Regresi Y di X dan memeriksa residual dari regresi ini. Apa yang kamu
mengamati?

c. Karena data untuk Chili tampak tidak umum (pencilan?), Ulangi regresi di ( b),
menjatuhkan data di Chili. Sekarang periksa residual dari regresi ini. Apa yang Anda
amati?
d. Jika berdasarkan hasil di ( b) Anda menyimpulkan bahwa ada heteroskedastis-
ity dalam varian kesalahan tetapi berdasarkan hasil di ( c) Anda membalikkan kesimpulan Anda, kesimpulan
umum apa yang Anda tarik?

TABEL 11.9
Tingkat Perubahan,% per Tahun Harga
Stok dan Konsumen
Harga, Post – World Saham, Harga Konsumen,
Periode Perang II Negara Y X
(sampai 1969)
1. Australia 5.0 4.3
Sumber: Phillip Cagan, Nilai dan 2. Austria 11.1 4.6
Inflasi Saham Biasa: Catatan Sejarah
3. Belgia 3.2 2.4
Banyak Negara, Biro Riset Ekonomi
Nasional, Suppl., 4. Kanada 7.9 2.4
5. Chili 25.5 26.4
Maret 1974, Tabel 1, hal. 4.
6. Denmark 3.8 4.2
7. Finlandia 11.1 5.5
8. Prancis 9.9 4.7
9. Jerman 13.3 2.2
10. India 1.5 4.0
11. Irlandia 6.4 4.0
12. Israel 8.9 8.4
13. Italia 8.1 3.3
14. Jepang 13.5 4.7
15. Meksiko 4.7 5.2
16. Belanda 7.5 3.6
17. Selandia Baru 4.7 3.6
18. Swedia 8.0 4.0
19. Inggris Raya 7.5 3.9
20. Amerika Serikat 9.0 2.1
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 409

11.23. Tabel 11.10 dari website memberikan gaji dan data terkait pada 447 eksekutif perusahaan Fortune 500. Data
termasuk gaji = gaji 1999 dan bonus; totcomp = kompensasi total CEO 1999; masa kerja = jumlah tahun
sebagai CEO (0 jika kurang dari 6 bulan); usia = usia CEO; penjualan = total pendapatan penjualan tahun 1998
dari perusahaan; laba = laba 1998 bagi perusahaan; dan aset = total aset perusahaan pada tahun 1998.

Sebuah. Perkirakan regresi berikut dari data ini dan dapatkan Breusch–
Statistik Pagan – Godfrey untuk memeriksa heteroskedastisitas:

gaji i = β 1 + β 2 masa jabatan i + β 3 usia i + β 4 penjualan i + β 5 keuntungan i + β 6 aktiva i + u saya

Apakah tampaknya ada masalah dengan heteroskedastisitas?

b. Sekarang buat model kedua menggunakan ln (Gaji) sebagai variabel dependen. Disana
ada peningkatan dalam heteroskedastisitas?

c. Buat tabel gaji vs. masing-masing variabel independen. Bisakah kau


cern variabel mana yang berkontribusi terhadap masalah ini? Saran apa yang akan Anda buat sekarang untuk
mengatasi hal ini? Apa model terakhir Anda?

Lampiran 11A

11A.1 Bukti Persamaan (11.2.2)

Dari Lampiran 3A, Bagian 3 (A.3, kami punya


)
2
var ( β̂ 2) = E (k 2 2 1 u 1 + k 2 22 u 2 + · · · + k n u 2 n) + 2 istilah produk silang

= E k2 1 u 12 + k 2 2 u2 + · · · + k 2 n u n2

karena ekspektasi istilah produk silang adalah nol karena asumsi tidak ada korelasi serial,

() () ()
2
var ( β̂ 2) = k 2 1E u2 1+k2 2E u2 2+· · · + k2 nE un

sejak k saya dikenal. (Mengapa?)

2
var ( β̂ 2) = k 2 1 σ 12 + k 2 σ 2 2+· · · + k2 n σ n2

sejak E (u 2 i) = σ 2 i.

var ( β̂ 2) = k22
[ saya σ ) ]
∑ ( saya 2

= ∑ x saya σ saya
2 sejak k i = ∑ x saya (11.2.2)
x saya
2 x saya
2


saya σ)
= ( ∑ x2
saya
2

2
x saya
2

11A.2 Metode Kuadrat Terkecil Tertimbang

Untuk mengilustrasikan metode, kami menggunakan model dua variabel Y i = β 1 + β 2 X i + u i. Meminimalkan metode kuadrat terkecil tak berbobot

∑ ∑
û i2= ( Y saya - β̂ 1 - β̂ 2 X 2 i) (1)
410 Bagian kedua Melonggarkan Asumsi Model Klasik

untuk mendapatkan perkiraan, sedangkan metode kuadrat terkecil tertimbang meminimalkan jumlah sisa kuadrat tertimbang:

∑ ∑
w saya ûi =2

w saya ( Y saya - β̂ 1 - β 2 ˆ ∗ X i) 2 (2)

dimana β ∗ 1 dan β∗ 2 adalah penaksir kuadrat terkecil tertimbang dan di mana bobotnya w saya seperti itu

wi=1 (3)
σ saya
2

Artinya, bobot berbanding terbalik dengan varians u saya atau Y saya bergantung pada yang diberikan X saya,
dipahami bahwa var ( u i | X i) = var ( Y i | X i) = σ 2 i.
Membedakan Persamaan. (2) sehubungan dengan β̂ ∗ 1 dan β̂ ∗ 2, kami dapatkan


∂ w saya ûi =2 ∑
2 w saya ( Ysaya
-∗ β̂ 1- β ˆ ∗ 2 X i) ( - 1)
∂β ∗
∑1
∂ w saya ûi =2 ∑
∗- 2
2 w saya ( Y saya - β̂ 1 β̂ ∗ X i) ( - X i)
∂β ∗2

Mengatur ekspresi sebelumnya ∑ s sama dengan nol, kita mendapatkan dua persamaan normal berikut:

∗ ∑ ∗ ∑
w i + β̂ 2 w saya X saya (4)

∑ w saya Y i = β̂ 1 ∑ ∑

w saya X saya Y i = β̂ 1 w saya X i + β̂ ∗ 2
w saya Xsaya
2 (5)

Perhatikan persamaan antara persamaan normal ini dan persamaan normal kuadrat terkecil tidak berbobot.

Memecahkan persamaan ini secara bersamaan, kami dapatkan

β̂ 1∗ = • ∗ - β̂ ∗ ¯ 2X∗
(6)

dan (∑) (∑ ) (∑ ) (∑ )
w saya w saya X saya Y saya -) ( ∑ w saya X saya w saya Y saya
β̂ 2∗ = (∑) (∑ ) (11.3.8) = (7)
2
2
w saya w saya X saya - w saya X saya

Varians β̂ ∗ ained dengan cara varian β̂ 2 ditampilkan


dalam Lampiran 3A, Bagian 3A.3.
∑ ∑
w sayadalam
Catatan: • ∗ = ∑ 2 ditampilkan Y saya / Persamaan.
w saya dan X̄(11.3.9)
∗= dapat w saya X saya∑/
diperoleh w i. Seperti yang dapat dengan mudah diverifikasi, ini berbobot
Berarti sesuai dengan cara biasa atau tidak tertimbang • dan X̄ kapan w i = w, sebuah konstanta, untuk semua saya.

11A.3 Buktikan itu E ( σ̂ 2) σ 2 di Hadirat


dari Heteroskedastisitas

Pertimbangkan model dua variabel:

Y i = β 1 + β 2 X i + u saya (1)

where var ( u i) = σ 2 saya

Sekarang

∑ ∑ ∑ 2
û2= ( Y saya- Y)ˆ2saya
= [ β 1 + β 2 X i + u saya - β̂ 1 - β̂ 2 X saya]
σ̂ 2 = - saya
n2 n-2
(2)
∑n-2
[ - ( 1β̂- β 1) - ( β̂ 2 - β 2) X i + u saya] 2
=
n-2
Bab 11 Heteroskedastisitas: Apa yang Terjadi Jika Varians Kesalahan Tidak Konstan? 411

Memperhatikan itu ( β̂ 1 - β 1) = - ( β̂ 2 - β 2) X̄ + ū, dan menggantikan ini menjadi Persamaan. (2) dan mengambil ekspektasi di kedua sisi, kita

mendapatkan:

[∑ ]}
E ( ˆσ)2 = 1 { ∑ - x 2 var () β̂+2E ( u - ū) 2
n 2-[ ∑ saya
∑ ] saya (3)
saya σ
( n - 1) σ saya
2
- ∑ x2
saya
+
2
=1
n-2 x saya
2 n

dimana penggunaan terbuat dari Persamaan. (11.2.2).


2 = σ 2 untuk setiap i, E ( ˆ 2) = 2.
Seperti yang Anda lihat dari Persamaan. (3), jika ada homoskedastisitas, yaitu, nilai yang σ σ
diharapkan dihitung secara konvensional σ̂ 2 = σ saya ∑
û 2 / ( n - 2) tidak akan sama
dengan kebenaran σ 2 di hadapan heteroskedastisitas. 1

Kesalahan Standar Kuat 11A.4 White

Untuk memberi Anda gambaran tentang kesalahan standar yang dikoreksi heteroskedastisitas White, pertimbangkan model regresi dua
variabel:

Y i = β 1 + β 2 X i + u saya var ( u)saya


= σ2 saya
(1)

Seperti yang ditunjukkan pada Persamaan. (11.2.2),



ˆ 2= ( ∑ x 2 σ) 2
var ( β)
ii
(2)
2
x saya
2

Sejak σ 2 saya tidak dapat diamati secara langsung, White menyarankan untuk menggunakan û 2 kuadrat untuk masing-masing saya, di tempat
saya, sisa

dari σ saya
2
dan memperkirakan var ( β 2) sebagai berikut ∑ s:

x saya
2
û)
var ( β̂ 2) = ( ∑
saya
2

2
(3)
x saya
2

Putih telah menunjukkan Persamaan itu. (3) adalah penduga yang konsisten dari Persamaan. (2), yaitu, sebagai ukuran sampel meningkat tanpa
batas, Persamaan. (3) konvergen ke Persamaan. (2). 2

Secara kebetulan, perhatikan bahwa jika paket perangkat lunak Anda tidak berisi prosedur kesalahan standar kuat White, Anda dapat

melakukannya seperti yang ditunjukkan pada Persamaan. (3) dengan terlebih dahulu menjalankan regresi OLS biasa, mendapatkan residual dari

regresi ini, dan kemudian menggunakan rumus (3).

Prosedur White dapat digeneralisasikan ke k- model regresi variabel

Y i = β 1 + β 2 X 2 i + β 3 X 3 i + · · · + β k X ki + u saya (4)

Varians dari koefisien regresi parsial ∑ efisien, katakanlah β̂ j, diperoleh sebagai berikut:

Ji û 2
var ()βˆ j= ( ∑ ŵ 2) saya 2
(5)
ŵ 2Ji

dimana û saya adalah residual yang diperoleh dari regresi (asli) (4) dan ŵ j adalah residu
diperoleh dari regresi (tambahan) regressor X j pada regressor yang tersisa di Persamaan. (4).
Jelas, ini adalah prosedur yang memakan waktu, karena Anda harus memperkirakan Persamaan. (5) untuk masing-masing X

variabel. Tentu saja, semua persalinan ini dapat dihindari jika Anda memiliki paket statistik yang melakukan ini secara rutin. Paket seperti
PC-GIVE, EViews, MICROFIT, SHAZAM, STATA, dan LIMDEP sekarang mendapatkan kesalahan standar kuat heteroskedastisitas White
dengan sangat mudah.

1 Rincian lebih lanjut dapat diperoleh dari Jan Kmenta, Elemen Ekonometrika, 2d. ed., Macmillan, New York, 1986, hlm. 276–278.

2 Lebih tepatnya, n kali Persamaan. (3) kemungkinan bertemu E [(X saya - µ) 2 u 2


X i] / ( σ 2 X),
2 yang mana
batas probabilitas n kali Persamaan. (2), dimana n adalah ukuran sampel, µ x adalah nilai yang diharapkan dari X, dan σ 2 X adalah
varians (populasi) dari X. Untuk lebih jelasnya, lihat Jeffrey M. Wooldridge, Ekonometrika Pengantar:
Pendekatan Modern, South-Western Publishing, 2000, hal. 250.

Anda mungkin juga menyukai