KELOMPOK 3
NAMA KELOMPOK:
Asumsi penting regresi linear klasik (CLRM) adalah bahwa gangguan ui yang tecakup dalam
fungsi regresi populasi (PRS) bersifat homoskedatis : artinya, semua memiliki varian yang sama,
σ2. Jika tidak demikian , jika varians ui adalah σi2 , yang menunjukan bervariasi dari observasi ke
observasi (perhatikan subskrip pada σ2) berarti kita menghadapi situasi heteroskedastisitas, atau
varian tak sama, atau nonkonstan.
Peraga 13.1(a) melihatkan bahwa sewakti PDI naik, mean, atau tingkat rata-rata, tingkat
tabungan juga naik, tapi tabungan di sekitar nilai means tetap sama pada semua tingkat PDI.
Ingat bahwa PRF memberikan nilai mean, atau rata-rata variabel tak bebas untuk tingkat variabel
(variabel penjelas) tertentu. Inilah kasus homoskedastisitas , atau varians yang sama. Di sisi
lain, seperti dilihatkan peraha 13.1(b), meskipun tingkat tabungan rata-rata niak siring naiknya
PDI, varians tabungan tidak tetap sama di setiap tingkat PDI. Di sini varian niak bersama PDI.
Inilah kasus heteroskedastisitas atau varians tak sama. Bedanya, peraga 13.1(b) menunjukan
bahwa orang orang berpendapatan tinggi, secara rata- rata, menabung lebih banyak dari pada
orang berpendapatan rendah, tapi juga lebih memiliki variabelitas dalam tabungan mereka.
Antara April dan Mei 1975, Securities and Exchange Commision (Komisi Sekuritas dan Bursa
AS, SEC) melarang praktek tingkat komisi tetap dalam transaksi saham Bursa Efek New York
(NYSE) dan mengizinkan pialang saham untuk menagih komisi atas basis kompetitif. Tabel 13-1
menampilkan data tentang rata-rata komisi per saham (dalam sen AS) dari industri pialang
kepada investor selama periode kuartal terpilih antara April 1975 dan Desember 1978.
.
Perhatikan dua angka menarik dari tabel ini. Ada tren menurun dalam tingkat komisi
yang ditagih semenjak deregulasi. Tapi, lebih menariknya, ada perbedaan besar dalam komisi
rata -rata yang ditagih dan varians komisi dianta 4 kategori investor kelembagaan yang di
tampilkan dalam tabel ini. Investor kelembagaan terkecil, yang memiliki transaksi saham antara
0 – 199 saham, secara rata-rata, membayar komisi 46,5 sen persaham dengan varians 32,22,
sedang investor kelembagaan terbesar, rata-rata , hanya setingkat 10,1 sen persaham tapi dengan
varians hanya 3,18. Semua ini bisa dilihat dengan jelas dalam peraga 13-2.
Apa yang menimbulkan perbedaan ini? Salah satunya dalah efek skala semakin besar
volume transaksi, semakin rendah biaya total transaksinya, dan karna itu makinrendah pula biaya
rata-ratanya. Ekonomi akan mengatakan bahwa ada skala ekonomis dalam data industri pialang
yang di tampilkan di Tabel 13-1.
Jadi, bila kita hendak mengembangkan model regresi unutk menerangkan tingkat komisi
sebagai fungsi jumlah transaksi saham (dan variabel-variabel lain), varians kesalahan yang
berhubungan dengan klien transaksi tinggi akan lebih rendah dari pada yang berhubungan
dengan klien transaksi rendah .
Sebagai contoh data lintas sektoral murni dengan potensi heteroskedastisitas, perhatikan data
yang disajikan Tabel 13-2.. data ini terkait dengan pengeluaran penelitian dan pengembangan
(R&D) yang di tanggung oleh gabungan 18 industri (grouping) dikaitkan dengan penjualan dan
laba tahun 1988. Semua data adalah dalam jutaan dollar. karena masing-masing pengelompokan
industri merupakan kategori luas yang meliputi beberapa industri dengan perusahaan berukuran
berbeda jika kita hendak meregresikan pengeluaran r&d, katakanlah, terhadap penjualan,
menurut teori akan sulit mempertahankan asumsi heteroskedastisitas karena beragam nya
pengelompokan industry.
Mari kita anggap bahwa kita ingin mengetahui bagaimana hubungan pengeluaran R&D dengan
penjualan. untuk tujuan ini perhatikan model berikut ini :
Menurut teori kita akan memperkirakan hubungan positif antara kedua variabel ini, yang
tampaknya ditunjukkan oleh grafik pencar di peraga 13.3 yang memetakan pengeluaran R&D
terhadap penjualan
Hasil-hasil kuadrat terkecil biasa atau OLS persamaan 13.2 adalah sebagai berikut
^
R∧D i=1172,69+0,0238 penjualani
se =( 1127,69 ) ( 0,0103 ) (13.3)
t=( 1,0300 ) ( 2,3121 ) r 2=0,2504
Hal yang menarik tentang peraga 13.3 bukanlah karena secara rata-rata pengeluaran R&D naik
seiring layaknya penjualan tapi karena varietas pengeluaran R&D di sekitar garis regresi sampai
kelihatannya naik seiring kenaikan penjualan. artinya kelihatannya ada bukti heteroskedastisitas .
ini bisa dilihat lebih jelas bila kita memetakan residu residu dari regresi 13.3 terhadap masing-
masing observasi.
Dari peraga 13.4 jelaslah bahwa nilai absolute residu e naik bersama volume penjualan yang
kembali menunjukkan bahwa asumsi homoskedastisitas mungkin tidak bertahan dalam contoh
kita ini. karena itu kita harus meninjau ulang regresi 13.3 yang secara eksplisit didasarkan pada
asumsi homoskedastisitas.
Untuk diingat bahwa benar residu ei tidak sama dengan gangguan ui, meskipun residu ei cukup
mewakili kan. Oleh sebab itu, dari observasi varietas ei, kita tidak bisa secara categories
menyimpulkan bahwa varian ui juga ber variable tapi seperti akan kita lihat nanti dalam
prakteknya kita jarang melihat ui dan karena itu kita harus puas dengan hanya menggunakan e i
dengan kata lain menguji pola yang kita langsung dari kesimpulan seputar pola ui.
Ingat bahwa dengan asumsi CLRM, estimator OLS merupakan estimator tak bias linear terbaik
atau blue, artinya dalam kelas menaksir tak bias linier,penaksir kudrat terkecil memiliki varian
minimum yang efisien . sekarang asumsi kan bawa semua asumsi clrm berlaku kecuali asumsi
homoskedastisitas sehingga memungkinkan varian gangguan berbeda dari observasi ke
observasi. konsekuensi berikut ini dinyatakan tanpa bukti :
Peraga ini menampilkan contoh populasi Y yang di petakan terhadap nilai terpilih
variabel X. seperti diperlihatkan diagram ini, varians masing-masing sub populasi Y dengan X
tidak selalu sama, yang menunjukkan heteroskedastisitas . Anggap kita memiliki secara acak
nilai Y terhadap masing-masing nilai X. Lalu y seperti ini kita lingkari seperti ditunjukkan
persamaan 6.13
Untuk melihat hal ini lebih jelas mari kembali ke data R &D yang disajikan di tabel 13.2
untuk masing-masing pengelompokan industri dalam table, hanya ada satu angka R &D . Dari 1
angka R &D ini tidak cara untuk mengetahui varian R &D dalam kelompok itu. misalnya untuk
kelompok barangnya listrik dan elektronik tertawa pengeluaran R &D jelas sekitar 6107 dollar
dalam jutaan. Tetapi ada 171 perusahaan yang tercakup dalam kelompok ini kecuali bila kita
memiliki informasi tentang masing-masing perusahaan. kita tidak bisa mengatakan apapun
tentang variabelitas pengeluaran R &D dalam kelompok ini. Artinya jika kita membagi $1107
dengan 171 untuk memperoleh sekitar $38 (jutaan) sebagai pengeluaran R &D rata-rata
kelompok ini, kita tak bisa menentukan bagaimana pengeluaran R &D didistribusikan di sekitar
nilai meannya. Dengan kata lain kita tidak bisa menentukan berapa varian pengeluaran R &D
untuk kelompok ini. Hal yang sama berlaku untuk 17 kelompok industri lain yang ditampilkan di
table 13.2
Hasilnya dari data yang diberikan di table 13.2 , jika kita meregresikan R &D atas
penjualan, seperti yang kita lakukan di persamaan 13.3 kita tak tahu o yang berhubungan dengan
masing-masing observasi yakni masing-masing angka R &D. Regresi 13.3 dilakukan dengan
asumsi bahwa masing-masing observasi R &D di tabel 13-2 miliki varian o yang sama.
Sekarang kita berada di antara dua pulihan jika ada heteroskedastisitas dan kita
mengasumsikannya, begitu saja kita mungkin menarik kesimpulan menyesatkan atas dasar
prosedural ols yang biasa karena estimator OLS tidak BLUE.
Seperti dalam kasus multikolinearitas, kita tidak punya metode pasti untuk mendeteksi
heteroskedastisitas, kita hanya mempunyai beberapa perangkat diagnosa yang mungkin
membantu kita mendeteksinya. Beberapa alat diagnose itu adalah berikut ini.
Sifat Masalah
Sifat masalah yang tengah kita bahas ini seringkali terkait dengan ada-tidaknya
heteroskedastisitas. Sebagai contoh, berdasarkan riset pendahuluan Paris dan Houthakker
tentang studi anggaran perusahaan di mana mereka menemukan bahwa varians residu di
sekitar regresi konsumsi terhadap pendapatan naik bersama pendapatan, sekarang
umumnya diasumsikan bahwa dalam studi serupa kita bisa meneukan heteroskedastisitas
di dalam faktor kesalahan. Bahkan dalam data lintas sektoral yang melibatkan unit-unit
heterogen, heteroskedastisitas mungkin cenderung dijadikan auran ketimbang
pengecualian. Untuk itu, dalam studi lintas sektoral yang melibatkan pengeluaran
investasi dalam hubungannya dengan penjualan, tingkat bunga, dan lain-lain kita
umumnya akan menemukan terjadinya heteroskedastisitas bila perusahaan berukuran
kecil, sedang dan besar menempel sekaligus. Demikian pula dalam studi lintas sektoral
biaya produksi rata-rata dalam hubungannua dengan output, heteroskedastisitas
cenderung ditemukan bila perusahaan berukuran kecil, sedang, dan besar di masukkan ke
dalam sampel.
Dalam analisis regresi terapan, pengujian residu yang didaptkan dari persamaan regresi
yang digunakan selalu merupakan praktek yang baik. Residu-residu ini bisa dipetakan terhadap
obsevrasinya sendiri atau terhadap suatu variabel penjelas atau lebih tau terhadap Ŷi , nilai mean
taksiran, Yi. Plot Residu seperti itu sering member kita petunjuk tentang apaah suatu asumsi atau
lebih dari CLRM berlaku atau tidak, seperti yang akan kita bahas secara ringkas.
Seperti diungkap grafik ini, nilai (absolut) residu naik seiring peningkatan volume
penjualan. Sebenarnya grafik ini berbentuk megafon. Dalam datanya mungkin terdapat
heteroskedastisitas.
Kadang kita tak usah memetakan residu dengan penjualan (variabel penjelas manapun).
Kita cukup memetakan ei2 residu kuadrat, terhadap penjualan. Meskipun ei2 tidak sama dengan
μi2, sering kali cukup mewakili μi2 khususnya jika ukuran sampel cukup besar.
Sebelum memplot residu kuadrat terhadap penjualan untuk regresi R & D kita mari kita
perhatikan beberapa pola heteroskedastisitas yang mungkin kita hadapi ketika ei2 dipetakan
terhadap variable X. Pola ini seperti gambar 13-6.
Gambar 13-6(a) tak memperlihatkan adanya pola sistematis antara ei2 dan X, yang
menunjukkan bahwa mungkin tidak ada heteroskedastisitas di dalam datanya. Disisi lain gambar
13-6(b) hingga (e) menunjukkan hubungan sistematis antara residu kuadrat dengan variabel
penjelas X. misalnya, gambar 13-6(c) menunjukkan hubungan linear di antara keduanya,
sedangkan gambar 13-6(d) dan (e) menunjukkan hubungan kuadrat. Oleh sebab itu jika dalam
penerapannya residu kuadrat menunjukkan salah satu pola yang terampil dalam gambar 11-6(b)
hingga (e) ada kemungkinan bahwa heteroskedastisitas dalam data.
Camkan dalam benak anda bahwa pemetaan grafis sebelumnya hanyalah sebuah
perangkat diagnose. Bila kita mencurigasi adanya heteroskedastisitas, kita seharusnya
menindaklanjuti dengan lebih berhati-hati untuk memastikan bahwa kecurigaan ini tidak berakhir
sia-sia. Secara singkat kita akan tampilkan beberapa prosedur formal untuk secara tepat
melakukan hal itu.
Sementara itu kita bisa ajukan beberapa pertanyaan praktis. Anggap kita menghadapi
regresi berganda, kataknlah empat variabel X. Apa yang harus kita lakukan? Cara yang paling
sederhana untuk dilakukan adalah memetakan ei2 terhadap variabel masing-masing X. Pola ini
tergambar dalam gambar 13-6 mungkin pula bisa berlaku hanya dengan salah satu variabel X.
Kadang kita bisa memilih jalan pintas. Kita tidak memetakan ei2 terhadap masing-masing
variabel X, melainkan terhadap Ŷi hasil estimasi nilai mean Y. karena Ŷi merupakan kombinasi
kinear X, plot residu kuadrat terhadap Ŷi mungkin menunjukkan salah satu pola yang terampil di
gambar 13-6(b) hingga (e), dengan menganggap bahwa mungkin ada heteroskedastisitas dalam
data. hal ini menghindari perlunya membandingkan residu kuadrat terhadap variabel-variabel X
individual, khususnya bila jumlah variabel penjelas dalam model sangat besar.
Anggap kita memplot ei2 terhadap salah satu variabel X atau lebih terhadap Ŷi dan
selanjutnya anggap pemetaan itu menunjukkan adanya heteroskedastisitas. Lalu apa? Kita akan
tampilkan bagaimana pengetahuan mengenai keterkaitan ei2 dengan variabel X atau dengan Ŷi
memungkinkan kita mentransformasikan data asal, sebagai dalam data transformasi ini
heteroskedastisitas tidak terjadi lagi.
Sekarang mari kita kecontoh R&D terdahulu. Dalam gambar 13-7 kita memetakan
residu-residu kuadrat yang diestimasi dari regresi terhadap penjualan variabel penjelas dalam
model. Angka ini hampir menyerupai gambar 11-6(b) yang jelas menunjukkan bahwa residu
kuadrat secara sistematis terkait dengan penjualan. Diagram ini muncul kemungkinana bahwa
regresi R&D mengalami masalah heteroskedastisitas.
Uji Park
Uji yang menarik secara intuitif dan visual barusan bisa diformalkan. Jika ada
heteroskedastisitas, varians heteroskedastisitas σi2 mungkin bisa secara sistematis dihubungkan
dengan satu variabel penjelas atau lebih. Untuk melihat apakah memang demikian kita bisa
regresikan σi2 atas satu variabel X atau lebih. Misalnya, dalam model dua variabel kita bisa
lakukan regresi berikut ini:
In σi2 = B1 + B2 In Xi + vi (13.4)
Dimana vi adalah faktor residu. Ini persis dengan temuan Park. Dalam bentuk fungsional
khusus yang ia pilih dimaksudkan untuk penyederhanaan. Sayang regresi tidak bisa dilaksanakan
karena kita tau varians heteroskedastisitas σi2. Kalau saja kita tahu, kita bisa menuntaskan
masalah heteroskedastisitas dengan mudah, seperti yang ditampilkan di bagian 13.4 Park
menganjurkan penggunaan ei sebagai proksi untuk μi dan melakukan regresi berikut ini:
In ei2 = B1 + B2 In Xi + vi (13.5)
Dimana kita mendapatkan ei2? Kita bisa peroleh regresi dari regresi asal seperti model 13.3.
Dengan begitu Uji Park memerlukan langkah-langkah berikut ini:
Ketika residu yang diperoleh dari regresi ini diregresikan seperti dalam model 13.5 kita dapatkan
hasil berikut:
jelas, koefisien kemiringan yang diestimasi tidak signifikan secara statistik pada deraat 5% (tes
satu sisi) jika kita memilih tingkat signifikansi 5%.
Bila demikian, bisakah kita terima hipotesis bahwa dalam data R&D kita tidak
menghadapi masalah heteroskedastisitas? Tidak secepat itu, bentuk fungsional khusus yang
dipilih Park dalam regresi 13.5 hanyalah sugesti, bentuk fungsional lain mungkin member kita
kesimpulan berbeda. Tapi ada masalah yang lebih serius dengan tes Park yakni dalam regresi
13.5 faktor kesalahan vi mungkin juga heteroskedastisitas. Kita akan berjalan di tempat.
Diperlukan lebih banyak lagi pengujian sebelum kita bisa simpulkan bahwa regresi R&D tidak
mengalami heteroskedastisitas.
Uji Glejser
Uji glejser mirip dengan uji Park. Setelah mendapatkan residu ei dari model asal, glejser
mempertimbangkan regresi nilai absolute ei |ei| terhadap variabel X yang dianggao berhubungan
dekat dengan varians heteroskedastisitas σ2. Beberapa bentuk fungsional yang ia anjurkan untuk
regresi ini adalah
|ei| = B1 + B2 Xi + vi (13.7)
Hipotesis nol dalam masing-masing kasus adalah tidak ada heteroskedastisitas, yakni B2 = 0.
Jika hipotesis ini ditolak mungkin ada bukti heteroskedastisitas.
Hasil pengestimasian model ini dari residu-residu yang diperoleh dari regresi 13.3 adalah
Peringatan menyangkut uji glejser : seperti dalam kasus uji Park, faktor kesalahan V1 dalam
regresi yang dianjurkan oleh glajser bisa dengan sendirinya bersifat heteroskedastis, maupun
secara serial berkolerasi ( lihat bab 14 tentang korelasi serial). Namun glejser berpendapat
bahwa dalam sampel-sampel besar model di atas cukup baik dalam mendeteksi
heteroskedastisitas. Oleh sebab itu tes glejser bisa digunakan sebagai perangkat diagnostik dalam
sampel besar. regresi R&D kita hanya didasarkan atas 18 observasi karena itu hasil yang di
sajikan dalam regresi (13.10) hingga (13. 12) harus ditafsirkan dengan hati-hati.
Yaitu residu diperoleh dari regresi awal (13.13) dikuadratkan dan diregresikan pada
semua variable asal, nilai kuadratnya, dan perkalian silangnya. Pemangkatan tambahan
variable-variabel X asal juga bisa ditambahkan. Faktor vi adalah factor residu dalam
regresi pelengkap.
3. Tentukan nilai R2 dari regresi pelengkap (13.14). dengan hipotesis nol, bahwa tidak ada
heteroskedastitas (yakni semua koefisien kemiringan dalam persamaan (13.14) dikali
ukuran sampel (=n) mengikuti distribusi X2 dengan d.f sama dengan jumlah variable-
variabel penjelas dalam (13.14) (dengan menghilangkan factor titik potong)
n. R2 X2 k-1 (13.15)
Dimana (k-1) menujukkan d.f dalam model (13.14) d.f adalah 5
4. Jika nilai yang diperoleh dari persamaan (13.15) melebihi nilai kai-kuadrat kritis pada
tingkat signifikansi yang dipilih, atau jika nilai p nilai kai-kuadrat yang dihitung cukup
rendah (katakanlah 1% atau 5%) kita bisa menolak hipotesis nol tentang tidak adanya
heteroskedastisitas. Di sisi lain, jika nilai p nilai kai-kuadrat hitung cukup besar ( katakan
diatas 5% atau 10%) kita tidak bisa menolak hipotesis nol.
Contoh 13.5
Untuk mengilustrasikan tes white perhatikan data yang disajikan dalam tabel 13.5 soal 13. 18
dalam regresi 3.13 anggap y mewakili tingkat kematian bayi X2 produk nasional bruto per kapita
(GNP) dan X3 presentasi kelompok usia yang terdaftar dalam pendidikan dasar. menurut teori
GNP perkapita dan indikator pendidikan diperkirakan memiliki dampak negatif atas kematian
Mengapa hasil regresi nya adalah sebagai berikut
Seperti diperkirakan koefisien X2 dan X3 negatif. atas dasar uji satu sisi Mengapa? tes
satu sisi nilai p dan nilai t yang berhubungan dengan koefisien 2 kemiringan adalah sekitar 0,002
dan 0,000 separuh nilai p yang dilaporkan dalam persamaan 13.16
Seperti ditunjukkan dalam soal 13 titik 18 data yang disajikan dalam tabel 13 5
menyangkut 20 negara 5 diantaranya berpendapatan rendah 5 pendapatan sedang 5 pendapatan
sedang tinggi dan 5 sisanya berpendapatan tinggi dengan klasifikasi pendapatan yang digunakan
oleh Bank Dunia. karena kita memiliki sampel 20 negara dengan berbagai kondisi ekonomi
yang beragam seperti itu Menurut teori seharusnya kita memperkirakan adanya
heteroskedastisitas. untuk mengeceknya kita menggunakan uji white yang menggunakan model
13.14. hasil regresi ini disajikan dalam soal 13.15 yang menunjukkan bahwa nilai r kuadrat
adalah 0,230. lalu dengan menggunakan persamaan 13.5 kita menemukan
Dengan hipotesis nol bahwa tidak ada heteroskedastisitas nilai yang diberikan dalam
persamaan 13 titik 17 mengikuti distribusi Chi kuadrat dengan 5 DF. nilai P diperolehnya nilai k
y kuadrat sebesar 4,6 adalah sekitar 0,47 yang terhitung tinggi. karena itu berdasarkan tes kita
bisa simpulkan bahwa tak ada bukti heteroskedastisitas.
Salah satu kekurangan uji white adalah bahwa uji ini sangat umum. Jika ada beberapa
variable penjelas yang meliputi kuadratnya (atau pemangkatan yang lebih tinggi) dan perkalian
silangnya kedalam regresi (13.14) akan segera menghabiskan derajat kebebasan. Oleh karena itu,
kita harus cermat dalam memasukkan terlalu banyak factor kedalam regresi (13.14). kadang bisa
kita mengeluarkan factor perkalian silang berbagai variable dalam regresi (13.14)
Disamping penggunaan uji yang dibahas dalam (13.14) white juga mengemukakan
praktek statistic rutin untuk mengoreksi kesalahan standar yang diestimasi, seperti dalam regresi
seperti persamaan (13.16) untuk menentukan heteroskedastisitas. Kita akan membahas hal ini
dalam subbab 13.5
Yi = Bi + B2Xi + ui (13.18)
Dimana Y adalah, katakanlah pengeluaran R&D adalah X penjualan. Asumsika untuk sementara
bahwa varians kesalahan sebenarnya dengan σ i diketahui, yakni varians kesalahan untuk
masing-masing observasi diketahui. Sekarang perhatikan “transformasi” model (13.18) berikut
ini:
Yi 1 Xi ui
σi
= B1 ( ) ( ) ( )
σi
+ B2
σi
+
σi
(13.19)
Yang sudah kita lakukan disini adalah yang membagi atau “mendeflasi” baik sisi kiri maupun
kanan regresi (13.18) dengan σ i yang diketahui , yang praktis adalah akar kuadrat varians σ i2
Sekarang anggap
vi = ( uiσi ) (13.20)
Kita bisa sebut vi factor kesalahan yang “ditransformasikan”. Apakah vi homoskedastisitas? Jika
ya, maka regresi yang ditransformasikan (13.19) tidak mengalami masalah heteroskedastisitas.
Dengan mengasumsikan semua asumsi CLRM lain terpenuhi, estimor OLS dari parameter-
parameter dalam persamaan (13.19) akan menjadi BLUE dan kemudian kita bisa beranjak ke
inferensi statistic dengan cara biasa.
Sekarang tidak terlalu sulit melihay bahwa factor kesalahan vi homoskedastisitas. Dari
persamaan (13.20) kita peroleh
( uiσi 22 )
vi2 =
ui 2
E (v ) = E (
σi 2 )
2
i (13.21)
1
=(
σi 2 )
E (u ) karena σ
i
2
i
2
diketahui
=1 (13.22)
Yang jelas merupakan suatu konstanta. Pendeknya factor kesalahan transformasi vi bersifat
homoskedastis. Alhasil dari model transformasi (13.19) tidak mengalami masalah
heteroskedastisitas, sehingga bisa diestimasi dengan metode OLS biasa.
Pada dasarnya untuk mengestimasi regresi (13.19) anda harus menginstruksikan
computer untuk membagi masing-masing observasi Y dan X dengan σ i yang diketahui dan
melakukan regresi OLS atas data yang telah tertransformasikan. (sebagian besar program
computer sekarang sudah bisa melakukan ini) estimasi OLS B1 B2 yang diperoleh disebut
estimator kuadrat terkecil tertimbang (WLS, weighted Least Squares) : masing-masing observasi
X dan Y dibobot (yaitu, dibagi) dengan deviasi standar sendiri (heteroskedasitas), σ i karena
proseur pembobotan ini, metode OLS dalam konteks ini dikenal sebagai metode kuadrat terkecil
tertimbang (WLS).
Ketika σi2 yang Sebenarnya Tidak Diketahui
Meskipun cukup sederhana, metode WLS model (13.19) menimbulkan satu pertanyaan penting :
Bagaimana kita mengetahui atau mencari tahu varians kesalahan sebenarnya, σi2 ? seperti
disebutkan sebelumnya, pengetahuan tentang varians kesalahan sebenarnya langka. Karena itu,
bila kita ingin menggunakan metode WLS, kita harus memilih asumsi informal, meskipun cukup
masuk akal, tentang σi2 dan mentransformasikan model regresi asal sehingga model transformasi
memenuhi asumsi homoskedastisitas. OLS dengan begitu bisa diterapkan pada model
transformasi, karena, seperti diperlihatkan sebelumnya, WLS praktis adalah OLS yang
diterapkan pada data transformasi.
Ketika kita tidak mengetahui σi2 yang sebenarnya, pertanyaan praktisnya adalah asumsi –
asumsi apa yang bisa kita ambil tentang varians kesalahan tidak diketahui dan bagaimana kita
bisa menggunakan metode WLS? Di sini kita mempertimbangkan beberapa kemungkinan, yang
kita bahas dengan model dua variable (13.3); pengembangan hingga model regresi berganda bisa
dilakukan secara sederhana.
Yi 1 X u
= B1 + B2 i + i
√ Xi √ Xi √ Xi √ Xi
1
= B1 X + B2 √ X i + vi (13.24)
√ i
Dimana vi = ui √ X i . Artinya, kita membagi kedua sisi model (13.18) dengan akar kuadrat Xi,
persamaan (13.24) merupakan contoh apa yang dikenal sebagai transformasi akar kuadrat.
(u ¿ ¿ i 2) Xi
E(vi2) = E
Xi ( )
¿ = σ2
Xi
= σ2
Penting dicatat bahwa untuk mengestimasi persamaan (13.24) kita harus menggunakan
prosedur estimasi regresi melalui titik asal. Sebagian besar paket software resgresi standard
sudah biasa melakukan ini.
Untuk dara R&D terdahulu, dari peraga 13-7 yang dibahas sebrelumnya, kita menemukan
bahwa heteroskedastisitas mungkin terjadi dalam data. Dari peraga 13-7 tampak bahwa
varians kesalahan proporsiona terhadap variable penjualan. Karena itu, jika kita
menerima asumsi persamaan (13.23) dan mengestimasi persamaan (13.24), kita akan
mendapatkan hasil-hasil berikut ini :
Yi 1
= -46,632 + 0,-392 √ X i (13.25)
√ Xi √ Xi
se = (605,4713) (0,0122)
bagaimana hasil-hasil WLS ini dibandingkan dengan regresi OLS yang dibahas dalam
regresi (13.3)?
pertama, pembaca mungkin beranggapan bahwa kedua hasil ini tidak bisa
dibandingkan karena, variable tak bebas dan penjelas dalam kedua model ini berbeda.
Tapi beda ini lebih dari sekedar riil, karena setelah mendapatkan persamaan (13.25) kita
bisa mengalikan seterusnya dengan √ X iyang akan mengubah persamaan (13.25) menjadi
Yang bisa dibandingkan langsung dengan regresi (13.3). Ada sangat sedikit perbedaan
antara kedua koefisien kemiringan ini. Namun perhatika, bahwa dalam persamaan
(13.25) koefisien X secara staistik lebih signifikan daripada dalam regresi (13.3),
mengapa? Yang menunjukkan bahwa dalam regresi (13.3) OLS sebenarnya berlebihan
dalam menaksir kesalahan standard koefisien X. Seperti dibahas sebelumnya, saat
heteroskedastisitas terjadi, penaksir OLS kesalahan standard bias dan kita tidak bisa
mengatakan ke mana arah bias ini. Dalam kasus saat ini, bias ini menanjak; artinya terlalu
banyak terjadi penaksiran nilai kesalahan standard. Selama kita memperhitungkan titik
potong, kedua kasus ini tidaklah signifikan.
Jadi, kelihatannya asumsi (13.23) cocok untuk contoh R&D tadi. Sementara itu, hasil-
hasil regresi WLS yang disajikan dalam persamaan (13.25) kelihatannya lebih bisa
dipercaya karena kita secara eksplisit memperhitungkan masalah heteroskedastisitas.
Pertanyaan : Apa yang terjadi bila ada lebih dari satu variable penjelas dalam model
tersebut? Dalam kasus ini kita bisa mentransformasikan model seperti yang terlihat dalam
persamaan (13.24) dengan menggunakan variable manapun dari variable X yang katakanlah atas
dasar plot grafis, cenderung menjadi kandidat yang cocok (lihat soal 13.7). Tapi bagaimana jika
ada lebih dari satu variable X yang menjadi kandidat? Dalam kasus ini, kita tidak perlu
menggunakan variable manapun dari X; kita bisa menggunakan Ŷi, taksiran nilai mean Yi, sebagai
variable transformasi sebagai variable transformasi, karena seperti kita ketahui Ŷi adalah
kombinasi linear X.
Kasus 2 : Varians Kesalahan yang Proporsional Terhadap X i2, Jika hasil residu yang
diestimasi memperlihatkan pola yang mirip dengan Peraga 13-9, hal itu memperlihatkan
bahwa varians kesalahan tidak secara linear berhubungan dengan X, melainkan naik
secara proporsional terhadap kuadrat X. Secara simbolis,
Yi 1 ui
Xi
= ( ) ( )
B1 X + B2
i Xi
(13.28)
(1)
= B1 X + B2 + vi
i
Dimana vi = ui / Xi
Sifat menarik persamaan (13.28) adalah bahwa hal yang awalnya merupakan
koefisien kemiringan sekarang menjadi titik potong, dan apa yang awalnya titik potong
sekarang menjadi koefisien kemiringan. Tapi perubahan ini hanya untuk keperluan
estimasi; begitu kita mengestimasi persamaan (13.28) mengalikan dengan Xi di kedua sisi
kita akan kembali ke model awal.
Respesifikasi Model
Kita tidak perlu berspesifikasi tentang σi2, kadang respesifikasi PRF- memilih bentuk
fungsional yang berbeda (Lihat Bab 9 buku jilid 1) – bisa mengurangi heteroskedastisitas.
Sebagai contoh, kita tidak perlu mengerjakan regresi linear dalam variable (LIV);
sebaliknya, jika kita cukup mengestimasi model dalam bentuk log, hal itu serig
mengurangi heteroskedastisitas. Artinya, jika kita estimasi
In Yi = B1 + B2 In Xi+ ui (13.29)
Masalah heteroskedastisitas mungkin akan kurang besar dalam transformasi ini karena
transformasi log menekan skala-skala pengukuran variable. Sehingga mengurangi
sepuluh kali selisih di antara dua nilai ini menjadi selisih dua kali saja. Jadi, angka 90
adalah 10 kali angka 9, tapi In 90 (= 4,4998) hanya sekitar 2 kali besarnya In 9 (=
2,1972).
Keuntungan tak sengaja dari model log-linear, atau log-ganda seperti yang kita
lihat di Bab 9 adalah bahwa koefisien kemiringan B2 mengukur elastisitas Y dengan
mempertimbangkaan X, yakni perubahan persentase dalam Y setiap perubahan persentase
dalam X.
Dalam penerapan tertentu, apakah kita harus menggunakan model LIV ataukah
model log-linear? Jawabannya harus ditentukan oleh pertimbangan teoritis dan
pertimbangan lainnya yang kita bahas di Bab 11. Tapi jika ada preferensi yang kuat atas
salah satunya, dan jika masalah heteroskedastisitas sangat parah dalam model LIV, kita
bisa mencoba model log-ganda.
Untuk data R&D tadi, pasangan empiris regresi (13.29) adalah sebagai berikut :
se = (2,3889) (0,2195)
seperti diperlihatkan regresi ini, dalam bentuk log, pengeluaran R&D dan penjualan
berhubungan positif dan signifikan secara statistic. Hasil estimasi atas koefisien elastisitas
memperlihatkan bahwa peningkatan 1% dalam penjualan mengakibatkan, secara rata-rata
peningkatan ≈ 1,29 % dalam pengeluaran R&D, cateris patribus.
Dalam soal 13.9 kita diminta menguji regresi untuk mencari tahu apakah ada
heteroskedastisitas. Jika regresi (13.30) tidak diganggu oleh masalah heteroskedastisitas,
maka model ini lebih dianjurkan daripada model LIV. Bila maslah terjadi, maka kita
memerlukan transformasi variable, sebagaimana halnya dalam regresi (13.25).
Sambil berlanjut, perhatikan bahwa semua transformasi yang sudah kita bahas
sebelumnya untuk menghilangkan heteroskedastisitas dikenal dalam literature sebagai
transformasi penstabil varians, yang merupakan nama lain dari penetuan varians
homokedastisitas.
Untuk mengakhiri kesimpulan kita tentang solusi-solusi ini, harus kita ulangi lagi
bahwa semua transformasi yang sudah dibahas sebelumnya hingga taraf teretentu bersifat
informal; jika kita tidak punya pengetahuan persis tentang σi2 sebenarnya, kita pada
dasarnya tengah berspekulasi tentang seperti apa kemungkinannya. Transformasi mana
yang kita perkirakan akan berhasil tergantung pada sifat masalah dan derajat tingginya
heteroskedastisitas. Perhatikan pula bahwa kadang varians kesalahan mungkin tidak
terkait dengan variable penjelas manapun yang tercangkup dalam model. Sebaliknya,
mungkin terkait pada variable yang awalnya merupakan kandidat untuk dimasukkan
dalam model tapi akhirnya tidak dimasukkan. Dalam kasus model ini bisa
ditransformasikan dengan menggunakan variable tersebut. Tentu, jika suatu variable
secara logis menjadi milik model tersebut, variable itu seharusnya dimasukkan sejak
awal, seperti diungkap pada Bab 11.
jika suatu variabel secara logis menjadi milik model tersebut, variabel itu seharusnya
dimasukkan sejak awal, seperti diungkap di Bab 11.
Seperti telah kita ungkap, ketika heteroskedastisitas terjadi, estimator OLS, meskipun tak bias,
tidak efisien. Akibatnya, kesalahan standar yang dihitung secara konvensional dan statistik t dari
estimator pun dicurigai sebagai penyebabnya. White telah mengembangkan suatu prosedur
estimasi yang menghasilkan kesalahan standar koefisien-koefisien regresi diestimasi yang
mempertimbangkan heteroskedastisitas. Hasilnya, kita bisa terus menggunakan uji t dan F,
kecuali bahwa sekarang uji-uji itu valid secara asimptotis, yakni valid dalam sampel besar.
Untuk melihat bagaimana kesalahan standar OLS yang dihitung secara konvensional dan
statistik t bisa menyesatkan saat adanya heteroskedastisitas, mari kita kembali pada regresi
kematian bayi (13.16). Dengan menggunakan software statistik Eviews, kita mendapatkan
regresi koreksi heteroskedastisitas (White) berikut ini sebagai contohnya:
Membandingkan regresi koreksi heteroskedastisitas (13.16) dengan regresi (13.31), kita tidak
melihat perubahan yang berarti. Ini tidak mengejutkan, karena atas dasar tes heteroskedastisitas
White kita menemukan bahwa regresi (13.16) tidak mengalami masalah heteroskedastisitas.
Tentu, ini tidak selalu benar. Oleh sebab itu, Anda disarankan menyajikan kesalahan standar
biasa serta kesalahan standar koreksi heteroskedastisitas White untuk tujuan perbandingan.
Camkan bahwa metodologi White dibatasi penggunaannya dalam sampel besar saja.
Kita mengakhiri bab ini dengan menampilkan dua contoh untuk memperlihatkan pentingnya
heteroskedastisitas dalam terapan.
Bursa Efek New York (NYSE) awalnya sangat banyak bertentangan dengan deregulasi tingkat
komisi pialang. Nyatanya, dalam suatu studi ekonometri yang diajukan pada Komisi Sekuritas
dan Bursa (SEC) sebelum deregulasi diperkenalkan pada 1 Mei 1975, NYSE berpendapat bahwa
ada skala ekonomis dalam industri pialang sehingga komisi tingkat tetap (ditentukan secara
monopoli) bisa dibenarkan. Studi ekonometri yang diajukan NYSE pada dasarnya dibangun
berdasarkan regresi berikut ini:
di mana Y = biaya total dan X = jumlah transaksi saham. Dari model (13.32) kita melihat bahwa
biaya total secara positif terkait dengan volume transaksi. Tapi karena faktor kuadrat dalam
variabel transaksi negatif dan "signifikan secara statistik", hal ini menyiratkan bahwa biaya total
mengalami peningkatan pada tingkat yang menurun. Oleh sebab itu, menurut NYSE, ada skala
ekonomis dalam industri pialang, yang menjustifikasi status monopoli NYSE.
Perhatikan, tidak hanya faktor kuadrat yang secara statistik tak signifikan, tapi juga
menyesatkan. Oleh sebab itu, tidak ada skala ekonomis dalam industri pialang, yang
meruntuhkan argumen NYSE untuk mempertahankan struktur komisi monopoli.
Sebagai pendukung argumennya bahwa skala ekonomis dengan infrastruktur transportasi darat
yang superior akan bermanfaat melalui produktivitas yang lebih tinggi dan pertumbuhan
pendapatan per kapita, David A. Aschauer mendapatkan hasil-hasil yang ditampilkan dalam
Tabel 13-3. Karena studi ini dilakukan pada lintas sektor 48 negara bagian di Amerika Serikat,
"ada dugaan bahwa struktur kesalahan mungkin tidak homoskedastis."
Akan tetapi, dalam contoh ini dugaan heteroskedastisitas tak begitu berpengaruh, karena
mengoreksi heteroskedastisitas dengan berbagai cara tidak banyak mengubah hasil-hasil OLS.
Tapi contoh ini memperlihatkan bahwa kalau kita menduga adanya heteroskedastisitas, kita
seharusnya menelitinya, alih-alih berasumsi untuk menghindari masalah itu. Seperti diungkap
sebelumnya, dan seperti ditunjukkan begitu baiknya oleh contoh skala ekonomis NYSE tadi,
heteroskedastisitas berpotensi menjadi masalah yang amat serius dan tidak seharusnya dianggap
remeh. Lebih baik mencari aman dalam setiap tindakan!
13.7 IKHTISAR
Asumsi kritis model regresi linear klasik adalah bahwa gangguan ui , semua memiliki varians
yang sama (artinya, homoskedastis). Jika asumsi ini tidak terpenuhi, kita mengalami
heteroskedastisitas. Heteroskedastisitas tidak merusak sifat tak bias estimator OLS, tapi estimator
ini tidak lagi efisien. Dengan kata lain, estimator OLS tidak lagi BLUE. Jika varians
heteroskedastis σ i2 diketahui, maka metode kuadrat terkecil tertimbang (WLS) akan
menghasilkan penaksir BLUE.
Terlepas dari adanya heteroskedastisitas, jika kita terus menggunakan metode OLS biasa
yang tidak hanya mengestimasi parameter (yang tetap tak bias) tapi juga membangun lagi
interval keyakinan dan hipotesis uji, kita cenderung menarik kesimpulan yang menyesatkan,
seperti dalam Contoh 13.8 NYSE. Ini disebabkan karena hasil estimasi dari kesalahan standar
cenderung bias sehingga rasio-rasio t hasilnya cenderung bias pula. Karena itu, penting diketahui
apakah kita berhadapan dengan masalah heteroskedastisitas dalam suatu penerapan tertentu. Ada
beberapa tes diagnosa heteroskedastisitas, seperti memetakan hasil estimasi residu-residu
terhadap satu variabel penjelas atau lebih. tes Park, tes Glejser, atau tes korelasi peringkat.
Jika salah satu tes diagnostik atau lebih mengungkap bahwa kita menghadapi masalah
heteroskedastisitas, kita memerlukan solusinya. Jika varians kesalahan sebenarnya σ i2 dikenali,
kita bisa menggunakan metode WLS untuk mendapatkan estimator BLUE. Sayangnya,
pengetahuan tentang varians kesalahan sebenarnya jarang tersedia dalam praktek. Akibatnya,
kita terpaksa menggunakan asumsi yang masuk akal tentang sifat heteroskedastisitas dan
mentransformasikan data kita sehingga dalam model transformasi itu, faktor kesalahan bersifat
homoskedastis. Oleh karena itu, kita menerapkan OLS pada data transformasi, yang
menyebabkan penggunaan WLS. Tentu, diperlukan keahlian dan pengalaman untuk
mendapatkan transformasi yang cocok. Tapi tanpa transformasi seperti itu, masalah
heteroskedastisitas tak bisa dipecahkan dalam prakteknya. Namun, jika ukuran sampel cukup
besar, kita bisa menggunakan prosedur White untuk mendapatkan kesalahan standar dengan
koreksi heteroskedastisitas.