Anda di halaman 1dari 25

Mengatasi Heteroskedasitas

varians
1. Pendahuluan
Misalkan kita memiliki model regresi
Yi = β0+ β1X1+ β2X2 + . . . + βkXk + εi
atau secara matrik dapat kita tuliskan
 y1  1 x11 x21... xk 1 
  1 x 
 y2  =  12 x22 xk 2 
+
 .  . . . . 
  . . . . 
 .  1 x
 x2 n xkn  
 yn 
1n
Dalam analisis regresi dengan menggunakan
metode kuadrat terkecil (MKT - OLS: ordinary
least square), ada beberapa asumsi yang harus
dipenuhi yaitu: (i) galat εi berdistribusi normal
dengan nilai tengah nol (E(εi ) = 0); (ii) Varian
dari εi adalah sama (homoskedastis); (iii) Tidak
ada korelasi diantara galat C orr(εi , εj ) = 0; (iv)
Tidak ada multikolinier di antara peubah
bebas. Dari model (1) dan juga kondisi E(ε) = 0
maka
E(yi ) = β0 + β1x1i + β2 x2i + · · · + βk xki
= XT β
Dalam notasi matriks
E(y) = X β
Hal tersebut berarti bahwa
y i ∼ N (xT β, σ 2 ) ∀i = 1, 2, . . . , n
Atau
2
y ∼ M N (X β, σ I ).
Jadi Var(y) = Var(ε) = σ2 I atau Var(yi )
= Var(εi ) = σ2 untuk semua i = 1, 2, . . . , n
atau
 2 0 ... 0
 2 
0  ... 0
Var (e)     2I
 ... ... ... 0 
 2
 0 0 ...  
Ini adalah kondisi ideal dimana semua asumsi
dari MKT terpenuhi
Dalam topik kali ini yang akan dibahas
adalah berkaitan dengan
homoskedastisitas, yang akan mencakup:
1. Sifat dari heteroskedastisitas
2. Akibat yang akan ditimbulkan akibat
adanya heteroskedastisitas
3. Metode untuk mendeteksi
heteroskedastisitas
4. Cara untuk mengatasi
heteroskedastistas
Sifat/Karaketeristik dari Heteroskedastisitas

Galat εi mengukur jarak antara nilai


pengamatan yi dengan nilai dugaannya (yˆi
) yang tidak lain adalah jarak dari
pengamatan y terhadap garis regresi β0 + β1
X1 + · · · + βk Xk . Homoskedastisitas berarti
bahwa dispersi/penyebaran εi sepanjang
garis regresi adalah :
Figure 1: Pencaran galat εi sepanjang garis
regresi pada kondisi homoskedastis
sama untuk semua pengamatan. Ini adalah
kondisi ideal di mana variasi galat disepanjang
garis regresi adalah sama (lihat Gambar 1 dan
Gambar 2). Meskipun demikian, dalam
prakteknya hal tersebut tidak selalu dapat
terpenuhi. Banyak kasus terutama dalam bidang
ekonomi dan juga bidang lain yang mengalami
masalah ragam yang tidak homogen.
Contoh 1. Hubungan antara besarnya konsumsi
rumah tangga dengan pendapatan. Rumah
tangga dengan dengan pendapatan rendah tidak
punya fleksibilitas dalam
membelanjakan uangnya sehingga konsumsinya
akan berada dekat dengan pendapatan.
Sedangkan untuk rumah tangga dengan
pendapatan tingi, mereka juga punya kelelu-
asaan yang tinggi untuk membelanjakan
uangnya. Pada kasus terkhir ini, sebagian bisa
membelanjakan uangnya tinggi juga dan
sebagian akan membelanjakan uangnya se-
cukupnya. Hal ini mengakibatkan variabilitas
pembelanjaan untuk RT berpendapatan tinggi
menjadi besar dibandingkan dengan variabilitas
yang berpendapatan rendah.
Figure 2: Pencaran galat εi sepanjang garis
regresi pada kondisi heteroskedastis
Contoh 2. Hubungan antara Nilai UN siswa SMP dengan
UN SMA. Secara teoritis, anak-anak dengan kecerdasan
yang tinggi akan mempunyai nilai UN SMP yang tinggi
demikian juga pada saat lulus SMA nilai UN-nya juga
tinggi. Jika ada peningkatan nilai UN, maka siswa dengan
nilai UN SMP yang tinggi, maka nilai UN SMA cenderung
naik tetapi dengan kenaikan yang rendah, sebab nilai UN
SMA tidak mungkin melewati angka 100. Sehingga kenaikan
skor UN bagi siswa dengan skor UN SMP tinggi, variasi
kenaikan skornya akan kecil. Sedangkan bagi siswa SMP
dengan skor UN SMP yang rendah nilai UN SMA nya bisa
naik sangat tinggi. Oleh karena itu kenaikan skor UN SMP
ke skor UN SMA variasinya besar bagi siswa dengan skor UN
SMP yang rendah, dan variasinya akan kecil bagi siswa
dengan skor UN SMP yang tinggi.
Contoh 3. Ketika kita melihat hubungan
antara banyaknya makanan yang diberikan
kepada sapi dengan kenaikan berat badan
sapi. Sapi yang pada awalnya kurus akan
semakin mudah menjadi gemuk, dan sapi yang
gemuk akan lebih sulit untuk menjadi lebih
gemuk lagi. Oleh karena itu untuk berat awal
sapi yang berbeda, variasi kenaikan berat sapi
juga akan berbeda.
Asumsi bahwa ragam galat heterogen
(heteroskedastis) berarti bahwa Var(ε1) ≠
Var(ε2 ) ≠ · · · ≠ Var(εn ) atau var(εi ) = , atau
secara matriks dapat dituliskan
 12 0 ... 0
 2 
0  ... 0 
Var (e)   2
V
 ... ... ... 0 
 2

 0 0 ...  n 
Jika ragam tidak homogen (heteroskedastis) dan kita
tetap menggunakan MKT ada beberapa hal yang
harus kita ketahui.
• Dugaan bagi β tetap tidak bias, jadi E(βˆ) = β.
Sehingga kita tetap bisa menggunakan βˆ= b = (b0,
b1, · · · , bk )T sebagai penduga bagi β dan
menggunakan
yˆ = b0 + b1 X1 + · · · + bk Xk sebagai penduga bagi
E(y|X ).
• Ragam dari βˆ = b tidak lagi minimum (tidak bersifat
BLUE=best linear unbiased estimator). Jadi ragam
bagi βˆ lebih besar dibandingkan dengan pada
kondisi homoskedastis.
• Ragam dan standar error bagi b0 , b1, . . . , bk
yaitu S2b0 , S2b2 , . . . , S2bk tidak lagi dapat
digunakan untuk pengujian hipotesis dan
pembuatan selang kepercayaan bagi βj

• Nilai dugaan bagi Ragam dan standar error


untuk b0, b1 , . . . , bk mungkin terlalu besar
(over estimate ) mungkin juga terlalu kecil
(under estimate )⇒ S2bi
Pada kebanyakan kasus S2bi terlalu besar.
Hal ini berakibat pada pengujian hipotesis:
H0: βi = Bi vs H1: βi = Bi , karena statistik uji untuk
hipotesis tersebut adalah
thit = bi − Bi
Sbi
akan menjadi terlalu kecil. Akibatnya adalah kita
akan terlalu sering menerima H0 padahal
seharusnya menolak H0. Hal tersebut juga berarti
bahwa jika sesungguhnya variabel bebas X
mempengaruhi variabel tak bebas Y , maka kita
akan terlalu sering mengatakan banyak variabel
bebas X yang tidak mempengaruhi Y .
• Penduga ragam (varian) dan covarian bagi
koefisien regresi bersifat bias dan tidak
konsisten, sehingga uji hipotesis tidak valid.
Mengatasi Masalah Heteroskedasitas

Heteroskedastisitas atau kehomogenan ragam


sangat sering terjadi, terutama dengan data-
data ekonomi dan juga sosial. Hal ini memang
tidak dapat dihindari. Salah satu penyebabnya
adalah ragam galat yang tidak bebas dari nilai
tengah E(y). Seringkali dengan semakin
besarnya respons, maka ragam juga ikut
membesar.
Transformasi

Salah satu cara untuk menstabilkan ragam


adalah dengan melakukan transformasi ter-
hadap peubah tak bebas atau peubah respon y.
Beberapa transformasi yang seringkali berguna
dalam menstabilkan ragam adalah
• Transformasi logaritma natural, ln(y).
Transformasi ini biasanya berguna jika
hubungan antara ragam adalah proporsional
terhadap E(y), dalam arti bahwa ragam
semakin besar dengan semakin besarnya nilai
yˆ.
• Transformasi akar kuadrat, √y. Transformasi
ini biasanya juga berguna ketika ragam
membesar dengan semakin besarnya yˆ.
• Transformasi invers, 1/y. Transformasi ini
biasanya berguna jika ragam membesar
(sangat besar) dengan membesarnya yˆ,
secara matematis, ragam proporsional
terhadap [yˆ]2.
Misalkan kita mempunyai k peubah bebas X1,
X2, . . . , Xk dan peubah responya adalah y.
Karena ragam tidak homogen, kemudian kita
ingin menggunakan transformasi ln(y) untuk
menstabilkan ragam. Maka kita tinggal
meregresikan antara ln(y) terhadap X1 , X2, . . . ,
Xk .
Beberapa catatan penting yang perlu diperhatikan
adalah :
Transformasi seringkali berguna juga untuk
menormalkan sisaan. Jadi jika sisaan tidak
normal, terkadang dengan transformasi sisaan jadi
berdistribusi normal.
Intepretasi. Jika tadinya modelnya adalah

Maka dengan transformasi modelnya sekarang


menjadi :
Transfor
Sehingga intepretasi sekarang terhadap
transfor y bukan lagi terhadap peubah respon
yang asli, y.
Tugas
Ada 16 orang yang mempunyai pengeluaran dan
pemasukkan dalam ratusan ribu rupiah. Buat
model regresinya kemudian uji dengan
menggunakan plot sisaan dan Uji Brown-
Forsythe Test atau Breusch Pagan apakah terjadi
heteroskedasitas. Kemudian lakukan
transformasi dengan ln(Y), dan uji kembali
apakah masih terjadi heteroskedasitas
Data Pengeluaran dan Pendapatan
n0 Pengeluaran (Y) Pendapatan (X)
1 25 34
2 45 40
3 67 150
4 21 25
5 12 12
6 68 120
7 100 150
8 34 35
9 67 90
10 89 99
11 67 134
12 38 48
13 65 200
14 69 156
15 72 172
16 73 135

Anda mungkin juga menyukai