Anda di halaman 1dari 38

KOLINEARITAS GANDA

(MULTICOLLINEARITY)
Pelanggaran Asumsi Moel Klasi! an Si"a#$si"a# Kolineari#as Gana%
Model regresi linear secara klasik dapat dipergunakan untuk membuat estimasi
atau perkiraan, pengujian hipotesa dan ramalan interval nilai variabel tak bebas Y.
Model regresi ini berdasarkan asumsi-asumsi yang sering disebut asumsi klasik,
yaitusebagai berikut:
1. Nilai rata-rata kesalahan pengangu nol, yaitu E&i! " #, untuk semua i " 1, $,
%,......,n.
$. &arian &i! " E&'! " '
$
, sama untuk semua kesalahan pengganggu asumsi
homoscedastic!
%. (idak ada otokorelasi antara kesalahan pengganggu, berarti kovarian &i( &'! " #, i
) j
*. &ariabel bebas +$, +%, +*, ....., +k, konstan dalam sampling yang terulang
repeated sampling! dan bebas terhadap kesalahan pengganggu &i.
,. (idak ada kolinearitas ganda multicolinearity! diantara variabel bebas +
-. &i ) N #. '
$
!, artinya kesalahan penggangu mengikuti distribusi normal dengan
rata-rata nol dan varian '
$
.
/engan keenam asumsi tersebut kita talah mengetahui bah0a pemerkira koe1isien regresi
yang diperoleh dengan metode kuadrat terkesil biasa 2rninary 3east 45uare Estimators!
merupakan pemerkira linear terbaik tak bias 637E " 6est 3inear 7nbiased Estimator!,
dengan asumsi kenormalan, pemerkira tersebut mengikuti distribusi normal. 8emudian
kita bisa membuat perkiraan interval, dan menguji hipotesa tentang koe1isien regresi
tersebut.
/i sini akan akan dibahas persoalan yang yang disebabkan oleh adanya adanya beberapa
asumsi yang tidak berlaku pelanggaran!, apa akibatnya terhadap si1at-si1at atau ciri-ciri
yang dimiliki oleh pemerkira tersebut seandainya terjadi pelanggaran, perbaikan apa yang
harus dilakukan.
Metode ekonometrika akan mengembangkan metode analisa apabila terjadi pelanggaran
asumsi, mencari metode baru atau melakukan modi1ikasi terhadap metode yang ada
untuk penyempurnaan.
9elanggaran terhadap asumsi pertama, keempat dan keenam tidak begitu serius sehingga
tidak perlu dijelaskan secara mendalam.
:sumsi pertama: Nilai rata-rata kesalahan pengangu nol, yaitu E&i! " #, untuk semua i "
1, $, %,......,n.
:sumsi pertama ini tidak begitu serius persoalannya seandainya terjadi pelanggaran,
sebab hanya akan mempengaruhi titik potong intercept! dari garis regresi.
Misalnya kita mempunyai model regresi dari dua variabel sbb:
Yi " : ; 6+i ; &i
Misalnya E&i<+i! " k, yaitu rata-rata bersyarat &i kalau +i diketahui tidak sama dengan
nol akan tetapi sama dengan k. =ngat, E&i! " #, menurut asumsi klasik.
EYi<+i! " : ; 6+i ; E &i<+i!
" : ; 6+i ; k
" 6# ; 6+i , dimana 6# " : ;k
maka dari itu jika asumsi pertama tidak terpenuhi, yaitu kalau E&i! ) #, kita tidak dapat
memperkirakan :, sebab perkiraan yang diperoleh 6# " : ;k.
/alam prakteknya, titik potong intercept! : tidak begitu penting, kita bisa
melupakannya, yang paling penting ialah koe1isien regresi 6 yang dapat untuk mengukur
besarnya pengaruh + terhadap Y secara kuantitati1, dimana koe1isien ini tidak
terpengaruh 0alaupun asumsi pertama tidak terpenuhi terjadi pelanggaran!.
:sumsi keempat: &ariabel bebas +$, +%, +*, ....., +k, konstan dalam sampling yang
terulang repeated sampling! dan bebas terhadap kesalahan pengganggu &i.
9endekatan analisa model regresi dua variabel ialah bersyarat conditional! yaitu dengan
syarat bah0a variabel bebas + nilainya diketahui given!. 6erlainan dengan ilmu0an
4cientist! di bidang lain, ahli ekonomi biasanya tidak bisa mengontrol data ekonomi
yang dianalisa.
:hli ilmu alam atau kimia yang melakukan penelitian dalam laboratorium dapat
melakukan pengontrolan terhadap data yang diperoleh, misalnya dengan cara membuat
suhu temperatur! dalam ruangan tetap tak berobah!, lalu membiarkan nilai variabel lain
yang tak boleh dipengaruhi oleh suhu, bebas bergerak mengambil nilai.
:hli ekonomi sangat tergantung pada data sekunder, yaitu data yang diperoleh dalam
bentuk sudah jadi berupa publikasi dari 694, 6= dan lain-lainnya!
2leh karena itu strategi yang praktis biasanya menganggap bah0a untuk persoalan
regresi yang dihadapi variabel bebas nilainya diketahui tetap tidak berubah untuk
sampling yang terulang atau sering disebut non stochastic, 0alaupun kenyataan
sebenarnya mungkin tidak demikian. >adi hasil dari analisa regresi adalah bersyarat
artinya tergantung kepada variabel bebas + yang diketahui.
:sumsi keempat ternyata terjadi pelanggaran dalam model dengan persamaan simultan
simultaneous e5uation model! yaitu model yang terdiri dari lebih dari satu persamaan
regresi, yang merupakan persoalan pokok dalam ekonometrik. /alam model yang
demikian itu, kesalahan pengganggu dari suatu persamaan tertentu, mungkin mempunyai
korelasi dengan satu atau lebih variabel bebas yang terdapat dalam persamaan tersebut.
:pabila demikian halnya, dapat ditunjukkan bah0a pemerkira 234 2rninary 3east
45uare! tidak hanya bias akan tetapi juga tidak konsisten, yaitu tetap bias 0alaupun
banyaknya elemen sampel diperbesar n?@!
Misalnya model regresi:
Yi " : ; 6+i ; &i
b " 6 ; A 0i &i, dimana 0i " Bi< ABi
$
Misalkan sekarang &i dan +i berkorelasi, suku terakhir A 0i &i " A Bi &i< A Bi tidak akan nol,
jadi Eb! ) 6, b pemerkira bias dari 6, dalam hal ini 0alaupun n ditambah sampai
mendekati tak terhingga n?@!, bias ini tidak akan lenyap.
:pabila variabel bebas + berkorelasi dengan kesalahan pengganggu &, maka metode
kuadrat terkecil yang biasa 234! tak dapat dipergunakan.
:sumsi keenam: yaitu asumsi kenormalan, tidak begitu penting kalau tujuan kita hanya
untuk membuat estimasi atau perkiraan. Metode kuadrat terkecil menghasilkan pemerkira
linear tak bias terbaik tanpa memperhatikan apakah kesalahan pengganggu &i mengikuti
distribusi normal atau tidak. 3agi pula kalau &i tidak mengikuti distribusi normal, akan
dapat ditunjukkan bah0a pemerkira 234 cenderung akan mendekati distribusi normal
apabila sampel semakin besar yaitu n mendekati tak tehingga. /engan perkataan lain
pemerkira 234 mengenai koe1isien regresi cenderung mengikuti distribusi normal secara
asimptotis asymptotically normally distributed!. :kan tetapi ini tidak benar untuk sampel
kecil tanpa asumsi kenormalan, pemerkira 234 tidak mengikuti distribusi normal. 2leh
karena itu ahli ekonomi seringkali menghadapi sampel kecil didalam membuat analisa
ekonomi, oleh karena itu untuk pengujian hipotesis dan pemerkiraan interval, asumsi
kenormalan tersebut sangat diperlukan.
/idalam prakteknya sering kali dihadapi data ekonomi dengan sampel kecil, khususnya
data berkala time series data! yang kurang dari %# tahun, padahal harus membuat
perkiraan interval dan pengujian hipotesa, maka pembuatan asumsi kenormalan menjadi
suatu keharusan.
8olinearitas ganda multicollinearity! yaitu kalau ada ada korelasi antar variabel bebas.
Ceteroskedastisisittas heteroscedasticity! yaitu keadaan dimana masing-masing
kesalahan pengganggu mempunyai varian yang berlainan
2tokorelasi autocorrelation! yaitu keadaan dimana kesalahan pengganggu saling
berkorelasi
:sumsi kelima
4i1at-si1at kolinearitas ganda
8olinearitas ganda multicollinearity! yaitu adanya korelasi antar variabel bebas.
=stilah 8olinearitas ganda multicollinearity! diciptakan oleh Dagner Erish, disebutkan
bah0a 8olinearitas ganda multicollinearity! berarti: adanya hubungan linear yang
sempurna atau eksak diantara variabel-variabel bebas dalam model regresi.
=stilah 8olinearitas colinearity! berarti hubungan linear tungal, sedangkan kolinearitas
ganda Multicollinearity! menunjukkan adanya lebih dari satu hubungan linear yang
sempurna. /alam praktek sering tidak dibedakan baik satu hubungan atau lebih
dipergunakan istilah kolinearitas ganda.
Cubungan linear yang sempurna<eksak terjadi kalau berlaku hubungan:
F1+1 ; F$+$ ; ...... ; Fk+k " #
/i mana F1, F$, ....., Fk merupakan bilangan konstan dan tidak seluruhnya nol atau paling
tidak ada satu yang tidak sama dengan nol, yaitu Fj ) # j " 1, $, ...., k!
=stilah kolinearitas ganda dipergunakan juga dalam arti yang lebih luas, yaitu mencakup
hubungan linear yang sempurna maupun tidak sempurna di mana variabel-variabel bebas
+ interkorelasi akan tetapi tidak sempurna seperti hubungan berikut:
F1+1 ; F$+$ ; ...... ; Fk+k ; &i " #
di mana &i " kesalahan pengganggu.
:pabila hanya ada $ variabel bebas, interkorelasi dapat diukur dengan koe1isien korelasi
sederhana, atau koe1isien korelasi order nol, akan tetapi kalau ada lebih dari dua variabel,
interkorelasi dapat diukur dengan koe1isien korelasi parsial atau koe1isien korelasi
berganda antara variabel bebas + dengan sisa variabel bebas lainnya secara simultan.
7ntuk mengetahui perbedaan antara hubungan linear yang sempurna dan kurang
sempurna, kita anggap F$ ) # , persamaan F1+1 ; F$+$ ; ...... ; Fk+k " # dapat ditulis
sbb:
ki
$
k
%i
$
%
1i
$
1
$i
+
F
F
....... +
F
F
+
F
F
- + =

yang menunjukkan bagaimana +$ berhubungan linear secara sempurna dengan sisa
variabel lainnya secara keseluruhan. /alam hal ini, koe1isien korelasi antara +$ dan
kombinasi linear yang berada di sebelah kanan tanda sama dengan nilainya satu unity!.
>ika F$ ) # untuk persamaan F1+1 ; F$+$ ; ...... ; Fk+k ; &i " # maka:
i
$
ki
$
k
%i
$
%
1i
$
1
$i
&
F
1
+
F
F
....... +
F
F
+
F
F
- + =
yang menunjukkan bah0a +$ tidak berhubungan linear sempurna dengan sisa variabel
lainnya, sebab masih tergantung pada kesalahan pengganggu yang sering disebut
stochastic error term.
Fontoh:
+$ +% +
G
%
1# ,# ,$
1, H, H,
1I J# JH
$* 1$# 1$J
%# 1,# 1,$
(elihat bah0a +% " ,+$, ada hubungan sempurna antara +$ dan +% sebab r$% " 1
&ariabel +
G
% diperoleh dengan jalan menambah +% dengan bilangan<angka yang diperoleh
dari tabel bilangan random yaitu: $, #, H, J, $. 4ekarang tak ada hubungan yang sempurna
antara +$ dan +
G
%, akan tetapi hubungan antara +$ dan +
G
% masih sangat kuat, sebab
hubungan antara +$ dan +
G
% sebesar #,JJ,J mendekati 1 unity!.
9erlu ditegaskan bah0a kolinearitas ganda hanya berlaku untuk hubungan linear antara
variabel bebas + saja, tidak berlaku untuk hubungan yang bukan linear non linear
relationship!
Fontoh hubungan non linear:
Yi " : ; 61+i ; 6$+
$
i ; 6%+
%
i ; Ki
/i mana Y " biaya total produksi
+ " output atau produksi
&ariabel +$ output kuadrat! dan +% output pangkat tiga! secara 1ungsional mempunyai
hubungan dengan +, sebab asalnya memang dari +, tetapi hubungannya bukan linear.
Maka dari itu tidak melanggar asumsi bah0a tak ada kolinearitas ganda.
Mengapa di dalam regresi linear harus dianggap bah0a tidak ada kolinearitas ganda
diantara variabel bebasL :lasannya adalah sbb:
1. :pabila kolinearitas sempurna terjadi maka koe1isien regresi pada variabel +
tidak dapat ditentukan indeterminite! dan standar erornya tak terhingga in1inite!.
$. 8alau kolinearitas kurang sempurna less per1ect!, 0alaupun koe1isien + bisa
ditentukan determinite! mempunyai standar eror yang tinggi dalam hubungannya
dengan koe1isien-koe1isien itu sendiri!, yang berarti koe1isien regresi tak dapat
diperkirakan dengan tingkat ketelitian yang tinggi jadi perkiraan yang diperoleh
menjadi kurang teliti!.
8etika kita merumuskan 1ungsi regresi populasi, kita sudah mempunyai keyakinan bah0a
variabel-variabel bebas + yang dimasukkan dalam model regresi mempunyai pengaruh
terpisah atau bebas terhadap variabel tak bebas Y. (etapi bisa juga terjadi dalam suatu
sampel yang kita teliti yang kita pergunakan untuk menguji model 1ungsi regresi
populasi, beberapa atau semua variabel bebas + mempunyai hubungan atau korelasi yang
sangat kuat sehingga kita tidak dapat memisahkan pengaruh individu masing- masing
variabel bebas + terhadap tak bebas Y.
/engan kata lain mungkin sampel tersebut tidak dapat mengakomodir semua variabel
bebas + dalam analisis.
Misalnya:
8onsumsi " 61 ; 6$ 9endapatan ; 6% 8ekayaan ; K
:tau Yi " 61 ; 6$ +$i ; 6%+%i ; Ki
6isa saja terjadi bah0a kalau kita peroleh data tentang pendapatan dan kekayaan kedua
variabel mungkin mempunyai korelasi yang tinggi, atau bahkan sempurna hubungannya,
sebab orang kaya biasanya pendapatannya tinggi. Malaupun kita percaya bah0a baik
pendapatan maupun kekayaan dapat mempengaruhi pengeluaran konsumsi, akan tetapi
dalam praktek pengaruh masing-masing sukar dipisahkan, maksudnya kalau ada
pengaruh terhadap konsumsi berapa N dari pendapatan dan berapa N dari kekayaan.
Es#imasi alam !eaaan !olineari#as gana *ang sem+urna an !urang sem+urna
(elah disebutkan bah0a jika terjadi kolinearitas ganda yang sempurna, koe1isien regresi
tak dapat ditentukan dan standard errornya tak terhingga.
Fontoh:
yi " b1$.%B$i ; b1%.$ B%i; ei
( )( ) ( )( )
( )( ) ( )
$
%i $i
$
%i
$
$i
%i $i i %i
$
%i i $i
1$.%
B B B B
B B y B B y B
b

=
( )( ) ( )( )
( )( ) ( )
$
%i $i
$
%i
$
$i
%i $i i $i
$
$i i %i
1%.$
B B B B
B B y B B y B
b

=
kita anggap bah0a B%i " k B$i di mana k ) # kita masukkan dalam persamaan ,-.%/ sbb:
( )( ) ( )( )
( )( ) ( )
ditentukan dapat tak ,
#
#
B k B k B
B k y B k B k y B
b
$
$i
$ $
$i
$ $
$i
$i i $i
$
$i
$
i $i
1$.%
=

=


demikian juga jika B%i " k B$i di mana k ) # kita masukkan dalam persamaan ,-/%. akan
diperoleh b1%.$ "

#
#
juga tak dapat ditentukan, karena hasilnya nol dibagi nol
ingat arti dari ,-.%/ memberikan rata-rata perubahan yang terjadi pada nilai Y kalau +$
berubah dengan satu unit, dengan menganggap +% konstan, akan tetapi kalau +$ dan +%
berkorelasi secara sempurna, kita tak dapat membuat +% konstan, sebab kalau +$ berubah
maka +% berubah juga dengan kelipatan k. =ni berarti kita tidak dapat memisahkan
pengaruh +$ dan +% terhadap Y, sehingga untuk keperluan praktis kalau +$ dan +%
berkorelasi sempurna, +$ dan +% tak dapat dibedakan, sebab kalau +$ berubah, +% akan
selalu mengikuti berubah, keduanya tak dapat dibedakan.
( )( ) ( )
$
% $
$
. %
$
. $
$
. % $
% . 1$
!

=
i i i i
i
x x x x
x
b Var
( )( ) ( )
$
% $
$
. %
$
. $
$
. $ $
$ . 1%
!

=
i i i i
i
x x x x
x
b Var
kita masukkan x3i = kx2 ke Var b(12.3)
( ) ( )
ngga! tak terhi
#

!
$
. $
$
$
$
. $
$
$
$
. $
$
$
. %
$
$
% . 1$
= =

i
i i
i
x
x k x k
x k
b Var

>adi dalam hal ada korelasi sempurna antara +$ dan +% maka koe1isien regresi tak dapat
ditentukan, dan varian serta standar errornya tak tak terhingga
Es#imasi !alau !olineari#as gana !urang sem+urna%
Misalnya: x3i = kx2i +vi untuk k 0 dan vi " kesalahan pengganggu.
4edemikian rupa sehingga x2i vi " # artinya x2i dan vi tak berkorelasi!.
/alam hal ini estimasi koe1isien regresi 61$.% dan 61%.$ dimungkinkan.
/engan memasukkan x3i = kx2i +vi ke b1$.% diperoleh:
( )( ) ( )
( ) ( )
$
$i
$
i
$
$i
$
$i
$
$i i i i $i
$
i
$
$i i $i
1$.%
B v B B
B y v y B v B y B
b


+
+ + +
=
dengan kenyataan bah0a Ax2i vi " #
apabila kolinearitas ganda tak sempurna, dalam bentuk rumusan di atas yang masih ada
kemungkinan untuk dapat diperkirakan, hal ini tergantung dari nilai vi. >ika vi sangat
kecil sekali mendekati nol , maka persamaan b1$.% di atas akan menunjukkan kolinearitas
sempurna sehingga
#
#
b
1$.%
=
, tak dapat ditentukan nilainya indeterminate!
sekarang perhatikan apa yang akan terjadi jika persamaan varian b1$.% dan b1%.$ dirubah
bentuknya sbb:
( )( ) ( )
( ) ( )
( )
( )
( )
$
$%
$
. %
$
$ . 1%
$
$%
$
. $
$
$
. %
$
$
$
% $ $
. $
$
$
. %
$
% $
$
. $
$
$
% $
$
. %
$
. $
$
. % $
% . 1$
1
!
: juga n ditunjukka dapat sama yang cara dengan
1

1


!
r x
b Var
r x
x x
x x
x
x
x x x
x x x x
x
b Var
i
i
i i
i i
i
i
i i i
i i i i
i

di mana r$% " koe1isien korelasi antara B$ dan B%


=
$
%
$
$
% $
$%
i i
i i
x x
x x
r
jelas sekali jika r$% mendekati 1 karena kolinearitas semakin sempurna, varian dari kedua
koe1isien semakin besar dan dalam limit ketika r$% " 1, varian atau standar error menjadi
in1inite! ngga tak terhi
#
$
= =

7ntuk memperoleh gambaran tentang bagaimana cepatnya peningkatan varian ketika


nilai r$% meningkat
Nilai r$% Nilai var b1$.%!
# '
$
<AB
$
$i
#,, 1,%%! '
$
<AB
$
$i
#,H# 1,J-!'
$
<AB
$
$i
#,I# $,HI!'
$
<AB
$
$i
#,J# ,,$-!'
$
<AB
$
$i
#,J, 1#,$-!'
$
<AB
$
$i
1,## @ tak terhingga!
Cubungan nilai varian ,-.%/ dengan koevisien korelasi r./
1 1 1 1 1 1
0,5 0,7 0,8 0,9 0,95 1
0,25 0,49 0,64 0,81 0,9025 1
0,75 0,51 0,36 0,19 0,0975 0
1,333333 1,960784 2,777778 5,263158 10,25641 #DIV/0!
Konse!uensi ari Kolineari#as Gana
8alau asumsi model regresi linear yang klasik berlaku, pemerkira koe1isien regresi yang
diperoleh dengan menggunakan metode kuadrat terkecil biasa 234 " 2rdinary least
s5uare! akan linear, tak bias dan mempunyai varian minimum, atau sering disebut 637
best linear unbiased estimator!. /apat juga ditunjukkan 0alaupun kolinearitas ganda
cukup tinggi, pemerkira 234 akan masih tetap merupakan 637.
8etidakbiasan unbiasedness! merupakan si1at dari sampling terulang repeated
sampling!. Yaitu kalau nilai veriabel bebas kita buat tetap dari sampel yang satu dengan
sampel lainnya, kalau kita memperoleh hasil dari penelitian sampel yang terulang dan
( )
$
$%
$
. $
$
% . 1$
1
!
r x
b Var
i

=

kita hitung pemerkira 234 dari setiap sampel, kemudian rata-rata nilai sampel
perkiraan! akan mendekati nilai parameter sebenarnya dari populasi, se0aktu banyaknya
elemen sampel " n! makin meningkat.
6ila 61$.% " parameter dari populasi kita ambil sampel dengan n elemen, akan diperoleh
sampel sebanyak k, di mana k diperoleh dengan rumus
populasi elemen banyaknya
!O O
O
=

=
N
n N n
N
k
b1$.% adalah pemerkira 61$.%.
/ari setiap sampel kita peroleh nilai b1$.% sebegai pemerkira estimate! 61$.% sebagai
berikut: b1$.% 1!, b1$.% $! , ........, b1$.% k!
Data-rata b1$.% "

=
=
k
1 i
i! 1$.% 1$.%
b
k
1
b
akan mendekati nilai parameter 61$.% kalau n makin
membesar mendekati N.
>adi kalau n ? N, maka b1$.% ? 61$.%
4i1at ketidak biasan tidak berlaku untuk satu sampel yang sedang kita teliti, secara
individu, akan tetapi berlaku untuk seluruh kemungkinan sapel dari suatu populasi
darimana sampel tersbut berasal, berdasarkan rata-rata.
Memang benar bah0a kolinearitas tidak merusak si1at adanya varian yang minimum. /i
dalam kelas seluruh pemerkira tak bias linear linear unbiased estimator!, pemerkira 234
mempunyai varian minimum, jadi e1isien. (etapi hal ini tidak berarti bah0a varian dari
pemerkira 234 dihitung dari sampel yang diteliti nilainya harus kecil, bisa saja besar
untuk sampel tertentu.
Konse!uensi +ra!#is ari !olineari#as gana
1. /alam hal kolinearitas ganda yang sempurna, pemerkira 234 akan tidak dapat
ditentukan indeterminite! dan varian serta standard erornya tak terhingga.
$. :pabila terjadi kolinearitas tidak sempurna maka akan timbul kosekuensi sbb:
a. Meskipun pemerkira 234 dapat diperoleh, standard erornya akan cenderung
membesar nilainya se0aktu tingkat kolinearitas antara variabel bebas juga meningkat.
b. 2leh karena nilai standard eror dari koe1isien regresi besar maka dari itu dengan
sendirinya interval keyakinan untuk parameter dari populasi juga cenderung melebar.
Misalnya untuk hubungan tiga variabel tanpa adanya kolinearitas r$% " #!, dengan
anggapan ' diketahui dan tingkat keyakinan J,N, perkiraan interval untuk 61$.% sbb:
9b1$.% P 1,J-
$
i
x

61$.% b1$.% ; 1,J-


$
i
x

! " #,J,
(etapi kalau kolinearitas cukup serius, misalnya r$% " #,J, dengan tingkat keyakinan
J,N perkiraan interval 61$.% menjadi sbb:
9b1$.% P 1,J-
$
$J , $
i
x
61$.% b1$.% ; 1,J-
$
$J , $
i
x
! " #,J,
>adi jelas dengan meningkatnya tingkat kolinearitas dari r$% " # menjadi #,J, perkiraan
interval menjadi hampir $ kali lebih yaitu
$J , $ $- , , =
c. /engan tingginya tingkat kolinearitas, probabilitas untuk menerima hipotesa,
padahal hipotesa itu salah, menjadi membesar nilainya.
d. 4elama kolinearitas ganda tidak sempurna, masih mungkin untuk menghitung
perkiraan koe1isien regresi , akan tetapi standard erornya menjadi sangat sensiti1,
0alaupun terjadi perubahan yang sangat kecil dalam data.
Fontoh :
+$ +% Y
$ * 1
# $ $
* 1$ %
- # 1*
I 1- ,
Qi " 1,1J%J ; #,**-% +$i ; #,##%# +%i
#,HH%H! #,1I*I! #,#J,1!
t " ,*%1! $,*1,1! #,#%,I!
D
$
" #,I1#1 r$% " #,,,$%
Degresi di atas menunjukkan bah0a tak satupun dari ko1isien regresi secara individu
signi1ikan pada tingkat signi1ikan 1N atau $N, meskipun b$ signi1ikan pada tingkat
1#N, dengan menggunakan uji t dua arah.
4ekarang jika terjadi perubahan data, misalnya nilai variabel +% yang ketiga dan
keempat ditukar tempatnya.
+$ +% Y
$ * 1
# $ $
* # %
- 1$ 1*
I 1- ,
Qi " 1,$1#I ; #,*#1* +$i ; #,#$H# +%i
#,H*I#! #,$H$1! #,1$,1!
t " 1,-1IH! 1,*H,$! #,$1,I!
D
$
" #,I1*% r$% " #,I$I,
4ebagai akibat dari perubahan data, maka b$ yang tadinya signi1ikan pada tingkat
signi1ikan 1#N. 4udah tidak signi1ikan lagi meskipun pada tingkat signi1ikan 1#N.
9erubahan ini mungkin disebabkan karena meningkatnya kolinearitas ganda, yaitu
dari r$% " #,,,$% menjadi #,I$I,. juga standar error dari koe1isien b$ dan b% cenderung
membesar.
e. :pabila kolinearitas ganda tinggi seseorang akan memperoleh nilai D
$
"
koe1isien determinasi ganda! yang tinggi, akan tetapi tidak ada atau sedikit sekali
koe1isien regresi yang signi1icant secara statistik. 8alau koe1isien regresi suatu
vaiabel bebas signi1ican, maka variabel bebas yang bersangkutan mempunyai
pengaruh terhadap Y.
>ika dalam regresi Qi " 1,$1#I ; #,*#1* +$i ; #,#$H# +%i
D
$
" #,I1*% berarti bah0a I1N variasi naik turunnya! Y disebabkan oleh +$ dan +%,
akan tetapi 0alaupun begitu tak satupun dari koe1isien regresi tersebut signi1ikan,
meskipun pada tingkat signi1ikan 1#N. >adi tingginya kolinearitas tidak
memungkinkan kita untuk memisahkan pengaruh secara individu dari +$ dan +%
terhadap Y.
Fontoh:
Y " pengeluaran konsumsi, ribuan Dp
+$ " pendapatan, ribuan Dp
+% " kekayaan, ribuan Dp
+$ I# 1## 1$# 1*# 1-# 1I# $## $$# $*# $-#
+% I1# 1##J 1$H% 1*$, 1-%% 1IH- $#,$ $$#1 $*%, $-I-
Y H# -, J# J, 11# 11, 1$# 1*# 1,, 1,#
/ari data tersebut dihasilkan:
Qi " $*,HH*H ; #,J*1, +$i P #,#*$* +%i
-,H,$,! #,I$$J! #,#I#H!
t " %,--J#! 1,1**$! #,,$-1!
D
$
" #,J-%,
Degresi tersebut menunjukkan bah0a pendapatan dan kekayaan secara bersama-sama
memberikan sumbanganshare! sebesar lebih dari J-N terhadap naik turunnya
pengeluaran konsumsi. :kan tetapi 0alaupun demikian tak satupun dari koe1isien regresi
yaitu baik b$ maupun b% secara individu berpengaruh signi1ikan terhadap Y konsumsi!.
6ukan hanya itu saja koe1isien regresi b% yang mengukur pengaruh kekayaan terhadap
konsumsi, yang seharusnya positip, memberikan tanda negati1.
4ecara individu untuk menguji pengaruh pendapatan terhadap konsumsi dirumuskan sbb:
C# : 6$ " # tak ada pengaruh!
Ca : 6$ ) # ada pengaruh!
7ntuk R " #,#,, t#,#$,. H! " $,%-,
/iketahui t hitung " 1,1**$
8arena t "1,1**$ S $,%-, maka C# diterima, berarti tak ada pengaruh dari pendapatan
+$! terhadap pengeluaran konsumsi Y!
Malaupun masing-masing variabel secara sendiri-sendiri individu! tak mempunyai
pengaruh terhadap Y namun secara bersama simultan! mempunyai pengaruh yang
signi1ikan.
C# : 6$ " 6% " # tak ada pengaruh!
Ca : 6$ ) 6$ ) # ada pengaruh!
:nalisis varian untuk menguji hubungan antara pendapatan dan kekayaan terhadap
konsumsi
Sum,er 0ariasi SS " MSS
/ari regresi E44! I,-,,,,*1 $ *$I$,HHH#
/ari kesalahan pengganggu D44! %$*,**,J H *-,%*J*
G G
J$,*#1J
*-,%*J*
*$I$,HHH#
E = =
dari E tabel diperoleh:
untuk R " #,#, E #,#,!$!H! " *,H*
untuk R " #,#1 E #,#1!$!H! " J,,,
baik untuk tingkat signi1ikan ,N maupun 1N nilai E observasi hasil hitung! sangat jauh
lebih besar dari E tabel. >adi secara bersama-sama atau serentak pendapatan dan kekayaan
sangat signi1ikan pengaruhnya terhadap pengeluaran konsumsi.
Fontoh ini menunjukkan akibat adanya kolinearitas ganda. 8enyataan bah0a uji E " E
test! hasilnya sangat signi1ikan tanda dua bintang GG! akan tetapi uji t " t test! hasilnya
tidak signi1ikan, ini berarti bah0a dua variabel pendapatan +$! dan kekayaan +%! sangat
tinggi tingkat korelasinya sehingga sukar untuk memisahkan pengaruh individu masing-
masing secara terpisah terhadap pengeluaran konsumsi.
4ekarang kita lihat tingkat korelasi antara pendapatan +$! dan kekayaan +%!
$i %i
+ 1J#J , 1# ,*,* , H + + =
$J,*H,I! #,1-*%!
t " #,$,-#! -$,#*#,!
D
$
" #,JJHJ
Casil ini menunjukkan bah0a ada kolinearitas yang hampir sempurna antara pendapatan
+$! dan kekayaan +%!, D
$
kalau dibulatkan menjadi 1.
4ekarang perhatikan apa yang akan terjadi kalau kita regresikan Y terhadap +$ saja.
Qi " $,,*,*, ; #,,#J1 +$i
-,*1%I! #,#%,H!
t " %,I1$I! 1*,$*%$!
D
$
" #,J-$1
4etelah +% dikeluarkan dari model, ternyata pengaruh +$ terhadap Y signi1ikan.
4elanjutnya jika dibuat regresi Y terhadap +% saja, hasilnya sbb:
Qi " $*,%*I# ; #,#*JI +%i
-,%IHH! #,##%H!
t " %,I1*1! 1%,%,H-!
D
$
" #,J,-H
7ntuk R " 1N, t#,#,H! " %,*JJ jauh lebih kecil dari t observasi yaitu 1%,%,H-, jadi hipotesis
nol yang menyatakan bah0a kekayaan tidak berpengaruh terhadap konsumsi ditolak,
berarti pengaruh kekayaan terhadap konsumsi sangat signi1ikan.
>adi jelas bah0a dalam situasi kolinearitas ganda sangat tinggi, dengan jalan
mengeluarkan variabel-variabel bebas yang berkorelasi akan membuat variabel yang
tinggal dalam model akan mempunyai pengaruh yang signi1ikan terhadap variabel tak
bebas Y. Casil ini memberikan petunjuk bah0a kalau ada kolinearitas ganda yang tinggi,
kita harus mengeluarkan variabel bebas yang berkorelasi dengan variabel bebas lainnya.
Fara mengetahui 8olinearitas Tanda
1. 8olinearitas seringkali dapat diduga kalau nilai D
$
cukup tinggi misalnya
antara #,H sampai 1! dan kalau koe1isien korelasi sederhana Uero order coe11icient o1
correlation! juga tinggi akan tetapi tak satupun atau sedikit sekali koe1isien regresi
parsial yang signi1icant secara individu kalau dilakukan uji t. :pabila nilai D
$
tinggi,
ini berarti bah0a uji E melalui analisa varian, pada umumnya menolak hipotesa nol
yang mengatakan bah0a secara bersama-sama, seluruh koe1isien regresi parsial
nilainya nol C# : 6$ " 6% " ....." 6k " #!
$. Meskipun ko1isien korelasi sederhana Uero coe11icient o1 correlation!
nilainya tinggi sehingga timbul dugaan bah0a terjadi kolinearitas ganda, akan tetapi
belum tentu berlaku untuk kasus tertentu, maksudnya dugaan tersebut bisa meleset.
:tau secara teknis dikatakan: (ingginya nilai koe1isien korelasi sederhana Uero
order! merupakan syarat yang cukup su11icient! akan tetapi bukan syarat yang perlu
necessary! untuk terjadinya kolinearitas dalam model regresi linear berganda, sebab
kolinearitas ganda bisa terjadi 0alaupun koe1isien korelasi sederhana nilainya relati1
rendah, misalnya kurang dari #,,.
7ntuk model regresi linear dengan variabel bebas lebih dari dua, nilai koe1isien
korelasi sederhana antara variabel bebas tidak cukup untuk dipergunakan sebagai
petunjuk ada tidaknya kolinearitas ganda, akan tetapi kalau hanya ada dua variabel
bebas, nilai koe1iaien korelasi sederhana antara variabel bebas sudah cukup sebagai
petunjuk<indikator ada tidaknya kolinearitas ganda.
%. 7ntuk mengetahui ada tidaknya kolinearitas ganda dalam suatu model
regresi linear berganda, kita tidak boleh hanya melihat nilai koe1isien korelasi
sederhana antara variabel bebas akan tetapi dianjurkan untuk melihat nilai koe1isien
regresi parsial. Misalnya dalam regresi linear berganda yang menghubungkan Y
dengan +$, +%, +*, kalau ternyata D
$
1.$%* sangat tinggi nilainya mendekati 1! akan
tetapi r
$
1$.%*, r
$
1%.$*, r
$
1*.$% nilainya sangat rendah dibandingkan dengan nilai D
$
1.$%*, hal
ini menunjukkan bah0a kemungkinan besar variabel bebas +$, +%, +*, saling
berkorelasi sehingga paling tidak akan kelebihan satu variabel, artinya jumlah
variabel bebas bisa dikeluarkan minimal ada satu. Malaupun studi tentang koe1isien
korelasi parsial itu mungkin berguna akan tetapi bukan suatu jaminan untuk dapat
menunjukkan kolinearitas ganda dengan pasti, sebab bisa juga terjadi baik D
$
maupun
semua koe1isien korelasi parsial nilainya tinggi.
*. 2leh karena kolinearitas timbul disebabkan adanya satu atau lebih variabel
bebas yang berkorelasi sempurna atau mendekati sempurna dengan variabel bebas
lainnya, salah satu cara untuk mengetahui variabel bebas + yang mana berkorelasi
dengan variabel lainnya ialah dengan membuat regresi setiap 1i terhadap sisa variabel
lainnya dengan menghitung D
$
dan kita beri simbul R
.
i. 4elanjutnya dilakukan uji E,
jika ternyata E hitung lebih besar dati E tabel dengan tingkat signi1ikan tertentu
misalnya 1N! maka dapat disimpulkan bah0a 1i tersebut memang berkorelasi
dengan sisa variabel lainnya, sebaliknya jika E hitung lebih kecil dari E tabel maka 1i
tidak berkorelasi dengan sisa variabel lainnya dan dapat mempertahankan variabel
bebas yang bersangkutan tetap dalam model regresi. :kan tetapi kalau E signi1ikan
secara statistik , berarti ada korelasi antara +i dengan sisa variabel lainnya, kita tidak
perlu langsung mengeluarkan variabel tersebut dari model.
9erlu ditegaskan disini bah0a kalau tujuan pembuatan model regresi linear berganda
hanya untuk memperkirakan atau meramalkan nilai variabel tak bebas Y, makin besar D
$
makin baik. (etapi ini hanya berlaku kalau adanya kolinear ganda itu secara kontinyu
terus menerus! sampai pada 0aktu di mana ramalan nilai variabel tak bebas Y akan
dibuat.
Penggunaan moel regresi aa ua *ai#u2
1. untuk memperhitungkan<memperkirakan besarnya pengaruh secara kuantitati1
dari masing-masing variabel beas yang tercakup dalam model regresi terhadap
variabel tak bebas, misalnya pengaruh +ji terhadap Yi, > " $, %, ......, k
6esarnya pengaruh tersebut dinyatakan dengan parameter 6j sebagai koe1isien regresi
parsial +j terhadap Y dengan perkiraan bj.
Model sebenarnya: Y " 61 ; 6$ +$ ; 6% +% ; ..........; 6k +k ; K
Model perkiraan : Q " b1 ; b$ +$ ; b% +% ; ..........; bk +k ; e
$. 7ntuk memperkirakan<meramalkan Y kalau +$, +%, ...., +k sudah diketahui
nilainya.
7ntuk keperluan perkiraan<peramalan nilai variabel tak bebas Y, makin besar D
$
makin
baik, sebab D
$
adalah ukuran kecocokan<ketepatan bagi garis regresi untuk peramalan
goodness o1 1it test!, adanya kolinearitas ganda tidak menjadi persoalan yang serius,
akan tetapi kalau tujuan model untuk memperkirakan koe1isien regresi parsial dalam
rangka untuk memperkirakan besarnya pengaruh secara kuantitati1 dari + terhadap Y,
maka adanya kolinearitas ganda menjadi sangat serius, oleh karena standard error
estimate menjadi sangat besar, sehingga akibatnya perkiraan interval untuk masing-
masing koe1isien regresi parsial sebenarnya yang merupakan parameter menjadi sangat
lebar, perkiraan menjadi makin tidak pasti.
Cara menga#asi +ersoalan *ang i#im,ul!an ole3 !olineari#as gana%
1. :danya in1ormasi sebelumnya.
Misalnya kita mempunyai model berikut:
8onsumsi " 61 ; 6$ 9endapatan ; 6% 8ekayaan ; K
:tau Yi " 61 ; 6$ +$i ; 6%+%i ; Ki
Misalnya kita telah emperoleh in1ormasi sebelumnya bah0a pendapatan dan
kekayaan mempunyai kolinearitas yang tinggi, sehingga kita mempunyai kepercayaan
bah0a
6% " #,1# 6$, tingkat perubahan konsumsi terhadap perubahan kekayaan
sepersepuluh 1<1#! dari tingkat perubahannya terhadap pendapatan.
Maka regresinya menjadi
Yi " 61 ; 6$ +$i ; #,1# 6$ +%i ; Ki
6egitu kita bisa menghitung b$ sebagai perkiraan 6$, maka b% sebagai perkiraan 6%
secara otomatis dapat diketahui berdasarkan in1ormasi sebelumnya bah0a 6% " #,1#
6$. 3alu bagaimana kita bisa memperoleh in1ormasi sebelumnyaL Cal ini bisa
diperoleh baik berdasarkan teori ekonomi maupun berdasarkan penelitian empiris
sebelumnya sebagai suatu pengalaman praktek dimana persoalan kolinearitas menjadi
kurang serius.
$. Menggabungkan data VFross 4ectionW dan V6erkalaW
/ata cross section adalah data yang menggambarkan keadaan pada suatu 0aktu
tertentu, sedangkan data berkala ialah data yang menggambarkan perkembangan
suatu kegiatan dari 0aktu ke 0aktu. :nalisa cross section si1atnya statis, artinya tidak
memperhitungkan perubahan-perubahan yang terjadi karena perubahan 0aktu,
sedangkan analisa berkala si1atnya dinamis, karena sudah memperhitungkan adanya
perubahan-perubahan yang disebabkan oleh adanya perubahan 0aktu. Data-rata
tingkat kenaikan dan rata-rata tingkat pertumbuhan selalu dihubungkan dengan data
berkala selama jangka 0aktu tertentu. :nalisa trend termasuk yang dinamis.
9enggabungan data cross section dan data berkala secara bersama-sama dipergunakan
dalam suatu analisa. Misalnya kita ingin meneliti permintaan mobil di >akarta untuk
untuk golongan pendapatan mengah keatas. Misalnya kita sudah mempunyai data
berkala, selama 9E3=(: =, ==, dan === 1, tahun! tentang jumlah mobil yang terjual
Y!, rata-rata harga mobil C!, pendapatan masyarakat 9! dan t menunjukkan 0aktu
dengan model regresi sbb:
Yi " 61 ; 6$ ln Ct ; 6% ln 9t ; Kt, t " 1, $, ........., 1,
(ujuan kita ingin memperkirakan elstisitas harga 6$ dan elastisitas pendapatan 6%.
/i dalam data berkala, data harga dan pendapatan seringkali mempunyai kolinearitas
yang tinggi, jika harga kebutuhan pokok aik, gaji akan naik juga sbagai akibat
tuntutan para karya0an<buruh. /engan demikian seandainya kita menggunakan
model regresi diatas untuk meramalkan jumlah permintaan mobil di >akarta dengan
variabel harga dan pendapatan akan berhadapan dengan persoalan adanya kolinearitas
ganda yang tinggi.
7ntuk keperluan pembuatan peramalan tidak terjadi persoalan, oleh karena makin
besar D$ makin tepat model regresi untuk meramalkan nilai variabel tak bebas Y.
:kan tetapi kalau model dipergunakan untuk mengukur pengaruh masing-masing
variabel bebas terhadap variabel tak bebas dengan jalan memperkirakan koe1isien
regresi parsial, maka persoalan menjadi sangat serius, oleh karena hasil perkiraan
mempunyai tingkat ketelitian yang rendah yang disebabkan oleh standard error yang
sangat tinggi.
7ntuk menghindari hal ini kita harus menggunakan data cross section untuk
memperkirakan 6% yaitu elastisitas pendapatan. /ata tersebut bisa diperoleh dari
suatu 4urvey 4osial Ekonomi Nasional 474EN:4!. /ata hasil 474EN:4 kalau
diolah dapat menghasilkan data tingkat nasional dan data tingkat regional<propinsi
seperti propinsi /8= >akarta. /alam data cross section, harga tidak begitu bervariasi
sebab hanya terjadi pada suatu 0aktu tertentu. 8alau b% perkiraan 6%, kemudian kita
pergunakan b%, maka model di atas menjadi :
Yi " 61 ; 6$ ln Ct ; Kt,
/imana YG " ln Y P b% ln 9
YG merupakan Y yang sudah tidak dipengaruhi pendapatan. 9erkiraan elastisitas
harga b$ kemudian dapat diperoleh dari persamaan di atas dengan rumus yang
sederhana sekali yaitu:
Y Y y
C ln C ln h ln
h ln
y h ln
b
G
t
G
t
t t
t
G
t t
$
=
=

=
%. Mengeluarkan salah satu variabel atau lebih dan kesalahan spesi1ikasi.
>ika terjadi kolinearitas ganda yang serius, salah satu hal yang paling mudah untuk
mengatasinya adalah mengeluarkan salah satu variabel yang berkorelasi dengan
variabel lainnya.
:kan tetapidengan mengeluarkan suatu variabel dari model regresi kita melakukan
kesalahan spesi1ikasi. 8esalahan spesi1ikasi terjadi kalau kita melakukan kesalahan
dalam menentukan spesi1ikasi model yang dipergunakan dalam analisa, maksudnya
salah dalam menentukan variabel yang tepat<benar dalam suatu model regresi. >adi
kalau kalau teori ekonomi mengatakan bah0a pendapatan dan kekayaan keduanya
harus dimasukkan dalam model regresi untuk menerangkan tingkah laku variabel
konsumsi, keputusan untuk mengeluarkan variabel kekayaan dari model berarti
melakukan kesalahan spesi1ikasi.
Mengeluarkan suatu variabel justru akan menyesatkan kita dalam usaha memperoleh
parameter yang benar, artinya perkiraan parameter yang diperoleh bukan parameter
yang sebenarnya atau bukan parameter yang dimaksudkan dituju!.
*. (ran1ormasi variabel-variabel
Misalkan kita mempunyai data berkala mengenai konsumsi Y!, pendapatan +$!, dan
kekayaan +%!. 4alah satu alasan mengapa kolinearitas ganda antara pendapatan dan
kekayaan untuk data yang demikian itu tingi ialah bah0a melalui perkembangan
0aktu kedua variabel +$ X +% cenderung untuk bergerak dengan arah yang sama.
4alah satu cara untuk membuat ketergantungan dependency! antara kedua variabel
tersebut caranya sbb:
:pabila hubungan Y, +$ dan +%:
Yt " 61 ; 6$ +$t ; 6%+%t ; Kt
6erlaku untuk 0aktu t, hubungan tersebut harus berlaku untuk 0aktu t-1!, sebab titik
asal 0aktu toh sembarang arbitrary!. 2leh karena itu kita mempunyai hubungan:
Yt-1 " 61 ; 6$ +$,t-1 ; 6%+%,t-1 ; Kt-1
/ari dua persamaan tersebut diperoleh:
Yt P Yt-1 " 6$ +$t P +$,t-1! ; 6% +%t P +%,t-1! ; &t. /i mana &t " Kt P Kt-1
9ersamaan ini disebut bentuk perbedaan pertama, sebab kita membuat regresi bukan
berdasarkan data asli akan tetapi pada perbedaan dari nilai variabel yang berurutan
menurut 0aktu.
Model regresi dalam bentuk perbedaan pertama, seringkali mengurangi keseriusan
kolinearitas ganda, sebab 0alaupun tingkat korelasi +$ dan +% mungkin tinggi sekali,
akan tetapi tidak ada alasan bah0a perbedaannya juga mempunyai korelasi yang
tinggi.
(rans1ormasi atau perubahan bentuk menjadi perbedaan pertama menimbulkan
persoalan lainnya. 8esalahan pengganggu &t mungkin tidak memenuhi salah satu
asumsi model regresi linear klasik yang mengatakan bah0a kesalahan pengganggu
tidak berkorelasi antara yang satu dengan lainnya, akan tetapi kemungkinan besar
berkorelasi serial. 9ada umumnya kesalahan pengganggu &i akan berkorelasi satu
sama lain, kita lihan dengan simbul:
8ov Ki, Kj! " #, untuk i ) j
8ov &t, &t! ) #, untuk i ) j
>uga dalam hal ini penyembuhan mungkin lebih buruk dari penyakitnya sendiri, yang
jelas kita akan kehilangan satu observasi, berarti derajat kebebasan akan berkurang
satu dengan menggunakan berpedaan pertama ini, untuk sampel kecil, tentu saja hal
ini kurang baik. 4elain daripada itu cara trans1ormasi ini tidak cocok untuk data cross
section, sebab data tak dapat diurutkan menurut urutan 0aktu.
,. 9enambahan data baru.
2leh karena adanya kolinearitas ganda merupakan gambaran sampel, ada
kemungkinan bah0a untuk sampel lainnya yang mencakup variabel-variabel yang
sama, persoalan kolinearitas ganda mungkin tidak begitu serius seperti sampel
pertama. 8adang-kadang hanya dengan menambah observasi menambah nilai n!,
sudah dapat mengurangi persoalan kolinearitas ganda tersebut.
Misalnya dengan model % variabel sbb:
( )
$
$%
$
. $
$
% . 1$
1
!
r x
b Var
i

=

sekarang kalau nilai n bertambah, nilai


$
. $ i
x
akan membesar, oleh karena itu untuk
nilai r$% tertentu, &ar b1$.%! akan berkurang, ini berarti akan memperkecil standard
error, sehingga akan memperoleh perkiraan b1$.% untuk parameter 61$.% yang lebih baik,
maksudnya lebih tinggi tingkat ketelitiannya.
:da satu hal yang perlu diperhatikan yaitu bah0a didalam analisa regresi kalau kita
memperoleh hasil uji t yang tidak signi1ikan dalam rangka untuk menguji koe1isien
regresi, kita selalu beranggapan bah0a dalam hal ini disebabkan karena adanya
kolinearitas ganda. :kan tetapi penyebab kesalahan mungkin bukan karena adanya
kolinearitas ganda akan tetapi sbab-sebab lainnya seperti misalnya adanya kesalahan
spesi1ikasi.
8emungkinan besar model regresi linear yang dipergunakan salah, kurang
memasukkan variabel-variabel yang berdasarkan teori seharusnya mempunyai
pengaruh terhadap variabel tak bebas Y, dengan demikian model tersebut kurang
mendapat dukungan teori.
/i sini dianjurkan kalau memang dijumpai dalam hal di mana hasil uji t tidak
signi1ikan jangan terburu-buru menyalahkan adanya kolinearitas yang tinggi, akan
tetapi lebih baik dilakukan pengecekan apakah model sudah benar secara teoritis,
mungkin dengan melakukan penelitian perpustakaan akan dapat diperoleh alternati1
model dengan spesi1ikasi yang lebih tepat.
Kolineari#as gana sem+urna%
/ua atau lebih variabel bebas disebut Vper1ect collinearW kalau satu atau lebih variabel
bebas dapat dinyatakan sebagai kombinasi linear dari variabel lainnya. 4ebagai contoh
misalnya terjadi per1ect multicollinearity antara +$ dan +%, kalau +$ " %+% atau +$ " $ P
#,,+%. apabila dua atau lebih variabel bebas mempunyai korelasi yang sempurna
kie1isien korelasi sebesar 1!, adalah tidak mungkin menghitung V234 estimatesW dari
parameters, sebab sistem persamaan normal akan memuat dua atau lebih persamaan yang
tak bebas.
Yang dimaksud dengan VCighW but Vnot per1ect multicollinearityW adalah kalau dua atau
lebih variabel bebas dalam model regresi berkorelasi tinggi koe1isien korelasi mendekati
1, tetapi tidak mencapai satu, misalnya #,JJJ!. Cal ini menyebabkan kesukaran untuk
memisahkan pengaruh dari masing-masing variabel bebas + terhadap variabel tak bebas
Y, akan tetapi 234 estimates dari koe1isien-koe1isien masih unbiased. 3ebih lanjut, kalau
tujuan utama pembuatan regresi untuk meramalkan, multicolinearity bukan merupakan
persoalan apabila multicollinearity terus terjadi sampai pada 0aktu di mana peramalan
dibuat.
Multicollinearity dapat terjadi kalau dalam suatu model regresi tak satupun variabel bebas
hasil dari 234 2rdinary least 45uare! yang signi1icant secara statistik bahkan beberapa
diantaranya mungkin mempunyai tanda yang salah!, 0alaupun nilai koe1isien determinasi
ganda D
$
tinggi misalnya #,H sampai 1!. Mendeteksi multicollinearity tidak mudah.
8oe1isien korelasi baik sederhana maupun parsial yang tinggi diantara variabel bebas
kadang-kadang dipakai sebagai suatu ukuran adanya multicollinearity. :kan tetapi harus
disadari bah0a kolinearitas ganda yang serius bisa terjadi 0alaupun koe1isien korelasi
sederhana maupun parsial nilainya relati1 rendah, misalnya kurang dari #,,
Kolineri#as gana *ang serius( !aang$!aang ia#asi engan2
a. Menambah data.
b. Menggunakan Va priori in1ormationW misalnya telah diketahui dari hasil
penelitian sebelumnya bah0a b% " #,H, b$!
c. Membuat trans1ormasi 1ungsional
d. Membuang salah satu variabel yang berkorelasi tinggi, akan tetapi hal ini
dapat menimbulkan persoalan baru yang disebut Yspeci11ication errorW yaitu
membuang variabel yang seharusnya menurut teori ekonomi harus masuk dalam
persamaan regresi.
Ring!asan Kolineari#as gana%
4alah satu asumsi model regresi linear klasik adalah bah0a tidak ada kolinearitas
ganda diantara variabel bebas +. /alam interpretasi secara luas kolinearitas ganda
menunjukkan suatu situasi di mana terjadi hubungan linear yang eksak atau mendekati
eksak diantara variabel bebas +.
Konse!uensi ari !olineari#as gana aala3 se,agai ,eri!u#2
a. 8alau ada kolinearitas yang sempurna per1ect collinearity! diantara
variabel bebas +, koe1isien regresi parsial dari masing-masing variabel bebas tidak
menentu indeterminite! dan standard errornya tak terbatas in1inite!.
b. 4eandainya kolinearitas tinggi akan tetapi tidak sempurna, koe1isien
regresinya dapat dicari akan tetapi standard errornya terlalu besar, sehingga perkiraan
interval dari koe1isien regresi sangat lebar, tingkat ketelitiannya menjadi kurang,
sebagai perkiraan suatu parameter.
Malaupun tak ada suatu cara yang tepat untuk mengetahui atau mendeteksi kolinearitas,
akan tetapi ada beberapa indikator yang perlu untuk mendeteksinya, yaitu sbb:
1. 4uatu tanda yang jelas dengan adanya kolinearitas ganda ialah kalau nilai R
.
besar
sekali dan tak satupun dari koe1isien regresi parsial yang signi1ikan kalau
dipergunakan uji t. =ni suatu keadaan yang ekstrim.
$. /i dalam model yang mencakup dua variabel bebas, untuk mengetahui adanya
kolinearitas ganda, kita hitung koe1ieien regresi sederhana atau order satu antara dua
variabel bebas tersebut, kalau nilai koe1isien regresi ini tinggi, berarti memang ada
kolinearitas ganda.
%. 7ntuk yang mencakup dua variabel bebas atau lebih, koe1isien korelasi sederhana
atau order nol dapat menyesatkan sebab mungkin bisa terjadi mempunyai koe1isien
korelasi sederhana yang rendah akan tetapi masih diperoleh kolinearitas ganda yang
tinggi. /alam situasi semacam ini kita perlu meneliti koe1isien korelasi parsial.
*. :pabila D
$
tinggi akan tetapi koe1isien korelasi parsial rendah, adanya
kolinearitas ganda merupakan suatu kemungkinan yang besar, akan tetapi kalau D
$
tinggi dan koe1isien korelasi parsial juga tinggi, adanya kolinearitas ganda mungkin
susah diketahui, tidak segera bisa dideteksi.
,. 2leh karena kita bisa membuat regresi dari setiap variabel bebas terhadap sisa
variabel bebas lainnya yang tercakup dalam model dan mencari koe1isien determinasi
masing-masing raitu D
$
i. (ingginya nilai D
$
i berarti bah0a +i mempunyai korelasi
yang tinggi dengan sisa variabel bebas lainnya. /engan demikian kita bisa
mengeluarkan dari model variabel +i dengan nilai D$i yang tinggi asalkan tidak
menimbulkan persoalan spesi1ikasi yang serius.
:sumsi kedua
Comoskedastisitas
4alah satu asumsi dalam model regresi linear klasik ialah bah0a kesalahan pengganggu &i
mempunyai varian yang sama, artinya &arian &i! " E&
.
i! " '
$
untuk semua i, i " 1, $,
%, ....... , n, sama untuk semua kesalahan pengganggu asumsi homoscedastic!
Comoskedastisitas yaitu bah0a varian dari setiap kesalahan pengganggu Ki untuk
variabel-variabel bebas yang diketahui, merupakan suatu bilangan konstan dengan simbul
'
$
dibaca sigma kuadrat!. =nilah asumsi homoskedastisitas homoscedasticity! atau sama
homo! penyebarannya skedastisitas! maksudnya sama varian.
4ecara simbol : E&i! " '
$
, i " 1, $, %, ....... , n,
4ecara diagram, dalam hubungan dua variabel, homoskedastisitas dapat ditunjukkan sbb:
8epadatan Gam,ar -
Y
+ " pendapatan : ; 6 +
Y " tabungan +
Tambar di atas menunjukkan bah0a varian Yi atau varian &i! dengan syarat variabel
bebas + " +i, akan tetap sama untuk semua nilai variabel + yang berlainan.
9erlu diketahui bah0a varian Yi! " varian &i!. Cal ini ditunjukkan dengan kurva normal
yang sama untuk setiap nilai variabel +i. 9ersamaan garis regrasi sebenarnya
EYi<+i! " : ; b +.
9erhatikan bah0a untuk + tertentu, misalnya + " +i akan terdapat beberapa nilai Y, jadi
untuk nilai konstan +i maka nilai Y bervariasi, Y mempunyai distribusi dan varian, dalam
hal ini varian Yi! " varian &i!.
Misalnya ada , orang yang diteliti masing masing mempunyai pendapatan yang sama
yaitu Dp 1##.###,- tetapi konsumsinya tidak sama.
No 9endapatan 8onsumsi
1 1##.### I#.###
$ 1##.### H,.###
% 1##.### -#.###
* 1##.### I,.###
, 1##.### J#.###
>umlah ,##.### %J#.###
Data-rata 1##.### HI.###
Data-rata Y dengan syarat + " 1##.### ditulis sbb: EY<+ " 1##.###! " HI.###
>adi rata-rata konsumsi dengan syarat pendapatan Dp1##.###,- sebesar DpHI.###,-
7ntuk setiap kelompok pendapatan tertentu, konsumsi akan berbeda-beda.
9endapatan +1, konsumsi Y11, Y1$, ..........., Y1n
9endapatan +$, konsumsi Y$1, Y$$, ..........., Y$n
9endapatan +%, konsumsi Y%1, Y%$, ..........., Y%n
9endapatan +k, konsumsi Yk1, Yk$, ..........., Ykn
/alam keadaan homoskedastik, varian dari masing-masing Y sama,
yaitu &ar Yi! " &ar &i! " 'i
$
. akan tetapi dalam keadaan heteroskedastik, varian msing-
masing Y tak sama dengan simbul: &ar Yi! ) &ar &i! ) 'i
$
ini berarti bah0a varian Yi atau varian &i dengan syarat bah0a + " +i, tak sama untuk
semua + yang berlainan. 9erhatikan gambar berikut:
4ecara diagram, dalam hubungan dua variabel, heteroskedastisitas dapat ditunjukkan sbb:
8epadatan Gam,ar .
Y
+ " pendapatan : ; 6 +
Y " tabungan +
/alam gambar 1, varian untuk tabungan sama untuk semua tingkat pendapatan,
sedangkan dlam gambar $, varian tabungan meningkat dengan naiknya pendapatan.
/alam gambar $, makin tinggi pendapatan, secara rata-rata akan menabung lebih besar
daripada keluarga dengan pendapatan rendah, akan tetapi tabungan mereka lebih
vervariasi sebab varian makin membesar!
:da beberapa alasan mengapa kesalahan pengganggu &i menjadi variabel, selalu berubah,
antara lain sebagai berikut:
1. Mengikuti model berbuat kesalahan dalam belajar error learning model!, yaitu kalau
orang belajar terus, kesalahan untuk melakukan apa yang dipelajari semakin menurun,
sebab ketrampilan semakin meningkat. /alam hal ini varian 'i
$
diharapkan menurun
nilainya. 4epert dalam gambar berikut
8epadatan
Y
+ " lamanya belajar mengetik : ; 6 +
Y " kesalahan mengetik +
Makin lama seseorang seseorang berpraktek mengetik, secara rata-rata makin sedikit
kesalahan yang dilakukan, dan di samping itu mengecil nilai variannya.
$. 8alau pendapatan tumbuh<berkembang, makin banyak orang menerima pendapatan
yang sangat berbeda-beda jumlahnya dari puluhan ribu sampai miliaran rupiah!,
kemungkinan mempunyai lebih banyak alternati1 untuk mengeluarkan<menggunakan
pendapatannya itu, misalnya pengeluaran untuk tabungan sangat bervariasi, sehingga
varian makin membesar dengan kenaikan pendapatan. 9erusahan-perusahaan dengan
keuntungan besar akan bervariasi dalam pemberian deviden dibandingkan dengan
perusahaan yang keuntungannya kecil.
%. >uga kalau teknik pengumpulan data semakin baik, nilai '
$
cenderung mengecil.
Misalnya bank yang menggunakan peralatan elektronik data processing E/9! akan
membuat kesalahan yang relati1 kecil dalam laporannya bulanan, tri0ulan, tahunan!
dibandingkan dengan bank yang tidak mempunyai peralatan tersebut.
9erlu diketahui bah0a persoalan heteroskedastisitas akan lebih sering terjadi pada
analisa data cross section daripada data time series.
Konse!uensi se,agai a!i,a# aan*a 3e#eros!eas#isi#as%
>ika semua asumsi model regresi linear klasik dipenuhi, pemerkira hasil dari metode
kuadrat terkecil biasa 2rdinary least s5uares " 234, estimators! akan tak bias dan
dengan varian minimum di antara pemerkira-pemerkira linear yang tak bias atau sering
disebut 637 6est 3inear 7nbiased Estimator!. 4ingkatnya pemerkira-pemerkira itu
e1isien.
4ekarang kalau semua asumsi klasik tersebut berlaku kecuali satu yang tidak,
yaitu terjadi herteroskedastisitas, maka pemerkira 234 masih tetap tak bias dan konsisten
akan tetapi tidak lagi e1isien baik untuk sampel kecil maupun untuk sampel besar.
/alam sampling yang terulang repeated sampling!, pemerkira 234 secara rata-
rata akan sama dengan nilai parameter dari populasinya si1at ketidak biasan atau
unbisedness! dan kalau sampel diperbesar sampai n menuju tak terhingga, pemerkira itu
akan mendekati nilai sebenarnya si1at konsistensi! akan tetapi varian atau standard
errornya tidak lagi minimum, meskipun sampel diperbesar sampai n menuju tak terhingga
si1at e1isiensi asimtotis atau Vasymtitic e11iciencyW!
Misalnya model regresi dua variabel sbb:
Yi " : ; 6 +i ; Ki
4ekarang varian Ki! " EKi! " '
$
i akan tetapi semua asumsi klasik masih tetap sama, akan
dapat ditunjukkan bah0a dengan metode kuadrat terkecil tertimbang, dapat diperoleh
637E dari parameter 6, yaitu bG, dengan rumus sbb:
$
i
i
$
i
$
i i i
i G
$
i
$
i i i
i i i i i i i i G
1
M
! + M ! + M ! M
M
b &ar
! + M ! + M ! M
! Y M ! + M ! Y + M ! M
b

=


=
9emerkira bG disebut pemerkira kuadrat terkecil tertimbang.
9emerkira 234 untuk 6 ialah b dengan rumus berikut:
$
i
i i
B
y B
b

=

dalam keadaan heteroskedastisitas, variannya dapat ditunjukkan menjadi:
$ $
i
$
i
$
i
! B
B
b! &ar

=

4i1at ketidak biasan unbiasedness! tidak memerlukan syarat bah0a kesalahan
pengganggu &i harus homoskedastik. :kan tetapi varian b! dalam ==.H akan berbeda dan
lebih besar dari varian bG dalam ==.*, kita telah sebutkan bah0a bG adalah 637E. /apat
disimpulkan bah0a 0alaupun b tak bias, tetapi tak e1isien, variannya terlalu besar, lebih
besar dari varian bG
8onsekuensi dari heteroskedastisitas:
1. :pabila terjadi heteroskedastisitas, secara teoritis 637E dari 6 ialah pemerkira
kuadrat terkecil tertimbang bG, bukan b seperti biasanya, 0alaupun b tak bias
akan tetapi varian b! tidak e1isien.
$. &arian b! yang diperoleh berdasarkan asumsi adanya heteroskedastisitas tidak
lagi minimum, akan tetapi varian bG yang minimum
%. =nterval keyakinan untuk 6 sangat lebar dan uji signi1ikan kurang kuat.
*. >ika terjadi heteroskedastisitas, var b! menjadi bias, bias ini terjadi karena
pemerkira 4
$
untuk '
$
tak lagi tak bias.
,. >ika terjadi heteroskedastisitas, kalau kita tak sadar kemudian menggunakan
1ormula 234 yang biasa, kita akan membuat kesimpulan yang salah, sebab uji t
dan E tak ber1ungsi sebagaimana seharusnya kalau terjadi heteroskedastisitas.
Cara mene#e!si 3e#ros!eas#isi#as%
(idak ada suatu aturan yang sudah mapan untuk mendeteksi adanya heteroskedastisitas,
belum ada aturan yang memuaskan untuk dipergunakan.
:da beberapa metode yang yang dapat mendeteksi adanya heteroskedastisitas.
1. 4i1at persoalannya. 4ringkali, si1at persoalan yang diteliti menyarankan atau
menunjukkan kemungkinan adanya heteroskedastisitas. 4ebagai contoh, pengalaman
penelitian yang dilakukan oleh 9rois dan Couthakker mengenai pengeluaran rumah
tangga, dimana mereka menemukan bah0a varian residual atau kesalahan
pengganggu sekitar garis regresi konsmsi terhadap pendapatan meningkat nilainya
bersamaan dengan meningkatnya pendapatan, kemudian pada 0aktu ini, pada
umumnya ada anggapan bah0a dalam penelitian yang serupa seseorang akan
mengharapkan adanya varian yang tidak sama diantara kesalahan pengganggu.
$. Metode gra1ik. :pabila tak ada in1ormasi sebelumnya atau in1ormasi secara
empiris, tentang adanya heteroskedastisitas, dalam prakteknya kita dapat membuat
analisa regresi berdasarkan sumsi bah0a tak ada heteroskedastisitas dan kemudian
melakukan pengecekan terhadap perkiraan kesalahan pengganggu residual! kuadrat
yaitu ei untuk melihat kalau-kalau seluruh ei menunjukkan yang sistimatis. 4uatu
pengecekan tentang Ae
$
i " jumlah kesalahan pengganggu kuadrat D44 " residual
sum s5uare! akan menunjukkan pola seperti pada gambar di ba0ah ini. /alam gra1ik,
ei digambar bersamaan dengan Qi, tujannya untuk mengetahui apakah perkiraan nilai
rata-rata Y secara sistimatis berhubungan dengan kuadrat kesalahan pengganggu
residual!.
e
$
e
$
e
$
a! Q b! Q c! Q
e
$
e
$
d! Q e! Q
Tambar a tak ada pola sistimatis yang terjadi antara dua variabel, mungkin tak ada
heteroskedastisitas dalam data. Tambar b ada pola yang de1initi1. Tambar c
menunjukan adanya hubungan linear, gambar d menunjukkan hubungan kuadratik,
gambar e menunjukkan hubungan asimtutis antara ei dan Q.
/engan menggunakan gra1ik hubungan antara ei dan Q, 0alaupun in1ormal seseorang
dapat membuat trans1ormasi terhadap data sedemikian rupa sehingga hasil trans1ormasi
tidak menunjukkan adanya heterodkedastisitas.
8ita juga dapat menggambarkan hubungan antara ei dengan salah satu variabel bebas
+ yang tercakup dalam model regresi linear berganda sbb:
e
$
e
$
e
$
a! + b! + c! +
e
$
e
$
d! + e! +
9ola seperti pada gambar c menunjukkan suatu pertanda bah0a varian dari kesalahan
pengganggu atau residual mempunyai hubungan linear dengan +, hal ini menunjukkan
bah0a varian heteroskedastik mungkin proporsional dengan variabel bebas +.
9engetahuan ini mungkin membantu kita untuk mentrans1ormasikan data yang akan
kita analisa sedemikian rupa dalam regresi terhadap data yang sudah ditran1ormasikan ,
varian dari kesalahan pengganggu menjadi homoskedastik.
%. 7ji 9ark 9ark test!
9ark mem1ormalkan metode gra1ik dengan menganjurkan bah0a '
$
i merupakan
1ungsi dari variabel bebas +. Eungsi yang dianjurkan adalah sbb:
'
$
i " '
$
+
6
i e
v
i
atau ln '
$
i " ln '
$
; 6 ln +i ; &i
di mana &i merupakan kesalahan pengganggu residual!
8arena pada umumnya '
$
tidak diketahui, 9ark mengusulkan menggunakan ei
sebagai suatu proBy pendekatan<ganti! dan membuat regresi berikut:
ln e
$
i " ln '
$
; 6 ln +i ; &i
" : ; 6 ln +i ; &i
:pabila melalui pengujian hipotesa 6 ternyata signi1ikan secara statistik berarti +
mempengaruhi ei maka dalam data terjadi heteroskedastisitas.
7ji 9ark adalah prosedur dua 1ase<tahap.
9ada tahap pertama kita membuat regresi dengan menggunakan 234 kemudian
melakukan regresi tanpa memperhatikan adanya heteroskedastisitas. /ari regresi ini
kita peroleh ei, kemudian pada tahap kedua kita kekbuat regresi ei terhadap +.
*. 7ji Tlejser Tlejser test!
7ji Tlejser hampir sama dengan uji 9ark. 4etelah memperoleh residual ei dari regresi
234, Tlejser mengusulkan regresi harga mutlak dari ei, yaitu ZeiZterhadap variabel
bebas + yang dianggap mempunyai hubungan yang kuat dengan 'i.
/alam eksperimen yang dia lakukan, Tlejser mengunakan bentuk 1ungsi sbb:
ZeiZ" 6 +i ; &i
i
$
i i
i i i
i i i
i
i
i
i
i
i
i i i
& + 6 : e
& + 6 : e
& + 6 : e
&
+
1
6 e
&
+
1
6 e
& + 6 e
+ + =
+ + =
+ + =
+ =
+ =
+ =
di mana &i " kesalahan penganggu.
4ebagai suatu yang empiris atau praktis, kita bisa menggunakan uji Tlejser. (etapi
Told1eld dan [uandt, menunjukkan bah0a kesalahan pengganggu &i akan
menimbulkan persoalan yaitu bah0a nilai harapannya tak sama dengan nol, E&i! ) #
sebab terjasi korelasi serial.
8esukaran lain yang ditimbulkan oleh Tlejser adalah bah0a model seperti
& + 6 : e
& + 6 : e
$
i i
i i i
+ + =
+ + =
adalah non linear dalam parameter maka dari itu tak dapat diperkirakan dengan
menggunakan prosedur 234 yang biasa.
Tlejser telah menemukan bah0a untuk sampel yang besar, empat pertama dari model
di atas akan memberikan hasil yang memuaskan di dalam usaha mendeteksi adanya
heteroskedastisitas. 2leh karna itu sebagai hal yang praktis, teknik Tlejser dapat
dipergunakan untuk sampel yang besar dan dapat juga digunakan untuk sampel yang
kecil sebagai suatu alat kualitatai1 untuk mempelajari sesuatu yang berkenaan dengan
heteroskedastisitas.
,. 7ji korelasi rank dari 4pearman 4pearman\s rank correlation test!
8oe1isien korelasi rank dari 4pearman dide1insikan sbb:

=
! 1 nn
d
- - 1 r
$
$
i
s
dimana di " perbedaan dalam rank yang diberikan pada dua karakteristik yang
berbeda dari individu atau 1enomana ke i.
n " banyaknya individy atai 1enomena yang diberi rank.
8oe1isien korelasi rank tersebut dapat dipergunakan untuk mendeteksi
heteroskedastisitas, sebagai berikut: 8ita anggap belaku hubungan Yi " : ; 6+i ; Ki
(ahap = : (erapkan regresi tersebut pada data Y dan + dan hitung kesalahan
pengganggu residual! ei, perkiraan Ki
(ahap == : tanpa memperhatikan tanda ei, yaitu kita ambil nilai mutlaknya ZeiZ,
kemudian buat rank dari kedua variabel ZeiZ dan +i sesuai dengan urutan yang
menaik<menurun dan hitung koe1isien korelasi rank dari 4pearman.
(ahap === : /engan anggapan bah0a koe1isien korelasi rank sebenarnya ]s "Dho s!,
akan sebesar nol, dan n ^ I, signi1ikan dari sampel, dapat diuji dengan uji t sbb:
$
s
s
r 1
$ n r
t

=
dengan d1 " n P $
apabila nilai t hitung melebihi nilai t tabel, kita dapat menerima hipotesa bah0a ada
heteroskedastisitas, kalau tidak kita tolak hipotesa.
:pabila model regresi mencakup lebih dari dua variabel bebas, rs dapat dihitung
antara ei dengan setiap variabel bebas + secara terpisah dan dapat diuji untuk
mengetahui signi1ikan tidaknya dengan menggunakan uji t
Fontoh:
+ ei Dank +! Dank ei! d d
$
1$,* 1,#1H , J -* 1-
1*,* 1,$-# H 1# -% J
1*,- #,1I1 I * * 1-
1-,# 1,$#$ J , * 1-
11,% #,$$1 %,, - -$,, -,$,
1#,# #,-#$ 1 H -- %-
1-,$ #,J#I 1# I $ *
1#,* #,11# $ % -1 1
1%,1 #,#HH - $ * 1-
11,% #,#%I %,, 1 $,, -,$,
>umlah # 1$-,,
$%%% , #
! 1 1## 1#
1$-,,
- 1
! 1 nn
d
- - 1 r
$
$
i
s
=

=

-HI- , #
$%%% , # 1
$ - 1# #,$%%%
r 1
$ n r
t
$ $
s
s
=

=
untuk d1 " n-$ " 1# P $ " I, nilai t signi1ikan 0alaupun sudah dipergunakan nilai tingkat
signi1ikan R alpha! sebesar 1#N. >adi tak ada bukti adanya hubungan yang sistimatis
antara variabel bebas + dengan nilai mutlak residual, sehingga dapat disimpilkan
berdasarkan kriteria uji ini, bah0a tak terjadi heteroskedastisitas.
Cara menga#asi +ersoalan 3e#eros!eas#isi#as%
Cateroskedastisitas tidak merusak si1at-si1at ketidakbiasan dan konsisten daripada
pemerkira 234 akan tetapi tidak lagi e1isien, bahkan tidak juga secara asimtotis yang
seharusnya berlaku untuk sampel besar!.
8ekurangan si1at e1isiensi ini membuat prosedur pengujian hipotesa yang biasa
berkurang nilainya<meragukan hasilnya. Maka dari itu perlu adanya penyembuhan, perlu
diatasi. :da dua pendekatan, pertama kalau '
$
i diketahui, kedua kalau '
$
i tidak diketehui.
Kalau 4
.
i i!e#a3ui2 Me#oe !uara# #er!e5il #er#im,ang%
:pabila '
$
i diketahui atau dapat diperkirakan, cara yang paling mudah untuk mengatasi
adanya heteroskedastisitas ialah dengan metode kuadrat terkecil tertimbang.
Fontoh:
Eungsi Degresi 9opulasi ED9!: Yi " : ; 6+i ; Ki
Eungsi Degresi 4ampel ED9! : Qi " a ; b+i ; ei
Metode kuadrat terkecil tak tertimbang, membuat Ae
$
i " AYi P Qi! atau AYi P a P b+!
$
minimum agar diperoleh a X b sebegai pemerkira parameter : X 6. /alam membuat Ae
$
i
menjadi minimum, metode kuadrat terkecil tak tertibang, secara implisit memberikan
timbangan yang sama unuk setiap e
$
i. >adi dalam scattergram pada gambar di ba0ah ini,
titik :, 6 dan F, semua mempunyai timbangan yang sama untuk menghitung Ae
$
i.
>elaslah bah0a dalam hal ini e
$
i yang berhubungan dengan titik F akan mendominir Ae
$
i,
sebab pada titi F, e
$
i mempunyai nilai terbesar ekstrim!.
Metode kuadrat terkecil tertimbang sudah memperhitungkan adanya ei yang ekastrim
dengan membuatnya minimum:
Ae
$
i " A0i Yi P aG P bG+!
/i mana 0i " timbangan , aG X bG pemerkira metode kuadrat terkecil tertimbang.
(imbangan 0i harus dipilih sedemikian rupa sehingga observasi yang ekstrim seperti
pada titik F, menerima timbangan yang kecil.
8alau 'i diketahui maka timbangan 0i akan mengambil nilai:

i
i
1
0

=
yang berarti timbangan untuk setiap observasi proporsional terbalik dari 'i. (imbangan
ini akan mengurangi secara tajam pengaruh nilai observasi ekstrim seperti pada titik F.
Q _ F
e
Qi " a ; b+i
_ :
e
e
_ 6
# +
Metode kuadrat terkecil tertimbang akan menghasilkan rumus berikut:
$ G
i i
G
i
G
i i G
G G G G
B 0
y B 0
b
+ b Y a

=
=
di mana:
G
i
G
i
G
i
G
i
i
i i G
i
i i G
Y Y y
+ + B
0
+ 0
+
0
Y 0
Y
=
=

=
7ntuk ilustrasi, metode kuadrat terkecil tertimbang, kita pergunakan model dua variabel
sbb:
Eungsi Degresi 9opulasi ED9!: Yi " : ; 6+i ; Ki
Eungsi Degresi 4ampel ED9! : Qi " a ; b+i ; ei
Metose kuadrat terkecil tak tertimbang membuat minimum Ae
$
i " AYi P a P b+!
$
untuk
memperoleh perkiraan berikut:
$
i
i i
B
y B
b

=
4edangkan metode kuadrat terkecil tertimbang membuat minimum
A0ie
$
i " A0i Yi P aG P bG+!
$
di mana aG dan bG merupakan pemerkira kuadrat terkecil
dengan timbangan 0i sbb:
$ i
1
0
i

=
Menurunkan parsial A0ie
$
i " A0i Yi P aG P bG+!
$
terhadap aG dan bG kemudian
menyamakannya dengan nol maka diperoleh hasil:
A0iYi " aGA0i ; bGA0i+i
A0i+iYi" aGA0i+i ; bG A0i+
$
i
6isa juga diperoleh hasil:
$ G
i i
G
i
G
i i G
G G G G
B 0
y B 0
b
+ b Y a

=
=
Kalau 4
.
i #ia! i!e#a3ui
>ika 4
.
i tidak diketahui kita dapat membuat trans1ormasi model regresi yang asli
sedemikian rupa sehingga model yang telah ditrans1ormasikan akan memenuhi asumsi
homoskedastisitas.
Fontoh membuat trans1ormasi dengan menggunakan model dua variabel:
Yi " : ; 6+i ; Ki
:sumsi = : EK
$
i! " '
$
+
$
i
4ebagai suatu spekulasi, model pendekatan gra1ik 9ark dn glejser dapat dipercaya bah0a
varian K! proporsional dengan B
$
, kita dapat membuat trans1ormasi pada model asli sbb:
i
i
i
i
i i
i
i
i
i i
i
+
v
v 6
+
:
+
Y
+
6
+
:
+
Y

=
+ + =
+ + =
vi adalah kesalahan pengganggu yang sudah ditran1ormasikan.
>adi varian vi sekarang sudah homoskedastisitas, dan kita dapat menggunakan 234
terhadap model yang sudah ditrans1ormasikan, yaitu membuat regresi Yi<+i terhadap 1<+i
9erlu diperhatikan bah0a dalam regresi yang ditrans1ormasikan, titik potong 6
merupakan koe1isien regresi dari model yang asli. Maka dari itu, untuk mendapatkan
model yang asli kembali kita harus mengalikan persamaan i
i i
i
v 6
+
:
+
Y
+ + =
dengan +i.
:sumsi $: hal -,
6e#eros!earsisi#as
Cetroskedastisitas adalah suatu keadaan di mana varian dari kesalahan pengganggu tidak
konstan untuk semua nilai variabel bebas, yaitu E+i, Ki! ) #, sehingga EKi!
$
) '
$

=ni merupakan pelanggaran salah satu asumsi tentang model regresi linear berdasarkan
metode kuadrat terkecil. /i dalam regresi biasanya kita berasumsi bah0a EKi!
$
" '
$
untuk semua Ki, artinya untuk semua kesalahan pengganggu, variannya sama. 9ada
umumnya terjadi di dalam data Vcross sectionW, yaitu data yang menggambarkan keadaan
pada suatu 0aktu tertentu, misalnya data data hasil suatu survai.
Misalnya varian kesalahan pengganggu yang berhubungan dengan pengeluaran dari
keluarga berpenghasilan rendah biasanya lebih kecil daripada keluarga berpenghasilan
tinggi, oleh karena pengeluaran bagi keluarga berpenghasilan rendah biasanya hanya
terbatas pada kebutuhan pokok.
Tambar a! menunjukkan homoskedastisitas
Tambar b!, c! dan d! menunjukkan heteroskedastisitas.
Tambar a! menunjukkan varian kesalahan pengganggu yang konstan.
Tambar b!, '$ makin besar kalau + makin besar
Tambar c! '$ makin kecil kalau + makin besar
Tambar d! '$ mula-mula mengecil kemudian membesar kalau + makin besar
Ceteroskedastisitas menjadi masalah karena dengan adanya Ceteroskedastisitas,
perkiraan parameter berdasarkan 234, masih V7nbiased and cosistentW akan tetapi tidak
e1isien, maksudnya mempunyai varian yang lebih besar daripada Vminimum varianceW.
3ebih lanjut perkiraan varian parameter akan VbiasedW dan menyebabkan pengujian
hipotesa tentang parameter tidak tepat, interval keyakinan menjadi bias biased
convidence intervals!.
:danya heteroskedastisitas dapat diuji dengan cara mengatur atau mengurutkan data dari
nilai variabel bebas + dari yang terkecil sampai yang terbesar, sehingga diperoleh urutan
sebagai berikut +1 +$ + ... +i ... +n, +i " terkecil dan +n terbesar, setelah
diurutkan. 8emudian dibuat regresi secara terpisah, pertama untuk nilai + yang kecil,
kedua untuk + yang besar, dihilangkan beberapa data yang ada di tengah, misalnya data
yang dihilangkan sekitar 1<, atau $#N
+i +n
*#N $#N *#N
Nilai kecil nilai yg dihilangkan nilai besar
8emudian rasio jumlah kuadrat dari kesalahan pengganggu regresi kedua terhadap
regresi pertama yaitu
( )
( )
1
$
E44
E44
, di mana E44 singkatan dari Error 4um 45uares, diuji,
untuk mengetahui apakah ada perbedaan atau tidak. 7ntuk menguji ini dipergunakan
distribusi E E test! dengan derajat kebebasan sebesar n P d P $k!, di mana n "
banyaknya observasi atau besarnya sampel, d, banyaknya data atau nilai observasi yang
ada di tengah, yang dibuang tak dipergunakan untuk regresi! sebesar ` $#N, k "
banyaknya parameter yang diperkirakan. (est ini disebut Vthe Told1eld [uandt test 1or
heteroscedasticityW dan sangat tepat untuk sampel yang besar, yaitu kalau n ^ %#.
seandainya tidak ada data yang dibuang, yaitu kalau d " #, test masih berlaku, hanya
kemampuan untuk mendeteksi adanya heteroskedastisitas agak berkurang.
6agaimana heteroskedastisitas dapat dikoreksiL
:pabila dianggap atau diasumsikan bah0a varian K! " h +
$
i, di mana h " konstan, tak
sama dengan nol h ) #!, kita dapat mengoreksi adanya heteroskedastisitas dengan jalan
membagi menimbang! setiap suku di dalam regresi baru dengan variabel yang sudah
dirubah bentuknya trans1ormrd variables!.
7ntuk hubungan dua variabel regresi sederhana! bentuknya sbb:
Yi<+i " :<+i ; 6 ; K<+i G!
:slinya: Yi " : ; 6+i ; K populasi!
Yi " a ; b+i ; K sampel!
8esalahan pengganggu sekarang menjadi K<+i, dan variannya menjadi homoskedastik,
yaitu:
&ar K<+i! "
h h.+ .
+
1
! .varK
+
1
$
i $
i
i $
i
= =
9erlu diperhatikan, dalam persamaan G!, titik potong intercept! yang asli, berubah
menjadi variabel setelah dibagi dengan +i, sedangkan koe1isien regresi 6, sekarang
memegang peranan sebagai titik potong yang baru. /i dalam membuat interpretasi harus
berhati-hati mengenai regresi yang ditimbang, berdasarkan variabel yang sudah dirubah
trans1ormed!.
/i dalam hal regresi berganda, lebih dari satu variabel bebas, setiap suku dalam regresi
dibagi dengan salah satu variabel bebas, misalnya +%i, yang berkorelasi sangat kuatnya
dengan kesalahan pengganggu K.
9ersamaan asli Yi " 61 ; 6$ +$i ; 6% +%i ; Ki GG!
4etelah dirubah<ditimbang:
%i
i
%
%i
$i $
%i
1
%i
i
+
K
6
+
+ 6
+
6
+
Y
+ + + =

9erhatikan untuk persamaan GG!, titik potong 6 berubah menjadi 61<+%i, sedangkan
koe1isien regresi parsial 6% berubah menjadi titik potong. /i dalam prakteknya kesalahan
pengganggu sebenarnya Ki tidak diketahui, akan tetapi dapat diperkirangan dengan ei.
7ntuk mengetahui mana yang kuat berkoralasi dengan K, apakah +$ atau +%, cukup
membuat scaterdiagram antara +$ dengan e dan antara +% dengan e, yang bemberikan
nilai koe1isien regrasei terbesar akan dipergunakan untuk menimbang membagi!.
OTOKORELASI
2tokorelasi adalah merupakan korelasi antara anggota seri observasi yang disusun
menurut urutan 0aktu seperti data time-series! atau menurut urutan tempat<ruang
seperti data cross-section!, atau korelasi pada pada dirinya sendiri.
2tokorelasi adalah korelasi yang terjadi diantara anggota-anggota dari serangkaian
pengamatan yang tersusun dalam rangkaian 0aktu data time series! atau yang disusun
dalam rangkaian ruang data cross section!.
8alau korelasi menunjukkan hubungan antara dua atau lebih variabel-variabel yang
berbeda, maka otokorelasi menunjukkan hubungan antara nilai-nilai yang berurutan dari
variabel yang sama.
/ata time series
/alam hal hubungan antara konsumsi dan pendapatan, biasanya pola pengeluaran
konsumsi periode sekarang antara lain ditentukan oleh pengeluaran konsumsi pada
periode sebelumnya. 8arena biasanya konsumen tidak bisa mengubah pola konsumsinya
dalam 0aktu singkat. Cal ini karena adanya pengaruh psikologis, teknis dan
kelembagaan.
/ata cross section
/emikian juga pada data konsumsi dan pendapatan rumah tangga. 8enaikan pendapatan
suatu rumah tangga akan mempengaruhi konsumsi rumah tangga lainnya tetangganya!.
Misalnya di lingkungan perumahan, jika ada rumah tangga yang pendapatannya
meningkat kemudian beli (&, sepeda motor, kulkas, mesin cuci, maka tetangganya
menjadi ngiri kemudian ikutan beli barang yang sama, padalal pendapatannya tidak
meningkat.
/alam hubungannya dengan persoalan regresi, model regresi linear klasik menganggap
bah0a otokorelasi demikian itu tidak terjadi pada kesalahan pengganggu Ki. /engan
simbul dinyatakan sbb: E Ki Kj! " #, i ) j
Model klasik menganggap bah0a kesalahan pengganggu Ki yang berhubungan dengan
data observasi ke-i tidak akan dipengaruhi oleh kesalahan pengganggu Kj yang
berhubungan dengan data observasi ke-j i,j " 1,$,...,n!.
Misalnya kita mempunyai data tri0ulanan yang berkenaan dengan regresi output Y!
pada tenaga kerja +$! dan modal +%!, dan misalnya ada pemogokan para karya0an yang
mempengaruhi output dalam suatu tri0ulan tertentu, tak ada alasan untuk percaya bah0a
gangguan ini akan berlangsung terus hingga ke tri0ulan berikutnya, sebab kemungkinan
masalahnya sudah diselesaikan, maksudnya kalau karena pemogokan ini, output tri0ulan
yang bersangkutan rendah, output dalam tri0ulan berikutnya belum tentu rendah.
/emikian halnya, kalau kita mempunyai data cross section yang berkenaan dengan
regresi mengenai konsumsi rumah tangga Y terhadap pendapatan rumah tangga +!,
pengeruh kenaikan pendapatan dari ssuatu rumah tangga akan mempengaruhi konsumsi
rumah tangga yang bersangkutan, akan tetapi tidak perlu mempengaruhi konsumsi rumah
tangga lainnya tetangganya!.
8alau memang ada ketergantungan antara Ki dan Kj maka dikatakan ada otokorelasi,
dengan simbol dapat dinyatakan sbb: E Ki Kj! ) #, i ) j, persamaan ini berarti gangguan
yang disebabkan oleh adanya pemogokan karya0an yang menyebabkan menurunnya
output dalam tri0ulan yang bersangkutan masih mempengaruhi output tri0ulan
berikutnya, output masih turun mungkin usaha penyelesaian masalah buruh belum
tuntas 1##N!, atau kenaikan pendapatan rumah tangga yang juga menaikkan konsumsi
rumah tangga yang bersangkutan, ternyata mempengaruhi konsumsi rumah tangga
lainnya tetangganya!.
4ebab-sebab terjadinya otokorelasi adalah:
1. 8elembaman =nertia!
4i1at atau tanda yang menonjol daripada data time-series ekonomi adalah
kelembaman. (elah terkenal bah0a data time series seperti TN9, indeks harga,
produksi, employment X unemployment selalu menunjukkan siklus bisnis
business cycles!. Mulai dari ba0ah pada masa resesi, ketika ekonomi mulai
membaik, variabel-variabel ekonomi ini mulai bergerak. /alam setiap perubahan
ini, nilai variabel pada suatu 0aktu tertentu lebih besar<lebih kecil dari 0aktu
sebelumnya. >adi ada suatu momentum atau laju yang tertanam pada variabel-
variabel tersebut dan akan berlanjut sampai sesuatu terjadi misalnya kenaikan
tingkat bunga, pajak atau kenaikan keduanya! yang membuat gerakan menjadi
agak lambat.
Maka dari itu di dalam regresi yang mencakup data time-series, data observasi
yang beurutan saling kait-mengkait<saling tergantung interdependent!.
$. (erjadi bias dalam spesi1ikasi.
6eberapa variabel penting tidak tercakup, ini dikatakan bias dalam spesi1ikasi.
4eringkali terjadi memasukkan variabel yang dimaksud dapat menghilangkan <
menyingkirkan pola korelasi yang terjadi pada residual.
Fontoh: kita mempunyai model sbb:
Yt " 61 ; 6$+$t ; 6%+%t ; 6*+*t ; Kt
Yt " jumlah permintaan daging domba.
+$ " harga daging domba.
+% " pendapatan masyarakat
+* " harga daging sapi.
t " 0aktu
:kan tetapi karena sesuatu hal, regresi yang dipergunakan sbb:
Yt " 61 ; 6$+$t ; 6%+%t ; &t
8alau Yt " 61 ; 6$+$t ; 6%+%t ; 6*+*t ; Kt dianggap model yang benar,
menggunakan model Yt " 61 ; 6$+$t ; 6%+%t ; &t jelas membuat kesalahan
pengganggu &i " 6*+*t ; Kt. 8alau harga daging sapi mempengaruhi tingkat
konsumsi daging domba, kesalahan pengganggu &i akan menunjukkan suatu pola
yang sistematis , jadi akan menimbulkan otokorelasi.
%. (erjadi bias dalam spesi1ikasi bentuk 1ungsi yang dipergunakan.
Misalkan model yang benar untuk studi biaya dan output adalah sbb:
6iaya marjinal!i " 61 ; 6$ 2utput ; 6% 2utput!
$
i ; Ki, curvanya nonlinear
akan tetapi model yang dipergunakan
6iaya marjinal!i " :1 ; :$ 2utput!i ; &i, curvanya linear.
Tambar di atas menunjukkan antara titik : dan 6, bah0a kurva biaya marjanal linear
secara konsisten akan Vunder estimateW biaya marjinal sebenarnya
*. 9henomena sarang laba-laba Fob0eb phenomena!
,. 6eda 8ala (ime lag!
-. :danya manipulasi data
8onsekuensi dari 2tokorelasi.
>ika semua asumsi tentang model regresi linear klasik terpenuhi, teori Tauss Markov
mengatakan bah0a dalam kelas seluruh seluruh pemerkira tak bias linear linear
unbiased estimators!, pemerkita 234 adalah terbaik the best!, yaitu mempunyai varian
yang minimum, dengan kata lain e1isien.
>uka semua asumsi terpenuhi, kecuali VnonautokorrelationW saja yang tidak terpenuhi,
maka pemerkira 234 akan mempunyai si1at-si1at sbb:
1. Masih tetap tidak bias, dalam sampling yang terulang dengan syarat variabel
bebas + tetap, rata-rata atau nilai harapan dari pemerkira akan sama nilai
sebenarnya parameter!, dengan kata lain
i i i
a
semua untuk , !
a
E = .
$. Masih tetap konsisten, artinya kalu sampel makin besar n menuju tak terhingga!,
pemerkira akan mendekati parameter n ? @,
i i

a

%. 4ebagaimana heteroskedastisitas, dalam hal terjadi otokorelasi, pemerkira tak lagi
e1isien varian tak lagi minimum! baik dalam sampel kecil maupun besar, artinya
tidak e1isien 0alaupun secara asimtotis.
""""""""""""""""
2tokorelasi atau korelasi serial adalah suatu keadaan dimana kesalahan pengganggu
dalam periode tertentu, misalnya Kt berkorelasi dengan kesalahan penganggu dari periode
lainnya misalnya Ks, jadi kesalahan pengganggu tidak bebas, satu sama lainnya
berkorelasi, saling berhubungan. :pabila kesalahan pengganggu dari suatu periode
misalnya 0aktu t! berkorelasi dengan kesalahan pengganggu dalam periode sebelumnya
misalnya 0aktu t-1!, maka keadaan ini disebut otokorelasi tingkat pertama 1irst-order
autocorrelation!.
2tokorelasi bisa positi1, bisa juga negati1, akan tetapi kebanyakan data ekonomi time
series menunjukkan otokorelasi yang positi1. 2tokorelasi tingkat pertama terjadi kalau Kt
Kt-1! ^ #, jadi melanggar salah satu asumsi dalam 234, menurut asumsi nilainya nol. Cal
ini sering muncul dalam analisa data time series.
/engan otokorelasi, perkiraan parameter, 234 masih unbiased dan consistent, akan tetapi
standard error dari perkiraan parameter regresi bias, menyebabkan pengujian hipotesa
tidak tepat, interval keyakinan bias biased con1idence intervals!.
8alau otokorelasi positi1, standard error dari perkiraan parameter regresi Vbiased up0ardW
Fara menguji adanya otokorelasi tingkat pertama yang positip dan negatip.
:danya otokorelasi dapat diuji dengan jalan menghitung Vthe /urbin Matson 4tatistics,
dW dengan rumus sbb:

=
=
=
n
1 t
$
t
n
$ t
$
1 - t t
! e
! e - e
d
Nilai d berkisar antara # X *, tidak ada otokorelasi kalau nilai d sekitar $. Nilai d yang
menunjukkan adanya atau tidak adanya otokorelasi tingkat pertama baik positi1 maupun
negati1 dan juga untuk test yang VinconclusiveW, terlihat dalam ganbar berikut ini.
2tokorelasi (ak ada otokorelasi otokorelasi
Z b b c b b Z
0 positi !" !# $%!# $%!" negati #
VinconclusiveW VinconclusiveW
:pabila Vllagged dependent variableW muncul sebagai variabel bebas dalam regresi, d
akan Vbiased to0ard $W dan kemampuannya untuk mendeteksi adanya otokorelasi
terhalang.
"""""""

Anda mungkin juga menyukai