Anda di halaman 1dari 49

JURNAL MULTIKOLINEARITAS

A. Materi Pendahuluan
1. Pengertian dan Sifat Multikolinearitas
Salah satu asumsi dari Classical Liniear Regression Model (CLRM)
adalah tidak terjadi multikolinearitas diantara variabel-variabel independen
yang terlibat dalam model regresi, atau dengan kalimat lain dalam metode
Ordinary Least Squae (OLS) variabel independen tidak saling berkorelasi.
Karena, koefisien regresi dari variabel-variabel independen tidak dapat
ditentukan, dan standar errornya sangat besar bahkan mencapai tidak
terhingga. Istilah multikolinearitas diperkenalkan pada tahun 1934 oleh
Ragnar Frisch., dan didefinisikan bahwa multikolinearitas adalah keberadaan
hubungan linear yang sempurna atau tepat, di antara sebagian atau seluruh
variabel independen dalam sebuah model regresi.
Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang
digunakan saling terkait dalam suatu model regresi. Oleh karena itu masalah
multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya
melibatkan satu variabel independen, dan karena multikolinearitas yaitu
terdapat hubungan linear antara variabel independennya, maka
multikolinearitas tidak terjadi pada hubungan non linear.
Untuk regresi variabel k yang melibatkan variabel independen
𝑋1 , 𝑋2 , … , 𝑋𝑘 (dimana 𝑋1 = 1 untuk semua observasi mengikutkan faktor
intercept), dikatakan multikolinearitas sempurna jika:
𝜆1 𝑋1 + 𝜆2 𝑋2 + ⋯ + 𝜆𝑘 𝑋𝑘 = 0
Di mana 𝜆1 , 𝜆2 , … , 𝜆𝑘 adalah konstanta yang tidak semuanya bernilai nol
secara bersamaan.
Sebaliknya, dikatakan multikolinearitas tidak sempurna jika:
𝜆1 𝑋1 + 𝜆2 𝑋2 + ⋯ + 𝜆𝑘 𝑋𝑘 + 𝑣𝑖 = 0
Di mana 𝑣𝑖 adalah faktor kesalahan stokastik.
2. Estimasi pada Keberadaan Multikolinearitas
a. Multikolinearitas sempurna
Dalam kasus multikolinearitas sempurna, koefisien regresi tidak dapat
ditentukan dan standard errornya tidak terhingga. Pernyataan ini dapat
ditunjukkan dalam model regresi linear tiga variabel sebagai berikut:
𝑌𝑖 = 𝛽̂2 𝑋2𝑖 + 𝛽̂3 𝑋3𝑖 + 𝑢̂𝑖
Pada materi sebelumnya kita ketahui bahwa:
(∑ 𝑌𝑖 𝑋2𝑖 )(∑ 𝑋3𝑖 2 ) − (∑ 𝑌𝑖 𝑋3𝑖 )(∑ 𝑋2𝑖 𝑋3𝑖 )
𝛽̂2 =
(∑ 𝑋2𝑖 2 )(∑ 𝑋3𝑖 2 ) − (∑ 𝑋2𝑖 𝑋3𝑖 )2
(∑ 𝑌𝑖 𝑋3𝑖 )(∑ 𝑋2𝑖 2 ) − (∑ 𝑌𝑖 𝑋2𝑖 )(∑ 𝑋2𝑖 𝑋3𝑖 )
𝛽̂3 =
(∑ 𝑋2𝑖 2 )(∑ 𝑋3𝑖 2 ) − (∑ 𝑋2𝑖 𝑋3𝑖 )2
Asumsikan bahwa 𝑋3𝑖 = 𝜆𝑋2𝑖 , dimana 𝜆 adalah konstanta yang tidak
bernilai nol. Selanjutnya substitusikan ke persamaan yang pertama sehingga
kita peroleh:
0
𝛽̂2 =
0
sehingga 𝛽̂2 tidak dapat ditentukan.
b. Multikolinearitas “tinggi” tapi tidak sempurna
Perhatikan kembali model regresi linear tiga variabel berikut:
𝑌𝑖 = 𝛽̂2 𝑋2𝑖 + 𝛽̂3 𝑋3𝑖 + 𝑢̂𝑖
Pada materi sebelumnya kita ketahui bahwa:
(∑ 𝑌𝑖 𝑋2𝑖 )(∑ 𝑋3𝑖 2 ) − (∑ 𝑌𝑖 𝑋3𝑖 )(∑ 𝑋2𝑖 𝑋3𝑖 )
𝛽̂2 =
(∑ 𝑋2𝑖 2 )(∑ 𝑋3𝑖 2 ) − (∑ 𝑋2𝑖 𝑋3𝑖 )2
Asumsikan bahwa 𝑋3𝑖 = 𝜆𝑋2𝑖 + 𝑣𝑖 , dimana 𝜆 adalah konstanta yang
tidak bernilai nol dan 𝑣𝑖 adalah faktor kesalahan stokastik. Selanjutnya
substitusikan ke persamaan di atas sehingga kita peroleh:
(∑ 𝑌𝑖 𝑋2𝑖 )(𝜆2 ∑ 𝑋2𝑖 2 + ∑ 𝑣𝑖 2 ) − (𝜆 ∑ 𝑌𝑖 𝑋2𝑖 + ∑ 𝑌𝑖 𝑣𝑖 )(𝜆 ∑ 𝑋2𝑖 2 )
𝛽̂2 = 2
(∑ 𝑋2𝑖 2 )(𝜆2 ∑ 𝑋2𝑖 2 + ∑ 𝑣𝑖 2 ) − (𝜆 ∑ 𝑋2𝑖 2 )
Dalam kasus ini, 𝛽̂2 dapat diestimasi, tetapi jika 𝑣𝑖 cukup kecil,
katakanlah mendekati nol, maka akan menjadi multikolinearitas yang
sempurna sehingga koefisiennya tidak dapat ditentukan.
3. Sebab terjadinya multikolinearitas
Terdapat beberapa sumber dari multikolinearitas, sebagaimana yang
dikemukakan oleh Montgomery dan Peck. Multikolinearitas disebabkan oleh
beberapa faktor:
a. Metode pengumpulan data yang digunakan. Sebagai contoh,
mengambil sampel dari jangkauan nilai yang terbatas dan diambil
dari regresor-regresr di populasi.
b. Batasan yang ada pada model atau populasi yang diambil
sampelnya. Sebagai contoh, dalam regresi konsumsi listrik terhadap
pendapatan (X2) dan ukuran rumah (X3), terdapat batasan fisik
populasi pada keluarga tersebut, dimana keluarga dengan pendapatan
yang lebih tinggi biasanya memiliki rumah yang lebih besar
dibandingkan keluarga dengan pendapatan yang lebih rendah.
c. Spesifikasi model. Sebagai contoh, menambahkan istilah polynomial
pada model regresi, khususnya ketika jangkauan variable X kecil.
d. Model yang “overdetermined”. Hal ini terjadi ketika model memiliki
banyak variable penjelas daripada jumlah observasi. Terjadi dalam
penelitian medis, dimana mungkin saja hanya terdapat sedikit jumlah
pasien yang informasinya dikumpulkan pada variable dengan jumlah
yang lebih banyak.
Faktor lain yang memungkinkan adalah khususnya pada data time series
adalah terdapat kemungkinan regresor-regresor yang diikutsertakan dalam
model memiliki trend yang serupa, yaitu mereka sama-sama meningkat atau
menurun seiring berjalannya waktu. Jadi, dalam regresi pengeluaran konsumsi
terhadap pendapatan, kekayaan/kesejahteraan, dan populasi, regresor
pendapatan, kekayaan, dan pupolasi dapat tumbuh bersama dari waktu ke
waktu pada laju yang kurang lebih sama, sehingga menyebabkan kolinearitas
diantara variable tersebut.
4. Konsekuensi Praktis dari Multikolinearitas
Dalam kasus multikolinearitas mungkin akan menemukan konsekuesi-
konsekuensi berikut:
a. Walaupun BLUE (Best Linear Unbiased Estimator), estimator
OLS memiliki varians dan kovarians yang besar, membuat
estimasi yang akurat menjadi sulit.
Untuk melihat varians dan kovarians yang besar ingat kembali rumus
varian dan kovarians 𝛽̂2 dan 𝛽̂3 dari model regresi linear tiga variabel 𝑌𝑖 =
𝛽̂2 𝑋2𝑖 + 𝛽̂3 𝑋3𝑖 + 𝑢̂𝑖 yaitu:
𝜎2
𝑣𝑎𝑟(𝛽̂2 ) =
∑ 𝑋2𝑖 2 (1 − 𝑟23 2 )
𝜎2
𝑣𝑎𝑟(𝛽̂3 ) =
∑ 𝑋3𝑖 2 (1 − 𝑟23 2 )
−𝑟23 𝜎 2
𝑐𝑜𝑣(𝛽̂2 , 𝛽̂3 ) =
(1 − 𝑟23 2 )√∑ 𝑋2𝑖 2 𝑋3𝑖 2

Dimana 𝑟23 adalah koefisien korelasi antara X2 dan X3.


Dari persamaan di atas, terlihat bahwa seiring dengan 𝑟23 menuju 1, yakni
kolinearitas meningkat, varians dari kedua estimator meningkat dan kovarians
dari kedua estimator juga meningkat pada nilai absolutnya. Bahkan pada suatu
nilai batas ketika nilai 𝑟23 = 1, varians dari kedua estimator dan kovarians
dari kedua estimator menjadi tidak terhingga.
Kecepatan dari meningkatnya varians dan kovarians dapat dilihat dengan
Variance Inflating Factor (VIF) yang di definisikan sebagai:
1
𝑉𝐼𝐹 =
(1 − 𝑟23 2 )
VIF menunjukkan bagaimana varians dari sebuah estimator ditingkatkan
oleh keberadaan multikolinearitas. Seiring dengan 𝑟23 2 mendekati 1, VIF
mendekati tidak terhingga.
b. Dikarenakan konsekuensi 1, interval kepercayaan cenderung
sangat lebar, menimbulkan penerimaan dari “hipotesis nol” lebih
awal
Oleh karena standard errornya yang besar, interval kepercayaan untuk
parameter populasi yang relevan juga cenderung besar. Oleh karena itu, pada
kasus high multikolinearity, data sampel mungkin sesuai dengan kumpulan
hipotesis-hipotesis yang berbeda. Dengan demikian, probabilitas untuk
menerina hipotesis yang salah meningkat.
c. Juga dikarenakan konsekuensi 1, rasio t dari satu atau lebih
koefisien akan cenderung tidak signifikan secara statistik.
Pada kasus kolinearitas yang tinggi, standard error yang diestimasi
meningkat secara dramastis, oleh karenanya membuat nilai t menjadi lebih
kecil. Sehingga, pada kasus yang demikian, kita sangat dimungkinkan untuk
menerima hipotesis nol yang menyatakan bahwa nilai populasi yang
sebenarnya adalah nol.
d. Walaupun rasio t dari satu atau lebih koefisien secara statistic
tidak signifikan, 𝑹𝟐 , ukuran goodness of fit suatu model secara
keseluruhan bisa saja sangat tinggi.
Perhatikan model regresi linear variabel k:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖
Pada pembahasan sebelumnya, ketika pada kasus kolinearitas yang tinggi,
kita mungkin menemukan bahwa satu atau lebih koefisien kemiringan parsial
secara statistik tidak signifikan berdasarkan uji t. Namun demikian, nilai R2
pada situasi seperti ini akan sangat tinggi, sehingga berdasarkan uji F,
seseorang secara meyakinkan dapat menolak hipotesis yang menyatakan
bahwa 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑘 = 0. Jelasnya hal ini merupakan salah satu
pertanda multikolinearitas yakni nilai-nilai t yang tidak signifian, tetapi secara
keseluruhan memiliki nilai R2 yang tinggi (dan nilai F yang signifikan).
e. Estimator OLS dan standard error-nya dapat bersifat sensitive
terhadap perubahan yang kecil pada data.
5. Cara Mendeteksi Multikolinearitas
a. Nilai R2 Tinggi Tetapi Hanya Sedikit Variabel Independen yang
Signifikan

Salah satu ciri adanya gejala multikolinearitas adalah model memiliki


koefisien determinasi (R2) yang tinggi katakanlah di atas 0,8 tetapi hanya
sedikit variabel independen yang signifikan mempengaruhi variabel dependen
melalui uji t. Namun, berdasarkan uji F secara statistik signifikan yang berarti
semua variabel independen secara bersama-sama mempengaruhi variabel
dependen. Dalam hal ini terjadi suatu kontradiktif dimana berdasarkan uji t
secara individual variabel independen tidak berpengaruh terhadap variabel
dependen, namun secara bersama-sama variabel independen mempengaruhi
variabel dependen.
b. Matriks Korelasi
Telah dijelaskan sebelumnya bahwa multikolinearitas adalah hubungan
linear antara variabel independen di dalam regresi. Dengan menggunakan
matriks korelasi maka hubungan linear antara variabel independen dapat
diketahui. Sebagai aturan main (rule of thumb), jika nilai koefisien korelasi (r)
> 0,80 maka kita dapat mengatakan bahwa dalam model terdapat masalah
multikolinearitas sebaliknya apabila nilai koefisien korelasi < 0,80 maka kita
dapat menduga bahwa dalam model tidak terdapat masalah multikolinearitas.
Namun deteksi dengan metode ini perlu kehati-hatian. Masalah ini timbul
terutama pada data time series dimana korelasi antar variabel independen
cukup tinggi karena kedua data biasanya mengandung unsur tren yang sama
yaitu data naik dan turun secara bersamaan.
c. Regresi Auxiliary
Regresi jenis ini dapat digunakan untuk mengetahui hubungan antara dua
atau lebih variabel independen yang secara bersama-sama (misalnya X2 dan
X3). Kita harus menjalankan beberapa regresi, masing-masing dengan
memberlakukan satu variabel independen (misalnya X1) sebagai variabel
dependen dan variabel independen lainnya tetap diperlakukan sebagai variabel
independen. Dengan membandingkan nilai Fhitung pada masing masing regresi
dengan Ftabel. Dengan ketentuan:
Jika nilai Fhitung > Ftabel pada ∝ dan derajat kebebasan tertentu, maka
model kita mengandung unsur multikolinearitas.
Jika nilai Fhitung < Ftabel pada ∝ dan derajat kebebasan tertentu, maka
model kita tidak mengandung unsur multikolinearitas.
d. Metode Klien
Pada dasarnya cara deteksi multikolinearitas dengan metode Klien hampir
sama dengan regresi auxiliary. Perbedaannya terletak pada pengambilan
keputusan dimana dalam metode regresi auxiliary untuk menentukan ada
tidaknya multikolinearitas maka tingkat signifikansi nilai F hitung yang
dijadikan acuan. Sedangkan dalam metode Klien, penentuan ada tidaknya
unsur multikolinearitas dilakukan dengan cara membandingkan nilai koefisien
determinasi asli dengan model regresi auxiliary. Menurut Klien,
multikolinearitas terjadi jika koefisien determinasi (R2) model regresi
auxiliary lebih besar dari koefisien determinasi (R2) model regresi asli.
6. Cara Mengatasi Multikolinearitas
a. Melihat Informasi Sejenis yang Ada
Misalkan kita memiliki model seperti berikut:
Konsumsi = 𝛼0 + 𝛼1 Pendapatan + 𝛼2 Kekayaan +𝜇
Misalnya ada teori atau hasil empiris yang mengatakan bahwa dampak
pendapatan terhadap konsumsi lebih besar dibandingkan dengan dampak
kekayaan terhadap konsumsi atau lebih spesifik lagi misalnya perubahan
konsumsi terhadap kekayaan 25% perubahan pendapatan ( 𝛼2 = 0,25 𝛼1).
Akibatnya dalam pemodelan dapat ditambahkan informasi tersebut sehingga
modelnya menjadi seperti berikut:
Konsumsi = 𝛼0 + 𝛼1 Pendapatan + 0,25 𝛼1 Kekayaan + 𝜇
Jika model pada persamaan di atas diestimasi maka akan diperoleh nilai
𝛼1 , yang kemudian menjadi landasan untuk mendapatkan nilai 𝛼2 .
b. Menghilangkan Salah Satu Variabel yang Berkorelasi
Menghilangkan salah satu variabel yang berkorelasi dapat menghilangkan
masalah multikolinearitas pada model. Akan tetapi, adakalanya pembuangan
salah satu variabel yang berkorelasi menimbulkan masalah baru yaitu bias
spesifikasi (specification bias) yaitu salah spesifikasi model karena variabel
yang dibuang merupakan variabel yang sangat penting.
c. Transformasi Variabel
Misalkan kita memiliki data time series mengenai pengeluaran konsumsi,
pendapatan, dan kekayaan. Alasan untuk menciptakan multikolinearitas yang
tinggi antara pendapatan dan kekayaan pada data ini adalah seiring
berjalannya waktu, keduanya cendenrung bergerak ke arah yang sama. Salah
satu jalan untuk meminimalisasi dependensi ini adalah dengan memprosesnya
sebagai berikut:
Jika hubungan:
𝑌𝑡 = 𝛽1 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝑢𝑡
berlaku pada waktu t sehingga harus juga berlaku pada waktu t-1, karena sifat
aslinya yang acak. Oleh karena itu, kita miliki:
𝑌𝑡−1 = 𝛽1 + 𝛽2 𝑋2,𝑡−1 + 𝛽3 𝑋3,𝑡−1 + 𝑢𝑡−1
Jika kita mengurangkan kedua persamaan di atas, maka akan diperoleh:
𝑌𝑡 − 𝑌𝑡−1 = 𝛽2 (𝑋2𝑡 − 𝑋2,𝑡−1 ) + 𝛽3 (𝑋3𝑡 − 𝑋3,𝑡−1 ) + 𝑣𝑡
dimana 𝑣𝑡 = 𝑢𝑡 − 𝑢𝑡−1 . Persamaan di atas dikenal dengan nama bentuk
diferensial pertama, karena kita melakukan regresi tidak terhadap variabel
aslinya, tetapi terhadap perbedaan dari nilai berurutan pada variabel.
Seringkali, model regresi diferensial mengurangi tingkat keparahan
multikolinearitas, karena walaupun pada level X2 dan X3 munkin sangat
berkolinear, tidak ada alasan yang diduga sebelumnya untuk mempercayai
bahwa bentuk diferensial mereka juga berkolinear dengan kuat.
d. Penambahan Data
Masalah multikolinearitas pada dasarnya merupakan persoalan sampel
sehingga masalah multikolinearitas seringkali dapat diatasi dengan menambah
jumlah data. Namun dalam prakteknya tidak mudah mendapatkan data
tambahan.
B. Soal dan Pembahasan
Contoh Pertama
Diketahui data Longley yang merupakan data time series untuk tahun
1947-1962 sebagai berikut:

OBSERVASI Y X1 X2 X3 X4 X5 TAHUN
1947 60323 830 234289 2356 1590 107608 1
1948 61122 885 259426 2325 1456 108632 2
1949 60171 882 258054 3682 1616 109773 3
1950 61187 895 284599 3351 1650 110929 4
1951 63221 962 328975 2099 3099 112075 5
1952 63639 981 346999 1932 3594 113270 6
1953 64989 990 365385 1870 3547 115094 7
1954 63761 1000 363112 3578 3350 116219 8
1955 66019 1012 397469 2904 3048 117388 9
1956 67857 1046 419180 2822 2857 118734 10
1957 68169 1084 442769 2936 2798 120445 11
1958 66513 1108 444546 4681 2637 121950 12
1959 68655 1126 482704 3813 2552 123366 13
1960 69564 1142 502601 3931 2514 125368 14
1961 69331 1157 518173 4806 2572 127852 15
1962 70551 1169 554894 4007 2827 130081 16

Keterangan: Y = jumlah pekerja; X1 = deflator harga implisit PDB; X2 =


PNB; X3 = jumlah pengangguran; X4 = jumlah orang dalam angkatan perang;
X5 = populasi non-institusional di atas 14 tahun; X6 = tahun. Apakah pada
regresi linear data di atas terjadi multikolinearitas? Jika iya, bagaimana cara
mengatasi masalah multikolinearitas pada kasus di atas?
Penyelesaian
Akan digunakan aplikasi EViews7 untuk menjawab pertanyaan di atas.
Adapun langkah-langkahnya adalah sebagai berikut:
1) Masukkan data di atas ke Microsoft excel. Selanjutnya copy data dari
variabel Y sampai X6, kemudian salin di dalam sheet yang berbeda
(misal sheet 2). Dan simpanlah file tersebut dalam suatu folder.
2) Buka software EViews7, sehingga muncul gambar seperti di bawah
ini:

3) Lalu, klik file  new  workfile, seperti gambar di bawah ini:


4) Selanjutnya akan muncul kotak dialog seperti di bawah ini:

5) Lalu di WorkFile Creator, isilah tabel sesuai gambar di bawah ini, lalu
klik OK
6) Akan muncullah tampilan seperti di bawah ini:

7) Selanjutnya kita akan meng-import file excel yang sudah disimpan di


dalam folder pada langkah 1, dengan cara klik file  import  import
from file, dan pilihlah data di atas yang sebelumnya telah kita simpan.
Sehingga muncullah tampilan seperti di bawah ini:
8) Kemudian pada predefined range pilih sheet 2, lalu klik next, sehingga
muncul tampilan seperti di bawah ini:

9) Pada kotak dialog excel read- step 2 of 3, di kotak name, ganti nama
series01 sampai series07, dengan Y, X1, X2, X3, X4, X5, dan X6
secara berturut-turut, sehingga diperoleh tampilan seperti di bawah ini:
10) Lalu klik next, sehingga diperoleh tampilan seperti di bawah ini:

11) Pada kotak dialog excel read- step 2 of 3, isikan 1947 pada start date,
seperti pada gambar di bawah ini:
12) Lalu klik finish, sehingga diperoleh tampilan seperti di bawah ini:

13) Selanjutnya akan dicari hasil regresi dari data di atas. Dengan cara
klik quick  estimate equation, lalu akan muncul tampilan seperti di
bawah ini:
14) Pada kotak dialog equation estimation, bagian equation specification
isikan Y c X1 X2 X3 X4 X5 X6, seperti pada gambar di bawah ini:
15) Kemudian klik OK, sehingga akan muncul tampilan seperti di bawah
ini:

16) Dari tampilan di atas, dapat diduga bahwa terdapat masalah


multikolinearitas pada model regresi data yang dimiliki (penjelasan di
bahas kemudian).
17) Untuk memperkuat dugaan di atas, akan dilakukan uji korelasi
terhadap variabel-variabel independennya, yaitu dengan cara klik
quick  pilih group statistic  pilih correlations. Seperti pada
gambar di bawah ini:
18) Lalu, akan muncul tampilan seperti di bawah ini:

19) pada kotak dialog series list masukkan variabel-variabel


independennya yaitu dengan menuliskan X1, X2, X3, X4, X5, dan X6
lalu klik OK, sehingga akan muncul tampilan seperti di bawah ini:
20) Dari tampilan di atas, dapat diduga bahwa terdapat masalah
multikolinearitas pada model regresi data yang dimiliki (penjelasan di
bahas kemudian).
21) Untuk memperkuat dugaan di atas, akan dilakukan pengujian dengan
metode regresi auxiliary, yaitu dengan menjalankan beberapa regresi,
dengan masing-masing memberlakukan variabel X1, X2, X3, X4, X5,
dan X6 sebagai variabel dependen. Dengan melakukan langkah yang
serupa dengan langkah 13, diperoleh:
22) Dengan X1 sebagai variabel dependennya, diperoleh hasil regresi
sebagai berikut:
23) Dengan X2 sebagai variabel dependennya, diperoleh hasil regresi
sebagai berikut:

24) Dengan X3 sebagai variabel dependennya, diperoleh hasil regresi


sebagai berikut:
25) Dengan X4 sebagai variabel dependennya, diperoleh hasil regresi
sebagai berikut:

26) Dengan X5 sebagai variabel dependennya, diperoleh hasil regresi


sebagai berikut:
27) Dengan X6 sebagai variabel dependennya, diperoleh hasil regresi
sebagai berikut:

28) Dari beberapa tampilan regresi di atas, dapat diduga bahwa terdapat
masalah multikolinearitas pada model regresi data yang dimiliki
(penjelasan di bahas kemudian).
29) Setelah mengetahui terdapat masalah multikolinearitas pada model
regresi di atas, maka selanjutnya akan di coba untuk melakukan
perbaikan terhadap masalah multikolinearitas ini dengan mengubah
variabel X2 (PNB) menjadi bentuk riil yaitu dengan membaginya
dengan deflator harga implisit (X1), dan menghilangkan variabel X3
(jumlah pengangguran) dan X6 (tahun).
30) Masukkan data yang baru ke dalam excel, lalu simpan file tersebut.
31) Selanjutnya lakukan langkah yang serupa dengan langkah 2-7.
32) Kemudian pada predefined range pilih sheet 3, lalu klik next,
sehingga muncul tampilan seperti di bawah ini:

33) Pada kotak dialog excel read- step 2 of 3, di kotak name, ganti nama
series01 sampai series04, dengan Y, GNP, X4, dan X5 secara
berturut-turut, sehingga diperoleh tampilan seperti di bawah ini:

34) Lalu klik next, sehingga diperoleh tampilan seperti di bawah ini:
35) Pada kotak dialog excel read- step 2 of 3, isikan 1947 pada start date,
seperti pada gambar di bawah ini:

36) Lalu klik finish, sehingga diperoleh tampilan seperti di bawah ini:
37) Selanjutnya akan dicari hasil regresi dari data di atas. Dengan cara
klik quick  estimate equation.
38) Pada kotak dialog equation estimation, bagian equation specification
isikan Y c GNP X4 X5, seperti pada gambar di bawah ini:

39) Kemudian klik OK, sehingga akan muncul tampilan seperti di bawah
ini:
40) Dari tampilan di atas, masalah multikolinearitas sudah tidak ada lagi.
(penjelasan di bahas kemudian).
Pembahasan
 Poin 16

Dari tampilan no 15 diperoleh bahwa R2 adalah 0,9954, ini sangatlah


tinggi, tetapi bisa kita lihat juga bahwa hanya sedikit variabel yang secara
statistik signifikan yaitu X3 X4 dan X6. Berdasarkan dari cara cara
mendeteksi multikolinearitas maka dapat diduga bahwa terdapat
multikolinearitas pada model regresi data di atas.

 Poin 20

Dari tampilan no 16 diperoleh matriks korelasi antara variabel-variabel


independen. Dapat dilihat bahwa kebanyakan nilai koefisien korelasi antara
variabel-variabel independennya > 0,8 ini artinya terdapat multikolinearitas
pada model regresi data di atas.

 Poin 28

Dari tampilan no 22-27 diperoleh:

Fhitung (Fi) Dibanding Kesimpulan


Ftabel
269,065 > Ada korelasi antara X1 dengan (X2, X3, X4, X5 dan X6) secara
bersamaan
3575,027 > Ada korelasi antara X2 dengan (X1, X3, X4, X5 dan X6) secara
bersamaan
65,2377 > Ada korelasi antara X3 dengan (X1, X2, X4, X5 dan X6) secara
bersamaan
5,177 > Ada korelasi antara X4 dengan (X1, X2, X3, X5 dan X6) secara
bersamaan
796,3020 > Ada korelasi antara X5 dengan (X1, X2, X3, X4 dan X6) secara
bersamaan
1515,961 > Ada korelasi antara X6 dengan (X1, X2, X3, X4 dan X5) secara
bersamaan
Diketahui nilai Ftabel dengan ∝=5% dan derajat kebebasan 2,26 adalah 3,37

Ini berarti terdapat multikolinearitas pada model regresi data di atas.

Variabel dependen Nilai R2 Toleransi (TOL) = 1-R2


X1 0,9926 0,0074
X2 0,9994 0,0006
X3 0,9702 0,0298
X4 0,7213 0,2787
X5 0,9970 0,0030
X6 0,9986 0,0014
Pada tabel di atas terlihat bahwa nilai R2 dari regresi auxiliary lebih dari
nilai R2 keseluruhan ( yang diperoleh dari regresi Y terhadap semua variabel
X). ini artinya terdapat multikolinearitas pada model regresi data di atas.
Jadi dapat disimpulkan bahwa pada model regresi sebagai berikut:
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4 + 𝛽5 𝑋5 + 𝛽6 𝑋6
terdapat multikolinearitas.
Ini artinya kita harus memperbaiki model regresi di atas dengan cara-cara
yang telah dijelaskan di awal. Pada kasus ini kita akan memperbaiki model
regresi di atas dengan cara mengubah variabel X2 (PNB) menjadi bentuk riil
yaitu dengan membaginya dengan deflator harga implisit (X1), dan
menghilangkan variabel X3 (jumlah pengangguran) dan X6 (tahun). Sehingga
modelnya menjadi sebagai berikut:
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3
𝑋2
Dimana 𝑋1 = , 𝑋2 = 𝑋4 , dan 𝑋3 = 𝑋5
𝑋1

 Poin 40
Pada tampilaan nomor 39, dapat dilihat bahwa tidak terdapat
multikolinearitaas pada model regresi yang telah diperbaiki. Karena nilai R2
tidak terlalu besar dengan yang sebelumnya dan variabel independennya
signifikan.

Contoh Kedua
Model Pertumbuhan Ekonomi Indonesia pada Periode 1980-2008. Adapun
modelnya adalah :
lnGDP = 𝛽 0 + 𝛽 1lnFDI + 𝛽 2lnL + 𝛽 3lnPMDN
dimana :
lnGDP = pertumbuhan ekonomi (di-proxy dari nilai ln PDB real tahun
2000)
lnFDI = investasi asing langsung (dibuat ln dari data realisasi investasi
asing langsung Indonesia)
lnL = jumlah tenaga kerja (dibuat ln)
lnPMDN = penanaman modal dalam negeri ( dibuat ln dari nilai
realisasi PMDN)
Berikut adalah datanya:
Tahun LnGDP LnFDI LnL LnPMDN
1980 13.26 5.85 3.94 9.16
1981 13.34 5.94 4 9.36
1982 13.36 6.13 4.06 9.51
1983 13.37 6.25 4.08 10.01
1984 13.44 5.82 4.11 10.06
1985 13.46 6.39 4.13 10.21
1986 13.52 6.19 4.22 10.28
1987 13.57 6.58 4.25 10.58
1988 13.62 6.36 4.28 10.67
1989 13.7 6.53 4.3 10.98
1990 13.76 6.56 4.33 11.08
1991 13.83 6.97 4.34 11.29
1992 13.89 7.57 4.36 11.42
1993 13.96 8.64 4.37 11.48
1994 14.03 8.24 4.41 11.68
1995 14.11 8.81 4.43 11.89
1996 14.18 8.44 4.45 12
1997 14.23 8.15 4.47 12.2
1998 14.09 8.49 4.47 11.98
1999 14.11 9.02 4.49 11.74
2000 14.14 9.2 4.5 12.64
2001 14.18 8.16 4.51 12.82
2002 14.23 8.03 4.52 12.87
2003 14.27 8.6 4.52 13.15
2004 14.32 8.43 4.54 13.22
2005 14.38 9.1 4.55 13.45
2006 14.43 8.7 4.56 13.65
2007 14.49 9.24 4.6 13.8
2008 14.55 9.61 4.63 14.14
Sumber : BPS dan Bank Indonesia (data diolah)
Apakah pada regresi linear data di atas terjadi multikolinearitas? Jika iya,
bagaimana cara mengatasi masalah multikolinearitas pada kasus di atas?

Akan digunakan aplikasi EViews7 untuk menjawab pertanyaan di atas.


Adapun langkah-langkahnya adalah sebagai berikut:
1) Masukkan data di atas ke Microsoft excel. Selanjutnya copy data dari
variabel LnGDP, LnFDI, LnL, dan LnPMDN, kemudian salin di
dalam sheet yang berbeda (misal sheet 2). Dan simpanlah file tersebut
dalam suatu folder.
2) Buka software EViews7, sehingga muncul gambar seperti di bawah
ini:

3) Lalu, klik file  new  workfile, seperti gambar di bawah ini:


4) Selanjutnya akan muncul kotak dialog seperti, lalu di WorkFile
Creator, isilah tabel sesuai gambar di bawah ini, lalu klik OK

5) Selanjutnya kita akan meng-import file excel yang sudah disimpan di


dalam folder pada langkah 1, dengan cara klik file  import  import
from file, dan pilihlah data di atas yang sebelumnya telah kita simpan.
Sehingga muncullah tampilan seperti di bawah ini:
6) Kemudian pada predefined range pilih sheet 2, lalu klik next, pada
kotak dialog excel read- step 2 of 3, di kotak name, ganti nama
series01 sampai series04, dengan LnGDP, LnFDI, LnL, dan LnPMDN
secara berturut-turut, sehingga diperoleh tampilan seperti di bawah ini:

7) Lalu klik next, dan pada kotak dialog excel read- step 2 of 3, isikan
1980 pada start date, seperti pada gambar di bawah ini:sehingga
diperoleh tampilan seperti di bawah ini:
8) Lalu klik finish, sehingga diperoleh tampilan seperti di bawah ini:

9) Selanjutnya akan dicari hasil regresi dari data di atas. Dengan cara
klik quick  estimate equation, pada kotak dialog equation
estimation, bagian equation specification isikan LnGDP c LnFDI LnL
LnPMDN, seperti pada gambar di bawah ini:

10) Kemudian klik OK, sehingga akan muncul tampilan seperti di bawah
ini:
11) Dari tampilan di atas, belum dapat diduga bahwa terdapat masalah
multikolinearitas pada model regresi data yang dimiliki (penjelasan di
bahas kemudian).
12) Untuk mendeteksi adanya multikolinearitas, lanjut kepada cara yang
lain yakni akan dilakukan uji korelasi terhadap variabel-variabel
independennya, yaitu dengan cara klik quick  pilih group statistic 
pilih correlations. Seperti pada gambar di bawah ini:
13) Pada kotak dialog series list masukkan variabel-variabel
independennya yaitu dengan menuliskan LnFDI LnL dan LnPMDN
lalu klik OK, sehingga akan muncul tampilan seperti di bawah ini:
14) Dari tampilan di atas, dapat diduga bahwa terdapat masalah
multikolinearitas pada model regresi data yang dimiliki (penjelasan di
bahas kemudian).
15) Untuk memperkuat dugaan di atas, akan dilakukan pengujian dengan
metode regresi auxiliary, yaitu dengan menjalankan beberapa regresi,
dengan masing-masing memberlakukan variabel LnFDI LnL dan
LnPMDN sebagai variabel dependen. Dengan melakukan langkah
yang serupa dengan langkah 9, diperoleh:
16) Dengan LnFDI sebagai variabel dependennya, diperoleh hasil regresi
sebagai berikut:
17) Dengan LnL sebagai variabel dependennya, diperoleh hasil regresi
sebagai berikut:
18) Dengan LnPMDN sebagai variabel dependennya, diperoleh hasil
regresi sebagai berikut:
19) Dari beberapa tampilan regresi di atas, dapat diduga bahwa terdapat
masalah multikolinearitas pada model regresi data yang dimiliki
(penjelasan di bahas kemudian).
20) Setelah mengetahui terdapat masalah multikolinearitas pada model
regresi di atas, maka selanjutnya akan di coba untuk melakukan
perbaikan terhadap masalah multikolinearitas ini dengan mengubah
menghilangkan variabel LnL.
21) Selanjutnya lakukan langkah yang serupa dengan langkah 2-5.
22) Kemudian pada predefined range pilih sheet 3, lalu klik next,
sehingga muncul tampilan seperti di bawah ini:
23) Pada kotak dialog excel read- step 2 of 3, di kotak name, ganti nama
series01 sampai series03, dengan LnGDP, LnFDI, dan LnPMDN
secara berturut-turut, sehingga diperoleh tampilan seperti di bawah ini:

24) Lalu klik next, pada kotak dialog excel read- step 2 of 3, isikan 1980
pada start date, seperti pada gambar di bawah ini:
25) Lalu klik finish, sehingga diperoleh tampilan seperti di bawah ini:

26) Selanjutnya akan dicari hasil regresi dari data di atas. Dengan cara
klik quick  estimate equation.
27) Pada kotak dialog equation estimation, bagian equation specification
isikan LnGDP c LnFDI LnPMDN, seperti pada gambar di bawah ini:
28) Kemudian klik OK, sehingga akan muncul tampilan seperti di bawah
ini:
29) Dari tampilan di atas, masalah multikolinearitas sudah tidak ada lagi.
(penjelasan di bahas kemudian).
30) Untuk menambah keyakinan kita bahwa sudah tidak ada masalah
multikolinearitas pada model di atas, maka akan dilakukan langkah
yang serupa dengan poin 15, yaitu:
31) Ketika LnFDI sebagai variabel dependennya, diperoleh hasil regresi
sebagai berikut:
32) Ketika LnPMDN sebagai variabel dependennya, diperoleh hasil
regresi sebagai berikut:
33) Terlihat bahwa tidak ada masalah multikolinearitas pada model
regresi yang telah di perbaharui (penjelasan di bahas kemudian).
Pembahasan
 Poin 11
Dari tampilan no 10 diperoleh bahwa R2 adalah 0,9847, ini sangatlah
tinggi, dan semua variabel independen yang secara statistik signifikan, dalam
hal ini belum bisa menentukan apakah terdapat multikolinearitas atau tidak
pada model regresi di atas.
 Poin 14
Dari tampilan no 13 diperoleh matriks korelasi antara variabel-variabel
independen. Dapat dilihat bahwa kebanyakan nilai koefisien korelasi antara
variabel-variabel independennya > 0,8 ini artinya terdapat multikolinearitas
pada model regresi data di atas.
 Poin 19
Dari tampilan no 16-18 diperoleh:
Fhitung (Fi) Dibanding Kesimpulan
Ftabel
67,0377 > Ada korelasi antara LnFDI dengan (LnL dan LnPMDN) secara
bersamaan
213,659 > Ada korelasi antara LnL dengan (LnFDI dan LnPMDN ) secara
bersamaan
185,146 > Ada korelasi antara LnPMDN dengan (LnL dan LnFDI) secara
bersamaan
Diketahui nilai Ftabel dengan ∝=5% dan derajat kebebasan 2,26 adalah 3,37
Jadi dapat disimpulkan bahwa pada model regresi sebagai berikut:
𝑌 = 𝛽0 + 𝛽1 𝐿𝑛𝐹𝐷𝐼 + 𝛽2 𝐿𝑛𝐿 + 𝛽3 𝐿𝑛𝑃𝑀𝐷𝑁
terdapat multikolinearitas.
Ini artinya kita harus memperbaiki model regresi di atas dengan cara-cara
yang telah dijelaskan di awal. Pada kasus ini kita akan memperbaiki model
regresi di atas dengan dengan mengubah menghilangkan variabel LnL.
Sehingga modelnya menjadi sebagai berikut:
𝑌 = 𝛽0 + 𝛽1 𝐿𝑛𝐹𝐷𝐼 + 𝛽2 𝐿𝑛𝐿 + 𝛽3 𝐿𝑛𝑃𝑀𝐷𝑁
 Poin 29
Pada tampilan nomor 28, dapat dilihat bahwa tidak terdapat
multikolinearitaas pada model regresi yang telah diperbaiki. Karena nilai R2
tidak terlalu besar dengan yang sebelumnya dan variabel independennya
signifikan.
 Poin 33
Pada tampilaan nomor 31 dan 32 diperoleh
Variabel dependen Nilai R2 Toleransi (TOL) = 1-R2
LnFDI 0,8086 0,1914
LnPMDN 0,8086 0,1914
Diketahui sebelumnya bahwa R2 keseluruhan adalah 0,9802. Ini berarti
tidak terdapat masalah kolinearitas pada model di atas ( karena nilai R2
pada regresi auxiliary < nilai R2 model regresi asli.

Anda mungkin juga menyukai