Anda di halaman 1dari 12

Ringkasan Materi Lanjutan Ekonometrika

MULTIKOLINERITAS
Pengertian multikolinieritas Istilah multikolinieritas pertama digunakan oleh Ragner Frish di dalam bukunya: Statistical confluence analysis by means of Complete Regression Systems. Aslinya istilah itu berarti adanya hubungan linear yang sempurna atau eksak (perfect or exact) di antara variabel-variabel bebas dalam model regresi. Istilah kolinearitas (collinearity) sendiri berarti hubungan linear tunggal (single linear relationship), sedangkan kolinearitas ganda (multikolinieritas) menunjukkan adanya lebih dari satu hubungan linear yang sempurna. Dalam praktik sering tidak dibedakan baik satu hubungan atau lebih dipergunakan istilah kolinearitas ganda. Mengapa di dalam regresi linear haras dianggap bahwa tidak ada kolinearitas di antara variabel bebas? Apabila kolinearitas sempurna terjadi, maka koefisien regresi variabel X tidak dapat ditentukan (indeterminate) dan standard error-nya tak terhingga (infinite). Kalau kolinearitas kurang sempurna (less perfect) terjadi, walaupun bisa ditentukan (determinate), penduga mempunyai standard error yang tinggi (dalam hubungannya dengan koefisien-koefisien itu sendiri), yang berarti koefisien regresi tidak dapat diperkirakan dengan tingkat ketelitian yang tinggi (jadi perkiraan yang diperoleh menjadi kurang teliti). Pengertian multikolinieritas sempurna (perfect multicollinearity) dan pengaruhnya Dua atau lebih variabel bebas disebut perfectly collinear bila satu atau lebih variabel bebas dapat dinyatakan sebagai kombinasi linear dari variabel lainnya. Sebagai contoh, misalnya terjadi perfect multicollinearity antara X2 dan X3, kalau X2 = 3X3 atau X2 = 2 - 0,5X3. Apabila dua atau lebih variabel bebas mempunyai korelasi yang sempurna (koefisien korelasinya sebesar 1), adalah tidak mungkin untuk menghitung "penduga OLS" dari parameter, sebab sistem persamaan normal akan memuat dua atau lebih persamaan yang tidak bebas. Pengertian multikolinieritas yang tinggi tetapi tidak sempurna (high but not perfect multicolinearity) dan pengaruhnya. "High" but "not perfect multicollinearity" dimaksudkan kalau dua atau lebih
Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika

variabel bebas dalam model regresi berkorelasi tinggi (koefisien korelasi mendekati 1, tetapi tidak mencapai satu, katakan sebesar 0,999). Hal ini menyebabkan suatu kesukaran untuk memisahkan pengaruh dari masing-masing variabel bebas X terhadap variabel tak bebas Y, tetapi penduga OLS dari koefisien-koefisien masih unbiased. Apabila terjadi kolinearitas, tetapi tidak sempurna, maka akan timbul konsekuensi sebagai berikut. 1. Meskipun pemerkira OLS dapat diperoleh, standard error-nya akan cenderung membesar nilainya sewaktu tingkat kolinieritas antara variabel bebas juga meningkat. 2. Oleh karena nilai standard error dari koeisien regresi besar, maka dari itu dengan sendirinya interval keyakinan untuk parameter dari populasi juga cenderung melebar. 3. Dengan tingginya tingkat kolinearitas, probabilita untuk menerima hipotesis, padahal hipotesis itu salah (galat jenis II), menjadi membesar nilainya. 4. Selama multikolinieritas tidak sempurna, masih mungkin untuk menghitung perkiraan koefisien regresi, tetapi standard error-nya menjadi sangat sensitif. 5. Apabila multikolinieritas tinggi, seseorang akan memperoleh nilai R2 (= koefisien determinasi berganda) yang tinggi, akan tetapi tidak ada atau sedikit sekali koefisien regresi yang signifikan secara statistik. Kalau koefisien regresi suatu variabel bebas signifikan, maka variabel bebas yang bersangkutan mempunyai pengaruh terhadap Y. Mendekteksi multikolineritas Multicollinearity terjadi kalau dalam suatu model regresi tak satupun variabel bebas mempunyai koefisien regresi hasil dari OLS (Ordinary Least Square) yang signifikan secara statistik (bahkan beberapa di antaranya mungkin mempunyai tanda yang salah), walaupun nilai koefisien determinasi ganda R2 tinggi (katakan antara 0,7 sampai 1). Mendeteksi multicollinearity tidak mudah. Koefisien korelasi baik sederhana maupun parsial, yang tinggi di antara variabel bebas kadang-kadang dipergunakan sebagai suatu ukuran adanya multicollinearity. Akan tetapi, harus kita sadari bahwa, multikolinieritas yang serius bisa terjadi walaupun koefisien korelasi sederhana atau parsial nilainya relatif rendah, misalkan nilainya kurang dari 0,5.
Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika

Mengurangi efek multikolineritas. 1. Menggunakan informasi sebelumnya (a priori information) 2. Menggabungkan data cross section dan berkala 3. Mengeluarkan satu variabel atau lebih 4. Transformasi variabel 5. Penambahan data baru Resume Multikolinieritas adalah persoalan regresi dimana dua atau lebih variabel bebas saling berkorelasi sangat kuat, sehingga sukar sekali memisahkan pengaruh masing-masing variabel bebas tersebut terhadap variabel tak bebas. Misalkan Y adalah variabel tak bebas dan X1 dan X2 adalah variabel bebas, tetapi X1 dan X2 berkorelasi sangat kuat. Dalam hal ini sukar untuk memisahkan pengaruh X1 dan X2 terhadap Y, maksudnya kita tidak tahu berapa besar pengaruh X1 dan berapa besar pengaruh X2 terhadap Y. Bila terjadi multikolinieritas, walaupun R2 nilainya tinggi, tetapi koefisien regresi parsial dari metode kuadrat terkecil mungkin tidak signifikan, bahkan tandanya pun mungkin salah, yang seharusnya positif mungkin menjadi negatif, ataupun sebaliknya. Studi Kasus 1 Berikut ini diberikan contoh kasus bagaimana mendekteksi dan mengatasi masalah multikolinieritas dengan menggunakan informasi sebelumnya (a priori information) dan membuang sebagian variabel bebas. Perhatikan data impor (Y), GNP (X1), dan IHK (X2) dari suatu negara sebagai berikut:
t 1 2 3 4 5 6 7 8 9 Y 28.4 32.0 37.7 40.6 47.7 52.9 58.5 64.0 75.9 X1 637.5 688.1 753.0 796.3 868.5 935.5 982.4 1063.4 1171.1 X2 92.9 94.5 97.2 100.0 104.2 109.8 116.3 121.3 125.3

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika


10 11 12 13 14 15 16 94.4 131.9 126.9 155.4 185.8 217.5 260.9 1306.6 1412.9 1528.8 1702.2 1899.5 2127.6 2368.5 133.1 147.7 161.2 170.5 181.5 195.4 217.4

Hasil analisis regresi dari tabel di atas dapat dilihat sebagai berikut:
SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 2.00 13.00 15.00 SS 76626.75 977.77 77604.52 Standard Error 33.12 0.06 0.76 Pvalue 0.01 0.18 0.35 MS 38313.37 75.21 F 509.40 Significance F 0.00 0.994 0.987 0.985 8.673 16.000

Coefficients Intercept X1 X2 -100.96 0.08 0.75

t Stat -3.05 1.42 0.98

Lower 95% -172.51 -0.04 -0.90

Upper 95% -29.40 0.20 2.39

Persamaan regresi dugaan dapat dituliskan sebagai

Yi 0 1 X 1i 2 X 2i i X X Y i 0 1 1i 2 2i 100.96 0.08 X 0.75 X Y


1

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika

Dari hasil regresi di atas dapat dilihat bahwa tak satupun koefisien penduga dari X1 dan X2 yang signifikan secara statistik (baik pada taraf nyata 5% maupun 10%), padahal nilai R2 dari hasil analisis tersebut sangat tinggi yaitu 0,987. Selain itu diketahui pula X1 dan X2 berkorelasi cukup tinggi (r23 = 0,997). Maka jelaslah bahwa terjadi gejala multikolinieritas. Mengatasi multikolinieritas dengan menggunakan a priori information. Misalkan kita memperoleh informasi sebelumnya bahwa

0.1 2 1,
yakni tingkat perubahan impor terhadap perubahan IHK sepersepuluh kali dari tingkat perubahannya terhadap GNP. Model regresi

Yi 0 1 X 1i 2 X 2i i
dapat diubah menjadi

Yi 0 1 X 1i 0.1 1 X 2i i Yi 0 1 X i i ;
dengan

X i X 1i 0.1X 2i
sehingga model regresi dugaannya dapat dituliskan sebagai

X Y i 0 1 i
i 1 2 3 4 5 6 7 8 9 10 Y 28.4 32.0 37.7 40.6 47.7 52.9 58.5 64.0 75.9 94.4 X2 637.5 688.1 753.0 796.3 868.5 935.5 982.4 1063.4 1171.1 1306.6 X3 92.9 94.5 97.2 100.0 104.2 109.8 116.3 121.3 125.3 133.1 Xi 646.8 697.6 762.7 806.3 878.9 946.5 994 1076 1184 1320

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika


11 12 13 14 15 16 131.9 126.9 155.4 185.8 217.5 260.9 1412.9 1528.8 1702.2 1899.5 2127.6 2368.5 147.7 161.2 170.5 181.5 195.4 217.4 1428 1545 1719 1918 2147 2390

SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 1.00 14.00 15.00 SS 76557.54 1046.98 77604.52 Standard Error 5.75 0.00 MS 76557.54 74.78 F 1023.71 Significance F 0.00 0.993 0.987 0.986 8.648 16.000

Coefficients Intercept Xi -69.67 0.13

t Stat -12.13 32.00

P-value 0.00 0.00

Lower 95% -81.99 0.12

Upper 95% -57.34 0.14

Dari hasil di atas diperoleh model regresi dugaannya sebagai

69.67 0.13 X Y i i
dengan koefisien penduga yang signifikan secara statistik. Selain itu nilai R2 juga cukup tinggi, yakni sebesar 0.987.

Mengatasi multikolinieritas dengan membuang sebagian variabel bebas.


Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika

Dengan meregresikan masing-masing secara terpisah, mula-mula terhadap X1, diperoleh hasil sebagai berikut:
SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 1.00 14.00 15.00 SS 76554.99 1049.53 77604.52 Standard Error 5.74 0.00 Upper 95% -56.79 0.14 MS 76554.99 74.97 F 1021.19 Significance F 0.00 0.993 0.986 0.986 8.658 16.000

Coefficients Intercept X1 -69.09 0.13

t Stat -12.05 31.96

P-value 0.00 0.00

Lower 95% -81.40 0.13

Kemudian dilanjutkan terhadap X2, sehingga diperoleh hasil sebagai berikut:


SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df SS MS F Significance F 0.993 0.985 0.984 8.980 16.000

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika


Regression Residual Total 1.00 14.00 15.00 76475.50 1129.01 77604.52 Standard Error 8.33 0.06 Pvalue 0.00 0.00 76475.50 80.64 948.31 0.00

Coefficients Intercept X2 -146.52 1.82

t Stat -17.58 30.79

Lower 95% -164.39 1.70

Upper 95% -128.64 1.95

Studi Kasus 2 Perhatikan data output (Q), tenaga kerja (L), dan modal (K) dari 15 perusahaan berikut:
Q 2350 2470 2110 2560 2650 2240 2430 2530 2550 2450 2290 2160 2400 2490 2590 L 2334 2425 2230 2463 2565 2278 2380 2437 2446 2403 2301 2253 2367 2430 2470 K 1570 1850 1150 1940 2450 1340 1700 1860 1880 1790 1480 1240 1660 1850 2000 ln Q 7.76 7.81 7.65 7.85 7.88 7.71 7.80 7.84 7.84 7.80 7.74 7.68 7.78 7.82 7.86 ln L 7.76 7.79 7.71 7.81 7.85 7.73 7.77 7.80 7.80 7.78 7.74 7.72 7.77 7.80 7.81 ln K 7.36 7.52 7.05 7.57 7.80 7.20 7.44 7.53 7.54 7.49 7.30 7.12 7.41 7.52 7.60

a. Analisis model regresi Cobb-Douglas

L1 K 2 Q 0 ln L ln K ln Q ln 0 1 2

SUMMARY OUTPUT

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika

Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 2.00 12.00 14.00 SS 0.06 0.00 0.06 Standard Error 4.48 0.71 0.14 MS 0.03 0.00 F 186.82 Significance F 0.00 0.984 0.969 0.964 0.013 15.000

Coefficients Intercept ln L ln K 0.50 0.76 0.19

t Stat 0.11 1.07 1.36

P-value 0.91 0.31 0.20

Lower 95% -9.26 -0.78 -0.11

Upper 95% 10.26 2.30 0.49

Koefisien regresi baik ln L dan ln K tidak ada yang signifikan secara statistik, dan nilai R2 cukup tinggi, selain itu korelasi antara ln L dan ln juga relatif besar, yakni

rln l ,ln K 0.992


Dari hasil tersebut jelas dalam kasus ini terdapat gejala multikolinieritas. Analisis model regresi secara terpisah b. Model dugaan regresi ln Q terhadap ln L dapat dituliskan sebagai:

ln L ln Q ln 0 1
SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R 0.982 0.964 0.961

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

Ringkasan Materi Lanjutan Ekonometrika


Square Standard Error Observations ANOVA df Regression Residual Total 1.00 13.00 14.00 SS 0.06 0.00 0.06 Standard Error 0.71 0.09 MS 0.06 0.00 F 349.28 Significance F 0.00 0.013 15.000

Coefficients Intercept ln L -5.50 1.71

t Stat -7.74 18.69

P-value 0.00 0.00

Lower 95% -7.04 1.51

Upper 95% -3.96 1.91

Analisis model regresi secara terpisah c. Model dugaan regresi ln Q terhadap ln K dapat dituliskan sebagai:

ln K ln Q ln 0 2
SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 1.00 13.00 14.00 SS 0.06 0.00 0.06 MS 0.06 0.00 F 368.32 Significance F 0.00 0.983 0.966 0.963 0.013 15.000

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

10

Ringkasan Materi Lanjutan Ekonometrika


Coefficients Intercept ln K 5.30 0.34 Standard Error 0.13 0.02 t Stat 40.78 19.19 P-value 0.00 0.00 Lower 95% 5.02 0.30 Upper 95% 5.58 0.37

Untuk b) dan c), masing-masing regresi linear sederhana antara In Q dan In L dan antara In Q dan In K. Ternyata, baik In L maupun In K, bila diregresikan dengan In Q secara terpisah menunjukkan pengaruh yang signifikan secara statistsik, bahkan untuk tingkat signifikan 1% (highly significant), sedangkan nilai R2 juga tinggi, masing-masing sebesar 0,96. Akan tetapi, kalau kita buang salah satu variabel bebas, akan kita peroleh perkiraan OLS yang bias. Selain itu, juga menimbulkan persoalan spesifikasi, sebab menurut teori ekonomi tenaga kerja dan modal mempengaruhi output. Jadi harus masuk dalam persamaan regresi. Bagaimana persoalan kolinearitas ganda yang terjadi pada studi kasus di atas dapat diatasi, apabila diketahui bahwa constant returns to scale (yaitu

1 ) terjadi di dalam industri ini? 1 2


Dengan constant returns to scale fungsi produksi Cobb-Douglas dapat ditulis sebagai berikut:

L1 K 1 1 Q 0
Kemudian dibuat transfirmasi log sebagai berikut:

ln L 1 ln K ln Q ln 0 1 1 ln Q ln K ln ln L ln K
0 1

ln L * ln Q* ln 0 1
dengan dan

ln Q* ln Q ln K
ln L* ln L ln K
Q 2350 2470 L 2334 2425 K 1570 1850 ln Q 7.76 7.81 ln L 7.76 7.79 ln K 7.36 7.52 ln Q* 0.40 0.29 ln L* 0.40 0.27

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

11

Ringkasan Materi Lanjutan Ekonometrika


2110 2560 2650 2240 2430 2530 2550 2450 2290 2160 2400 2490 2590 2230 2463 2565 2278 2380 2437 2446 2403 2301 2253 2367 2430 2470 1150 1940 2450 1340 1700 1860 1880 1790 1480 1240 1660 1850 2000 7.65 7.85 7.88 7.71 7.80 7.84 7.84 7.80 7.74 7.68 7.78 7.82 7.86 7.71 7.81 7.85 7.73 7.77 7.80 7.80 7.78 7.74 7.72 7.77 7.80 7.81 7.05 7.57 7.80 7.20 7.44 7.53 7.54 7.49 7.30 7.12 7.41 7.52 7.60 0.61 0.28 0.08 0.51 0.36 0.31 0.30 0.31 0.44 0.55 0.37 0.30 0.26 0.66 0.24 0.05 0.53 0.34 0.27 0.26 0.29 0.44 0.60 0.35 0.27 0.21

SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 1.00 13.00 14.00 SS 0.24 0.00 0.24 Standard Error 0.01 0.02 MS 0.24 0.00 F 1584.97 Significance F 0.00 0.996 0.992 0.991 0.012 15.000

Coefficients Intercept ln L* 0.07 0.83

t Stat 9.26 39.81

P-value 0.00 0.00

Lower 95% 0.06 0.78

Upper 95% 0.09 0.87

Dipersiapkan oleh: Indra, S.Si, M.Si (indradata@gmail.com)

12