A. Tujuan Pembelajaran
1. Mahasiswa diharapkan mampu memahami analisis varians dalam regresi
linier berganda, dan melakukan pendugaan dengan menggunakan regresi
linier berganda.
2. Mahasiswa diharapkan mampu memahami masalah regresi lainnya.
B. Uraian Materi
1. Analisis varians dalam regresi linier berganda, dan melakukan
pendugaan dengan menggunakan regresi linier berganda.
Pada regresi sederhana, dinyatakan bahwa apabila variabel 𝑋 dan 𝑌 yang
diukur menurut rata-ratanya, dinyatakan dalam bentuk simpangan
(𝑥𝑖 = 𝑋𝑖 − 𝑋, 𝑦𝑖 = 𝑦𝑖 − 𝑌), maka:
∑ 𝑥𝑖 𝑦𝑖
𝑦𝑖 = 𝑦̂𝑖 + 𝑒𝑖 ⇒ 𝑒𝑖 = 𝑦𝑖 − 𝑦̂𝑖 , 𝑦̂𝑖 = 𝑏𝑥𝑖 ⇒ 𝑏 =
∑ 𝑥𝑖2
∑ 𝑦𝑖2 = ∑ 𝑦̂𝑖2 + ∑ 𝑒𝑖2 ⇒ ∑ 𝑦̂𝑖2 = 𝑏 2 ∑ 𝑥𝑖2 = 𝑏 ∑ 𝑥𝑖 𝑦𝑖 = 𝑏 𝑇 𝑥 𝑇 𝑦
∑ 𝑒𝑖2 = (1 − 𝑟 2 ) ∑ 𝑦𝑖2 = (1 − 𝑟 2 )𝑦 𝑇 𝑦
∑ 𝑥𝑖 𝑦 𝑖 ∑ 𝑦2
𝑏 ∑ 𝑥𝑖 𝑦𝑖 = ∑ 𝑥𝑖2
. ∑ 𝑥𝑖 𝑦𝑖 . ∑ 𝑦𝑖2 = 𝑟 2 ∑ 𝑦𝑖2 = 𝑟 2 𝑦 𝑇 𝑦
𝑖
Jadi, ∑ 𝑦𝑖2 = 𝑟 2 𝑦 𝑇 𝑦(1 − 𝑟2 )𝑦 𝑇 𝑦
Apabila variabel 𝑋 dan 𝑌 diukur dari titik asal, maka dapat diringkaskan
hal-hal sebagai berikut:
𝑌 = 𝑋𝐵 + 𝜀, diestimasi dengan 𝑋𝑏 + 𝑒
−1
𝑏 = (𝑋 𝑇 𝑋) 𝑋 𝑇 𝑌
𝐸(𝑏) = 𝐵
−1
Var(𝑏) = 𝜎 2 (𝑋 𝑇 𝑋)
1
2 𝑏 𝑋 𝑇 𝑌− (∑ 𝑌𝑖 )2
𝐸(𝑒 𝑇 𝑒) = (𝑛 − 𝑘)𝜎 2 dan 𝑅1,23…..𝑘 = 𝑅2 = 𝑛
1
𝑌 𝑇 𝑌−− (∑ 𝑌𝑖 )2
𝑛
𝑏1 𝜀1 𝜀1 𝑒1
𝑏2 𝜀2 𝜀2 𝑒2
⋮ ⋮ ⋮ ⋮
𝑏 = ⋮ ,𝜀 = ⋮ ,𝜀 = ⋮ ,𝑒 = ⋮
𝑏𝑖 𝜀𝑖 𝜀𝑖 𝑒𝑖
⋮ ⋮ ⋮ ⋮
[𝑏𝑛 ] [𝜀𝑛 ] [𝜀𝑛 ] [𝑒𝑛 ]
Perhatikan bahwa kita sukar sekali (tidak bisa) membedakan antara
matriks/vektor dengan elemen-elemen berupa variabel yang diukur dari
titik nol (dinyatakan dengan huruf latin besar) dan yang diukur dari rata-
ratanya (dinyatakan dengan huruf latin kecil), sebab matriks/vektor harus
dinyatakan dalam huruf latin besar.
Apabila variabel diukur dari rata-ratanya, atau dinyatakan dalam
bentuk simpangan dengan huruf latin kecil, maka matriks 𝑋 akan menjadi
𝑛 baris dan 𝑘 kolom, sedangkan vektor 𝐵 akan terdiri dari 𝑘
komponen/elemen.
Semua rumus yang berhubungan dengan variabel yang dinyatakan
dalam bentuk simpangan (huruf kecil), mepunyai bentuk yang sama
2
apabila dinyatakan dalam bentuk persamaan matriks, kecuali 𝑅1,23…..𝑘 =
𝑟 2 , yang bentuknya akan berubah dari:
1
bT XT Y− (∑ Yi )2
2
𝑅 = 1
n
(variabel 𝑋 dan 𝑌 dinyatakan dalam huruf besar)
YT Y− (∑ Yi )2
n
menjadi,
bT X T Y
𝑅2 = (variabel 𝑋 dan 𝑌 dinyatakan dalam huruf kecil) dimana:
YT Y
∑ 𝑥1𝑖 𝑦𝑖
∑ 𝑥2𝑖 𝑦𝑖
⋮
bT X T Y = (𝑏1 , 𝑏2 , … , 𝑏𝑗 , … , 𝑏𝑘 ) ∑ 𝑥 𝑦
𝑗𝑖 𝑖
⋮
[∑ 𝑥𝑘𝑖 𝑦𝑖 ]
Jadi, variasi 𝑌 berasal dari dua sumber, yaitu dari regresi linear berganda
(tergantung pada variabel bebas 𝑋1 , 𝑋2 , … , 𝑋𝑘 ) dan dari residu.
Pemecahan variasi 𝑌 menjadi dua sumber merupakan dasar
analisis varians dan dapat disajikan dalam bentuk tabel analisis varians
(Anova) sebagai berikut:
∑ Y T Y = ∑ 𝑦𝑖2 𝑛−1
𝑘 = banyaknya variabel 𝑋
bT XT Y/𝑘 YT Y(𝑅2 ) 𝑅2 /𝑘
𝐹0 = = =
𝑒𝑇 𝑒/(𝑛 − 𝑘 − 1) YT Y(1 − 𝑅2 )/(𝑛 − 𝑘 − 1) (1 − 𝑅2 )/(𝑛 − 𝑘 − 1)
𝑅𝐾𝑅
𝐹obs =
𝑅𝐾𝐸
dimana,
𝐽𝐾𝑅 = jumlah kuadrat regresi
𝐽𝐾𝐸 = jumlah kuadrat error
𝐽𝐾𝑇 = jumlah kuadrat total
𝑅𝐾𝑅 = rata-rata kuadrat regresi
𝑅𝐾𝐸 = rata-rata kuadrat error
𝐻0 : 𝐵1 = 𝐵2 = ⋯ 𝐵𝑗 = ⋯ 𝐵𝑘 = 0
(tak ada pengaruh dari 𝑋1 , 𝑋2 , … , 𝑋𝑗 , … , 𝑋𝑘 terhadap 𝑌).
𝐻𝑎 : 𝐵𝑗 ≠ 0
(paling sedikit ada satu variabel 𝑋 yang mempengaruhi 𝑌, misalnya 𝑋𝑗 ⇒
𝐵𝑗 ≠ 0).
𝐹0 kemudian dibandingkan dengan 𝐹(𝛼)(𝑘)(𝑛−𝑘−1) dari tabel 𝐹.
Apabila 𝐹0 > 𝐹𝑡𝑎𝑏𝑒𝑙 , 𝐻0 ditolak, sebaliknya apabila 𝐹0 < 𝐹𝑡𝑎𝑏𝑒𝑙 , 𝐻0 diterima.
Tujuan pengujian hipotesis ini ialah sebagai dasar pembuatan
keputusan, apakah persamaan regresi linear dapat digunakan untuk
memperkirakan/meramalkan nilai 𝑌 kalau nilai𝑋1 , 𝑋2 , … , 𝑋𝑘 sudah diketahui
semuanya.
Nilai variabel 𝑋 diketahui berdasarkan hal-hal berikut:
1. Ditentukan berdasarkan kebijakan, mungkin melalui perencanaan
sehingga disebut “policy variable”. Misalnya, pemerintah memutuskan
untuk waktu yang akan datang, bahwa suku bunga deposito akan
diturunkan menjadi 1% per bulan; pemerintah daerah akan
menggunakan pupuk 100 ton; harga minyak akan dinaikkan 5%; tarif
bis kota DKI Jakarta Raya akan dinaikkan menjadi dua kali lipat; tarif
pajak akan diturunkan 10%; pengeluaran pemerintah akan dinaikkan
7%; biaya iklan suatu perusahaan akan naik menjadi Rp. 100 juta; dan
seterusnya.
2. Kejadian yang sudah terjadi (sudah lama timbul atau baru saja terjadi).
Misalnya, konsumsi tahun lalu, harga sebulan yang lalu. PDB tahun
yang lalu, jumlah kredit 3 bulan yang lalu, jumlah penduduk tahun lalu,
jumlah uang yang beredar triwulan yang lalu, dan lain sebagainya.
3. Hasil ramalan. Misalnya, ramalan PDB, ramalan produksi padi, ramalan
penduduk, ramalan hasil penjualan, ramalan ekspor, dan lain
sebagainya.
Contoh 1
1. Berdasarkan data dari contoh 4 di pertemuan ke-13, ujilah pendapat
dengan menggunakan analisis varians, bahwa 𝑋1 dan 𝑋2 masing-
masing tidak mempengaruhi 𝑌, dengan alternatif, paling tidak ada satu
yang mempengaruhi 𝑌. Gunakan 𝛼 = 5% dan 𝛼 = 1% !
Jawab
𝐻0 : 𝐵1 = 𝐵2 = 0
𝐻𝑎 : 𝐵𝑗 ≠ 0, 𝑗 = 2,3
Dari contoh 4 dipertemuan ke-13 telah dihitung perkiraan:
𝑏1 = 1,3642
𝑏2 = 0,1139
bT X T Y = 𝑏1 ∑ 𝑥1𝑖 𝑦𝑖 + 𝑏2 ∑ 𝑥2𝑖 𝑦𝑖 = 1,3642(879) + 0,1139(−79) = 1183,3127
Y T Y = ∑ 𝑦𝑖2 = 1260,89
T
𝑒 𝑇 𝑒 = ∑ 𝑒𝑖2 = Y T Y − b XT Y = 1260,89 − 1183,3127 = 77,5773
Hasil perhitungan ini dapat disajikan dalam tabel Anova sebagai berikut.
591,6564
𝐹0 = = 45,7598
12,9296
𝐹0 juga dapat diperoleh rumus:
𝑅2 /𝑘 (0,9384)/2 0,4692
𝐹0 = 2
= = = 45,5534
(1 − 𝑅 )/(𝑛 − 𝑘 − 1) (1 − 0,9384)/6 0,0103
(perbedaan merupakan kesalahan pembulatan).
Karena 𝐹0 = 45,5534 > 𝐹(0,05)(2)(6) = 5,14 maka 𝐻0 ditolak yang berarti ada
pengaruh dari 𝑋1 dan 𝑋2 terhadap 𝑌. Ternyata, 𝐹0 = 45,5534 >
𝐹(0,01)(2)(6) = 10,92 sehingga pada 𝛼 = 1% , 𝐻0 juga ditolak.
Hipotesis yang ditolak pada nilai 𝛼 = 5% dikatakan nyata biasa
(significant); sedangkan kalau ditolak pada nilai 𝛼 = 1% dikatakan sangat
nyata (highly significant). Hasil penolakan 𝐻0 pada 𝛼 = 1% ini lebih
meyakinkan, yang berarti nyata-nyata ada pengaruh dari 𝑋1 dan 𝑋2
terhadap 𝑌. Perlu disebutkan di sini bahwa ada kemungkinan suatu
hipotesis ditolak pada tingkat nyata 5%, akan tetapi tidak ditolak pada
tingkat nyata 1%. Dalam hal ini, penolakan dianggap biasa saja.
Analisis varians yang baru saja diuraikan di atas, digunakan untuk
menguji hipotesis bahwa seluruh variabel bebas 𝑋1 , 𝑋2 , … , 𝑋𝑗 , … , 𝑋𝑘 tidak
mempengaruhi 𝑌. Apabila hipotesis tersebut benar, maka garis regresi
linear berganda yang bersangkutan tak dapat digunakan untuk
memperkirakan/meramalkan 𝑌; sebaliknya kalau hipotesis tersebut
ditolak, persamaan garis regresinya adalah:
𝑦̂ = 𝑏1 𝑥1 + 𝑏2 𝑥2 + ⋯ + 𝑏𝑗 𝑥𝑗 + ⋯ . +𝑏𝑘 𝑥𝑘
atau
𝑌̂ = 𝑏0 + 𝑏1 𝑋1 + 𝑏2 𝑋2 + ⋯ + 𝑏𝑗 𝑋𝑗 + ⋯ . +𝑏𝑘 𝑋𝑘
2
Atau dapat juga dipergunakan statistik uji 𝐹, karena 𝑡(𝑛−𝑘−1) = 𝐹(𝑛−𝑘−1) ,
sebagai berikut.
𝑏𝑘2 𝑏𝑘2
𝐹0 = 2 =
𝑠𝑏𝑘 ( 1
∑ 𝑒𝑖2 ) (𝑑𝑘𝑘 )
(𝑛 − 𝑘 − 1)
𝑏2
Apabila 𝑑 𝑘 = 𝑏𝑘∗2 ⇒ 𝑏𝑘2 = 𝑑𝑘𝑘 . 𝑏𝑘∗2 , maka 𝐹0 menjadi
𝑘𝑘
𝑏𝑘∗2
𝐹0 =
∑ 𝑒𝑖2 /(𝑛 − 𝑘 − 1)
Pengujian hipotesis mengenai 𝐻0 : 𝐵𝑘 = 0 dan 𝐻0 : 𝐵𝑘 ≠ 0 dapat
menggunakan analisis varians dengan tabel Anova sebagai berikut:
𝑋𝑘 𝑏𝑘∗2 1 𝑏𝑘∗2
𝑋1 , 𝑋2 , … 𝑋𝑘 ∗2
∑𝑘𝑖=1 𝑏𝑖 𝑘
∑ ∑ 𝑦𝑖2 𝑛−1
𝑏𝑘∗2
𝐹0 =
∑ 𝑒𝑖2 /(𝑛 − 𝑘 − 1)
Contoh 2
1. Dengan menggunakan data contoh 1 pada pertemuan 13, buatlah
ramalan 𝑌, apabila 𝑋1 = 8, pada 𝑋2 = 10, lengkapilah garis regresi
dengan kesalahan baku untuk setiap penduga, juga dilengkapi dengan
koefisien determinasi berganda.
Jawab
𝑏0 = 2,5529 𝑠𝑏0 = 1,6248
𝑏1 = −1,0921 𝑠𝑏1 = 0,2708
𝑏2 = 1,9608 𝑠𝑏2 = 0,3018
𝑒 𝑇𝑒 ∑ 𝑒2 9,7576
𝑠𝑒 = √𝑆𝑒2 = √𝑛−𝑘−1 = √𝑛−𝑘−1
𝑖
=√ = 1,1806
7
(∑ 𝑌𝑖2 )2 742
∑ 𝑦𝑖2 = ∑ 𝑌𝑖2
− = 626 − = 78,4
𝑛 10
∑ 𝑋1𝑖 . ∑ 𝑌𝑖 (40)(74)
∑ 𝑥1𝑖 𝑦𝑖 = ∑ 𝑋1𝑖 𝑌𝑖 − = 282 − = −14
𝑛 10
∑ 𝑋2𝑖 . ∑ 𝑌𝑖 (47)(74)
∑ 𝑥2𝑖 𝑦𝑖 = ∑ 𝑋2𝑖 𝑌𝑖 − = 375 − = 27,2
𝑛 10
Jadi,
𝑌̂ = 2,5529 − 1,0921𝑋1 + 1,9608𝑋2 𝑠𝑒 = 1,1806
(1,6248) (0,2708) (0,3018) 𝑅 2 = 0,8753
Sehingga, apabila 𝑋1 = 8 dan 𝑋2 = 10, maka nilai ramalan 𝑌 adalah
𝑌̂ = 2,5529 − 1,0921𝑋1 + 1,9608𝑋2
𝑌̂ = 2,5529 − 1,0921(8) + 1,9608(10)
𝑌̂ = 2,5529 − 8,7368 + 19,608
𝑌̂ = 13,42
𝜀𝑖 = ∑ 𝜌𝑡 𝑉𝑖−𝑡
𝑡=0
Jadi, 𝐸(𝜀𝑖 ) = ∑∞ 𝑡
𝑡=0 𝜌 𝐸(𝑉𝑖−𝑡 )
Variance-Covariance (= VC) dari matriks kesalahan pengganggu adalah:
𝐸(𝜀𝑖2 ) (𝜀1 𝜀2 ) ⋯ 𝐸(𝜀1 𝜀𝑛 )
2
VC = E(𝜀𝜀 𝑇 ) = 𝐸(𝜀2 𝜀1 ) 𝐸(𝜀2 ) ⋯ 𝐸(𝜀2 𝜀𝑛 )
⋮ ⋮ ⋮ ⋮
[𝐸(𝜀𝑛 𝜀1 ) 𝐸(𝜀𝑛 𝜀2 ) ⋯ 𝐸(𝜀𝑛2 ) ]
2
𝐸(𝜀𝑖2 ) = 𝐸 (∑ 𝜌𝑡 (𝑉𝑖−𝑡 ))
𝐸(𝜀𝑖2 ) = 𝐸(𝑉𝑖2 ) + 𝜌2 𝐸(𝑉𝑖−1 + 𝜌2 𝑉𝑖−2 + ⋯ )2
𝐸(𝜀𝑖2 ) = 𝐸(𝑉𝑖2 ) + 𝜌2 𝐸(𝑉𝑖−1 ) + 𝜌4 𝐸(𝑉𝑖−2 ) + ⋯
𝐸(𝜀𝑖2 ) = (1 + 𝜌2 + 𝜌4 + ⋯ )𝜎𝑣2
𝜎2
𝐸(𝜀𝑖2 ) = 1−𝜌
𝑣 2
2 = 𝜎𝜀 , untuk semua 𝑖.
Statistik d Durbin-Watson
Misalnya, 𝜀𝑖 merupakan kesalahan pengganggu (disturbance error) yang
sering disebut residu dari suatu regresi linear.
𝑌𝑖 = 𝑎 + 𝑏1 𝑋1𝑖 + 𝑏2 𝑋2𝑖 + ⋯ + 𝑏𝑗 𝑋𝑗𝑖 + ⋯ + 𝑏𝑘 𝑋𝑘𝑖 + 𝑒𝑖
𝒌
𝑌𝑖 = 𝑎 + ∑ 𝑏𝑗 𝑋𝑗𝑖 + 𝒆𝒊
𝒋=𝟏
Statistik d Durbin-Watson adalah sebagai berikut.
∑𝑛𝑖=2(𝑒𝑖 − 𝑒𝑖−1 )2
𝑑= … … … … … … … … … … … … … . (𝐩𝐞𝐫𝐬. 𝟐𝟕)
∑𝑛𝑖=1 𝑒𝑖2
Durbin dan Watson sudah membuat tabel yang disebut statistik d Durbin-
Watson pada tingkat nyata 5% dan 1%. Tabel, memuat nilai batas atas
(upper bound), 𝑑𝑢 dan nilai batas bawah (lower bound) 𝑑𝐿 , untuk berbagai
nilai 𝑛 (= besarnya sampel) dan 𝑘 (banyaknya variabel bebas:
𝑋1 , 𝑋2 , … , 𝑋𝑗 , … . , 𝑋𝑘 ).
∑ 𝑋𝑖 = 83 ∑ 𝑒𝑖2 = 42,140
2
∑ 𝑌𝑖 = 515,7 ∑ 𝑒𝑖−1 = 41,86
∑ 𝑋𝑖2 = 463 ∑(𝑒𝑖 − 𝑒𝑖−1 )2 = 23,491
∑ 𝑋𝑖 𝑌𝑖 = 2.630 ∑ 𝑒𝑖 𝑒𝑖−1 = 29,969
𝑌′𝑖 = 𝑌𝑖 − 𝜌𝑋𝑖−1
𝑋𝑖 = 𝑋𝑖 − 𝜌𝑋𝑖−1
∑ 𝑒𝑖 𝑒𝑖−1 29,969
𝜌̂ = 2
∑ 𝑒𝑖−1
= 41,860 = 0,716 dimana 𝜌̂ adalah penduga 𝜌.
Heteroskedastisitas
Apabila matriks VC (Variance Covariance) kesalahan pengganggu adalah
sebagai berikut:
𝑉11 0 ⋯ 0
𝑇 2 2 0 𝑉
𝐸(𝜀 ) = 𝜎 𝑉 = 𝜎 [ 22 ⋯ 0 ]
0 0 ⋯ 𝑉𝑛𝑛
dan beberapa elemen pada diagonal utama tidak sama dengan satu
(𝑉𝑖𝑖 ≠ 1), maka kesalahan pengganggu disebut heteroskedastis. Dengan
kata lain, kesalahan pengganggu merupakan variabel bebas, akan tetapi
dengan varians dan untuk setiap nilai 𝑋 (nilai konstan) yang berbeda,
dimana 𝑋 merupakan variabel bebas.
Kalau 𝑋 = pendapatan rumah tangga, 𝑌 = pengeluaran rumah
tangga, maka biasanya varians 𝑌 akan naik. Artinya, bagi rumah tangga
dengan tingkat pendapatan yang tinggi akan terdapat variasi yang tinggi
pada pola pengeluarannya. Kenyataannya ini sering dijumpai dalam studi
anggaran rumah tangga (family budget studies).
Sebagai ilustrasi, misalnya kita pergunakan suatu regresi linear,
dan kita asumsikan bahwa varians dari kesalahan pengganggu adalah
proporsional terhadap 𝑋 2 , yaitu:
𝐸(𝜀𝑖2 ) = 𝜎 2 𝑋𝑖2 , 𝑖 = 1,2,3, … , 𝑛
Atau, apabila model regresi tersebut dinyatakan dalam bentuk matriks:
𝑌 = 𝑋𝐵 + 𝜀
Dimana seperti biasanya,
1. 𝐸(𝜀) = 0
𝑋𝑖2 0 ⋯ 0
𝑇 2
2. 𝐸(𝜀 ) = 𝜎 [ 0 𝑋2 ⋯ 0 ] 2
0 0 ⋯ 𝑋𝑛2
3. 𝑋 suatu matriks konstan, artinya tak berubah dari sampel ke sampel.
𝑎0 = 𝑌0 + 𝑏0 𝑋0
𝑛 ∑ 𝑋0 𝑌0 − ∑ 𝑋0 ∑ 𝑌0
𝑏0 =
𝑛 ∑ 𝑋02 − (∑ 𝑋0 )2
∑(1/𝑋𝑖 )(𝑌𝑖 /𝑋𝑖 ) − ∑ 1/𝑋𝑖 ∑ 𝑌𝑖 /𝑋𝑖
𝑏0 =
𝑛 ∑(1/𝑋𝑖 )2 − (∑ 1/𝑋𝑖 )2
∑ 𝑌𝑖 /𝑋𝑖2 − ∑ 1/𝑋𝑖 ∑ 𝑌𝑖 /𝑋𝑖
𝑏0 =
𝑛 ∑(1/𝑋𝑖 )2 − (∑ 1/𝑋𝑖 )2
∑ 𝑌0 ∑ 𝑋0
𝑎0 = 𝑌0 + 𝑏0 𝑋0 → 𝑌0 = , 𝑋0 =
𝑛 𝑛
∑ 𝑌0 ∑ 𝑋0 𝑛 ∑ 𝑋0 𝑌0 − ∑ 𝑋0 𝑌0
𝑎0 = − { }
𝑛 𝑛 𝑛 ∑ 𝑋02 − (∑ 𝑋0 )2
(∑ 𝑋02 )(∑ 𝑌0 ) − (∑ 𝑋0 )(∑ 𝑋0 𝑌0 )
𝑎0 =
𝑛 ∑ 𝑋02 − (∑ 𝑋0 )2
𝑎0 =, dimana dalam hal ini 𝑏2 = 𝑏2
Kolinearitas berganda
Apabila kitamenggunakan model regresi: 𝑌 = 𝐴 + 𝐵1 𝑋1 + 𝐵2 𝑋2 + ⋯ +
𝐵𝑘 𝑋𝑘 + 𝜀, 𝑌 = 𝐵0 + 𝐵1 𝑋1 + 𝐵2 𝑋2 + ⋯ + 𝐵𝑘 𝑋𝑘 + 𝜀, dalam hal ini kita
mempunyai asumsi bahwa 𝑋1 , 𝑋2 , … , 𝑋𝑘 sebagai variabel-variabel bebas
tidak berkorelasi satu sama lain.
Seandainya variabel-variabel bebas tersebut berkorelasi satu sama
lain, maka dikatakan terjadi kolinearitas berganda (multi collinearity). Hal
ini sering terjadi pada data berkala (time series data), khususnya di bidang
ekonomi. Secara ekstrem, ada kemungkinan terjadi 2 variabel atau lebih
mempunyai hubungan (korelasi) yang sangat kuat sehingga pengaruh
masing-masing variabel tersebut terhadap 𝑌 sukar untuk dibedakan.
Perhatikan hubungan linear berikut:
𝑌𝑖 = 𝐵0 + 𝐵1 𝑋1𝑖 + 𝐵2 𝑋2𝑖 + 𝜀𝑖
Dalam hal ini, metode kuadrat terkecil tidak dapat menghasilkan penduga
𝑏0 , 𝑏1 , 𝑏2,…. , 𝑏𝑘 yang BLUE karena 𝑟(𝑋 𝑇 𝑋) < 𝑘 = 2, dimana 𝑟 = rank
matriks, sehingga det (𝑋 𝑇 𝑋) = 0. Karena det (𝑋 𝑇 𝑋) = 0, maka (𝑋 𝑇 𝑋)−1
tak dapat dicari.
−1
Jadi, 𝑏 = (𝑋 𝑇 𝑋) (𝑋 𝑇 𝑌)
Tak mungkin dapat dihitung. Perhatikan uraian berikut:
1 1 ⋯ 1 1 𝑋11 ⋯ 𝑋21 𝑛 ∑ 𝑋2𝑖 ∑ 𝑋2𝑖
𝑋 𝑋12 ⋯ 𝑋1𝑛 1 𝑋12 ⋯ 𝑋22 2
𝑋𝑇 𝑋 = [ 1 ][ ] = [∑ 𝑋1𝑖 ∑ 𝑋1𝑖 ∑ 𝑋2𝑖 𝑋1𝑖 ]
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 2
𝑋21 𝑋22 ⋯ 𝑋2𝑛 1 𝑋1𝑛 ∑ 𝑋2𝑖 ∑ 𝑋2𝑖 𝑋1𝑖 ∑ 𝑋2𝑖
⋯ 𝑋2𝑛
𝑛 ∑ 𝑋1𝑖 𝑘 ∑ 𝑋1𝑖
𝑇 2
𝑋 𝑋 = [ ∑ 𝑋1𝑖 ∑ 𝑋1𝑖 𝑘 ∑ 𝑋1𝑖 ]
𝑘 ∑ 𝑋1𝑖 𝑘 ∑ 𝑋1𝑖 𝑘2 ∑ 𝑋21𝑖
2
C. Soal/Latihan/Tugas
1. 𝑋1 = indeks pendapatan nasional suatu negara
𝑋2 = indeks harga impor suatu komoditi
𝑌 = indeks impor suatu komoditi
Selama 10 tahun diperoleh data berkala sebagai berikut.
𝑋1 100 104 104 106 111 111 115 120 124 126
𝑋2 100 99 99 110 136 113 113 103 102 98
𝑌 100 108 106 107 120 110 126 133 133 147
Ujilah pendapat dengan menggunakan analisis varians, bahwa 𝑋1 dan 𝑋2
masing-masing tidak mempengaruhi 𝑌, dengan alternatif, paling tidak ada
satu yang mempengaruhi 𝑌. Gunakanlah 𝛼 = 5% dan 𝛼 = 1% !
2. Ada 12 rumah tangga yang merupakan sampel acak dari suatu penelitian.
Antara lain dinyatakan tentang banyaknya konsumsi atas komoditi tertentu
(dalam satuan), harga komoditi (dalam satuan), dan pendapatan (dalam
satuan).
Kita ketahui, bahwa permintaan terhadap komoditi tersebut untuk
keperluan konsumsi (𝑌) akan dipengaruhi oleh harga (𝑋1 ) dan
pendapatan (𝑋2 ). Hasil penelitian adalah sebagai berikut:
𝑋1 2 5 3 3 5 4 6 3 3 4 5 6
𝑋2 3 7 5 4 7 6 8 6 4 5 6 4
𝑌 5 9 6 8 8 10 9 12 7 11 7 13
Ujilah dengan apakah data di atas ada otokorelasi positif atau tak ada
otokorelasi (gunakan statistik 𝑑 Durbin-Watson dengan 𝛼 = 5%) ?
5. Referensi
Supranto, J. 2009. Statistik: Teori dan Aplikasi Edisi Ketujuh. Jakarta:
Erlangga