PENDAHULUAN
Apakah Konsumsi hanya dipengaruhi oleh
Pendapatan saja?
Ada beberapa variabel lain yang berpengaruh,
seperti jumlah anggota keluarga, umur anggota
keluarga, selera pribadi, dan sebagainya.
Bila dianggap variabel lain perlu diakomodasikan
dalam menganalisis konsumsi, maka Regresi
Sederhana dikembangkan menjadi Regresi
Berganda.
MODEL
Contoh Aplikasi:
Yi = 0 + 1X1 + 2X2 + 3X3 + ui
Y: Konsumsi
X1 : Pendapatan
X2 : Umur
X3 : Jumlah tanggungan
ESTIMASI
Teknik Estimasi: Ordinary Least Square
Estimator:
b = (XTX)-1 XTY
Regresi sederhana:
H0 : 1 = 0
H1 : 1 0
Observasi: Yi = 0 + 1 Xi + ei
Regresi: Ŷi = b0 + b1 Xi (catatan: Ŷi merupakan estimasi dari Yi).
(Y Y ) (Y Y e )
i
2
i i
2
SST
(Y Y )
i (
SSR
Y) e
Y2
SSE i
2
i
2
Tabel ANOVA
Sumber Sum of Square df Mean Squares F Hitung
Regresi SSR k MSR = SSR/k F = MSR
Error SSE n-k-1 MSE= SSE/(n-k-1) MSE
Total SST n-1
Y : Konsumsi
X1 : Total Pendapatan
X2 : Pendapatan dari upah
X3 : Pendapatan bukan dari upah
X1 X2 X3
12 48 51
16 64 65
19 76 82
23 92 96
29 116 118
Nilai-nilai yang tertera dalam tabel menunjukan bahwa Antara X1 dan X2
mempunyai hubungan: X2 = 4X1. Hubungan seperti inilah yang disebut
dengan perfect multicollinearity.
Akibat Multikolinieritas
Model:
Y = 12,8 – 1,414X1 + 0,202 X2
SE (4,696) (1,199) (0,117)
t (2,726) (-1,179) (1,721)
R2 = 0,982
max eigenvalues
CI
min eigenvalues
Jika CI berada antara nilai 10 sampai 30:
kolinieritas moderat.
Bila CI mempunyai nilai diatas 30: kolinieritas
yang kuat. Age vaes
2. VIF dan Tolerance
1
VIFj ; j = 1,2,……,k
(1 R 2j )
k adalah banyaknya variabel bebas
R 2j adalah koefisien determinasi antara variabel bebas ke-j dengan
variabel bebas lainnya.
2
Jika R j = 0 atau antar variabel bebas tidak berkorelasi, maka nilai VIF = 1.
Jika R 2j ≠ 0 atau ada korelasi antar variabel bebas, maka nilai VIF > 1.
Oleh karena itu, dapat disimpulkan bahwa kolinieritas tidak ada
jika nilai VIF mendekati angka 1
Tolerance
100
80
60
40
20
0 20 40 60
Data Heteroskedastisitas
Fakta:
– hubungan positif antara X dan Y, dimana nilai Y
meningkat searah dengan nilai X.
– semakin besar nilai variabel bebas (X) dan
variabel bebas (Y), semakin jauh koordinat (x,y)
dari garis regresi (Error makin membesar)
– besarnya variasi seiring dengan membesarnya
nilai X dan Y. Atau dengan kata lain, variasi data
yang digunakan untuk membuat model tidak
konstan.
Pemeriksaan Heteroskedastisitas
1. Metode Grafik
Prinsip: memeriksa pola residual (ui2)
terhadap taksiran Yi.
Langkah-langkah:
– Run suatu model regresi
– Dari persamaan regresi, hitung ui2
– Buat plot antara ui2 dan taksiran Yi
Pola Grafik
u i2
Yi
Yi
Pengamatan:
1.Tidak adanya pola yang sistematis.
2.Berapapun nilai Y prediksi, residual kuadratnya relatif sama.
3.Variansi konstan, dan data homoskedastis.
Pola Adanya Heteroskedastisitas
ui2 ui2
Yi
Yi
Pola sistematis
Uji Park
RSS 2 / df 2
RSS1 / df1
Bila > F tabel, kita tolak hipotesis yang mengatakan data mempunyai variansi
yang homoskedastis
Ilustrasi
Ada 30 pengamatan penjualan sepatu dan bonus. Sebanyak 4
pengamatan yang di tengah diabaikan sehingga tinggal 13
pengamatan pertama (Kelompok I) dan 13 pengamatan kedua
(Kelompok II).
Yj 1 X j uj
1 2
j j j j
ui2
E(ui*2) = E 2 12 E (u i 2 ) 12 ( i 2 ) 1 konstan
i i i
Transformasi
u j2
E(vi2) = E 2 1 E (u 2 ) 1 ( 2 X 2 ) 2 konstan
X X 2 j
X
2 j
j j j
1
2. Transformasi dengan Xi
Asumsi:
j2 = E u 2j 2 X j
ui ui
*
* **
* * * ***
* * * **
* * * Waktu/X * **
Waktu/X
* * * *
***
*
Gambar nomor (1) menunjukan adanya siklus, sedang nomor (2)
menunjukan garis linier. Kedua pola ini menunjukan adanya
otokorelasi.
Uji Durbin-Watson ( Uji d)
Statistik Uji N
t t 1
(
t2
u
u ) 2
d N
t
u
t 1
2
0 dL dU 4-dU 4-dL 4
Mengatasi Otokorelasi: Metode Pembedaan
Umum (Generalized Differences)
2
R
SSR
1
SSE
1
i
u 2
Y
2
SST SST Y
i
R2 Adjusted
SST sama sekali tidak dipengaruhi oleh jumlah variabel bebas,
karena formulasinya hanya memperhitungkan variabel terikat
SSE dipengaruhi oleh variabel bebas, dimana semakin banyak
variabel bebas, maka nilai SSE cenderung semakin kecil, atau
paling tidak tetap. SSE kecil, maka nilai SSR akan besar.
Akibat kedua hal tersebut, maka semakin banyak variabel
bebas yang dimasukkan dalam model, maka nilai R2 akan
semakin besar.
R2 1
i /(n k )
u 2
(Y i Y ) /(n 1)
Pemilihan Model
AIC e 2k/n i
u 2
e 2k/n SSE
n n
2k RSS
ln AIC ln
n n
Bila kita membandingkan dua buah regresi atau lebih, maka model yang
mempunyai nilai AIC terkecil merupakan model yang lebih baik.
Ilustrasi
SIC n k/n i
u 2
n k/n SSE
n n
k RSS
ln SIC ln n ln
n n
Sama dengan AIC, model yang mempunyai nilai SIC terkecil merupakan
model yang lebih baik.
Ilustrasi
Y
Yi Y
* *
= Yi
Y i Y
0
0 (nilai tengah = 0)
i
SY n SY n SY
S 2
Y
i Y /(n 1) n 1S
2
2
Y /(n 1)
1 (varian = 1)
Y* 2 2
S Y S Y
Standarisasi Variabel