I. Pengantar
Analisa regresi merupakan salah satu topik utama ekonometrika. Dengan
regresi, kita berupaya mengungkapkan hubungan antar variabel dengan
memasukkan unsur kausalitas. Dengan kata lain kita ingin mengetahui jika
suatu variabel berubah (misalnya x=tingkat pendidikan) maka apa yang
terjadi dengan variabel lainnya (misalnya y=tingkat gaji/upah).
y = β 0 + β1 x + u ………………………1)
y x
Dependent Variable Independent Variable
Explained Variable Explanatory Variable
Response Variable Control Variable
Predicted Variable Predictor Variable
Regressand Regressor
1
Variabel u disebut sebagai error term atau disturbances yang berfungsi
untuk menampung seluruh factor yang mempengaruhi y selain x (tidak
terbatas pada variabel lain namun mungkin juga kesalahan bentuk
fungsional, kesalahan pengukuran, dsb). Variabel u juga sering disebut
sebagai variabel tak terobservasi (unobserved).
Katakanlah kita mengukur gaji dalam satuan ribuan rupiah dan didik
sebagai jumlah bulan sekolah (termasuk training). Dengan demikian
perubahan 1 bulan sekolah akan berimplikasi pada perubahan gaji sebesar
β1 ribuan rupiah.
2
E (u ) = 0 ………………………3)
E (u x) = E (u ) = 0 ………………………4)
E ( y x) = β 0 + β1 x ………………………5)
3
III. Penurunan Estimator Ordinary Least Squares
Seperti yang telah diuraikan didepan kita mengestimasi population
regression function/PRF (persamaan 5) dari suatu sampel. Hasil dari
estimasi ini disebut dengan sample regression function/SRF yang
berbentuk persamaan 1. Error term diperlukan mengingat hasil yang
diperoleh dari sampel ini hanya merupakan suatu dugaan yang diharapkan
berlaku atas dasar asumsi/prinsip statistik tertentu. Dengan kata lain selalu
terdapat kemungkinan kesalahan atas dugaan populasi karena
menggunakan data dari sample. Prinsip ini adalah umum digunakan dalam
statistik induktif.
4
jumlah kuadrat residualnya adalah yang paling kecil. Dengan menggunakan
teknik kalkulus dan penerapan aturan penjumlahan dapat ditunjukkan
bahwa parameter β0 dan β1 adalah (lihat appendiks 1 untuk derivasi):
n _ _
^ ∑ ( x − x)( y − y) i i
Cov( x, y )
β1 = i =1
n _
= ………………………7)
∑ ( x − x) 2 Var ( x)
i
i =1
^ _ _
β 0 = y − β1 x ………………………8)
Ini adalah nilai prediksi dari y jika kita mengetahui nilai x adalah tertentu.
Selanjutnya residual dari observasi ke i dapat dihitung dengan cara
^ ^ ^ ^
u i = yi − y i = yi − β 0 − β 1 xi ……………………10)
Contoh 1.
Sebagai suatu ilustrasi cara kerja prinsip OLS berikut disajikan suatu contoh
yang diberikan oleh Wooldridge (2005). File CEOSAL1.RAW berisi data gaji
CEO dan berbagai variabel lainnya (misalnya ROE, Sales, dummy kategori
perusahaan, dsb) dengan jumlah observasi sebanyak 209. Disini kita akan
mencoba melihat regresi antara gaji CEO (diukur dalam satuan ribu USD)
terhadap Return On Equity (diukur dalam poin persentase). Dengan
menggunakan software EVIEWS ver. 5.10 dan menjalankan perintah: ls
salary c roe pada command window maka diperoleh output sbb:
5
Dependent Variable: SALARY
Method: Least Squares
Date: 05/06/08 Time: 07:54
Sample: 1 209
Included observations: 209
Dari kolom dengan header: coefficient, kita dapat menuliskan SRF bagi
regresi ini sebagai (dengan pembulatan)
^
Salary = 963,191 + 18,501ROE ……………………11)
a. Jika ROE=0, maka prediksi dari gaji CEO adalah 963,191 ribu USD.
b. Jika ROE naik 1 persen maka gaji CEO akan naik sebesar 18,501 ribu
USD (dan sebaliknya jika turun). Karena kita mengestimasi bentuk linier
maka perubahan ini tidak dipengaruhi oleh posisi awal gaji CEO.
c. Jika ROE=30% maka gaji CEO adalah 963,191 + 18,501(30) = 1518,221
(ribu USD).
6
Grafik 3. SRF dan PRF regresi Gaji CEO terhadap ROE
Sumber: Wooldridge (2005), hal 33.
− −
3. Titik rata-rata ( x, y) selalu berada pada garis regresi, dengan kata lain
_ ^ ^ _
yi = β 0 + β 1 x ……………………14)
7
Selanjutnya kita dapat memandang OLS sebagai mendekomposisi yi
kedalam 2 bagian, yakni fitted value dan suatu residual. Fitted value dan
residual tidak memiliki korelasi pada sampel. Untuk melihat hal ini dapat
merujuk pada terminology sebagai berikut:
n _
Sum Square Total (SST) = ∑ ( yi − y )2 ……………………15)
i =1
n ^ _
Sum Square Explained (SSE) = ∑ ( y i − y ) 2 ……………………16)
i =1
n
⎛ n 2⎞ ^
Sum Square Residual (SSR) = ∑ ( yi − y i ) ⎜ = ∑ ui ⎟ ………17) 2
i =1 ⎝ i =1 ⎠
Dapat ditunjukkan disini bahwa total variasi pada y adalah sama dengan
jumlah SSE dan SSR, atau
SSE SSR
R2 = = 1− ……………………21)
SST SST
Seperti yang dapat dilihat pada persamaan 21, koefisien determinasi
menunjukkan proporsi variasi variabel tergantung (y) yang dapat dijelaskan
oleh variasi variabel bebas (x). Nilai R2 selalu terletak antara 0 dan 1 karena
SSE dan SSR tidak mungkin melebihi nilai SST. R2 adalah suatu ukuran
kesuaian model (model fit).
8
Kembali pada contoh regresi gaji CEO dan ROE diatas (tabel 1), dapat
dilihat disini bahwa nilai R2 adalah 0.0131. Dengan kata lain variasi pada
variabel ROE menjelaskan 1.31% variasi pada gaji CEO.