Anda di halaman 1dari 5

ANALISIS REGRESI DUA VARIABEL: BEBERAPA IDE MENDASAR

A. Konsep Fungsi Regresi Populasi

Setiap rerata kondisional E(Y|Xi) adalah sebuah fungsi linear dari Xi, merupakan nilai X
yang telah ditentukan secara simbolis.

E ( Y | Xi ) = F( Xi )

Dimana F (Xi) melambangkan beberapa fungsi dari penjelas X. dalam contoh yang kita
berikan E( Y | Xi ), adalah sebuah fungsi linear dari X i Persamaan (2.2.1) dikenal sebagai
fungsi espektasi kondisonal (conditional expectation function—CEF) atau lebih pendek
lagi dikenal sebagai FRP (fungsi regresi populasi—population regretion function). Fungsi
ini kurang lebih menyatakan bahwa nilai ekspektasi dari distrubusi Y dari Xi yang telah
ditetapkan, adalah fungsi yang berhubungan dengan Xi. Dalam terminology yang lebih
singkat lagi, fungsi tersebut menjelaskan bagaiman rerata atau rata-rata respons Y yang
bervariasi mengikuti X.

Pendekatan awal atau hipotesisnya adalah kita dapat mengasumsikan bahwa FRP E(Y|Xi)
adalah sebuah funsi linear Xi missal, dari tipe

E(Y|Xi) = β1+β2Xi

Dimana β1 dan β2 tidak diketahui, namun merupakan parameter yang telah ditetapkan
atau dikenal sebagai koefisien regresi β1 dan β2 juga dikenal sebagai intercept dan
koefisien kemiringan. Persamaan (2.2.1) sendiri dikenal sebagai fungsi regresi populasi
linear. Beberapa ungkapan alternative yang digunakan dalam literatur-literatur adalah
model regresi populasi linear atau hanya menyebutkan regresi populasi linear.
Berdasarkan urutan, istilah regresi, persamaan regresi memiliki arti yang sama ketika
digunakan.

B. Makna Istilah Linear

Oleh karena buku ini membahas lebih banyak mengenai model-model linear,seperti
Persamaan (2.2.2),maka sangatlah penting untuk mengetahui arti sebenarnya dari
terminologi linear sebab dapat diartikan dalam dua cara yang berbeda.
1. Linear dalam Variabel

Arti paling pertama dan mungkin yang paling “alamiah” dari linearitas adalah
ekspektasi kondisional Y adalah sebuah fungsi linear Xi,sebagai
contoh,Persamaan (2.2.2).6 Secara geometris,kurva regresi dalam kasus ini adalah
sebuah garis lurus.Dalam interprestasinya,sebuah fungsi regresi seperti E(Y│Xi )
= β1+β2Xi2,bukan merupakan fungsi linear karena variabel X muncul dengan
sebuah pangkat atau indeks 2.

2. Linearitas dalam Parameter


Interprestasi kedua dari linearitas adalah bahwa ekspektasi kondisional dari Y ,
E(Y │ Xi) adalah sebuah fungsi linear dari parameter-parameternya,β; bisa saja
linear atau bisa juga tidak linear untuk variabel X-nya.7 Dalam Interprestasi ini, E(
Y │ Xi) = β1+β2Xi2 adalah model regresi (dalam parameter) linear.Untuk
melihatnya lebih lanjut,misal : X bernilai 3.Oleh karena itu,E( Y│ X = 3 ) =
β1+9β2, yang jelas linear dalam parameter β1 dan β2.Semua model yang disajikan
dalam Figur 2.3 adalah model regresi linear (MRL),yaitu model linear dalam
parameter.
Dari kedua interprestasi mengenai linearitas,linearitas dalam parameter relevan
terhadap pembentukan teori regresi yang baru saja dibahas.Oleh karena itu,dari
sekarang terminologi regresi “linear” akan selalu berarti sebuah regresi yang
linear dalam parameter-parameternya; β-nya (yaitu parameternya) berpangkat satu
saja.Parameter untuk variabel penjelasnya,atau X-nya,bisa saja linear atau tidak
linear.Secara skematis,terdapat pada Tabel2.3 . Jadi, E(Y│X i) = β1 + β2Xi,yang
linear untuk keduanya,parameter dan variabel,atau MRL,dan juga E(Y│X i ) = β1
+ β2Xi2 , yang linear dalam parameter,namun tidak linear dalam variabel X.
Figur 2.3 Paramater linear dalam sebuah fungsi

C. Spesifikasi Stokastik dari FRP


Jelas terlihat dari Figur 2.1 bahwa pendapatan keluarga meningkat,maka pengeluaran
konsumsi keluarga secara rata-rata meningkat pula.Namun demikian,bagaimana dengan
pengeluaran konsumsi keluarga secara individual sehubungan dengan tingkat
pendapatannya (tertentu)? Jelas terlihat dari Tabel 2.1 dan Figur 2.1 bahwa pengeluaran
konsumsi keluarga secara individual tidak harus selalu meningkat seiring dengan
peningkatan tingkat pendapatan.Sebagai contoh,dari tabel 2.1,kita dapat melihat bahwa
sehubungan dengan tingkat pendapatan $100,ada satu keluarga yang pengeluaran
konsumsinya $65,lebih kecil dibandingkan dengan pengeluaran konsumsi dari dua
keluarga yang pendapatan mingguannya hanya $80.Akan tetapi,perhatikan bahwa
pengeluaran konsumsi rata-rata dari keluarga dengan pendapatan mingguan sebesar $100
lebih besar dibandingkan dengan pengeluaran konsumsi keluarga dengan pendapatan
mingguan sebesar $80 ($77 dibandingkan dengan $65).
Menyatakan deviasi dari seorang individu Y i, di sekitar nilai ekspektasinya adalah
sebagai berikut:
Ui = Yi – E(Y│Xi)
atau
Yi = E(Y│Xi) + ui
Di mana deviasi, ui, adalah sebuah variabel acak yang tidak dapat diamati dan dapat
mengambil nilai positif maupun negatif.atau,secara teknis, ui dikenal sebagai faktor
gangguan stokastik ( stochastic disturbance) atau faktor kesalahan stokastik
( stochastic error term ).
Komponen ini juga dikenal sebagai komponen yang sistematik atau deterministik,dan,
(2) ui yang merupakan komponen acak atau nonsistematik.Kita mesti mencoba
menganalisis secara cepat sifat dari faktor gangguan stokastik,namun untuk saat ini kita
mengasumsikan bahwa hal tersebut adalah pengganti atau proksi terhadap variabel yang
dihilangkan atau diabaikan yang dapat saja memengaruhi Y , tetapi tidak (atau tidak
dapat) dimasukkan dalam model regresi.
Jika E(Y│Xi) diasumsikan linear dalam Xi, seperti yang ditunjukkan dalam Persamaan
(2.2.2), Persamaan (2.4.1) dapat juga dituliskan sebagai
Yi = E(Y│Xi) + ui
= β1 + β2Xi + ui

D. Signifikansi Faktor Gangguan Stokastik


Seperti yang telah dibahas pada Subbab 2.4, faktor gangguan u i,merupakan pengganti
dari semua variabel yang telah dihilangkan dari model,namun secara kolektif
memengaruhi Y. Pertanyaannya yang jelas adalah: Mengapa tidak mengenalkan variabel-
variabel tersebut ke dalam model secara eksplisit? Atau,jika dibalik,mengapa tidak
mengembangkan model regresi majemuk saja dengan variabel sebanyak mungkin? Ada
banyak alasan yang mendasarinya.
1. Kerancuan teori
2. Ketidaktersediaan data
3. Variabel inti (core variable)
4. Keacakan intrinsik pada perilaku manusia
5. Variabel yang diproksi secara tidak tepat
6. Prinsip parsimoni
7. Bentuk fungsi yang salah
Untuk semua alasan ini,gangguan stokastik ui memiliki peran yang penting dalam
analisis regresi

E. Fungsi Regresi Sampel


Dengan menegaskan kembali pembahasan kita,bahwa selama ini kita telah membahas
mengenai nilai Y yang berhubungan dengan sebuah nilai tetap X, kita telah secara terang-
terangan menghindari pemikiran dalam pengumpulan sampel (perhatikan bahwa data
dalam tabel 2.1 merepresentasikan populasi bukan sampel).Namun demikian,sudah
saatnya bagi kita untuk menghadapi permasalahan dalam sampling,untuk beberapa kasus
praktik yang kita miliki hanyalah nilai sampel Y yang berhubungan dengan beberapa
nilai X yang tetap.Oleh karena itu,tugas kita sekarang adalah mengestimasikan FRP
berdasarkan informasi sampel.
Sekarang, analog dengan FRP yang mendasari garis regresi populasi,kita dapat
mengembangkan konsep FRS (Fungsi regresi sampel-sample regression function)
untuk merepresentasikan garis regresi sampel.Penulisan sebaliknya dari Persamaan
(2.2.2) untuk sampel adalah:
Ŷi = β1 + β2Xi (2.6.1)

Figur 2.4
Di mana Ŷ dibaca sebagai “Y-topi” atau “Y-cap”
Ŷ = merupakan pengestimasi dari E(Y│Xi)
β1 = merupakan pengestimasi dari β1.
β2 = merupakan pengestimasi dari β2.
Kini,seperti bagaimana kita mengekspresikan FRP dalam bentuk yang
mirip.Persamaan (2.2.2) dan (2.4.2), kita dapat mengekspresikan FRS pada Persamaan
(2.6.1) dalam bentuk stokasinya sebagai berikut:
Ŷi = β1 + β2Xi +ûi

Anda mungkin juga menyukai