Anda di halaman 1dari 16

Chapter 2

Two-Variable Regression Analysis:


Some Basic Ideas
A Hypothetical Example

ada 10 nilai rata-rata untuk 10 sub populasi Y. nilai rata-rata ini disebut sebagai nilai ekspektasi
bersyarat/kondisional (conditional expected values) , karena nilai tersebut bergantung pada nilai yang
diberikan dari variabel (pengkondisian) X. Secara simbolis,dinyatakan sebagai E(Y | X), yang dibaca
sebagai nilai yang diharapkan dari Y untuk setiap nilai X.
Titik-titik yang dilingkari gelap pada Figure 2.1 menunjukkan nilai rata-rata bersyarat Y terhadap berbagai nilai X.
Jika kita menggabungkan nilai rata-rata bersyarat ini, kita memperoleh apa yang dikenal sebagai garis regresi
populasi (PRL/population regression line), atau lebih umum, kurva regresi populasi/population regression
curve.
• secara geometris, kurva regresi populasi hanyalah sebuah titik tengah dari rerata kondisional variabel
terikat untuk nilai-nilai tetap dari variabel penjelas.
• atau kurva yang menghubungkan mean dari subpopulasi Y yang sesuai dengan nilai yang diberikan dari
regressor X.
• dengan pertimbangan kemudahan, diasumsikan bahwa nilai-nilai Y ini didistribusikan secara simetris di
sekitar nilai rata-rata (bersyarat) masing-masing. Dan garis regresi (atau kurva) lewat melalui nilai rata-rata
(bersyarat) ini.
The Concept of Population Regression Function (PRF)
• mean kondisional E(Y | Xi) adalah fungsi dari Xi, di mana Xi adalah nilai tertentu dari X.
Secara simbolis:

• equation 2.2.1 disebut conditional expectation function (CEF) or population regression function (PRF) or
population regression (PR)
• bentuk fungsional PRF merupakan pertanyaan empiris, meskipun dalam kasus-kasus tertentu teori dapat
menjelaskan . Misal, pengeluran konsumen berbanding lurus dengan pendapatan. sehingga hipotesisnya dapat
diasumsikan bahwa PRF E(Y | Xi) adalah fungsi linier dari Xi :

β1, β2 tidak diketahui, tp mrp parameter yg telah di tetapkan koefisien regresi


β1 : intercept
β2 : slope coefficients

• equation 2.2.1 dikenal sebagai linear population regression model = linear population
regression = regression = regression equation = regression model.
• kepentingan melakukan analisis regresi adalah untuk mengestimasi PRF seperti pada equation 2.2.2
yaitu mengestimasi nilai dari β1 dan β2yang tidak diketahui berdasarkan obervasi terhadap X dan Y.
The Meaning of the Term Linear
1. Linearity in the Variables
linier dalam variabel (X)
non linier dalam variabel (X)

2. Linearity in the Parameters


β bisa linier atau bisa juga tidak linier untuk variabel X-nya
Linier dalam parameter (β): Non-linier dalam parameter (β):
Istilah regresi "linier" akan selalu berarti regresi yang linier dalam
parameter-parametrnya: β-nya berpangkat satu (linier), X-nya
bisa linier bisa tidak linier
Stochastic Specification of PRF

• meningkatnya pendapatan keluarga, pengeluaran konsumsi keluarga secara rata-rata juga


meningkat.
• tetapi bagaimana dengan pengeluaran konsumsi keluarga secara individu dalam kaitannya
dengan tingkat pendapatan (tetap)?
• figure 2.1 bahwa, pada tingkat pendapatan tertentu (Xi) , pengeluaran konsumsi keluarga individu
terkelompokkan di sekitar konsumsi rata-rata semua keluarga pada tingkat Xi tersebut, yaitu di
sekitar ekspektasi kondisionalnya.
• Oleh karena itu, dapat dinyatakan deviasi dari Yi individu di sekitar nilai yang
diharapkan sebagai berikut:
ui = Yi - E(Y│Xi)
Yi = E(Y│Xi) + ui (2.4.1)
ui : penyimpangan, suatu variabel random yang dapat bernilai positif atau negatif.
ui : merupakan gangguan stokastik/stochastic disturbance or stochastic error term.

• Jika E(Y│Xi) diasumsikan linear dalam Xi, maka persamaan dapat ditulis sbb:
Yi = E(Y | Xi) + ui
= β1 + β2Xi + ui (2.4.2)

• Nilai yang diekspektasikan dari persamaan 2.4.1 di kedua sisi:


E(Yi | Xi) = E[E(Y | Xi)] + E(ui | Xi)
= E(Y | Xi) + E(ui | Xi) (2.4.4)

• Nilai harapan dari suatu konstanta adalah konstanta itu sendiri.


• Oleh karena E(Yi | Xi) sama dengan E(Y | Xi), persamaan (2.4.4) memiliki implikasi:
E(ui│Xi) = 0 (2.4.5)
Jadi, asumsi bahwa garis regresi melewati rata-rata
kondisional/bersyarat dari Y (figure 2.2) mengimplikasikan bahwa
nilai rata-rata bersyarat dari ui (yang konsisional terhadap X ttt)
adalah nol.
The Significance of the Stochastic Disturbance Term
• Istilah gangguan ui adalah pengganti untuk semua variabel yang dihilangkan
dari model tetapi secara kolektif mempengaruhi Y.
• Mengapa tidak? memperkenalkan variabel-variabel ini ke dalam model secara
eksplisit? mengapa tidak mengembangkan model regresi berganda dengan
variabel sebanyak mungkin?
Alasan:
1. Teori: kita tidak mengetahui variabel lain.
2. Ketidaktersediaan data
3. Variabel inti (core variable) dibanding dengan variabel pinggiran (peripheral
variable)
4. Keacakan intrinsik pada perilaku manusia
5. Variabel yang diproxy secara tidak tepat
6. Prinsip parsimoni, mengusahakan model sesederhana mungkin
7. bentuk fungsi yang salah (linier atau non linier)
The Sample Regression Function (SRF)
Dalam praktek yang dimiliki hanyalah nilai sampel Y yang berhubungan dengan beberapa nilai X
yang tetap.
• Populasi seperti pada tabel 2.1 tidak diketahui.
• informasi yang diketahui adalah sampel yang dipilih secara acak seperti tabel 2.4 atau tabel
2.5
• Analog dengan PRF/population regression line, yang mendasari
garis regresi populasi, kita dapat mengembangkan konsep fungsi regresi
sampel (SRF/sample regression function) untuk mewakili garis regresi sampel.

denotes the (sample) residual term

Anda mungkin juga menyukai