Disusun oleh :
Cut Anly Tritama
1305102010057
Fajriani
1305102010040
Friska Utari
1305102010024
Rahmatun Fauza
1305102010051
Risha Muliana
1305102010036
BAB I
PENDAHULUAN
Regresi merupakan suatu alat ukur yang juga dapat digunakan untuk
mengukur ada atau tidaknya korelasi antarvariabel. Jika kita memiliki dua buah
variabel atau lebih maka sudah selayaknya apabila kita ingin mempelajari
bagaimana variabel-variabel itu berhubungan atau dapat diramalkan.
Analisis regersi berguna untuk mendapatkan hubungan fungsional antara dua
variabel atau lebih. Selain itu analisis regersi berguna untuk mendapatkan pengaruh
antar variabel prediktor terhadap variabel kriteriumnya atau meramalkan pengaruh
variabel prediktor terhadap variabel kriteriumnya.
Analisis regresi mempelajari hubungan yang diperoleh dinyatakan dalam
persamaan matematika yang menyatakan hubungan fungsional antara variabelvariabel. Hubungan fungsional antara satu variabel prediktor dengan satu variabel
kriterium disebut analisis regresi sederhana (tunggal), sedangkan hubungan
fungsional yang lebih dari satu variabel disebut analisis regresi ganda.
Istilah regresi (ramalan/taksiran) pertama kali diperkenalkan oleh Sir Francis
Galton pada tahun 1877 sehubungan dengan penelitiannya terhadap tinggi manusia,
yaitu antara tinggi anak dan tinggi orang tuanya. Pada penelitiannya Galton
mendapatkan bahwa tinggi anak dari orang tua yang tinggi cenderung meningkat
atau menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan
tersebut disebut garis regresi.
Analisis regresi linier sederhana adalah hubungan secara linear antara satu
variabel independen (X) dengan variabel dependen (Y). Analisis ini untuk
mengetahui arah hubungan antara variabel independen dengan variabel dependen
apakah positif atau negatif dan untuk memprediksi nilai dari variabel dependen
apabila nilai variabel independen mengalami kenaikan atau penurunan.. Data yang
digunakan biasanya berskala interval atau rasio.
Rumus regresi linear sederhana sebagi berikut:
Y = a + bX
Keterangan:
Y = Variabel dependen (nilai yang diprediksikan)
X = Variabel independen
a = Konstanta (nilai Y apabila X = 0)
b = Koefisien regresi (nilai peningkatan ataupun penurunan)
BAB II
PEMBAHASAN
Dalam bab ini akan dibahas suatu model regresi linier yang sederhana, yaitu
hubungan antara dua buah variabel yang dinyatakan dalam suatu bentuk fungsi
linier. Terlebih dahulu akan dibahas dua bentuk hubungan yang penting; Stokastik
dan Nir-skokastik, yang akan digunakan dalam metode-metode ekonometri.
2.1. Hubungan Stokastik dan Nir-stokastik
Hubungan antara X dan Y yang berbentuk Y = f(x) dikatakan deterministik
pasti atau nir-stokastik, jika setiap nilai variabel bebas (X) terdapat satu nilai
variabel terikat (Y). Suatu hubungan antara X dan Y dikatakan stokastik, jika suatu
nilai X tertentu terdapat distribusi probabilitas menyeluruh dari nilai Y. Dengan
demikian, dalam kasus stokastik ini, setiap nilai X tertentu, variabel terikat (Y) dapat
memiliki beberapa nilai dengan probabilitas yang tertentu.
Contoh : Permintaan akan suatu barang tertentu, diasumsikan, tergantung pada
harga barang itu saja, dan bentuk fungsinya adalah linier.
q = f(p) = +
= 25 dan
= -2,
q = 25 - 2p + U
Hubungan q = 25 - 2p + U adalah hubungan stokastik karena terdapat variabel
gangguan (U). Dalam hubungan stokastik, nilai variabel bebas (p) yang berbedabeda menimbulkan distribusi probabilitas variabel terikat (q) yang berbeda-beda
pula. Dalam teori ekonomi, semua hubungan dinyatakan dalam bentuk nir-stokastik,
tetapi hal ini tidak sesuai dengan kenyataannya, karena hubungan-hubungan
ekonomi yang nir-stokastik memang tidak pernah ada.
2.2. Model Regresi Linier Sederhana
Bentuk paling sederhana dari hubungan stokastik antara dua variabel X dan Y
disebut model regresi linier.
Yi = + Xi + Ui
( i = 1, ....., n)
Adapun dan adalah parameter-parameter regresi. Subskrip i menunjukkan
pengamatan yang ke-i. Parameter dan ditaksir atas dasar data yang tersedia
untuk variabel X dan Y. Sifat stokastik dari model regresi mengandung arti bahwa
setiap niai X terdapat suatu distribusi probabilitas seluruh nilai Y. Dengan kata lain,
nilai Y tidak dapat diprediksikan secara pasti. Ketidakpastian mengenai nilai Y ini
timbul, karena faktor stokastik U yang memberi sifat random pada Y.
Dengan mengabaikan (untuk sementara) bahwa teori tersebut mungkin tidak
benar, alasan penyisipan faktor U tersebut adalah :
a) Karena kesalahan dalam persamaan.
b) Karena kesalahan dalam pengukuran (Kesalahan dalam variabel).
c) Karena ketidaksempurnaan spesifikasi bentuk matematis model.
d) Karena agregasi.
Jadi, dalam pembuatan model semaksimal mngkin memasukkan variabelvariabel penjelas ke dalam model, sebagai variable-variabel yang terpisah, sedangkan
(i = 1,...., n).
ini
dikenal
adalah konstan).
sebagai
asumsi
homoskedastisitas
(homoscedasticity).
Asumsi 4. Faktor gangguan dari pengamatan yang berbeda-beda (Ui, Uj) tidak
tergantung (independent).
E[Ui, Uj] = 0
Asumsi
ini
dikenal
(i j)
sebagai
asumsi
nir-otokorelasi
(nonautocorrelation).
Asumsi 5. Variabel-variabel penjelas/bebas adalah variabel nir-stokastik dan
diukur
tanpa
kesalahan;
Ui
tidak
tergantung
pada
variabel
penjelas/bebas.
E[XiUi] = Xi E[Uj] = 0,
dan
ei2 = ( Yi ( + Xi)2
= 0
= 0
atau
Yi = n + Xi
XiYi = Xi + Xi
Penaksiran suatu fungsi yang intercept-nya nol
Jika ingin diestimasi garis Y = + X + U dengan syarat = 0. Metode
Lagrange
meminimumkan:
Yi
( X i) 2
n
n
2
e i =
i=1
i=1
dengan syarat : = 0
dimana fungsi gabungannya menjadi : Z = (Yi - + Xi)2 , dimana adalah
pengganda Lagrange (Lagrange multiplier).
2.4. Sifat-sifat Penaksir Kuadrat Terkecil
(a). Linier (Linearity)
Contoh :
= (Xi - X) (Yi- Y)
(Xi - X)2
= Yi(Xi - X) - Y (Xi- X)
(Xi - X)2
sehingga :
= Yi Xi
Xi2
(b). Unbiasedness
Contoh :
= kiYi
= ki ( + Xi + Ui )
= ki + kiXi + kiUi
maka:
kiXi = ki (Xi + X) = Xi2 = 1
Xi2
(c). Varian Minimum dari dan
Harus dibuktikan dan memiliki carian sampel terkecil dibandingkan
dengan penaksir-penaksir linier tidak bias lainnya. Untuk itu, pertama-tama akan
dicari varian dan kemudian dibuktikan bahwa varianya minimum.
Adapun untuk membuktikan bahwa memiliki varian minimum, perlu
dibandingkan dengan varian dengan varian beberapa penaksir (katakanlah *)
yang tidak bias.
Misalkan: * = wiYi ; dimana konstanta wi ki, tetapi wi = ki + ci
sehingga :
* = wi ( + Xi + Ui )
= wi ( + wi Xi + wi Ui )
dan
= wi + wi Xi
{karena E[Ui] = 0}
Sifat
perhitungan
(b). Unbiasedness
ini
dibutuhkan
untuk
memudahkan
dalam penaksiran.
parameter
(c). Best
b.) Untuk membuktikan sifat-sifat BLU tidak perlu dibuat asumsi bentuk spesifik
dari distribusi faktor-faktor gangguan. Kenyataannya asumsi normalitas dari
U tidak diperlukan untuk membuktikan dan sebagai BLUE (Best Linier
Unbiased Estimator).
2.6. Distribusi Sampel Penaksir Kuadrat Terkecil
Karena penaksir-penaksir kuadrat terkecil merupakan kombinasi linier
variabel-variabel normal Y1, Y2, Y3, ...... Yn tidak saling tergantung, maka dan juga
berdistribusi normal, dengan sifat-sifat sebagai berikut :
(i)
(ii)
dan
Z =
1
xi
xi
n xi
2
dimana Z ~ N(0,1)
adalah varian dari faktor gangguan yang tak teramati dan yang tiak diketahui.
Jika penaksir yang tidak bias dari
n2
n xi
Z=
ei
2
( n2 ) 2
2
sehingga
n xi
t =
n xi
t =
. n2
n n2
diperoleh formula untuk pengujian yang hanya tergantung pada pengamatanpengamatan sampel dan nilai hipotesis dari .
Dengan menyusun kembali persamaan diatas, diperoleh :
xi
=t .
n x i
t0,025 .
xi
n x i
( )
Z=
t=
t=
( ) n xi
Jadi: (
xi
i2
( ) n xi
dan
n2 . 2
n n2
. n2
=t
xi
Variabel t yang diperoleh dari (5.23) dan (5.24) penting artinya dalam uji
hipotesis yang berkaitan dengan parameter regresi. Salah satu hipotesis yang
menarik adalah hipotesis tentang tidak adanya hubungan antara variabel bebas X
dan variabel terikat Y dalam model regresi: Y = + X. Dengan kata lain, garis
regresi populasi berupa garis horizontal. Dengan demikian, hipotesis nol mengenai
tidak adanya hubungan antara X dan Y adalah:
H0 : = 0
dan hipotesis alternatifnya,
Ha : 0
Untuk menguji H0 terhadap Ha, statistik-t sudah ditentukan pada (5.23) dan
(5.24) dapat dipergunakan, disertai penentuan daerah penerimaan dan daerah
kritisnya.
Untuk pengujian dua sisi dengan tingkat signifikasi 5% dan derajat bebas (n-2),
daerah penerimaannya ditentukan dengan:
t
0,025.SE
( ^)
^
+
t
0,025.SE
( ^)
b). ei2
R2 =
R2 = 0,934
(4,39) (0,347)
2.10. Aplikasi (Penerapan)
Contoh 1:
Tentukan hasil-hasil regresi dari data 20 pasang pengamatan atas X (variabel
bebas) dan Y (variabel terikat) berikut ini :
Xi = 228, Xi = 3121, XiYi = 38927, Xi2 = 3204,
xiyi = 3347,60, xi2 = 604,80, dan yi = 19837.
Jawaban:
(i)
Penaksiran ^
dan
X = 11,4
Xi = 3121; n = 20; seningga Y = 156,05
^ 347,6
Dari (5.5) diperoleh = 604,8 = 5,54
Xi = 228; n = 20; sehingga
= 92,95 + 5,54 Xi
(ii)
Panaksiran varian
Dari (5.12) dan (5.13), diperoleh:
X 2i
^
^
2 (
Var (
) = X 2 ) dan Var ( )
i
2
X 2i
penaksir yang tidak bias bagi varian faktor gangguan ke dalam persamaan
diatas, sehingga:
Var ( ^ ) =
Dimana,
e2i
n2
yi ^ X i
n2
2
2 X 2i
n X 2i
1274,72
18
^
dan Var (
2
X 2i
19837(5,54)2(604,8)
202
= 70,82
Sehingga:
3204
[
]
^
Var (
) = 70,82 ( 20 ) (604,8) = 19,25
SE( ^ ) = 4,38
dan
70,82
^
Var ( ) = 604,8 = 0,117
(iii)
^
SE ( ) = 0,34
dan:
(iv)
Pengujian Hipotesis
Diketahui
H0 : = 0
dan
Ha : 0
t
0,025[SE
( ^) ]
^ +
t
0,025[SE
( ^) ]
Atau:
^
SE( ^ )
t
0,025
^
SE( ^ ) + t0,025
5,54
0,34
16,29;
t
0,025(n-18)
= 2,101
Oleh karena nilai 16,29 terletak di luar daerah permintaan, maka hipotesis yang
menyatakan tidak ada hubungan anatara X dan Y, yakni H0, ditolak.