Anda di halaman 1dari 61

EKONOMETRIKA

Marlina Ekawaty
TIU: mhs memahami konsep, pendekatan,
metodologi ekonometrika & mampu
menerapkannya scr praktis.
Pokok Bahasan Sub Bahasan Sumb
ke er

1 Pendahuluan - Pengertian & definisi G-1


- Metodologi Ekonometrika
- Tujuan Ekonometrika
2 Analisis Korelasi & Regresi Ragam bentuk analisis: G-1
- Korelasi
- Regresi
3 Model regresi linear klasik MRLK: - Estimasi titik dengan G-2
(MRLK): dua variabel OLS
- Uji statistik
- Asumsi klasik
4 - Estimasi interval G-5
- Uji hipotesis estimasi interval
- Analisis regresi & Anova
5 Analisis regresi berganda MRLK: - Estimasi titik dengan G-7
6 Analisis regresi berganda - Uji kesamaan dua koefisien G-8
regresi
- Uji estimasi regresi dg
kendala
- Uji stabilitas koefisien
7 Normalitas & Multikolinearitas Konsep & uji: - normalitas G-10
-
multikolinearitas
Solusi kasus multikolinearitas
9 Homoskedastisitas Pengertian, pengujian & solusi G-11
1 Bentuk model regresi/ Pengertian & pengujian G-11
0 linearitas
1 Otokorelasi Pengertian, pengujian & solusi G-12
1
1 Regresi dg v. bebas dummy Pengertian v. dummy, regresi G-15
2 Anova
1 Regresi dg v. tergantung LPM, model logistik, model G-16
3 dummy probit
1 Metodologi ekonometrika - Average Economic Regression G-13
4 tradisional (AER)
- Kesalahan spesifikasi: jenis,
akibat & pengujian
Daftar Pustaka:
Gujarati, Damodar N. (2009). Basic Econometrics. 5th
ed. McGraw-Hill International Edition.
Singapura. (G)
PENDAHULUAN
What is econometrics?
Etimologi economic measurement
Pendapat Econometrics may be defined as the quantitative
Ahli analysis of actual economic phenomena based on the
concurrent development of theory and observation,
related by appropriate methods of inference
Econometrics may be defined as the social science in
which the tools of economic theory, mathematics &
statistical inference are applied to the analysis of
economic phenomena
Why a separate discipline?
Teori ekonomi pernyataan kualitatif
Matematika ekonomi pernyataan TE dlm bentuk
matematis
Statistik ekonomi pengumpulan, pengolahan,
penyajian data
Methodology of
Keynes: Ketika pendapatan naik, mk
Econometrics
Statement of Theory
or Hypothesis konsumsi akan naik tp tidak sebesar
kenaikan pendapatan
Specf of the
mathemati- cal Y=+X, 0<<1,
model of theory Y=pengeluaran konsumsi, X=pendapatan
Specf of the
economet- ric Y=+X+ ,
model of theory =disturbance/error term
Menentukan Definisi
Obtaining the data operasional X, Y
Mengumpulkan data X, Y
Estimation of
parameter of the Mendapatkan nilai ,
econometric mdl =-231,8+0,7194X

Hypothesis testing Ho : <1

Forecasting or Pada saat X=6000 Y=?


prediction =-231,8+0,7194(6000) =
4084,6
Using the model for =4000 X=?
control or policy 4000=-231,8+0,7194X
purpose X=5882
Econometrics

Types ofTheoritical
econometrics
Applied

Classica
Classical Bayesian Bayesian
l

Theoritical Ecm. pengembangan metode tepat unt mengukur hubungan2


ekonomi yg ditentukan ol model ekonometrik, misal: least squares,
maximum likehood menguraikan asumsi, sifat, & akibat jk asumsi
tidak dipenuhi.

Applied Ecm. menggunakan alat dr ekm teori unt mempelajari beb


bidang khusus ek & bisnis spt fungsi produksi, investasi, permintaan,
penawaran & portofolio

Program statistik ET, Limdep, Shazam, Micro TSP, Minitap, Eviews, SAS,
SPSS, Stata, Microfit, PcGive
REGRESI: Studi ketergantungan satu var. (v.
tergantung, Y) pd 1 var. lain (v. bebas, X)
dg maksud menaksir & at meramal kan nilai
rata2 populasi
Ketergantungan statistik (pd var.Yrandom/stokhastik:
jk nilai X diketahui atau
v. yg tetap
memp. Distribusi probabilitas) bukan
fungsional/deterministik (F=k[m1.m2/r], E=mc).
Tidak berarti hubungan
X sebab akibat Y
Contoh: Umum Tinggi ayah Tinggi anak lelaki
Umur Tinggi anak
Ekonomi Pendapatan disposible Konsumsi
Harga Jumlah permintaan
Upah Tk pengangguran
IHSaham Harga saham A
Biaya iklan Jumlah permintaan
Curah hujan, suhu, cahaya Hasil panen
matahari
Regresi Korelasi
Tujuan Menaksir nilai rata2 populasi Y mengukur tk hubungan linier
utama 2 var
Sifat Ketergantungan (ada X, Y) Ketidaktergantungan
analisis
Perlakuan Asimetri: X nilainya Simetri: kedua var. random
Istilah & Notasi
X Y
Dependent V. (v bebas) Independent V. (v tidak
bebas/tergantung)
Explanatory V. (v yg Explained V. (v yg dijelaskan)
menjelaskan)
Predictor (peramal) Predictand (yg diramalkan)
Regressor (yg meregresi) Regressand (yg diregresi)
Stimulus/Control V. (v Response (tanggapan)
kendali)
Exogenous (eksogenus) Endogenous (endogenus)
Covariate Outcome
Control V. (v yg mengontrol) Controlled V. (v yg dikontrol)
Regresi Sederhana (simple/two-variable reg.): regresi dg 1 var
bebas
Regresi
X 1 , X 2 , X 3 ...Berganda
Xk (multiple reg.): regresi dg 1 var bebas
Random= stokhastik, v yg dapat mengambil nilai berapapun dg
Xi probabilitas tertentu Xt
Sifat & Sumber Data
Jenis Data: time series, cross section & pooled data
Time series Data Cross Section Pooled Data
Data
Data var. dr 1 objek pd Data var. dr >1 Data var. dr >1 objek pd
> 1 waktu (tahunan, objek pd 1 waktu >1 waktu
bulanan, mingguan,
harian, 3bulanan)
Dinotasikan dg t Dinotasikan dg i Dinotasikan dg it
Tahunan: GDP, M, I, Data
Contoh data: panel/longitudinal/mikropa
nel: objek
Sumber data: instansi pemerintah (BPS), data cross
lembaga
section yg sama disurvei
internasional (IMF, World Bank), swasta, perorangan.
slm beb periode
Melalui internet: http://www.portal.euromonitor.com ,
http://www.bps.go.id , http://www.lipi.go.id ,
http://www.ceicdata.com ,
http://www.go-indonesia.com/pdbi /,
http://www.cides.or.id/ ,
Skala data: nominal, ordinal, interval, rasio
TWO-VARIABLES REGRESSION
ANALYSIS: SOME BASIC IDEAS
8 10 12 14 16 18 20 22 24 26
0 0 0 0 0 0 0 0 0 0
5 65 79 80 10 11 12 13 13 15
5 70 84 93 2 0 0 5 7 0
6 74 90 95 10 11 13 13 14 15
0 80 94 10 7 5 6 7 5 2
6 85 98 3 11 12 14 14 15 17
5 88 10 0 0 0 0 5 5
7 8 11 13 14 15 16 17
0 11 6 0 4 2 5 8
7 3 11 13 14 15 17 18
5 11 8 5 5 7 5 0
5 12 14 16 18 18
5 0 0 9 5
16 19
2 1

6 77 89 10 11 12 13 14 16 17
5 1 3 5 7 9 1 3
X= pendapatan mingguan (80, 100, , 260)
Y= pengeluaran konsumsi mgan (55, 60,191)

N=60 , =7272/60=121.20

65, 77, , 191 = Conditional means of Y =


POPULATION REGRESSION
FUNCTION
E(Y/Xi) = f(Xi) PRF
E(Y/Xi)=E(Y/Xi)+E(U/Xi)
E(Y/Xi)=+Xi PRF linear E(U/Xi)=0, selain pendapatan ada var.
=intersep, =koefisien lain yg mempengaruhi pengeluaran
(regresi, persamaan/model regresi) konsumsi. Pengeluaran konsumsi ind
Linear dlm parameter, bukan dlm var. tidak dpt sepenuhnya dijelask hanya
dg var. dlm model regresi
Saat X , , apakah Y ind juga ? Tidak Why ada Ui:
selalu, tp berada di sekitar - Teori mungkin tidak lengkap
- Tidak ada data X yg lain
Yi=E(Y/Xi) + Ui, Ui=Stokhastic
disturbance/error term - Pengaruh X yg lain kecil & tidak
sistematis
Yi=+Xi+Ui - Ada kerandoman Y yg tdk terjelaskan
X=80 Y1=55=+(80)+U1, U1=-10 - Model regresi cukup memasukkan X
Y2=60=+(80)+U2, U2= -5 yg relevan (sederhana Occam)
Y3=65=+(80)+U3, U3= 0
Y4=70=+(80)+U4, U4=5 Bagaimana jk data yg dimiliki ad sampel
Y5=75=+(80)+U5, U5=10 bukan populasi? Kita perlu menaksir PRF
dg data sampel.
SAMPLE REGRESSION
FUNCTION
X
Y
Sampel-1 Sampel-2
80 70 55
100 65 88
120 90 90
140 95 80
160 110 118
180 115 120
200 120 145
220 140 135
240 155 145
260 150 175
Garis hitam merah
regresi

i=a+bXi+ei SRF
i= penaksir E(Y/Xi)
a = penaksir
b = penaksir
e = penaksir U
lanjutan:
Y SRF:
SRF ad pendekatan dr PRF,
i=a+bXi adakah suatu metode untuk
.Yi membuat pendekatan itu
ei
Ui . i PRF:
sedekat mungkin?
E(Y/X)=+Xi

A
. E(Y/Xi)
Bagaimana SRF harus disusun
shg a sedekat mungkin dg
X
sebenarnya & b sedekat
Xi mungkin dg sebenarnya?
Titik2 di kanan A, SRF overestimate
PRF yg sebenarnya. Titik2 di kiri A,
SRF underestimate PRF yg
sebenarnya. Hal ini tdk bisa
dihindari krn fluktuasi sampling.
2 VARIABLE REGRESSION MODEL:
The Problem of Estimation
Bagaimana mengestimasi PRF berda Prinsip kuadrat terkecil memilih a
sarkan SRF setepat mungkin? & b sedemk rupa shg unt sampel
Ada beberapa metode al: OLS, ML ttt ei sekecil mungkin. Dg ini
didapat:
( Xi X )(Yi Y ) xi yi
The Method of Ordinary Least b
( Xi X ) 2 xi2
Square
X i2 Y X i X iYi
Dikemukakan ol Carl Friedrich a Y bX
N X i2 ( X i ) 2
Gauss
PRF: Yi=+Xi+Ui Penaksir yg didapat ad least
SRF: Yi=a+bXi+ei=i+ei squares estimators, cirinya:
ei=Yi-i=Yi-a-bXi - Penaksir dinyatakan dlm besaran
sampel
ei=(Yi-i) bisa kecil at bahkan 0
- Merp point estimator (dg sampel ttt,
padahal sebenarnya ada residual tiap penaksir memberikan hanya 1
ei=(Yi-i)=(Yi-a-bXi) least nilai/titik tunggal parameter populasi
squared residual yg relevan)
ei=f(a,b) jumlah residual - Sekali penaksir OLS didpt dr data
sampel, mk garis regresi sampel dg
kuadrat ad fungsi dr a dan b
mudah didapat.
lanjutan:
Sifat garis regresi tsb ad: 3. Rata2 nilai pengganggu Ui ad 0
a. Garis regresi mell rata2 Y dan X E(Ui)=0
sampel 4. Varians Ui ad konstan
b. Nilai rata2 Y yg ditaksir sama dg nilai (homoskedastis) var(Ui)=
rata2 Y yg sebenarnya 5. Tidak terjadi otokorelasi antar
c. Nilai rata2 residual ei ad 0 kesalahan pengganggu cov(Ui,
d. Residual ei tidak berkorelasi dg Yi yg Uj)=0
ditaksir 6. Jumlah pengamatan n > k,
e. Residual ei tidak berkorelasi dg Xi k=jumlah parameter yg ditaksir
7. X tidak boleh semua sama dlm
The Classical Linear Regression sample ttt
Model: Asumsi Metode var(b)
2



2 2

2
ei y i b xi2
, Kuadrat
se(b) Penaksir 2

Ketepatan xi2 N 2 N 2
xi
2
Kuadrat Terkecil Terkecil
1. Model regresi linear X i2 2 X i2 2
var(a ) se(a)
linear dlm parameter tidak harus linear N xi2 N xi2
dlm variabel.
2. Nilai X tetap at bebas dr kesalahan
pengganggu (dlm sample yg
berulang)
X=80 Y=55, 60, 65, 70, 75 = varians dr Ui yg konstan
lanjutan:
Sifat Estimastor Least Squares Contoh:
1. Linear(fungsi linear dr var. 1.Hubungan Konsumsi-Pendapatan
random) di AS tahun 1960-2005
2. Unbiased [E(b)=] Yt 299.5913 0.7218 X t , 2 73,56689
3. Minimum Variance (827,4195) (0,0000195)
(28,7649) (0,004423)
2 & 3 efficient estimator r=0,9983
Koefisien Determinasi (r) 2.Pengeluaran Makanan di ,6913
India
FEi 94,2087 0,4368TEi , 2 4469
Suatu ukuran kebaikan suai
(goodness of fit) garis regresi (2560,9401) (0,0061)
Rumusnya adalah:2 (Yi Yi ) 2 ESS (50,8563) (0,0783) r=0,3698
r
(Yi Yi ) 2 TSS
ESS=explained sum of squares
TSS=total sum of squares
Mengukur persentase total
variasi Y yg dapat dijelaskan ol
model regresi
- Non negatif
- 0r1
Contoh:
Xi Yi Xi.Yi xi yi xi.y Xi xi yi i ei=Y- ei
i
80 70 5600 - - 3690 3600 8100 4900 65,18 4,82 23,21
90 41
10 65 6500 - - 3220 1000 4900 4225 75,36 -10,36 107,4
0 70 46 0 0
12 90 10800 - - 1050 1440 2500 8100 85,55 4,45 19,84
0 50 21 0
14 95 13300 - - 450 1960 900 9025 95,73 -0,73 0,53
0 30 16 0
16 11 17600 - -1 10 2560 100 1210 105,9 4,09 16,74
0 0 10 0 0 1
18 11 20700 10 4 40 3240 100 1322 116,0 -1,09 1,19
0 5 0 5 9
20 12 24000 30 9 270 4000 900 1440 126,2 -6,27 39,35
0 0 0 0 7
Estimasi
22 14model
30800regresi:
50 29 1450 4840 2500 1960 136,4 3,54 12,57
b
0xi yi
0 0,5091
16800 337,27
2 42,16
0 0 5
x 33000
24
2
i
15 37200 10 2
70 44 3080 5760 4900 2402 146,6 8,36 69,95
a 1110 0,5091 132100 337,27
5(170) 24,454 r
2
0,9974 0 5 4
132100
SIMPLE REGRESSION: INTERVAL
ESTIMATION &
Interval Estimation: Some Basic HYPOTHESISI
- Tidak berarti bh probabilitas
Idea terletak dlm batas2 tsb ad (1-)%, tp
b=0,5091 ad estimasi titik dr TESTING
probabilitas me-nyusun suatu
bisakah estimasi ini dipercaya? interval yg berisi ad (1-)%
walau dlm penyampelan berulang - Merp interval random, interval
nilai rata2nya diharapkan sama dg sangat be-ragam dr satu sampel ke
nilai sebenar nya, krn fluktuasi sampel lain krn berdasar pd b yg
sampling suatu estimasi bisa random pernyataan probabilitas
berbeda dr nilai yg sebenarnya. harus difahami dlm arti jangka
Dlm statistik, realibility dpt diukur panjang (dlm penyampelan berulang)
dr Se-nya bs dibuat interval di Confidence Interval for dan
sekitar estimasi titik 2 at 3 Se dg Interval keyakinan
probabilitas 95% nilai parameter yg
b (b ) xi b (b ) x
2 2
i
benar est. interval Z t
Se(b) Se(b)
Pr(b-b+)=1-
1-= tk kepercayaan/keyakinan
= tk signifikansi
b-= batas kepercayaan bawah mengikuti distribusi t dg df=N-2
interval keyakinan unt adalah:
b+ = batas kepercayaan atas
lanjutan:
Interval keyakinan untuk adalah: Interval Keyakinan untuk

Pr t t t 1 adalah:
2
2
( N 2)

2

2 2

b Pr 12 2 2 1
Pr t t 1 2 2

2 Se(b) 2
2 2

Pr b t .Se(b) b t .Se(b) 1

2
2
2
Pr ( N 2) 2 ( N 2) 2

2

1
2
1


Dg b=0,5091 , Se(b)=0,0357 , df=8
dan diasumsikan =5% , 1-=95% ,
t untuk 2
=2,306 interval keyakinan2 mengikuti distribusi dg df=N-2
adalah: Dg 0,025=42,1591
2
17,5346 dan
0, 975 2
2
,1797
df=8,
0,4268 0,5914 dlm jk =5% tabel
panjang 95 dari 100 kejadian interval dan (proba-bilitas
(0,4268 , 0,5914) akan berisi yg nilai melebihi 17,5346 ad
sebenarnya bukan proba-bilitasnya
2,5% dan probabilitas melebihi
95% bh interval 0,4268 0,5914
berisi yg sebenarnya.
2,1797 ad 97,5%
Interval keyakinan untuk adalah: Interval keyakinan untuk
9,6643 39,2545
adalah:
19,2310 154,7038
Pengujian Hipotesis
Prosedurnya:
b=0,5091 yg diperoleh dr data
- mendapatkan interval keyakinan
sampel, apakah konsisten dg hipotesa
=1 ? yg sesuai
Hipotesis yg dinyatakan hipotesis - Menguji apakah nilai dlm Ho
nol (Ho), diuji dg hipotesis alternatif terletak di dalam atau di luar
(H1) interval
H1 bisa 1
H 1 :sederhana atau gabungan Contoh: interval keyakinan
H1 : 1
Pr(0,4268 0,5914)=95%
Pendekatan uji hipotesis: confidence Karena Ho terletak di luar
interval dan test of sigificance interval keya-kinan mk Ho ditolak.
penak-sir mempunyai suatu distribusi Probabilitas nilai =0,3 kurang
probabi-litas (t, F atau ) & membuat dari 2,5%
pernyataan ttg nilai parameter
distribusi tsb
Pendekatan Uji Signifikansi
Pendekatan Interval Keyakinan Hasil sampel digunakan unt
b (b ) atxi kepalsuan
2
H 0 : 0,3 menguji
Misal: hip sederhana t kebenaran
H1 : 0,3 Se (b )
Ho menguji penaksir & distribusi
hip gabungan
sampling statistik
b * dlm Ho
Apakah b yg didapat sesuai dg Ho ? Pr t t 1
2
Se(b) 2


Pr * t .Se(b) * t .Se(b) 1
2 2
lanjutan:
b=0,5091 , Se(b)=0,0357 , df=8 ,
Hipotesis satu sisi H : 0,3
t
=5% H 0 : 0,3 1
2
=2,306 misalnya:
H 1 : 0,3
maka diperoleh: 95%
(2-tail/sided) Daerah Penerimaan DK
Pr[0,2177 0,3823)=95%
t 0,3664
95%
95% DK=Daerah
Kritis (2,5%) Daerah
Daerah Penerimaan DK
Penerimaan
DK DK 1,860
-2,306 2,306
Analisis Regresi & Analisis
Dlm praktek tidak perlu dihitung Pr Varians
scr beksplisit, cukup
* 0,5091 0,3 nilai t yaitu:
t 5,86 TSS =ESS + RSS,
Se(b) 0,0357 Total/Explained/Residual

t hitung yg diperoleh terletak dlm


yi2 y i2 ei2 Sum
i xi ei
2 2
of Squares
2

daerah kritis Ho ditolak penting


Studi ttg komponen2 TSS An
scr statistik (statistically significant)
Varians (AOF)
Tidak penting scr statistik (statistically
Derajat kebebasan TSS=N-1, RSS=N-
insignificant) jk t hitung terletak di
2, ESS=1
daerah penerimaan Ho diterima
Keputusan unt menerima atau menolak Ho :
Jenis Ho H Keputusan menolak Ho jika:
Hipt b
t
Se(b)
2 sisi = |t-h|> t-t , , t-t (, df) , df=n-k
1 sisi- * * k= jumlah parameter (v. bebas + 1)
kanan > = tk signifikansi (% kesalahan yg
1 sisi-kiri * * ditolelir) yang digunakan
<
p value (sig) <
* *
P value = tk sig minimal unt menolak
Ho:=0
Aturan 2-t untuk df 20, Ho:=0
Aspek praktis uji hipotesa:
akan ditolah pada =5% jika nilai |t-h|>
a) Arti accepting or rejecting
2 suatu hipotesa
b) Harapan teori at hasil penelitian sblnya mendasari pembuatan
hipotesa. Hipotesa sebaiknya dibuat sebelum penelitian empiris
c) Tidak ada aturan menetapkan , tp ekonometrisian menggunakan
(1-10)%
d) The exact level of significance : the p value
lanjutan:
F hitung dirumuskan dg: Peramalan Rata-2

MSSdariESS i xi Y0 ( )
- Besarnya Y untuk Xo=100
2 2

F x2 adalah: E(Yo/Xo=100)=
MSSdariRSS i ( N 2) 24,4545+0,5091(100)=75,37
- Bisa saja berbeda dr nilai yg
Digunakan unt menguji Ho:=0 , Ho sebenarnya kesalahan peramalan
ditolak jk F hitung>F tabel (F kritis) 1 (X0 X )
2
var(Y0 ) 2
Misal F hitung=202,87 > F N xi2
tabel=5,32 (5%, 1, 8) Ho ditolak Y0 ( X 0 )
t
Pd regresi sederhana (t=F) Se(Y0 )
hitung unt Ho: =0 didapat t 2 2

Pr a bX 0 t .Se(Y0 ) X 0 a bX 0 t .Se(Y0 ) 1
hitung=14,26 dan F hitung=202,87
(=14,26) - Besarnya varians dr contoh:

var(Y0 ) 42,159 101 (10033000
170 ) 2

10,4873
Peramalan Se(Y0 ) 3,2383

Yi 24,4545 0,5091X i - Interval keyakinan 95% unt E(Yo/Xo)
Misalnya didapat:
sebe-narnya adalah: interval
Hasil regresi dapat digunakan keyakinan unt fungsi regresi populasi
melakukan peramalan rata2 dan
peramalan indivi-dual. 75,3676 2,306(3,2383) E (Yo / X 100) 75,3676 2,306(3,2383)
67,8965 E (Yo / X 100) 82,8325
lanjutan:
Pelaporan Hasil Analisis
- Xo=100, dlm penyampelan berulang, Regresi
95 dari 100 interval (67,8965-82,8325)
YCara yg digunakan:
0,0144 0,7240 X i , F1,11 108,30
akan meliputi nilai rata2 Y yang i

sebenarnya
Se (0,9313) (0,0700) r=0,9065
- Penaksir titik 75,3676
t (-0,0154) (10,3428) df=11
Peramalan Individual p (0,987) (0,000)
- Untuk Xo=100 besarnya Yo diduga
Y0 X 0 24,4545 0,5091(100) 75,3676
sebesar Yi 24,4545 0,5091X i , F1,8 202,868
(6,4138) (0,0357) r = 0,9621
(3,8128) (14,2605) df = 8
sama dg peramalan rata2, tetapi
(0,005) (0,000)
besar-nya varian adalah
1 ( X X )2
var(Y0 Y0 ) E[Y0 Y0 ]2 2 1 0 2
n xi Evaluasi Hasil Analisis Regresi
Seberapa baik model ?
- untuk contoh didapat var=52,6470
interval keyakinan 95% didapat 1. Kesesuaian tanda koefisien dg teori
sebesar
(58,6353 Y / X 92,0925) 2. Kesignifikanan koefisien scr statistik
0 0
3. Kebaikansuaian model (koefisien
lebih lebar drp interval keyakinan unt deter-minasi)
nilai rata2 Yo Sebelumnya pastikan kenormalan dr
Ui
Lanjutan:

Uji Normalitas
histogram residual
normal probability plot
jarque-Bera (JB) test S 2
( K 3) 2

JB n
6 24
(S=koefisien Skewness,
K=koefisien Kurtosis)
mengikuti distribusi dg df=2, jika
nilai p
- Sangat rendah residual
didistribusikan scr tidak normal
- Tinggi residual didistribusikan
secara normal
Atau jk nilai JB dibandingkan
adalah:
-> residual didistribusikan scr tidak
normal
-< residual didistribusikan scr
normal
Extensions of the Two-Variable
Linear Regression Model
1.Regression Through the Hasil: (a) ei tidak tentu nol,
Origin (b) r bisa negatif perlu
Yi = Xi + Ui berhati2 menggunakannya.
Misal: CAPM dr teori portofolio Sebaiknya menggunakan model
( ERi r f ) i ( ERm r f )
modern , dg intersep krn (a) intersep bs
hip. Pendapatan permanen Milton tidak signifikan scr statistik, (b)
Friedman (Cp ~ Yp), teori an. modei interceptless bs
Biaya (VC ~ Q) , teori monete ris menimbulkan specification error.
(inf ~ Sm) Contoh: p-153
Estimasi fungsi: Y X e Yt =1.156Xt Yt=-0.447 +
Y X e
i i i i i i
1.171Xt

X Y i i

x .y
i i
Se (0.074396) (0.3629)
X i
2
x 2
i (0.075386)

var( )
2
,
2 ei2 2 ei2 p (0.000) (0.2188)
var( ) ,
2
(0.000)
i
X 2
n 1
xi2
n2
r = 0.500309 0.503480

Beda: (a) SS dan cross product,


2
(b) df dari
lanjutan:
2. Scaling & Unit of Measurement =0,2535 jk Y naik 1
Contoh: It = a + bYt , I dan Y dalam milyar, mk I rata2 akan naik
a. milyar It = -926,090 + 0,2535 milyar.
0,2535Yt
=0,0002535 jk Y naik 1
r=0,9648 (116,358)
(0,0129) juta, mk I rata2 akan naik
b. juta It = -926,090 + 0,2535Yt 0,0002535 milyar.
r=0,9648 (116,358) Perbedaan unit ukuran tidak
(0,0129) merubah konstanta dan
c. I (milyar) dan Y (juta) koefisien determinasi (r)
It = -926,090 +
0,0002535Yt
r=0,9648 (116,358) 3. Regression on
(0,0000129) Standardized Variables
d. I (juta) dan Y (milyar) Variabel yang distandarkan
It = -926,090 + Yi Yi
Y
ad:
i
*

253,524Yt y S
%dY (unit Y ) (116,358) Xi Xi S= standar
r=0,9648 X *

deviasi S
%dX (unit X )
(12,9465) i
X
Interpretasi koefisien: (n=16)
lanjutan:
Sifat: mean ad 0 dan standar N=15, =1,63 jk X (pengeluaran
deviasi ad 1 personal total) naik 1%, secara
Hasil koefisien regresi beta rata2 Y (pengeluaran barang
tahan lama) akan naik 1,63%.
koef. Arti: jk X naik 1 standar
dev, maka scr rata2 Y akan naik b. The Log-Lin Model
standar dev.
Contoh: It = 0,9822 Yt Yi Y0 (1 r ) t ln Yi ln Y0 t.ln(1 r ) ln Yi .t
(0,0485) = semi elastisitas, .100=the
growth rate
4. Functional Forms of Contoh: =8,3226 + 0,0071t
Regression Models r=9919 (5201,6) (39,167)
a. The Log Linear Model (Log-log, Selama periode 2003/1-2006/3
pengeluaran jasa kuartalan meningkat
doub le log, constant elasticity
0,71% seban ding dg tk pertumbuhan
model tahunan 2,82%.
Yi X i e i ln Yi ln ln X i i a ln X i Karena 8,3226=ln Yo, Y pd periode awal
yaitu 4115,96
Contoh: lnt=-7,5417 + 1,6266lnXt 0,0071 = instantaneous rate og growth
r=9695 (-10,5309) Antiln(0,0071)-1 = compound rate of
(20,3152) growth = 0,708% per kuartal
lanjutan:
Linear model trend d. Reciprocal Model
Yt = a + b.t +Ut hasilnya
menun- jukkan trend yg menaik at
Yi U
1
Xi i

menurun. ln Yi U
1
Xi i

Ketika X meningkat tak terbatas, mk


= 4111,545 + 30,674.t (1/X) akan mendekati 0
r=0,9935 (655,563) (44,467)
Selama periode 2003/1-2006/3 penge-
luaran jasa meningkat 30 jt per kuartal
Yi 81,794 27237,17
r=0,459 (7,551)

(7,254)
1
Xi

c. The Lin-Log Model Jk pendapatan/kapita meningkat tidak


Untuk mengetahui perubahan terbatas, mk kematian anak akan
absolut Y akibat perubahan X 1%. mendekati nilai asimtotnya yaitu 82
kematian/1000.
Yi = a + b.lnXi +Ui
positif menunjukkan pengaruh X thd
= -1283,9 + 257,27.lnX
Y adalah negatif.
r=0,3769 (292,81) (45,434)
e. Log Hyperbola/Logarithmic
Jk pengeluaran total naik 1%, scr rata2
Reciprocal M.
pe-ngeluaran makanan naik 257,27
rupee Awalnya Y meningkat dg tk yg
menaik, kemudian kenaikannya
menurun
lanjutan:
Ringkasan Bentuk Fungsional Model Regresi
Model Persamaa Penggunaan Kemiring Elastisit
n an as
Linear Y=+.X .(X/Y)
Double Log lnY=+.lnX Mengukur .(Y/X)
elastisitas
Log Lin lnY=+.X Mengukur tk .Y .X
pertum buhan
Lin Log Y=+.lnX .(1/X) .(1/Y)
Reciprocal Y=+.(1/X) -.(1/X) -.(1/XY)
Log lnY=+. Fungsi produksi .(Y/X) .(1/X)
Reciprocal (1/X) jk pendek
7. MULTIPLE REGRESSION
ANALYSIS: THE PROBLEM OF
ESTIMATION
1. The Three-Variable Model: Notation & Asummption
PRF 3-variabel Y X X U 1 , 2 , ad koefisien
i 1 1 2 2 i
regresi parsial
Asumsi: a. linear dlm parameter
cov(U i , X 1i ) cov(U i , X 2i ) 0
b. nilai X tetap atau bebas dr Ui
E (U / X , X ) 0
c. rata2 dr Ui ad 0 i 1i 2i untuk2 setiap I
var(U )
d. varian Ui ad konstan (homoskedastis)i
e. tidak terjadi auto/serial-korelasi antar cov(U U j ) 0, i j
U i ,

f. n > k
g. harus ada variasi nilai X
h. tidak ada hubungan linear exact antar X
i. tidak ada bias spesifikasi
Interpretasi E (Yi / X 1, X 2 ) 1 X 1i 2 X 2i rata2 bersyarat atau
nilai Y yg diharapkan tergantung pd nilai X yg tetap at tertentu.
lanjutan:
2. The Meaning of Partial Regression Coefficient
1 mengukur perubahan nilai rata2 Y, E(Y), untuk setiap unit
perubahan X1 dg menjaga 2 X2 konstan. Mengukur perubahan
nilai rata2 Y untuk setiap unit perubahan X2 dg menjaga X1
konstan.
Bagaimana menjaga X lain konstan?
= 263,8635 + 2,3905X + e e = (Y 263,8635 -
2,3905X)
se (12,2249) (0,2135) r=0,6695

X = -39,3033 28,1427X + e e = (X + 39,3033


28,1427X)
se (734,9526) (12,8211) r=0,0721

e = -0,0056.e
se (0,0019) r=0,1152
-0,0056 = nilai yg sebenarnya at menggambarkan efek bersih dr
perubahan X terhadap Y (koefisien regresi parsial dr Y thd X ()
OLS Estimation of Partial Regression
Coefficient
SRF Yi 1 X 1i 2 X 2i ei
min ei2 (Yi 1 X 1i 2 X 2i ) 2
ESS 1 yi x1i 2 yi x2i
Y 1 X 1 2 X 2 R
2

TSS yi2
1
y x x y x x
i 1i
2
2i i 2i 1i x2i
x x x x
2
1i
2
2i 1i 2i
2

2
y x x y x x
i 2i
2
1i i 1i 1i x2i
x x x x
2
1i
2
2i 1i 2i
2

1 X 12 x22i X 21
2
x12i 2 X 1 X 2 x1i x2i 2
var .
n x12i x22i ( x1i x2i ) 2

se var , 2

u 2
i

n3

var 1
x22i . 2
( x )( x ) ( x1i x2i )
2
1i
2
2i
2
Contoh:
Kematian anak (M) dipengaruhi oleh GNPP (Y) dan tk
M ipd
membaca wanita (F) 263
64,6416 0,0056
negara Yi 2,2316 Fi , R 2 0,6981
didapat
(11,59) (0,002)
(0,21) R=0,7077
-0,0056 ketika Y naik $1, dg F tetap, scr rata2 M akan turun
0,0056 unit. Ketika Y naik $1000, dg F tetap, scr rata2 M akan
turun 5,6 per 1000 kelahiran hidup.
-2,2316 dg menjaga Y tetap, ketika F naik 1 unit, scr rata2 M
akan turun 2,23 per 1000 kelahiran hidup.
263,6416 jk nilai Y dan F nol, rata2 besarnya F adalah 264 per
1000 kelahiran hidup.
0,7077 sekitar 71% variasi M dijelaskan oleh Y dan F
8. MULTIPLE REGRESSION ANALYSIS: THE
PROBLEM OF INFERENCE
1.The Normality Assumption riabel masing2 mengikuti distribusi
t dg df N-3.
Jk tujuannya ad mendapatkan 1 1 2 2
t , ,
esti-masi titik, metode OLS cukup se( 1 ) se( 2 ) se( )
me- madai. Tp jk tujuannya ad 2. Contoh Ilustratif
estimasi & inferensi , mk
diperlukan asumsi bh Ui M i 263,6416 0,0056Yi 2,2316 Fi , R 2 0,6981
(11,59) (0,002) (0,21)
mengikuti distribusi normal dg R=0,7077
rata2 0 & varians hg penaksir (22,74) (-2,82) (-10,63)
F=73,8325
OLS bersifat BLUE.
(0,00) (0,007) (0,00)
, , didistribusikan scr normal
1 2
dg rata2 sama dg , , yg 3. Uji Hipotesis Koef. Regresi
sebenar- nya. Individual
( N 3) 2 mengikuti distribusi Uji t
dg df2 (N-3) dan 3 penaksir OLS Dg asumsi Ui~N(0,) dpt
didistribu- sikan bebas dr . Dg digunakan uji t dg hipotesis:
mengganti dg penaksir tidak
2
Ho : =0 dg F tetap, Y tidak
biasnya 2
dlm menghitung berpenga- ruh thd M
kesalahan standar, va- H : 0 dg F tetap, Y
berpengaruh thd M
lanjutan:
Keputusan dilakukan dg: Keputusan: Ho ditolak krn besarnya
a.t=-2,82 sedang t(5%,61)=2,00 yg diuji tidak berada dlm
krn th>2,00 mk Ho ditolak interval.
4. Testing the Overall
b.Sig=0,007 < =5% Ho ditolak
Significance of the Sample
c.df=64-3=61, =5% dan Regression: The F test
th>2,00 Ho ditolak Hipotesis yg diuji:
Uji t satu sisi: Ho: 0 Ho: ==0
H : >0 H : tidak semua scr simultan ad 0
jk Ho ditolak pd uji 2-sisi, mk Ho Ho ditolak jk Fh>Ft
pasti ditolak pd uji 1-sisi.
Estimasi interval untuk ESS df ESS (k 1) R 2 (k 1)
Fh
Ft dilihat pd dfdf(k-1,n-k)
RSS k ) R 2 (n k )
RSS (n dan
adalah:
tertentu.
2 t .Se( 2 ) 2 t .Se( 2 ) Atau Ho ditolak jk sig. F < yg
2 2 digunakan
0,0056 2(0,002) 0,0056 2(0,002) Keputusan: Ho ditolak krn Fh
0,0096 0,0016 (=73,8325) > Ft (=3,15) unt (5%)
Interval -0,0096 -0,0016 & df (2,61) scr bersama2 Y dan F
mengandung koef. yg benar dg tk berpengaruh nyata (signifikan) thd
keyakinan 95%. M
lanjutan:
Kontribusi tambahan atau margi Contoh: fungsi biaya total
nal dr X
Yi 141,7667 63,4777 X i 12,9615 X i2 0,9396 X i3
Penambahan X dlm model regresi (6,3753) (4,7786) (0,9857)
sebaik nya dilakukan jk dapat (0,0591)
meningkatkan . R2 2 3 )=-0,0576 R=0,9983
cov(
Ho: ==0 or (-)=0
R 2 akan naik, jk absolut t hitung dr X
yg baru ditambahkan lebih besar dr 1. 2 3
t
Jk penambahan sekelp X menghasilkan
Fh yg lebih besar dr 1, R akan naik.

var(2 ) var(3 ) 2 cov 2 , 3
12,9615 0,9396 13,9011
5. Testing the Equality of Two t 13,3130
Ho ditolak krn ItI>t kritis
0,9867 0,00591 2(0,0576)
2 2 tidak
1,0442betul
Regression Coef. bahwa koef. X dan X ad identik (sama).
6. Restricted Least Square:
Yi Ho:
Diuji hipotesa: 1 X 1==0
i 2 X 2 i or
3 X(-)=0
3i U i Testing Linear Equality
H : or (- Restrictions
)0
Fungsi produksi Cobb-Douglass

( 2 3 ) ( 2 3 ) 2 3
t
Tolak Ho Se( jk2
t>
3 ) t kritis 2 ) var(
atau
var( 3 ) 2 cov
p value
< 2yg
, 3 Yi X 1i 1 X 2i2 eU i
Constant
digunakan ln Yi a return to scale +=1
1 ln X 1i 2 ln X 2 i U i
lanjutan:
Ada 2 pendekatan: Perlu dilakukan uji F:
a.The t-Test Approach
F
RSS R RSSUR / m R 2
UR RR2 / m
t
( 2 3 ) ( 2 3 ) RSSUR /( n k ) 1 RUR2 /(n k )
Se( )
2 3 mengikuti distribusi F dg df
( 2 3 ) 1 (m,n-k)
t

var(2 ) var(3 ) 2 cov 2 , 3 Contoh:
ln=-
Jk t > t kritis mk hipotesis CRS 1,6524+0,3397lnL+0,8460lnK
ditolak (0,0144) (0,0849) (0,0000)
b.The F-Test Approach: R=0,9951 RSS-ur=0,0136
Restricted Least Squares ln(/L)=-0,4947+1,0153ln(K/L)
=1- (0,0007) (0,0000)
R-r=0,9777 RSS-r=0,0166
ln Yi (1 2 ) ln X 1i 2 ln X 2i U i F
RSS R RSSUR / m (0,0166 0,0136) / 1 3,75
RSSUR /( n k ) 0,0136 /(20 3)
ln Yi ln X 1i 2 (ln X 2i ln X 1i ) U i
(ln Yi ln X 1i ) 2 (ln X 2i ln X 1i ) U Dg df (1,17) dan =% didapat
Ft=4,45 Ho diterima,
restricted least squares (RLS),
perekonomian Mexico bersifat
bagaimana tahu hasilnya constant return to scale.
valid?
lanjutan:
Hasilnya adalah:
General F Testing
ln Ct 1 ln Yt 2 ln At 3 ln S t 4 ln Bt ut
(1).....Yi 1 X 1i 2 X 2i ... n X ni ui
jk dianggap konsumsi ayam tidak
(2).....H 0 : 1 2
dipengaruhi harga daging sapi dan
(3).....H 0 : 2 3 4 3 babi, Ho adalah:
(4).....H 0 : 2 3 4 5 0 H 0 : 3 4 0
Larger model unconstrained model (1), ln Ct data 2 ln At
Setelah 1 ln Yt dimasukkan didapat:
smaller model constrained model di
dapat dr (1) dikurangi beb. X (4), mema
sang kendala linear (2) atau (3) ln Ct (0,16)
2,19 0,34(0,08)
ln Yt 0,50 ln At 0,15 ln(0,10)
(0,11) S t 0,09 ln Bt ut
(0,10)
Rur=0,9823

F
R R / m
RSS R RSSUR / m 2
UR
2
R ln Ct 2,(0,12)
03 0,45(0,02)
ln Yt 0,38 ln(0,06)
At ut
RSS /(n k ) 1 R /(n k )
Df m adalah 1 unt (2) & (3), 4 unt (4).
Jk Fh>F(,m,n-k) Ho ditolak
UR
2
UR Rr=0,9801
Contoh: konsumsi ayam/kapita (C), dipe
F
R
UR
RR2 / m 0,9823 0,9801 / 2
2
1,1224
ngaruhi pendapatan disposible/kap (Y),
1 RUR
2

/(n k ) 1 0,9823 /(23 5)
harga ayam (A), daging (S), & babi (B).
F(5%,2,18)=3,55 Fh<Ft Ho
diterima, Konsumsi ayam tidak
dipengaruhi harga daging sapi & babi
lanjutan:
Uji F untuk Testing for Structural or
menambah/mengeluark Parameter Stability of Regr.
ESS N ESS 0 /(k N k 0 ) RN2 RO2 /(k N k O )
variabel: Models: The Chow Test
F
RSS N /(n k N ) 1 R /(n k
2
N N ) Model regresi dg data time series, me-
mungkinkan adanya perubahan struk-
(k N k 0 ), (n k N ) tural dlm hubungan antara X dg Y.
Perubahan struktural berarti nilai para-
Jika F>F[, ] var meter model tidak tetap sama selama
X yg baru sebaiknya
M i 157 ,4244 0,0114Yi , r 2 0,1528 keseluruhan periode. Hal ini bisa
dimasukkan model. disebab kan karena faktor eksternal spt
0,7077 0,1662 /(3 2) 113.05 embargo minyak ol OPEC, perubahan
Contoh:
F kebijakan,
1 0,7077 /(64 3)
(15,99) (-3,52) Bagaimana menemukan bh perubahan
r=0,1662 struktural terjadi? Contoh: fungsi tabu-
ngan USA 1970-1995. Anggap 1982 ter
jadi resesi ekonomi.
F(5%;1,61)=4,00 F>Ft var. 1970-1981 t=1,0161 + 0,0803Xt
F sebaik nya dimasukkan dlm t (0,0875)
(9,6015)
model regresi r=0,9021 RSS-
1=1785,032 df=10
lanjutan:
1982-1995 t=153,4947 + 0,0148Xt Testing the Funcional Form:
t (4,6922) Choosing betw Linear & Log
(9,6015)
Linear-MWD Test
r=0,29711 RSS-2=10005,2
Ho: Model Linear (Y ad fungsi linear dr X)
df=12
1970-1995 t=62,4226 + 0,0376Xt H : Model Log-Linear (lnY ad f. linear
lnX)
t (4,8917) (8,8937)
r=0,7672 RSS-3=23248,3
Tahap uji MacKinnon, White & Davidson:
df=24 -Estimasi model linear, dapatkan nilai
RSS Rdidapat
FF hitung

RSSUR dg
/ k rumus: -Estimasi model log-linear dapatkan nilai
RSSUR /( n1 n2 2k ) ln Y

- Dapatkan Z=(ln- ln Y )
RSS-R=RSS 1970-1995, RSS-UR=RSS-1 + -Estimasikan Y terhadap X dan Z. Tolak
RSS-2
Ho jk Z signifikan scr statistik (gunakan
Jk Fh>Ft terjadi perubahan struktural uji t)
23248,3 11790,252 / 2 10,69 ln Y
dlm model regresi
F
11790,252 /(12 14 2.2) -Dapatkan Z=(antiln dr - )
Fh sebesar:
-Estimasikan lnY thd ln X dan Z. Tolak H
jk Z signifikan scr statistik
F(1%,2,22)=5,72 Contoh: fungsi permintaan bunga
Karena Fh>Ft Te;ah terjadi perubahan mawar di Detroit periode 1971-3 sampai
struktural dlm fungsi tabungan USA 1975-2
lanjutan:
=9734,22 - 3782,20P +
2815,25Pc
(3,37) (-6,61) (2,97)
LnY=9,23 1,76lnP + 1,34 lnPc
(16,23) (-5,90) (2,54)
=9727,57
3783,06P+2817,72Pc+85,23Z
(3,22) (-6,33) (2,84)
(0,02)
F = 13,44 R =
0,7707
Karena Z tidak signifikan scr
statistik Ho diterima, model yg
benar ad model linear.
DUMMY VARIABLE REGRESSION
MODEL
ANOVA Models
The Nature of Dummy Variable Yi = + D+ D + Ui
Dlm an. Regresi, var. bebas tidak Yi = gaji guru sekolah negeri di neg bag
hanya berskala rasio (pendapatan, Di = negara bagian (utara, selatan,
output, harga, biaya, suhu) tp jg barat)
var. kualitatif yg berskala nominal D = 1 unt neg bag utara
(jenis kelamin, ras, warna kulit,
= 0 unt neg bag lainnya
daerah geografis,
D = 1 unt neg bag selatan
kewarganegaraan, partai).
= 0 unt neg bag
Karena var tsb biasanya
i = 48014,65 + 1524,10D -
menunjukkan ada atau tidak
1721,03D
adanya suatu kualitas atau suatu
(25,85) (0,65) (-0,70)
atribut (pria atau wanita, Islam
(0,00) (0,52) (0,49)
atau non Islam, demokrat atau
republik), var ini pd dasarnya ad Rata2 gaji guru di barat ad 48014,65,
skala nominal yg diberi nilai 1 jk gaji guru di utara lebih tinggi 1524,10
ada atribut tsb dan nilai 0 jk tidak dan gaji guru di selatan lebih rendah
1721,03
ada atribut tsb var. dummy.
Tp ternyata perbedaan tsb tidak
signifikan scr statistik rata2 gaji guru
sekolah negeri di barat, utara dan
selatan ad sama
Lanjutan:
Caution in the Use of Dummy Var. Jk var kualitatif mempunyai > 1 kate-
Jumlah var dummy ad sebanyak gori, penentuannya terserah peneliti
katagori dikurangi 1. Misal tk Untuk menghindari the dummy var
pendidikan ada 4 katagori, berarti trap dg menggunakan var dummy
jumlah var dummy ada 3 sebanyak kategori dg model
interceptless
D=1, D=1, D=1,S
Yi = D + D + D
SD SMP MU
D=1 daerah di barat
SD 1 0 0 D=1 daerah di utara
SMP 0 1 0 D=1 daerah di selatan
Yi=48014,62D+49538,73D+46293,59
SMU 0 0 1 D
PTKategori yg0 mempunyai 0 nilai 0 disebut
0 (25,85) (33,90) (28,51)
sbg kategori dasar/pembanding, Koefisien menunjukkan rata2 gaji di
perbandingan dibuat dg kategori tsb. setiap neg bag.
Konstanta menunjukkannilai rata2 dr ANOVA Models with 2
kategori dasar Qualitative Vars
Koefisien di depan var dummy disebut i = 8,81 + 1,10D - 1,67D R=0,032
differential intercept coef krn (21,95) (2,37) (-3,45)
menunjukan sebrp banyak nilai (0,00) (0,02) (0,00)
kategori dg dummy 1 berbeda dr
D = 1, status perkawinan menikah
kategori dasarnya
D = 1, daerah tp tinggal selatan
Lanjutan:

Model ANCOVA
i = 28694,92-295413D-311219D+234X
(8,80) (-1,59) (-1,71) (6,52)
R=0,4977
D=1 untuk daerah utara
D=0 untuk daerah selatan
X=pengeluaran sekolah neger
Y=gaji guru/tahun
VAR DUMMY sbg Alternatif Uji
Chow
S=1,02+152,48D+0,08D-
0,066DY
(005) (461) (5,54) (-
4,10)
R=0,8819 D=1970-1981
D=1982-1995
MULTICOLLINEARITY
Asumsi ke-8 CLRM ad tidak terjadi Sumber terjadinya multikol
multiko- linearitas diantara regressor (Montgomery & Peck):
dlm model regresi.
- Metode pengumpulan data yg
The Nature of Multicollinearity digunakan
Multikol adalah: - Kendala pd model at populasi yg
- Terjadinya hubungan linear yg diambil sampelnya
sempurna at tepat diantara beberapa at
- Spesifikasi model
semua v. bebas dlm model regresi.
- Model overdetermined (jk jumlah X >
X=5X ada
koli- n)
X X X. nearitas ant - Unt data time series, regresor
X dg mengikuti pola trend umum: menaik
10 50 52
X r=1 at menurun dr waktu ke waktu.
15 75 75 X. dg X Misalnya pendapatan, kekayaan dan
berkorela penduduk mempengaruhi
18 90 97
si kuat pengeluaran konsumsi
24 120
r.=0,996 129 Estimation in the Presence of Multicoll.
Y
30 150 152 X X
Perfect koef. regresi tidak tertentu
& standar error tidak terbatas
- Terjadinya hubungan linear yg kuat walau- High but imperfect koef. regresi
pun tidak sempurna antar v. bebasnya dpt diperoleh tp standar error besar
Theoretical Consequences of
Multicollinerity
Dlm kasus near multikol estimator2
Contoh ilustratif
OLS masih bersifat BLUE:
Ci = 24,775 + 0,942Yi 0,042Wi
Theoritical R=0,9635
(3,669) (1,144) (-0,526) df=7
- Tidak bias F=92,40
- Mempunyai varians minimum W
- Merp fenomena regresi sampel i= 7,545 + 10,191Yi R=0,9979
(0,256) (62,041)
walau pun var2 X tidak
berhubungan linear pd populasi, tp
pd sampel tertentu yg diam-bil Ci = 24,455 + 0,510Yi R=0,9621
(3,813) (14,243)
mungkin berhubungan
Practical = 24,411 + 0,0498Wi R=0,9567
- Walaupun BLUE, estimator OLS C i (3,551) (13,29)
memiliki varians & kovarians yg
besar sulit men dapatkan Ln = -0,468+0,805.lnYi+0,202.lnW-0,003.I
estimator yg akurat (0,000) (0,000) (0,000)
C i
(0,000)
- Interval kepercayaancenderung R=0,9996 F=37832,59 p-F=0,000
sangat lebar menerima Ho 0,805 elastisitas pendapatan 0,805, artinya: dg
- t hitung cenderung tidak sig scr W dan I tetap, jk pendapatan (y) naik 1%, mk
rata2 konsumsi (C) akan naik 0,805%.
statistik walaupun R sangat tinggi
- Esrimator OLS & Se-nya sensitif thd
peru- bahan kecil dlm data
Detection of Multicollinearity
Multikol pd dasarnya ad fenomena - Tolerance & Variance Inflation Factor
sampel, deteksi keberadaan Jk VIF>10 kolinear tinggi,
multikol: Tol~0 kolinear tinggi, Tol~1
- R tinggi (>0,8) tp t hitung sedikit yg kolinear rendah
sig. - Scatterplot (gb. 10.4 hal.341)
- Korelasi berpasangan tinggi diant var. Remedial Measures
X (regresi dg 2 var. X) koef. Korelasi Jk multikol ad parah, yg dapat dilakukan
derj 0 ant 2 var. X ad tinggi (>0,8) ad:
- Pemeriksaan korelasi parsial R - Do nothing
model tinggi, tp r (Y dg X, Y dg X, Y
- Follow some rule of the thumb
X . X X ... X /( k 2)
2
dg X) ren-dah (Farrar R
Fi & Glauber) i 2 3 k

a.A priori information


- Regresi auxillary (1 R X . X X ... X ) /(n k 1)
2
i 2 3 k
b.Kombinasi data time series dg cross
jk Fi>F kritis dg df (k-2) & (n-k+1)
section
Xi memp kolinear dg X lainnya,
apakah Xi perlu dikeluarkan dr model c. Mengeluarkan var X yg berkolinear
regresi? Klein ruleR of
2 thumb jk tinggi
X i . X 2 X 3 ... X k
>R model berarti ada masalah d.Transformasi var bentuk differensi
multikol parah pertama, bentuk rasio
- Eigenvalue & Condition Index e.Menambah at menggunakan data baru
Jk 100<k<1000 multikol sedang- f. An faktor, an komponen utama
kuat, k>1000 multikol parah,
k=max eigen value/min eigenvalue.
lanjutan:
Jk tujuan regresi ad prediksi ,
Deteksi multikol
multikol tidak masalah, tp tidak jk
tujuannya jg estimasi parameter yg X X X X X
dpt diandalkan.
Regresi data Longley 0,99
Var. Koefisi Prob. R Tol=1- 2
en value R
0,62 0,604
C - 0,0036 1
348225
9, 0,46 0,446 -
5 0,18
X 15,0618 0,8631 0,9926 0,0074
7 0,98 0,991 0,68 0,36
Perbaikan:
9 6 4
X - 0,3127 0,9994 0,0006
0,03581
- Memasukkan PNB 0,41
0,99 0,995 0,66 riil, 0,99
9 1
RGNP=X/X 8 7 4

X - 0,0025 0,9702 0,0298 - Mengeluarkan X, Koefisi


Var. X Prob.
2,02023 en
Gejala
0 multikol:
C 65720,3 0,0000
- R tinggi
X - tp 3 0,0009
X tidak sig scr statistik
0,7213 0,2787 7
(X, 1,03322
X & X)
7 RGN 9,73649 0,0002
- Korelasi berpasangan cukup tinggi P 6
X - 0,8262 0,9970 0,0030
- R regresi penyokong tinggi kecuali X - 0,0541
0,05110
X 4 0,68796
HETEROSCEDASTICITY
Asumsi CLRM ad Ui dlm PRF ad homo Estimasi OLS Dg adanya
skedastik (memp varians yg sama) Heterosk.
berapapun X E(Ui)= i=1,2,
Penaksir OLS tetap tidak bias &
,n
konsisten tp tidak efisien dlm
Alasan varians Ui bersifat variabel:
sampel besar at kecil.
- Mengikuti model kesalahan belajar,
misal nya kesalahan ketik dg makin Metode General LS (GLS)
seringnya praktek mengetik
- Makin tinggi pendapatan, makin tinggi Deteksi Heteroskedastisitas
discretionary income pilihan
pembagian pendapatannya makin Metode informal
banyak - Sifat dr masalah
- Tehnik pengumpulan data makin baik
-UjiMetode grafis
Bentuk Pengujian
- Kewujudan outlier
- Spesifikasi model yg tidak benar
Metode
Park formal
LnU=+.lnX Jk signifikan scr
statistik berarti
Glejs |Ui|=+.X
- Skewness dlm dist 1 var X dlm model terjadi heteroske-
er
- dastisitas
David Henry: transformasi data yg
|Ui|=+. X
tidak tepat, bentuk fungsional model
tdk tepat |Ui|=+.1/X
Masalah heteroskedastisitas sering |Ui|= (+.1/X)
ditemui dlm data ceoss section |Ui|=(+.X)
|Ui|=(+.X)
lanjutan:
i=1992,3452+0,2329Xi R=0,4375 Contoh:
(2,1275) (2,3333) n=90 Yi Xi i Ui R R d d
U X
Uji Park LnUi=35,817-2,8099.lnXi
BF 12, 12, 11,3 1,0 9 4 5 25
R=0,0595 (0,934) (-0,667) 4 1 7 3
Uji Glejser |Ui|=407,2783-0,0203Xi DF 14, 21, 15,6 1,2 10 9 1 1
4 4 4 4
R=0,0127 (0,6432) (-
0,3012) EF 14, 18, 14,4 0,2 4 7 -3 9
6 7 0 0
- Uji Spearmens Rank Correlation
FI 16, 21, 15,7 0,2 5 10 -5 25
Lakukan regresi, dapatkan Ui 0 7 8 2
Ranking besarnya |Ui| dr yg IM 11, 12, 11,5 0,2 6 5 1 1
3 5 6 6
terkecil/terbe sar. Ranking besarnya

Xi atau Yi, cari beda kedua ranking d i2 &
rs 1 6 n ( n2 1)
LSM 10,
0
10,
4
10,5
9
0,5
9
7 2 5 25
hitung: rs n 2
t MIT 16, 20, 15,3 0,8 8 8 0 0
Hitung 1 rs2 2
8

rs 1 6 10 (1001) 0,3333
110 7 3 unt df 8,
th
NEF tidak
10,
0 , 3333 10 2
10, 10,5 0,1 3 1 2 4
Jk t hitung > t kritis (pd dan df=n-2) t 4 2 0,9998
0 0
10 , 3333 sig pd
terjadi heteroskedastisitas. Jk X PFB 13, 16, 13,1 0,0 2
-4 16 6
=10%
1 0 tidak
6 ada
terjadi
6 bukti
lebih dr 1, dihitung |Ui| & tiap X scr hub11,sistematik antara X dg absolut
WF 12, 11,3 1,0 1 3 -2 4
terpisah & hitung t-nya. Ui, 3tdk terjadi
0 3 hete-roskedastisitas
3
Tot 0 11
0
Lanjutan:
- Uji Whites General Ho : =0
Heteroscedasticity
Jk Ho diterima, tidak sig scr
Estimasi model regresi statistik (dg uji t) tidak terjadi
Y=+X+X , da-patkan Ui.
heterosk
Estimasi Ui=f(X,X,X,X,XX),
Jk model double log Ui
dapatkan R-nya hitung n.R
mengikuti distri-busi dg df= diregresikan pada (lni)
jumlah var bebas dr reg-resi Ui Perbaikan:
Jk n.R > kritis terdapat heterosk. a. YJk
i diketahui
*
1 X umetode
* i i

Contoh: LnYi=+.lnX+.lnX+Ui Weight
i i LS i i
Uji WGHUi=- Yi 1 X
3406,639 154,153 i , R 2 0,9993
5,84+2,56lnX+0,69lnX-0,41(lnX)- i i i
0,05(lnX)+0,0015(lnX. lnX) Yi 3417,833 148,767 X i , R 2 0,9383
R=0,1148 Y X Y/ X/
n.R=41.0,1148=4,7068
3396 1 742,2 4,566 0,001
df=5, =5% kritis =11,0705 4 3
tdk terdapat heteroskedastisitas 3787 2 851,4 1,448 0,002
Yi 1 X 1 2 X 2 ... k X k ui
- Uji Koenker-Bassett (KB) 0 3
u i (Yi ) vi
2 2
4013 3 727,8 5,513 0,004
9 1
Lanjutan:
b. Jk tidak diketahui 1.Tk kematian balita
- Varians & Se Whites Heterosc- Mi=263,64-0,0056Yi-2,2316Fi
Consistent (robust Se), tersedia (0,000) (0,007) (0,000)
dlm program statistik Uji Park Ui=854,40+5,70Mi
i=832,91-1834,2Xi+1587,04Xi (1,201) (1,243)
OLS Se= (327,3) (829,0) (519,1) Uji Glejser|Ui|=22,313+0,065Mi
t = (2,54) (-2,21) (3,06) (2,809) (1,262)
White Se=(460,9) (1243,0) (830,0) 2. Pengeluaran riset
t= (1,81) (-1,48) (1,91) Ri=1338+0,044Si
- Asumsi ttg pola heteroskedastisitas (0,27) (1,58)
Varians Yi=+.X+Ui Uji ParkUi=-72493719+916,1Si
Ui
(-1,32) (3,01)
proporsio
nal
Yi
Xi
Xi ui
Xi X1i vi Uji Glejser|Ui|=-1003+0,04639Mi
to X
Yi

Xi ui
1
X i vi (-0,43) (3,62)
Xi Xi Xi Xi

to X Uji WhiteUi=-
Yi
E (Yi ) EX(Yii ) E u(Yi i ) E (1Yi ) EX(Yii ) vi
E (Yi ) 46746325+578Si+0,000846Si
to Yi
n=14 R=0,435 (-0,42) (0,44)
Transform. LnYi=+.lnXi+Ui (0,27)
ln n.R=6,090 > (2,5%=5,99147)terdapat
Contoh: hete-roskedastisitas
AUTOKORELASI
Ad korelasi antar anggota seri Penawaran komoditi pertanian:
observasi yg diurutkan berdasar
waktu (serial cor-relation) at ruang Q st Pt 1 ut
(spatial autocorrela-tion) - Transformasi data
cov(ui , u j / X i , X j ) E (u i u j ) 0, i j Keterlambatan (lag) Ct 1Yt 2 Ct 1 ut
kesalahan pengganggu observasi model autoregresif at bentuk
tidak dipengaruhi ol kesalahan (first) difference Y=X+Ui
pengganggu observasi lain - Manipulasi data (perata-rataan,
Kenapa terjadi autokorelasi? interpola si, ekstrapolasi)
- Inertia - Non-stationaritas
Data time series (GNP, IHK, Q, Karakteristik data (mean, var, cov)
kesempatan kerja, pengangguran) ad time invariant (tidak berubah
menunjukkan pola siklus.
dr waktu ke waktu)
- Bias spesifikasi (var X yg tidak
Konsekuensi Autokorelasi
dimasuk kan, bentuk fungsional
model yg salah) - Sifat penaksir OLS: tidak bias,
- Fenomena Cobweb konsisten, tidak efisien
Terjadi pd penawaran banyak hasil konsekuensi:
pertani-an (S bereaksi thd P 1 a. Interval keyakinan menjadi lebar
periode sblnya) & uji signifikansi tidak akurat
lanjutan:
b. Uji signifikansi t dan F tidak sah & - Uji Breusch-Godfrey (LM test)
dpt memberikan kesimpulan yg Yt f ( X t ) ut ut f ( X t , ut 1 , ut 2 ,..., ut p ) R 2
salah
(n p) R 2 2 terjadi autokorela si
c. Penaksir OLS sensitif thd fluktuasi
penyampelan df = p
Deteksi Autokorelasi Jk terjadi Autokorelasi,
- Metode grafis bagaimana?
Membuat scatterplot Ut dg waktu a.Apakah autokorelasinya murni?
- Durbin-Watson d (autokorelasi first b.Transformasi model regresi dg
d < dL
order) Autokorelasi positif
model GLS
d > 4-dL Autokorelasi negatif
c. Menggunakan metode Newey-
dL < d < 4- Tidak terdapat
dU autokorelasi West unt dapat Se penduga
OLS yg telah dikoreksi dr
dL d dU Ragu-ragu, tidak
4-dU d meyakinkan autokorelasi
4-dL d.Tetap menggunakan metode
Asumsi: OLS
a.Model dg konstanta, tidak
memasukkan Y(t-1) sbg var bebas
b.X nonstokastik
c. Ut mengikuti distribusi normal
Variables Coefficie Std.Error t- Prob.
Konsumsi AS
nt Statistics
1947-2000
C -0,467711 0,042778 -10,93343 0,0000
Ln(Income 0,804873 0,017498 45,99836 0,0000
) 0,201270 0,017593 11,44060 0,0000
Ln(Wealth) -0,002689 0,000762 -3,529265 0,0009 V. dependent:
Interest Ln(Konsumsi)
R-squared Mean dependent var.
0,999560 7,826093 n=54
Adjusted R-adjusted S.D. dependent var.
0,999533 0,552368
S.E. of regression F-statistics
Variable Coefficie
0,011934 Std.Error
37832,59 t- Prob. Hasil estimasi
s
Sum nt
squared resid. Statisti
Prob. (F-statistics) dg Skema
0,007121 0,000000 cs
autokorelasi(1)
Log
C likehood-0,399833 Durbin-Watson -stat.
0,070954 0,0000
164,5880
Ln(Incom 0,845854 1,289219 5,63511
0,029275 0,0000
e) 0,159131 0,027462 2 0,0000 V. dependent:
Ln(Wealt 0,001214 0,000925 28,8931 0,1954 Ln(Konsumsi)
h) 0,612443 0,100591 3 0,0000
Interest 5,79450 n=53
AR(1) 1
1,31298
6
6,08846
2
15. QUALITATIVE RESPONSE
REGRESSION MODELS
Bagaimana jk var tergantung dr fungsi regresi adalah kualitatif? Misalnya
kepemilikan kartu kredit-asuransi jiwa, walikota terpilih, keputusan
pembelian barang, jk pilihan 2 biner/dikotomi LPM, Logit,
Probit/Normit
Linear Probability Model (LPM)
Yi = + Xi + Ui , Yi= kepemilikan rumah Yi=1 : keluarga punya rumah,
Yi=0 : keluarga tidak punya rumah, Xi =
pendapatan
Yi Probabili
E(Yi/Xi)=+Xi probabilita suatu keluarga memiliki rumah tas
Yi mengikuti distribusi Bernoulli E(Yi)=0(1-Pi)+1.Pi=Pi
1 Pi
0E(Yi/Xi)1
- Walaupun penduga OLS tidak bias, Ui tidak terdistribusi normal 0 (Bernoulli)
1-Pi tp
seiring dg peningkatan n penduganya akan cenderung terdistribusi normal
- Varians Ui bersifat heteroskedastis
var(Ui)=Pi(1-Pi) , Pi= E(Yi/Xi)=+Xi var Ui tergantung nilai X , bisa
diperbaiki dg WLS
Yi X u
i i , wi Yi (1 Yi )
wi wi wi wi
lanjutan:
- Nilai probabilitas Pi ada kemungkinan tidak memenuhi 0E(Yi/Xi)1
- Nilai R diragukan sbg goodness of fit (lebih kecil)
Contoh: a. Kepemilikan rumah
i = -0,9457 +0,1021Xi , r=0,8048 Yi 1,2456 1 0,1196 X i , r 2 0,9214
(-7,698) (12,515) n = 40 wi w(-10,332)
i wi (17,454) n=28
=-0,9457 probabilitas keluarga dg pendapatan 0 memiliki rumah ad 0%
=0,1021 jika pendapatan naik $1 (000), mk probabilitas keluarga akan
memiliki rumah naik rata2 10,21%
X=12000 Yi=-0,9457 + 0,1021(12000) = 0,2795 probabilitas keluarga dg
pendapatan $12,000 akan memiliki rumah ad 28%
b. Penggunaan kartu debit Y=1 : pakai kartu debit
=0 : tidak pakai kartu debit Model-
Variabe Model-
Pemilik saldo rekening lebih besar cenderung memakai
l 1 2
kartu debit dlm transaksi Konstan 0,361* 0,3631
Jumlah transaksi melalui ATM (JTA) tidak mempengaruhi
ta *
pemakaian kartu debit. Tanda negatif mungkin disebab
Saldo 0,0002 0,0002
kan transaksi ATM dikenakan biaya 8* 8*
JTA -0,0269 -0,0269
Bunga - -
Untuk mengatasi kelemahan LPM diperlukan model yg
menggambarkan: peningkatan Pi krn naiknya Xi tidak
memenuhi batas 0-1 dan hubungan Xi dg Pi ad non linear
scr grafis berupa kurva berbentuk S : CDF
Cummulative distribution Function (CDF) 1 P
Model Logit
1 1 eZ fungsi dist logistik
Pi , Z X i
1 e ( X i ) 1 e Zi 1 e Z - 0
X
Jk Pi ad probabilitas memiliki rumah maka
1 Pi 1 eZ Pi model logit, contoh:
1 Pi Z i X i
Z
e L i ln
1 e Z 1 Pi 1 e Z 1 Pi

Hasil estimasi nilai MK dg metode ML Eviews-6: Li=-


13,0213+2,8261.I+0,0951.N+2,3786.D
Mc Fadden R=0,3740 LR stat(df=3)=15,40419(0,0015) (0,0082) (0,0252) (0,5014)
(0,0255)
- t diganti Z, F diganti LR stat mengikuti dist
- R diganti R hitung atau R Mc Fadden
=2,8261jk IPK naik 1 unit, ceteris paribus, scr rata2 logit meningkat 2,83 unit
N tidak berpengaruh signifikan, tp scr serentak I, N dan D berpengaruh signifikan
=2,3786e^2,3786=10,7897 mhs yg mendapat metode mengajar baru,
probabilitas mendapat nilai A ad 10 kali lebih besar
lanjutan:
Li=-
13,0213+2,8261(3,92)+0,0951(29)+2,3786(0)=0,814912
Pi=0,69351 probabilitas mhs mendapat nilai A ad
69,3511A
R=26/32=0,8125 , Rmf=0,3740

Anda mungkin juga menyukai