Joan marta
Pada contoh aplikasi ini yang kita gunakan adalah data mroz.dta, untuk mengetahui
data kita tersebut seperti apa maka kita perlu mengenal data itu tersebut. Data ini
dapat di import ke stata dengan menuliskan perintah: (harus terkoneksi ke internet)
use http://www.stata.com/data/jwooldridge/eacsap/mroz
Mengenal data
Untuk mengetahui jenis data, variabel name, value label, format serta varabel label
kita dapat melakukannya sebagai berikut:
describe
Contains data from http://www.stata.com/data/jwooldridge/eacsap/mroz.dta
obs: 753
vars: 22 2 Sep 1996 16:04
size: 36,897
Untuk mengetahui berapa jumlah observasi, mean, std.deviasi, nilai max dan nilai
minimum kita dapat melakukannya sebagai berikut:
sum
1
Variable Obs Mean Std. Dev. Min Max
Untuk mengetahui suatu komposisi nilai dari suatu nilai dummy, kita dapat
melakukannya sebagai berikut: (misal variabel yang kita ingin tahu adalah inlf)
inspect inlf
inlf: =1 if in lab frce, 1975 Number of Observations
0 1 753
(2 unique values)
histogram inlf
15
10
Density
5
0
0 .2 .4 .6 .8 1
=1 if in lab frce, 1975
Untuk membuat lebih mudah dalam simulasi model logit dan probit didalam modul
ini, kita akan membuat variabel baru yaitu variabel individu awal. Dengan cara:
gen idawal = _n
2
Model yang digunakan
Misalnya kita ingin mengestimasi kemungkinan/peluang seseorang wanita yang telah
menikah untuk bekerja atau berada pada angkatan kerja (inlf) berdasarkan
serangkaian variabel (nwifeinc, educ, exper, exper2, age, kidslt6 dan kidsge6). Dengan
menggunakan data Mroz.raw dengan model sbb:
P(infl =1) = α + β1kidsge6 + β2kidslt6 + β3age + β4educ + β5nwifeinc + β6exper + ε
Dimana,
inlf =1 if in lab force in 1975,
kidsge6 = number of kids aged 6-18
kidslt6 = number of kids aged < 6 years
age = woman's age in years
educ = years of schooling
nwifeinc = (faminc - wage*hours)/1000
exper = actual labor market experience
1. LPM
reg inlf kidslt6 kidsge6 age educ nwifeinc exper
Karena kita melakukan data menggunakan LPM dimana berdasarkan OLS, maka dari
hasil diatas kita dapat membuat model menjadi seperti berikut: (yaitu dengan
memasukan koefisient ke model awal)
P(infl =1) = 0.707 – 0.272kidslt6 + 0.013kidsge6 – 0.017age + 0.039educ –
0.003nwifeinc + 0.023exper
3
Melihat nilai prediksi dan error dari estimasi menggunakan LPM
reg inlf kidslt6 kidsge6 age educ nwifeinc exper
(omitted)
predict lpminlfhat → (untuk mendapatkan nilai inlf estimasi)
predict erlpm, resid → (untuk mendapatkan nilai error dari inlf estimasi
(lpminlfhat))
Dimana dari nilai variabel tersebut kita masukkan kedalam model LPM yang telah kita
dapatkan koefisiennya dari hasil estimasi di atas. Terlihat bahwa estimasi yang kita
peroleh bisa lebih dari 1, padahal data sebenarnya data kita hanya antara 0 dan 1. Oleh
karena itu, permasalahan tersebut merupakan salah satu kelemahan dari LPM.
Grafik scatterplot
Untuk memperjelas hasil dari estimasi menggunakan LPM (lpminlfhat) maka nilainya
dapat kita gambarkan menggunakan scatter plot, dengan cara seperti berikut:
4
Membuat Scatter Plot berdasarkan Fitted Values
scatter inlf lpminlfhat || lfit inlf lpminlfhat
1.5
1
.5
0
-.5
-.5 0 .5 1 1.5
Fitted values
5
2. Logit
logit inlf kidslt6 kidsge6 age educ nwifeinc exper
Dari hasil regress kita menggunakan logit maka kita mendapatkan koefisient untuk
dimasukan kedalam rumus logistik, yakni
𝟏 𝒆𝒛
𝑷𝒊 = =
𝟏 + 𝒆−𝒛 𝟏 + 𝒆𝒛
Contoh, misalkan kita ingin melihat data kita pada baris satu dari stata dan melihat
berapa nilai probabilitas prediksi dengan logit, maka dapat dilakukan dengan
seperti berikut:
6
Dengan memasukan rumus yang telah memiliki keofisien kita akan mendapatkan
nilai inlf estimasi (lgtinlfhat), atau nilai Probabilitas prediksi dengan rumus seperti
ini:
Nilai Odds Ratio mewakili kemungkinan untuk inlf = 1 (bekerja) ketika variabel
tersebut meningkat sebesar 1 unit. Nilai ini adalah exp (logit coeff).
Jika nilai Odds Ratio > dari 1 maka kemungkinan inlf = 1 akan meningkat, namun
jika nilai Odds Ratio < dari 1 maka kemungkinan inlf = 1 menurun. Lihatlah tanda
koefisien logit
7
Dependent variable: inlf Equation: inlf Command: logit
Variables left as is: kidsge6, age, educ, exper, nwifeinc
# kids <
6 years exp(xb)
0 1.85037
1 .589443
2 .289553
3 .023302
Interpretasi:
ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun) maka
kemungkinan (the odds of) inlf=1 (bekerja) akan meningkat dengan odds ratio sebesar
1.85037 (controlling by the other variables). Misalnya contoh lain, ketika kids<6 years
= 3 (perempuan memiliki anak dibawah 6 tahun sebanyak 3 orang) maka
kemungkinan (the odds of) inlf=1 (bekerja) akan menurun dengan odds ratio sebesar
0.023302 (controlling by the other variables).
# kids <
6 years pr
0 .649168
1 .370849
2 .224538
3 .022772
Key: pr = Probability
8
Efek marginal rata-rata dari setiap variabel peubah (multiplier) Model
Logit
Penjelasan untuk marginal tiap variable, misal untuk variabel kidslt6, secara rata-
rata ketika nilai kidslt6 naik satu satuan maka kemungkinan perempuan untuk infl=1
(bekerja) akan turun sebesar 0.3487663 point atau 34.88%. contoh lain, misal untuk
variabel educ, secara rata-rata ketika nilai educ naik satu satuan maka kemungkinan
perempuan untuk infl=1 (bekerja) akan naik sebesar 0.0549967 point atau sebesar
5.5%.
Pengujian ini perlu dilakukan karena hasil Pseudo R2 hasil dari persamaan diragukan
untuk di analisa, karena hasil yang cukup lemah. Untuk itu kita perlu mencari R2 lain
misalnya dengan McFadden’s R2, Efron’s R2 dll. Selain itu pengujian ini
menampilkan nilai aic & bic, hasil ini bisa kita bandingkan dengan persamaan lain
yang kita buat, semakin kecil aic & bic semakin baik. Pengujian Goodness of Fit dapat
dilakukan dengan cara:
9
Hasil diatas menyatakan bahwa McFadden's Adj R2 = 0.198, yang dapat diartikan
sebagai berikut garis regresi mampu menjelaskan variasi penyebaran dependen
dengan menggunakan kurva sigmoid sebesar 19.8%.
Pada hasil model kita, model fits hasilnya sangat baik. Dimana, nilai number of
covariate patterns saama dengan number of observations yaitu 753, sedangkan nilai
dari (Prob>chi2) lebih besar dari α atau terima H0. Dimana memilki hipotesisi seperti
berikut:
H0 : 𝒚 = 𝒚̅ ∶ Tidak Tolak Model
H1 : 𝒚 ≠ 𝒚̅ ∶ Tolak Model
Grafik scatterplot
Untuk memperjelas hasil dari estimasi menggunakan Logit maka nilainya dapat kita
gambarkan menggunakan scatter plot, dengan cara seperti berikut:
Membuat grafik Scatter Plot Transformasi logit
Kita harus membuat variable baru, yaitu berisi ln dari (probabilitas/(1-
probabilitas)), seperti yang tertera dalam grafik dalam membuat kurva
transformasi logit. Dengan cara:
10
1
.8
.6
.4
.2
0
-4 -2 0 2 4
lnlgtinlfhat
11
3. Probit
probit inlf kidslt6 kidsge6 age educ nwifeinc exper
(Tahapan interpretasi model probit dan pengujian Goodness of Fit sama dengan
yang sebelumnya dilakukan pada model logit)
Contoh, misalkan kita ingin melihat data kita pada baris satu dari stata dan melihat
berapa Nilai Probabilitas Prediksi dengan probit, maka dapat dilakukan dengan
seperti berikut:
probit inlf kidslt6 kidsge6 age educ nwifeinc exper
predict prinlfhat → (untuk mendapatkan nilai probabilitas inlf estimasi)
inlf kidslt6 kidsge6 age educ nwifeinc exper prinlf~t Nilai Probabilitas
1. 1 1 0 32 12 10.91006 14 .6512424 inlf=1 dengan Probit
Grafik scatterplot
12
1
1
.8
.8
.6
.6
.4
.4
.2
.2
0
0
-6 -4 -2 0 2 4 -4 -2 0 2 4
lnprinlfhat lnlgtinlfhat
13