Anda di halaman 1dari 39

LABORATORIUM KOMPUTASI DEPARTEMEN ILMU EKONOMI

FAKULTAS EKONOMI UNIVERSITAS INDONESIA

MODUL

STATA: LPM, LOGIT, dan PROBIT MODEL (Edisi:2011)


Oleh : Akbar Suwardi

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Departemen Ilmu Ekonomi-FEUI Lt. 1, Depok Telp. (021) 78886252

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

LPM, Logit, dan Probit Model


PENGANTAR TEORI Model dengan variabel dependen yang bersifat diskrit, maka estimasi dengan menggunakan regresi liner akan terasa dipaksakan, karena estimator yang dihasilkan tidak lagi bersifat BLUE (Best Linier Unbiased Estimator). Hal ini disebabkan: varian error-nya tidak terdistribusi normal, estimator tidak efisien akibat heteroskedastis, dan R tidak dapat digunakan sebagai pengukur Goodness of Fit. Oleh karenanya, untuk menghasilkan estimator persamaan yang BLUE, penelitian ini menggunakan qualitative response regression model. Terdapat tiga pendekatan untuk mengembangkan model yang menjelaskan model regresi binary response yaitu: a. Linear Probability Model (LPM) b. Logit Model c. Probit Model (Normit Model) I. Linear Probability Model (LPM)

Linear Probability Model (LPM) merupakan metode regresi yang umum digunakan sebelum logit dan probit model dikembangkan. LPM bekerja dengan dasar bahwa variabel respon Y, yang merupakan probabilita terjadinya sesuatu, mengikuti Bernoulli probability distribution dimana: Yi 1 0 Total Probability 1-Pi Pi 1

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 1

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Sumber: wcr.sonoma.edu

Gambar diatas menunjukkan bahwa garis dari Linear Probability Model (LPM) sangat minim menjelaskan atau mempresentasikan dari variabel dependent yang diskrit. Oleh karena itu, karena LPM bekerja berdasarkan metode OLS biasa maka timbul permasalahan yang telah diungkapkan sebelumnya: non-normality of the disturbance, heteroscedastis, tidak terpenuhinya ekspektasi nilai Y antara satu sampai dengan nol, dan tidak dapat digunakannya R sebagai pengukur Goodness of Fit. Kebutuhan akan model probabilita yang menghasilkan Y yang terletak antara interval satu sampai dengan nol dengan hubungan antara Pt dengan Xt yang tidak linear menyebabkan logit model dikembangkan.

II.

LOGIT MODEL

Model Linear Probability Model memiliki masalah, tidak dapatnya memberikan hasil nilai Y yang terletak pada interval 1 dan 0, padahal niai probabilitas mengharuskan kisaran nilainya diantara 1 dan 0. dikarenakan mereka menggunakan OLS atau regresi linear dalam melakukan estimasinya, atau dengan persamaan sebagai berikut: Pr(xi)= 0 + 1xi + i akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 2

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Dikarenakan persamaan regresi linear tidak dapat memenuhi persyaratan nilai probabilitas tersebut, di buatlah model logit yang menggunakan persamaan eksponensial untuk mendapatkan nilai probabilitas pada interval 1 dan 0, Dimana persamaan model Logit menjadi seperti berikut: = + + (++)

() =

Lalu persamaan tersebut disederhanakan menjadi:

Pi =

eZ 1 = 1+ eZ 1 + e Zi

Dimana Zi = 1 + 2Xi. Persamaan diatas lebih dikenal sebagai logistic distribution function. Persyaratan yang diminta sebelumnya, yaitu model probabilita yang menghasilkan Y antara interval satu sampai dengan nol dengan hubungan antara Pt dengan Xt yang tidak linear, dapat terpenuhi. Hal ini disebabkan, saat Z berkisar antara - sampai dengan , Pi berkisar antara 0 dan 1 sehingga Pi tidak berhubungan linear dengan Z. Meskipun begitu masih terdapat masalah estimasi karena P tidak hanya tidak linier pada X tetapi juga ke . Namun, seperti dapat ditunjukkan pada persamaan berikut, masalah estimasi tersebut dapat diatasi. Setelah itu kita perlu menentukan seperti dibawah ini: () = akbarsuwardi@gmail.com = + + persamaan kejadian gagal, dengan merujuk

kepada Bernoulli probability distribution. Maka kita akan mendapatkan persamaan

STATA LPM, Logit, dan Probit Model | 3

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Setelah kita memiliki persamaan kejadian sukses dan persamaan kejadian gagal, maka kita dapat pula membuat Odds Ratio yang merupakan peluang sukses dibagi dengan peluang gagal, dengan rumus matematika seperti dibawah. () = + = () +

Untuk mendapatkan nilai z yang sudah linier maka kita perlu melakukan treatment tambahan setelah melakukan odd ratio dimana dengan mengalikan persamaan diatas dengan Logaritma Natural dengan tujuan membuat persamaan menjadi linear, sehingga bentuk persamaan akan menjadi seperti dibawah ini: () = = + + l () Logaritma Natural atau ln dari odds ratio tidak hanya bersifat linear pada X tetapi juga bersifat linear terhadap parameter. Persamaan tersebut yang kemudian dikenal sebagai model logit. Kelebihan dari model logit tersebut adalah: Saat P berpindah dari 0 ke 1, logit L akan berpindah dari - ke .Oleh karena itu, meskipun probabilita terletak antara 0 hingga 1, logit sendiri tidak terbatasi. Dan meski L linear terhadap X, probabilitanya sendiri tidak. L (logit) yang bernilai positif menandakan bahwa meningkatnya nilai regresor akan menyebabkan meningkatnya odds dari regresan yang setara dengan 1. Sebaliknya, L (logit) yang bernilai negative menandakan bahwa menurunnya odds dari regresan yang setara dengan 1akan menyebabkan meningkatnya nilai dari X. Model logit yang diberikan pada persamaan lima dapat diinterpretasikan sebagai berikut: slope 2 merupakan pengukur perubahan nilai L karena akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 4

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 perubahan nilai X, sementara Intercept 1 merupakan nilai dari log-odds apabila nilai suatu slope nol. Logit model juga mengasumsikan bahwa log sebuah odds ratio berhubungan linier terhadap Xi atau nilai sebuah slope.

Sumber: www.graphpad.com

Pengolahan Logit Untuk menguji signifikansi suatu koefisien secara statistik, kita

menggunakan Z statistik (distribusi normal). Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan R2, untuk mengukur goodness of fit. Program Stata secara otomatis menyediakan pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2. Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik. LR statistik mengikuti ditribusi
2

dengan derajat kebebasan (degree

of freedom) sama dengan jumlah variabel bebas Mencari Odds Ratio dari setiap variabel independent Margina Effek dari setiap variabel independent Mencari probabilitas setiap variabel independent terhadap variabel dependentnya akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 5

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 III. Probit Model (Normit Model)

Model probit adalah salah satu model dari cummulative distribution function (CDF), yaitu model statistik yang sering digunakan untuk data dengan distribusi binomial. Model ini digunakan untuk menganalisis model dengan variabel dependen yang memiliki hasil binaryyaitu y = 1 untuk menandakan suksesnya sebuah kejadian, dan y = 0 untuk menandakan gagalnya sebuah kejadian. Terdapat beberapa asumsi yang mengikuti model probit, pertama, kita berasumsi bahwa peluang kejadian sukses satu kejadian bergantung kepada latent variabel atau yang tidak dapat di observasi, dimana akan ditentukan oleh variabel penjelas. Jika nilai dari variabel yang tidak terobservasi semakin besar, maka peluang kejadian sukses akan semakin besar. Kedua, kita berasumsi bahwa terdapat nilai kritikal dari variabel yang tidak teramati, seperti jika variabel yang tidak teramati melewati tingkat kritikalnya, maka kejadian akan sukses, atau sebaliknya. Nilai kritikal tidak teramati sama dengan variabel yang tidak teramati tersebut, tapi kita berasumsi bahwa nilai kritikal tersebut terdistribusi secara normal, dengan niai mean dan varians yang sama, dan sangat dimungkinkan bahwa tidak hanya digunakan untuk estimasi parameter variabel penjelas, informasi mengenai variabel yang tidak teramati tersebut. Dengan asumsi normalitas, probabilitas dari nilai kritikal kurang dari atau sama dengan variabel yang tidak teramati dapat dihitung melalui cumulative distributio function. Sebagai contoh, jika keputusan keluarga memiliki ruah sendiri tergantung dengan nilai utility index Ii variabel yang tidak teramati. Sementara indeks utilitas sendiri ditentukan oleh pendapatan keluarga xi Ii = 1 + 2 Xi tapi juga mendapatkan

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 6

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Jika nilai kritikal Ii* lebih rendah atau sama dengan indeks utiitas Ii, keluarga akan memiliki rumah, atau sebaliknya. Probabilitas Ii* I standardize normal CDF: Pi = P (Y = 1| X) = P (Ii* Ii) = P (Zi 1 + 2 Xi) = F (1 + 2 Xi) Dimana P (Y = 1| X) artinya probabilitas kejadian terjadi pada nilai X yang tetap dan dimana Zi adalah variabel standar normal. F adalah standar normal CDF. Model matematis Probit sebagai berikut:
i

dapat dihitung dari

F ( Ii ) = F ( Ii ) =

1 2 1 2

Ii

e z / 2 dz
2

1+ 2 Xi

e z / 2 dz
2

P adalah peluang kejadian sukses, maka nilai standar normal adalah diantara - dan Ii, Indeks utilitas, sama seperti persamaan (1 dan 2), kita melakukan inverse dari CDF normal. Ii = F-1 (Ii) = F-1 (Pi) = 1 + 2 Xi Dari persamaan diatas kita dapat mengestimasi parameter variabel penjelas dan variabel yang tidak teramati. Pengolahan Probit Untuk menguji signifikansi suatu koefisien secara statistik, kita

menggunakan Z statistik (distribusi normal). Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan R2, untuk mengukur goodness of fit. Program Stata secara otomatis akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 7

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 menyediakan pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2. Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik. LR statistik mengikuti ditribusi
2

dengan derajat kebebasan (degree

of freedom) sama dengan jumlah variabel bebas Margina Effek dari setiap variabel independent Mencari probabilitas setiap variabel independent terhadap variabel dependentnya Sensitivity; yang menyatakan seberapa besar hasil observasi positif secara tepat dinyatakan positif. Specitivity; yang menyatakan seberapa besar hasil observasi negatif secara tepat dinyatakan negatif. Meninjau grafik antar sensitivity/specitivity dan probability cut-off; jika koordinat (x < 0,5, y > 0,5) maka dapat dinyatakan bahwa model tersebut semakin baik dan stabil.

Sumber: teaching.sociology.ul.ie

Pada dasarnya perbedaan logit dan probit adalah Jika Logit Cumulative standard logistic distribution (F), sedangkan Probit Cumulative standard normal distribution (). Namun Pada akhirnya dari dua model tersebut memiliki hasil yang persis sama.(Oscar Torres, Princeton University) akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 8

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

APLIKASI PADA STATA Pada contoh aplikasi ini yang kita gunakan adalah data mroz.dta, untuk mengetahui data kita tersebut seperti apa maka kita perlu mengenal data itu tersebut. Mengenal data o Untuk mengetahui jenis data, variabel name, value label, format serta varabel label kita dapat melakukannya sebagai berikut: describe

Contains data from D:\Kelas Ekonomet2\lab1- Logit n Probit\mroz.dta obs: 753 vars: 22 2 Sep 1996 16:04 size: 39,909 (99.6% of memory free) ----------------------------------------------------------------------------storage display value variable name type format label variable label ----------------------------------------------------------------------------inlf byte %9.0g =1 if in lab frce, 1975 hours int %9.0g hours worked, 1975 kidslt6 byte %9.0g # kids < 6 years kidsge6 byte %9.0g # kids 6-18 age byte %9.0g woman's age in yrs educ byte %9.0g years of schooling wage float %9.0g est. wage from earn, hrs repwage float %9.0g rep. wage at interview in 1976 hushrs int %9.0g hours worked by husband, 1975 husage byte %9.0g husband's age huseduc byte %9.0g husband's years of schooling huswage float %9.0g husband's hourly wage, 1975 faminc float %9.0g family income, 1975 mtr float %9.0g fed. marg. tax rte facing woman motheduc byte %9.0g mother's years of schooling fatheduc byte %9.0g father's years of schooling unem float %9.0g unem. rate in county of resid. city byte %9.0g =1 if live in SMSA exper byte %9.0g actual labor mkt exper nwifeinc float %9.0g (faminc - wage*hours)/1000 lwage float %9.0g log(wage) expersq int %9.0g exper^2 -------------------------------------------------------------------

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 9

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

o Untuk mengetahui berapa jumlah observasi, mean, std.deviasi, nilai max dan nilai minimum kita dapat melakukannya sebagai berikut: sum

Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------inlf | 753 .5683931 .4956295 0 1 hours | 753 740.5764 871.3142 0 4950 kidslt6 | 753 .2377158 .523959 0 3 kidsge6 | 753 1.353254 1.319874 0 8 age | 753 42.53785 8.072574 30 60 -------------+-------------------------------------------------------educ | 753 12.28685 2.280246 5 17 wage | 753 2.374565 3.241829 0 25 repwage | 753 1.849734 2.419887 0 9.98 hushrs | 753 2267.271 595.5666 175 5010 husage | 753 45.12085 8.058793 30 60 -------------+-------------------------------------------------------huseduc | 753 12.49137 3.020804 3 17 huswage | 753 7.482179 4.230559 .4121 40.509 faminc | 753 23080.59 12190.2 1500 96000 mtr | 753 .6788632 .0834955 .4415 .9415 motheduc | 753 9.250996 3.367468 0 17 -------------+-------------------------------------------------------fatheduc | 753 8.808765 3.57229 0 17 unem | 753 8.623506 3.114934 3 14 city | 753 .6427623 .4795042 0 1 exper | 753 10.63081 8.06913 0 45 nwifeinc | 753 20.12896 11.6348 -.0290575 96 -------------+-------------------------------------------------------lwage | 428 1.190173 .7231978 -2.054164 3.218876 expersq | 753 178.0385 249.6308 0 2025

o Untuk mengetahui suatu komposisi nilai dari suatu nilai dummy, kita dapat melakukannya sebagai berikut: (misal variabel yang kita ingin tahu adalah inlf)

inspect inlf

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 10

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
inlf: =1 if in lab frce, 1975 -----------------------------| # | # | # # | # # | # # | # # +---------------------0 1 (2 unique values) Negative Zero Positive Total Missing Number of Observations -----------------------------Total Integers Nonintegers 325 325 428 428 ------------753 753 ----753

o Untuk membuat lebih mudah dalam simulasi model logit dan probit didalam modul ini, kita akan membuat variabel baru yaitu variabel individu awal. Dengan cara:

gen idawal = _n Model yang digunakan Setelah kita mengetahui jenis data kita serta mengetahui berapa jumlah observasi, mean, std.deviasi, nilai max dan nilai minimum, maka kita masuk kedalam model yang ingin kita gunakan. Contoh model pada modul untuk data ini adalah

P (infl = 1) = + 1kidsge6 + 2 kidslt6 + 3age + 4educ + 5nwifeinc + 6 exper +


Keterangan: inlf adalah =1 if in lab force in 1975, kidsge6 adalah number of kids aged 6-18 kidslt6 adalah number of kids aged < 6 years age adalah woman's age in years educ adalah years of schooling nwifeinc adalah (faminc - wage*hours)/1000 exper adalah actual labor market experience akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 11

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 1. LPM

reg

inlf kidslt6 kidsge6 age educ nwifeinc exper


Number of obs F( 6, 746) Prob > F R-squared Adj R-squared Root MSE = = = = = = 753 42.32 0.0000 0.2539 0.2479 .42982

Source | SS df MS -------------+-----------------------------Model | 46.9082358 6 7.8180393 Residual | 137.81952 746 .184744665 -------------+-----------------------------Total | 184.727756 752 .245648611

-----------------------------------------------------------------------------inlf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | -.2718291 .0335715 -8.10 0.000 -.3377348 -.2059233 kidsge6 | .0125301 .0132781 0.94 0.346 -.0135368 .038597 age | -.017712 .0024487 -7.23 0.000 -.0225191 -.0129049 educ | .0398189 .0074006 5.38 0.000 .0252905 .0543474 nwifeinc | -.0033265 .0014574 -2.28 0.023 -.0061876 -.0004654 exper | .0225725 .0021786 10.36 0.000 .0182956 .0268493 _cons | .7072318 .1504335 4.70 0.000 .4119083 1.002555 ------------------------------------------------------------------------------

Karena kita melakukan data menggunakan LPM dimana berdasarkan OLS, maka dari hasil diatas kita dapat membuat model menjadi seperti berikut: (yaitu dengan memasukan koefisient ke model awal)

P(infl = 1) = 0.707 0.271 kidslt6 + 0.013 kidsge6 0.017 age + 0.039 educ 0.003 nwifeinc + 0.023 exper
Melihat nilai prediksi dan error dari estimasi menggunakan LPM

reg inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) predict lpminlfhat (untuk mendapatkan nilai inlf estimasi) predict erlpm, resid (untuk mendapatkan nilai error dari inlf estimasi (lpminlfhat))

list inlf lpminlfhat erlpm in 26/35

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 12

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
Nilai Prediksi dengan LPM

26. 27. 28. 29. 30. 31. 32. 33. 34. 35.

+-----------------------------+ | inlf lpminl~t erlpm | |-----------------------------| | 1 1.030639 -.030639 | | 1 .7865728 .2134272 | | 1 .8024666 .1975335 | | 1 .6710289 .3289711 | | 1 .5469357 .4530643 | |-----------------------------| | 1 .9649304 .0350696 | | 1 .4919043 .5080957 | | 1 .9282249 .0717751 | | 1 .5534077 .4465922 | | 1 1.138675 -.1386752 | +-----------------------------+

list

inlf lpminlfhat erlpm in 481/485

481. 482. 483. 484. 485.

+------------------------------+ | inlf lpminl~t perlpm | |------------------------------| | 0 .4951564 -.4951564 | | 0 .5932751 -.5932751 | | 0 .065651 -.065651 | | 0 -.3042662 .3042662 | | 0 .0083976 -.0083976 | +------------------------------+

Contoh, jika kita punya data pada list 26, dengan nilai setiap variabel, dapat dilihat dengan cara berikut:

List

inlf

kidslt6

kidsge6

age

educ

nwifeinc

exper

lpminlfhat erlpm in 26
Nilai Prediksi dengan LPM

+--------------------------------------------------------------------------------+ | inlf kidslt6 kidsge6 age educ nwifeinc exper lpminl~t erlpm | |--------------------------------------------------------------------------------| 26. | 1 0 2 43 17 27.34999 21 1.030639 -.030639 | +--------------------------------------------------------------------------------+

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 13

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Dimana dari nilai variabel tersebut kita masukin kedalam model LPM yang telah kita dapatkan koefisienya dari hasil estimasi di atas. Terlihat bahwa estimasi yang kita peroleh bisa lebih dari 1, padahal data sebenarnya data kita hanya antara 0 dan 1. Oleh karena itu, permasalahan tersebut merupakan salah satu kelemahan dari LPM.

Grafik scatterplot

Untuk memperjelas hasil dari estimasi menggunakan LPM (lpminlfhat) maka nilainya dapat kita gambarkan menggunakan scatter plot, dengan cara seperti berikut: 1. Membuat Scatter Plot berdasarkan Fitted Values scatter
1.5

inlf lpminlfhat || lfit inlf lpminlfhat

-.5
-.5

.5

.5 Fitted values

1 Fitted values

1.5

=1 if in lab frce, 1975

2. Membuat Scatter Plot berdasarkan nilai Estimasi menggunakan LPM sort lpminlfhat

gen idlpmm = _n scatter lpminlfhat inlf idlpmm

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 14

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
1.5 -.5 0 .5 1

200 Fitted values

400 idlpmm

600

800

=1 if in lab frce, 1975

Dari hasil kedua scatter plot diatas menunjukkan bahwa nilai Fitted Values dan estimasi menggunakan LPM (lpminlfhat) keluar dari nilai inlf aslinya, yaitu antara 0 dan 1.

) ) berdasarkan nilai residual ( u 3. Membuat Scatter Plot nilai predicted ( y


dari nilai Estimasi menggunakan LPM akan terlihat seperti berikut: rvfplot

-1
-.5

-.5

Residuals 0

.5

0 Fitted values

.5

= y y , maka u = y Karena u

ketika

y = 0 (the lower line in the

= 1 y above graph yaitu -1), sedangkan u

ketika

y =1

(the upper

line). akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 15

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 2. LOGIT logit inlf kidslt6 kidsge6 age educ nwifeinc exper

Iteration Iteration Iteration Iteration Iteration

0: 1: 2: 3: 4:

log log log log log

likelihood likelihood likelihood likelihood likelihood

= = = = =

-514.8732 -406.91038 -406.14404 -406.14318 -406.14318 Number of obs LR chi2(6) Prob > chi2 Pseudo R2 = = = = 753 217.46 0.0000 0.2112

Logistic regression

Log likelihood = -406.14318

-----------------------------------------------------------------------------inlf | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | -1.439393 .2014989 -7.14 0.000 -1.834324 -1.044462 kidsge6 | .0581735 .07338 0.79 0.428 -.0856487 .2019957 age | -.0910884 .0143207 -6.36 0.000 -.1191564 -.0630204 educ | .2269766 .0432954 5.24 0.000 .1421191 .3118341 nwifeinc | -.0202165 .0082637 -2.45 0.014 -.036413 -.0040199 exper | .1197458 .0136264 8.79 0.000 .0930385 .146453 _cons | .8379088 .8409368 1.00 0.319 -.810297 2.486115 ------------------------------------------------------------------------------

Dari hasil regress kita menggunakan logit maka kita mendapatkan koefisient untuk dimasukan kedalam rumus logistik,
eZ 1 = 1+ eZ 1 + e Zi

Pi =

menjadi seperti berikut:

Contoh, misalkan kita ingin melihat data kita pada baris satu dari stata dan melihat berapa nilai probabilitas prediksi dengan logit, maka dapat dilakukan dengan seperti berikut:

( = ) ..+..+..+. = ..+..+..+. +

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 16

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

logit inlf kidslt6 kidsge6 age educ nwifeinc exper predict plgtinlfht (untuk mendapatkan nilai probabilitas inlf estimasi) Sebelum kita ingin melihat nilai dari list, kita harus membuat urutan dalam data seperti semua, dengan cara:

sort idawal list inlf kidslt6 kidsge6 age educ nwifeinc exper plgtinlfht in 1

Nilai Probabilitas inlf=1 dengan Logit

+---------------------------------------------------------------------+ | inlf kidslt6 kidsge6 age educ nwifeinc exper plgiti~t| |---------------------------------------------------------------------| 1. | 1 1 0 32 12 10.91006 14 .6599977 | +---------------------------------------------------------------------+

Dengan memasukan rumus yang telah memiliki keofisien kita akan mendapatkan nilai inlf estimasi (plgtinlfht), atau nilai Probabilitas prediksi dengan rumus seperti ini:

..()+.().()+.().(.)+.() = ..()+.().()+.().(.)+.() + = .
Nilai Probabilitas inlf=1 dengan Logit

( = )

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 17

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Lihat odds ratio logit inlf kidslt6 kidsge6 age educ nwifeinc exper, or

Iteration Iteration Iteration Iteration Iteration

0: 1: 2: 3: 4:

log log log log log

likelihood likelihood likelihood likelihood likelihood

= = = = =

-514.8732 -406.91038 -406.14404 -406.14318 -406.14318 Number of obs LR chi2(6) Prob > chi2 Pseudo R2 = = = = 753 217.46 0.0000 0.2112

Logistic regression

Log likelihood = -406.14318

-----------------------------------------------------------------------------inlf | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | .2370717 .0477697 -7.14 0.000 .1597215 .351881 kidsge6 | 1.059899 .0777754 0.79 0.428 .9179166 1.223843 age | .912937 .0130739 -6.36 0.000 .8876689 .9389243 educ | 1.254801 .0543271 5.24 0.000 1.152714 1.365928 nwifeinc | .9799865 .0080983 -2.45 0.014 .964242 .9959881 exper | 1.12721 .0153598 8.79 0.000 1.097504 1.157721 ------------------------------------------------------------------------------

Nilai Odds Ratio mewakili kemungkinan untuk inlf = 1 ketika variabel meningkat sebesar 1 unit. Nilai ini adalah exp (logit coeff). Jika > ATAU 1 maka kemungkinan inlf = 1 meningkat. Jika < ATAU 1 maka kemungkinan inlf = 1 menurun. Lihatlah tanda koefisien logit

Melihat Odds ratio pada different levels di setiap variable logit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) adjust, by (kidslt6) exp

-------------------------------------------------------------------------Dependent variable: inlf Equation: inlf Command: logit

Variables left as is: kidsge6, age, educ, exper, nwifeinc --------------------------------------------------------------------------

---------------------# kids < |

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 18

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
6 years | exp(xb)

----------+----------0 | 1 | 2 | 3 | 1.85037 .589443 .289553 .023302

----------------------

Key:

exp(xb)

exp(xb)

Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun) maka kemungkinan (the odds of) inlf=1 (bekerja) akan meningkat dengan faktor sebesar 1.85037 (controlling by the other variables). Misalnya contoh lain, ketika kids<6 years = 3 (perempuan memiliki anak dibawah 6 tahun sebanyak 3) maka kemungkinan (the odds of) inlf=1 (bekerja) hours akan meningkat dengan faktor sebesar .023302 (controlling by the other variables). Memprediksi probabilitas pada different levels di setiap variable di Model Logit logit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) adjust, by (kidslt6) pr

-------------------------------------------------------------------------Dependent variable: inlf Equation: inlf Command: logit

Variables left as is: kidsge6, age, educ, exper, nwifeinc --------------------------------------------------------------------------

---------------------# kids < 6 years | | pr

----------+----------0 | 1 | 2 | .649168 .370849 .224538

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 19

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
3 | .022772

---------------------Key: pr = Probability

Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun) maka probabilita inlf=1 (kerja) adalah .649168 atau 64.91%. (controlling by the other variables). ketika kids<6 years = 2 (perempuan memiliki anak dibawah 6 tahun sebanyak 2) maka probabilita inlf=1 (kerja) adalah .224538 atau 22.45%. (controlling by the other variables). Hasil dari Probabilitas tersebut berasal dari persamaan logit diatas.

Efek marginal rata-rata dari setiap variabel peubah (multiplier) Model Logit logit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) Mfx

Marginal effects after logit y = Pr(inlf) (predict) = .58774394 -----------------------------------------------------------------------------variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------kidslt6 | -.3487663 .04902 -7.12 0.000 -.444839 -.252694 .237716 kidsge6 | .0140955 .01778 0.79 0.428 -.020758 .048949 1.35325 age | -.0220708 .00347 -6.35 0.000 -.028879 -.015263 42.5378 educ | .0549967 .01049 5.24 0.000 .034435 .075559 12.2869 nwifeinc | -.0048985 .002 -2.45 0.014 -.008823 -.000973 20.129 exper | .0290145 .00327 8.88 0.000 .022611 .035418 10.6308 ------------------------------------------------------------------------------

Nilai yang berada di kolom X adalah nilai rata-rata dari setiap variabel (lihat sum per variabel)

Penjelasannya: Pertama, terlihat bahwa ada marjinal efek tabel terpisah untuk setiap alternatif dan tabel yang diawali dengan melaporkan keseluruhan probabilitas memilih alternatif, misalnya, 0,58774394. Kedua, penjelasan untuk marginal tiap variable, misal untuk variabel kidslt6, secara rata-rata ketika nilai kidslt6 naik satu akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 20

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 satuan maka kemungkinan perempuan untuk infl=1 (bekerja) akan turun sebesar 0.3487663 point atau 34.88%. contoh lain, misal untuk variabel educ, secara rata-rata ketika nilai educ naik satu satuan maka kemungkinan perempuan untuk infl=1 (bekerja) akan naik sebesar 0.0549967 point atau sebesar 5.5%. Pengujian Goodness of Fit

Pengujian ini perlu dilakukan karena hasil Pseudo R2 hasil dari persamaan diragukan untuk di analisa, karena hasil yang cukup lemah. Untuk itu kita perlu mencari R2 lain misalnya dengan McFaddens R2, Efrons R2 dll. Selain itu pengujian ini menampilkan nilai aic & bic, hasil ini bisa kita bandingkan dengan persamaan lain yang kita buat, semakin keci aic & bic semakin baik. Pengujian Goodness of Fit dapat dilakukan dengan cara,

logit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) fitstat (Jika perintah fitstat dijalankan, hasil yang keluar unrecognized command: fitstat maka anda perlu untuk mengUpdate perintah. Dengan cara keitik help fitstat, setelah itu klik tulisan sg145 lalu ikuti perintah untuk meng install)
Measures of Fit for logit of inlf

Log-Lik Intercept Only: D(746):

-514.873 812.286

Log-Lik Full Model: LR(6): Prob > LR:

-406.143 217.460 0.000 0.198 0.337 0.261 3.290 0.403 826.286 -177.716

McFadden's R2: Maximum Likelihood R2: McKelvey and Zavoina's R2: Variance of y*: Count R2: AIC: BIC:

0.211 0.251 0.354 5.090 0.742 1.097 -4129.266

McFadden's Adj R2: Cragg & Uhler's R2: Efron's R2: Variance of error: Adj Count R2: AIC*n: BIC':

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 21

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Hasil diatas menyatakan bahwa McFadden's Adj R2 = 0.198, yang dapat diartikan sebagai berikut garis regresi mampu menjelaskan variasi penyebaran dependen dengan menggunakan kurva sigmoid sebesar 19.8% yang lebih kecil dari nilai McFadden's R2 = 0.211 atau sebagai berikut garis regresi mampu menjelaskan variasi penyebaran dependen dengan menggunakan kurva sigmoid sebesar 21.1%. Pengujian Goodness of Fit Hosmer-Lemeshow

Pengujian Hosmer-Lemeshow (2000) menyajikan Pearson X2 goodness-of-fit test untuk the fitted model atau pengujian ini mirip dengan uji global pada OLS. Pengujian Pearson X2 goodness-of-fit adalah sebuah test terhadap hasil data yang observed terhadap expected number of responses dimana menggunakan covariate patterns (Manual Stata11). Pengujian Hosmer-Lemeshow dapat dilakukan dengan cara seperti berikut:

logit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) estat gof

Logistic model for inlf, goodness-of-fit test

number of observations = number of covariate patterns = Pearson chi2(746) = Prob > chi2 =

753 753 753.63 0.4152

Pada hasil model kita, model fits hasilnya sangat baik. Dimana, nilai number of covariate patterns saama dengan number of observations yaitu 753, sedangkan nilai dari (Prob>chi2) lebih besar dari atau terima H0. Dimana memilki hipotesisi seperti berikut: H0 : = Tidak Tolak Model akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 22

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 H1 : Tolak Model Pengujian Sensitivity dan Specitivity

Pada pengujian ini prinsipnya sama dengan uji goodness of fit sebagai bentuk perwakilan pengganti R2, dengan melihat melalui specitivity & sensitivity. Dengan cara: logit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) estat classification
Logistic model for inlf -------- True -------Classified | D ~D | Total -----------+--------------------------+----------+ | 347 113 | 460 | 81 212 | 293 -----------+--------------------------+----------Total | 428 325 | 753 Classified + if predicted Pr(D) >= .5 True D defined as inlf != 0 -------------------------------------------------Sensitivity Pr( +| D) 81.07% Specificity Pr( -|~D) 65.23% Positive predictive value Pr( D| +) 75.43% Negative predictive value Pr(~D| -) 72.35% -------------------------------------------------False + rate for true ~D Pr( +|~D) 34.77% False - rate for true D Pr( -| D) 18.93% False + rate for classified + Pr(~D| +) 24.57% False - rate for classified Pr( D| -) 27.65% -------------------------------------------------Correctly classified 74.24% --------------------------------------------------

Berdasarkan hasil diatas dapat disimpulkan: o Specitivity : observasi hasil negative yang dinyatakan secara negative secara benar sebesar 65.23%% o Sensitivity : observasi hasil positive yang dinyatakan secara positive secara benar sebesar 81.07% o Secara Overall : model mampu menyatakan secara benar sebesar 74.24%

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 23

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Grafik scatterplot

Untuk memperjelas hasil dari estimasi menggunakan Logit (logitinlfhat) maka nilainya dapat kita gambarkan menggunakan scatter plot, dengan cara seperti berikut: 1. Membuat grafik Scatter Plot Transformasi logit Kita harus membuat variable baru, yaitu berisi ln dari (probabilitas/(1probabilitas)), seperti yang tertera dalam grafik dalam membuat kurva transformasi logit. Dengan cara:

gen lnplgtinlfht = ln( plgtinlfht/(1- plgtinlfht)) scatter plgtinlfht inlf lnplgtinlfht

.2

.4

.6

.8

-4

-2 Pr(inlf)

0 lnplgtinlfht =1 if in lab frce, 1975

2. Membuat

Scatter

Plot

berdasarkan

nilai

Probabilitas

Estimasi

menggunakan Logit, dengan cara:

sort

plgtinlfht

gen idlogit = _n scatter plgtinlfht inlf idlogit

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 24

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
1 0 .2 .4 .6 .8

200 Pr(inlf)

400 idlogit

600

800

=1 if in lab frce, 1975

Dari hasil kedua scatter plot diatas menunjukkan bahwa nilai Transformasi logit dan Probabilitas Estimasi menggunakan Logit (plgtinlfht) tidak keluar dari nilai inlf aslinya, yaitu antara 0 dan 1. Berbeda dengan hasil dari LPM.

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 25

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 3. PROBIT probit inlf kidslt6 kidsge6 age educ nwifeinc exper

Iteration Iteration Iteration Iteration Iteration

0: 1: 2: 3: 4:

log log log log log

likelihood likelihood likelihood likelihood likelihood

= = = = =

-514.8732 -407.11545 -406.21971 -406.21886 -406.21886 Number of obs LR chi2(6) Prob > chi2 Pseudo R2 = = = = 753 217.31 0.0000 0.2110

Probit regression

Log likelihood = -406.21886

-----------------------------------------------------------------------------inlf | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | -.8742923 .1175098 -7.44 0.000 -1.104607 -.6439773 kidsge6 | .0345459 .0429862 0.80 0.422 -.0497055 .1187974 age | -.0555548 .0083447 -6.66 0.000 -.0719101 -.0391995 educ | .1336902 .0251346 5.32 0.000 .0844273 .1829531 nwifeinc | -.0115648 .0047942 -2.41 0.016 -.0209613 -.0021684 exper | .0702165 .007571 9.27 0.000 .0553775 .0850555 _cons | .5795817 .496205 1.17 0.243 -.3929623 1.552126 ------------------------------------------------------------------------------

Dari hasil regress kita menggunakan Probit maka kita mendapatkan koefisient untuk dimasukan kedalam rumus Probabiltas (probit) berikut: menjadi seperti berikut: ( ) = ( ) =

/

Pi = P (Y = 1| X) = P (Ii* Ii) = P (Zi 1 + 2 Xi) = F (1 + 2 Xi)

menjadi seperti berikut:

( ) =

(..+..+..+. )

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 26

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

= ( + )

= (. . + . . + . . + . )

Contoh, misalkan kita ingin melihat data kita pada baris satu dari stata dan melihat berapa Nilai Probabilitas Prediksi dengan probit, maka dapat dilakukan dengan seperti berikut:

probit inlf kidslt6 kidsge6 age educ nwifeinc exper predict prinlfhat (untuk mendapatkan nilai probabilitas inlf estimasi) Sebelum kita ingin melihat nilai dari list, kita harus membuat urutan dalam data seperti semua, dengan cara:

sort idawal list inlf kidslt6 kidsge6 age educ nwifeinc exper prinlfhat in 1
Nilai Probabilitas inlf=1 dengan Probit

+---------------------------------------------------------------------+ | inlf kidslt6 kidsge6 age educ nwifeinc exper prinl~t |

|---------------------------------------------------------------------| 1. | 1 1 0 32 12 10.91006 14 .6512424 |

+---------------------------------------------------------------------+

Dengan memasukan nilai-nilai diatas kedalam rumus yang telah memiliki keofisien, kita akan mendapatkan nilai inlf estimasi (proinlfhat) atau nilai Probabilitas prediksi dengan proses seperti berikut :

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 27

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

( ) =

= ( + )

(..+..+..+. )

= (. . () + . () . () + . () . (. ) + . () = 0.6512424
Nilai Probabilitas inlf=1 dengan Probit

Melihat exp (e) ratio pada different levels di setiap variable di Model Probit logit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) adjust, by (kidslt6) exp

-------------------------------------------------------------------------Dependent variable: inlf Equation: inlf Command: probit

Variables left as is: kidsge6, age, educ, exper, nwifeinc --------------------------------------------------------------------------

---------------------# kids < 6 years | | exp(xb)

----------+----------0 | 1 | 2 | 3 | 1.4445 .730329 .469383 .104823

---------------------Key: exp(xb) = exp(xb)

Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun) maka kemungkinan (the odds of) inlf=1 (bekerja) akan meningkat dengan akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 28

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 faktor sebesar 1.4445 (controlling by the other variables). Misalnya contoh lain, ketika kids<6 years = 3 (perempuan memiliki anak dibawah 6 tahun sebanyak 3) maka kemungkinan (the odds of) inlf=1 (bekerja) hours akan meningkat dengan faktor sebesar 0.104823 (controlling by the other variables). Memprediksi probabilitas pada different levels di setiap variable di Model Probit logit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) adjust, by (kidslt6) pr

-------------------------------------------------------------------------Dependent variable: inlf Equation: inlf Command: probit

Variables left as is: kidsge6, age, educ, exper, nwifeinc ----------------------------------------------------------------------------------------------# kids < 6 years | | pr

----------+----------0 | 1 | 2 | 3 | .643474 .376662 .224724 .012051

---------------------Key: pr = Probability

Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun) maka probabilita inlf=1 (kerja) adalah 0.643474 atau 64.38 %. (controlling by the other variables). ketika kids<6 years = 2 (perempuan memiliki anak dibawah 6 tahun sebanyak 2) maka probabilita inlf=1 (kerja) adalah 0.224724 atau 22.47%. (controlling by the other variables). Hasil dari Probabilitas tersebut berasal dari persamaan logit diatas.

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 29

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Efek marginal rata-rata dari setiap variabel perubah (multiplier) probit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) mfx
Nilai yang berada di kolom X adalah nilai rata-rata dari setiap variabel (lihat sum per variabel)

Marginal effects after probit y = Pr(inlf) (predict) = .58379791 -----------------------------------------------------------------------------variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------kidslt6 | -.341069 .04594 -7.42 0.000 -.431103 -.251035 .237716 kidsge6 | .0134767 .01677 0.80 0.422 -.019397 .04635 1.35325 age | -.0216724 .00326 -6.66 0.000 -.028052 -.015293 42.5378 educ | .0521537 .0098 5.32 0.000 .032944 .071364 12.2869 nwifeinc | -.0045115 .00187 -2.41 0.016 -.008177 -.000846 20.129 exper | .0273921 .00294 9.30 0.000 .021621 .033163 10.6308 ------------------------------------------------------------------------------

Penjelasannya: Pertama terlihat bahwa ada marjinal efek tabel terpisah untuk setiap alternatif dan tabel yang diawali dengan melaporkan keseluruhan probabilitas memilih alternatif, misalnya, 0.58379791. Sedangkan penjelasan untuk marginal tiap variable, misal untuk variabel kidslt6, secara rata-rata ketika nilai kidslt6 naik satu satuan maka kemungkinan perempuan untuk infl=1 (bekerja) akan turun sebesar 0.341069 point atau 34.11%. contoh lain, misal untuk variabel educ, secara rata-rata ketika nilai educ naik satu satuan maka kemungkinan perempuan untuk infl=1 (bekerja) akan naik sebesar 0.0521537point atau sebesar 5.2%. Pengujian Goodness of Fit

Pengujian ini perlu dilakukan karena hasil Pseudo R2 hasil dari persamaan diragukan untuk di analisa, karena hasil yang cukup lemah. Untuk itu kita perlu mencari R2 lain misalnya dengan McFaddens R2, Efrons R2 dll. Selain itu pengujian ini menampilkan nilai aic & bic, hasil ini bisa kita bandingkan dengan persamaan lain yang kita buat, semakin keci aic & bic semakin baik. Pengujian Goodness of Fit dapat dilakukan dengan cara, akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 30

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

probit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) fitstat (Jika perintah fitstat dijalankan, hasil yang keluar unrecognized command: fitstat maka anda perlu untuk mengUpdate perintah. Dengan cara keitik help fitstat, setelah itu klik tulisan sg145 lalu ikuti perintah untuk meng install)
Measures of Fit for probit of inlf Log-Lik Intercept Only: D(746): -514.873 812.438 Log-Lik Full Model: LR(6): Prob > LR: McFadden's R2: Maximum Likelihood R2: McKelvey and Zavoina's R2: Variance of y*: Count R2: AIC: BIC: 0.211 0.251 0.388 1.633 0.745 1.098 -4129.115 McFadden's Adj R2: Cragg & Uhler's R2: Efron's R2: Variance of error: Adj Count R2: AIC*n: BIC': -406.219 217.309 0.000 0.197 0.336 0.261 1.000 0.409 826.438 -177.564

Hasil diatas menyatakan bahwa McFadden's Adj R2 = 0.198, yang dapat diartikan sebagai berikut garis regresi mampu menjelaskan variasi penyebaran dependen dengan menggunakan kurva sigmoid sebesar 19.7% yang lebih kecil dari nilai McFadden's R2 = 0.211 atau sebagai berikut garis regresi mampu menjelaskan variasi penyebaran dependen dengan menggunakan kurva sigmoid sebesar 21.1%. Pengujian Goodness of Fit Hosmer-Lemeshow

Pengujian Hosmer-Lemeshow (2000) menyajikan Pearson X2 goodness-of-fit test untuk the fitted model atau pengujian ini mirip dengan uji global pada OLS. Pengujian Pearson X2 goodness-of-fit adalah sebuah test terhadap hasil data yang observed terhadap expected number of responses dimana menggunakan covariate patterns (Manual Stata11). Pengujian Hosmer-Lemeshow dapat dilakukan dengan cara seperti berikut: akbarsuwardi@gmail.com STATA LPM, Logit, dan Probit Model | 31

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

probit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) estat gof
Probit model for inlf, goodness-of-fit test

number of observations = number of covariate patterns = Pearson chi2(746) = Prob > chi2 =

753 753 758.31 0.3691

Pada hasil model kita, model fits hasilnya sangat baik. Dimana, nilai number of covariate patterns saama dengan number of observations yaitu 753, sedangkan nilai dari (Prob>chi2) lebih besar dari atau terima H0. Dimana memilki hipotesis seperti berikut: H1 : Tolak Model H0 : = Tidak Tolak Model

Pengujian Sensitivity dan Specitivity

Pada pengujian ini prinsipnya sama dengan uji goodness of fit sebagai bentuk perwakilan pengganti R2, dengan melihat melalui specitivity & sensitivity. Dengan cara:

probit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) estat classification
Probit model for inlf -------- True -------Classified | D ~D | Total -----------+--------------------------+----------+ | 348 112 | 460 | 80 213 | 293 -----------+--------------------------+----------Total | 428 325 | 753

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 32

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
Classified + if predicted Pr(D) >= .5 True D defined as inlf != 0 -------------------------------------------------Sensitivity Pr( +| D) 81.31% Specificity Pr( -|~D) 65.54% Positive predictive value Pr( D| +) 75.65% Negative predictive value Pr(~D| -) 72.70% -------------------------------------------------False + rate for true ~D Pr( +|~D) 34.46% False - rate for true D Pr( -| D) 18.69% False + rate for classified + Pr(~D| +) 24.35% False - rate for classified Pr( D| -) 27.30% -------------------------------------------------Correctly classified 74.50% --------------------------------------------------

Berdasarkan hasil diatas dapat disimpulkan: o Specitivity : observasi hasil negative yang dinyatakan secara negative secara benar sebesar 65.54%% o Sensitivity : observasi hasil positive yang dinyatakan secara positive secara benar sebesar 81.31% o Secara Overall : model mampu menyatakan secara benar sebesar 74.50%

Grafik scatterplot

Untuk memperjelas hasil dari estimasi menggunakan Probit (prinlfhat) maka nilainya dapat kita gambarkan menggunakan scatter plot, dengan cara seperti berikut:: 1. Membuat grafik Scatter Plot Transformasi Probit Kita harus membuat variable baru, yaitu berisi ln dari (probabilitas/(1probabilitas)), seperti yang tertera dalam grafik dalam membuat kurva transformasi Probit, deengan cara:

gen lnprinlfhat = ln(prinlfhat/(1-prinlfhat)) scatter prinlfhat inlf lnprinlfhat

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 33

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

0
-6

.2

.4

.6

.8

-4 Pr(inlf)

-2 lnprinlfhat

0 =1 if in lab frce, 1975

2. Membuat

Scatter

Plot

berdasarkan

nilai

Probabilitas

Estimasi

menggunakan Probit, dengan cara:

sort

prinlfhat

gen idprobit = _n scatter prinlfhat inlf idprobit

.2

.4

.6

.8

200 Pr(inlf)

400 idprobit

600

800

=1 if in lab frce, 1975

Dari hasil kedua scatter plot diatas menunjukkan bahwa nilai Transformasi probit dan akbarsuwardi@gmail.com Probabilitas Estimasi menggunakan probit STATA LPM, Logit, dan Probit Model | 34

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 (prinlfhat) tidak keluar dari nilai inlf aslinya, yaitu antara 0 dan 1. Berbeda dengan hasil dari LPM, namun sama dengan hasil menggunakan estimasi logit. 4. PERBANDINGAN ANTARA LOGIT DAN PROBIT DENGAN UJI FITSTAT logit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) fitstat, saving(L1) (Omitted) probit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) fitstat, using(L1) force
Measures of Fit for probit of inlf Current Model: probit N: 753 Log-Lik Intercept Only: -514.873 Log-Lik Full Model: -406.219 D: 812.438(746) LR: 217.309(6) Prob > LR: 0.000 McFadden's R2: 0.211 McFadden's Adj R2: 0.197 Maximum Likelihood R2: 0.251 Cragg & Uhler's R2: 0.336 McKelvey and Zavoina's R2: 0.388 Efron's R2: 0.261 Variance of y*: 1.633 Variance of error: 1.000 Count R2: 0.745 Adj Count R2: 0.409 AIC: 1.098 AIC*n: 826.438 BIC: -4129.115 BIC': -177.564 Saved logit 753 -514.873 -406.143 812.286(746) 217.460(6) 0.000 0.211 0.198 0.251 0.337 0.354 0.261 5.090 3.290 0.742 0.403 1.097 826.286 -4129.266 -177.716 Difference 0 0.000 -0.076 0.151(0) -0.151(0) 0.000 -0.000 -0.000 -0.000 -0.000 0.034 -0.001 -3.457 -2.290 0.003 0.006 0.000 0.151 0.151 0.151

Difference of 0.151 in BIC' provides weak support for saved model.

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 35

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 5. PERBANDINGAN ANTARA LPM. LOGIT, DAN PROBIT

MENGGUNAKAN GRAFIK SCATTER PLOT LPM dan Logit berdasarkan hasil estimasi (estimasi probabilitas) scatter inlf lpminlfhat inlf idlpmm ||scatter plgtinlfht idlogit

-.5

.5

1.5

200 Fitted values Pr(inlf)

400

600

800

=1 if in lab frce, 1975 =1 if in lab frce, 1975

LPM dan Probit berdasarkan hasil estimasi (estimasi probabilitas) scatter inlf lpminlfhat inlf idlpmm || scatter prinlfhat idprobit

-.5

.5

1.5

200 Fitted values Pr(inlf)

400

600

800

=1 if in lab frce, 1975 =1 if in lab frce, 1975

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 36

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Logit dan Probit berdasarkan hasil estimasi (estimasi probabilitas) scatter plgtinlfht inlf idprobit idlogit || scatter prinlfhat inlf

.2

.4

.6

.8

200 Pr(inlf) Pr(inlf)

400

600

800

=1 if in lab frce, 1975 =1 if in lab frce, 1975

LPM, Logit dan Probit berdasarkan hasil estimasi (estimasi probabilitas) scatter lpminlfhat inlf idlpmm || scatter prinlfhat inlf plgtinlfht inlf idprobit idlogit || scatter

-.5

.5

1.5

200 Fitted values Pr(inlf) Pr(inlf)

400

600

800

=1 if in lab frce, 1975 =1 if in lab frce, 1975 =1 if in lab frce, 1975

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 37

Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252

Grafik Transformasi Logit dan Probit scatter plgtinlfht inlf lnplgtinlfht || scatter prinlfhat inlf lnprinlfhat

.2

.4

.6

.8

-6

-4 Pr(inlf) Pr(inlf)

-2

0 =1 if in lab frce, 1975 =1 if in lab frce, 1975

DAFTAR PUSTAKA Gujarati, Damodar. 2006. Basic Econometrics. McGraw-Hill. https://dss.princeton.edu/ https://teaching.sociology.ul.ie/ https://wcr.sonoma.edu/ https://www.ats.ucla.edu/ https://www.graphpad.com/ Manual Stata 11. 2009. Stata Press Publication, College Station, Texas
Jika ada kritik dan saran atas modul ini, silahkan email ke akbarsuwardi@gmail.com Segala kritik dan saran sangat berharga bagi penulis.

akbarsuwardi@gmail.com

STATA LPM, Logit, dan Probit Model | 38

Anda mungkin juga menyukai