Anda di halaman 1dari 16

Asistensi Ekonometrika Program Pascasarjana Ilmu Ekonomi (PPIE)

(LPM (Linear Probability Model), Logit Model, dan Probit Model, Ordered, Multinomial
Logistic Model) – 4/1/2021
(Asisten Dosen: Novani Karina Saputri)

Kenali istilah dalam model:

P(Y=1) = Pi

Probabilitas terjadinya peristiwa Y=1. Contoh probabilitas suatu proyek mendapatkan


NPV bernilai negatif adalah 30% dari seluruh nilai proyek di sepanjang periodel t.

Odds = Pi/1-Pi

Tidak seperti pada analisis regresi linier berganda/sederhana, interpretasi pada analisis
regresi logistik tidak dapat langsung dibaca melalui nilai koefisiennya. Untuk dapat
diinterpretasikan, terlebih dahulu nilai koefisien setiap variabel harus di-eksponensial-
kan yang sering disebut sebagai analisis odd rasio. Analisis: Ketika terjadi kenaikan 1
satuan variabel X maka probabilitas kejadian i=1 akan meningkat sebesar nilai β kali.
Nilai Odds Ratio mewakili kemungkinan untuk inlf = 1 ketika variabel X meningkat
sebesar 1 unit satuan. Nilai ini adalah exp (logit coeff). Jika > ATAU 1 maka
kemungkinan inlf = 1 meningkat. Jika < ATAU 1 maka kemungkinan inlf = 1
menurun. Lihatlah tanda koefisien logit
LPM (Linear Probability Model),

Linear Probability Model (LPM) merupakan metode regresi yang umum digunakan sebelum
logit dan probit model dikembangkan. LPM bekerja dengan dasar bahwa variabel responsY,
yang merupakan probabilitas terjadinya sesuatu, mengikuti Bernoulli probability distribution.

Angka koefisien yang dihasilkan menjelaskan bilai probabilitas kejadian suatu kategori
tertentu.

Nilai expected value Y terhadap X atau Pi memiliki hubungan yang tidak linear baik terhadap
X maupun terhadap β sehingga model spesifikasi yang akan terbentuk tidak dapat diestimasi
dengan menggunakan regresi OLS. Apabila diestimasi maka akan menyebabkan bias karena
estimasi nilai Y (yhat) tidak lagi kategorikal, terdapat masalah heterokedastisitas, dan nilai
eror tidak terdistribusi normal. Karena tidak terpenuhinya ekspektasi nilai Y antara satu
sampai dengan nol, dan tidak dapat digunakannya R² sebagai pengukur Goodness of Fit.

Pertanyaan: Bagaimana cara membuktikan nilai estimasi lebih dari 1?


Di mana dari nilai variabel tersebut kita masukan ke dalam model LPM yang telah kita
dapatkan koefisiennya dari hasil estimasi di atas. Terlihat bahwa estimasi yang kita peroleh
bisa lebih dari 1, padahal data sebenarnya data kita hanya antara 0 dan 1. Oleh karena itu,
permasalahan tersebut merupakan salah satu kelemahan dari LPM.

STATA Commands:
LOGIT MODEL

Agar analisis linear tetap dapat dilakukan, maka diperlukan transformasi nilai dependen tanpa
mengubah arti dari nilai kategorikal tersebut. Solusi yang dapat digunakan dalam analisis ini
adalah dengan menggunakan log rasio kecenderungan (odds ratio) terjadinya kategori dimana
nilai log odds ratio ini tidak hanya berhubungan linear terhadap X, namun juga linear
terhadap β. Nilai pada L (logit) yang bernilai positif menandakan bahwa meningkatnya nilai
regresor akan menyebabkan meningkatnya odds dari regresan yang setara dengan 1.
Sebaliknya, L (logit) yang bernilai negatif menandakan bahwa menurunnya odds dari
regresan yang setara dengan 1.

Pengolahan Logit

 Untuk menguji signifikansi suatu koefisien secara statistik, kita menggunakan Z


statistik (distribusi normal).
 Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan
R2, untuk mengukur goodness of fit. Program Stata secara otomatis menyediakan
pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2.
 Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik.
LR statistik mengikuti ditribusi χ2 dengan derajat kebebasan (degree of freedom)
sama dengan jumlah variabel bebas
 Uji rasio likelihood terhadap model nol menghasilkan statistik penguji sebesar
XXX.X yang berdistribusi chi-kuadrat dengan derajat bebas dan nilai p = 0.0000.
 Mencari Odds Ratio dari setiap variabel independent
 Margina Effek dari setiap variabel independent
 Mencari probabilitas setiap variabel independent terhadap variabel dependentnya

STATA Commands:
 LR (Likelihood Rasio) merupakan mengganti F-stat yang berfungsi untuk menguji
apakah semua variabel independen secara serentak mampu menjelaskan variabel
dependen. Pada output di atas dijelaskan bahwa dengan tingkat keyakinan 95%
probabilitas LR adalah 0;000 yang artinya tolak H0/ semua variabel secara serentak
mempengaruhi variabel dependen

 Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan
R2, untuk mengukur goodness of fit. Dala, hal ini, pseudo R2 menjelaskan persentase
variabel dependen yang mampu dijelaskan oleh semua variabel independen. Namun
nilai pseudo R2 ini digenerate dengan metode memaksimalkan likelohood function.
 Odd Ratio kidslt6= 0,23, artinya semakin bertambah 1 anak usia di bawah 6 tahun maka
menurunkan peluang seorang ibu bekerja adalah 0,23 kali lipat

Melihat Odds ratio pada different levels di setiap variable


Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun)
maka kemungkinan (the odds of) inlf=1 (bekerja) akan meningkat dengan faktor sebesar
1.85037 (controlling by the other variables). Misalnya contoh lain, ketika kids<6 years = 3
(perempuan memiliki anak dibawah 6 tahun sebanyak 3) maka kemungkinan (the odds of)
inlf=1 (bekerja) hours akan menurun dengan faktor sebesar .023302 (controlling by the other
variables).

Memprediksi probabilitas pada different levels di setiap variable di Model Logit


Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun)
maka probabilita inlf=1 (kerja) adalah .649168 atau 64.91%. (controlling by the other
variables). ketika kids<6 years = 2 (perempuan memiliki anak dibawah 6 tahun sebanyak 2)
maka probabilita inlf=1 (kerja) adalah .224538 atau 22.45%. (controlling by the other
variables). Hasil dari Probabilitas tersebut berasal dari persamaan logit diatas.

Efek marginal rata-rata dari setiap variabel peubah (multiplier) Model Logit

Penjelasannya: Pertama, terlihat bahwa ada marjinal efek tabel terpisah untuk setiap alternatif
dan tabel yang diawali dengan melaporkan keseluruhan probabilitas memilih alternatif,
misalnya, 0,58774394. Kedua, penjelasan untuk marginal tiap variable, misal untuk variabel
kidslt6, secara rata-rata ketika nilai kidslt6 naik satu satuan maka kemungkinan perempuan
untuk infl=1 (bekerja) akan turun sebesar 0.3487663 point atau 34.88%. contoh lain, misal
untuk variabel educ, secara rata-rata ketika nilai educ naik satu satuan maka kemungkinan
perempuan untuk infl=1 (bekerja) akan naik sebesar 0.0549967 point atau sebesar 5.5%.

Pengujian Sensitivity dan Specitivity


Pada pengujian ini prinsipnya sama dengan uji goodness of fit sebagai bentuk perwakilan
pengganti R2, dengan melihat melalui specitivity & sensitivity. Dengan cara:

Berdasarkan hasil diatas dapat disimpulkan:


 Specitivity : observasi hasil negative yang dinyatakan secara negative secara benar
sebesar 65.23%%

 Sensitivity : observasi hasil positive yang dinyatakan secara positive secara benar
sebesar 81.07%

 Secara Overall : model mampu menyatakan secara benar sebesar 74.24%


MODEL PROBIT

Model probit adalah salah satu model dari cummulative distribution function (CDF), yaitu
model statistik yang sering digunakan untuk data dengan distribusi binomial. Model ini
digunakan untuk menganalisis model dengan variabel dependen yang memiliki hasil binary—
yaitu y = 1 untuk menandakan suksesnya sebuah kejadian, dan y = 0 untuk menandakan
gagalnya sebuah kejadian. Terdapat beberapa asumsi yang mengikuti model probit, pertama,
kita berasumsi bahwa peluang kejadian sukses satu kejadian bergantung kepada latent
variabel atau yang tidak dapat di observasi, dimana akan ditentukan oleh variabel penjelas.

Pada dasarnya perbedaan logit dan probit adalah Jika Logit – Cumulative standard logistic
distribution (F), sedangkan Probit – Cumulative standard normal distribution (Φ). Namun
Pada akhirnya dari dua model tersebut memiliki hasil yang persis sama.(Oscar Torres,
Princeton University)

Pengolahan Probit
 Untuk menguji signifikansi suatu koefisien secara statistik, kita menggunakan Z
statistik (distribusi normal).

 Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan
R2, untuk mengukur goodness of fit. Program Stata secara otomatis menyediakan
pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2.
 Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik.
LR statistik mengikuti ditribusi χ2 dengan derajat kebebasan (degree of freedom)
sama dengan jumlah variabel bebas
 Margina Effek dari setiap variabel independent
 Mencari probabilitas setiap variabel independent terhadap variabel dependentnya
 Sensitivity; yang menyatakan seberapa besar hasil observasi positif secara tepat
dinyatakan positif.
 Specitivity; yang menyatakan seberapa besar hasil observasi negatif secara tepat
dinyatakan negatif.
 Meninjau grafik antar sensitivity/specitivity dan probability cut-off; jika koordinat (x
< 0,5, y > 0,5) maka dapat dinyatakan bahwa model tersebut semakin baik dan stabil.
STATA Commands:

Melihat taksiran nilai Z, dengan membentuk model sesuai dengan hasil run probit untuk
mendapatkan nilai Z (starting point) untuk model probit

Z= -0.87 (kidslt6) + 0.034(kidage) – 0.055(age) + 0.133(educ) – 0.0115(nwifeinc) +


0.07(exper) + e

misalkan kita ingin melihat data kita pada baris satu dari stata dan melihat berapa Nilai
Probabilitas Prediksi dengan probit, maka dapat dilakukan dengan seperti berikut:
Melihat exp (e) ratio pada different levels di setiap variable di Model Probit

Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun)
maka kemungkinan (the odds of) inlf=1 (bekerja) akan meningkat dengan faktor sebesar
1.4445 (controlling by the other variables). Misalnya contoh lain, ketika kids<6 years = 3
(perempuan memiliki anak dibawah 6 tahun sebanyak 3) maka kemungkinan (the odds of)
inlf=1 (bekerja) hours akan meningkat dengan faktor sebesar 0.104823 (controlling by the
other variables).

Memprediksi probabilitas pada different levels di setiap variable di Model Probit

Penjelasannya: ketika kids<6 years = 0 (perempuan tidak memiliki anak dibawah 6 tahun)
maka probabilita inlf=1 (kerja) adalah 0.643474 atau 64.38 %. (controlling by the other
variables). ketika kids<6 years = 2 (perempuan memiliki anak dibawah 6 tahun sebanyak 2)
maka probabilita inlf=1 (kerja) adalah 0.224724 atau 22.47%. (controlling by the other
variables). Hasil dari Probabilitas tersebut berasal dari persamaan logit diatas.

Efek marginal rata-rata dari setiap variabel perubah (multiplier)


Penjelasannya: Pertama terlihat bahwa ada marjinal efek tabel terpisah untuk setiap alternatif
dan tabel yang diawali dengan melaporkan keseluruhan probabilitas memilih alternatif,
misalnya, 0.58379791. Sedangkan penjelasan untuk marginal tiap variable, misal untuk
variabel kidslt6, secara rata-rata ketika nilai kidslt6 naik satu satuan maka kemungkinan
perempuan untuk infl=1 (bekerja) akan turun sebesar 0.341069 point atau 34.11%. contoh
lain, misal untuk variabel educ, secara rata-rata ketika nilai educ naik satu satuan maka
kemungkinan perempuan untuk infl=1 (bekerja) akan naik sebesar 0.0521537point atau
sebesar 5.2%.

Pengujian Sensitivity dan Specitivity


Berdasarkan hasil diatas dapat disimpulkan:
 Specitivity : observasi hasil negative yang dinyatakan secara negative secara benar
sebesar 65.54%%

 Sensitivity : observasi hasil positive yang dinyatakan secara positive secara benar
sebesar 81.31%

 Secara Overall : model mampu menyatakan secara benar sebesar 74.50%

PERBANDINGAN ANTARA LOGIT DAN PROBIT DENGAN UJI FITSTAT


Sumber:

Modul STATA: LPM, Logit, dan Probit Model, Laboraturium Komputasi Departemen Ilmu
Ekonomi, FEB UI, 2011

Anda mungkin juga menyukai