Anda di halaman 1dari 6

di mana P (Y = 1 | X) berarti probabilitas bahwa suatu peristiwa terjadi mengingat nilai X,

atau variabel penjelas, dan di mana Zi adalah variabel normal standar, yaitu, Z ∼ N (0, σ²). F
adalah CDF normal standar, yang ditulis secara eksplisit dalam konteks ini adalah:

Karena P merupakan probabilitas bahwa suatu peristiwa akan terjadi, di sini probabilitas
memiliki bentuk yang dapat diukur dengan luas kurva normal standar dari −∞ ke Ii seperti
yang ditunjukkan pada Gambar 15.4a.

Sekarang untuk mendapatkan informasi tentang Ii, indeks utilitas, serta tentang β1 dan β2,
kita mengambil kebalikan dari (15.9.2) untuk mendapatkan:

di mana 𝐹 −1 adalah kebalikan dari CDF normal. Apa artinya semua ini dapat diperjelas dari
Gambar 15.4. Pada panel a dari gambar ini kita memperoleh dari ordinasi (kumulatif)
probabilitas memiliki bentuk yang diberi 𝐼𝑖∗ ≤ Ii, sedangkan pada panel b kita memperoleh
dari absis nilai Ii diberi nilai Pi, yang hanya merupakan kebalikan dari yang pertama.
Tapi bagaimana kita sebenarnya mendapatkan indeks Ii serta memperkirakan β1 dan β2?
Seperti dalam kasus model logit, jawabannya tergantung pada apakah kita telah
mengelompokkan data atau data yang tidak dikelompokkan. Kami mempertimbangkan dua
kasus secara individual.

Probis Etimation with Grouped Data: gprobit

Kami akan menggunakan data yang sama yang kami gunakan untuk glogit, yang
diberikan pada Tabel 15.4. Karena kita sudah memiliki ˆPi, frekuensi relatif (ukuran empiris
probabilitas) memiliki rumah di berbagai tingkat pendapatan seperti yang ditunjukkan pada
Tabel 15.5, kita dapat menggunakannya untuk memperoleh Ii dari CDF normal seperti yang
ditunjukkan pada Tabel 15.10, atau dari Gambar 15.5.
Setelah kami memiliki estimasi Ii, memperkirakan β1 dan β2 relatif mudah, seperti
yang kami tunjukkan segera. Secara sepintas, perhatikan bahwa dalam bahasa analisis probit,
indeks utilitas yang tidak dapat diobservasi Ii dikenal sebagai penyimpangan ekuivalen
normal (n.e.d.) atau hanya normit. Sejak tanggal atau Ii akan menjadi negatif setiap kali Pi
<0,5, dalam praktiknya angka 5 ditambahkan ke n.e.d. dan hasilnya disebut probit.

Interpretasi Estimasi Probit pada Tabel 15.11.

Bagaimana kita menginterpretasikan hasil sebelumnya? Misalkan kita ingin mengetahui


pengaruh perubahan satuan dalam X (pendapatan diukur dalam ribuan dolar) pada
probabilitas bahwa Y = 1, yaitu, keluarga membeli rumah. Untuk melakukan ini, lihat
Persamaan. (15.9.2). Kami ingin mengambil turunan dari fungsi ini sehubungan dengan X
(yaitu, tingkat perubahan probabilitas sehubungan dengan pendapatan). Ternyata turunan ini
adalah:
di mana f (β1 + β2Xi) adalah fungsi kepadatan probabilitas normal standar yang dievaluasi
pada β1 + β2Xi. Seperti yang akan Anda sadari, evaluasi ini akan tergantung pada nilai
tertentu dari variabel X. Mari kita ambil nilai X dari Tabel 15.5, katakanlah, X = 6 (ribu
dolar). Dengan menggunakan nilai estimasi dari parameter yang diberikan pada Tabel 15.11,
kami ingin menemukan fungsi kerapatan normal pada f [.01.0166 + 0,04846 (6)] = f
(−0.72548). Jika Anda merujuk ke tabel distribusi normal, Anda akan menemukan bahwa
untuk Z = .70.72548, kepadatan normal adalah sekitar 0,3066.33 Sekarang mengalikan nilai
ini dengan estimasi koefisien kemiringan 0,04846, kami memperoleh 0,01485. Ini berarti
bahwa dimulai dengan tingkat pendapatan $ 6000, jika pendapatan naik $ 1000, probabilitas
keluarga yang membeli rumah naik sekitar 1,4 persen. (Bandingkan hasil ini dengan yang
diberikan pada Tabel 15.6.)

Seperti yang dapat Anda lihat dari diskusi sebelumnya, dibandingkan dengan LPM
dan model logit, perhitungan perubahan probabilitas menggunakan model probit agak
membosankan.

Alih-alih menghitung perubahan dalam probabilitas, misalkan Anda ingin mencari


probabilitas yang diperkirakan dari model gprobit yang dipasang. Ini bisa dilakukan dengan
mudah. Menggunakan data pada Tabel 15.11 dan memasukkan nilai-nilai X dari Tabel 15.5,
pembaca dapat memeriksa bahwa estimasi n.i.d. nilai (untuk dua digit) adalah sebagai
berikut:

Sekarang alat statistik seperti Minitab dapat dengan mudah menghitung probabilitas
(kumulatif) yang terkait dengan berbagai n.i.d. Misalnya, sesuai dengan n.i.d. nilai .60.63,
probabilitas yang diperkirakan adalah 0.2647 dan, sesuai dengan n.i.d. nilai 0,43, probabilitas
yang diperkirakan adalah 0,6691. Jika Anda membandingkan perkiraan ini dengan nilai
aktual yang diberikan pada Tabel 15.5, Anda akan menemukan bahwa keduanya cukup dekat,
menunjukkan bahwa model yang dipasang cukup baik. Secara grafis, apa yang baru saja kita
lakukan sudah ditunjukkan pada Gambar 15.4.

The Probit Model for Ungrouped or Individual Data

Mari kita lihat kembali Tabel 15.7, yang memberikan data pada 32 individu tentang nilai
akhir mereka dalam ujian ekonomi mikro menengah dalam kaitannya dengan variabel IPK,
TUCE, dan PSI. Hasil regresi logit diberikan pada Tabel 15.8. Mari kita lihat seperti apa
hasilnya nanti. Perhatikan bahwa seperti dalam kasus model logit untuk data individual, kita
harus menggunakan prosedur estimasi nonlinier berdasarkan metode kemungkinan
maksimum. Hasil regresi yang dihitung oleh Eviews 4 diberikan pada Tabel 15.13.
"Secara kualitatif," hasil model probit sebanding dengan yang diperoleh dari model
logit di mana IPK dan PSI secara individual signifikan secara statistik. Secara kolektif, semua
koefisien signifikan secara statistik, karena nilai statistik LR adalah 15.5458 dengan nilai p
0,0014. Untuk alasan yang dibahas dalam bagian selanjutnya, kami tidak dapat langsung
membandingkan koefisien regresi logit dan probit.

Untuk tujuan perbandingan, kami menyajikan hasil berdasarkan model probabilitas


linier (LPM) untuk data kelas pada Tabel 15.14. Sekali lagi, secara kualitatif, hasil LPM
mirip dengan model logit dan probit di mana IPK dan PSI secara individual signifikan secara
statistik tetapi TUCE tidak. Juga, bersama-sama variabel penjelas memiliki dampak yang
signifikan pada kelas, karena nilai F dari 6,6456 signifikan secara statistik karena nilai p-nya
hanya 0,0015.

The Marginal Effect of a Unit Change in the Value of a Regressor in the Various
Regression Model

Dalam model regresi linier, koefisien kemiringan mengukur perubahan dalam nilai rata-rata
regresi dan untuk perubahan satuan dalam nilai regresor, dengan semua variabel lainnya
dianggap konstan.

Dalam LPM, koefisien kemiringan mengukur secara langsung perubahan dalam


probabilitas suatu peristiwa yang terjadi sebagai hasil dari perubahan satuan dalam nilai
regressor, dengan pengaruh semua variabel lain tetap konstan.

Dalam model logit koefisien kemiringan suatu variabel memberikan perubahan dalam
log peluang yang terkait dengan perubahan unit dalam variabel itu, sekali lagi memegang
semua variabel lainnya konstan. Tetapi seperti dicatat sebelumnya, untuk model logit laju
perubahan dalam probabilitas suatu peristiwa terjadi diberikan oleh βj Pi (1 - Pi), di mana βj
adalah koefisien (regresi parsial) dari regresi jth. Tetapi dalam mengevaluasi Pi, semua
variabel yang termasuk dalam analisis terlibat.

Dalam model probit, seperti yang kita lihat sebelumnya, laju perubahan probabilitas
agak rumit dan diberikan oleh βj f (Zi), di mana f (Zi) adalah fungsi kepadatan variabel
normal standar dan Zi = β1 + β2X2i + · · · + ΒkXki, yaitu model regresi yang digunakan
dalam analisis.

Dengan demikian, baik dalam model logit dan probit semua regressor terlibat dalam
menghitung perubahan dalam probabilitas, sedangkan dalam LPM hanya regresor ke-j yang
terlibat. Perbedaan ini mungkin menjadi salah satu alasan popularitas awal model LPM.

15.10 Logit and Probit Models

Meskipun untuk kelas contoh kami LPM, logit, dan probit memberikan hasil yang serupa
secara kualitatif, kami akan membatasi perhatian kami pada model logit dan probit karena
masalah dengan LPM yang disebutkan sebelumnya. Antara logit dan probit, model mana
yang lebih disukai? Dalam sebagian besar aplikasi, model-modelnya sangat mirip, perbedaan
utamanya adalah bahwa distribusi logistik memiliki ekor yang sedikit lebih gemuk, yang
dapat dilihat pada Gambar 15.6. Artinya, probabilitas bersyarat Pi mendekati nol atau satu
pada tingkat yang lebih lambat di logit daripada di probit. Ini bisa dilihat lebih jelas dari
Tabel 15.15. Karena itu, tidak ada alasan kuat untuk memilih satu dari yang lain. Dalam
praktiknya banyak peneliti memilih model logit karena kesederhanaan matematis
komparatifnya.

Meskipun modelnya serupa, kita harus berhati-hati dalam menafsirkan koefisien yang
diperkirakan oleh kedua model. Misalnya, untuk contoh tingkat kami, koefisien IPK 1,6258
dari model probit dan 2,8261 dari model logit tidak dapat dibandingkan secara langsung.
Alasannya adalah bahwa, walaupun logistik standar (basis logit) dan distribusi normal standar
(basis probit) keduanya memiliki nilai rata-rata nol, varians mereka berbeda; 1 untuk standar
normal (seperti yang sudah kita ketahui) dan π2 / 3 untuk distribusi logistik, di mana π ≈
22/7. Oleh karena itu, jika Anda mengalikan koefisien probit sekitar 1,81 (yang kira-kira = π /
√ 3), Anda akan mendapatkan kira-kira koefisien logit. Sebagai contoh kami, koefisien probit
IPK adalah 1,6258. Mengalikan ini dengan 1,81, kita memperoleh 2,94, yang dekat dengan
koefisien logit. Atau, jika Anda mengalikan koefisien logit dengan 0,55 (= 1 / 1,81), Anda
akan mendapatkan koefisien probit. Amemiya, bagaimanapun, menyarankan mengalikan
estimasi logit dengan 0,625 untuk mendapatkan estimasi yang lebih baik dari estimasi probit
yang sesuai. Sebaliknya, mengalikan koefisien probit dengan 1,6 (= 1 / 0,625) memberikan
koefisien logit yang sesuai.

Anda mungkin juga menyukai