atau variabel penjelas, dan di mana Zi adalah variabel normal standar, yaitu, Z ∼ N (0, σ²). F
adalah CDF normal standar, yang ditulis secara eksplisit dalam konteks ini adalah:
Karena P merupakan probabilitas bahwa suatu peristiwa akan terjadi, di sini probabilitas
memiliki bentuk yang dapat diukur dengan luas kurva normal standar dari −∞ ke Ii seperti
yang ditunjukkan pada Gambar 15.4a.
Sekarang untuk mendapatkan informasi tentang Ii, indeks utilitas, serta tentang β1 dan β2,
kita mengambil kebalikan dari (15.9.2) untuk mendapatkan:
di mana 𝐹 −1 adalah kebalikan dari CDF normal. Apa artinya semua ini dapat diperjelas dari
Gambar 15.4. Pada panel a dari gambar ini kita memperoleh dari ordinasi (kumulatif)
probabilitas memiliki bentuk yang diberi 𝐼𝑖∗ ≤ Ii, sedangkan pada panel b kita memperoleh
dari absis nilai Ii diberi nilai Pi, yang hanya merupakan kebalikan dari yang pertama.
Tapi bagaimana kita sebenarnya mendapatkan indeks Ii serta memperkirakan β1 dan β2?
Seperti dalam kasus model logit, jawabannya tergantung pada apakah kita telah
mengelompokkan data atau data yang tidak dikelompokkan. Kami mempertimbangkan dua
kasus secara individual.
Kami akan menggunakan data yang sama yang kami gunakan untuk glogit, yang
diberikan pada Tabel 15.4. Karena kita sudah memiliki ˆPi, frekuensi relatif (ukuran empiris
probabilitas) memiliki rumah di berbagai tingkat pendapatan seperti yang ditunjukkan pada
Tabel 15.5, kita dapat menggunakannya untuk memperoleh Ii dari CDF normal seperti yang
ditunjukkan pada Tabel 15.10, atau dari Gambar 15.5.
Setelah kami memiliki estimasi Ii, memperkirakan β1 dan β2 relatif mudah, seperti
yang kami tunjukkan segera. Secara sepintas, perhatikan bahwa dalam bahasa analisis probit,
indeks utilitas yang tidak dapat diobservasi Ii dikenal sebagai penyimpangan ekuivalen
normal (n.e.d.) atau hanya normit. Sejak tanggal atau Ii akan menjadi negatif setiap kali Pi
<0,5, dalam praktiknya angka 5 ditambahkan ke n.e.d. dan hasilnya disebut probit.
Seperti yang dapat Anda lihat dari diskusi sebelumnya, dibandingkan dengan LPM
dan model logit, perhitungan perubahan probabilitas menggunakan model probit agak
membosankan.
Sekarang alat statistik seperti Minitab dapat dengan mudah menghitung probabilitas
(kumulatif) yang terkait dengan berbagai n.i.d. Misalnya, sesuai dengan n.i.d. nilai .60.63,
probabilitas yang diperkirakan adalah 0.2647 dan, sesuai dengan n.i.d. nilai 0,43, probabilitas
yang diperkirakan adalah 0,6691. Jika Anda membandingkan perkiraan ini dengan nilai
aktual yang diberikan pada Tabel 15.5, Anda akan menemukan bahwa keduanya cukup dekat,
menunjukkan bahwa model yang dipasang cukup baik. Secara grafis, apa yang baru saja kita
lakukan sudah ditunjukkan pada Gambar 15.4.
Mari kita lihat kembali Tabel 15.7, yang memberikan data pada 32 individu tentang nilai
akhir mereka dalam ujian ekonomi mikro menengah dalam kaitannya dengan variabel IPK,
TUCE, dan PSI. Hasil regresi logit diberikan pada Tabel 15.8. Mari kita lihat seperti apa
hasilnya nanti. Perhatikan bahwa seperti dalam kasus model logit untuk data individual, kita
harus menggunakan prosedur estimasi nonlinier berdasarkan metode kemungkinan
maksimum. Hasil regresi yang dihitung oleh Eviews 4 diberikan pada Tabel 15.13.
"Secara kualitatif," hasil model probit sebanding dengan yang diperoleh dari model
logit di mana IPK dan PSI secara individual signifikan secara statistik. Secara kolektif, semua
koefisien signifikan secara statistik, karena nilai statistik LR adalah 15.5458 dengan nilai p
0,0014. Untuk alasan yang dibahas dalam bagian selanjutnya, kami tidak dapat langsung
membandingkan koefisien regresi logit dan probit.
The Marginal Effect of a Unit Change in the Value of a Regressor in the Various
Regression Model
Dalam model regresi linier, koefisien kemiringan mengukur perubahan dalam nilai rata-rata
regresi dan untuk perubahan satuan dalam nilai regresor, dengan semua variabel lainnya
dianggap konstan.
Dalam model logit koefisien kemiringan suatu variabel memberikan perubahan dalam
log peluang yang terkait dengan perubahan unit dalam variabel itu, sekali lagi memegang
semua variabel lainnya konstan. Tetapi seperti dicatat sebelumnya, untuk model logit laju
perubahan dalam probabilitas suatu peristiwa terjadi diberikan oleh βj Pi (1 - Pi), di mana βj
adalah koefisien (regresi parsial) dari regresi jth. Tetapi dalam mengevaluasi Pi, semua
variabel yang termasuk dalam analisis terlibat.
Dalam model probit, seperti yang kita lihat sebelumnya, laju perubahan probabilitas
agak rumit dan diberikan oleh βj f (Zi), di mana f (Zi) adalah fungsi kepadatan variabel
normal standar dan Zi = β1 + β2X2i + · · · + ΒkXki, yaitu model regresi yang digunakan
dalam analisis.
Dengan demikian, baik dalam model logit dan probit semua regressor terlibat dalam
menghitung perubahan dalam probabilitas, sedangkan dalam LPM hanya regresor ke-j yang
terlibat. Perbedaan ini mungkin menjadi salah satu alasan popularitas awal model LPM.
Meskipun untuk kelas contoh kami LPM, logit, dan probit memberikan hasil yang serupa
secara kualitatif, kami akan membatasi perhatian kami pada model logit dan probit karena
masalah dengan LPM yang disebutkan sebelumnya. Antara logit dan probit, model mana
yang lebih disukai? Dalam sebagian besar aplikasi, model-modelnya sangat mirip, perbedaan
utamanya adalah bahwa distribusi logistik memiliki ekor yang sedikit lebih gemuk, yang
dapat dilihat pada Gambar 15.6. Artinya, probabilitas bersyarat Pi mendekati nol atau satu
pada tingkat yang lebih lambat di logit daripada di probit. Ini bisa dilihat lebih jelas dari
Tabel 15.15. Karena itu, tidak ada alasan kuat untuk memilih satu dari yang lain. Dalam
praktiknya banyak peneliti memilih model logit karena kesederhanaan matematis
komparatifnya.
Meskipun modelnya serupa, kita harus berhati-hati dalam menafsirkan koefisien yang
diperkirakan oleh kedua model. Misalnya, untuk contoh tingkat kami, koefisien IPK 1,6258
dari model probit dan 2,8261 dari model logit tidak dapat dibandingkan secara langsung.
Alasannya adalah bahwa, walaupun logistik standar (basis logit) dan distribusi normal standar
(basis probit) keduanya memiliki nilai rata-rata nol, varians mereka berbeda; 1 untuk standar
normal (seperti yang sudah kita ketahui) dan π2 / 3 untuk distribusi logistik, di mana π ≈
22/7. Oleh karena itu, jika Anda mengalikan koefisien probit sekitar 1,81 (yang kira-kira = π /
√ 3), Anda akan mendapatkan kira-kira koefisien logit. Sebagai contoh kami, koefisien probit
IPK adalah 1,6258. Mengalikan ini dengan 1,81, kita memperoleh 2,94, yang dekat dengan
koefisien logit. Atau, jika Anda mengalikan koefisien logit dengan 0,55 (= 1 / 1,81), Anda
akan mendapatkan koefisien probit. Amemiya, bagaimanapun, menyarankan mengalikan
estimasi logit dengan 0,625 untuk mendapatkan estimasi yang lebih baik dari estimasi probit
yang sesuai. Sebaliknya, mengalikan koefisien probit dengan 1,6 (= 1 / 0,625) memberikan
koefisien logit yang sesuai.