5.probit Logit Complete

MODEL RESPON
KUALITATIF
Anggota Kelompok:
Valian Mahdi Syhabi Nur Hasyim 041624153015
Sudrajat Dharmawansyah 041624153011
Kudang Boro Suminar 041624153024
FAKULTAS EKONOMI DAN BISNIS

PROGRAM STUDI MAGISTER SAINS MANAJEMEN
UNIVERSITAS AIRLANGGA SURABAYA
Model Respons Kualitatif
1. Model Respons Kualitatif
Pembahasan pada bab ini untuk mencari jawaban atas pertanyaan-pertanyaan berikut :
A. Bagaimana cara mengestimasi model regresi respons kualitatif ? Dapatkah kita

menyederhanakan estimasi dengan prosedur OLS yang biasanya ?
B. Apakah ada masalah interferensi khusus ? Dengan kata lain, apakah hipotesis menguji
prosedur perbedaan antara satu dengan yang lain yang telah dipelajari sejauh ini ?
C. Jika suatu regresi adalah kualitatif, bagaimana cara mengukur goodness of fit atau kesesuaian
model dari banyak model ?
D. Bagaimana cara mengestimasi model regresi polikotomi ? Juga bagaiman cara mengendalikan
model regresi yang bersifat ordinal ?
E. Bagaimana cara memodelkan banyak fenomena yang melibatkan banyak angka, data, dan
juga data nominal ?
Ada empat pendekatan untuk mengembangkan suatu model probabilitas untuk variabel
dependen yang bersifat biner yaitu model probabilitas linier, model logit, model probit, dan model
tobit. Untuk review kali ini fokus pada pembahasan model logit dan probit.
2. Model Logit
Pada model probabilitas linier (LPM) dirumuskan model yaitu : Pi = β1 + β2 X2, sedangkan model
𝟏 𝒆𝒛
logit dirumuskan berikut : Pi = = . Kemudian untuk menghitung probabilitas
𝟏+𝒆−𝒁𝒊 𝟏+𝒆𝒁
𝐏𝒊 𝟏+ 𝐞𝒁𝒊
dengan menggunakan persamaan : = 𝟏+ 𝒆−𝒁𝒊 = 𝒆𝒁𝒊 . Dimana Pi/(1 – Pi) adalah bentuk
𝟏−𝑷𝟏
sederhana dari odds ratio untuk menentukan rasio probabilitas dari regresi yang dimodelkan. Odds
dan probabilitas memberikan informasi yang sama tetapi dalam bentuk yang berbeda. Mengubah
odds ratio menjadi probabilitas atau sebaliknya dapat dilakukan dengan mudah, misalkan,
𝟏𝟎 𝑷𝒊 𝟎,𝟗𝟎𝟗
Pi = = 0,909 dan Oddsi = = = 10.
𝟏+𝟏𝟎 𝟏−𝑷𝒊 𝟏−𝟎,𝟗𝟎𝟗
Perhitungan odds ratio yang telah disebutkan dapat dirumuskan nilai log naturalnya
𝑃
menjadi berikut : Li = ln(1− 𝑖𝑃 ) = 𝑍𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 . Rumus yang sudah dituliskan ini menyebutkan
𝑖
bahwa log dari odd adalah fungsi linier dari variabel bebas dan dapat diinterpretasikan seperti
koefisien pada analisis regresi. Jika koefisien positif maka log dari odds akan meningkat jika
variabel bebas atau independen meningkat dan juga akan berlaku jika koefisien negatif. Variabel
independennya dapat berupa kombinasi variabel metrik maupun non metrik.oleh karena itu log
dari odds disebut sebagai logit maka persamaan regresinya disebut regresi logistik.
3. Estimasi Model Logit

𝑃
Mengestimasi model logit dengan menggunakan persamaan Li = ln(1− 𝑖𝑃 ) = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
𝑖
dan terdapat dua jenis data yaitu, data pada tingkat individu atau makro dan data kelompok atau
replikasi. Data pada tingkat individu tidak dapat dilakukan estimasi dengan OLS standard dan
harus menggunakan metode maximum-likelihood untuk melakukan estimasi. Pada data kelompok
atau replikasi mengestimasi model menggunakan OLS. Tahapan pada estimasi regresi logit, antara
lain :
1. Pada setiap variabel independen, menghitung probabilitas dari variabel dependen.
𝑃
2. Untuk setiap variabel independen, mendapatkan logit sebagaimana rumus Li = ln(1− 𝑖𝑃 ).
𝑖
𝑃
3. Jika terdapat heteroskedastisitas diselesaikan dengan mengubah persamaan Li = ln(1− 𝑖𝑃 ) =
𝑖
𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖 menjadi Li* = β1 √𝑤𝑖 + β2 Xi* + vi . Persamaan perlu diubah mengingat varian

eror asli yakni σu2 = 1/[Ni Pi (1 − Pi)].
4. Mengestimasi persamaan √𝑤𝑖 Li = β1 √𝑤𝑖 + β2 √𝑤𝑖 Xi + √𝑤𝑖 ui dengan OLS.
5. Membangun interval kepercayaan atau menguji hipotesis pada kerangka OLS.
Untuk menguji H0 dan alternatifnya, L ditransformasikan menjadi -2logL atau biasa
disebut sebagai likelihood X2 dimana X2 ditribusi dengan degree of freedom n-q, q adalah jumlah
parameter dalam model. Statistik -2logL dapat juga digunakan untuk menentukan jika variabel
independen ditambahkan kedalam model apakah secara signifikan memperbaiki model fit.
Estimasi maximum likelihood parameter dari model dapat dilihat pada persamaaannya. Jika
variabel independen dianggap konstan, maka log dari odds akan naik dibandingkan variabel Y2.
Regresi multinomial logit adalah pengembangan dari regresi biner (dua kategori) logit jika
variabel dependen memiliki kategori lebih dari dua. Kategori pada multinomial ini harus dipilih
salah satu sebagai kategori referensi yang digunakan sebagai pembanding untuk analisis dan jika
pada sampel ada satu kategori yang memiliki jumlah terbanyak maka akan digunakan sebagai
referensi. Jika variabel dependen berupa data ordinal, maka analisis logit harus menggunakan
regresi ordinal. Pseudo R2 digunakan untuk menjelaskan seberapa besar variabel dependen yang
dapat dijelaskan oleh semua variabel independen.
4. Model Probit
Regresi logit didalam mengestimasikan model menggunakan fungsi kumulatif logistik

(CLF). Fungsi kumulatif logistik bukan satu-satunya fungsi kumulatif distibusi (CDF) yang dapat
digunakan. Pada beberapa aplikasi normal CDF model estimasi sering disebut dengan model probit
atau model normit. Prinsipnya adalah mengganti logistif CDF dengan normal CDF dan melakukan
analisis seperti halnya pada regresi logistik. Persamaan pada model probit dinyatakan It = 𝛽1 +
𝛽2 𝑋𝑡 . Asumsi pada model probit ini adalah model harus berdistribusi normal dan non
multikolinearitas. Pada model probit, perubahan koefisien slope pada beberapa aplikasi
probabilitasnya cukup rumit dan dimana pada βj f (Zi), f (Zi) adalah fungsi density pada variabel
normal standard dan Zi = 𝛽1 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 adalah model regresi yang digunakan pada
analisis.
5. Model Logit dan Probit
Model logit dan probit memberikan hasil yang seragam. Perbedaan utama dari keduanya adalah
bahwa distribusi logit memiliki ujung kurva yang sedikit lebih gemuk. Tetapi, tidak ada
argumentasi yang menyatakan bahwa ada alasan kuat untuk memilih salah satu dari keduanya.
Pada penerapannya, banyak peneliti yang memilih model logit karena kesederhanaan komparatif
pada matematika. Meskipun begitu, peneliti harus berhati-hati saat menginterpretasi koefisiensi
estimasi dari kedua model ini karena keduanya tidak dapat secara langsung dibandingkan.
Alasannya adalah meskipun standar logistik dan standar distribusi normal keduanya memiliki nilai
rata-rata nol, variannya berbeda
Contoh Kasus : The Effect of Personalized System of Instruction (PSI) on Course Grades
Data yang digunakan berasal dari Tabel 15.7 pada Buku Basic Econometrics (Gujarati, 2008) yang
melihat pengaruh metode pembelajaran terhadap nilai mata kuliah. Data ini kemudian kami olah
dengan Probit dan Logit menggunakan softwere Eviews 8.
Logistic Regression
Berdasarkan output di atas, dapat diketahui bahwa variabel GPA memiliki nilai koefisien
sebesar 2,826113 dan p-value sebesar 0,0252, jika dihitung nilai antilognya menggunakan
koefisien variabel GPA (2,826113) akan diperoleh nilai antilog-nya sebesar 16,8789. Hal ini
menunjukkan bahwa mahasiswa memiliki probabilitas 16 kali lebih besar mendapatkan nilai A
jika memiliki nilai GPA yang tinggi.
Variabel TUCE memiliki nilai koefisien sebesar 0,095158 dan p-value sebesar 0,5014, jika
jika dihitung nilai antilognya menggunakan koefisien variabel TUCE (0,095158 akan diperoleh
nilai antilog-nya sebesar 1,0998. Hal ini menunjukkan bahwa mahasiswa memiliki probabilitas
satu kali lebih besar mendapatkan nilai A jika memiliki skor ujian yang diberikan pada awal
semester untuk pengetahuan ekonomi makro yang tinggi.
Variabel PSI memiliki nilai koefisien sebesar 2,378688 dan p-value sebesar 0,0255, jika
dihitung nilai antilognya dari koefisien variabel PSI (2,378688) akan diperoleh nilai antilog-nya
sebesar 10,7897. Hal ini menunjukkan bahwa mahasiswa yang mendapatkan metode pembelajaran
baru memiliki probabilitas mendapatkan nilai A sebesar 10 kali lipat dibandingkan dengan
mahasiswa yang mendapatkan metode pembelajaran lama.
LR Stratistik menunjukkan nilai sebesar 15,40419 dan p-value (LR Statistics) sebesar
0,001502 yang artinya secara bersama-sama ketiga variabel berpengaruh signifikan terhadap
Grade. McFadden R-squared menunjukkan sebesar 0,374038, yang artinya bahwa variabilitas
variabel dependen yang dapat dijelaskan oleh variabilitas variabel independen sebesar 37,40%.
Uji Goodness-of-fit Test (Hosmer-Lemeshow)
Hosmer and Lemeshow’s (HL) test digunakan untuk menguji hipotesis nol bahwa tidak ada
perbedaan antara mdel dengan data, sehingga model dapat dikatakan fit. Jika nilai Statistics HL
Goodness-of-fit lebih besar dari 0,05, maka hipotesis nol tidak dapat ditolak dan berarti model
mampu memprediksi nilai observasinya atau dapat dikatakan model dapat diterima karena cocok
dengan data observasinya.Pada uji dapat dirumuskan hipotesis sebagai berikut:
Ho = Model yang dibentuk fit dengan data.
H1 = Model yang dibentuk tidak fit dengan data.
Dapat diketahui bahwa besarnya nilai HL Statistics sebesar 6,5691 dengan probabilitas
signifikansi 0,5838 yang berarti nilai HL statistics > 0,05, dengan demikian dapat disimpulkan
bahwa model dapat diterima. Selain menggunakan McFadden R-suared dan Uji Hosmer and
Hosmer and Lemeshow’s (HL), kita juga dapat menggunakan nilai percently correctly predicted.
Semakin besar persentasi prediksi maka model yang dibentuk semakin baik.
Berdasarkan output percently correctly predicted di atas, dapat diketahui bahwa nilai Total
% Correct sebesar 81,25 yang menunjukkan bahwa akurasi prediksi dari model yang dibentuk
mencapai 81,25% sehingga dapat disimpulkan bahwa model yang dibentuk cukup baik.
Probit Regression
Dapat pada gambar di atas, bahwa hasil estimasi untuk variabel GPA berpengaruh
signifkan positif terhadap probabilitas mendapatkan nilai A, hal ini ditunjukkan dengan koefisien
sebesar 1,625810 dan p-value sebesar 0,0191 < 0,05, yang mengindikasikan dari setiap kenaikan
GPA sebesar 1 satuan akan meningkatkan Grade sebesar 1,625 satuan. Variabel TUCE tidak
berpengaruh terhadap Grade yang ditunjukkan dengan nilai koefisien sebesar 0,051729 dan p-
value sebesar 0,5375 > 0,05, yang mengindikasikan dari setiap kenaikan TUCE sebesar 1 satuan
maka akan meningkatkan Grade sebesar 0,051 satuan. Variabel PSI berpengaruh signifikan dan
positif terhadap probabilitas mendapatkan nilai A yang ditunjukkan dengan nilai koefisien sebesar
1,426332 dan p-value sebesar 0,0165 < 0,05, yang mengindikasikan dari setiap kenaikan PSI
sebesar 1 satuan maka akan meningkatkan Grade sebesar 1,426. Secara bersama-sama ketiga
variabel berpengaruh signifikan terhadap Grade yang ditunjukkan dengan LR Statistics sebesar
15,54585 dan p-value (LR Statistics) sebesar 0,001405. Output Logistic Regression pada gambar
4 memberikan hasil McFadden R-squared sebesar 0,377478, yang artinya bahwa variabilitas
variabel dependen yang dapat dijelaskan oleh variabilitas variabel independen sebesar 37,74%.
Uji Goodness-of-fit Test (Hosmer-Lemeshow)
Hosmer and Lemeshow’s (HL) test digunakan untuk menguji hipotesis nol bahwa tidak ada
perbedaan antara mdel dengan data, sehingga model dapat dikatakan fit. Jika nilai Statistics HL
Goodness-of-fit lebih besar dari 0,05, maka hipotesis nol tidak dapat ditolak dan berarti model
mampu memprediksi nilai observasinya atau dapat dikatakan model dapat diterima karena cocok
dengan data observasinya. Sehingga pada tes ini dapat dirumuskan hipotesis sebagai berikut:
Ho = Model yang dibentuk fit dengan data.
H1 = Model yang dibentuk tidak fit dengan data.

Dapat diketahui pada output bahwa besarnya nilai HL Statistics sebesar 6,9086 dengan
probabilitas signifikansi 0,5465 yang berarti nilai HL statistics > 0,05, dengan demikian dapat
disimpulkan bahwa model dapat diterima. Selain menggunakan McFadden R-suared dan Uji
Hosmer and Hosmer and Lemeshow’s (HL), kita juga dapat menggunakan nilai persentase akurasi
prediksi (percently correctly predicted). Semakin besar persentasi prediksi maka model yang
dibentuk semakin baik.
Berdasarkan output percently correctly predicted di atas, dapat diketahui bahwa nilai Total
% Correct sebesar 81,25 yang menunjukkan bahwa akurasi prediksi dari model yang dibentuk
mencapai 81,25% sehingga dapat disimpulkan bahwa model yang dibentuk cukup baik.

5.probit Logit Complete

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

5.probit Logit Complete

Diunggah oleh

Hak Cipta:

Format Tersedia

MODEL RESPON

FAKULTAS EKONOMI DAN BISNIS

1. Model Respons Kualitatif

A. Bagaimana cara mengestimasi model regresi respons kualitatif ? Dapatkah kita

3. Estimasi Model Logit

𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖 menjadi Li* = β1 √𝑤𝑖 + β2 Xi* + vi . Persamaan perlu diubah mengingat varian

Regresi logit didalam mengestimasikan model menggunakan fungsi kumulatif logistik

5. Model Logit dan Probit

Ho = Model yang dibentuk fit dengan data.

H1 = Model yang dibentuk tidak fit dengan data.

Uji Goodness-of-fit Test (Hosmer-Lemeshow)

Ho = Model yang dibentuk fit dengan data.

H1 = Model yang dibentuk tidak fit dengan data.

Anda mungkin juga menyukai