KUALITATIF
Anggota Kelompok:
Valian Mahdi Syhabi Nur Hasyim 041624153015
Sudrajat Dharmawansyah 041624153011
Kudang Boro Suminar 041624153024
Pembahasan pada bab ini untuk mencari jawaban atas pertanyaan-pertanyaan berikut :
Ada empat pendekatan untuk mengembangkan suatu model probabilitas untuk variabel
dependen yang bersifat biner yaitu model probabilitas linier, model logit, model probit, dan model
tobit. Untuk review kali ini fokus pada pembahasan model logit dan probit.
2. Model Logit
Pada model probabilitas linier (LPM) dirumuskan model yaitu : Pi = β1 + β2 X2, sedangkan model
𝟏 𝒆𝒛
logit dirumuskan berikut : Pi = = . Kemudian untuk menghitung probabilitas
𝟏+𝒆−𝒁𝒊 𝟏+𝒆𝒁
𝐏𝒊 𝟏+ 𝐞𝒁𝒊
dengan menggunakan persamaan : = 𝟏+ 𝒆−𝒁𝒊 = 𝒆𝒁𝒊 . Dimana Pi/(1 – Pi) adalah bentuk
𝟏−𝑷𝟏
sederhana dari odds ratio untuk menentukan rasio probabilitas dari regresi yang dimodelkan. Odds
dan probabilitas memberikan informasi yang sama tetapi dalam bentuk yang berbeda. Mengubah
odds ratio menjadi probabilitas atau sebaliknya dapat dilakukan dengan mudah, misalkan,
𝟏𝟎 𝑷𝒊 𝟎,𝟗𝟎𝟗
Pi = = 0,909 dan Oddsi = = = 10.
𝟏+𝟏𝟎 𝟏−𝑷𝒊 𝟏−𝟎,𝟗𝟎𝟗
Perhitungan odds ratio yang telah disebutkan dapat dirumuskan nilai log naturalnya
𝑃
menjadi berikut : Li = ln(1− 𝑖𝑃 ) = 𝑍𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 . Rumus yang sudah dituliskan ini menyebutkan
𝑖
bahwa log dari odd adalah fungsi linier dari variabel bebas dan dapat diinterpretasikan seperti
koefisien pada analisis regresi. Jika koefisien positif maka log dari odds akan meningkat jika
variabel bebas atau independen meningkat dan juga akan berlaku jika koefisien negatif. Variabel
independennya dapat berupa kombinasi variabel metrik maupun non metrik.oleh karena itu log
dari odds disebut sebagai logit maka persamaan regresinya disebut regresi logistik.
dan terdapat dua jenis data yaitu, data pada tingkat individu atau makro dan data kelompok atau
replikasi. Data pada tingkat individu tidak dapat dilakukan estimasi dengan OLS standard dan
harus menggunakan metode maximum-likelihood untuk melakukan estimasi. Pada data kelompok
atau replikasi mengestimasi model menggunakan OLS. Tahapan pada estimasi regresi logit, antara
lain :
1. Pada setiap variabel independen, menghitung probabilitas dari variabel dependen.
𝑃
2. Untuk setiap variabel independen, mendapatkan logit sebagaimana rumus Li = ln(1− 𝑖𝑃 ).
𝑖
𝑃
3. Jika terdapat heteroskedastisitas diselesaikan dengan mengubah persamaan Li = ln(1− 𝑖𝑃 ) =
𝑖
Model logit dan probit memberikan hasil yang seragam. Perbedaan utama dari keduanya adalah
bahwa distribusi logit memiliki ujung kurva yang sedikit lebih gemuk. Tetapi, tidak ada
argumentasi yang menyatakan bahwa ada alasan kuat untuk memilih salah satu dari keduanya.
Pada penerapannya, banyak peneliti yang memilih model logit karena kesederhanaan komparatif
pada matematika. Meskipun begitu, peneliti harus berhati-hati saat menginterpretasi koefisiensi
estimasi dari kedua model ini karena keduanya tidak dapat secara langsung dibandingkan.
Alasannya adalah meskipun standar logistik dan standar distribusi normal keduanya memiliki nilai
rata-rata nol, variannya berbeda
Contoh Kasus : The Effect of Personalized System of Instruction (PSI) on Course Grades
Data yang digunakan berasal dari Tabel 15.7 pada Buku Basic Econometrics (Gujarati, 2008) yang
melihat pengaruh metode pembelajaran terhadap nilai mata kuliah. Data ini kemudian kami olah
dengan Probit dan Logit menggunakan softwere Eviews 8.
Logistic Regression
Berdasarkan output di atas, dapat diketahui bahwa variabel GPA memiliki nilai koefisien
sebesar 2,826113 dan p-value sebesar 0,0252, jika dihitung nilai antilognya menggunakan
koefisien variabel GPA (2,826113) akan diperoleh nilai antilog-nya sebesar 16,8789. Hal ini
menunjukkan bahwa mahasiswa memiliki probabilitas 16 kali lebih besar mendapatkan nilai A
jika memiliki nilai GPA yang tinggi.
Variabel TUCE memiliki nilai koefisien sebesar 0,095158 dan p-value sebesar 0,5014, jika
jika dihitung nilai antilognya menggunakan koefisien variabel TUCE (0,095158 akan diperoleh
nilai antilog-nya sebesar 1,0998. Hal ini menunjukkan bahwa mahasiswa memiliki probabilitas
satu kali lebih besar mendapatkan nilai A jika memiliki skor ujian yang diberikan pada awal
semester untuk pengetahuan ekonomi makro yang tinggi.
Variabel PSI memiliki nilai koefisien sebesar 2,378688 dan p-value sebesar 0,0255, jika
dihitung nilai antilognya dari koefisien variabel PSI (2,378688) akan diperoleh nilai antilog-nya
sebesar 10,7897. Hal ini menunjukkan bahwa mahasiswa yang mendapatkan metode pembelajaran
baru memiliki probabilitas mendapatkan nilai A sebesar 10 kali lipat dibandingkan dengan
mahasiswa yang mendapatkan metode pembelajaran lama.
LR Stratistik menunjukkan nilai sebesar 15,40419 dan p-value (LR Statistics) sebesar
0,001502 yang artinya secara bersama-sama ketiga variabel berpengaruh signifikan terhadap
Grade. McFadden R-squared menunjukkan sebesar 0,374038, yang artinya bahwa variabilitas
variabel dependen yang dapat dijelaskan oleh variabilitas variabel independen sebesar 37,40%.
Uji Goodness-of-fit Test (Hosmer-Lemeshow)
Hosmer and Lemeshow’s (HL) test digunakan untuk menguji hipotesis nol bahwa tidak ada
perbedaan antara mdel dengan data, sehingga model dapat dikatakan fit. Jika nilai Statistics HL
Goodness-of-fit lebih besar dari 0,05, maka hipotesis nol tidak dapat ditolak dan berarti model
mampu memprediksi nilai observasinya atau dapat dikatakan model dapat diterima karena cocok
dengan data observasinya.Pada uji dapat dirumuskan hipotesis sebagai berikut:
Dapat diketahui bahwa besarnya nilai HL Statistics sebesar 6,5691 dengan probabilitas
signifikansi 0,5838 yang berarti nilai HL statistics > 0,05, dengan demikian dapat disimpulkan
bahwa model dapat diterima. Selain menggunakan McFadden R-suared dan Uji Hosmer and
Hosmer and Lemeshow’s (HL), kita juga dapat menggunakan nilai percently correctly predicted.
Semakin besar persentasi prediksi maka model yang dibentuk semakin baik.
Berdasarkan output percently correctly predicted di atas, dapat diketahui bahwa nilai Total
% Correct sebesar 81,25 yang menunjukkan bahwa akurasi prediksi dari model yang dibentuk
mencapai 81,25% sehingga dapat disimpulkan bahwa model yang dibentuk cukup baik.
Probit Regression
Dapat pada gambar di atas, bahwa hasil estimasi untuk variabel GPA berpengaruh
signifkan positif terhadap probabilitas mendapatkan nilai A, hal ini ditunjukkan dengan koefisien
sebesar 1,625810 dan p-value sebesar 0,0191 < 0,05, yang mengindikasikan dari setiap kenaikan
GPA sebesar 1 satuan akan meningkatkan Grade sebesar 1,625 satuan. Variabel TUCE tidak
berpengaruh terhadap Grade yang ditunjukkan dengan nilai koefisien sebesar 0,051729 dan p-
value sebesar 0,5375 > 0,05, yang mengindikasikan dari setiap kenaikan TUCE sebesar 1 satuan
maka akan meningkatkan Grade sebesar 0,051 satuan. Variabel PSI berpengaruh signifikan dan
positif terhadap probabilitas mendapatkan nilai A yang ditunjukkan dengan nilai koefisien sebesar
1,426332 dan p-value sebesar 0,0165 < 0,05, yang mengindikasikan dari setiap kenaikan PSI
sebesar 1 satuan maka akan meningkatkan Grade sebesar 1,426. Secara bersama-sama ketiga
variabel berpengaruh signifikan terhadap Grade yang ditunjukkan dengan LR Statistics sebesar
15,54585 dan p-value (LR Statistics) sebesar 0,001405. Output Logistic Regression pada gambar
4 memberikan hasil McFadden R-squared sebesar 0,377478, yang artinya bahwa variabilitas
variabel dependen yang dapat dijelaskan oleh variabilitas variabel independen sebesar 37,74%.
Hosmer and Lemeshow’s (HL) test digunakan untuk menguji hipotesis nol bahwa tidak ada
perbedaan antara mdel dengan data, sehingga model dapat dikatakan fit. Jika nilai Statistics HL
Goodness-of-fit lebih besar dari 0,05, maka hipotesis nol tidak dapat ditolak dan berarti model
mampu memprediksi nilai observasinya atau dapat dikatakan model dapat diterima karena cocok
dengan data observasinya. Sehingga pada tes ini dapat dirumuskan hipotesis sebagai berikut:
Berdasarkan output percently correctly predicted di atas, dapat diketahui bahwa nilai Total
% Correct sebesar 81,25 yang menunjukkan bahwa akurasi prediksi dari model yang dibentuk
mencapai 81,25% sehingga dapat disimpulkan bahwa model yang dibentuk cukup baik.