1. PENDAHULUAN
Regresi logistik merupakan sebuah metode analisis statistik untuk menggambarkan hubungan
antara peubah prediktor dengan peubah respon yang mempunyai dua atau lebih kategori dengan
peubah prediktor yang menggunakan skala kategorik maupun interval (Hosmer dan Lemeshow, 1989).
Regresi logistik dengan peubah respon lebih dari dua kategori yang berskala nominal disebut juga
regresi logistik multinomial. Berbeda dengan regresi logistik yang menggunakan fungsi logit, metode
analisis regresi probit menggunakan fungsi distribusi normal (Normal Distribution Function).
Model logistik dan probit dapat digunakan pada peubah prediktor kategorial (diskrit) atau
kontinyu. Namun, hingga saat ini belum ada penelitian yang membandingkan kedua model dengan
peubah respon bersifat multinomial. Oleh karena itu perlu dilakukan perbandingan antara model
logistik dan probit dengan peubah respon multinomial, menggunakan peubah prediktor bersifat diskrit
dengan ukuran sampel yang berbeda. Pendugaan parameter model regresi logistik dan probit dapat
dilakukan dengan menggunakan metode Maximum Likelihood Estimation (MLE). Tujuan penelitian
ini adalah pembentukan model regresi logistik dan probit dengan peubah respon multinomial serta
membandingkan keduanya berdasarkan nilai R2 Mc.Fadden.
2. TINJAUAN PUSTAKA
2.1 Distribusi Multinomial
Distribusi multinomial merupakan suatu distribusi yang sering digunakan dalam analisis data
kategori. Misalnya terdapat j kategori pada peubah respon. Peluangnya dinotasikan {
}
dengan
. Untuk n sampel, peluang multinomial bahwa
termasuk kategori 1,
termasuk
kategori 2, , menjelaskan pada kategori j dengan
adalah (Agresti, 1990) :
(
309
( ( ))
2.3 Pendugaan Parameter Regresi Logistik Multinomial
Parameter dari model diduga dari vektor (
). Dimisalkan terdapat peubah
respon berskala nominal dengan tiga kategori, maka didapatkan fungsi likelihood untuk n pengamatan
yang saling bebas adalah sebagai berikut :
( )
( [ ( )
( )
( ) ])
Turunan kedua dari fungsi log likelihood merupakan elemen dari matriks Hessian. Turunan
parsial pertama dari fungsi log likelihood terhadap parameter yang akan diduga merupakan fungsi
nonlinear (tidak dapat diturunkan secara parsial). Oleh karena itu, diperlukan metode iterasi Newton
Raphson. Persamaan yang dipergunakan metode iterasi Newton Raphson adalah sebagai berikut :
(
( )
( )
( )
(
(
|
|
)
)
(
(
|
|
)
)
310
Jika nilai
[
nonmultikolinearitas.
(|
menunjukkan
|)
bahwa
antar
peubah
prediktor
terdapat
| |
( )
Statistik mengikuti sebaran
dengan derajat bebas satu. H0 ditolak jika
atau pvalue < , sehingga disimpulkan bahwa peubah prediktor secara parsial (berdiri sendiri)
berpengaruh pada peubah respon.
2.10 Uji Kelayakan Model (Goodness Of Fit)
Statistik uji yang digunakan untuk melihat goodness of fit dalam analisis regresi logstik dan
probit Uji Pearson, dengan hipotesis :
: model sesuai dengan data
: model tidak sesuai dengan data
Apabila H0 benar :
Jika nilai statistik uji kurang dari dan sama dengan nilai kritis khi-kuadrat keputusan yang akan
diambil adalah menerima
atau berarti model yang digunakan telah sesuai (Hosmer dan Lemeshow,
2000).
2.11 Kriteria Model Terbaik
R2 Mc.Fadden adalah indikator model terbaik yang digunakan untuk mengetahui nilai
likelihood-ratio yang didasarkan pada nilai likelihood model penuh yang mengandung semua
parameter (L1) dengan model yang hanya memuat intersep (L0) :
=1
di mana p adalah banyaknya peubah prediktor (Fujimoto, 2003). Model terbaik memiliki nilai R2
Mc.Fadden terbesar. Semakin besar nilai R2 Mc.Fadden maka semakin baik model menjelaskan data.
2.12 Uji t Berpasangan
Uji t berpasangan merupakan metode untuk menguji perbedaan rata-rata antara dua kelompok
data yang dependen. Rumus yang digunakan, sebagai berikut :
(
311
Logit
Probit
Logit
Probit
Logit
Probit
Logit
Probit
Logit
Probit
Logit
Probit
Logit
Probit
Logit
Probit
Logit
Probit
Logit
Probit
L0
L1
-123,282
-123,282
-302,220
-302,220
-168,793
-168,793
-72,677
-72,677
-104,028
-104,028
-43,771
-43,771
-40,522
-40,522
-95,995
-95,995
-34,431
-34,431
-50,715
-50,715
-107,233
-106,725
-288,142
-288,205
-47,524
-47,934
-49,737
-49,487
-87,056
-86,418
-30,296
-30,306
-16,257
-15,862
-75,244
-74,950
-5,981
-5,551
-20,303
-20,286
R2 Mc.
Fadden
0,130
0,134
0,100
0,099
0,719
0,716
0,316
0,319
0,163
0,169
0,308
0,308
0,599
0,609
0,216
0,219
0,826
0,839
0,589
0,600
Pilihan
terbaik
Probit
Logistik
Probit
Probit
Probit
Probit
Probit
Probit
Hasil uji t berpasangan menunjukkan P-value 0,024<, dapat dikatakan bahwa nilai 12
sehingga terdapat perbedaan yang nyata antar dua kelompok data. Artinya, nilai R2 Mc.Fadden analisis
regresi logistik multinomial tidak samadengan nilai R2 Mc.Fadden analisis regresi probit multinomial
walaupun dengan selisih nilai R2 Mc.Fadden yang relatif kecil. Kesimpulan perhitungan nilai R2
Mc.Fadden Tabel 1 didapatkan 7 data lebih baik dianalisis menggunakan analisis probit multinomial,
1 data lebih baik dianalisis menggunakan analisis logistik multinomial dan 2 data yang sama baiknya
dianalisis menggunakan analisis regresi logistik multinomial maupun probit multinomial.
4. KESIMPULAN
Berdasarkan nilai R2 Mc.Fadden didapatkan 7 data lebih baik menggunakan analisis probit
multinomial, 1 data lebih baik dianalisis menggunakan analisis logistik multinomial dan 2 data yang
sama baiknya dianalisis menggunakan regresi logistik multinomial maupun probit multinomial.
Sehingga dapat disimpulkan bahwa analisis regresi probit multinomial lebih baik daripada analisis
logistik multinomal yang digunakan untuk data dengan peubah respon berskala nominal dengan peubah
prediktor berskala nominal maupun ordinal.
DAFTAR PUSTAKA
Agresti, A., (2007), An Introduction to Categorical Data Analysis Second Edition, John Willey &
Sons,Inc, Canada.
Aldrich, J.H. dan Nelson, F.D., (1984), Linier Probability, Logit dan Probit Models, Series
Quantitative Applications in the Sosial Sciences, Sage Publication, California.
Fujimoto, K., (2003), Application of Multinomial and Ordinal Regression to Data Of The Japanese
Female Labor Market, Journal Of The Japanese Statistik University Of Pittsburgh, Faculty Of
Arts and Science.
Hosmer, D.W dan Lemeshow S., (1989), Applied Logistic Regression, John Wiley and Sons, New
York.
312