Anda di halaman 1dari 22

REGRESI LOGISTIK KUMULATIF / ORDINAL

Menurut Agresti (2002) model regresi logistik termasuk dalam model linear umum
(Generalized Linear Models). Model regresi logistik juga dapat disebut sebagai model logit.
Model logit digunakan untuk memodelkan hubungan antara satu variabel respon yang bersifat
kategori dan beberapa variabel bebas yang bersifat kategori maupun kontinu. Apabila variabel
respon terdiri dari lebih dari dua kategori dan terdapat tingkatan dalam kategori tersebut (skala
ordinal) maka dinamakan model regresi logistik ordinal. Dalam Agresti (2002) model untuk
regresi logistik ordinal adalah model logit kumulatif (cumulative logit models). Pada model logit
ini sifat ordinal dari respon Y dituangkan dalam peluang kumulatif. Misalkan variabel respon Y
memiliki G buah kategori berskala ordinal dan x i menyatakan vektor variabel prediktor ke-p
T
pada pengamatan ke-i, xi =  xi1 xi 2 ... xip  dengan i = 1, 2,..., n , maka model logit

kumulatif dinyatakan sebagai berikut:

logit  P (Yi  g xi ) =  g + xi  , g = 1, 2,..., G − 1


T

dimana P (Yi  g xi ) adalah peluang kumulatif kurang dari atau sama dengan kategorike-g jika

diketahui x i ,  g  merupakan parameter intersep dan memenuhi kondisi 1   2  ...   G −1 dan


T
β =  1 2 ...  p  merupakan vektor koefisien regresi yang bersesuaian dengan

x1 , x2 ,..., x p .

Logit kumulatif didefinisikan sebagai:


 P (Yi  g xi ) 
logit  P (Yi  g xi )  = ln   , g = 1, 2,..., G − 1
1 − P (Yi  g xi ) 
maka model regresi logistik ordinal dapat dinyatakan sebagai
 P (Yi  g xi ) 
logit  P (Yi  g xi ) = ln   =  g + xi 
T

1 − P (Yi  g xi ) 
sehingga dapat diperoleh

P (Yi  g xi ) =
(
exp  g + xi 
T
) , g = 1, 2,..., G − 1
(
1 + exp  g + xi 
T
)

1
Misalkan  g ( xi ) = P (Yi = g xi ) menyatakan peluang variabel respon pada pengamatan ke-i

mempunyai kategori ke-g jika diketahui x i , maka

P (Yi  g xi ) = P (Yi = 1 xi ) + P (Yi = 2 xi ) + ... + P (Yi = g xi )

= 1 ( xi ) +  2 ( xi ) + ... +  g ( xi )

Sehingga peluang untuk masing-masing kategori respon dapat dinyatakan sebagai:


 g ( xi ) = P (Yi = g xi ) = P (Yi  g xi ) − P (Yi  g − 1 xi ) , g = 1, 2,..., G

maka diperoleh

 g ( xi ) =
(
exp  g + xi 
T
) −
(
exp  g −1 + xi 
T
) , g = 1, 2,..., G
(
1 + exp  g + xi 
T
) (
1 + exp  g −1 + xi 
T
)
dengan
(
exp  0 + xi 
T
) = 0 dan
(
exp  G + xi 
T
) = 1.
(
1 + exp  0 + xi 
T
) (
1 + exp  G + xi 
T
)
Jika dimisalkan variabel respon mempunyai 3 buah kategori ( G = 3) , maka model regresi

logistik ordinal yang terbentuk adalah


 P (Yi  1 xi ) 
logit  P (Yi  1 xi ) = ln   = 1 + xi 
T

1 − P (Yi  1 xi ) 
 P (Yi  2 xi ) 
logit  P (Yi  2 xi ) = ln   =  2 + xi 
T

1 − P (Yi  2 xi ) 

dengan P (Yi  1 xi ) =
(
exp 1 + xi 
T
) (
dan P Yi  2 xi = )
(
exp  2 + xi 
T
)
1 + exp 1 + xi ( T
) (
1 + exp  2 + xi 
T
)
sehingga didapatkan peluang untuk masing-masing kategori respon adalah :
peluang kategori pertama :
 1 ( xi ) = P (Yi = 1 xi ) = P (Yi  1 xi )

=
(
exp 1 + xi 
T
)
(
1 + exp 1 + xi 
T
)
peluang kategori kedua :
 2 ( xi ) = P (Yi = 2 xi ) = P (Yi  2 xi ) − P (Yi  1 xi )

=
(
exp  2 + xi 
T
) −
(
exp 1 + xi 
T
)
(
1 + exp  2 + xi 
T
) 1 + exp 1 + xi ( T
)
2
peluang kategori ketiga :
 3 ( xi ) = P (Yi = 3 xi ) = P (Yi  3 xi ) − P (Yi  2 xi )

= 1−
(
exp  2 + xi 
T
)
(
1 + exp  2 + xi 
T
)

Estimasi Parameter
Menurut Agresti (2002) penaksiran parameter regresi logistik ordinal dilakukan dengan
menggunakan metode Maximum Likelihood Estimation (MLE). Jika diambil n sampel vektor
T
variabel random Y1 , Y2 , …, Yn , dengan Yi =  yi1 yi 2 ... yi ,G −1  berdistribusi multinomial

dengan peluang hasil kategori ke-g adalah  g ( xi ) , maka membentuk fungsi likelihood yaitu:
n G
( ) =  ( g ( xi ) ) ig
y

i =1 g =1

( ) ( )
yig
n G  exp  + x   exp  g −1 + xi   
  
g i
= −
i =1 g =1


1 + exp  g + x i

 ( 1 + exp  g −1 + xi   ) ( ) 

Menurut Hosmer dan Lemeshow (2000) prinsip dari metode MLE adalah mengestimasi
vektor parameter  = 1 2 ... G−1 1 2 ...  p T dengan cara memaksimumkan fungsi

likelihood. Untuk mempermudah perhitungan, maka dilakukan transformasi ln pada fungsi


likelihood sehingga terbentuk fungsi ln-likelihood, yaitu
L ( ) = ln  ( ) 

n G  exp  + x   (
exp  g −1 + xi   ) ( ) 
 yig ln  
g i
= −
i =1 g =1
 g i (
1 + exp  + x   1 + exp  + x  
g −1 i ) ( ) 

Jika dimisalkan variabel respon mempunyai 3 buah kategori ( G = 3) , maka fungsi ln-

likelihood menjadi
n 
 (
 exp  + x  
) 
(
 exp  + x  
) exp 1 + xi  ( ) 
   + y ln  
1 i 2 i
L ( ) =  i1  −
( ) ( ) ( )
y ln
 i2  
i =1  1 + exp 1 + xi   1 + exp  2 + xi   1 + exp 1 + xi  
    


+ yi 3 ln 1 −
(
exp  2 + xi   ) 



 (
1 + exp  2 + xi   ) 
 

3
Dapat disederhanakan menjadi

y ( ) ( )
n
L ( ) = + xi   − ( yi1 + yi 2 ) ln 1 + exp 1 + xi   
i1 1
 
i =1

( ) (
+ yi 2 ln exp  2 + xi   − exp 1 + xi    + ( yi1 − 1) ln 1 + exp  2 + xi   
   ) ( )
Estimasi parameter melalui metode MLE adalah dengan melakukan turunan parsial fungsi
ln-likelihood terhadap parameter yang akan diestimasi kemudian disamadengankan nol (Hosmer
dan Lemeshow, 2000). Turunan parsial pertama dari fungsi ln-likelihood terhadap parameter
yang akan diestimasi adalah:

L ( )


n exp 1 + xi   ( exp 1 + xi   ) 
 ( )
1
=  yi1 − ( yi1 + yi 2 )
i =1 

1 + exp 1 + xi 
− yi 2
( 
exp  2 + xi  − exp 1 + xi    =0
) ( ) ( )
 

L ( ) n 


exp  2 + xi  ( 
)
exp  2 + xi    ( )
 2
=  yi 2
i =1 

(
exp  2 + xi  − exp 1 + xi  
+ ( yi1 − 1)
) ( 
1 + exp  2 + xi  
=0
) ( )
 

L ( ) n 
 exp  2 + xi  

 ( )

1
( yi1 + yi 2 ) xi + ( yi1 − 1) xi 

= =0
 i =1 

1 + exp 1 + xi 
( 
1 + exp  2 + xi  
 ) ( )
Turunan parsial pertama dari fungsi ln-likelihood yang akan diestimasi merupakan fungsi
yang nonlinear terhadap parameter. Estimasi parameter dari persamaan regresi yang nonlinear
tidak mudah jika menggunakan metode kemungkinan maksimum dan memerlukan metode yang
bersifat iterasi untuk memperoleh estimasi parameternya (Hosmer dan Lemeshow, 2000).
Menurut Agresti (2002) metode iterasi yang digunakan adalah metode iterasi Newton Raphson.
Metode Newton Raphson merupakan metode iterasi untuk menyelesaikan persamaan nonlinear,
seperti persamaan yang solusinya menentukan titik dimana sebuah fungsi mencapai maksimum.
Oleh karena itu diperlukan turunan parsial kedua fungsi ln-likelihood terhadap parameter
yang akan diestimasi yaitu sebagai berikut
 
 2 L ( ) n
 exp 1 + xi   ( )
exp 1 + xi   exp  2 + xi    ( ) ( )
=  − ( yi1 + yi 2 ) − yi 2 2
12
( ) ( ) ( )
2
i =1  1 + exp  + x    exp  + x   − exp  + x    
  1 i   2 i 1 i
 

 2 L ( ) n
( ) (
exp 1 + xi   exp  2 + xi   )
= y
1 2
(  ) − exp ( + x  ) 
i2 2
i =1 exp  + x  
 2 i
 1 i

 
 2 L ( )  n
(
exp 1 + xi  
 )
= 
− ( yi1 + yi 2 ) xi

2
1 i =1 
  1 i (
1 + exp  + x    
  )

4
 
 2 L ( ) n
 ( ) (
exp 1 + xi   exp  2 + xi   ) (
exp  2 + xi   )
=  − yi 2 + ( yi1 − 1) 2
 2
( ) ( ) ( )
2 2
i =1  exp  + x   − exp  + x    1 + exp  + x    
  2 i 1 i
  2 i
 
 
 2 L ( ) 
n
(
exp  2 + xi    )
= ( yi1 − 1) xi

2
 2  i =1 
  2 i (
1 + exp  + x    
  )
 
 2 L ( ) n
 (
exp 1 + xi   ) (
exp  2 + xi   )
=  − ( yi1 + yi 2 ) xi xi

+ ( y − 1) x x 
2
  
( ) ( )
2 i1 i i
i =1  1 + exp  + x    1 + exp  + x    
  1 i   2 i  

Menurut Agresti (2002) persamaan yang digunakan dalam proses iterasi Newton-Raphson
untuk mendapatkan nilai ˆ adalah:

 (t +1) =  (t ) −  H ( (t ) ) q ( (t ) )
−1

dengan H ( ) merupakan matriks nonsingular dengan elemen-elemen matriksnya adalah

turunan parsial kedua dari fungsi ln-likelihood terhadap parameter yang akan diestimasi, q ( )

adalah vektor dengan elemen turunan parsial pertama dari fungsi ln-likelihood terhadap
parameter yang akan diestimasi dan t adalah banyaknya iterasi (t = 0,1,2,…). Sehingga elemen
dari q ( ) dan H ( ) adalah sebagai berikut :

 L ( ) L ( ) L ( ) 
T

q ( ) =  
 1  2 β 

  2 L ( )  2 L ( )  2 L ( ) 
 
 1 1 2 1 
2

  2 L ( )  2 L ( )  2 L ( ) 
H ( ) =  
 1 2  2 2  2 
 2 
  L ( )  2 L ( )  2 L ( ) 
 1  2    

Uji Signifikansi
Setelah diperoleh model logit kumulatif dan melakukan penaksir parameter-parameter
yang ada pada model, maka langkah selanjutnya adalah menilai signifikansi dari parameter-
parameter tersebut. Hal ini akan melibatkan pengujian dari suatu hipotesis statistika. Ada dua uji
yang digunakan untuk menguji signifikansi model tersebut, yaitu uji parameter secara
keseluruhan dan uji parameter secara individu dengan menggunakan uji rasio likelihood dan uji
wald.
5
1. Uji Rasio Likelihood (Uji Keseluruhan)
Hosmer dan Lemeshow (2000) mengatakan uji Rasio Likelihood diperoleh dengan cara
membandingkan fungsi ln-likelihooddari seluruh variabel bebas dengan fungsi ln-likelihood
tanpa variabel bebas. Uji Rasio Likelihood digunakan untuk mengetahui apakah variabel bebas
yang terdapat dalam model berpengaruh nyata atau tidak secara keseluruhan.
a. Hipotesis
H0 : β1 = β2 = ... = βp = 0
H1 : Paling sedikit salah satu dari βk ≠ 0 dengan k = 1,2,...,p

b. Taraf Signifikansi = α
c. Statistik Uji Rasio Likelihood adalah G2= -2 ln

dengan fungsi likelihood tanpa variabel bebas adalah :


L(θ) = yi1α1 - (yi1 + yi2) ln [1 + exp (α1)] + yi2 ln [ exp (α2) – exp (α1)] + (yi1 - 1) ln [ 1+
exp (α2)]}
dan fungsi likelihood dengan variabel bebas adalah :

y ( + x  ) − ( y ) ln 1 + exp (1 + xi  )


n
L ( ) = i1 1 i

i1 + yi 2
i =1

( ) (  )  (
+ yi 2 ln exp  2 + xi   − exp 1 + xi    + ( yi1 − 1) ln 1 + exp  2 + xi   
  )
d. Kriteria Uji : H0 ditolak jika G2> dari  (2 , p ) ataunilai signifikasi<  .

2. Uji Wald (Uji Parameter secara Individu)


Menurut Hosmer dan Lemeshow (2000) uji Wald atau uji parameter secara individu
diperoleh dengan cara mengkuadratkan rasio estimasi parameter dengan estimasi standar
errornya. Uji Wald dilakukan untuk mengetahui signifikansi parameter terhadap variabel
respon, langkah-langkah uji Wald yaitu sebagai berikut:
a. Hipotesis
H0 : βk = 0
H1 : βk ≠ 0, dengan k = 1,2,...,p
b. Taraf Signifikansi = α

c. Statistik Uji : Wk =

d. Kriteria uji : H0 ditolak jika nilai Wk > χ2(α,1) atau nilai signifikansi <  .
6
3. Uji Kesesuaian Model
Hosmer dan Lemeshow (2000) mengatakan uji kesesuaian model digunakan untuk
menilai apakah model sesuai atau tidak, statistik uji yang digunakan adalah Pearson Chi-Square
dan Deviance dengan langkah-langkah sebagai berikut:
a. Hipotesis
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi)
b. Taraf Signifikansi = α

c. Statistik Uji: Deviance = D = - 2

dengan: = merupakan peluang observasi ke-i pada kategori ke-g


df = J – (p+1) dimana J merupakan jumlah kovariat
d. Kriteria Uji: H0 ditolak jika nilai Deviance > (J-(p+1);α) atau nilai signifikansi < α

Contoh 1:

Jenis Kepuasan
Pendapatan
Kelamin Kurang Puas Puas Sangat Puas
< 1000000 15 9 6
Laki-laki 1000000 - 2000000 5 8 10
> 2000000 6 7 16
< 1000000 12 8 6
Perempuan 1000000 - 2000000 7 15 5
> 2000000 7 10 20
Tentukan model regresi logistiknya dan analisalah, gunakan  = 5%.

Output Tahap Pertama


PLUM - Ordinal Regression
Case Processing Summary

Marginal
N Perc entage
TK_PUAS kurang puas 52 30.2%
puas 57 33.1%
sangat puas 63 36.6%
JK perempuan 90 52.3%
laki-laki 82 47.7%
GAJI < 1 juta 56 32.6%
1 juta - 2 juta 50 29.1%
> 3 juta 66 38.4%
Valid 172 100.0%
Mis sing 0
Total 172

7
Iteration Historyb

Threshold Location
Number of -2 Log [TK_PUAS = [TK_PUAS =
Iteration Step-Halvings Likelihood 1] 2] [JK=0] [GAJI=1] [GAJI=2]
0 0 67.325 -.8362480 .5482132 .0000000 .0000000 .0000000
1 0 49.083 -1.5650220 -.1805608 -.1427763 -1.40669 -.6744892
2 0 48.487 -1.7076982 -.1952680 -.1562972 -1.52011 -.7332505
3 0 48.487 -1.7142423 -.1985105 -.1578730 -1.52637 -.7371479
4 0 48.487 -1.7143984 -.1986717 -.1579197 -1.52654 -.7372328
5 0 48.487 -1.7144058 -.1986790 -.1579230 -1.52654 -.7372404
6 0 48.487a -1.7144060 -.1986792 -.1579230 -1.52654 -.7372404
Redundant parameters are not displayed. Their values are always zero in all iterations.
a. The parameter estimates converge. Las t absolute change in -2 Log Likelihood is .000, and last
maximum absolute change in parameters is 2.512304E-07.
b. Link function: Logit.

Model Fitting Information

-2 Log
Model Likelihood Chi-Square df Sig.
Intercept Only 67.325
Final 48.487 18.838 3 .000
Link func tion: Logit.

Goodness-of-Fit Pseudo R-Square

Chi-Square df Sig. Cox and Snell .104


Pearson 7.195 7 .409 Nagelkerke .117
Deviance 7.105 7 .418 McFadden .050
Link function: Logit. Link function: Logit.

Parameter Estimates

95% Confidence Interval


Estimate Std. Error Wald df Sig. Lower Bound Upper Bound
Threshold [TK_PUAS = 1] -1.714 .320 28.666 1 .000 -2.342 -1.087
[TK_PUAS = 2] -.199 .290 .471 1 .493 -.766 .369
Location [JK=0] -.158 .288 .300 1 .584 -.723 .407
[JK=1] 0a . . 0 . . .
[GAJI=1] -1.527 .356 18.394 1 .000 -2.224 -.829
[GAJI=2] -.737 .353 4.353 1 .037 -1.430 -.045
[GAJI=3] 0a . . 0 . . .
Link function: Logit.
a. This parameter is set to zero because it is redundant.

8
Cell Information

Frequency
TK_PUAS
JK GAJI kurang puas puas sangat puas
perempuan < 1 juta Observed 12 8 6
Expec ted 12.805 8.396 4.798
Pearson Res idual -.316 -.166 .607
1 juta - 2 juta Observed 7 15 5
Expec ted 8.260 9.760 8.980
Pearson Res idual -.526 2.099 -1.626
> 3 juta Observed 7 10 20
Expec ted 6.444 11.679 18.877
Pearson Res idual .241 -.594 .369
laki-laki < 1 juta Observed 15 9 6
Expec ted 13.595 10.119 6.285
Pearson Res idual .515 -.432 -.128
1 juta - 2 juta Observed 5 8 10
Expec ted 6.289 8.235 8.476
Pearson Res idual -.603 -.102 .659
> 3 juta Observed 6 7 16
Expec ted 4.425 8.639 15.936
Pearson Res idual .813 -.666 .024
Link function: Logit.

Parameter Estimates

95% Confidence Interval


Estimate Std. Error Wald df Sig. Lower Bound Upper Bound
Threshold [TK_PUAS = 1] -1.714 .320 28.666 1 .000 -2.342 -1.087
[TK_PUAS = 2] -.199 .290 .471 1 .493 -.766 .369
Location [JK=0] -.158 .288 .300 1 .584 -.723 .407
[JK=1] 0a . . 0 . . .
[GAJI=1] -1.527 .356 18.394 1 .000 -2.224 -.829
[GAJI=2] -.737 .353 4.353 1 .037 -1.430 -.045
[GAJI=3] 0a . . 0 . . .
Link function: Logit.
a. This parameter is set to zero because it is redundant.

Model Awal Tahap Pertama (angka dilihat dari Tabel Parameter Estimates)
e −1, 714+ 0,158 jk ( 0) +1,527gaji(1) + 0, 737gaji( 2 )
c1 = ;
1 + e −1, 714+ 0,158 jk ( 0) +1,527gaji(1) + 0, 737gaji( 2)

c2 =

1. Uji Rasio Likelihood (angka dilihat dari Tabel Model Fitting Information)
Hipotesa : H0 :  1 =  2 = β3 = 0
H1 : salah satu dari k  0 dengan k = 1, 2, 3
Statistik uji rasio likelihood adalah
 likelihood tan pa var iabel bebas 
G2 = -2 ln   = 67,325 – 48,487 = 18,838
 likelihood dengan var iabel bebas 
Kriteria uji : H0 ditolak jika G2 > χ2(0,05;3) dimana nilai χ2(0,05;3) adalah 7,81
Keputusan : Karena nilai G2 = 18,838 > (χ2(0,05;3)) = 7,81 maka H0 ditolak.
9
Kesimpulan : Karena H0 ditolak dari Uji Rasio Likelihood maka dapat disimpulkan
bahwa model signifikan.

2. Uji Wald (angka dilihat dari Tabel Parameter Estimates)


Hipotesa : H0 : k = 0,
H1 : k  0, dengan k = 1, 2, 3
2
 ˆ k 
Statistik uji : Wk =  
 se ( ˆ k ) 

Kriteria uji : tolak H0 jika Wk > 2(,1)

Uji Wald Tahap Pertama


Variabel Estimasi SE
Wald sig. χ2(0,05;1) Keputusan
Bebas
Jk(0) (β1) -0,158 0,288 0,300 0,584 3,84 H0 diterima
Gaji(1) (β2) -1,527 0,356 18,394 0,000 3,84 H0 ditolak
Gaji(2) (β3) -0,737 0,353 4,353 0,037 3,84 H0 ditolak

Kesimpulan : Dari uji parameter secara individu dapat dilihat nilai signifikansi
parameter yang diperoleh dari output, maka dapat disimpulkan variabel
bebas yang signifikan dan memiliki hubungan yang kuat dengan variabel
respon adalah gaji(1) dan gaji(2).

Output Tahap Kedua


PLUM - Ordinal Regression
Case Processing Summary

Marginal
N Perc entage
TK_PUAS kurang puas 52 30.2%
puas 57 33.1%
sangat puas 63 36.6%
GAJI < 1 juta 56 32.6%
1 juta - 2 juta 50 29.1%
> 3 juta 66 38.4%
Valid 172 100.0%
Mis sing 0
Total 172

10
Iteration Historyb

Threshold Location
Number of -2 Log [TK_PUAS = [TK_PUAS =
Iteration Step-Halvings Likelihood 1] 2] [GAJI=1] [GAJI=2]
0 0 46.780 -.8362480 .5482132 .0000000 .0000000
1 0 28.815 -1.4849807 -.1005196 -1.39294 -.6715471
2 0 28.241 -1.6172511 -.1068762 -1.50235 -.7335844
3 0 28.241 -1.6225196 -.1090634 -1.50797 -.7371191
4 0 28.241 -1.6226276 -.1091804 -1.50810 -.7372361
5 0 28.241 -1.6226321 -.1091848 -1.50811 -.7372403
6 a
0 28.241 -1.6226323 -.1091849 -1.50811 -.7372404
Redundant parameters are not displayed. Their values are always zero in all iterations.
a. The parameter estimates converge. Last absolute change in -2 Log Likelihood is .000, and
last maximum absolute change in parameters is 1.926293E-07.
b. Link function: Logit.

Model Fitting Information

-2 Log
Model Likelihood Chi-Square df Sig.
Intercept Only 46.780
Final 28.241 18.540 2 .000
Link func tion: Logit.

Goodness-of-Fit Pseudo R-Square

Chi-Square df Sig. Cox and Snell .102


Pearson 3.394 2 .183 Nagelkerke .115
Deviance 3.336 2 .189 McFadden .049
Link function: Logit. Link function: Logit.

Parameter Estimates

95% Confidence Interval


Estimate Std. Error Wald df Sig. Lower Bound Upper Bound
Threshold [TK_PUAS = 1] -1.623 .273 35.446 1 .000 -2.157 -1.088
[TK_PUAS = 2] -.109 .239 .208 1 .648 -.578 .360
Location [GAJI=1] -1.508 .354 18.134 1 .000 -2.202 -.814
[GAJI=2] -.737 .353 4.359 1 .037 -1.429 -.045
[GAJI=3] 0a . . 0 . . .
Link function: Logit.
a. This parameter is set to zero because it is redundant.

Model awal tahap kedua (angka dilihat dari Tabel Parameter Estimates)

c1 = ;

c2 =

11
1. Uji Rasio Likelihood (angka dilihat dari Tabel Model Fitting Information)
Hipotesa : H0 :  1 =  2 = 0
H1 : salah satu dari k  0 dengan k = 1, 2
Statistik uji rasio likelihood adalah
 likelihood tan pa var iabel bebas 
G2 = -2 ln   = 46,780 – 28,241 = 18,540
 likelihood dengan var iabel bebas 
Kriteria uji : H0 ditolak jika G2 > χ2(0,05;3) dimana nilai χ2(0,05;2) adalah 5,99
Keputusan : Karena nilai G2 = 18,540 > (χ2(0,05;2)) = 5,99 maka H0 ditolak.
Kesimpulan : Karena H0 ditolak dari Uji Rasio Likelihood maka dapat disimpulkan
bahwa model signifikan.

2. Uji Wald (angka dilihat dari Tabel Parameter Estimates)


Hipotesa : H0 : k = 0,
H1 : k  0, dengan k = 1, 2
2
 ˆ k 
Statistik uji : Wk =  
 se ( ˆ k ) 

Kriteria uji : tolak H0 jika Wk > 2(,1)

Uji Wald Tahap Pertama


Variabel Estimasi SE
Wald sig. χ2(0,05;1) Keputusan
Bebas
Gaji(1) (β2) -1,508 0,354 18,134 0,000 3,84 H0 ditolak
Gaji(2) (β3) -0,737 0,353 4,359 0,037 3,84 H0 ditolak
Kesimpulan : Dari uji parameter secara individu dapat dilihat nilai signifikansi
parameter yang diperoleh dari output, maka dapat disimpulkan variabel
bebas yang signifikan dan memiliki hubungan yang kuat dengan variabel
respon adalah gaji(1) dan gaji(2).

3. Uji Goodness of Fit (angka dilihat dari Tabel Goodness of Fit)


H0 = Model sesuai (tidak ada perbedaan antara observasi dan prediksi)
H1 = Model tidak sesuai (ada perbedaan antara observasi dan prediksi)

Statistik Uji : Deviance = D = - 2

dengan: = merupakan peluang observasi ke-i pada kategori ke-g


df = J – (p+1) dimana J merupakan jumlah kovariat

12
Kriteria uji : H0 ditolak jika nilai Deviance > (J-(p+1);α) atau nilai signifikansi < α
Karena sig = 0,183, maka H0 diterima, yaitu model sesuai

Jadi Model regresi logistik ordinalnya adalah

Contoh penghitungan estimasi peluang


Gaji < 1000000 (kode gaji(1) = 1, gaji(2) = 0) maka
Logit [P (Yi ≤ 1|Xi)] = -1,623 +1,508 gaji(1) + 0,737 gaji(2)
Logit [P (Yi ≤ 2|Xi)] = -1,109 +1,508 gaji(1) + 0,737 gaji(2)

Sehingga peluang kurang puas (1) = c1 = 0,47128


peluang puas (2) = c2 – c1 = 0,80203 - 0,47128 = 0,33075
peluang sangat puas (3) = 1- c2 = 1- 0,59845= 0,19797
Silahkan dicoba estimasi peluang untuk kode yang lain. Cocokkan dengan tabel berikut:
Kepuasan
Pendapatan
Kurang Puas Puas Sangat Puas
< 1000000 0,47128 0,33075 0,19797
1000000 - 2000000 0,29194 0,36010 0,34796
> 2000000 0,16479 0,30799 0,52722

13
Contoh 2:
Dilakukan penelitian terhadap 666 orang untuk mengetahui faktor-faktor apa saja yang
mempengaruhi tingkat keparahan korban kecelakaan. Variabel dependen (Y) yang dianalisis
adalah tingkat keparahan korban kecelakaan lalu lintas yang dikategorikan menjadi 3 tingkatan
yaitu: Y = 1, untuk korban luka ringan
Y = 2, untuk korban luka berat
Y = 3, untuk korban meninggal dunia
Berdasarkan penelitian sebelumnya yang dilakukan oleh Fitriah, et al. (2012), variabel
independen yang diasumsikan memiliki pengaruh terhadap tingkat keparahan korban kecelakaan
lalu lintas adalah:
1. X1 : Jenis kecelakaan, dikategorikan menjadi lima: 1 : Tabrak belakang
2 : Tabrak depan
3 : Tabrak samping
4 : Hilang kendali
5 : Lain-lain
2. X2 : Jenis kelamin, dikategorikan menjadi dua: 1 : Laki-laki
2 : Perempuan
3. X3 : Usia
4. X4 : Peran korban dalam kecelakaan, dikategorikan menjadi tiga:
1 : Pengguna kendaraan
2 : Pengguna jalan non pengguna kendaraan (penyebrang jalan, pejalan kaki, dan lain-
lain)
5. X5 : Jenis kendaraan korban, dikategorikan menjadi empat:
1 : Lain-lain (pejalan kaki, sepeda angin, becak, atau kendaraan bukan bermotor
lainnya)
2 : Sepeda motor (kendaraan bermotor roda dua atau tiga)
3 : Kendaraan roda empat
4 : Kendaraan dengan lebih dari empat roda
6. X6 : Jenis kendaraan lawan, dikategorikan menjadi empat:
1 : Lain-lain (pejalan kaki, sepeda angin, becak, atau kendaraan bukan bermotor
lainnya)
2 : Sepeda motor (kendaraan bermotor roda dua atau tiga)
3 : Kendaraan roda empat
4 : Kendaraan dengan lebih dari empat roda
14
7. X7 : Waktu kecelakaan, dikategorikan menjadi dua:
1 : Padat kendaraan (antara pukul 06.00 WIB – 08.00 WIB, antara pukul 12.00 WIB
– 13.30 WIB, antara pukul 16.00 WIB – 18.00 WIB)
2 : Sepi kendaraan (selain waktu padat kendaraan)

Berdasarkan output dari SPSS diperoleh model awal tahap pertama: (angka dilihat dari Tabel
Parameter Estimates)
Logit [P (Yi ≤ 1|Xi)] = 1,438 – 1,174 X1(1) – 0,652 X1(2) – 0,811 X1(3) + 0,566 X1(4) + 0, 089
X2(1) – 0,016 X3 – 0,533 X4(1) – 2,085 X5(1) – 0,750 X5(2) + 4,326
X6(1) + 4,018 X6(2) + 2,629 X6(3) + 0,499 X7(1)
Logit [P (Yi ≤ 2|Xi)] = 2,329 – 1,174 X1(1) – 0,652 X1(2) – 0,811 X1(3) + 0,566 X1(4) + 0, 089
X2(1) – 0,016 X3 – 0,533 X4(1) – 2,085 X5(1) – 0,750 X5(2) + 4,326
X6(1) + 4,018 X6(2) + 2,629 X6(3) + 0,499 X7(1)

Model Fitting Information

Model -2 Log Likelihood Chi-Square df Sig.

Intercept Only 599.423

Final 509.014 90.409 13 .000

Link function: Logit.

Uji Rasio Likelihood (Uji Keseluruhan) Tahap Pertama (angka dilihat dari Tabel Model
Fitting Information)
Hipotesis : H0 : β1 = β2 = ... = β13 = 0 (Model tidak signifikan)
H1 : Paling sedikit ada salah satu dariβk ≠ 0 dengan k =1,2,...,13 (Model
signifikan)
Taraf Signifikansi : α = 5%
Statistik Uji : G2= -2 ln = 599,423 – 509,014 = 90,409.

Kriteria Uji : H0 ditolak jika G2 > χ2(0,05;13) dimana nilai χ2(0,05;13) adalah 22,36
Keputusan : Karena nilai G2 = 90,409 > (χ2(0,05;13)) = 22,36 maka H0 ditolak.
Kesimpulan : Karena H0 ditolak dari Uji Rasio Likelihood maka dapat disimpulkan
bahwa model signifikan.

15
Uji Wald (Uji Parameter secara Individu) Tahap Pertama (angka dilihat dari Tabel
Parameter Estimates)
Hipotesis : H0 : βk = 0 (parameter tidak signifikan atau variabel bebas tidak memiliki
hubungan yang kuat dengan variabel respon)
H1 : βk ≠ 0 dengan k = 1,2,....,13 (parameter signifikan atau variabel bebas
memiliki hubungan yang kuat dengan variabel respon)
Taraf Signifikansi : α = 5%

Statistik Uji : Wk =

Kriteria Uji : H0 ditolak jika Wk > χ2(0,05;1)


Uji Wald Tahap Pertama
Variabel
Wald sig. χ2(0,05;1) Keputusan
Bebas
[X1=1] 1,112 0,292 3,84 H0 diterima
[X1=2] 0,330 0,566 3,84 H0 diterima
[X1=3] 0,542 0,462 3,84 H0 diterima
[X1=4] 0,162 0,687 3,84 H0 diterima
[X2=1] 0,087 0,768 3,84 H0 diterima
X3 4,330 0,037 3,84 H0 ditolak
[X4=1] 0,914 0,339 3,84 H0 diterima
[X5=1] 4,152 0,042 3,84 H0 ditolak
[X5=2] 0,741 0,389 3,84 H0 diterima
[X6=1] 14,625 0,000 3,84 H0 ditolak
[X6=2] 53,550 0,000 3,84 H0 ditolak
[X6=3] 27,089 0,000 3,84 H0 ditolak
[X7=1] 3,234 0,072 3,84 H0 diterima
Kesimpulan : Dari uji parameter secara individu dapat dilihat nilai signifikansi
parameter yang diperoleh dari output, maka dapat disimpulkan variabel
bebas yang signifikan dan memiliki hubungan yang kuat dengan variabel
respon adalah X3, X5, X6.
Model Tahap Kedua (angka dilihat dari Tabel Parameter Estimates)
Pengolahan data pada tahap kedua ini merupakan pengolahan data berdasarkan variabel
yang telah signifikan pada pengolahan data tahap pertama. Sehingga diperoleh model awal tahap
kedua:
Logit [P (Yi ≤ 1|Xi)] = 0,635 – 0,017 X3 – 1,788 X5(1) – 0,872 X5(2) + 4,213 X6(1) + 3,834
X6(2) + 2,412 X6(3)
Logit [P (Yi ≤ 2|Xi)] = 1,501 – 0,017 X3 – 1,788 X5(1) – 0,872 X5(2) + 4,213 X6(1) + 3,834
X6(2) + 2,412 X6(3)
16
Model Fitting Information

Model -2 Log Likelihood Chi-Square df Sig.

Intercept Only 474.670

Final 395.237 79.433 6 .000

Link function: Logit.

Uji Rasio Likelihood (Uji Keseluruhan) Tahap Kedua (angka dilihat dari Tabel Model
Fitting Information)
Hipotesis : H0 : β1 = β2 = .... =β6 = 0 (Model tidak signifikan)
H1 : Paling sedikit ada salah satu dariβk≠ 0 dengan k = 1, 2, .... ,6 (Model
signifikan)
Taraf Signifikansi : α = 5%
Statistik Uji : G2= -2 ln = 474,670 – 395,237 = 79,433.

Kriteria Uji : H0 ditolak jika G2 > χ2(0,05;6) dimana nilai χ2(0,05;6) adalah 12,59
Keputusan : Karena nilai G2 = 79,433 > (χ2(0,05;6)) = 12,59 maka H0 ditolak.
Kesimpulan : Karena H0 ditolak dari Uji Rasio Likelihood maka dapat disimpulkan bahwa
model signifikan.

Uji Wald (Uji Parameter secara Individu) Tahap Kedua (angka dilihat dari Tabel Parameter
Estimates)
Hipotesis : H0 : βk = 0 (parameter tidak signifikan atau variabel bebas tidak memiliki
hubungan yang kuat dengan variabel respon)
H1 : βk ≠ 0 dengan k = 1,2,...,6 (parameter signifikan atau variabel bebas
memiliki hubungan yang kuat dengan variabel respon)
Taraf Signifikansi : α = 5%

Statistik Uji : Wk =

Kriteria Uji :H0 ditolak jika Wk > χ2(0,05;1)

17
Uji Wald Tahap Kedua
Variabel
Wald sig. χ2(0,05;1) Keputusan
Bebas
X3 4,902 0,027 3,84 H0 ditolak
[X5=1] 3,834 0,050 3,84 H0 diterima
[X5=2] 1,041 0,308 3,84 H0 diterima
[X5=3]
[X6=1] 14,625 0,000 3,84 H0 ditolak
[X6=2] 53,550 0,000 3,84 H0 ditolak
[X6=3] 27,089 0,000 3,84 H0 ditolak
[X6=4]

Kesimpulan : Dari uji parameter secara individu dapat dilihat nilai signifikansi parameter
yang diperoleh dari output, maka dapat disimpulkan variabel bebas yang
signifikan dan memiliki hubungan yang kuat dengan variabel respon adalah
X3 dan X6.

Model Tahap Ketiga (angka dilihat dari Tabel Parameter Estimates)


Pengolahan data pada tahap ketiga ini merupakan pengolahan data berdasarkan variabel
yang telah signifikan pada pengolahan data tahap kedua. Sehingga diperoleh model awal tahap
kedua:
Logit [P (Yi ≤ 1|Xi)] = 0,315 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)
Logit [P (Yi ≤ 2|Xi)] = 1,167 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)

Model Fitting Information

Model -2 Log Likelihood Chi-Square df Sig.

Intercept Only 429.013

Final 358.486 70.526 4 .000

Link function: Logit.

Uji Rasio Likelihood (Uji Keseluruhan) Tahap Ketiga (angka dilihat dari Tabel Model
Fitting Information)
Hipotesis : H0 : β1 =β2 = β3 = β4 = 0 (Model tidak signifikan)
H1 : Paling sedikit ada salah satu dari βk ≠ 0 dengan k = 1,2,3,4 (Model
signifikan)
Taraf Signifikansi : α = 5%

18
Statistik Uji : G2= -2 ln = 429,013 – 358,486 = 70,526.

Kriteria Uji : H0 ditolak jika G2 > χ2(0,05;4) dimana nilai χ2(0,05;4) adalah 9,49
Keputusan : Karena nilai G2 = 70,526 > (χ2(0,05;4)) = 9,49 maka H0 ditolak.
Kesimpulan : Karena H0 ditolak dari Uji Rasio Likelihood maka dapat disimpulkan bahwa
model signifikan.
Uji Wald (Uji Parameter secara Individu) Tahap Ketiga (angka dilihat dari Tabel Parameter
Estimates)
Hipotesis : H0 : βk = 0 (parameter tidak signifikan atau variabel bebas tidak memiliki
hubungan yang kuat dengan variabel respon)
H1 : βk ≠ 0 dengan k = 1, 2, 3, 4 (parameter signifikan atau variabel bebas
memiliki hubungan yang kuat dengan variabel respon)
Taraf Signifikansi : α = 5%

Statistik Uji : Wk =

Kriteria Uji : H0 ditolak jika Wk >χ2(0,05;1) atau nilai signifikansi < 5% (α)
Uji Wald Tahap Ketiga
Variabel
Wald sig. χ2(0,05;1) Keputusan
Bebas
X3 11,844 0,001 3,84 H0 ditolak
[X6=1] 12,711 0,000 3,84 H0 ditolak
[X6=2] 50,092 0,000 3,84 H0 ditolak
[X6=3] 22,071 0,000 3,84 H0 ditolak
[X6=4]

Kesimpulan : Dari uji parameter secara individu dapat dilihat nilai signifikansi parameter
yang diperoleh dari output, maka dapat disimpulkan variabel bebas yang
signifikan dan memiliki hubungan yang kuat dengan variabel respon adalah
X3 dan X6.

Dari hasil uji Rasio Likelihood dan uji Wald maka didapatkan model akhir tahap ketiga dengan
variabel bebas yang telah signifikan yaitu X3 dan X6. Setelah dilakukan pengolahan data
sebanyak tiga kali, maka diperoleh model akhir dengan variabel bebas yang telah signifikan
semua yaitu model akhir tahap ketiga:
Logit [P (Yi ≤ 1|Xi)] = 0,315 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)
Logit [P (Yi ≤ 2|Xi)] = 1,167 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)

19
Uji Kesesuaian Model Tahap Ketiga (angka dilihat dari Tabel Goodness of Fit)
Hipotesis : H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil
prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil
prediksi)
Taraf Signifikansi : α = 5%

Statistik Uji :D=-2 = 248,533

Kriteria Uji : H0 ditolak jikanilai Deviance >χ2(0,05;328) atau nilai signifikansi <5% (α)
Keputusan : Karena nilai Deviance = 248,533 <χ2(0,05; 328) = 371,23 atau nilai signifikansi
= 1,000> 0,05 (α) maka H0 diterima.
Kesimpulan : Karena H0 diterima maka dapat disimpulkan bahwa model akhir tahap
ketiga sesuai atau tidak ada perbedaan antara hasil observasi dengan hasil
prediksi.

Contoh penghitungan estimasi peluang


Usia korban (X3) 15 tahun, jenis kendaraan lawan kendaraan roda empat (X6(3)), maka
Logit [P (Yi ≤ 1|Xi)] = 0,315 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)
Logit [P (Yi ≤ 2|Xi)] = 1,167 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)
e 0,315−0,025*15+3,937*0+3, 262*0+2,048*1
c1 = = 0,879
1 + e 0,315−0,025*15+3,937*0+3, 262*0+2,048*1
e1,167−0,025*15+3,937*0+3, 262*0+2,048*1
c2 = = 0,945
1 + e1,167−0,025*15+3,937*0+3, 262*0+2,048*1

Sehingga peluang korban luka ringan (1) = c1 = 0,879


peluang korban luka berat (2) = c2 – c1 = 0,945 - 0,879 = 0,066
peluang korban meninggal (3) = 1- c2 = 1- 0,945 = 0,055

Silahkan dicoba menghitung estimasi peluang untuk korban dengan variabel bebasnya kategori
yang lain.

20
Output Analisis Regresi Logistik Ordinal
Pengolahan Tahap Pertama
Model Fitting Information
Model -2 Log Likelihood Chi-Square df Sig.
Intercept Only 599.423
Final 509.014 90.409 13 .000
Link function: Logit.

Goodness-of-Fit

Chi-Square df Sig.
Pearson 1134.581 987 .001
Deviance 469.699 987 1.000
Link function: Logit.

Pengolahan Tahap Kedua

Model Fitting Information


Model -2 Log Likelihood Chi-Square df Sig.
Intercept Only 474.670
Final 395.237 79.433 6 .000
Link function: Logit.

21
Goodness-of-Fit

Chi-Square df Sig.
Pearson 422.176 434 .649
Deviance 304.139 434 1.000
Link function: Logit.

Pengolahan Tahap Ketiga

Model Fitting Information


Model -2 Log Likelihood Chi-Square df Sig.
Intercept Only 429.013
Final 358.486 70.526 4 .000
Link function: Logit.

Logit [P (Yi ≤ 1|Xi)] = 0,315 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)
Logit [P (Yi ≤ 2|Xi)] = 1,167 – 0,025 X3 + 3,937 X6(1) + 3,262 X6(2) + 2,048 X6(3)
Goodness-of-Fit

Chi-Square df Sig.
Pearson 326.010 328 .521
Deviance 248.533 328 1.000
Link function: Logit.

22

Anda mungkin juga menyukai