Anda di halaman 1dari 17

Model Regresi Logistik Ordinal

2.1 Distribusi Multinomial


Distribusi multinomial merupakan suatu distribusi yang sering digunakan dalam analisa data
dengan variabel respon polikotomus. Misalkan variabel random Y mempunyai G buah kategori,
maka yrg = 1 jika percobaan ke-r mempunyai hasil kategori ke-g dan yrg = 0 untuk yang lainnya,

y r = [ yr 1 yr 2 ... yrG ]
T
dengan g = 1, 2,..., G dan r = 1, 2,..., m . Vektor variabel random
G m
menyatakan percobaan multinomial dengan ∑
g =1
yrg = 1 . Misalkan y g = ∑y
r =1
rg menyatakan jumlah

percobaan pada kategori ke-g, maka vektor variabel random [Y1 Y2 ... YG ] akan mempunyai
T

distribusi multinomial.

( yrg 1) menyatakan peluang hasil kategori ke-g untuk tiap-tiap


π g P=
Misalkan=

percobaan. Distribusi probabilitas multinomial adalah :


 m 
=
P(Y1 y=
1 , Y2 y2 ,...,= ,π ) 
YG −1 yG −1 ; m=   (2.1)
 y1 y2 ... yG −1 

dimana  π1y1π 2y2 ... π GG−−11 (1 − π1 − π 2 − ... − π G −1 )m − y1 − y2 −...− yG −1


y
=
G
y g = 0,1, 2,..., m dengan ∑y
g =1
g = m dan yG = m − y1 − y2 − ... − yG −1

π = [π 1 π 2 ... π G −1 ] dan π G =1 − π 1 − π 2 − ... − π G −1


T

mπ g ; Var (Yg ) =
E (Yg ) = mπ g (1 − π g ) ; Cov(Yg , Yg * ) =
− mπ g π g * untuk g ≠ g *

Untuk m = 1, maka persamaan (2.1) menjadi

= =
P(Y1 y1 ,..., 1 ;1, π )
YG −1 yG −= π1y1 ...π GyG−1−1 (1 − π1 − ... − π G −1 )1− y1 −...− yG −1 (2.2)

dimana y1 , y2 ,..., yG −1 bernilai 0 atau 1.

2.2 Keluarga Eksponensial


Suatu variabel acak Y dengan fungsi kepadatan probabilitas (fkp) f dan parameter θ
dikatakan menjadi anggota distribusi keluarga eksponensial jika f dapat dinyatakan sebagai
berikut (Dobson, 1990) :
f ( y ;θ ) exp  a ( y ) b (θ ) + c (θ ) + d ( y ) 
= (2.3)

Jika a ( y ) = y , maka persamaan (2.3 ) menjadi

f ( y=
;θ ) exp  yb (θ ) + c (θ ) + d ( y )  (2.4)

Persamaan (2.4) disebut bentuk kanonik dari distribusi keluarga eksponensial dan b (θ ) biasanya

disebut parameter natural dari distribusinya.


Jika ada parameter lain selain parameter θ , maka mereka dianggap sebagai parameter
nuisan atau gangguan yang terbentuk pada fungsi a , b , c dan d , dan mereka diperlakukan
seolah-olah mereka telah diketahui (tidak perlu diestimasi). Beberapa distribusi yang menjadi
anggota distribusi keluarga eksponensial adalah distribusi Poisson, Normal dan Binomial
(Dobson, 1990).

2.3 Fungsi Link


Fungsi link (link function) menghubungkan prediktor linear η ke nilai harapan µ dari

variabel respon Y, µ = E (Y X ) . Dalam model linear klasik, mean dan prediktor linear adalah

identik, sehingga link identitas (η = µ ) memungkinkan untuk η dan µ mempunyai sembarang

nilai pada bilangan real ( −∞, ∞ ) . Namun ketika berhadapan dengan data jumlah (count) dan

distribusinya adalah Poisson, dimana µ > 0 , maka kurang tepat apabila digunakan fungsi link
identitas karena nilai η mungkin negatif sementara µ tidak boleh negatif. Fungsi link untuk

distribusi Poisson adalah ln, yaitu η = ln ( µ ) . Sehingga diperoleh µ = exp (η ) , dimana µ akan

selalu bernilai positif.


Untuk distribusi Binomial, dimana 0 < µ < 1 , maka fungsi link harus memenuhi kondisi
pemetaan pada interval (0,1) untuk sembarang bilangan real. Ada tiga fungsi link yang dapat
digunakan, yaitu (McCullagh & Nelder, 1989) :
 µ 
(i) logit : η = ln  
 1− µ 
(ii) probit : η = Φ −1 ( µ )

dimana Φ (.) adalah fungsi distribusi kumulatif normal standard.


(iii) complementary ln-ln : η =ln {− ln (1 − µ )}

2.4 Model Regresi Logistik Ordinal


Model regresi logistik termasuk dalam model linear umum (Generalized Linear Models).
Model regresi logistik juga dapat disebut sebagai model logit. Model logit digunakan untuk
memodelkan hubungan antara variabel respon yang bersifat kategori dan variabel prediktor yang
bersifat kategori maupun kontinu. Apabila variabel respon terdiri dari dua kategori maka
dinamakan model regresi logistik dikotomus atau biner, namun apabila variabel respon terbagi
menjadi lebih dari dua kategori, maka dinamakan model regresi logistik polikotomus dan apabila
terdapat tingkatan dalam kategori tersebut (skala ordinal) maka dinamakan model regresi logistik
ordinal.
Model yang dapat digunakan untuk regresi logistik ordinal adalah model logit kumulatif
(cumulative logit models). Misalkan variabel respon Y memiliki G buah kategori berskala ordinal
T
dan xi menyatakan vektor variabel prediktor pada pengamatan ke-i, xi =  xi1 xi 2 ... xip 

dengan i = 1, 2,..., n , maka model logit kumulatif dapat dinyatakan sebagai

logit  P (Yi ≤ g xi )  =+
α g xiT β , g=
1, 2,..., G − 1 (2.5)

dimana P (Yi ≤ g xi ) adalah peluang kumulatif kurang dari atau sama dengan kategori ke-g

terhadap xi , {α g } merupakan parameter intersep dan memenuhi kondisi α1 ≤ α 2 ≤ ... ≤ α G −1 dan


T
β =  β1 β 2 ... β p  merupakan vektor koefisien regresi yang bersesuaian dengan

x1 , x2 ,..., x p .

Logit kumulatif didefinisikan sebagai (Agresti, 2002) :


 P (Yi ≤ g xi ) 
logit  P (Yi ≤ g xi )  =
ln  =, g 1, 2,..., G − 1 (2.6)
1 − P (Yi ≤ g xi ) 
berdasarkan persamaan (2.5) dan (2.6) maka model regresi logistik ordinal dapat dinyatakan
sebagai
 P (Yi ≤ g xi ) 
logit  P (Yi ≤ g xi )  =
ln  α g xiT β
 =+ (2.7)
1 − P (Yi ≤ g xi ) 
sehingga dapat diperoleh

P (Yi ≤ g xi =
)
(
exp α g + xi β
T
) , g= 1, 2,..., G − 1 (2.8)
1 + exp α g + xi β ( T
)
Misalkan π g (= (Yi g xi ) menyatakan peluang variabel respon pada pengamatan ke-i
xi ) P=

mempunyai kategori ke-g terhadap xi , maka

P (Yi ≤ g xi ) = P (Yi =1 xi ) + P (Yi = 2 xi ) + ... + P (Yi = g xi )

= π 1 ( xi ) + π 2 ( xi ) + ... + π g ( xi )

Sehingga peluang untuk masing-masing kategori respon dapat dinyatakan sebagai:

) P (Y=i g xi=) P (Yi ≤ g xi ) − P (Yi ≤ g − 1 xi ) , g= 1, 2,..., G (2.9)


π g ( xi=

berdasarkan persamaan (2.8) dan (2.9) maka diperoleh

π g ( xi ) =
(
exp α g + xi β

exp α g −1 + xi β
T
) , g=
1, 2,..., G
( T
) (2.10)
(
1 + exp α g + xi β 1 + exp α g −1 + xi β
T T
) ( )
dengan
(
exp α 0 + xi β
T
) =0 dan
(
exp α G + xi β
T
) = 1.
(
1 + exp α 0 + xi β
T
) (
1 + exp α G + xi β
T
)
Jika dimisalkan variabel respon mempunyai 3 buah kategori ( G = 3) , maka model regresi

logistik ordinal yang terbentuk adalah


 P (Yi ≤ 1 xi ) 
logit  P (Yi ≤ 1 xi )  =
ln  α1 xiT β
 =+ (2.11)
1 − P (Yi ≤ 1 xi ) 

 P (Yi ≤ 2 xi ) 
logit  P (Yi ≤ 2 xi )  =
ln  α 2 xiT β
 =+ (2.12)
1 − P (Yi ≤ 2 xi ) 

dengan P (Yi ≤ 1 xi ) =
exp α1 + xi β ( T
) dan P (Yi ≤ 2 xi ) =
exp α 2 + xi β
.
( T
)
1 + exp α1 + xi β
T
( ) 1 + exp α 2 + xi β
T
( )
sehingga didapatkan peluang untuk masing-masing kategori respon adalah :
peluang kategori pertama :
π 1 (=
xi ) P= xi ) P (Yi ≤ 1 xi )
(Yi 1=
=
(
exp α1 + xi β
T
) (2.13)

(
1 + exp α1 + xi β
T
)
peluang kategori kedua :
π 2 ( xi ) = P (Yi = 2 xi ) = P (Yi ≤ 2 xi ) − P (Yi ≤ 1 xi )

=
(
exp α 2 + xi β
T
) −
(
exp α1 + xi β
T
) (2.14)

(
1 + exp α 2 + xi β
T
) (
1 + exp α1 + xi β
T
)
peluang kategori ketiga :
π 3 ( xi ) = P (Yi = 3 xi ) = P (Yi ≤ 3 xi ) − P (Yi ≤ 2 xi )

= 1−
(
exp α 2 + xi β
T
) (2.15)

(
1 + exp α 2 + xi β
T
)

Nilai peluang untuk masing-masing kategori respon digunakan sebagai pedoman untuk
pengklasifikasian. Suatu pengamatan akan masuk dalam respon kategori ke- g berdasarkan nilai
peluang yang terbesar.

2.4.1 Penaksiran Parameter Model Regresi Logistik Ordinal


Metode yang dapat digunakan untuk memperoleh penaksir parameter model regresi
logistik ordinal adalah metode Maximum Likelihood Estimation (MLE). Langkah awal dari
metode ini adalah dengan membentuk fungsi likelihood. Misalkan diambil n sampel vektor
T
variabel random Y1 , Y2 , …, Yn , dengan Yi =  yi1 yi 2 ... yi ,G −1  berdistribusi Multinomial

dengan peluang hasil kategori ke-g adalah π g ( xi ) , maka membentuk fungsi likelihood
n G
 (θ ) = ∏∏ (π g ( xi ) )
yig

=i 1 =g 1

( ) ( )
yig
n G  exp α + x Τ β Τ
exp α g −1 + xi β 
∏∏  
g i

( ) ( )
(2.16)
=i 1 =
 Τ
1 1 + exp α g + xi β
Τ
1 + exp α g −1 + xi β 
g
 
Prinsip dari metode MLE adalah mengestimasi vektor parameter
T
θ = α1 α 2 ... α G −1 β1 β 2 ... β p  dengan cara memaksimumkan fungsi likelihood.

Untuk mempermudah perhitungan, maka dilakukan transformasi ln pada fungsi likelihood


sehingga terbentuk fungsi ln-likelihood, yaitu
L (θ ) = ln  (θ ) 

n G  exp α + x Τ β( exp α g −1 + xi Τ β) ( ) 
∑∑ yig ln  
g i

( ) ( )
(2.17)
=i 1 =
 1 + exp α + x Τ
β Τ
1 + exp α g −1 + xi β 
g 1
 g i

langkah selanjutnya dari fungsi ln-likelihood ini dilakukan turunan parsial pertama terhadap
parameter yang akan diestimasi dan kemudian disamakan dengan nol.
Jika dimisalkan variabel respon mempunyai 3 buah kategori ( G = 3) , maka fungsi ln-

likelihood menjadi

n

 exp α + x Τ β
( )   exp α + x Τ β
( )
exp α1 + xi Τ β ( ) 
∑   + y ln  
1 i 2 i
(θ )
L=  yi1 ln  −
( )  
( ) ( ) 
i2
i =1  1 + exp α1 + xi Τ β 1 + exp α + x Τ
β 1 + exp α1 + xi Τ β
    2 i




+ yi 3 ln 1 −
(
exp α 2 + xi Τ β ) 
 (2.18)


(
Τ
 1 + exp α 2 + xi β )  

Persamaan (2.18) dapat disederhanakan menjadi

∑ { y (α ) ( )
n
L (θ )
= + xi Τ β − ( yi1 + yi 2 ) ln 1 + exp α1 + xi Τ β 
i1 1
 
i =1

( ) ( )
+ yi 2 ln exp α 2 + xi Τ β − exp α1 + xi Τ β  + ( yi1 − 1) ln 1 + exp α 2 + xi Τ β  (2.19)
    ( )}
Hasil lengkap turunan parsial pertama dari persamaan (2.19) terhadap parameter yang akan
diestimasi dapat dilihat pada Lampiran B.1, sehingga diperoleh sebagai berikut :

∂L (θ ) n 
 exp α1 + xi Τ β ( )
exp α1 + xi Τ β 
 ( )
∂α1
= ∑ i =1
 i1 ( i1

y − y + yi2 )
1 + exp α + x Τ
β

(
yi2
exp α + x Τ
)β − exp α + x Τ

=
 0
 ) ( )
 1 i 2 i 1 i

∂L (θ ) n 
 exp α 2 + xi βΤ
( ) exp α 2 + xi β 
Τ
( )
∂α 2 ∑ i =1
 i2

y
exp α + (x Τ
β − exp α )+
=
x Τ
β
+
(
( yi1 − 1)
1 + exp α +)x Τ
β
 0
 ( )
 2 i 1 i 2 i

∂L (θ ) n 
 exp α 2 + xi Τ β  ( )

1
( yi1 + yi 2 ) xi + ( yi1 − 1) xi
Τ Τ
= = 0
∂β i =1 

1 + exp α 1 + x i
Τ
β ( 1 + exp α 2)+ x i
Τ
β 
 ( )
Hasil turunan parsial pertama yang diperoleh merupakan fungsi yang nonlinear terhadap
parameter yang akan diestimasi sehingga diperlukan suatu metode numerik untuk memperoleh
estimasi parameternya. Metode numerik yang dapat digunakan adalah metode iterasi Newton-
Raphson. Oleh karena itu diperlukan turunan parsial kedua dari fungsi ln-likelihood terhadap
parameter yang akan diestimasi. Hasil turunan parsial kedua yang diperoleh adalah sebagai
berikut :
 
∂ 2 L (θ ) n
 (
exp α1 + xi Τ β )
exp α1 + xi Τ β exp α 2 + xi Τ β  ( ) ( )
= ∑ − ( yi1 + yi 2 ) − yi 2 2
∂α1
( ) ( ) ( )
2 2
i =1  1 + exp α + x Τ β  exp α + x Τ β − exp α + x Τ β  
  1 i   2 i 1 i
 

∂ 2 L (θ ) n
( ) (
exp α1 + xi Τ β exp α 2 + xi Τ β )
= ∑y
∂α1∂α 2
( β ) − exp (α β ) 
i2 2
i =1 exp α + x Τ + xi Τ
 2 i 1

 
∂ 2 L (θ ) 
n
(
exp α1 + xi Τ β  )
= ∑
− ( yi1 + yi 2 ) xi
Τ
2
∂α1∂β i =1 
  1 i (
1 + exp α + x Τ β  
  )
 
∂ 2 L (θ )  n
(
exp α1 + xi Τ β exp α 2 + xi Τ β ) ( exp α 2 + xi Τ β  ) ( )
=  ∑ − y + ( y − 1) 2
( ) ( ) ( )
i 2 i1
∂α 2 2 i =1  exp α + x Τ β − exp α + x Τ β 
2
1 + exp α + x Τ β  
  2 i 1 i
  2 i
 
 
∂ 2 L (θ ) n
 exp α 2 + xi Τ β (  )
= ∑
( yi1 − 1) xi
Τ

∂α 2 ∂β
( )
2
i =1  1 + exp α + x Τ β  
  2 i  

 
∂ 2 L (θ ) 
n exp α1 + xi Τ β ( )
exp α 2 + xi Τ β  ( )
= ∑ − ( yi1 + yi 2 ) xi xi
Τ
+ ( y − 1) x Τ
x 
( ) ( )
Τ i1 i i
∂β ∂β i =1  1 + exp α + x Τ β 
2
1 + exp α + x Τ β  
2

  1 i
  2 i
 

Persamaan yang digunakan dalam proses iterasi Newton-Raphson untuk mendapatkan nilai
θˆ adalah (Agresti, 2002) :

θ (t ) −  H (θ (t ) )  q (θ (t ) )
−1
θ (t=
+1)
(2.20)
dengan H (θ ) merupakan matriks nonsingular dengan elemen-elemen matriksnya adalah

turunan parsial kedua dari fungsi ln-likelihood terhadap parameter yang akan diestimasi, q (θ )

adalah vektor dengan elemen turunan parsial pertama dari fungsi ln-likelihood terhadap
parameter yang akan diestimasi dan t adalah banyaknya iterasi (t = 0,1,2,…). Sehingga elemen
dari q (θ ) dan H (θ ) adalah sebagai berikut :

 ∂L (θ ) ∂L (θ ) ∂L (θ ) 
T

q (θ ) =   (2.21)
 ∂α1 ∂α 2 ∂β 

 ∂ 2 L (θ ) ∂ 2 L (θ ) ∂ 2 L (θ ) 
 
 ∂α1
2
∂α1∂α 2 ∂α1∂β 
 ∂ 2 L (θ ) ∂ 2 L (θ ) 
H (θ ) =   (2.22)
 ∂α 2
2
∂α 2 ∂β 
 
 ∂ 2 L (θ ) 
 simetris ∂β ∂β Τ 


Proses iterasi Newton-Raphson ini akan berhenti jika terpenuhi kondisi konvergen, yaitu
selisih θ (t +1) − θ (t ) ≤ ε , dimana ε adalah bilangan yang sangat kecil. Hasil estimasi yang

diperoleh adalah θ (t +1) pada saat iterasi terakhir.


Turunan parsial kedua dari fungsi ln-likelihood merupakan elemen dari matrik Hessian.
Nilai ekspektasi dari matrik Hessian merupakan matrik Informasi, Ι ( θ ) , di mana Ι ( θ ) = − H ( θ )

(Agresti, 2002). Matriks Informasi yang di-inverse-kan merupakan penduga dari matrik varian
kovarian dan dinyatakan sebagai :

() () ()
−1 −1
Cov θˆ = Ι θˆ  = −  H θˆ  (2.23)
   
2.4.2 Pengujian Parameter Model Regresi Logistik Ordinal
Setelah memperoleh model regresi logistik ordinal dan melakukan penaksiran parameter-
parameter yang ada pada model, maka langkah selanjutnya adalah menguji signifikansi dari
parameter-parameter tersebut. Pengujian parameter model regresi logistik ordinal dapat
dilakukan secara serentak maupun parsial. Uji serentak dilakukan untuk memeriksa peran
koefisien β secara keseluruhan atau serentak. Statistik uji yang digunakan adalah uji rasio
likelihood atau Likelihood Ratio Test (LRT).
Uji rasio likelihood diperoleh dengan terlebih dahulu menentukan dua buah fungsi
likelihood yang berhubungan dengan model regresi yang diperoleh. Fungsi-fungsi likelihood
ˆ ) yaitu nilai maksimum likelihood di bawah populasi dan L(ωˆ ) yaitu nilai
tersebut adalah L(Ω

maksimum likelihood di bawah H 0 . Likelihood ratio dinotasikan dengan

L(ωˆ )
Λ= (2.24)
L (Ω
ˆ)

Menurut Greene (2000), likelihood ratio pada persamaan (2.24) dapat juga ditulis dalam
bentuk :
 L (ωˆ ) 
G = −2 ln Λ = −2 ln 
2
L Ω ˆ ( )
( ( ))
 = −2 ln L (ωˆ ) − ln L Ω
ˆ (2.25)
 
Hipotesis yang digunakan dalam uji serentak adalah :
H 0 : β1= β 2= ...= β p= 0

H1 : minimal ada satu β k ≠ 0 , k =1,2,…,p

(
−2 ln L (ωˆ ) − ln L Ω
Statistik uji: G 2 = ˆ ( ))
Daerah penolakan:
H 0 ditolak apabila nilai G 2 lebih besar dari χ (2α , p ) atau p-value kurang dari α .

Pengujian parameter model regresi logistik ordinal secara parsial atau individu dilakukan
untuk menentukan apakah suatu variabel prediktor signifikan atau layak untuk masuk ke dalam
model atau tidak. Statistik uji yang digunakan adalah uji Wald (Hosmer dan Lemeshow, 2000).
Hipotesis yang digunakan dalam uji parsial adalah :
H 0 : βk = 0

H1 : β k ≠ 0 , k =1,2,…,p
Statistik uji :

βˆk
Wk = (2.26)
SE ( βˆk )

dengan βˆk merupakan penaksir parameter β k dan standar error βˆk diperoleh dari

SE ( βˆk ) = Var
ˆ ( βˆk ) (2.27)
ˆ ( βˆk ) merupakan elemen ke- ( k + G − 1) diagonal matrik Var
dengan Var ˆ (θˆ ) yang berukuran

( p + G − 1) x ( p + G − 1) dan G adalah jumlah kategori variabel respon.

Daerah penolakan :
H 0 ditolak apabila nilai Wk lebih besar dari Zα atau p-value kurang dari α .
2

3. Pemodelan Regresi Logistik Ordinal

Sumber Data
Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh dari berbagai
instansi pemerintahan, antara lain yaitu Dinas Kesehatan Kabupaten Lamongan dan Badan Pusat
Statistika (BPS) Kabupaten Lamongan. Sedangkan unit observasi yang digunakan pada
penelitian ini adalah desa/kelurahan di Kabupaten Lamongan Provinsi Jawa Timur yang terdiri
dari 330 desa/kelurahan.
Variabel Penelitian
Variabel respon (Y) dalam penelitian ini adalah tingkat kerawanan desa atau kelurahan
terhadap penyakit DBD yang terdiri dari tiga kategori, yaitu rawan I (Endemis), rawan II
(Sporadis) dan rawan III (Potensial).
Variabel prediktor (X k ) yang digunakan dalam penelitian ini didasarkan pada pendapat para
ahli penyakit DBD dan penelitian-penelitian sebelumnya mengenai beberapa faktor yang
mempengaruhi tingkat kerawanan desa atau kelurahan terhadap penyakit DBD. Variabel-variabel
tersebut disajikan dalam Tabel 3.1 berikut :
Tabel 3.1 Variabel penelitian

No. Variabel Tipe Kategori

1. Variabel respon :
Y : Tingkat kerawanan desa atau Kategorik 1 = Rawan I (Endemis)
kelurahan terhadap penyakit 2 = Rawan II (Sporadis)
DBD 3 = Rawan III (Potensial)
2. Variabel prediktor :
X 1 : Kepadatan penduduk Kontinu -
X 2 : Ketinggian dari permukaan -
Kontinu
laut
X 3 : Jarak desa ke -
Kontinu
puskesmas/pustu terdekat

No. Variabel Tipe Kategori

X 4 : Keberadaan kader atau juru Kategorik 0 = Tidak ada


pemantau jentik 1 = Ada

X 5 : Angka Bebas Jentik Kontinu -

X 6 : Jarak desa ke ibukota


Kontinu -
kabupaten

Selain itu juga digunakan dua variabel geografis mengenai lokasi desa/kelurahan di Kabupaten
Lamongan, yaitu :
u : Garis Lintang Selatan
v : Garis Bujur Timur
Dua variabel tersebut digunakan dalam menentukan pembobot pada model GWOLR.
Tabel 3.2 Struktur Data Penelitian
Desa/Kelurahan Y X1 X2 X3 … X6
(1) (2) (3) (4) (5) … (8)
1 y1 x 1,1 x 2,1 x 3,1 … x 6,1
2 y2 x 1,2 x 2,2 x 3,2 … x 6,2
3 y3 x 1,3 x 2,3 x 3,3 … x 6,3
4 y4 x 1,4 x 2,4 x 3,4 … x 6,4
5 y5 x 1,5 x 2,5 x 3,5 … x 6,5
      
330 y 330 x 1,330 x 2,330 x 3,330 … x 6,330

Sebelum memodelkan dengan menggunakan regresi logistik ordinal, terlebih dahulu variabel
prediktor distandarkan (variabel Z) karena terdapat perbedaan satuan data. Langkah selanjutnya
dilakukan uji kolinieritas untuk mengetahui apakah antara variabel-variabel prediktor tidak saling
berkorelasi. Pada penelitian ini ada dua kriteria yang digunakan untuk mengetahui adanya kasus
kolinieritas antar variabel prediktor. Kriteria pertama adalah dengan menggunakan koefisien korelasi
(Pearson Correlation) antar variabel prediktor.
Nilai koefisen korelasi antar variabel prediktor diperoleh dengan menggunakan software MINITAB
dapat dilihat pada Tabel 4.3.
Tabel 4.3 Koefisien korelasi antar variabel prediktor
X1 X2 X3 X5
X2 -0,217
X3 0,086 -0,004
X5 0,002 0,221 0,299
X6 -0,182 0,599 -0,138 -0,135

berdasarkan Tabel 4.3 terlihat bahwa semua variabel prediktor mempunyai nilai koefisien korelasi yang
lebih kecil dari 0,95, sehingga dapat dikatakan bahwa antar variabel prediktor tidak saling berkorelasi.
Kriteria kedua yang digunakan untuk memeriksa kolinieritas antar variabel prediktor adalah
dengan menggunakan nilai Variance Inflation Factors (VIF) pada variabel-variabel prediktor. Nilai VIF

dihitung berdasarkan nilai koefisien determinasi R 2 ( ) seperti pada persamaan (2.35). Semakin tinggi
nilai R 2 menunjukkan semakin kuat hubungan linier antar variabel prediktor. Oleh karena itu, nilai VIF

yang lebih besar dari 10 menunjukkan adanya kolinieritas antar variabel prediktor.

Nilai koefisien determinasi untuk variabel prediktor ke-k (R ) 2


k dapat diperoleh dengan cara

meregresikan variabel prediktor ke-k (X k ) terhadap variabel-variabel prediktor lainnya (Lampiran C.1).
Sehingga dapat diperoleh nilai VIF untuk masing-masing variabel prediktor sebagai berikut.

Tabel 4.4 Nilai VIF variabel prediktor

X1 X2 X3 X5 X6
VIF 1,06 1,859 1,116 1,284 1,776

berdasarkan Tabel 4.4 terlihat bahwa semua variabel prediktor mempunyai nilai VIF yang lebih
kecil dari 10, sehingga dapat dikatakan bahwa antar variabel prediktor tidak saling berkorelasi.
Kedua kriteria menunjukan hasil yang sama yaitu tidak adanya kolinieritas diantara variabel-
variabel prediktor sehingga variabel-variabel prediktor tersebut dapat digunakan dalam
pembentukan model regresi logistik ordinal.
Sebelum dilakukan analisis regresi logistik ordinal multivariabel, maka perlu dilakukan
pemilihan variabel prediktor yang berpengaruh nyata secara individu terhadap variabel respon,
yaitu dengan cara meregresikan tiap-tiap variabel prediktor terhadap variabel responnya sehingga
dapat diketahui variabel prediktor mana saja yang secara univariabel berpengaruh nyata terhadap
variabel respon. Hipotesis yang digunakan adalah :
H 0 : βk = 0

H1 : β k ≠ 0 , k =1,2,…,6

βˆk
Statistik uji yang digunakan adalah statistik Wald, Wk =
SE ( βˆk )

Keputusan tolak H 0 apabila nilai Wk lebih besar dari Zα atau p-value kurang dari α .
2

Hasil regresi logistik ordinal univariabel yang diperoleh dengan menggunakan software
MINITAB dapat dilihat pada Tabel 4.5.
Tabel 4.5 Hasil regresi logistik ordinal univariabel
Variabel Koefisien SE Koefisien Wald P-value
Z1 0,610771 0,134086 4,56 0,000
Z2 -0,93518 0,128779 -7,26 0,000
Z3 -0,19062 0,109675 -1,74 0,082
Z 4 (3,70622) 1,12549 0,405042 2,78 0,005
Z5 -0,30110 0,110737 -2,72 0,007
Z6 -1,03038 0,134393 -7,67 0,000
berdasarkan Tabel 4.5 apabila digunakan tingkat signifikansi α sebesar 10% maka semua
variabel memiliki nilai W lebih besar dari Z 0,05 = 1, 64485 atau p-value yang kurang dari α .

Hal ini berarti semua variabel prediktor secara univariabel berpengaruh signifikan terhadap
tingkat kerawanan desa atau kelurahan terhadap penyakit DBD di kabupaten Lamongan.
Selanjutnya variabel-variabel prediktor yang signifikan pada pengujian secara univariabel
digunakan untuk membentuk model regresi logistik ordinal multivariabel. Pengujian secara
serentak dilakukan untuk memeriksa peran koefisien β secara keseluruhan atau bersama-sama.
Hipotesis yang digunakan dalam uji serentak adalah :
H 0 : β=
1 β=
2 β=
3 β=
4 β=
5 β=
6 0

H1 : minimal ada satu β k ≠ 0 , k =1, 2, 3, 4, 5 dan 6

Statistik uji yang digunakan adalah statistik uji G 2 . Nilai dari statsitik uji G 2 ini akan

dibandingkan dengan nilai χ 2(α ;6) dan keputusan tolak H 0 apabila nilai G 2 lebih besar dari

χ 2(α ;6) atau p-value kurang dari α .


Tabel 4.6 Nilai statistik uji G 2 model regresi logistik ordinal multivariabel

Statistik G 2 df P-value
123,527 6 0,000
Berdasarkan Tabel 4.6 dapat dilihat bahwa nilai statistik G 2 yang dihasilkan adalah
sebesar 123,527 dan apabila dibandingkan dengan nilai χ (0,1;6)
2
= 10,6446 maka nilai statistik

G 2 lebih besar daripada χ (0,1;6)


2
sehingga keputusan tolak H 0 yang berarti minimal ada satu

variabel prediktor yang berpengaruh signifikan terhadap tingkat kerawanan desa atau kelurahan
terhadap penyakit DBD di kabupaten Lamongan.
Langkah selanjutnya adalah melakukan pengujian secara parsial untuk mengetahui variabel
mana saja yang berpengaruh signifikan terhadap model. Hipotesis yang digunakan dalam uji
parsial adalah :
H 0 : βk = 0

H1 : β k ≠ 0 , k =1, 2, 3, 4, 5 dan 6

Statistik uji yang digunakan adalah statistik uji Wald. Keputusan tolak H 0 apabila nilai Wk

lebih besar dari Zα atau p-value kurang dari α .


2

Tabel 4.7 Hasil regresi logistik ordinal multivariabel


Variabel Koefisien SE Koefisien Wald P-value
Konst(1) 1,76341 0,96185 1,83 0,067
Konst(2) 5,53338 1,02557 5,40 0,000
Z1 0,50754 0,13205 3,84 0,000
Z2 -0,30556 0,15938 -1,92 0,055
Z3 -0,33285 0,12887 -2,58 0,010
Z 4 (3,70622) 0,80963 0,45296 1,79 0,074
Z5 -0,32451 0,13443 -2,41 0,016
Z6 -0,98670 0,17521 -5,63 0,000

Berdasarkan Tabel 4.7, apabila digunakan tingkat signifikansi α sebesar 10% maka semua
variabel memiliki nilai W lebih besar dari Z 0,05 = 1, 64485 atau p-value yang kurang dari α .

Hal ini berarti semua variabel prediktor berpengaruh signifikan terhadap model atau dapat
dikatakan bahwa semua variabel prediktor signifikan atau layak untuk masuk ke dalam model.
Artinya, kepadatan penduduk, ketinggian dari permukaan laut, jarak desa ke puskesmas/pustu
terdekat, keberadaan kader atau juru pemantau jentik, Angka Bebas Jentik dan jarak desa ke
ibukota kabupaten, baik secara serentak maupun parsial signifikan berpengaruh pada tingkat
kerawanan desa atau kelurahan terhadap penyakit DBD di kabupaten Lamongan tahun 2009.
Variabel prediktor yang paling berpengaruh adalah variabel jarak desa ke ibukota kabupaten
karena mempunyai koefisien yang paling besar. Sedangkan variabel prediktor yang berpengaruh
paling kecil adalah variabel ketinggian dari permukaan laut karena mempunyai koefisien paling
kecil.
Selanjutnya, untuk mendapatkan model logit yang dibentuk untuk tingkat kerawanan desa
atau kelurahan terhadap penyakit DBD di kabupaten Lamongan tahun 2009, maka variabel
dalam bentuk standar (variabel Z) dikembalikan ke variabel asal (X) sehingga diperoleh model
logit sebagai berikut :

logit  Pˆ (Y ≤ 1 x )  = 1,7634 + 0,0005 X1 − 0,0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1)


−0,0265 X 5 − 0,0743 X 6
logit  Pˆ (Y ≤ 2 x )  = 5,5334 + 0,0005 X1 − 0,0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1)
−0,0265 X 5 − 0,0743 X 6

Tanda positif pada koefisien variabel kepadatan penduduk (X 1 ) menunjukkan bahwa


semakin tinggi kepadatan penduduk suatu desa atau kelurahan maka cenderung berhubungan
dengan tingkat kerawanan terhadap DBD yang lebih tinggi (lebih rawan). Setiap peningkatan
kepadatan penduduk sebesar 1 jiwa/km2 maka menghasilkan 0,05% peningkatan kecenderungan
bahwa desa/kelurahan mempunyai tingkat kerawanan DBD kategori endemis dibanding kategori
sporadis atau potensial, dan desa/kelurahan mempunyai tingkat kerawanan DBD kategori
endemis atau sporadis dibanding kategori potensial.
Sedangkan tanda negatif pada koefisien variabel ketinggian dari permukaan laut (X 2 )
menunjukkan bahwa semakin rendah ketinggian letak suatu desa atau kelurahan dari permukaan
laut maka cenderung berhubungan dengan tingkat kerawanan terhadap DBD yang lebih tinggi
(lebih rawan). Begitu pula dengan semakin dekat jarak suatu desa atau kelurahan ke
puskesmas/pustu terdekat (X 3 ) maka cenderung berhubungan dengan tingkat kerawanan
terhadap DBD yang lebih tinggi (lebih rawan).
Nilai odds rasio pada variabel keberadaan kader atau juru pemantau jentik (X 4 ) adalah
sebesar exp(0,8096) = 2, 25 yang menunjukkan bahwa adanya kader atau juru pemantau jentik
di suatu desa atau kelurahan cenderung berhubungan dengan desa atau kelurahan rawan DBD
dengan kategori potensial sebesar 2,25 kali dibandingkan desa yang tidak memiliki kader atau
juru pemantau jentik. Semakin rendah ABJ suatu desa atau kelurahan (X 5 ) maka cende rung
berhubungan dengan tingkat kerawanan terhadap DBD yang lebih tinggi (lebih rawan). Begitu
pula dengan semakin dekat jarak suatu desa atau kelurahan ke ibukota kabupaten (X 6 ) maka
cenderung berhubungan dengan tingkat kerawanan terhadap DBD yang lebih tinggi (lebih
rawan).
Setelah didapatkan model logit, maka peluang tiap-tiap kategori dapat dihitung sebagai
berikut :

Peluang rawan I (endemis) :


 exp (1, 7634 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )
π1 ( x ) =
1 + exp (1, 7634 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )
Peluang rawan II (sporadis) :
 exp ( 5,5334 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )
π 2 ( x) =
1 + exp ( 5,5334 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )
exp (1, 7634 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )

1 + exp (1, 7634 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )
Peluang rawan III (potensial) :
 exp ( 5,5334 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )
π 3 ( x) = 1 −
1 + exp ( 5,5334 + 0, 0005 X1 − 0, 0135 X 2 − 0,1251X 3 + 0,8096 X 4 (1) − 0, 0265 X 5 − 0, 0743 X 6 )

Berdasarkan perhitungan peluang tiap-tiap kategori di atas, maka dapat diperoleh hasil
prediksi sehingga kebenaran model logit ini dapat dilihat berdasarkan hasil pengklasifikasian
antara prediksi dan observasi.
Tabel 4.8 Ketepatan klasifikasi tingkat kerawanan desa atau kelurahan terhadap penyakit DBD
berdasarkan model regresi logistik ordinal

Prediksi Persentase
Observasi
kategori 1 kategori 2 kategori 3 ketepatan
kategori 1 12 48 0 20%
kategori 2 4 181 16 90,05%
kategori 3 0 41 28 40,58%
Total keseluruhan 66,97%

Anda mungkin juga menyukai