Regresi logistik merupakan salah satu metode regresi yang menggambarkan hubungan
antara suatu variabel respon (dependent) dan satu atau lebih variabel prediktor (independent)
, dimana variabel respon bersifat biner atau dikotomus. Variabel dikotomus adalah variabel
yang hanya mempunyai dua kemungkinan nilai, misalnya aktif dan tidak aktif, yang
dinotasikan dengan Y=1 (aktif) dan Y=0 (tidak aktif), maka variabel Y tersebut mengikuti
distribusi Bernoulli.
Bentuk dari model Regresi Logistik dengan variabel independen p adalah sebagai
berikut.
( x)
exp( 0 1 x1 2 x2 ... p x p )
1 exp( 0 1 x1 2 x2 ... p x p )
(2.5)
(x)
Dengan menggunakan transformasi logit dari
Selanjutnya g(x) disebut dengan Model Logit dan merupakan fungsi linear dalam
parameter-parameternya (Hosmer dan Lemeshow, 1989).
untuk mengestimasi
parameter regresi logistik. Metode ini akan menghasilkan dugaan maksimum likelihood bagi
yi
1 x i 1 y
, i = 1,2...,n
Fungsi likelihood berikut akan diperoleh jika pengamatan diasumsikan independen.
l
f x
i
i 1
x 1 x
i
yi
1 y i
i 1
yi xij j
j 0
i 1
ln 1 exp
i 1
exp
i ij
i 1
y x x
ij
1 exp
i 1
terhadap
i 1
mendifferensialkan
y i x ij
j x ij
j x ij
j 0
j 0
j xij
j 0
L ln l
p
ij
xi
i 1
Teori MLE (Maximum Likelihood Estimator) menyatakan bahwa turunan kedua fungsi
ln likelihood akan menghasilkan estimasi varians dan kovarians (Agresti, 1990).
Turunan kedua yaitu
exp
2 L
x ij x ik
j k
i 1
n
j 0
ij x ik
n
2 L
x ij2 x i 1 x i
2
j
i 1
x i 1 x i
i 1
j x ij 1 exp
j 0
1 exp
j x ij
j x ij
j 0
Metode iterasi Newton Raphson digunakan untuk mendapatkan nilai taksiran
dari
penyelesaian turunan pertama fungsi ln likelihood, dimana persamaannya bersifat non linier
(Agresti, 1990) dengan rumus sebagai berikut
t 1 t H t
qt
(2.6)
dengan
L L L
q T
,
,...
K
0 1
h11 h12
h21 h22
H
h j1 h j2
h1k
h2k
h jk
h jk
2 L
j k
Uji Parsial
Signifikansi parameter terhadap variabel respon dapat diketahui dengan uji parsial.
Pengujian signifikansi parameter ini menggunakan uji Wald (Hosmer dan Lemeshow,1989).
Hipotesis:
H 0 : j = 0
j=1, 2, 3, ..., p
H 1 : j 0
Statistik uji : Statistik Uji Wald
j
Wj
SE ( j )
~ N (0,1)
(2.7)
Pada tingkat kepercayaan , H0 ditolak jika nilai
derajat bebas v.
2.
Uji Serentak
W Z / 2
W 2 2 (v , )
atau
dengan
Untuk mengetahui apakah model telah tepat (signifikan) dan untuk memeriksa
kemaknaan koefisien
Hipotesis:
H0 : 1 = 2 = = p = 0
i 0
H1 : paling sedikit ada satu
, dengan i = 1, 2, ..., p
i 1
y ln x 1 y ln 1 x n ln n n
G 2
ln n0 n ln n
(2.8)
dengan :
n1
n0
dengan db=v.
(o k n k k ) 2
n (1 k )
k 1 k k
g
(2.9)
dengan
ok
n 'k
j 1
n 'k
j 1
m j j
n' k
mj
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
2
2
hitung
(db,)
Interpretasi Model
Setelah didapatkan kesesuaian model pada koefisienkoefisien parameter yang
signifikan, selanjutnya adalah memberikan interpretasi nilai koefisien dalam model tersebut.
Pada variabel prediktor dikotomus, interpretasi koefisien parameter dapat
menggunakan nilai odds ratio (). Variabel penjelas x yang bersifat kategori terbagi dalam 2
kategori yang dinyatakan dengan kode 0 dan 1. Disini kategori 1 dibandingkan terhadap
kategori 2 berdasarkan nilai -nya yang menyatakan variabel 1 berpengaruh kali variabel 2
terhadap variabel respon. Sehingga berdasarkan model ada dua nilai (x) dan dua nilai
(x). Nilainilai itu dapat dinyatakan seperti Tabel 2.2.
Tabel 2.2 Nilai Model Regresi Logistik bila Variabel X Dikotomus
Variabel
Respon
Variabel Bebas
X=1
Y 1
Y 0
exp 0 1
(1)
1 exp 0 1
1 (1)
1
1 exp 0 1
X=0
(0 )
exp( 0 )
1 exp( 0 )
1 ( 0)
1
1 exp( 0 )
e 1
1 1 1
g 1 g 0
0 1 0
(2.10)
ln ln
(2.11)
1-
Ini
Lemeshow, 1989).
Regresi Logistik
Regresi logistik adalah salah satu metode statistik untuk menganalisis hubungan
variabel respon (dependen) yang memiliki skala nominal atau ordinal dengan variabel
prediktor (independen). Regresi logistik yang memiliki variabel respon dengan dua kategori
disebut regresi logistik biner (dhikotomus). Sedangkan regresi logistik yang memiliki variabel
respon dengan tiga atau lebih kategori dimanakan regresi logistik polikotomus. Regresi
polikotomus terdiri dari dua yaitu regresi logistik multinomial dan regresi logistik ordinal.
Regresi logistik multinomial, masing- masing kategori pada variabel respon tidak ada
tingkatan melainkan hanya membedakan sedangkan yang memiliki tingkatan dinamakan
regresi logistik ordinal.
dan sukses
(x)
( y 1)
adalah
1 ( x)
y 1
peluang untuk
y0
dan
(1)
( xi ) P ( yi 1)
dimana
( xi )
xi
dan
dapat dijelaskan melalui fungsi logistik sebagai berikut ( Hosmer dan Lemeshow, 2000):
( x)
e 0 1x
1 e
( x)
0 1x
exp( o 1x)
1 exp( o 1x)
atau
(2)
terhadap
(x)
exp( 0 1x)
1 exp( 0 1x)
exp( 0 1x)
exp( 0 1x )
( x ) exp( 0 1x ) ( x ) exp( 0 1x )
=
( x ) 1 (x) exp( 0 1x)
=
(x)
1 (x)
=
(x)
1 (x)
exp( 0 1x)
ln
(x)
(x)
=ln
ln
g(x) =
{exp( 0 1x)}
0 1 x
0 1x
(3)
dimana
(x)
(x)
ln
g (x)
Uji Serentak
Dalam pengujian serentak, uji signifikansi model dapat dipergunakan likelihoodratio test. Likelihood-ratio test adalah metode pengujian signifikansi model dengan
membandingkan likelihood untuk model lengkap (L 1) dan likelihood untuk model yang
semua parameternya sama dengan nol (L0).
Hipotesis :
1 2 ... p 0
H0 :
H1 : minimal ada satu
k 0
X 2 ( p , )
Adapun statistik uji untuk likelihood-ratio test adalah sebagai berikut (Hosmer dan
Lemeshow, 2000)
L0
L1
G 2 ln
=
=
2 ln( L0 ) ln( L1 )
2 ln( L0 ) {2 ln( L1 )}
2 ln( L0 ) (2( L1 ))
(4)
Uji Parsial
Pengujian ini dilakukan untuk mengetahui signifikansi parameter secara individu
terhadap variabel respon. Pengujian signifikansi parameter menggunakan uji Wald (Hosmer
dan Lemeshow, 2000) dengan hipotesis:
i 0
H0 :
i 0
H1 :
, dengan i = 1, 2, ...p
SE( )
Statistik uji :
(3.5)
W 2 X 2 (v , )
W Z / 2
atau
Odd Rasio
Odd rasio pada regresi logistik biner dapat dicari dengan menggunakan acuan tabel
nilai peluang sebagai berikut (Hosmer dan Lemeshow, 2000):
Tabel 2.1: Tabel Nilai Peluang Regresi Logistik Jika Variabel dependen dan Independen
Memiliki Dua Kategori
Variabel
Variabel Prediktor
x=1
respon
1
y=1
exp 0 1
1 exp 0 1
1 - 1
y=0
x=0
0
1
1 exp 0 1
exp 0
1 exp 0
1 - 0
1
1 exp 0
Nilai odd rasio yang dinotasikan OR didefinisikan sebagai rasio untuk x=1 dan x=0
(Hosmer dan Lemeshow, 2000). Adapun peramaannya adalah sebagai berikut:
1 / 1 1
0 / 1 0
OR
(6)
Dengan mensubtitusikan nilai peluang pada tabel didapatkan hasil sebagai berikut :
exp( 0 1 )
exp( 0 1 )
1 exp( 0 1 )
OR
exp( 0 )
exp( 0 )
1 exp( 0 )
exp( 0 1 )
exp( 0 )
exp( 0 1 ) 0
=
= exp(
1 )
(7)
Dari persamaan di atas dapat disimpulkan bahwa odd rasio merupakan nilai eksponensial
dari
..................................(2.3)
f(x) =
1
1 e x
........................................... (2.4)
lim f ( x ) 0
Jika x = -, maka
lim f ( x) 1
Jika x = +, maka
Untuk mempermudah notasi maka digunakan nilai (x) = E(Y|X) untuk menyatakan
rata-rata bersyarat dari Y jika diberikan nilai x. Bentuk model regresi logistik adalah :
( x)
exp ( o 1 x)
1 exp ( o 1 x)
........................................... (2.5)
Dengan suatu transformasi dari persamaan (2.5) dikenal sebagai transformasi logit
digunakan untuk memperoleh fungsi g (x) yang linear dalam parameter-parameternya,
( x)
1 ( x)
g(x) = ln
o 1 x
g(x)
........................................... (2.6)
vektor
L() =
j i y i x ij j i ni log 1 exp
x ij
.(2.7)
( xi ) 1 ( xi )
ni y i
i 1
dengan (xi) =
i 1
( xi )
1 ( xi )
exp
log
(2.8)
x ij
1 exp
ni
exp
(1 ( x )
n
yi
x ij
...................................... (2.9)
Dimana i = 1, 2, , n
Fungsi di atas merupakan gabungan dari (Y1, Y2, , Yn) yang saling independen, dengan
nilai dari Y observasi terdiri dari sukses (1) dan gagal (0), dengan distribusi binomial dan
memiliki E (Yi) = ni(x) ; dimana n1 + n2 + + ni = N.
Persamaan log likelihood pada persamaan (2.7) dideferensialkan terhadap masing-masing
elemen . Sehingga diperoleh persamaan likelihood sebagai berikut :
n
y i x ij ni ( x i ) x ij
= 0 dengan j = 0, 1, 2, , k
............................ (2.10)
Sedangkan metode untuk mengestimasi varian dan kovarians dari estimasi koefisien
parameter dikembangkan teori maximum likelihood estimation. Teori ini mengatakan bahwa
estimasi varian diperoleh dari turunan kedua fungsi likelihood, turunan kedua adalah sebagai
berikut :
2L
x ij x iu n i i (1 i )
j u
i
........................................... (2.11)
Pengujian Estimasi Parameter
Menurut Hosmer dan Lameshow (1989), model yang telah diperoleh tersebut perlu
diuji kesignifikasinya, dengan melakukan pengujian statistik akan menentukan apakah
variabel-variabel prediktor yang terdapat dalam model tersebut memiliki hubungan yang
nyata dengan variabel responnya. Pengujian yang dilakukan adalah sebagai berikut :
1. Uji Serentak
Uji serentak dilakukan untuk memeriksa atau peran keberartian koefisien secara
keseluruhan atau serentak (Hosmer,1989). Pengujian yang dilakukan adalah sebagai berikut :
1 2 k 0
Hipotesa : H0 :
k 0
H1 : Minimal ada satu
Statistik Uji :
G2
n1
n
n
n1
n0
n0
n
yi
(1 y i )
i 1
= -2 ln
........................................... (2.12)
i 1
n 0 (1 y i ); n1 y i
Dimana :
dan N = n0 + n1
2
Nilai G2 yang diperoleh dibandingkan dengan distribusi
k + 1 sesuai dengan p-value yang diinginkan untuk dapat menolak H0 atau H1.
2. Uji Parsial
Menurut Hosmer dan Lemeshow (1989) menyatakan bahwa uji parsial ini dilakukan
untuk menguji keberartian koefisien secara parsial, yaitu dengan membandingkan
parameter dari hasil maksimum likelihood, dugaan , dengan penduga standar errornya dan
hipotesa yang dilakukan sebagai berikut :
Hipotesa
j 0
H0 :
j 0
H1 :
W1
Statistik Uji : Uji Wald :
SE j
Statistik uji Wald mengikuti distribusi Normal, sehingga pengujiannya dilakukan melalui
pembanding nilai statistik W1 dengan nilai Ztabel
Selain uji Wald tersebut di atas, dapat pula dilakukan Uji Wald yang lain, yaitu :
2
Wz
SE j
........................................... (2.13)
2 ;v
melalui pembanding nilai statistik Wz dengan nilai tabel
dan
derajat bebas v
O
i
Oij
ij
Log
E
ij
G =2
2. Goodness of Fit
(Oij E ij ) 2
E ij
Dari kedua statistik uji diatas untuk menguji hipotesis sebagai berikut :
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
3. Improvement
Uji ini digunakan untuk menilai apakah satu atau lebih variabel prediktor yang belum
masuk ke dalam model memiliki peran yang penting dalam model (Agresti, 1990). Pengujian
yang dilakukan adalah sebagai berikut :
Hipotesa :
H0 : Model tanpa variabel prediktor tertentu adalah model terbaik
H1: Model dengan variabel prediktor tertentu adalah model terbaik
Statistik Uji :
G2 = -2 (L0 L1)
Dimana :
L0 = Log Likelihood untuk model dengan variabel prediktor tertentu
L1 = Log Likelihood untuk model tanpa variabel prediktor tertentu
Nilai G2 yang diperoleh dibandingkan dengan distribusi 2 dengan derajat bebas selisih
antara L0 dan L1. Jika H0 ditolak maka model dengan variabel prediktor tertentu secara
signifikan lebih baik dibanding model tanpa prediktor tertentu.
..................................(2.3)
f(x) =
1
1 e x
........................................... (2.4)
lim f ( x ) 0
Jika x = -, maka
lim f ( x) 1
Jika x = +, maka
Untuk mempermudah notasi maka digunakan nilai (x) = E(Y|X) untuk menyatakan
rata-rata bersyarat dari Y jika diberikan nilai x. Bentuk model regresi logistik adalah :
( x)
exp ( o 1 x)
1 exp ( o 1 x)
........................................... (2.5)
Dengan suatu transformasi dari persamaan (2.5) dikenal sebagai transformasi logit
digunakan untuk memperoleh fungsi g (x) yang linear dalam parameter-parameternya,
sehingga akan mempermudah mengestimasi parameter-parameternya. Model transformasi
tersebut adalah sebagai berikut :
( x)
1 ( x)
g(x) = ln
o 1 x
g(x)
........................................... (2.6)
vektor
y
x
j i i ij j i ni log 1 exp
L() =
x ij
.(2.7)
( x ) 1 ( x )
i
yi
ni y i
(1 ( x )
i 1
Dimana i = 1, 2, , n
i 1
ni
( xi )
1 ( x i )
exp
log
(2.8)
x ij
1 exp
dengan (xi) =
exp
x ij
...................................... (2.9)
Fungsi di atas merupakan gabungan dari (Y1, Y2, , Yn) yang saling independen, dengan
nilai dari Y observasi terdiri dari sukses (1) dan gagal (0), dengan distribusi binomial dan
memiliki E (Yi) = ni(x) ; dimana n1 + n2 + + ni = N.
Persamaan log likelihood pada persamaan (2.7) dideferensialkan terhadap masing-masing
elemen . Sehingga diperoleh persamaan likelihood sebagai berikut :
n
y i x ij ni ( x i ) x ij
= 0 dengan j = 0, 1, 2, , k
............................ (2.10)
Sedangkan metode untuk mengestimasi varian dan kovarians dari estimasi koefisien
parameter dikembangkan teori maximum likelihood estimation. Teori ini mengatakan bahwa
estimasi varian diperoleh dari turunan kedua fungsi likelihood, turunan kedua adalah sebagai
berikut :
2L
x ij x iu n i i (1 i )
j u
i
........................................... (2.11)
1 2 k 0
Hipotesa : H0 :
k 0
H1 : Minimal ada satu
Statistik Uji :
G2
n1
n
n
n1
n0
n0
n
yi
(1 y i )
i 1
= -2 ln
........................................... (2.12)
n
i 1
n 0 (1 y i ); n1 y i
Dimana :
dan N = n0 + n1
2
Nilai G2 yang diperoleh dibandingkan dengan distribusi
k + 1 sesuai dengan p-value yang diinginkan untuk dapat menolak H0 atau H1.
2. Uji Parsial
Menurut Hosmer dan Lemeshow (1989) menyatakan bahwa uji parsial ini dilakukan
untuk menguji keberartian koefisien secara parsial, yaitu dengan membandingkan
parameter dari hasil maksimum likelihood, dugaan , dengan penduga standar errornya dan
hipotesa yang dilakukan sebagai berikut :
Hipotesa
j 0
H0 :
j 0
H1 :
W1
Statistik Uji : Uji Wald :
SE j
Statistik uji Wald mengikuti distribusi Normal, sehingga pengujiannya dilakukan melalui
pembanding nilai statistik W1 dengan nilai Ztabel
Selain uji Wald tersebut di atas, dapat pula dilakukan Uji Wald yang lain, yaitu :
2
Wz
SE j
........................................... (2.13)
2 ;v
melalui pembanding nilai statistik Wz dengan nilai tabel
dan
derajat bebas v
Oij Log
i
E
ij
G =2
2. Goodness of Fit
(Oij E ij ) 2
E ij
Dari kedua statistik uji diatas untuk menguji hipotesis sebagai berikut :
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
3. Improvement
Uji ini digunakan untuk menilai apakah satu atau lebih variabel prediktor yang belum
masuk ke dalam model memiliki peran yang penting dalam model (Agresti, 1990). Pengujian
yang dilakukan adalah sebagai berikut :
Hipotesa :
H0 : Model tanpa variabel prediktor tertentu adalah model terbaik
H1: Model dengan variabel prediktor tertentu adalah model terbaik
Statistik Uji :
G2 = -2 (L0 L1)
Dimana :
L0 = Log Likelihood untuk model dengan variabel prediktor tertentu
L1 = Log Likelihood untuk model tanpa variabel prediktor tertentu
Nilai G2 yang diperoleh dibandingkan dengan distribusi 2 dengan derajat bebas selisih
antara L0 dan L1. Jika H0 ditolak maka model dengan variabel prediktor tertentu secara
signifikan lebih baik dibanding model tanpa prediktor tertentu.
Regresi Logistik
Regresi logistik digunakan jika variabel respon bersifat kategorik (nominal atau ordinal)
dengan variabel-variabel prediktor kontinu maupun kategorik (Agresti, 1990). Variabel
respon Y yang bersifat random dan dikotomus, yakni bernilai 1 dengan probabilitas
dan
1 y i
1
1 e z
(1)
z 0 1 x
Dimana,
Untuk
Lim f ( z ) 0
maka
, sedangkan untuk
f z
Lim f ( z ) 1
z
maka
exp( 0 1x )
1 exp( 0 1x )
(2)
Untuk mempermudah penaksiran parameter regresi, maka digunakan transformasi logit
( x )
terhadap
( x )
1 (x )
g (x ) ln
0 1x
(3)
(4)
Jika model pada persamaan (4) ditransformasi dengan menggunakan transformasi logit,
maka akan menghasilkan bentuk logit
0 1x1 ... k x k
g(x) =
(5)
1 ... k
dengan
1 y i
(6)
Dimana,
(x i )
x
j 0
ij
1 exp
exp
x
j 0
ij
L( )
(Agresti, 1990).
L ln l
j 0
y x
i
i 1
ln 1 exp
ij
j
i 1
x
j 0
ij
L( )
terhadap
y i x ij x ij
j
i 1
i 1
n
exp
j 0
i 1
i 1
x ij
1 exp
j 0
x ij
0 y i x ij x i x ij
; j = 0,1,, k
(7)
Dimana,
x i
exp
j 0
ij
1 exp
x
j 0
ij
x i
maximum likelihood.
Likelihood Estimator) yang menyatakan bahwa estimasi varians dan kovarians diperoleh dari
turunan kedua fungsi ln Likelihood (Agresti, 1990), yaitu :
n
2 L
x ij2 x i 1 x i
2
j
i 1
x ij x ij x i i 1 x i
i 1
; j = 0, 1,,k
(8)
H0 :
j 0
untuk j=1,2,...,k
i 1
i 1
n0
x 1 x
i 1
n0
yi
n1 y i n0 1 y i
Dengan,
n1
n1
1 y i
(9)
n n0 n1
;
Dibawah H0, statistik uji G akan mengikuti distribusi chi-square dengan derajat bebas k
(Hosmer and Lemeshow, 1989). Sehingga untuk memperoleh keputusan, nilai statistik uji G
2 ,k
dibandingkan dengan nilai
G 2 ,k
j
Statistik uji Wald digunakan untuk menguji parameter
j
H0 :
= 0 ; j = 1,2,...,k
j
H1 :
j
SE( j )
(10)
W Z / 2
susunan variabel-variabel prediktor dalam model, bukan pada jumlah variabel prediktor
(Hosmer and Lemeshow, 1989). Berikut ini adalah prosedur pengujian kesesuaian model.
H0 : Model sesuai
H1 : Model tidak sesuai
Statistik Uji (Hosmer and Lemeshow, 1989):
g
o nk ' k
C Hosmer Lemeshow k
k 1 n k ' k 1 k
2
(11)
ck
ok y j
nk '
Dengan g
= Jumlah grup,
j 1
k
j 1
m j x j
nk '
rata-rata
ck
probabilitas dimana mj adalah banyaknya subjek pada
taksiran
derajat bebas g-2 (Hosmer and Lemeshow, 1989). Daerah penolakan H0 adalah
dan
1 x
1 x
Variabel Prediktor
x=1
respon
y=0
Variabel
y=1
exp 0 1
1 exp 0 1
1 - 1
1
1 exp 0 1
x=0
0
exp 0
1 exp 0
1 - 0
1
1 exp 0
Odds rasio, dinotasikan , didefinisikan sebagai rasio odds untuk x = 1 terhadap odds
untuk x = 0, yang dapat dituliskan dalam persamaan (12) berikut (Hosmer and Lemeshow,
1989).
1 /1 1
0 /1 0
exp 0 1
1
1 exp 0 1 1 exp 0
exp 0
1 exp 0 1 exp 0 1
(12)
exp( 0 1 )
exp 0 exp 1
Regresi Logistik
Model Regresi Logistik merupakan analisis statistik yang digunakan untuk
menggambarkan hubungan antara variabel tak bebas yang bersifat kategori dengan variabel
bebas yang bersifat kategori, kontinu atau keduanya. Untuk variabel bebas bertipe kualitatif
digunakan variabel dummy sedangkan untuk variabel bebas bertipe kuantitatif didefinisikan
secara langsung. Hubungan antara variabel tak bebas (Y) dengan variabel bebas (X), menurut
E(Y) x
V(Y) x - x
dan varian
. Sedangkan
regresi logistik dengan k variabel bebas (X) dan variabel tak bebas (Y) menurut Hosmer
P(Y 1 | x) ( x
(1989) adalah
( x)
g ( x)
1 e
g ( x)
(2.1)
atau
( x)
( 0 1 x1 2 x 2 ... k x k )
1 e
( 0 1 x1 2 x 2 ... k x k )
(2.2)
(x)
Dengan menggunakan transformasi logit dari
( x)
1 ( x)
(2.3)
g ( x) ln
( 0 1x1 2 x2 ... k xk )
( 0 1x1 2 x2 ... k xk )
1 e
e ( 0 1x1 2 x2 ... k xk )
1
( 0 1x1 2 x2 ... k xk )
1 e
( 0 1x1 2 x2 ... k xk )
( 0 1x1 2 x2 ... k xk )
(2.4)
( 0 1x1 2 x2 ... k xk )
g ( x ) ln 1 e
1
1 e ( 0 1x1 2 x2 ... k xk )
g ( x ) ln( e
(2.5)
(2.6)
g ( x) 0 1 x1 2 x 2 ... k x k
(2.7)
sehingga
k
g ( x) 0 b xb
b 1
(2.8)
yang merupakan fungsi linier dalam parameter parameternya.
Dalam suatu model regresi linier diasumsikan bahwa suatu amatan dari variabel tidak
y E (Y ( x)) e
, dimana
diasumsikan mengikuti
mempunyai
, maka
dengan peluang
1 ( x)
e (x)
y0
Jika
(x)
e 1 ( x)
y 1
, maka
dengan peluang
( x)[1 ( x)]
Maka nilai errornya mempunyai rataan nol dan varian
distribusi Binomial (Hosmer, 1989)
, yang mengikuti
Estimasi Parameter
Suatu model yang memiliki respon biner, dimana antar amatan diasumsikan bebas dan
nilai harapan variabel tak bebasnya tidak linier terhadap parameter , maka penduga dapat
diperoleh dengan metode maximum likelihood. Metode maximum likelihood merupakan
(n 10( s 1))
, dimana s
adalah jumlah parameter. Maximum Likelihood Estimation adalah suatu fungsi dari parameter
yang memaksimumkan peluangnya untuk menduga parameter.
dengan
( xa ) ( xa )
ya
1 ya
[1 ( x a )]
(2.9)
karena setiap pengamatan bebas maka fungsi likelihood merupakan fungsi kepadatan
gabungan dimana adalah vektor, yaitu :
n
l () ( x a )
a 1
l () ( x a )
a 1
l () ( x a )
a 1
ya
1 ya
[1 ( x a )]
ya [1 ( x a )]
y
[1 ( x a )] a
( xa )
l ()
a 1 1 ( a )
n
ya
1 ( x a )
n
( x ) ya
n
a
l () 1 ( x a ) exp ln
a 1
a 1
1 ( a )
n
n
( xa )
l () 1 ( x a ) exp y a ln
a 1
a 1
1
(
x
)
a
(2.10)
dengan melakukan transformasi logit terhadap model regresi logistik pada Persamaan
(2.10) maka didapatkan :
k
exp b x ab
1 exp b x ab
l ()
a 1
exp b x ab
n
b 0
1
exp y a ln
k
a 1
1 exp b x ab
b 0
b0
exp b x ab
b 0
1
k
1 exp b x ab
b 0
l ()
k
a 1 1 exp x
b ab
b 0
b0
k
k
n
exp y a ln exp b x ab
b 0
a 1
n
k
l ()
exp
y
b x ab
a
k
a 1
a 1 b 0
1 exp b x ab
b 0
k n
l ()
exp y a x ab b
k
a 1
b 0 a 1
1 exp b x ab
b 0
(2.11)
adalah dengan memaksimalkan fungsi likelihood. Secara matematis akan lebih mudah untuk
log l ()
memaksimalkan nilai
berikut :
L() ln
a 1 1 exp k x
b ab
b 0
exp y a x ab b
b 0 a 1
n
k
k n
L() y a x ab b ln 1 x ab b
b
0
b
1
a
1
b
(2.12)
Untuk mendapatkan nilai
terhadap
L()
1
y b x ab x ab
k
b 0
a 1
b
1 exp
b x ab
exp b x ab
b0
exp b x ab
n
L() k
b 0
y a x ab x ab
k
b 0
a 1
b
1 exp b x ab
b 0
(2.13)
Metode yang digunakan untuk melakukan estimasi varian dan kovarian adalah
pengembangan dari teori Maximum Likelihood Estimation. Teori ini menyatakan bahwa
estimasi varian dan kovarian diperoleh dari turunan kedua fungsi likelihood.
x ab
a 1
L()
b u
exp u x au
u 0
k
1 exp u x au
u 0
u
k
x ab
2
a 1
b u
k
1 exp x
u au
u 0
k
k
x au exp u x au
x au exp u x ab
2
n
L()
u 0
u 0
x ab
k
k
a 1
b u
1 exp x
1 exp u x au
u au
u 0
u 0
n
2 L()
2
x ab x au a a
a 1
b u
n
2 L()
x ab x au a 1 a
a 1
b u
(2.14)
untuk b = u adalah estimasi varian yang dapat ditulis menjadi:
n
2 L()
2
x ab a 1 a
2
a 1
b
(2.15)
dimana :
b, u = 0,1,2,...,k (parameter)
t 1 t H t
q t
(2.16)
2 g / 2j
2 g / j u
2
g / j u 2 g / u2
(2.18)
Mensubstitusikan estimasi
Mensubstitusikan
( 0)
c.
(0)
q 1
sehingga mendapatkan
dan
H 1
q 0
, nilai
2
untuk memperoleh
sampai konvergen.
Pengujian statistik dilakukan untuk menentukan apakah variabel variabel bebas yang
terdapat dalam model tersebut memiliki hubungan yang nyata dengan variabel tak bebasnya.
Pengujian ini dilakukan sebagai berikut :
1. Uji Serentak
Dilakukan untuk memeriksa kemaknaan koefisien secara serentak dan hipotesa
pengujiannya adalah
Ho : 0 = 1 = ...........= k = 0
H1 : paling sedikit ada satu k 0
Statistik uji yang digunakan adalah statistik uji G atau Likelihood Ratio Test, yaitu
n1
G 2 ln
( a )
a
1
ya
n1
n0
n0
1 a 1 ya
(2.19)
atau
G=2
a
a
a
a
1
1
0
0
a 1
n1 y a
a 1
a 1
dan
(2 ,v )
Tolak H0 jika G >
2. Uji Parsial
Untuk memeriksa kemaknaan koefisien secara parsial dengan membandingkan
dugaan dengan penduga standar errornya.
Hipotesis :
a 0
Ho :
a 0
H1 :
Dengan Statistik uji Wald :
W2
2
a
SE ( ) 2
a
(2.20)
Statistik uji
W2
2
mengikuti distribusi
W 2 2 ( ,v )
atau p-value <
(banyaknya parameter).
)
(ol nl' l ) 2
'
C l 1 nl l (1 l )
=
g
(2.21)
nl'
dimana :
Apabila g adalah banyaknya grup yang bisa dibentuk oleh model yang sedang di uji
dan
value <
H0
adalah tingkat kepercayaan, maka
2
2 ( g 2; )
ditolak bila nilai
>
atau p-
Interpretasi Model
Menurut Hosmer (1989) interpretasi dari koefisien model adalah sebagai berikut :
1.
2.
Odds Ratio
dengan kategori dua (kategori dua terhadap respon dengan kategori pembanding) dalam satu
variabel tersebut. Jika variabel tak bebas dikategorikan dalam 2 kategori dan dinyatakan
dengan 0 dan 1 dan variabel bebas juga dibagi dalam 2 kategori dan dinyatakan dengan kode
(x)
0 dan 1. Sehingga akan didapatkan model dengan 2 nilai
(x)
dan 2 nilai 1-
Variabel tak
Y=1
bebas
Y=0
Variabel
X=1
e 0 1
(1)
1 e 0 1
1 (1)
1 e
1
0 1
bebas
X=0
(0)
1 e
1 ( 0)
0
1
1 e
(1) /1 (1)
(0) /1 (0)
nilai
(2.23)
kali dari
Uji Independensi
Untuk mengetahui hubungan antara variabel A dan B digunakan uji independensi.
Adapun hipotesis yang digunakan adalah :
H0 : Tidak ada hubungan antara variabel A dan B
H1 : Ada hubungan antara variabel A dan B
Dalam bentuk peluang, hipotesis H0 dan H1 dapat ditulis sebagai berikut :
ab a b
H0 :
ab a b
H1 :
ab a b
Jika A dan B saling bebas, maka :
ab
Taksiran parameter untuk
, adalah :
ab a b
ab
X a X b
n n
(2.24)
E ( X ab ) mab n ab
Nilai harapan sel frekuensinya :
Taksiran nilai harapan jika H0 benar adalah :
m ab n ab n a b
X a X b
n
(2.25)
A B
(2.26)
2
Jika H0 benar, maka statistik uji
bebas
(2v , )