Regresi Logistik Biner

Regresi Logistik Biner
Regresi logistik merupakan salah satu metode regresi yang menggambarkan hubungan
antara suatu variabel respon (dependent) dan satu atau lebih variabel prediktor (independent)
, dimana variabel respon bersifat biner atau dikotomus. Variabel dikotomus adalah variabel
yang hanya mempunyai dua kemungkinan nilai, misalnya aktif dan tidak aktif, yang
dinotasikan dengan Y=1 (aktif) dan Y=0 (tidak aktif), maka variabel Y tersebut mengikuti
distribusi Bernoulli.
Bentuk dari model Regresi Logistik dengan variabel independen p adalah sebagai
berikut.
( x)
exp( 0 1 x1 2 x2 ... p x p )
1 exp( 0 1 x1 2 x2 ... p x p )
(2.5)
(x)
Dengan menggunakan transformasi logit dari
, maka model logistik dikotomus
dapat ditulis sebagai berikut.

g ( x) 0 1 x1 2 x2 ... p x p
Selanjutnya g(x) disebut dengan Model Logit dan merupakan fungsi linear dalam
parameter-parameternya (Hosmer dan Lemeshow, 1989).
Estimasi Parameter Model Regresi Logistik

Metode Maximum Likelihood Estimation (MLE) digunakan
untuk mengestimasi
parameter regresi logistik. Metode ini akan menghasilkan dugaan maksimum likelihood bagi
melalui iterasi Newton Raphson.

Fungsi distribusi probabilitas untuk setiap pasangan (xi, yi), adalah
f x i x i
yi
1 x i 1 y
, i = 1,2...,n
Fungsi likelihood berikut akan diperoleh jika pengamatan diasumsikan independen.
l
f x
i
i 1
x 1 x
i
yi
1 y i
i 1
Secara sistematis lebih mudah untuk memaksimumkan ln likelihood yang didefinisikan

sebagai berikut (Agresti, 1990).
yi xij j
j 0
i 1
ln 1 exp
i 1
exp
i ij
i 1
y x x
ij
1 exp
i 1
terhadap
i 1
Maksimum likelihood berikut diperoleh dengan
mendifferensialkan
y i x ij
j x ij
j x ij

j 0

j 0

j xij
j 0
L ln l
p
ij
dan menyamakan dengan nol,
xi
i 1
Teori MLE (Maximum Likelihood Estimator) menyatakan bahwa turunan kedua fungsi
ln likelihood akan menghasilkan estimasi varians dan kovarians (Agresti, 1990).
Turunan kedua yaitu
exp
2 L
x ij x ik
j k
i 1
n
j 0
ij x ik
n
2 L
x ij2 x i 1 x i
2
j
i 1
x i 1 x i
i 1
j x ij 1 exp
j 0

1 exp
j x ij
j x ij

j 0

Metode iterasi Newton Raphson digunakan untuk mendapatkan nilai taksiran
dari
penyelesaian turunan pertama fungsi ln likelihood, dimana persamaannya bersifat non linier
(Agresti, 1990) dengan rumus sebagai berikut
t 1 t H t
qt
(2.6)
dengan
L L L
q T
,
,...
K
0 1
h11 h12
h21 h22
H
h j1 h j2
h1k
h2k
h jk
h jk
2 L
j k
dimana elemen-elemen matrikss Hessian
Pengujian Parameter Model Regresi Logistik

Model yang telah diperoleh perlu diuji kesesuaiannya, dengan melakukan uji
statistik akan diketahui apakah variabel variabel prediktor yang terdapat dalam model
memiliki hubungan yang nyata dengan variabel responnya. Pengujian yang dilakukan adalah
sebagai berikut .
1.
Uji Parsial
Signifikansi parameter terhadap variabel respon dapat diketahui dengan uji parsial.
Pengujian signifikansi parameter ini menggunakan uji Wald (Hosmer dan Lemeshow,1989).
Hipotesis:
H 0 : j = 0
j=1, 2, 3, ..., p
H 1 : j 0
Statistik uji : Statistik Uji Wald
j
Wj
SE ( j )
~ N (0,1)
(2.7)
Pada tingkat kepercayaan , H0 ditolak jika nilai
derajat bebas v.
2.
Uji Serentak
W Z / 2
W 2 2 (v , )
atau
dengan
Untuk mengetahui apakah model telah tepat (signifikan) dan untuk memeriksa
kemaknaan koefisien
secara keseluruhan dapat dilakukan dengan uji serentak.
Hipotesis:
H0 : 1 = 2 = = p = 0
i 0
H1 : paling sedikit ada satu
, dengan i = 1, 2, ..., p
Statistik Uji : Statistik Uji G2 atau Likelihood Ratio Test, yaitu
i 1
y ln x 1 y ln 1 x n ln n n
G 2
ln n0 n ln n
(2.8)
dengan :
n1
= banyaknya observasi yang berkategori 1
n0
= banyaknya observasi yang berkategori 0

2 ( ,v )
Daerah penolakan H0 adalah jika G >
dengan db=v.
Uji Kesesuaian Model Regresi Logistik

Statistik uji yang dapat digunakan untuk menguji kesesuaian model regresi logistik
adalah Goodness of Fit.
(o k n k k ) 2
n (1 k )
k 1 k k
g
(2.9)
dengan
ok
n 'k
j 1
jumlah variabel respon pada grup ke- k

k
n 'k
j 1
m j j
n' k
rata-rata taksiran probabilitas

j
mj
banyaknya observasi yang memiliki nilai

n'k
banyaknya observasi pada grup ke- k

Statistik uji diatas untuk menguji hipotesis sebagai berikut.
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
2
Keputusan : Tolak H0 jika
2
hitung
, dengan derajat bebas sebesar g-2.
(db,)
Interpretasi Model
Setelah didapatkan kesesuaian model pada koefisienkoefisien parameter yang
signifikan, selanjutnya adalah memberikan interpretasi nilai koefisien dalam model tersebut.
Pada variabel prediktor dikotomus, interpretasi koefisien parameter dapat
menggunakan nilai odds ratio (). Variabel penjelas x yang bersifat kategori terbagi dalam 2
kategori yang dinyatakan dengan kode 0 dan 1. Disini kategori 1 dibandingkan terhadap
kategori 2 berdasarkan nilai -nya yang menyatakan variabel 1 berpengaruh kali variabel 2
terhadap variabel respon. Sehingga berdasarkan model ada dua nilai (x) dan dua nilai
(x). Nilainilai itu dapat dinyatakan seperti Tabel 2.2.
Tabel 2.2 Nilai Model Regresi Logistik bila Variabel X Dikotomus
Variabel
Respon
Variabel Bebas
X=1
Y 1
Y 0
exp 0 1
(1)
1 exp 0 1
1 (1)
1
1 exp 0 1
X=0
(0 )
exp( 0 )
1 exp( 0 )
1 ( 0)
1
1 exp( 0 )
Sumber : Hosmer and Lemeshow (1989)
Odds ratio didefinisikan sebagai berikut .

=
e 1
1 1 1
g 1 g 0
0 1 0
(2.10)
ln ln
(2.11)
1-
Nilai odds ratio digunakan untuk menunjukkan kecenderungan hubungan suatu

variabel X terhadap variabel Y. Bila nilai = 1, maka antara kedua variabel tersebut tidak
terdapat hubungan. Bila nilai < 1, maka antara kedua variabel terdapat hubungan negatif
terhadap perubahan nilai X dan demikian sebaliknya bila > 1.
Pada variabel prediktor kontinu, Hosmer and Lemeshow (1989) menjelaskan jika
model regresi logistik mengandung variabel prediktor kontinu, maka interpretasi dari
koefisien model tergantung pada bagaimana variabel tersebut dimasukkan kedalam model.
g x 0 1 x
Jika asumsi bahwa logit bersifat linier, maka persamaannya adalah
Ini
menunjukkan koefisien slope, 1, memberikan perubahan nilai pada ln odds untuk

1 g x 1 g x
penambahan 1 unit x. Dengan kata lain,
untuk setiap nilai x (Hosmer and
Lemeshow, 1989).
Regresi Logistik
Regresi logistik adalah salah satu metode statistik untuk menganalisis hubungan
variabel respon (dependen) yang memiliki skala nominal atau ordinal dengan variabel
prediktor (independen). Regresi logistik yang memiliki variabel respon dengan dua kategori
disebut regresi logistik biner (dhikotomus). Sedangkan regresi logistik yang memiliki variabel
respon dengan tiga atau lebih kategori dimanakan regresi logistik polikotomus. Regresi
polikotomus terdiri dari dua yaitu regresi logistik multinomial dan regresi logistik ordinal.
Regresi logistik multinomial, masing- masing kategori pada variabel respon tidak ada
tingkatan melainkan hanya membedakan sedangkan yang memiliki tingkatan dinamakan
regresi logistik ordinal.
Regresi Logistik Biner

Regresi lgisrtik biner merupakan metode statistik yang dapat digunakan untuk
mengetahui pola hubungan antara variabel respon yang memiliki dua kategori dan variabel
( y 0)
respon. Misalkan variabel prediktor tersebut memiliki kategori gagal
dan sukses
(x)
( y 1)
. Dalam hal ini setiap pengamatan Y mengikuti distribusi Bernaulli dengan
adalah
1 ( x)
y 1
peluang untuk
y0
dan
adalah peluang untuk
. Adapun fungsi peluang untuk
setiap pengamatan adalah sebagai berikut ( Hosmer dan Lemeshow, 2000):

F ( yi ) ( x i ) yi [1 ( xi )]1 yi ; yi 0,1
(1)
( xi ) P ( yi 1)
dimana
Pada analisis regresi logistik mengasumsikan bahwa hubungan antara
( xi )
xi
dan
dapat dijelaskan melalui fungsi logistik sebagai berikut ( Hosmer dan Lemeshow, 2000):
( x)
e 0 1x
1 e
( x)
0 1x
exp( o 1x)
1 exp( o 1x)
atau
(2)
Untuk mempermudah menaksir parameter regresi, fungi logistic ditransformasi logit
terhadap
(x)
sehingga menjadi persamaan sebagai berikut :
exp( 0 1x)
1 exp( 0 1x)
(x)1 exp( 0 1x)
exp( 0 1x)
(x) (x) exp( 0 1x)
exp( 0 1x )
( x ) exp( 0 1x ) ( x ) exp( 0 1x )
=
( x ) 1 (x) exp( 0 1x)
=
(x)
1 (x)
=
(x)
1 (x)
exp( 0 1x)
ln
(x)
(x)
=ln
ln
g(x) =
{exp( 0 1x)}
0 1 x
0 1x
(3)
dimana
(x)
(x)
ln
g (x)
Uji Serentak
Dalam pengujian serentak, uji signifikansi model dapat dipergunakan likelihoodratio test. Likelihood-ratio test adalah metode pengujian signifikansi model dengan
membandingkan likelihood untuk model lengkap (L 1) dan likelihood untuk model yang
semua parameternya sama dengan nol (L0).
Hipotesis :
1 2 ... p 0
H0 :
H1 : minimal ada satu
k 0
;k = 1, 2, ..,p dimana p adalah jumlah prediktor dalam model.
X 2 ( p , )
H0 ditolak bila G >
dimana p adalah jumlah prediktor dalam model.
Adapun statistik uji untuk likelihood-ratio test adalah sebagai berikut (Hosmer dan
Lemeshow, 2000)
L0
L1
G 2 ln
=
=
2 ln( L0 ) ln( L1 )
2 ln( L0 ) {2 ln( L1 )}
2 ln( L0 ) (2( L1 ))
(4)
dimana : L0 = Likelihood tanpa variabel independen

L1 = Likelihood dengan variabel independen
Uji Parsial
Pengujian ini dilakukan untuk mengetahui signifikansi parameter secara individu
terhadap variabel respon. Pengujian signifikansi parameter menggunakan uji Wald (Hosmer
dan Lemeshow, 2000) dengan hipotesis:
i 0
H0 :
i 0
H1 :
, dengan i = 1, 2, ...p
SE( )
Statistik uji :
(3.5)
W 2 X 2 (v , )
W Z / 2
Daerah penolakan H0 adalah jika
atau
dengan derajat bebas v.
Odd Rasio
Odd rasio pada regresi logistik biner dapat dicari dengan menggunakan acuan tabel
nilai peluang sebagai berikut (Hosmer dan Lemeshow, 2000):
Tabel 2.1: Tabel Nilai Peluang Regresi Logistik Jika Variabel dependen dan Independen
Memiliki Dua Kategori
Variabel
Variabel Prediktor
x=1
respon
1
y=1
exp 0 1
1 exp 0 1
1 - 1
y=0
x=0
0
1
1 exp 0 1
exp 0
1 exp 0
1 - 0
1
1 exp 0
Nilai odd rasio yang dinotasikan OR didefinisikan sebagai rasio untuk x=1 dan x=0
(Hosmer dan Lemeshow, 2000). Adapun peramaannya adalah sebagai berikut:
1 / 1 1
0 / 1 0
OR
(6)
Dengan mensubtitusikan nilai peluang pada tabel didapatkan hasil sebagai berikut :
exp( 0 1 )
exp( 0 1 )
1 exp( 0 1 )
OR
exp( 0 )
exp( 0 )
1 exp( 0 )
exp( 0 1 )
exp( 0 )
exp( 0 1 ) 0
=
= exp(
1 )
(7)
Dari persamaan di atas dapat disimpulkan bahwa odd rasio merupakan nilai eksponensial
dari
Analisis Regresi Logistik Biner

Analisis regresi logistik biner adalah suatu analisis regresi logistik antara variabel
prediktor dengan variabel respon yang terdiri dari dua buah kategori (Hosmer,1989). Disebut
sebagai variabel biner apabila variabel respon (Y) menghasilkan 2 kategori, yaitu 0 dan 1.
Sehingga variabel Y akan mengikuti distribusi Bernoulli dengan fungsi probabilitas sebagai
berikut :
f(y) = py (1 p)1-y dimana y = 0, 1
..................................(2.3)
Jika y = 0, maka f(0) = 1 p

Jika y = 1, maka f(1) = p
Tujuan dari analisis regresi logistik biner adalah untuk mencari pola hubungan secara
probabilitas antara variabel x dengan p (probabilitas kejadian yang diakibatkan oleh x).
Berapapun nilai x bila disubstitusikan ke fungsi logistik hasilnya akan berkisar 0 dan 1.
Fungsi logistik dapat dilihat sebagai berikut :
f(x) =
1
1 e x
........................................... (2.4)
lim f ( x ) 0
Jika x = -, maka
lim f ( x) 1
Jika x = +, maka
Untuk mempermudah notasi maka digunakan nilai (x) = E(Y|X) untuk menyatakan
rata-rata bersyarat dari Y jika diberikan nilai x. Bentuk model regresi logistik adalah :
( x)
exp ( o 1 x)
1 exp ( o 1 x)
........................................... (2.5)
Dengan suatu transformasi dari persamaan (2.5) dikenal sebagai transformasi logit
digunakan untuk memperoleh fungsi g (x) yang linear dalam parameter-parameternya,
sehingga akan mempermudah mengestimasi parameter-parameternya. Model transformasi

tersebut adalah sebagai berikut :
( x)
1 ( x)
g(x) = ln
o 1 x
g(x)
........................................... (2.6)
g(x) disebut dengan bentuk logit.
Metode Maximum Likelihood

Metode Maximum Likelihood (metode kemungkinan maksimum) digunakan untuk
menduga parameter-parameter dari model persamaan regresi logistik (Hosmer dan
= (0, 1, 2, , k). Nilai
Lameshow,1989). Parameter dari model diestimasi dari vektor
vektor
diperoleh dengan memaksimumkan fungsi L() melalui pendeferensialan dengan
parameter-parameter yang akan dihitung.

Fungsi L() adalah fungsi log likelihood, yaitu :
k
L() =
j i y i x ij j i ni log 1 exp

x ij

.(2.7)
Fungsi log likelihood diatas diperoleh berdasarkan pada persamaan likelihood :

n
( xi ) 1 ( xi )
ni y i
i 1
dengan (xi) =
i 1
( xi )
1 ( xi )
exp
log
(2.8)
x ij
1 exp
ni
exp
(1 ( x )
n
yi
x ij
...................................... (2.9)
Dimana i = 1, 2, , n
Fungsi di atas merupakan gabungan dari (Y1, Y2, , Yn) yang saling independen, dengan
nilai dari Y observasi terdiri dari sukses (1) dan gagal (0), dengan distribusi binomial dan
memiliki E (Yi) = ni(x) ; dimana n1 + n2 + + ni = N.
Persamaan log likelihood pada persamaan (2.7) dideferensialkan terhadap masing-masing
elemen . Sehingga diperoleh persamaan likelihood sebagai berikut :
n
y i x ij ni ( x i ) x ij
= 0 dengan j = 0, 1, 2, , k
............................ (2.10)
Sedangkan metode untuk mengestimasi varian dan kovarians dari estimasi koefisien
parameter dikembangkan teori maximum likelihood estimation. Teori ini mengatakan bahwa
estimasi varian diperoleh dari turunan kedua fungsi likelihood, turunan kedua adalah sebagai
berikut :
2L
x ij x iu n i i (1 i )
j u
i
........................................... (2.11)
Pengujian Estimasi Parameter
Menurut Hosmer dan Lameshow (1989), model yang telah diperoleh tersebut perlu
diuji kesignifikasinya, dengan melakukan pengujian statistik akan menentukan apakah
variabel-variabel prediktor yang terdapat dalam model tersebut memiliki hubungan yang
nyata dengan variabel responnya. Pengujian yang dilakukan adalah sebagai berikut :
1. Uji Serentak
Uji serentak dilakukan untuk memeriksa atau peran keberartian koefisien secara
keseluruhan atau serentak (Hosmer,1989). Pengujian yang dilakukan adalah sebagai berikut :
1 2 k 0
Hipotesa : H0 :
k 0
H1 : Minimal ada satu
Statistik Uji :
G2
atau Likelihood Ratio Test :
n1
n

n
n1
n0
n0
n

yi
(1 y i )
i 1
= -2 ln
........................................... (2.12)
i 1
n 0 (1 y i ); n1 y i
Dimana :
dan N = n0 + n1
2
Nilai G2 yang diperoleh dibandingkan dengan distribusi
dengan derajat bebas v =
k + 1 sesuai dengan p-value yang diinginkan untuk dapat menolak H0 atau H1.
2. Uji Parsial
Menurut Hosmer dan Lemeshow (1989) menyatakan bahwa uji parsial ini dilakukan
untuk menguji keberartian koefisien secara parsial, yaitu dengan membandingkan
parameter dari hasil maksimum likelihood, dugaan , dengan penduga standar errornya dan
hipotesa yang dilakukan sebagai berikut :
Hipotesa
j 0
H0 :
j 0
H1 :
W1
Statistik Uji : Uji Wald :
SE j
Statistik uji Wald mengikuti distribusi Normal, sehingga pengujiannya dilakukan melalui
pembanding nilai statistik W1 dengan nilai Ztabel
Selain uji Wald tersebut di atas, dapat pula dilakukan Uji Wald yang lain, yaitu :
2
Wz
SE j
........................................... (2.13)
Statistik uji Wz mengikuti distribusi Chi-Square 2 sehingga pengujiannya dilakukan
2 ;v
melalui pembanding nilai statistik Wz dengan nilai tabel
dan
derajat bebas v
(banyaknya variabel prediktor).

Menurut Agresti (1990) terdapat beberapa statistik uji yang dapat digunakan untuk
menguji kesesuaian model regresi logistik antara lain :
1. 2 Log Likelihood
O
i
Oij
ij
Log
E
ij
G =2
2. Goodness of Fit
(Oij E ij ) 2
E ij
Dari kedua statistik uji diatas untuk menguji hipotesis sebagai berikut :
prediksi model)
prediksi model)
3. Improvement
Uji ini digunakan untuk menilai apakah satu atau lebih variabel prediktor yang belum
masuk ke dalam model memiliki peran yang penting dalam model (Agresti, 1990). Pengujian
yang dilakukan adalah sebagai berikut :
Hipotesa :
H0 : Model tanpa variabel prediktor tertentu adalah model terbaik
H1: Model dengan variabel prediktor tertentu adalah model terbaik
Statistik Uji :
G2 = -2 (L0 L1)
Dimana :
L0 = Log Likelihood untuk model dengan variabel prediktor tertentu
L1 = Log Likelihood untuk model tanpa variabel prediktor tertentu
Nilai G2 yang diperoleh dibandingkan dengan distribusi 2 dengan derajat bebas selisih
antara L0 dan L1. Jika H0 ditolak maka model dengan variabel prediktor tertentu secara
signifikan lebih baik dibanding model tanpa prediktor tertentu.
Analisis Regresi Logistik Biner

Analisis regresi logistik biner adalah suatu analisis regresi logistik antara variabel
prediktor dengan variabel respon yang terdiri dari dua buah kategori (Hosmer,1989). Disebut
sebagai variabel biner apabila variabel respon (Y) menghasilkan 2 kategori, yaitu 0 dan 1.
Sehingga variabel Y akan mengikuti distribusi Bernoulli dengan fungsi probabilitas sebagai
berikut :
f(y) = py (1 p)1-y dimana y = 0, 1
..................................(2.3)
Jika y = 0, maka f(0) = 1 p

Jika y = 1, maka f(1) = p
Tujuan dari analisis regresi logistik biner adalah untuk mencari pola hubungan secara
probabilitas antara variabel x dengan p (probabilitas kejadian yang diakibatkan oleh x).
Berapapun nilai x bila disubstitusikan ke fungsi logistik hasilnya akan berkisar 0 dan 1.
Fungsi logistik dapat dilihat sebagai berikut :
f(x) =
1
1 e x
........................................... (2.4)
lim f ( x ) 0
Jika x = -, maka
lim f ( x) 1
Jika x = +, maka
Untuk mempermudah notasi maka digunakan nilai (x) = E(Y|X) untuk menyatakan
rata-rata bersyarat dari Y jika diberikan nilai x. Bentuk model regresi logistik adalah :
( x)
exp ( o 1 x)
1 exp ( o 1 x)
........................................... (2.5)
Dengan suatu transformasi dari persamaan (2.5) dikenal sebagai transformasi logit
digunakan untuk memperoleh fungsi g (x) yang linear dalam parameter-parameternya,
sehingga akan mempermudah mengestimasi parameter-parameternya. Model transformasi
tersebut adalah sebagai berikut :
( x)
1 ( x)
g(x) = ln
o 1 x
g(x)
........................................... (2.6)
g(x) disebut dengan bentuk logit.
Metode Maximum Likelihood

Metode Maximum Likelihood (metode kemungkinan maksimum) digunakan untuk
menduga parameter-parameter dari model persamaan regresi logistik (Hosmer dan
= (0, 1, 2, , k). Nilai
Lameshow,1989). Parameter dari model diestimasi dari vektor
vektor
diperoleh dengan memaksimumkan fungsi L() melalui pendeferensialan dengan
parameter-parameter yang akan dihitung.

Fungsi L() adalah fungsi log likelihood, yaitu :
n
y
x
j i i ij j i ni log 1 exp
L() =

x ij

.(2.7)
Fungsi log likelihood diatas diperoleh berdasarkan pada persamaan likelihood :

n
( x ) 1 ( x )
i
yi
ni y i
(1 ( x )
i 1
Dimana i = 1, 2, , n
i 1
ni
( xi )

1 ( x i )
exp
log
(2.8)
x ij
1 exp
dengan (xi) =
exp
x ij
...................................... (2.9)
Fungsi di atas merupakan gabungan dari (Y1, Y2, , Yn) yang saling independen, dengan
nilai dari Y observasi terdiri dari sukses (1) dan gagal (0), dengan distribusi binomial dan
memiliki E (Yi) = ni(x) ; dimana n1 + n2 + + ni = N.
Persamaan log likelihood pada persamaan (2.7) dideferensialkan terhadap masing-masing
elemen . Sehingga diperoleh persamaan likelihood sebagai berikut :
n
y i x ij ni ( x i ) x ij
= 0 dengan j = 0, 1, 2, , k
............................ (2.10)
Sedangkan metode untuk mengestimasi varian dan kovarians dari estimasi koefisien
parameter dikembangkan teori maximum likelihood estimation. Teori ini mengatakan bahwa
estimasi varian diperoleh dari turunan kedua fungsi likelihood, turunan kedua adalah sebagai
berikut :
2L
x ij x iu n i i (1 i )
j u
i
........................................... (2.11)

Menurut Hosmer dan Lameshow (1989), model yang telah diperoleh tersebut perlu
diuji kesignifikasinya, dengan melakukan pengujian statistik akan menentukan apakah
variabel-variabel prediktor yang terdapat dalam model tersebut memiliki hubungan yang
nyata dengan variabel responnya. Pengujian yang dilakukan adalah sebagai berikut :
1. Uji Serentak
Uji serentak dilakukan untuk memeriksa atau peran keberartian koefisien secara
keseluruhan atau serentak (Hosmer,1989). Pengujian yang dilakukan adalah sebagai berikut :
1 2 k 0
Hipotesa : H0 :
k 0
Statistik Uji :
G2
atau Likelihood Ratio Test :
n1
n

n
n1
n0
n0
n

yi
(1 y i )
i 1
= -2 ln
........................................... (2.12)
n
i 1
n 0 (1 y i ); n1 y i
Dimana :
dan N = n0 + n1
2
Nilai G2 yang diperoleh dibandingkan dengan distribusi
dengan derajat bebas v =
k + 1 sesuai dengan p-value yang diinginkan untuk dapat menolak H0 atau H1.
2. Uji Parsial
Menurut Hosmer dan Lemeshow (1989) menyatakan bahwa uji parsial ini dilakukan
untuk menguji keberartian koefisien secara parsial, yaitu dengan membandingkan
parameter dari hasil maksimum likelihood, dugaan , dengan penduga standar errornya dan
hipotesa yang dilakukan sebagai berikut :
Hipotesa
j 0
H0 :
j 0
H1 :
W1
Statistik Uji : Uji Wald :
SE j
Statistik uji Wald mengikuti distribusi Normal, sehingga pengujiannya dilakukan melalui
pembanding nilai statistik W1 dengan nilai Ztabel
Selain uji Wald tersebut di atas, dapat pula dilakukan Uji Wald yang lain, yaitu :
2
Wz
SE j
........................................... (2.13)
Statistik uji Wz mengikuti distribusi Chi-Square 2 sehingga pengujiannya dilakukan
2 ;v
melalui pembanding nilai statistik Wz dengan nilai tabel
dan
derajat bebas v
(banyaknya variabel prediktor).

Menurut Agresti (1990) terdapat beberapa statistik uji yang dapat digunakan untuk
menguji kesesuaian model regresi logistik antara lain :
1. 2 Log Likelihood
Oij
Oij Log
i
E
ij
G =2
2. Goodness of Fit
(Oij E ij ) 2
E ij
Dari kedua statistik uji diatas untuk menguji hipotesis sebagai berikut :
prediksi model)
prediksi model)
3. Improvement
Uji ini digunakan untuk menilai apakah satu atau lebih variabel prediktor yang belum
masuk ke dalam model memiliki peran yang penting dalam model (Agresti, 1990). Pengujian
yang dilakukan adalah sebagai berikut :
Hipotesa :
H0 : Model tanpa variabel prediktor tertentu adalah model terbaik
H1: Model dengan variabel prediktor tertentu adalah model terbaik
Statistik Uji :
G2 = -2 (L0 L1)
Dimana :
L0 = Log Likelihood untuk model dengan variabel prediktor tertentu
L1 = Log Likelihood untuk model tanpa variabel prediktor tertentu
Nilai G2 yang diperoleh dibandingkan dengan distribusi 2 dengan derajat bebas selisih
antara L0 dan L1. Jika H0 ditolak maka model dengan variabel prediktor tertentu secara
signifikan lebih baik dibanding model tanpa prediktor tertentu.
Regresi Logistik
Regresi logistik digunakan jika variabel respon bersifat kategorik (nominal atau ordinal)
dengan variabel-variabel prediktor kontinu maupun kategorik (Agresti, 1990). Variabel
respon Y yang bersifat random dan dikotomus, yakni bernilai 1 dengan probabilitas
dan
bernilai 0 dengan probabilitas 1- , disebut sebagai point-binomial (Le, 1998).

Untuk pengamatan ke-i dari sampel (i = 1,2,...,n), Yi adalah variabel bernoulli dengan
distribusi probabilitas (Le, 1998):
P Yi y i x i i 1 x i
y
1 y i
; yi = 0,1 dan n = jumlah sampel

Fungsi basis logistik adalah (Le, 1998)
f z
1
1 e z
(1)
z 0 1 x
Dimana,
Untuk
Lim f ( z ) 0
maka
, sedangkan untuk
Dengan melihat kemungkinan nilai
f z
Lim f ( z ) 1
z
maka
yang berkisar antara 0 dan 1, menunjukkan bahwa
regresi logistik sebenarnya menggambarkan probabilitas terjadinya suatu event.(Sumber: Le,

1998)
Secara umum, model regresi logistik yang dinyatakan sebagai fungsi x adalah (Hosmer
and Lemeshow, 1989)
( x )
exp( 0 1x )
1 exp( 0 1x )
(2)
Untuk mempermudah penaksiran parameter regresi, maka digunakan transformasi logit
( x )
terhadap
sehingga menjadi bentuk logit pada persamaan (3)
( x )
1 (x )
g (x ) ln
0 1x
(3)
Regresi logistik berganda

Model regresi logistik dengan k variabel prediktor adalah (Le, 1998)
(x)
exp( 0 1x1 ... k x k )

1 exp( 0 1x1 ... k x k )
(4)
Jika model pada persamaan (4) ditransformasi dengan menggunakan transformasi logit,
maka akan menghasilkan bentuk logit
0 1x1 ... k x k
g(x) =
(5)
yang merupakan fungsi linier dalam parameter-parameternya.

Estimasi parameter
Metode estimasi yang mengarah pada fungsi least squares dalam model regresi linier
(jika residual berdistribusi normal) disebut maximum likelihood (Hosmer and Lemeshow,
t 0
1 ... k
1989). Jika parameter pada model regresi logistik dinotasikan sebagai
maka pada dasarnya metode maximum likelihood mengestimasi nilai
dengan
memaksimumkan fungsi Likelihood (Hosmer and Lemeshow, 1989).

Fungsi distribusi probabilitas untuk setiap pasangan (x i, yi), adalah (Hosmer and
Lemeshow, 1989)
f x i x i i 1 x i
y
1 y i
(6)
Dimana,
(x i )
x
j 0
ij
1 exp
exp
x
j 0
ij
Secara matematis, lebih mudah untuk memaksimumkan ln
atau disebut juga ln
L( )
likelihood yang dinotasikan sebagai
(Agresti, 1990).
L ln l

j 0
y x
i
i 1
ln 1 exp
ij
j
i 1
x
j 0
ij
L( )
Maksimum ln likelihood dapat diperoleh dengan cara men-differensialkan
terhadap
dan menyamakannya dengan nol (Agresti, 1990).
y i x ij x ij
j
i 1
i 1
n
exp
j 0
i 1
i 1
x ij
1 exp
j 0
x ij

0 y i x ij x i x ij
; j = 0,1,, k
(7)
Dimana,
x i
exp
j 0
ij
1 exp
x
j 0
ij
x i
menyatakan estimasi dari
dengan menggunakan metode
maximum likelihood.
Dari hasil penurunan pertama pada persamaan (7), nilai
diestimasi dengan metode
numerik karena persamaannya ber-sifat nonlinier. Sedangkan metode untuk mengestimasi
varians dan kovarians dari taksiran
dikembangkan menurut teori MLE (Maximum
Likelihood Estimator) yang menyatakan bahwa estimasi varians dan kovarians diperoleh dari
turunan kedua fungsi ln Likelihood (Agresti, 1990), yaitu :
n
2 L
x ij2 x i 1 x i
2
j
i 1
x ij x ij x i i 1 x i
i 1
; j = 0, 1,,k
(8)
Pengujian signifikansi parameter

Pengujian parameter model dilakukan untuk memeriksa apakah variabel predictor
mempunyai peranan (pengaruh) yang nyata di dalam model. Uji parameter yang digunakan
dalam penelitian ini adalah :
a. Statistik uji G
b. Statistik uji Wald (W)
Statistik uji-G adalah uji rasio kemungkinan (likelihood ratio test) yang digunakan
untuk menguji peranan variabel prediktor di dalam model secara bersama-sama (Hosmer and
Lemeshow, 2000). Rumus umum untuk uji-G berdasarkan hipotesis :
1 2 ... k 0
H0 :
j 0
untuk j=1,2,...,k
Statistik Uji (Hosmer and Lemeshow, 1989):
G Likelihood Ratio Test 2 Ln
i 1
i 1
n0
x 1 x
i 1
n0
yi
n1 y i n0 1 y i
Dengan,
n1
n1
1 y i
(9)
n n0 n1
;
Dibawah H0, statistik uji G akan mengikuti distribusi chi-square dengan derajat bebas k
(Hosmer and Lemeshow, 1989). Sehingga untuk memperoleh keputusan, nilai statistik uji G
2 ,k
dibandingkan dengan nilai
G 2 ,k
. Kriteria penolakan H0 adalah jika
j
Statistik uji Wald digunakan untuk menguji parameter
secara parsial (Hosmer and
Lemeshow, 2000). Rumus umum untuk uji-Wald berdasarkan hipotesis :
j
H0 :
= 0 ; j = 1,2,...,k
j
H1 :
Statistik Uji (Le, 1998):

Wald (W)
j
SE( j )
(10)
W Z / 2
Kriteria penolakan H0 adalah jika |
Uji Kesesuaian Model

Dari estimasi model regresi logistik yang diperoleh, ingin diketahui seberapa besar
keefektifan model dalam menjelaskan variabel respon. Hal ini disebut sebagai goodness-of-fit
(kesesuaian model). Goodness-of-fit dihitung berdasarkan nilai
yang tergantung pada
susunan variabel-variabel prediktor dalam model, bukan pada jumlah variabel prediktor
(Hosmer and Lemeshow, 1989). Berikut ini adalah prosedur pengujian kesesuaian model.
H0 : Model sesuai
H1 : Model tidak sesuai
Statistik Uji (Hosmer and Lemeshow, 1989):
g
o nk ' k
C Hosmer Lemeshow k
k 1 n k ' k 1 k
2
(11)
ck
ok y j
nk '
Dengan g
= Jumlah grup,
j 1
= Banyaknya subjek pada grup ke-k,

ck
k
j 1
jumlah nilai variabel respon pada grup ke-k ,
m j x j
nk '
rata-rata
ck
probabilitas dimana mj adalah banyaknya subjek pada
kategori variabel respon.
taksiran
Jika H0 benar, maka distribusi statistik uji
mengikuti distribusi chi-square dengan

C (2g 2 , )
derajat bebas g-2 (Hosmer and Lemeshow, 1989). Daerah penolakan H0 adalah
Interpretasi koefisien model regresi logistik

Estimasi koefisien dari variabel prediktor menyatakan slope atau nilai perubahan
variabel respon untuk setiap perubahan satu unit variabel prediktor. Interpretasi meliputi:
menentukan hubungan fungsional antara variabel respon dan variabel prediktor serta
mendefinisikan unit perubahan variabel respon yang disebabkan oleh variabel prediktor
(Hosmer and Lemeshow, 1989).
Untuk regresi logistik dimana variabel prediktor bersifat dikotomus, nilai x
dikategorikan 0 atau 1. Pada model ini, ada dua nilai

Tabel 1 Nilai-Nilai
dan
1 x
1 x
Variabel Prediktor
x=1
respon
y=0
dan dua nilai
Untuk Variabel Prediktor Dikotomus
Variabel
y=1
exp 0 1
1 exp 0 1
1 - 1
1
1 exp 0 1
x=0
0
exp 0
1 exp 0
1 - 0
1
1 exp 0
Sumber: Hosmer and Lemeshow, 1989
Odds rasio, dinotasikan , didefinisikan sebagai rasio odds untuk x = 1 terhadap odds
untuk x = 0, yang dapat dituliskan dalam persamaan (12) berikut (Hosmer and Lemeshow,
1989).
1 /1 1
0 /1 0
Berdasarkan Tabel 1, nilai odds rasio adalah
exp 0 1
1

1 exp 0 1 1 exp 0
exp 0
1 exp 0 1 exp 0 1
(12)
exp( 0 1 )
exp 0 exp 1
Regresi Logistik
Model Regresi Logistik merupakan analisis statistik yang digunakan untuk
menggambarkan hubungan antara variabel tak bebas yang bersifat kategori dengan variabel
bebas yang bersifat kategori, kontinu atau keduanya. Untuk variabel bebas bertipe kualitatif
digunakan variabel dummy sedangkan untuk variabel bebas bertipe kuantitatif didefinisikan
secara langsung. Hubungan antara variabel tak bebas (Y) dengan variabel bebas (X), menurut
E(Y) x
Agresti (1996) adalah mean
V(Y) x - x
dan varian
. Sedangkan
regresi logistik dengan k variabel bebas (X) dan variabel tak bebas (Y) menurut Hosmer
P(Y 1 | x) ( x
(1989) adalah
, maka bentuk persamaan regresi logistik berganda adalah
( x)
g ( x)
1 e
g ( x)
(2.1)
atau
( x)
( 0 1 x1 2 x 2 ... k x k )
1 e
( 0 1 x1 2 x 2 ... k x k )
(2.2)
(x)
Dengan menggunakan transformasi logit dari
, maka model regresi logistik dapat
ditulis sebagai berikut :

g ( x) ln
( x)
1 ( x)
(2.3)
g ( x) ln
( 0 1x1 2 x2 ... k xk )
( 0 1x1 2 x2 ... k xk )
1 e
e ( 0 1x1 2 x2 ... k xk )
1
( 0 1x1 2 x2 ... k xk )
1 e
( 0 1x1 2 x2 ... k xk )
( 0 1x1 2 x2 ... k xk )
(2.4)
( 0 1x1 2 x2 ... k xk )
g ( x ) ln 1 e
1
1 e ( 0 1x1 2 x2 ... k xk )
g ( x ) ln( e
(2.5)
(2.6)
g ( x) 0 1 x1 2 x 2 ... k x k
(2.7)
sehingga
k
g ( x) 0 b xb
b 1
(2.8)
yang merupakan fungsi linier dalam parameter parameternya.
Dalam suatu model regresi linier diasumsikan bahwa suatu amatan dari variabel tidak
y E (Y ( x)) e
bebas dapat diekspresikan sebagai
, dimana
yang mengekspresikan penyimpangan amatan dari rataan dan
merupakan komponen acak
diasumsikan mengikuti
sebaran normal rataan nol dan varian konstan.

y ( x) e
Pada pola distribusi bersyarat errornya diekspresikan sebagai
mempunyai
salah satu dari dua kemungkinan nilai error yaitu :

Jika
, maka
dengan peluang
1 ( x)
e (x)
y0
Jika
(x)
e 1 ( x)
y 1
, maka
dengan peluang
( x)[1 ( x)]
Maka nilai errornya mempunyai rataan nol dan varian
distribusi Binomial (Hosmer, 1989)
, yang mengikuti
Estimasi Parameter
Suatu model yang memiliki respon biner, dimana antar amatan diasumsikan bebas dan
nilai harapan variabel tak bebasnya tidak linier terhadap parameter , maka penduga dapat
diperoleh dengan metode maximum likelihood. Metode maximum likelihood merupakan
(n 10( s 1))
penduga yang konsisten dan efisien untuk ukuran sampel besar
, dimana s
adalah jumlah parameter. Maximum Likelihood Estimation adalah suatu fungsi dari parameter
yang memaksimumkan peluangnya untuk menduga parameter.
Pada dasarnya metode maximum likelihood memberikan nilai dugaan
dengan
memaksimumkan suatu fungsi likelihood. Fungsi likelihood yang dimaksimumkan adalah :
( xa ) ( xa )
ya
1 ya
[1 ( x a )]
(2.9)
karena setiap pengamatan bebas maka fungsi likelihood merupakan fungsi kepadatan
gabungan dimana adalah vektor, yaitu :
n
l () ( x a )
a 1
l () ( x a )
a 1
l () ( x a )
a 1
ya
1 ya
[1 ( x a )]
ya [1 ( x a )]
y
[1 ( x a )] a
( xa )
l ()
a 1 1 ( a )
n
ya
1 ( x a )
n
( x ) ya
n
a

l () 1 ( x a ) exp ln
a 1
a 1
1 ( a )

n
n
( xa )

l () 1 ( x a ) exp y a ln
a 1
a 1
1
(
x
)
a
(2.10)
dengan melakukan transformasi logit terhadap model regresi logistik pada Persamaan
(2.10) maka didapatkan :
k
exp b x ab
1 exp b x ab
l ()
a 1

exp b x ab
n
b 0
1
exp y a ln
k
a 1
1 exp b x ab
b 0

b0
exp b x ab
b 0
1

k
1 exp b x ab
b 0
l ()
k
a 1 1 exp x
b ab
b 0

b0
k
k
n
exp y a ln exp b x ab
b 0

a 1

n
k

l ()
exp
y
b x ab
a
k
a 1
a 1 b 0
1 exp b x ab
b 0
k n
l ()
exp y a x ab b
k
a 1
b 0 a 1
1 exp b x ab
b 0
(2.11)
Untuk mendapatkan nilai taksiran
menggunakan Maximum Likelihood Estimatian
adalah dengan memaksimalkan fungsi likelihood. Secara matematis akan lebih mudah untuk
log l ()
memaksimalkan nilai
yang dapat disebut log likelihood, yang didefinisikan sebagai
berikut :
L() ln
a 1 1 exp k x
b ab
b 0
exp y a x ab b
b 0 a 1
n
k
k n
L() y a x ab b ln 1 x ab b
b
0
b
1
a
1
b
(2.12)

Untuk mendapatkan nilai
, maka dilakukan penurunan pada Persamaan (2.12)
terhadap
. Hasil turunan parsial pertama dari Persamaan (2.12) adalah :
L()
1
y b x ab x ab
k
b 0
a 1
b
1 exp
b x ab
exp b x ab
b0
exp b x ab
n
L() k
b 0
y a x ab x ab
k
b 0
a 1
b
1 exp b x ab
b 0
(2.13)
Metode yang digunakan untuk melakukan estimasi varian dan kovarian adalah
pengembangan dari teori Maximum Likelihood Estimation. Teori ini menyatakan bahwa
estimasi varian dan kovarian diperoleh dari turunan kedua fungsi likelihood.
Turunan kedua fungsi likelihood terhadap
x ab
a 1
L()

b u
exp u x au
u 0
k
1 exp u x au
u 0
u
k
adalah sebagai berikut :

x au exp u x au 1 exp u x au x au exp u x au exp u x au

n
L
u 0
u 0
u 0
u 0
x ab
2
a 1
b u
k
1 exp x
u au
u 0
k
k
x au exp u x au
x au exp u x ab
2
n
L()
u 0
u 0
x ab
k
k
a 1
b u
1 exp x
1 exp u x au
u au

u 0

u 0
n
2 L()
2
x ab x au a a
a 1
b u
n
2 L()
x ab x au a 1 a
a 1
b u
(2.14)
untuk b = u adalah estimasi varian yang dapat ditulis menjadi:
n
2 L()
2
x ab a 1 a
2
a 1
b
(2.15)
dimana :
b, u = 0,1,2,...,k (parameter)
Untuk mendapatkan Maximum Likelihood Estimatian bagi
digunakan metode Newton
Rhapson melalui iterasi sebagai berikut :
t 1 t H t
q t
(2.16)
dimana t = 0,1,2,...sampai konvergen

dengan
q g / 1 , g / 2 ,..., g / k
(2.17)
2 g / 2j
2 g / j u
2
g / j u 2 g / u2
(2.18)
Adapun langkah langkah estimasi dengan pendekatan estimasi Newton Rhapson

adalah, adalah sebagai berikut :
0
a.
b.
Mensubstitusikan estimasi
Mensubstitusikan
( 0)
kedalam Persamaan (2.2) untuk mendapatkan
Untuk t > 0 digunakan nilai
kedalam Persamaan (2.15).

1 0 H 0
c.
(0)
q 1
sehingga mendapatkan
dan
H 1
q 0
, nilai
digunakan untuk mencari
2
untuk memperoleh
sampai konvergen.
Pengujian statistik dilakukan untuk menentukan apakah variabel variabel bebas yang
terdapat dalam model tersebut memiliki hubungan yang nyata dengan variabel tak bebasnya.
Pengujian ini dilakukan sebagai berikut :
1. Uji Serentak
Dilakukan untuk memeriksa kemaknaan koefisien secara serentak dan hipotesa
pengujiannya adalah
Ho : 0 = 1 = ...........= k = 0
H1 : paling sedikit ada satu k 0
Statistik uji yang digunakan adalah statistik uji G atau Likelihood Ratio Test, yaitu
n1
G 2 ln
( a )
a
1
ya
n1
n0
n0
1 a 1 ya
(2.19)
atau
G=2
n [ y ln( ) (1 y ) ln( 1 )] [n ln( n ) n ln( n ) n ln( n)]
a
a
a
a
1
1
0
0
a 1
n1 y a
a 1
Dimana: n1 = banyaknya observasi yang berkategori 1 atau

n0 1 y a
n
a 1
n0 = banyaknya observasi yang berkategori 0 atau

n = n 0 + n1
Nilai G yang diperoleh dibandingkan dengan distribusi Chi Square dengan derajat
bebas
dan
untuk menolak H0.
(2 ,v )
Tolak H0 jika G >
atau jika nilai p value < .
2. Uji Parsial
Untuk memeriksa kemaknaan koefisien secara parsial dengan membandingkan
dugaan dengan penduga standar errornya.
Hipotesis :
a 0
Ho :
a 0
H1 :
Dengan Statistik uji Wald :
W2
2
a
SE ( ) 2
a
(2.20)
Statistik uji
W2
2
mengikuti distribusi
W 2 2 ( ,v )
atau p-value <
, sehingga H0 ditolak jika nilai
, dengan derajat bebas
(banyaknya parameter).
Uji Kesesuaian Model

Digunakan untuk mengetahui apakah model dengan satu atau lebih variabel bebas
merupakan model yang sesuai atau tidak.
Hipotesis:
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan
kemungkinan hasil prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan
kemungkinan hasil prediksi)
Statistik Uji :
Hosmer-Lemeshow test (
)
(ol nl' l ) 2
'
C l 1 nl l (1 l )
=
g
(2.21)
nl'
dimana :
= jumlah pola covariate yang bisa dibentuk dalam grup ke l

nl'
o yj
l j 1
(2.22)
Apabila g adalah banyaknya grup yang bisa dibentuk oleh model yang sedang di uji
dan
value <
H0
adalah tingkat kepercayaan, maka
2
2 ( g 2; )
ditolak bila nilai
>
atau p-
maka model tersebut tidak sesuai.
Interpretasi Model
Menurut Hosmer (1989) interpretasi dari koefisien model adalah sebagai berikut :
1.
Untuk menjelaskan hubungan fungsional antara

variabel variabel bebas dengan variabel tak bebas.
2.
Untuk menentukan unit perubahan setiap variabel

bebas.
( )
Odds Ratio
yaitu nilai yang menunjukkan besarnya pengaruh antara kategori satu
dengan kategori dua (kategori dua terhadap respon dengan kategori pembanding) dalam satu
variabel tersebut. Jika variabel tak bebas dikategorikan dalam 2 kategori dan dinyatakan
dengan 0 dan 1 dan variabel bebas juga dibagi dalam 2 kategori dan dinyatakan dengan kode
(x)
0 dan 1. Sehingga akan didapatkan model dengan 2 nilai
(x)
dan 2 nilai 1-
Tabel 2.1 Probabilitas Nilai Regresi Logistik
Variabel tak
Y=1
bebas
Y=0
Variabel
X=1

e 0 1
(1)

1 e 0 1
1 (1)
1 e
1
0 1
bebas
X=0
(0)
1 e
1 ( 0)
0
1
1 e
Odds ratio dilambangkan dengan
dan dinyatakan sebagai :
(1) /1 (1)
(0) /1 (0)
nilai
(2.23)
menyatakan bahwa variabel bebas dengan kategori 1 berpengaruh
kategori 0 terhadap variabel tak bebas.
kali dari
Uji Independensi
Untuk mengetahui hubungan antara variabel A dan B digunakan uji independensi.
Adapun hipotesis yang digunakan adalah :
H0 : Tidak ada hubungan antara variabel A dan B
H1 : Ada hubungan antara variabel A dan B
Dalam bentuk peluang, hipotesis H0 dan H1 dapat ditulis sebagai berikut :
ab a b
H0 :
ab a b
H1 :
ab a b
Jika A dan B saling bebas, maka :
ab
Taksiran parameter untuk
, adalah :
ab a b
ab
X a X b
n n
(2.24)
E ( X ab ) mab n ab
Nilai harapan sel frekuensinya :
Taksiran nilai harapan jika H0 benar adalah :
m ab n ab n a b
X a X b
n
(2.25)
Statistik uji yang digunakan adalah :

( X ab m ab ) 2

a 1b 1
m ab
2
A B
(2.26)
2
Jika H0 benar, maka statistik uji
bebas
mendekati distribusi Chi Square dengan derajat

2
hitung
= (a1)(b1). Kriteria penolakan H0 adalah jika
(2v , )

Regresi Logistik Biner

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Regresi Logistik Biner

Diunggah oleh

Hak Cipta:

Format Tersedia

Regresi Logistik Biner

, maka model logistik dikotomus

dapat ditulis sebagai berikut.

Estimasi Parameter Model Regresi Logistik

melalui iterasi Newton Raphson.

Secara sistematis lebih mudah untuk memaksimumkan ln likelihood yang didefinisikan

Maksimum likelihood berikut diperoleh dengan

dan menyamakan dengan nol,

dimana elemen-elemen matrikss Hessian

Pengujian Parameter Model Regresi Logistik

secara keseluruhan dapat dilakukan dengan uji serentak.

Statistik Uji : Statistik Uji G2 atau Likelihood Ratio Test, yaitu

= banyaknya observasi yang berkategori 1

= banyaknya observasi yang berkategori 0

Daerah penolakan H0 adalah jika G >

Uji Kesesuaian Model Regresi Logistik

jumlah variabel respon pada grup ke- k

rata-rata taksiran probabilitas

banyaknya observasi yang memiliki nilai

banyaknya observasi pada grup ke- k

Keputusan : Tolak H0 jika

, dengan derajat bebas sebesar g-2.

Sumber : Hosmer and Lemeshow (1989)

Odds ratio didefinisikan sebagai berikut .

Nilai odds ratio digunakan untuk menunjukkan kecenderungan hubungan suatu

Jika asumsi bahwa logit bersifat linier, maka persamaannya adalah

menunjukkan koefisien slope, 1, memberikan perubahan nilai pada ln odds untuk

penambahan 1 unit x. Dengan kata lain,

untuk setiap nilai x (Hosmer and

Regresi Logistik Biner

respon. Misalkan variabel prediktor tersebut memiliki kategori gagal

. Dalam hal ini setiap pengamatan Y mengikuti distribusi Bernaulli dengan

adalah peluang untuk

. Adapun fungsi peluang untuk

setiap pengamatan adalah sebagai berikut ( Hosmer dan Lemeshow, 2000):

Pada analisis regresi logistik mengasumsikan bahwa hubungan antara

Untuk mempermudah menaksir parameter regresi, fungi logistic ditransformasi logit

sehingga menjadi persamaan sebagai berikut :

(x)1 exp( 0 1x)

(x) (x) exp( 0 1x)

;k = 1, 2, ..,p dimana p adalah jumlah prediktor dalam model.

H0 ditolak bila G >

dimana p adalah jumlah prediktor dalam model.

dimana : L0 = Likelihood tanpa variabel independen

Daerah penolakan H0 adalah jika

dengan derajat bebas v.

Analisis Regresi Logistik Biner

Jika y = 0, maka f(0) = 1 p

sehingga akan mempermudah mengestimasi parameter-parameternya. Model transformasi

g(x) disebut dengan bentuk logit.

Metode Maximum Likelihood

= (0, 1, 2, , k). Nilai

Lameshow,1989). Parameter dari model diestimasi dari vektor

diperoleh dengan memaksimumkan fungsi L() melalui pendeferensialan dengan

parameter-parameter yang akan dihitung.

Fungsi log likelihood diatas diperoleh berdasarkan pada persamaan likelihood :

atau Likelihood Ratio Test :

dengan derajat bebas v =

Statistik uji Wz mengikuti distribusi Chi-Square 2 sehingga pengujiannya dilakukan

(banyaknya variabel prediktor).

Analisis Regresi Logistik Biner

Jika y = 0, maka f(0) = 1 p

g(x) disebut dengan bentuk logit.

Metode Maximum Likelihood