Anda di halaman 1dari 36

Regresi Logistik Biner

Regresi logistik merupakan salah satu metode regresi yang menggambarkan hubungan
antara suatu variabel respon (dependent) dan satu atau lebih variabel prediktor (independent)
, dimana variabel respon bersifat biner atau dikotomus. Variabel dikotomus adalah variabel
yang hanya mempunyai dua kemungkinan nilai, misalnya aktif dan tidak aktif, yang
dinotasikan dengan Y=1 (aktif) dan Y=0 (tidak aktif), maka variabel Y tersebut mengikuti
distribusi Bernoulli.
Bentuk dari model Regresi Logistik dengan variabel independen p adalah sebagai
berikut.
( x)

exp( 0 1 x1 2 x2 ... p x p )
1 exp( 0 1 x1 2 x2 ... p x p )

(2.5)

(x)
Dengan menggunakan transformasi logit dari

, maka model logistik dikotomus

dapat ditulis sebagai berikut.


g ( x) 0 1 x1 2 x2 ... p x p

Selanjutnya g(x) disebut dengan Model Logit dan merupakan fungsi linear dalam
parameter-parameternya (Hosmer dan Lemeshow, 1989).

Estimasi Parameter Model Regresi Logistik


Metode Maximum Likelihood Estimation (MLE) digunakan

untuk mengestimasi

parameter regresi logistik. Metode ini akan menghasilkan dugaan maksimum likelihood bagi

melalui iterasi Newton Raphson.


Fungsi distribusi probabilitas untuk setiap pasangan (xi, yi), adalah
f x i x i

yi

1 x i 1 y

, i = 1,2...,n
Fungsi likelihood berikut akan diperoleh jika pengamatan diasumsikan independen.
l

f x
i

i 1

x 1 x
i

yi

1 y i

i 1

Secara sistematis lebih mudah untuk memaksimumkan ln likelihood yang didefinisikan


sebagai berikut (Agresti, 1990).

yi xij j

j 0

i 1

ln 1 exp

i 1

exp

i ij

i 1

y x x

ij

1 exp

i 1

terhadap

i 1

Maksimum likelihood berikut diperoleh dengan

mendifferensialkan

y i x ij

j x ij

j x ij


j 0

j 0


j xij

j 0
L ln l
p

ij

dan menyamakan dengan nol,

xi

i 1

Teori MLE (Maximum Likelihood Estimator) menyatakan bahwa turunan kedua fungsi
ln likelihood akan menghasilkan estimasi varians dan kovarians (Agresti, 1990).
Turunan kedua yaitu

exp

2 L
x ij x ik
j k

i 1
n

j 0

ij x ik

n
2 L
x ij2 x i 1 x i
2
j
i 1

x i 1 x i

i 1

j x ij 1 exp

j 0

1 exp

j x ij

j x ij

j 0


Metode iterasi Newton Raphson digunakan untuk mendapatkan nilai taksiran

dari

penyelesaian turunan pertama fungsi ln likelihood, dimana persamaannya bersifat non linier
(Agresti, 1990) dengan rumus sebagai berikut

t 1 t H t

qt

(2.6)

dengan
L L L

q T
,
,...
K
0 1
h11 h12

h21 h22
H

h j1 h j2

h1k

h2k

h jk

h jk

2 L
j k

dimana elemen-elemen matrikss Hessian

Pengujian Parameter Model Regresi Logistik


Model yang telah diperoleh perlu diuji kesesuaiannya, dengan melakukan uji
statistik akan diketahui apakah variabel variabel prediktor yang terdapat dalam model
memiliki hubungan yang nyata dengan variabel responnya. Pengujian yang dilakukan adalah
sebagai berikut .
1.

Uji Parsial
Signifikansi parameter terhadap variabel respon dapat diketahui dengan uji parsial.
Pengujian signifikansi parameter ini menggunakan uji Wald (Hosmer dan Lemeshow,1989).
Hipotesis:
H 0 : j = 0

j=1, 2, 3, ..., p

H 1 : j 0
Statistik uji : Statistik Uji Wald

j
Wj
SE ( j )

~ N (0,1)

(2.7)
Pada tingkat kepercayaan , H0 ditolak jika nilai
derajat bebas v.
2.

Uji Serentak

W Z / 2

W 2 2 (v , )

atau

dengan

Untuk mengetahui apakah model telah tepat (signifikan) dan untuk memeriksa

kemaknaan koefisien

secara keseluruhan dapat dilakukan dengan uji serentak.

Hipotesis:
H0 : 1 = 2 = = p = 0

i 0
H1 : paling sedikit ada satu

, dengan i = 1, 2, ..., p

Statistik Uji : Statistik Uji G2 atau Likelihood Ratio Test, yaitu

i 1

y ln x 1 y ln 1 x n ln n n

G 2

ln n0 n ln n

(2.8)

dengan :

n1

= banyaknya observasi yang berkategori 1

n0

= banyaknya observasi yang berkategori 0


2 ( ,v )

Daerah penolakan H0 adalah jika G >

dengan db=v.

Uji Kesesuaian Model Regresi Logistik


Statistik uji yang dapat digunakan untuk menguji kesesuaian model regresi logistik
adalah Goodness of Fit.

(o k n k k ) 2

n (1 k )
k 1 k k
g

(2.9)
dengan
ok

n 'k

j 1

jumlah variabel respon pada grup ke- k


k

n 'k

j 1

m j j
n' k

rata-rata taksiran probabilitas


j

mj

banyaknya observasi yang memiliki nilai


n'k

banyaknya observasi pada grup ke- k


Statistik uji diatas untuk menguji hipotesis sebagai berikut.

H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
2

Keputusan : Tolak H0 jika

2
hitung

, dengan derajat bebas sebesar g-2.

(db,)

Interpretasi Model
Setelah didapatkan kesesuaian model pada koefisienkoefisien parameter yang
signifikan, selanjutnya adalah memberikan interpretasi nilai koefisien dalam model tersebut.
Pada variabel prediktor dikotomus, interpretasi koefisien parameter dapat
menggunakan nilai odds ratio (). Variabel penjelas x yang bersifat kategori terbagi dalam 2
kategori yang dinyatakan dengan kode 0 dan 1. Disini kategori 1 dibandingkan terhadap
kategori 2 berdasarkan nilai -nya yang menyatakan variabel 1 berpengaruh kali variabel 2
terhadap variabel respon. Sehingga berdasarkan model ada dua nilai (x) dan dua nilai
(x). Nilainilai itu dapat dinyatakan seperti Tabel 2.2.
Tabel 2.2 Nilai Model Regresi Logistik bila Variabel X Dikotomus
Variabel
Respon

Variabel Bebas
X=1

Y 1
Y 0

exp 0 1
(1)
1 exp 0 1

1 (1)

1
1 exp 0 1

X=0
(0 )

exp( 0 )
1 exp( 0 )

1 ( 0)

1
1 exp( 0 )

Sumber : Hosmer and Lemeshow (1989)

Odds ratio didefinisikan sebagai berikut .


=

e 1
1 1 1
g 1 g 0
0 1 0

(2.10)

ln ln

(2.11)

1-

Nilai odds ratio digunakan untuk menunjukkan kecenderungan hubungan suatu


variabel X terhadap variabel Y. Bila nilai = 1, maka antara kedua variabel tersebut tidak
terdapat hubungan. Bila nilai < 1, maka antara kedua variabel terdapat hubungan negatif
terhadap perubahan nilai X dan demikian sebaliknya bila > 1.
Pada variabel prediktor kontinu, Hosmer and Lemeshow (1989) menjelaskan jika
model regresi logistik mengandung variabel prediktor kontinu, maka interpretasi dari
koefisien model tergantung pada bagaimana variabel tersebut dimasukkan kedalam model.
g x 0 1 x

Jika asumsi bahwa logit bersifat linier, maka persamaannya adalah

Ini

menunjukkan koefisien slope, 1, memberikan perubahan nilai pada ln odds untuk


1 g x 1 g x

penambahan 1 unit x. Dengan kata lain,

untuk setiap nilai x (Hosmer and

Lemeshow, 1989).

Regresi Logistik
Regresi logistik adalah salah satu metode statistik untuk menganalisis hubungan
variabel respon (dependen) yang memiliki skala nominal atau ordinal dengan variabel
prediktor (independen). Regresi logistik yang memiliki variabel respon dengan dua kategori
disebut regresi logistik biner (dhikotomus). Sedangkan regresi logistik yang memiliki variabel
respon dengan tiga atau lebih kategori dimanakan regresi logistik polikotomus. Regresi
polikotomus terdiri dari dua yaitu regresi logistik multinomial dan regresi logistik ordinal.
Regresi logistik multinomial, masing- masing kategori pada variabel respon tidak ada
tingkatan melainkan hanya membedakan sedangkan yang memiliki tingkatan dinamakan
regresi logistik ordinal.

Regresi Logistik Biner


Regresi lgisrtik biner merupakan metode statistik yang dapat digunakan untuk
mengetahui pola hubungan antara variabel respon yang memiliki dua kategori dan variabel
( y 0)

respon. Misalkan variabel prediktor tersebut memiliki kategori gagal

dan sukses
(x)

( y 1)

. Dalam hal ini setiap pengamatan Y mengikuti distribusi Bernaulli dengan

adalah

1 ( x)

y 1

peluang untuk

y0

dan

adalah peluang untuk

. Adapun fungsi peluang untuk

setiap pengamatan adalah sebagai berikut ( Hosmer dan Lemeshow, 2000):


F ( yi ) ( x i ) yi [1 ( xi )]1 yi ; yi 0,1

(1)
( xi ) P ( yi 1)

dimana

Pada analisis regresi logistik mengasumsikan bahwa hubungan antara

( xi )

xi

dan

dapat dijelaskan melalui fungsi logistik sebagai berikut ( Hosmer dan Lemeshow, 2000):
( x)

e 0 1x
1 e

( x)

0 1x

exp( o 1x)
1 exp( o 1x)

atau

(2)

Untuk mempermudah menaksir parameter regresi, fungi logistic ditransformasi logit

terhadap

(x)

sehingga menjadi persamaan sebagai berikut :

exp( 0 1x)
1 exp( 0 1x)

(x)1 exp( 0 1x)

exp( 0 1x)

(x) (x) exp( 0 1x)

exp( 0 1x )

( x ) exp( 0 1x ) ( x ) exp( 0 1x )
=
( x ) 1 (x) exp( 0 1x)
=
(x)
1 (x)

=
(x)

1 (x)

exp( 0 1x)

ln

(x)

(x)

=ln

ln

g(x) =

{exp( 0 1x)}

0 1 x

0 1x

(3)

dimana

(x)

(x)

ln

g (x)

Uji Serentak
Dalam pengujian serentak, uji signifikansi model dapat dipergunakan likelihoodratio test. Likelihood-ratio test adalah metode pengujian signifikansi model dengan
membandingkan likelihood untuk model lengkap (L 1) dan likelihood untuk model yang
semua parameternya sama dengan nol (L0).
Hipotesis :
1 2 ... p 0

H0 :
H1 : minimal ada satu

k 0

;k = 1, 2, ..,p dimana p adalah jumlah prediktor dalam model.

X 2 ( p , )

H0 ditolak bila G >

dimana p adalah jumlah prediktor dalam model.

Adapun statistik uji untuk likelihood-ratio test adalah sebagai berikut (Hosmer dan
Lemeshow, 2000)
L0
L1

G 2 ln

=
=

2 ln( L0 ) ln( L1 )
2 ln( L0 ) {2 ln( L1 )}

2 ln( L0 ) (2( L1 ))

(4)

dimana : L0 = Likelihood tanpa variabel independen


L1 = Likelihood dengan variabel independen

Uji Parsial
Pengujian ini dilakukan untuk mengetahui signifikansi parameter secara individu
terhadap variabel respon. Pengujian signifikansi parameter menggunakan uji Wald (Hosmer
dan Lemeshow, 2000) dengan hipotesis:
i 0

H0 :
i 0

H1 :

, dengan i = 1, 2, ...p

SE( )

Statistik uji :

(3.5)
W 2 X 2 (v , )

W Z / 2

Daerah penolakan H0 adalah jika

atau

dengan derajat bebas v.

Odd Rasio
Odd rasio pada regresi logistik biner dapat dicari dengan menggunakan acuan tabel
nilai peluang sebagai berikut (Hosmer dan Lemeshow, 2000):
Tabel 2.1: Tabel Nilai Peluang Regresi Logistik Jika Variabel dependen dan Independen
Memiliki Dua Kategori
Variabel

Variabel Prediktor
x=1

respon
1

y=1

exp 0 1
1 exp 0 1

1 - 1

y=0

x=0
0

1
1 exp 0 1

exp 0
1 exp 0

1 - 0

1
1 exp 0

Nilai odd rasio yang dinotasikan OR didefinisikan sebagai rasio untuk x=1 dan x=0
(Hosmer dan Lemeshow, 2000). Adapun peramaannya adalah sebagai berikut:
1 / 1 1
0 / 1 0

OR

(6)

Dengan mensubtitusikan nilai peluang pada tabel didapatkan hasil sebagai berikut :

exp( 0 1 )

exp( 0 1 )

1 exp( 0 1 )

OR

exp( 0 )

exp( 0 )

1 exp( 0 )

exp( 0 1 )
exp( 0 )

exp( 0 1 ) 0

=
= exp(

1 )

(7)

Dari persamaan di atas dapat disimpulkan bahwa odd rasio merupakan nilai eksponensial
dari

Analisis Regresi Logistik Biner


Analisis regresi logistik biner adalah suatu analisis regresi logistik antara variabel
prediktor dengan variabel respon yang terdiri dari dua buah kategori (Hosmer,1989). Disebut
sebagai variabel biner apabila variabel respon (Y) menghasilkan 2 kategori, yaitu 0 dan 1.
Sehingga variabel Y akan mengikuti distribusi Bernoulli dengan fungsi probabilitas sebagai
berikut :
f(y) = py (1 p)1-y dimana y = 0, 1

..................................(2.3)

Jika y = 0, maka f(0) = 1 p


Jika y = 1, maka f(1) = p
Tujuan dari analisis regresi logistik biner adalah untuk mencari pola hubungan secara
probabilitas antara variabel x dengan p (probabilitas kejadian yang diakibatkan oleh x).
Berapapun nilai x bila disubstitusikan ke fungsi logistik hasilnya akan berkisar 0 dan 1.
Fungsi logistik dapat dilihat sebagai berikut :

f(x) =

1
1 e x

........................................... (2.4)

lim f ( x ) 0

Jika x = -, maka
lim f ( x) 1

Jika x = +, maka
Untuk mempermudah notasi maka digunakan nilai (x) = E(Y|X) untuk menyatakan
rata-rata bersyarat dari Y jika diberikan nilai x. Bentuk model regresi logistik adalah :

( x)

exp ( o 1 x)
1 exp ( o 1 x)
........................................... (2.5)

Dengan suatu transformasi dari persamaan (2.5) dikenal sebagai transformasi logit
digunakan untuk memperoleh fungsi g (x) yang linear dalam parameter-parameternya,

sehingga akan mempermudah mengestimasi parameter-parameternya. Model transformasi


tersebut adalah sebagai berikut :

( x)

1 ( x)

g(x) = ln

o 1 x
g(x)

........................................... (2.6)

g(x) disebut dengan bentuk logit.

Metode Maximum Likelihood


Metode Maximum Likelihood (metode kemungkinan maksimum) digunakan untuk
menduga parameter-parameter dari model persamaan regresi logistik (Hosmer dan

= (0, 1, 2, , k). Nilai

Lameshow,1989). Parameter dari model diestimasi dari vektor

vektor

diperoleh dengan memaksimumkan fungsi L() melalui pendeferensialan dengan

parameter-parameter yang akan dihitung.


Fungsi L() adalah fungsi log likelihood, yaitu :
k

L() =

j i y i x ij j i ni log 1 exp


x ij

.(2.7)

Fungsi log likelihood diatas diperoleh berdasarkan pada persamaan likelihood :


n

( xi ) 1 ( xi )

ni y i

i 1

dengan (xi) =

i 1

( xi )

1 ( xi )

exp

log

(2.8)

x ij

1 exp

ni

exp

(1 ( x )
n

yi

x ij

...................................... (2.9)

Dimana i = 1, 2, , n
Fungsi di atas merupakan gabungan dari (Y1, Y2, , Yn) yang saling independen, dengan
nilai dari Y observasi terdiri dari sukses (1) dan gagal (0), dengan distribusi binomial dan
memiliki E (Yi) = ni(x) ; dimana n1 + n2 + + ni = N.
Persamaan log likelihood pada persamaan (2.7) dideferensialkan terhadap masing-masing
elemen . Sehingga diperoleh persamaan likelihood sebagai berikut :
n

y i x ij ni ( x i ) x ij
= 0 dengan j = 0, 1, 2, , k

............................ (2.10)

Sedangkan metode untuk mengestimasi varian dan kovarians dari estimasi koefisien
parameter dikembangkan teori maximum likelihood estimation. Teori ini mengatakan bahwa
estimasi varian diperoleh dari turunan kedua fungsi likelihood, turunan kedua adalah sebagai
berikut :
2L
x ij x iu n i i (1 i )
j u
i

........................................... (2.11)
Pengujian Estimasi Parameter
Menurut Hosmer dan Lameshow (1989), model yang telah diperoleh tersebut perlu
diuji kesignifikasinya, dengan melakukan pengujian statistik akan menentukan apakah
variabel-variabel prediktor yang terdapat dalam model tersebut memiliki hubungan yang
nyata dengan variabel responnya. Pengujian yang dilakukan adalah sebagai berikut :
1. Uji Serentak
Uji serentak dilakukan untuk memeriksa atau peran keberartian koefisien secara
keseluruhan atau serentak (Hosmer,1989). Pengujian yang dilakukan adalah sebagai berikut :

1 2 k 0
Hipotesa : H0 :

k 0
H1 : Minimal ada satu
Statistik Uji :
G2

atau Likelihood Ratio Test :

n1
n

n

n1

n0

n0
n

yi

(1 y i )

i 1

= -2 ln

........................................... (2.12)

i 1

n 0 (1 y i ); n1 y i

Dimana :

dan N = n0 + n1

2
Nilai G2 yang diperoleh dibandingkan dengan distribusi

dengan derajat bebas v =

k + 1 sesuai dengan p-value yang diinginkan untuk dapat menolak H0 atau H1.
2. Uji Parsial
Menurut Hosmer dan Lemeshow (1989) menyatakan bahwa uji parsial ini dilakukan
untuk menguji keberartian koefisien secara parsial, yaitu dengan membandingkan
parameter dari hasil maksimum likelihood, dugaan , dengan penduga standar errornya dan
hipotesa yang dilakukan sebagai berikut :
Hipotesa

j 0
H0 :

j 0
H1 :

W1
Statistik Uji : Uji Wald :

SE j

Statistik uji Wald mengikuti distribusi Normal, sehingga pengujiannya dilakukan melalui
pembanding nilai statistik W1 dengan nilai Ztabel
Selain uji Wald tersebut di atas, dapat pula dilakukan Uji Wald yang lain, yaitu :
2

Wz

SE j

........................................... (2.13)

Statistik uji Wz mengikuti distribusi Chi-Square 2 sehingga pengujiannya dilakukan

2 ;v
melalui pembanding nilai statistik Wz dengan nilai tabel

dan

derajat bebas v

(banyaknya variabel prediktor).


Uji Kesesuaian Model Regresi Logistik
Menurut Agresti (1990) terdapat beberapa statistik uji yang dapat digunakan untuk
menguji kesesuaian model regresi logistik antara lain :
1. 2 Log Likelihood

O
i

Oij

ij

Log

E
ij

G =2
2. Goodness of Fit

(Oij E ij ) 2

E ij

Dari kedua statistik uji diatas untuk menguji hipotesis sebagai berikut :
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
3. Improvement
Uji ini digunakan untuk menilai apakah satu atau lebih variabel prediktor yang belum
masuk ke dalam model memiliki peran yang penting dalam model (Agresti, 1990). Pengujian
yang dilakukan adalah sebagai berikut :
Hipotesa :
H0 : Model tanpa variabel prediktor tertentu adalah model terbaik
H1: Model dengan variabel prediktor tertentu adalah model terbaik
Statistik Uji :
G2 = -2 (L0 L1)
Dimana :
L0 = Log Likelihood untuk model dengan variabel prediktor tertentu
L1 = Log Likelihood untuk model tanpa variabel prediktor tertentu

Nilai G2 yang diperoleh dibandingkan dengan distribusi 2 dengan derajat bebas selisih
antara L0 dan L1. Jika H0 ditolak maka model dengan variabel prediktor tertentu secara
signifikan lebih baik dibanding model tanpa prediktor tertentu.

Analisis Regresi Logistik Biner


Analisis regresi logistik biner adalah suatu analisis regresi logistik antara variabel
prediktor dengan variabel respon yang terdiri dari dua buah kategori (Hosmer,1989). Disebut
sebagai variabel biner apabila variabel respon (Y) menghasilkan 2 kategori, yaitu 0 dan 1.
Sehingga variabel Y akan mengikuti distribusi Bernoulli dengan fungsi probabilitas sebagai
berikut :
f(y) = py (1 p)1-y dimana y = 0, 1

..................................(2.3)

Jika y = 0, maka f(0) = 1 p


Jika y = 1, maka f(1) = p
Tujuan dari analisis regresi logistik biner adalah untuk mencari pola hubungan secara
probabilitas antara variabel x dengan p (probabilitas kejadian yang diakibatkan oleh x).
Berapapun nilai x bila disubstitusikan ke fungsi logistik hasilnya akan berkisar 0 dan 1.
Fungsi logistik dapat dilihat sebagai berikut :

f(x) =

1
1 e x

........................................... (2.4)

lim f ( x ) 0

Jika x = -, maka
lim f ( x) 1

Jika x = +, maka
Untuk mempermudah notasi maka digunakan nilai (x) = E(Y|X) untuk menyatakan
rata-rata bersyarat dari Y jika diberikan nilai x. Bentuk model regresi logistik adalah :

( x)

exp ( o 1 x)
1 exp ( o 1 x)
........................................... (2.5)

Dengan suatu transformasi dari persamaan (2.5) dikenal sebagai transformasi logit
digunakan untuk memperoleh fungsi g (x) yang linear dalam parameter-parameternya,
sehingga akan mempermudah mengestimasi parameter-parameternya. Model transformasi
tersebut adalah sebagai berikut :

( x)

1 ( x)

g(x) = ln

o 1 x
g(x)

........................................... (2.6)

g(x) disebut dengan bentuk logit.

Metode Maximum Likelihood


Metode Maximum Likelihood (metode kemungkinan maksimum) digunakan untuk
menduga parameter-parameter dari model persamaan regresi logistik (Hosmer dan

= (0, 1, 2, , k). Nilai

Lameshow,1989). Parameter dari model diestimasi dari vektor

vektor

diperoleh dengan memaksimumkan fungsi L() melalui pendeferensialan dengan

parameter-parameter yang akan dihitung.


Fungsi L() adalah fungsi log likelihood, yaitu :
n

y
x

j i i ij j i ni log 1 exp

L() =


x ij

.(2.7)

Fungsi log likelihood diatas diperoleh berdasarkan pada persamaan likelihood :


n

( x ) 1 ( x )
i

yi

ni y i

(1 ( x )

i 1

Dimana i = 1, 2, , n

i 1

ni

( xi )

1 ( x i )

exp

log

(2.8)

x ij

1 exp
dengan (xi) =

exp

x ij

...................................... (2.9)

Fungsi di atas merupakan gabungan dari (Y1, Y2, , Yn) yang saling independen, dengan
nilai dari Y observasi terdiri dari sukses (1) dan gagal (0), dengan distribusi binomial dan
memiliki E (Yi) = ni(x) ; dimana n1 + n2 + + ni = N.
Persamaan log likelihood pada persamaan (2.7) dideferensialkan terhadap masing-masing
elemen . Sehingga diperoleh persamaan likelihood sebagai berikut :
n

y i x ij ni ( x i ) x ij
= 0 dengan j = 0, 1, 2, , k

............................ (2.10)

Sedangkan metode untuk mengestimasi varian dan kovarians dari estimasi koefisien
parameter dikembangkan teori maximum likelihood estimation. Teori ini mengatakan bahwa
estimasi varian diperoleh dari turunan kedua fungsi likelihood, turunan kedua adalah sebagai
berikut :
2L
x ij x iu n i i (1 i )
j u
i

........................................... (2.11)

Pengujian Estimasi Parameter


Menurut Hosmer dan Lameshow (1989), model yang telah diperoleh tersebut perlu
diuji kesignifikasinya, dengan melakukan pengujian statistik akan menentukan apakah
variabel-variabel prediktor yang terdapat dalam model tersebut memiliki hubungan yang
nyata dengan variabel responnya. Pengujian yang dilakukan adalah sebagai berikut :
1. Uji Serentak
Uji serentak dilakukan untuk memeriksa atau peran keberartian koefisien secara
keseluruhan atau serentak (Hosmer,1989). Pengujian yang dilakukan adalah sebagai berikut :

1 2 k 0
Hipotesa : H0 :

k 0
H1 : Minimal ada satu
Statistik Uji :
G2

atau Likelihood Ratio Test :

n1
n

n

n1

n0

n0
n

yi

(1 y i )

i 1

= -2 ln

........................................... (2.12)
n

i 1

n 0 (1 y i ); n1 y i

Dimana :

dan N = n0 + n1

2
Nilai G2 yang diperoleh dibandingkan dengan distribusi

dengan derajat bebas v =

k + 1 sesuai dengan p-value yang diinginkan untuk dapat menolak H0 atau H1.
2. Uji Parsial
Menurut Hosmer dan Lemeshow (1989) menyatakan bahwa uji parsial ini dilakukan
untuk menguji keberartian koefisien secara parsial, yaitu dengan membandingkan
parameter dari hasil maksimum likelihood, dugaan , dengan penduga standar errornya dan
hipotesa yang dilakukan sebagai berikut :
Hipotesa

j 0
H0 :

j 0
H1 :

W1
Statistik Uji : Uji Wald :

SE j

Statistik uji Wald mengikuti distribusi Normal, sehingga pengujiannya dilakukan melalui
pembanding nilai statistik W1 dengan nilai Ztabel
Selain uji Wald tersebut di atas, dapat pula dilakukan Uji Wald yang lain, yaitu :
2

Wz

SE j

........................................... (2.13)

Statistik uji Wz mengikuti distribusi Chi-Square 2 sehingga pengujiannya dilakukan

2 ;v
melalui pembanding nilai statistik Wz dengan nilai tabel

dan

derajat bebas v

(banyaknya variabel prediktor).

Uji Kesesuaian Model Regresi Logistik


Menurut Agresti (1990) terdapat beberapa statistik uji yang dapat digunakan untuk
menguji kesesuaian model regresi logistik antara lain :
1. 2 Log Likelihood
Oij

Oij Log
i

E
ij

G =2
2. Goodness of Fit

(Oij E ij ) 2

E ij

Dari kedua statistik uji diatas untuk menguji hipotesis sebagai berikut :
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan kemungkinan hasil
prediksi model)
3. Improvement
Uji ini digunakan untuk menilai apakah satu atau lebih variabel prediktor yang belum
masuk ke dalam model memiliki peran yang penting dalam model (Agresti, 1990). Pengujian
yang dilakukan adalah sebagai berikut :
Hipotesa :
H0 : Model tanpa variabel prediktor tertentu adalah model terbaik
H1: Model dengan variabel prediktor tertentu adalah model terbaik
Statistik Uji :
G2 = -2 (L0 L1)
Dimana :
L0 = Log Likelihood untuk model dengan variabel prediktor tertentu
L1 = Log Likelihood untuk model tanpa variabel prediktor tertentu

Nilai G2 yang diperoleh dibandingkan dengan distribusi 2 dengan derajat bebas selisih
antara L0 dan L1. Jika H0 ditolak maka model dengan variabel prediktor tertentu secara
signifikan lebih baik dibanding model tanpa prediktor tertentu.
Regresi Logistik
Regresi logistik digunakan jika variabel respon bersifat kategorik (nominal atau ordinal)
dengan variabel-variabel prediktor kontinu maupun kategorik (Agresti, 1990). Variabel
respon Y yang bersifat random dan dikotomus, yakni bernilai 1 dengan probabilitas

dan

bernilai 0 dengan probabilitas 1- , disebut sebagai point-binomial (Le, 1998).


Untuk pengamatan ke-i dari sampel (i = 1,2,...,n), Yi adalah variabel bernoulli dengan
distribusi probabilitas (Le, 1998):
P Yi y i x i i 1 x i
y

1 y i

; yi = 0,1 dan n = jumlah sampel


Fungsi basis logistik adalah (Le, 1998)
f z

1
1 e z

(1)

z 0 1 x

Dimana,
Untuk

Lim f ( z ) 0

maka

, sedangkan untuk

Dengan melihat kemungkinan nilai

f z

Lim f ( z ) 1
z

maka

yang berkisar antara 0 dan 1, menunjukkan bahwa

regresi logistik sebenarnya menggambarkan probabilitas terjadinya suatu event.(Sumber: Le,


1998)
Secara umum, model regresi logistik yang dinyatakan sebagai fungsi x adalah (Hosmer
and Lemeshow, 1989)
( x )

exp( 0 1x )
1 exp( 0 1x )

(2)
Untuk mempermudah penaksiran parameter regresi, maka digunakan transformasi logit
( x )

terhadap

sehingga menjadi bentuk logit pada persamaan (3)

( x )

1 (x )

g (x ) ln

0 1x

(3)

Regresi logistik berganda


Model regresi logistik dengan k variabel prediktor adalah (Le, 1998)
(x)

exp( 0 1x1 ... k x k )


1 exp( 0 1x1 ... k x k )

(4)
Jika model pada persamaan (4) ditransformasi dengan menggunakan transformasi logit,
maka akan menghasilkan bentuk logit
0 1x1 ... k x k

g(x) =

(5)

yang merupakan fungsi linier dalam parameter-parameternya.


Estimasi parameter
Metode estimasi yang mengarah pada fungsi least squares dalam model regresi linier
(jika residual berdistribusi normal) disebut maximum likelihood (Hosmer and Lemeshow,
t 0

1 ... k

1989). Jika parameter pada model regresi logistik dinotasikan sebagai

maka pada dasarnya metode maximum likelihood mengestimasi nilai

dengan

memaksimumkan fungsi Likelihood (Hosmer and Lemeshow, 1989).


Fungsi distribusi probabilitas untuk setiap pasangan (x i, yi), adalah (Hosmer and
Lemeshow, 1989)
f x i x i i 1 x i
y

1 y i

(6)
Dimana,

(x i )

x
j 0

ij

1 exp

exp

x
j 0

ij

Secara matematis, lebih mudah untuk memaksimumkan ln

atau disebut juga ln

L( )

likelihood yang dinotasikan sebagai

(Agresti, 1990).

L ln l


j 0

y x
i

i 1

ln 1 exp

ij
j
i 1

x
j 0

ij

L( )

Maksimum ln likelihood dapat diperoleh dengan cara men-differensialkan

terhadap

dan menyamakannya dengan nol (Agresti, 1990).

y i x ij x ij
j
i 1
i 1
n

exp

j 0

i 1

i 1

x ij

1 exp

j 0

x ij

0 y i x ij x i x ij

; j = 0,1,, k

(7)

Dimana,

x i

exp

j 0

ij

1 exp

x
j 0

ij

x i

menyatakan estimasi dari

dengan menggunakan metode

maximum likelihood.

Dari hasil penurunan pertama pada persamaan (7), nilai

diestimasi dengan metode

numerik karena persamaannya ber-sifat nonlinier. Sedangkan metode untuk mengestimasi

varians dan kovarians dari taksiran

dikembangkan menurut teori MLE (Maximum

Likelihood Estimator) yang menyatakan bahwa estimasi varians dan kovarians diperoleh dari
turunan kedua fungsi ln Likelihood (Agresti, 1990), yaitu :

n
2 L
x ij2 x i 1 x i
2
j
i 1

x ij x ij x i i 1 x i
i 1

; j = 0, 1,,k

(8)

Pengujian signifikansi parameter


Pengujian parameter model dilakukan untuk memeriksa apakah variabel predictor
mempunyai peranan (pengaruh) yang nyata di dalam model. Uji parameter yang digunakan
dalam penelitian ini adalah :
a. Statistik uji G
b. Statistik uji Wald (W)
Statistik uji-G adalah uji rasio kemungkinan (likelihood ratio test) yang digunakan
untuk menguji peranan variabel prediktor di dalam model secara bersama-sama (Hosmer and
Lemeshow, 2000). Rumus umum untuk uji-G berdasarkan hipotesis :
1 2 ... k 0

H0 :
j 0

H1 : Minimal ada satu

untuk j=1,2,...,k

Statistik Uji (Hosmer and Lemeshow, 1989):

G Likelihood Ratio Test 2 Ln

i 1

i 1

n0

x 1 x
i 1

n0

yi

n1 y i n0 1 y i

Dengan,

n1

n1

1 y i

(9)

n n0 n1
;

Dibawah H0, statistik uji G akan mengikuti distribusi chi-square dengan derajat bebas k
(Hosmer and Lemeshow, 1989). Sehingga untuk memperoleh keputusan, nilai statistik uji G

2 ,k
dibandingkan dengan nilai

G 2 ,k

. Kriteria penolakan H0 adalah jika

j
Statistik uji Wald digunakan untuk menguji parameter

secara parsial (Hosmer and

Lemeshow, 2000). Rumus umum untuk uji-Wald berdasarkan hipotesis :

j
H0 :

= 0 ; j = 1,2,...,k

j
H1 :

Statistik Uji (Le, 1998):


Wald (W)

j
SE( j )

(10)
W Z / 2

Kriteria penolakan H0 adalah jika |

Uji Kesesuaian Model


Dari estimasi model regresi logistik yang diperoleh, ingin diketahui seberapa besar
keefektifan model dalam menjelaskan variabel respon. Hal ini disebut sebagai goodness-of-fit
(kesesuaian model). Goodness-of-fit dihitung berdasarkan nilai

yang tergantung pada

susunan variabel-variabel prediktor dalam model, bukan pada jumlah variabel prediktor
(Hosmer and Lemeshow, 1989). Berikut ini adalah prosedur pengujian kesesuaian model.
H0 : Model sesuai
H1 : Model tidak sesuai
Statistik Uji (Hosmer and Lemeshow, 1989):
g
o nk ' k
C Hosmer Lemeshow k
k 1 n k ' k 1 k
2

(11)
ck

ok y j

nk '
Dengan g

= Jumlah grup,

j 1

= Banyaknya subjek pada grup ke-k,


ck

k
j 1

jumlah nilai variabel respon pada grup ke-k ,

m j x j
nk '

rata-rata

ck
probabilitas dimana mj adalah banyaknya subjek pada

kategori variabel respon.

taksiran

Jika H0 benar, maka distribusi statistik uji

mengikuti distribusi chi-square dengan


C (2g 2 , )

derajat bebas g-2 (Hosmer and Lemeshow, 1989). Daerah penolakan H0 adalah

Interpretasi koefisien model regresi logistik


Estimasi koefisien dari variabel prediktor menyatakan slope atau nilai perubahan
variabel respon untuk setiap perubahan satu unit variabel prediktor. Interpretasi meliputi:
menentukan hubungan fungsional antara variabel respon dan variabel prediktor serta
mendefinisikan unit perubahan variabel respon yang disebabkan oleh variabel prediktor
(Hosmer and Lemeshow, 1989).
Untuk regresi logistik dimana variabel prediktor bersifat dikotomus, nilai x

dikategorikan 0 atau 1. Pada model ini, ada dua nilai


Tabel 1 Nilai-Nilai

dan

1 x

1 x

Variabel Prediktor
x=1

respon

y=0

dan dua nilai

Untuk Variabel Prediktor Dikotomus

Variabel

y=1

exp 0 1
1 exp 0 1

1 - 1

1
1 exp 0 1

x=0
0

exp 0
1 exp 0

1 - 0

1
1 exp 0

Sumber: Hosmer and Lemeshow, 1989

Odds rasio, dinotasikan , didefinisikan sebagai rasio odds untuk x = 1 terhadap odds
untuk x = 0, yang dapat dituliskan dalam persamaan (12) berikut (Hosmer and Lemeshow,
1989).
1 /1 1
0 /1 0

Berdasarkan Tabel 1, nilai odds rasio adalah

exp 0 1
1

1 exp 0 1 1 exp 0

exp 0

1 exp 0 1 exp 0 1

(12)

exp( 0 1 )
exp 0 exp 1

Regresi Logistik
Model Regresi Logistik merupakan analisis statistik yang digunakan untuk
menggambarkan hubungan antara variabel tak bebas yang bersifat kategori dengan variabel
bebas yang bersifat kategori, kontinu atau keduanya. Untuk variabel bebas bertipe kualitatif
digunakan variabel dummy sedangkan untuk variabel bebas bertipe kuantitatif didefinisikan
secara langsung. Hubungan antara variabel tak bebas (Y) dengan variabel bebas (X), menurut
E(Y) x

Agresti (1996) adalah mean

V(Y) x - x

dan varian

. Sedangkan

regresi logistik dengan k variabel bebas (X) dan variabel tak bebas (Y) menurut Hosmer
P(Y 1 | x) ( x

(1989) adalah

, maka bentuk persamaan regresi logistik berganda adalah

( x)

g ( x)

1 e

g ( x)

(2.1)

atau

( x)

( 0 1 x1 2 x 2 ... k x k )

1 e

( 0 1 x1 2 x 2 ... k x k )
(2.2)

(x)
Dengan menggunakan transformasi logit dari

, maka model regresi logistik dapat

ditulis sebagai berikut :


g ( x) ln

( x)
1 ( x)
(2.3)

g ( x) ln

( 0 1x1 2 x2 ... k xk )

( 0 1x1 2 x2 ... k xk )

1 e

e ( 0 1x1 2 x2 ... k xk )
1

( 0 1x1 2 x2 ... k xk )
1 e

( 0 1x1 2 x2 ... k xk )

( 0 1x1 2 x2 ... k xk )

(2.4)

( 0 1x1 2 x2 ... k xk )

g ( x ) ln 1 e
1

1 e ( 0 1x1 2 x2 ... k xk )

g ( x ) ln( e

(2.5)

(2.6)
g ( x) 0 1 x1 2 x 2 ... k x k
(2.7)
sehingga
k

g ( x) 0 b xb
b 1

(2.8)
yang merupakan fungsi linier dalam parameter parameternya.
Dalam suatu model regresi linier diasumsikan bahwa suatu amatan dari variabel tidak
y E (Y ( x)) e

bebas dapat diekspresikan sebagai

, dimana

yang mengekspresikan penyimpangan amatan dari rataan dan

merupakan komponen acak

diasumsikan mengikuti

sebaran normal rataan nol dan varian konstan.


y ( x) e

Pada pola distribusi bersyarat errornya diekspresikan sebagai

mempunyai

salah satu dari dua kemungkinan nilai error yaitu :


Jika

, maka

dengan peluang
1 ( x)

e (x)

y0

Jika

(x)

e 1 ( x)

y 1

, maka

dengan peluang

( x)[1 ( x)]
Maka nilai errornya mempunyai rataan nol dan varian
distribusi Binomial (Hosmer, 1989)

, yang mengikuti

Estimasi Parameter
Suatu model yang memiliki respon biner, dimana antar amatan diasumsikan bebas dan

nilai harapan variabel tak bebasnya tidak linier terhadap parameter , maka penduga dapat
diperoleh dengan metode maximum likelihood. Metode maximum likelihood merupakan
(n 10( s 1))

penduga yang konsisten dan efisien untuk ukuran sampel besar

, dimana s

adalah jumlah parameter. Maximum Likelihood Estimation adalah suatu fungsi dari parameter
yang memaksimumkan peluangnya untuk menduga parameter.

Pada dasarnya metode maximum likelihood memberikan nilai dugaan

dengan

memaksimumkan suatu fungsi likelihood. Fungsi likelihood yang dimaksimumkan adalah :

( xa ) ( xa )

ya

1 ya
[1 ( x a )]
(2.9)

karena setiap pengamatan bebas maka fungsi likelihood merupakan fungsi kepadatan
gabungan dimana adalah vektor, yaitu :
n

l () ( x a )
a 1

l () ( x a )
a 1

l () ( x a )
a 1

ya

1 ya
[1 ( x a )]

ya [1 ( x a )]
y
[1 ( x a )] a

( xa )
l ()

a 1 1 ( a )
n

ya

1 ( x a )

n
( x ) ya
n

a

l () 1 ( x a ) exp ln

a 1
a 1
1 ( a )

n
n
( xa )

l () 1 ( x a ) exp y a ln
a 1

a 1
1

(
x
)
a

(2.10)

dengan melakukan transformasi logit terhadap model regresi logistik pada Persamaan
(2.10) maka didapatkan :

k
exp b x ab

1 exp b x ab

l ()
a 1

exp b x ab
n

b 0
1
exp y a ln
k
a 1
1 exp b x ab
b 0

b0

exp b x ab
b 0
1

k

1 exp b x ab
b 0

l ()
k
a 1 1 exp x
b ab
b 0

b0
k

k
n

exp y a ln exp b x ab
b 0


a 1

n
k

l ()
exp
y
b x ab

a
k
a 1
a 1 b 0

1 exp b x ab
b 0

k n

l ()
exp y a x ab b
k
a 1

b 0 a 1

1 exp b x ab
b 0

(2.11)

Untuk mendapatkan nilai taksiran

menggunakan Maximum Likelihood Estimatian

adalah dengan memaksimalkan fungsi likelihood. Secara matematis akan lebih mudah untuk
log l ()

memaksimalkan nilai

yang dapat disebut log likelihood, yang didefinisikan sebagai

berikut :

L() ln
a 1 1 exp k x

b ab
b 0

exp y a x ab b

b 0 a 1

n
k
k n

L() y a x ab b ln 1 x ab b
b

0
b

1
a

1
b

(2.12)


Untuk mendapatkan nilai

, maka dilakukan penurunan pada Persamaan (2.12)

terhadap

. Hasil turunan parsial pertama dari Persamaan (2.12) adalah :

L()
1
y b x ab x ab
k
b 0
a 1
b
1 exp

b x ab

exp b x ab
b0

exp b x ab
n
L() k
b 0

y a x ab x ab
k
b 0
a 1
b

1 exp b x ab
b 0

(2.13)

Metode yang digunakan untuk melakukan estimasi varian dan kovarian adalah
pengembangan dari teori Maximum Likelihood Estimation. Teori ini menyatakan bahwa
estimasi varian dan kovarian diperoleh dari turunan kedua fungsi likelihood.

Turunan kedua fungsi likelihood terhadap

x ab
a 1

L()

b u

exp u x au
u 0

k
1 exp u x au
u 0

u
k

adalah sebagai berikut :





x au exp u x au 1 exp u x au x au exp u x au exp u x au


n
L
u 0
u 0
u 0
u 0

x ab
2

a 1
b u
k
1 exp x

u au
u 0

k
k
x au exp u x au
x au exp u x ab
2

n
L()
u 0
u 0

x ab
k
k
a 1
b u
1 exp x
1 exp u x au
u au


u 0

u 0

n
2 L()
2
x ab x au a a
a 1
b u

n
2 L()
x ab x au a 1 a
a 1
b u

(2.14)
untuk b = u adalah estimasi varian yang dapat ditulis menjadi:
n
2 L()
2

x ab a 1 a

2
a 1
b

(2.15)
dimana :
b, u = 0,1,2,...,k (parameter)

Untuk mendapatkan Maximum Likelihood Estimatian bagi

digunakan metode Newton

Rhapson melalui iterasi sebagai berikut :

t 1 t H t

q t
(2.16)

dimana t = 0,1,2,...sampai konvergen


dengan
q g / 1 , g / 2 ,..., g / k
(2.17)

2 g / 2j

2 g / j u

2
g / j u 2 g / u2

(2.18)

Adapun langkah langkah estimasi dengan pendekatan estimasi Newton Rhapson


adalah, adalah sebagai berikut :
0
a.
b.

Mensubstitusikan estimasi
Mensubstitusikan

( 0)

kedalam Persamaan (2.2) untuk mendapatkan

Untuk t > 0 digunakan nilai

kedalam Persamaan (2.15).


1 0 H 0

c.

(0)

q 1
sehingga mendapatkan

Pengujian Estimasi Parameter

dan

H 1

q 0
, nilai

digunakan untuk mencari

2
untuk memperoleh

sampai konvergen.

Pengujian statistik dilakukan untuk menentukan apakah variabel variabel bebas yang
terdapat dalam model tersebut memiliki hubungan yang nyata dengan variabel tak bebasnya.
Pengujian ini dilakukan sebagai berikut :
1. Uji Serentak
Dilakukan untuk memeriksa kemaknaan koefisien secara serentak dan hipotesa
pengujiannya adalah
Ho : 0 = 1 = ...........= k = 0
H1 : paling sedikit ada satu k 0
Statistik uji yang digunakan adalah statistik uji G atau Likelihood Ratio Test, yaitu

n1

G 2 ln

( a )
a
1

ya

n1

n0

n0

1 a 1 ya

(2.19)

atau

G=2

n [ y ln( ) (1 y ) ln( 1 )] [n ln( n ) n ln( n ) n ln( n)]

a
a
a
a
1
1
0
0
a 1

n1 y a
a 1

Dimana: n1 = banyaknya observasi yang berkategori 1 atau


n0 1 y a
n

a 1

n0 = banyaknya observasi yang berkategori 0 atau


n = n 0 + n1
Nilai G yang diperoleh dibandingkan dengan distribusi Chi Square dengan derajat
bebas

dan

untuk menolak H0.

(2 ,v )
Tolak H0 jika G >

atau jika nilai p value < .

2. Uji Parsial
Untuk memeriksa kemaknaan koefisien secara parsial dengan membandingkan
dugaan dengan penduga standar errornya.
Hipotesis :

a 0
Ho :

a 0
H1 :
Dengan Statistik uji Wald :
W2

2
a
SE ( ) 2
a

(2.20)
Statistik uji

W2

2
mengikuti distribusi

W 2 2 ( ,v )
atau p-value <

, sehingga H0 ditolak jika nilai

, dengan derajat bebas

(banyaknya parameter).

Uji Kesesuaian Model


Digunakan untuk mengetahui apakah model dengan satu atau lebih variabel bebas
merupakan model yang sesuai atau tidak.
Hipotesis:
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan
kemungkinan hasil prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan
kemungkinan hasil prediksi)
Statistik Uji :
Hosmer-Lemeshow test (

)
(ol nl' l ) 2
'
C l 1 nl l (1 l )
=
g

(2.21)

nl'

dimana :

= jumlah pola covariate yang bisa dibentuk dalam grup ke l


nl'
o yj
l j 1
(2.22)

Apabila g adalah banyaknya grup yang bisa dibentuk oleh model yang sedang di uji

dan

value <

H0
adalah tingkat kepercayaan, maka

2
2 ( g 2; )
ditolak bila nilai
>
atau p-

maka model tersebut tidak sesuai.

Interpretasi Model
Menurut Hosmer (1989) interpretasi dari koefisien model adalah sebagai berikut :
1.

Untuk menjelaskan hubungan fungsional antara


variabel variabel bebas dengan variabel tak bebas.

2.

Untuk menentukan unit perubahan setiap variabel


bebas.
( )

Odds Ratio

yaitu nilai yang menunjukkan besarnya pengaruh antara kategori satu

dengan kategori dua (kategori dua terhadap respon dengan kategori pembanding) dalam satu
variabel tersebut. Jika variabel tak bebas dikategorikan dalam 2 kategori dan dinyatakan
dengan 0 dan 1 dan variabel bebas juga dibagi dalam 2 kategori dan dinyatakan dengan kode

(x)
0 dan 1. Sehingga akan didapatkan model dengan 2 nilai

(x)
dan 2 nilai 1-

Tabel 2.1 Probabilitas Nilai Regresi Logistik

Variabel tak

Y=1

bebas
Y=0

Variabel
X=1

e 0 1
(1)

1 e 0 1
1 (1)

1 e

1
0 1

bebas
X=0

(0)

1 e

1 ( 0)

0
1

1 e

Odds ratio dilambangkan dengan

dan dinyatakan sebagai :

(1) /1 (1)
(0) /1 (0)

nilai

(2.23)

menyatakan bahwa variabel bebas dengan kategori 1 berpengaruh

kategori 0 terhadap variabel tak bebas.

kali dari

Uji Independensi
Untuk mengetahui hubungan antara variabel A dan B digunakan uji independensi.
Adapun hipotesis yang digunakan adalah :
H0 : Tidak ada hubungan antara variabel A dan B
H1 : Ada hubungan antara variabel A dan B
Dalam bentuk peluang, hipotesis H0 dan H1 dapat ditulis sebagai berikut :

ab a b
H0 :

ab a b
H1 :

ab a b
Jika A dan B saling bebas, maka :

ab
Taksiran parameter untuk

, adalah :

ab a b

ab

X a X b
n n

(2.24)

E ( X ab ) mab n ab
Nilai harapan sel frekuensinya :
Taksiran nilai harapan jika H0 benar adalah :

m ab n ab n a b

X a X b
n

(2.25)

Statistik uji yang digunakan adalah :


( X ab m ab ) 2

a 1b 1
m ab
2

A B

(2.26)

2
Jika H0 benar, maka statistik uji

bebas

mendekati distribusi Chi Square dengan derajat


2
hitung

= (a1)(b1). Kriteria penolakan H0 adalah jika

(2v , )

Anda mungkin juga menyukai