ISSN 2085-7829
Interpretasi Parameter dalam Model Regresi Logistik untuk Variabel Bebas Dikotomus
Parameter Interpretation in Logistic Regression Models for Dicotomus Independent Variable
Darnah A. Nohe
Program Studi Statistika FMIPA Universitas Mulawarman
Abstract
Logistic regression is a specialized form of regression that is formulated to predict and explain a binary
categorical variable rather than a metric dependent measure. Interpretation of coefficients in a logistic
regression model relies on the ability of researchers to put meaning to the difference between the two logit, and
these differences will directly connect to the definition and meaning of a unit change in independent variable.
This paper present parameters interpretation in logistic regression models for dicotomus independent variable
using odds ratio. Data will be presented in a 2x2 contingency table for ease of understanding. Logistic
regression were applied to data of Malaria case.
Keywords: Binary, Dicotomus Independent Variable, Logistic Regression.
Pendahuluan
Setiap model dugaan yang terbentuk
memerlukan
interpretasi
yang
dapat
menggambarkan inferensi praktis dari koefisien
taksiran didalam model yang direlevansikan dengan
tujuan yang ingin dicapai dalam suatu penelitian.
Koefisien
taksiran
untuk
variabel
bebas
menggambarkan slope atau tingkat perubahan dari
fungsi variabel tak bebas per satuan unit perubahan
di dalam variabel bebas. Jadi interpretasi ini akan
menyangkut dua hal, yaitu: penentuan hubungan
fungsional antara variabel tak bebas dan variabel
bebas, serta pendefinisian satuan unit perubahan
untuk variabel bebas.
Langkah pertama untuk menentukan
bagaimana bentuk fungsi dari variabel tak bebas
yang menghasilkan fungsi linier dari variabelvariabel bebas adalah dengan menggunakan fungsi
penghubung (link function). Dalam model regresi
logistik, fungsi penghubungnya adalah transformasi
logit yang berbentuk g(x) = ln{(x)/[1 - (x)]} =
0 + 1x. (McCullagh dan Nelder, 1983).
Sedangkan model regresi linier adalah fungsi
identitas karena variabel tak bebasnya linier dalam
parameter-parameternya.
Untuk model regresi linier, diketahui
bahwa koefisien slope, 1, adalah sama dengan
perbedaan antara nilai dari variabel tak bebas pada
x + 1 dengan nilai dari variabel bebas pada x, untuk
setiap nilai x. Untuk menggambarkan hal itu, kita
misalkan y(x) = 0 + 1x dimana 1 = y(x + 1) - y(x).
Dalam hal ini, interpretasi dari koefisien ini adalah
jelas yaitu menyatakan hasil perubahan dalam skala
pengukuran dari variabel tak bebas untuk suatu unit
perubahan dalam variabel bebas.
Dalam model regresi logistik maka
1 = g(x + 1) - g(x), yaitu koefisien slope yang
menggambarkan perubahan dalam logit untuk
Program Studi Statistika FMIPA Universitas Mulawarman
f z
1 , z
1 e z
dimana z 0 1x .
Untuk z
untuk
...(1)
ISSN 2085-7829
bahwa
hubungan
antara
x i dan
x i dapat
x i
1
, i = 1,2,...,n
1 exp 0 1x i
exp 0 1 x i
1 exp 0 1 x i exp 0 1 x i
1
exp 0 1x i
1 exp 0 1x i
...(2)
( x )
0
1
...
k
exp( 0 1x )
1 exp( 0 1x )
...(3)
exp j x ij
j 0
(x i )
k
1 exp j x ij
j 0
( x )
exp( 0 1x )
1 exp( 0 1x )
l f x i x i y 1 x i 1 y
n
g(x) = 0 1x
i 1
i 1
x yi
n
n
i
= 1 x i exp ln
1
i
n
n
x i ...(6)
=
1 x i exp yi ln
i
i 1
1 x i
1x)}
...(4)
adalah
Estimasi parameter
Diasumsikan sebuah sampel berukuran n dan
terdiri atas pengamatan independen berpasangan
(xi, yi), i = 1,2,...,n, dengan yi menyatakan nilai
variabel terikat dan xi adalah nilai variabel bebas
untuk subjek ke-i. Pada regresi linier, metode
penaksiran parameter yang lazim digunakan adalah
least squares, dengan konsep meminimumkan
jumlah kuadrat residual. Jika asumsi IIDN
terpenuhi, maka metode ini akan menghasilkan
estimator yang dapat dianggap valid. Namun, jika
diaplikasikan pada model dengan variabel terikat
dikotomus, maka estimator yang dihasilkan akan
bersifat bias (Hosmer and Lemeshow, 1989).
10
( x ) = exp( x)
0
1
1 ( x )
( x ) = ln {exp(
0
ln
1 ( x )
( x ) = x
0
1
ln
1 ( x )
x
j 0
ij
terakhir menjadi:
n k
n
x i
exp yi j x ij
exp yi ln
i 1 j 0
1 x i
i 1
k n
exp yi x ij j
j 0 i 1
Selain itu, untuk suku pertama berlaku
j x ij
exp
i 1
i 1
j 0
Secara matematis,
memaksimumkan ln l
L( ) (Agresti,
L lnl
k
n
yi x ij j ln 1 exp j x ij
j 0 i 1
i 1
j 0
k
exp j x ij
n
n
L
j 0
y i x ia x ia
k
a
i 1
i 1
1 exp j x ij
j 0
i 1
i 1
x i x ia ; a = 0, 1, , k
0 yi x ia
...(7)
dimana,
exp j x ij
j 0
x i
k
1 exp j x ij
j 0
menyatakan
estimasi
ISSN 2085-7829
x i dengan
dari
x ia2 x i 1 x i
a2
i 1
x ia x ib exp j x ij
L
j 0
k
a b
i 1
1 exp j x ij
j 0
x
i 1
x xi i 1 xi ;
ia ib
dimana a, b = 0, 1,,k
Sehingga
diperoleh
matriks
varianskovarians dari estimasi parameter melalui invers
matriks (Agresti, 1990),
1
ov xT Diag[ (x )(1 (x ))] x
(8)
C
i
i
Dengan
1 x n1 ... x nk
Diag[ (x i )(1 (x i ))]
merupakan n x n
(
0
)
(1)
1 e
1 e
y=0
1 (1)
1
1
1 ( 0)
0 1
1 e
1 e 0
Total
1
1
Odds dari variabel terikat yang muncul
diantara data pengamatan dengan x = 1
11
ISSN 2085-7829
... (13)
ln( ) ln
e 0 1 1
1 e 0 1 1 e 0
1 (a b)
ln e 1 = 1.
12
... (15)
e0
1
0
0 1
1 e 1 e
e 0 1
e 1
e0
... (16)
(a , b)
( x a ) / [1 ( x a )]
( x b) / [1 ( x b)]
... (17)
ISSN 2085-7829
Penaksir
koefisien
1.130
Galat
Baku
0.465
Kebiasaan
diluar
3.095
rumah
Konstanta
-1.680
0.729
Besaran merupakan penaksir kemungkinan
maksimum dari odds rasio, = e1.130 = 3.095. Jika
dihitung secara langsung akan diperoleh nilai yang
sama seperti ditunjukkan sebagai berikut:
26 / 14
3.095
15 / 25
Artinya, resiko terjadinya penyakit malaria pada
seseorang yang mempunyai kebiasaan diluar rumah
adalah 3.095 kali dibandingkan yang tidak
mempunyai kebiasaan diluar rumah.
Penaksir koefisien dapat dihitung secara langsung,
yaitu:
= ln[(26/14)/(15/25)] = 1.130.
Interval kepercayaan 95% untuk data di atas adalah:
exp(1.130 1.96 x 0.465) = (2.184;4.006).
Nilai batas bawah interval kepercayaan lebih besar
dari 1 sehingga memperkuat dugaan bahwa Berada
di Luar Rumah merupakan faktor resiko terhadap
terjadinya Penyakit Malaria.
Kesimpulan
Berdasarkan hasil dan pembahasan
tersebut, maka dapat disimpulkan bahwa
interpretasi parameter dalam model regresi logistik
untuk variabel bebas dikotomus dapat dilihat dari
koefisien regresi logistik dengan menentukan nilai
odds rasio. Hal ini dapat memberikan suatu
landasan bagi interpretasi dari semua hasil-hasil
yang diperoleh melalui analisis regresi logistik.
Daftar Pustaka
Agresti, A. (1990). Categorical Data Analysis. New
York: John Wiley and Sons.
13
14
ISSN 2085-7829