345 - MAKALAH Regresi Logistik PDF
345 - MAKALAH Regresi Logistik PDF
Ainun Farida
LPMP Sulawesi Selatan
ainun_farida@yahoo.com
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 1
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
I. Kajian Teori
Regresi logistik ordinal merupakan salah satu metode statistika untuk
menganalisis variabel respon (dependen) yang mempunyai skala data ordinal dan
terdiri tiga kategori atau lebih. Variabel prediktor (independen) yang dapat disertakan
dalam model berupa data kategori atau kontinu yang berjumlah dua variabel atau
lebih.
Model yang dapat dipakai untuk regresi logistik ordinal adalah model logit.
Model logit tersebut adalah cumulative logit models. Pada model logit ini sifat ordinal
dari respon Y dituangkan dalam peluang kumulatif sehingga cumulative logit models
merupakan model yang didapatkan dengan membandingkan peluang kumulatif yaitu
peluang kurang dari atau sama dengan kategori respon ke-j pada p variabel prediktor
yang dinyatakan dalam vektor x , P(Y j| x ), dengan peluang lebih besar dari kategori
~ ~
p
exp j k x k
P(Y j | x ) k 1 (1)
~ p
1 exp j k x k
k 1
dimana j = 1, 2, ..., J adalah kategori respon (Agresti, 1990).
1
Dari persamaan (1) didapatkan lim F ( x) 0 , lim F ( x) , dan
x x 0 2
lim F ( x) 1 sehingga dapat digambarkan dengan kurva sebagai berikut :
x
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 2
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
F(x)
1/2
0 x
p
j k xk (3)
k 1
respon ke-j pada p variabel prediktor yang dinyatakan dalam vektor x dan P(Y j| x ))
~ ~
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 3
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
menyatakan peluang kumulatif pada p variabel prediktor yang dinyatakan dalam
vektor x maka nilai j ( x ) didapatkan dengan persamaan berikut :
~ ~
dimana j = 1, 2, ..., J
Estimasi Parameter
Untuk mengestimasi parameter dapat digunakan metode maksimum
likelihood. Metode ini memperoleh estimasi maksimum likelihood bagi dengan
langkah awal yaitu membentuk fungsi likelihood.
Estimasi dari parameter regresi logistik ordinal didapatkan dengan
menurunkan fungsi log likelihood terhadap parameter yang akan diestimasi dan
L( )
disamakan dengan nol. Persamaan 0 dipergunakan untuk estimasi
k
L( )
parameter k dimana k = 1, 2, ...p dan 0 dipergunakan untuk estimasi
j
L( ) L( )
Hasil dari persamaan 0 dan 0 merupakan fungsi nonlinear
k j
(t 1) (t ) H (t ) q (t )
1
(5)
dimana :
2 L( )
H (t ) (6)
k k
L( )
q (t ) (7)
dan t = iterasi ke-t
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 4
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
Uji Serentak
Dalam pengujian serentak, uji signifikansi model dapat dipergunakan
likelihood-ratio test.
Hipotesis :
H0 : 1 2 ... p 0
Uji Individu
Untuk pengujian individu signifikansi parameter model dapat diuji dengan
Wald test. Hasil dari Wald test ini akan menunjukkan apakah suatu variabel prediktor
signifikan atau layak untuk masuk dalam model atau tidak.
Hipotesis :
H0 : k = 0
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 5
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
A (amat baik), B (baik), dan C (cukup). Ditinjau dari skala data, peringkat/status
akreditasi merupakan data dengan skala ordinal. Oleh karena itu, penentuan
peringkat/status ini adalah klasifikasi data yang bersifat ordinal. Salah satu metode
statistika yang dapat dipakai untuk klasifikasi data yang bersifat ordinal adalah
regresi logistik ordinal. Sebagai variabel respon adalah peringkat atau status
akreditasi yaitu:
1=C
2=B
3=A
sedangkan sebagai variabel prediktor atau independen adalah aspek-aspek yang
terdapat dalam profil sekolah yaitu:
1. Status sekolah (0=swasta, 1=negeri)
2. Lama berdiri sekolah
3. Jumlah siswa
4. Jumlah guru
5. Jumlah alumni yang diterima di dunia usaha dan industri setahun terakhir
6. Nilai rata-rata jumlah ujian nasional sekolah setahun terakhir
III. Interpretasi
Dengan menggunakan Minitab 14 didapatkan output regresi logistic ordinal
sebagai berikut:
Response Information
Odds 95% CI
Predictor Coef SE Coef Z P Ratio Lower Upper
Const(1) 4.58314 1.92156 2.39 0.017
Const(2) 8.33462 2.08410 4.00 0.000
STATUS -1.85012 1.38024 -1.34 0.180 0.16 0.01 2.35
LAMA BERDIRI -0.0360895 0.0193924 -1.86 0.063 0.96 0.93 1.00
JUMLAH SISWA -0.0013871 0.0011274 -1.23 0.219 1.00 1.00 1.00
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 6
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
JUMLAH GURU -0.0384253 0.0190664 -2.02 0.044 0.96 0.93 1.00
DITERIMA DU/DI 0.0021090 0.0057966 0.36 0.716 1.00 0.99 1.01
STATUS TANAH -0.511582 0.686322 -0.75 0.456 0.60 0.16 2.30
UNAS -0.228404 0.0883552 -2.59 0.010 0.80 0.67 0.95
Log-Likelihood = -81.743
Test that all slopes are zero: G = 36.695, DF = 7, P-Value = 0.000
Goodness-of-Fit Tests
Method Chi-Square DF P
Pearson 174.063 209 0.963
Deviance 163.487 209 0.991
Measures of Association:
(Between the Response Variable and Predicted Probabilities)
Model regresi logistik ordinal yang terbentuk pada fungsi klasifikasi akreditasi SMK
di Jawa Timur adalah:
Logit P(Y1| X) = 4,58314 1,85012 Status sekolah 0,0360895 Lama berdiri
sekolah 0,0013871 Jumlah siswa 0,0384253 Jumlah guru +
0,0021090 Jumlah alumni yang diterima didunia usaha dan
industri 0,511582 Status tanah dan bangunan - 0,228404 Nilai
rata-rata jumlah nilai ujian nasional sekolah setahun terakhir.
Logit P(Y2| X) = 8,33462 1,85012 Status sekolah 0,0360895 Lama berdiri
sekolah 0,0013871 Jumlah siswa 0,0384253 Jumlah guru +
0,0021090 Jumlah alumni yang diterima didunia usaha dan
industri 0,511582 Status tanah dan bangunan - 0,228404 Nilai
rata-rata jumlah nilai ujian nasional sekolah setahun terakhir.
Nilai koefisien variabel prediktor kedua fungsi klasifikasi di atas mempunyai
nilai yang sama tetapi untuk konstanta mempunyai nilai yang berbeda. Nilai
konstanta tersebut merupakan cut point yang akan menjadi pembeda dari kedua
fungsi klasifikasi dan dipergunakan untuk klasifikasi.
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 7
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
Dari pengujian secara serentak dapat diketahu bahwa p-value = 0,000
sehingga model adalah signifikan pada = 0,1. Sedangkan pengujian secara individu
dapat diketahui bahwa konstanta 1 dan 2 adalah signifikan dalam model dengan =
0,1. Sedangkan variabel yang signifikan adalah lama berdiri sekolah, jumlah guru,
serta nilai rata-rata jumlah nilai ujian nasional sekolah setahun terakhir.
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 8
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015
IV. Daftar Pustaka
Agresti, A., (1990), Categorical Data Analysis, John Wiley & Sons, Inc., New York.
Antonov, A., (2004), Performance of Modern Techniques for Rating Model Design,
Master Thesis, Zrich.
Hosmer, D. W., dan Lemeshow, S., (2000), Applied Logistic Regression, John Wiley
& Sons, Inc., New York.
Tim Sekretariat Negara RI (2005), Peraturan Pemerintah Tentang Standar Nasional
Pendidikan, Sekretariat Negara RI, Jakarta.
Wibowo, W., (2002), Perbandingan Hasil Klasifikasi Analisis Diskriminan dan
Regresi Logistik Pada Pengklasifikasian Data Respon Biner, KAPPA Vol.
3, No.1, hal 36-45.
http://www.lpmpsulsel.net/v2/index.php?option=com_content&view=article&id=345:regresi-logistik- 9
ordinal&catid=42:ebuletin&Itemid=215
Artikel E-Buletin edisi Maret 2015