Laporan Regresi Logistik Ordinal

LAPORAN TUGAS
ANALISIS DATA KUALITATIF

MODEL REGRESI LOGISTIK ORDINAL
Oleh:
1. Aqidatur Riska Puspitasari
(1311100008)
2. Marina Marsudi Putri
(1311100028)
3. Mentari Sonya Ningtyas
(1311100036)
4. Jainap Niken Melasasi
(1311100049)
Dosen Pengampu:
Dr. Vita Ratna Sari S.Si, M.Si
Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember
Surabaya
2014
1
REGRESI LOGISTIK ORDINAL

1. Definisi Regresi Logistik Ordinal
Regresi logistik adalah prosedur pemodelan yang diterapkan untuk memodelkan
variabel terikat (Y) yang bersifat kategori berdasarkan satu atau lebih variabel prediktor
(X), baik itu yang bersifat kategori maupun kontinyu. Dalam dunia nyata, ada kalanya
permasalahan yang dihadapi bukan hanya variabel respon yang bersifat nominal, tetapi juga
ordinal. Pada permasalahan seperti ini bisa saja diterapkan metode regresi logistik
multinomial, tetapi bagaimanapun juga metode ini tidak memperhitungkan sifat ordinalitas
variabel respon. Oleh karena itu, regresi logistik ordinal sangatlah berperan disini.
Regresi logistik ordinal adalah salah satu metode satu metode statistika untuk
menganalisis variabel terikat yang mempunya skala ordinal yang terdiri atas tiga variabel
atau lebih. Variabel bebas yang dapat disertakan dalam model dapat berupa data kategori
atau kontinyu yang terdiri dari dua variabel atau lebih. Menurut Holmer dan Lemenshow
(2000), regresi logistik ordinal adalah suatu metode analisis yang digunakan untuk
mengetahui hubungan antara variabel respon dengan variabel prediktor, dimana variabel
responnya memiliki lebih dari dua kategori dan dalam setiap kategori memiliki tingkatan.
(Holmer dan Lemenshow, 2000)
Model yang dapat digunakan untuk regresi logistik ordinal adalah model logit. Model
logit tersebut dalam regresi logistik ordinal disebut dengan cumulative logit models. Pada
model logit ini sifat ordinal dari respon Y ditunjukkan dalam probabilitas kumulatif
sehingga
cumulative
logit
models
merupakan
model
yang
didapatkan
denga
membandingkan probabilitas kumulatif.

Perbandingan probabilitas kumulatif yaitu probabilitas yang kurang dari atau sama
dengan kategori respon ke-j
respon ke-j
dengan probabilitas yang lebih besar dari kategori
. Model logit dari regresi logistik ordinal tersebut adalah sebagai
berikut:
[

Keterangan:
j = banyaknya kategori pada variabel respon, j = 0,1,2,3,.... j-1
k = banyaknya variabel prediktor.
Fungsi logit yang dapat dibentuk jika terdapat J kategori respon adalah sebanyak J-1
fungsi logit. Setelah diketahui fungsi logit maka selajutnya dapat dicari persamaan dari
probabilitas kumulatif kategori respon ke-j dengan penjabaran sebagai berikut:
*
Sehingga didapatkan fungsi probabilitas kumulatif kategori respon ke-j sebagai berikut.
Jika
menyatakan probabilitas kategori respon ke-j pada p
variabel prediktor yang dinyatakan dalam vektor
dan
menyatakan
probabilitas kumulatif pada variabel prediktor yang dinyatakan dalam vektor xi maka fungsi
probabilitas kumulatif tersebut dapat dinyatakan sebagai berikut:
2. Estimasi Parameter
Pada penelitian ini metode yang digunakan untuk menaksir nilai
adalah metode
Maksimum Likelihood Estimation (MLE). Metode ini digunakan untuk menaksir parameter
yang tidak diketahui. Prinsip metode ini adalah menaksir nilai
dengan memaksimumkan
fungsi likelihood. Bentuk umum dari fungsi likelihood untuk sampel dengan n observasi
independen, (
dimana i=1,2,..n adalah sebagai berikut

Selanjutnya didapatkan fungsi log likelihood sebagai berikut.
Parameter-parameter diperoleh dengan menurunkan persamaan
terhadap
parameter yang ingin diketahui dan selanjutnya turunan pertama tersebut disamadengankan
nol. Selanjutnya berdasarkan teori maximum likelihood, taksiran varian kovarian
didapatkan dari turunan kedua fungsi log-likeklihoodnya. Nilai parameter diestimasi dengan
menggunakan metode numerik karena persamaannya bersifat nonlinier. Metoder numerik
tersbut adalah metode iterasi Newton- Raphson (Agresti, 1990).
3. Pengujian Parameter
Menurut Hosmer dan Lameshow (2000), model yang telah diperoleh perlu diuji
kesignifikannya dengan melakukan pengujian statistik. Pengujian dilakukan terhadap
koefisien
dari model yang telah diperoleh. Dalam model regresi logistik terdapat dua
jenis pengujian yaitu pengujian secara parsial dan pengujian serentak.

3.1 Uji Serentak
Uji serentak dilakukan untuk memeriksa keberartian koefisien
secara keseluruhan
atau serentak. Jika parameter yang diuji signifikan maka dapat dikatakan jika model yang
dibentuk sesuai untuk memodelkan variabel respon. Hipotesis yang digunakan adalah
sebagai berikut.
H0 :
p=
H1 : paling sedikit terdapat satu
dengan k =1,2,...p
Statistik uji yang digunakan adalah statistik uji G atau likelihood ratio test.
[
Keterangan:
n0 = banyaknya observasi yang berkategori 0
4
n1 = banyaknya observasi yang berkategori 1

Daerah penolakan H0 adalah jika
dengan derajat bebas sebesar db
dimana db = (I-1)(J-1). Dalam hal ini G menyebar mengikuti distribusi Chi-square dengan
derajat bebas p.
3.2 Uji Parsial
Uji parsial digunakan untuk mengetahui signifikansi parameter terhadap variabel
respon. Statistik uji yang digunakan adalah uji Wald. Berdasarkan hasil dari uji Wald maka
akan diketahui apakah suatu variabel prediktor layak atau tidak masuk dalam model.
Hipotesis yang digunakan adalah sebagai berikut.
H0 :
H1 :
dengan k = 1,2,...p
P = jumlah prediktor dalam model

Statistik uji Wald adalah sebagai berikut
Keterangan : SE (
adalah taksiran standar error parameter
Daerah penolakan H0 adalah jika
atau
dengan derajat bebas
sebesar v.
4. Uji Kesesuaian Model

Uji kesesuaian model dilakukan untuk mengetahui apakah suatu model yang terbentuk
sudah sesuai untuk digunakan atau tidak. Statistik uji yang digunakan adalah uji pearson
chi-square dengan hipotesis sebagai berikut.
H0
: Model sesuai (tidak ada perbedaan yang nyata antara hasil observasi
dengan
kemungkinan hasil prediksi model)

H1
: Model tidak sesuai (ada perbedaan yang nyata antara hasil observasi
dengan
kemungkinan hasil prediksi model)

Statistik uji Chi-square adalah sebagai berikut:
Daerah penolakan H0 jika p-value <
atau
dengan derajat bebas
sebesar jumlahan dari derajat bebas sebesar jumlahan dari derajat bebas pada estimasi
parameter setiap variabel yang masuk kedalam model.
Contoh Kasus Regresi Logistik Ordinal

Suatu penelitian dilakukan dengan tujuan untuk mengetahui faktor-faktor yang
mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi Statistika FMIPA
Universitas Mulawarman, yaitu jenis kelamin (X1), jenis sekolah menengah (X2), daerah
asal (X3), pekerjaan orang tua (X4), lama studi (X5) dan usia masuk perguruan tinggi (X5),
akan dianalisis menggunakan analisis regresi logistik ordinal. Berikut adalah hasil tabulasi
silang faktor-faktor yang mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi
Statistika FMIPA Universitas Mulawarman:
Tabel 1 Tabulasi Jenis Kelamin (X1) terhadap IPK (Y)
IPK
Jenis Kelamin
Perempuan Laki-Laki
Jumlah
Memuaskan
11
17
Sangat Memuaskan
39
37
76
Dengan Pujian
53
10
63
98
58
156
Jumlah
Tabel 2 Tabulasi Jenis Sekolah Menengah (X2) terhadap IPK (Y)
IPK
Jenis Sekolah Menengah
Jumlah
SMK/MAN
SMA
Memuaskan
Sangat Memuaskan
2
6
15
70
17
76
Dengan Pujian
61
63
Jumlah
10
146
156
Tabel 3 Tabulasi Daerah Asal (X3) terhadap IPK (Y)
IPK
Daerah Asal
Jumlah
Luar Samarinda
9
Samarinda
8
17
Sangat Memuaskan
32
44
76
Dengan Pujian
31
32
63
Jumlah
72
84
156
Memuaskan
Tabel 4 Tabulasi Pekerjaan Orang Tua (X4) terhadap IPK (Y)
Pekerjaan Orang Tua

Pekerjaan Lainnya
PNS
Wiraswasta
IPK
Swasta
Jumlah
Memuaskan
10
17
Sangat Memuaskan
21
11
35
76
Dengan Pujian
18
10
32
63
Jumlah
15
43
21
77
156
Tabel 5 Tabulasi Lama Study (X5) terhadap IPK (Y)
Lama Studi (Tahun)
IPK
Jumlah
5,33 < X5 < 7
3,66 < X5 < 5,33
Memuaskan
15
17
Sangat Memuaskan
70
76
Dengan Pujian
61
63
10
146
156
Jumlah
Tabel 6 Tabulasi Usia (X6) terhadap IPK (Y)
Usia (tahun)
IPK
Jumlah
19 < X6 < 22
16 < X6 < 19
Memuaskan
16
17
Sangat Memuaskan
73
76
Dengan Pujian
Jumlah
0
4
63
152
63
156
Penyelesaian:
1.
Estimasi Parameter
Setelah dilakukan estimasi parameter menggunakan metode MLE diperoleh hasil seperti
pada Tabel 7 berikut:
Tabel 7 Hasil Estimasi Parameter Model
Variabel
X1
X2
X3
X4
X5
X6
Konstanta (1)
Konstanta (2)
Berdasarkan Tabel 7 tentang hasil
-1,767
-1,144
-0,502
-0,984
1,777
-0,504
0,331
3,642
estimasi
P-value
0,000
0,106
0,161
0,128
0,000
0,634
0,002
0,008
parameter menggunakan metode MLE
dapat digunakan untuk membuat taksiran model regresi logistik yang telah ditransformasi
logit. Berikut adalah model logit regresi logistik ordinal:
2.
Uji Serentak
Pengujian secara serentak dilakukan dengan menggunakan likelihood ratio test.

Tabel 8 Hasil Likelihood Ratio Test
G
df
P-value
55,158
8
0,000
Berdasarkan Tabel 8 dapat disimpulkan bahwa nilai statistik uji G sebesar 55,158
yang lebih besar dari nilai tabel
= 12,592 dan nilai p-value = 0,000 yang lebih kecil
dari = 0,05 maka dapat diambil kesimpulan Tolak H0, yang berarti bahwa pada pengujian
secara serentak model regresi logistik ordinal antara variabel respon (Y) nilai IPK dengan
enam variabel bebas terdapat minimal satu variabel yang signifikan.
3.
Uji Parsial
Pengujian secara individu digunakan untuk mengetahui signifikansi masing-masing
variabel bebas (X) terhadap variabel respon (Y). Berikut adalah hasil pengujian individu
untuk masing-masing variabel prediktor:
Tabel 9 Uji Individu Variabel X dengan Variabel Y
Variabel
Uji Wald
P-value
Keputusan
Konstanta (1)
2,25
0,002
Tolak H0
Konstanta (2)
2,65
0,008
Tolak H0
X1
-4,49
0,000
Tolak H0
X2
-1,62
0,106
Gagal Tolak H0
X3
-1,40
0,161
Gagal Tolak H0
X4
1,52
0,128
Gagal Tolak H0
X5
4,70
0,000
Tolak H0
X6
-0,48
0,634
Gagal Tolak H0
Berdasarkan Tabel 9 dapat diketahui pada hasil pengujian signifikansi variabel
prediktor, variabel prediktor yang berpengaruh signifikan terhadap variabel respon adalah
dua konstanta yang dihasilkan pada model logit dan variabel X1, yaitu jenis kelamin dan
variabel X5, yaitu lama studi, sedangkan variabel jenis sekolah menengah (X2), daerah asal
(X3) dan pekerjaan orang tua (X4) tidak berpengaruh secara signifikan atau dapat dikatakan
bahwa variabel prediktor tersebut memiliki pengaruh yang kecil terhadap variabel respon.
4. Model Terbaik Regresi Logistik Ordinal

Berikut ini adalah hasil pengujian untuk mengetahui model terbaik dari regresi logistik
ordinal:
Tabel 10 Hasil Pengujian Model Terbaik
Variabel
P-value
Konstanta (1)
-2,360
0,004
Konstanta (2)
0,754
0,027
X1
-1,515
0,000
X5
1,521
0,000
Berdasarkan pengujian terhadap variabel prediktor yang berpengaruh signifikan
terhadap variavel respon untuk mendapatkan model terbaik, diperoleh bahwa pada semua
variabel prediktor dan kedua konstanta model logit memiliki nilai P-value yang kurang dari
= 0,05 sehingga Tolak H0, yang berarti bahwa model telah sesuai. Berikut adalah model
logit pada yang digunakan dalam model regresi logistik ordinal:
10
5. Interpretasi Model
Interpretasi model regresi logistik ordinal dapat dilakukan dengan menggunakan nilai
Odds Ratio. Berikut adalah nilai Odds Ratio untuk masing-masing variabel prediktor yang
signifikan:
Tabel 11 Nilai Odds Ratio
Variabel
Nilai Odds Ratio
X1
0,22
X5
4,58
Pada variabel X1, yaitu jenis kelamin didapatkan nilai Odds Ratio sebesar 0,22 yang
artinya adalah mahasiswa perempuan memiliki resiko 4,54 kali lebih besar untuk
mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa laki-laki. Pada
variabel X5, yaitu lama studi didapatkan nilai Odds Ratio sebesar 4,58 yang artinya adalah
mahasiswa yang memiliki lama studi antara 3,66 < X5 < 5,33 resiko 4,58 kali lebih besar
untuk mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa yang memiliki
lama studi antara 5,33 < X5 < 7.
11

Laporan Regresi Logistik Ordinal

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Laporan Regresi Logistik Ordinal

Diunggah oleh

Hak Cipta:

Format Tersedia

LAPORAN TUGAS

ANALISIS DATA KUALITATIF

2. Marina Marsudi Putri

3. Mentari Sonya Ningtyas

4. Jainap Niken Melasasi

REGRESI LOGISTIK ORDINAL

membandingkan probabilitas kumulatif.

dengan probabilitas yang lebih besar dari kategori

. Model logit dari regresi logistik ordinal tersebut adalah sebagai

menyatakan probabilitas kategori respon ke-j pada p

variabel prediktor yang dinyatakan dalam vektor

dimana i=1,2,..n adalah sebagai berikut

Parameter-parameter diperoleh dengan menurunkan persamaan

jenis pengujian yaitu pengujian secara parsial dan pengujian serentak.

H1 : paling sedikit terdapat satu

n1 = banyaknya observasi yang berkategori 1

dengan derajat bebas sebesar db

P = jumlah prediktor dalam model

adalah taksiran standar error parameter

Daerah penolakan H0 adalah jika

dengan derajat bebas

4. Uji Kesesuaian Model

kemungkinan hasil prediksi model)

kemungkinan hasil prediksi model)

Daerah penolakan H0 jika p-value <

dengan derajat bebas

Contoh Kasus Regresi Logistik Ordinal

Tabel 2 Tabulasi Jenis Sekolah Menengah (X2) terhadap IPK (Y)

Jenis Sekolah Menengah

Tabel 3 Tabulasi Daerah Asal (X3) terhadap IPK (Y)

Tabel 4 Tabulasi Pekerjaan Orang Tua (X4) terhadap IPK (Y)

Pekerjaan Orang Tua

Tabel 5 Tabulasi Lama Study (X5) terhadap IPK (Y)

Lama Studi (Tahun)

5,33 < X5 < 7

3,66 < X5 < 5,33

Tabel 6 Tabulasi Usia (X6) terhadap IPK (Y)

Tabel 7 Hasil Estimasi Parameter Model

Pengujian secara serentak dilakukan dengan menggunakan likelihood ratio test.

= 12,592 dan nilai p-value = 0,000 yang lebih kecil

Tabel 9 Uji Individu Variabel X dengan Variabel Y

4. Model Terbaik Regresi Logistik Ordinal

Anda mungkin juga menyukai