Anda di halaman 1dari 11

LAPORAN TUGAS

ANALISIS DATA KUALITATIF


MODEL REGRESI LOGISTIK ORDINAL

Oleh:
1. Aqidatur Riska Puspitasari

(1311100008)

2. Marina Marsudi Putri

(1311100028)

3. Mentari Sonya Ningtyas

(1311100036)

4. Jainap Niken Melasasi

(1311100049)

Dosen Pengampu:
Dr. Vita Ratna Sari S.Si, M.Si

Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember
Surabaya
2014
1

REGRESI LOGISTIK ORDINAL


1. Definisi Regresi Logistik Ordinal
Regresi logistik adalah prosedur pemodelan yang diterapkan untuk memodelkan
variabel terikat (Y) yang bersifat kategori berdasarkan satu atau lebih variabel prediktor
(X), baik itu yang bersifat kategori maupun kontinyu. Dalam dunia nyata, ada kalanya
permasalahan yang dihadapi bukan hanya variabel respon yang bersifat nominal, tetapi juga
ordinal. Pada permasalahan seperti ini bisa saja diterapkan metode regresi logistik
multinomial, tetapi bagaimanapun juga metode ini tidak memperhitungkan sifat ordinalitas
variabel respon. Oleh karena itu, regresi logistik ordinal sangatlah berperan disini.
Regresi logistik ordinal adalah salah satu metode satu metode statistika untuk
menganalisis variabel terikat yang mempunya skala ordinal yang terdiri atas tiga variabel
atau lebih. Variabel bebas yang dapat disertakan dalam model dapat berupa data kategori
atau kontinyu yang terdiri dari dua variabel atau lebih. Menurut Holmer dan Lemenshow
(2000), regresi logistik ordinal adalah suatu metode analisis yang digunakan untuk
mengetahui hubungan antara variabel respon dengan variabel prediktor, dimana variabel
responnya memiliki lebih dari dua kategori dan dalam setiap kategori memiliki tingkatan.
(Holmer dan Lemenshow, 2000)
Model yang dapat digunakan untuk regresi logistik ordinal adalah model logit. Model
logit tersebut dalam regresi logistik ordinal disebut dengan cumulative logit models. Pada
model logit ini sifat ordinal dari respon Y ditunjukkan dalam probabilitas kumulatif
sehingga

cumulative

logit

models

merupakan

model

yang

didapatkan

denga

membandingkan probabilitas kumulatif.


Perbandingan probabilitas kumulatif yaitu probabilitas yang kurang dari atau sama
dengan kategori respon ke-j
respon ke-j

dengan probabilitas yang lebih besar dari kategori

. Model logit dari regresi logistik ordinal tersebut adalah sebagai

berikut:
[


Keterangan:
j = banyaknya kategori pada variabel respon, j = 0,1,2,3,.... j-1
k = banyaknya variabel prediktor.
Fungsi logit yang dapat dibentuk jika terdapat J kategori respon adalah sebanyak J-1
fungsi logit. Setelah diketahui fungsi logit maka selajutnya dapat dicari persamaan dari
probabilitas kumulatif kategori respon ke-j dengan penjabaran sebagai berikut:
*

Sehingga didapatkan fungsi probabilitas kumulatif kategori respon ke-j sebagai berikut.

Jika

menyatakan probabilitas kategori respon ke-j pada p

variabel prediktor yang dinyatakan dalam vektor

dan

menyatakan

probabilitas kumulatif pada variabel prediktor yang dinyatakan dalam vektor xi maka fungsi
probabilitas kumulatif tersebut dapat dinyatakan sebagai berikut:

2. Estimasi Parameter
Pada penelitian ini metode yang digunakan untuk menaksir nilai

adalah metode

Maksimum Likelihood Estimation (MLE). Metode ini digunakan untuk menaksir parameter
yang tidak diketahui. Prinsip metode ini adalah menaksir nilai

dengan memaksimumkan

fungsi likelihood. Bentuk umum dari fungsi likelihood untuk sampel dengan n observasi
independen, (

dimana i=1,2,..n adalah sebagai berikut


Selanjutnya didapatkan fungsi log likelihood sebagai berikut.

Parameter-parameter diperoleh dengan menurunkan persamaan

terhadap

parameter yang ingin diketahui dan selanjutnya turunan pertama tersebut disamadengankan
nol. Selanjutnya berdasarkan teori maximum likelihood, taksiran varian kovarian
didapatkan dari turunan kedua fungsi log-likeklihoodnya. Nilai parameter diestimasi dengan
menggunakan metode numerik karena persamaannya bersifat nonlinier. Metoder numerik
tersbut adalah metode iterasi Newton- Raphson (Agresti, 1990).

3. Pengujian Parameter
Menurut Hosmer dan Lameshow (2000), model yang telah diperoleh perlu diuji
kesignifikannya dengan melakukan pengujian statistik. Pengujian dilakukan terhadap
koefisien

dari model yang telah diperoleh. Dalam model regresi logistik terdapat dua

jenis pengujian yaitu pengujian secara parsial dan pengujian serentak.


3.1 Uji Serentak
Uji serentak dilakukan untuk memeriksa keberartian koefisien

secara keseluruhan

atau serentak. Jika parameter yang diuji signifikan maka dapat dikatakan jika model yang
dibentuk sesuai untuk memodelkan variabel respon. Hipotesis yang digunakan adalah
sebagai berikut.
H0 :

p=

H1 : paling sedikit terdapat satu

dengan k =1,2,...p

Statistik uji yang digunakan adalah statistik uji G atau likelihood ratio test.
[

Keterangan:
n0 = banyaknya observasi yang berkategori 0
4

n1 = banyaknya observasi yang berkategori 1


Daerah penolakan H0 adalah jika

dengan derajat bebas sebesar db

dimana db = (I-1)(J-1). Dalam hal ini G menyebar mengikuti distribusi Chi-square dengan
derajat bebas p.
3.2 Uji Parsial
Uji parsial digunakan untuk mengetahui signifikansi parameter terhadap variabel
respon. Statistik uji yang digunakan adalah uji Wald. Berdasarkan hasil dari uji Wald maka
akan diketahui apakah suatu variabel prediktor layak atau tidak masuk dalam model.
Hipotesis yang digunakan adalah sebagai berikut.
H0 :
H1 :

dengan k = 1,2,...p

P = jumlah prediktor dalam model


Statistik uji Wald adalah sebagai berikut

Keterangan : SE (

adalah taksiran standar error parameter

Daerah penolakan H0 adalah jika

atau

dengan derajat bebas

sebesar v.

4. Uji Kesesuaian Model


Uji kesesuaian model dilakukan untuk mengetahui apakah suatu model yang terbentuk
sudah sesuai untuk digunakan atau tidak. Statistik uji yang digunakan adalah uji pearson
chi-square dengan hipotesis sebagai berikut.
H0

: Model sesuai (tidak ada perbedaan yang nyata antara hasil observasi

dengan

kemungkinan hasil prediksi model)


H1

: Model tidak sesuai (ada perbedaan yang nyata antara hasil observasi

dengan

kemungkinan hasil prediksi model)


Statistik uji Chi-square adalah sebagai berikut:

Daerah penolakan H0 jika p-value <

atau

dengan derajat bebas

sebesar jumlahan dari derajat bebas sebesar jumlahan dari derajat bebas pada estimasi
parameter setiap variabel yang masuk kedalam model.

Contoh Kasus Regresi Logistik Ordinal


Suatu penelitian dilakukan dengan tujuan untuk mengetahui faktor-faktor yang
mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi Statistika FMIPA
Universitas Mulawarman, yaitu jenis kelamin (X1), jenis sekolah menengah (X2), daerah
asal (X3), pekerjaan orang tua (X4), lama studi (X5) dan usia masuk perguruan tinggi (X5),
akan dianalisis menggunakan analisis regresi logistik ordinal. Berikut adalah hasil tabulasi
silang faktor-faktor yang mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi
Statistika FMIPA Universitas Mulawarman:
Tabel 1 Tabulasi Jenis Kelamin (X1) terhadap IPK (Y)

IPK

Jenis Kelamin
Perempuan Laki-Laki

Jumlah

Memuaskan

11

17

Sangat Memuaskan

39

37

76

Dengan Pujian

53

10

63

98

58

156

Jumlah

Tabel 2 Tabulasi Jenis Sekolah Menengah (X2) terhadap IPK (Y)

IPK

Jenis Sekolah Menengah

Jumlah

SMK/MAN

SMA

Memuaskan
Sangat Memuaskan

2
6

15
70

17
76

Dengan Pujian

61

63

Jumlah

10

146

156

Tabel 3 Tabulasi Daerah Asal (X3) terhadap IPK (Y)

IPK

Daerah Asal

Jumlah

Luar Samarinda
9

Samarinda
8

17

Sangat Memuaskan

32

44

76

Dengan Pujian

31

32

63

Jumlah

72

84

156

Memuaskan

Tabel 4 Tabulasi Pekerjaan Orang Tua (X4) terhadap IPK (Y)

Pekerjaan Orang Tua


Pekerjaan Lainnya
PNS
Wiraswasta

IPK

Swasta

Jumlah

Memuaskan

10

17

Sangat Memuaskan

21

11

35

76

Dengan Pujian

18

10

32

63

Jumlah

15

43

21

77

156

Tabel 5 Tabulasi Lama Study (X5) terhadap IPK (Y)

Lama Studi (Tahun)

IPK

Jumlah

5,33 < X5 < 7

3,66 < X5 < 5,33

Memuaskan

15

17

Sangat Memuaskan

70

76

Dengan Pujian

61

63

10

146

156

Jumlah

Tabel 6 Tabulasi Usia (X6) terhadap IPK (Y)

Usia (tahun)

IPK

Jumlah

19 < X6 < 22

16 < X6 < 19

Memuaskan

16

17

Sangat Memuaskan

73

76

Dengan Pujian
Jumlah

0
4

63
152

63
156

Penyelesaian:
1.

Estimasi Parameter

Setelah dilakukan estimasi parameter menggunakan metode MLE diperoleh hasil seperti
pada Tabel 7 berikut:

Tabel 7 Hasil Estimasi Parameter Model

Variabel
X1
X2
X3
X4
X5
X6
Konstanta (1)
Konstanta (2)
Berdasarkan Tabel 7 tentang hasil

-1,767
-1,144
-0,502
-0,984
1,777
-0,504
0,331
3,642
estimasi

P-value
0,000
0,106
0,161
0,128
0,000
0,634
0,002
0,008
parameter menggunakan metode MLE

dapat digunakan untuk membuat taksiran model regresi logistik yang telah ditransformasi
logit. Berikut adalah model logit regresi logistik ordinal:

2.

Uji Serentak

Pengujian secara serentak dilakukan dengan menggunakan likelihood ratio test.


Tabel 8 Hasil Likelihood Ratio Test

G
df
P-value
55,158
8
0,000
Berdasarkan Tabel 8 dapat disimpulkan bahwa nilai statistik uji G sebesar 55,158
yang lebih besar dari nilai tabel

= 12,592 dan nilai p-value = 0,000 yang lebih kecil

dari = 0,05 maka dapat diambil kesimpulan Tolak H0, yang berarti bahwa pada pengujian
secara serentak model regresi logistik ordinal antara variabel respon (Y) nilai IPK dengan
enam variabel bebas terdapat minimal satu variabel yang signifikan.

3.

Uji Parsial
Pengujian secara individu digunakan untuk mengetahui signifikansi masing-masing

variabel bebas (X) terhadap variabel respon (Y). Berikut adalah hasil pengujian individu
untuk masing-masing variabel prediktor:

Tabel 9 Uji Individu Variabel X dengan Variabel Y

Variabel

Uji Wald

P-value

Keputusan

Konstanta (1)
2,25
0,002
Tolak H0
Konstanta (2)
2,65
0,008
Tolak H0
X1
-4,49
0,000
Tolak H0
X2
-1,62
0,106
Gagal Tolak H0
X3
-1,40
0,161
Gagal Tolak H0
X4
1,52
0,128
Gagal Tolak H0
X5
4,70
0,000
Tolak H0
X6
-0,48
0,634
Gagal Tolak H0
Berdasarkan Tabel 9 dapat diketahui pada hasil pengujian signifikansi variabel
prediktor, variabel prediktor yang berpengaruh signifikan terhadap variabel respon adalah
dua konstanta yang dihasilkan pada model logit dan variabel X1, yaitu jenis kelamin dan
variabel X5, yaitu lama studi, sedangkan variabel jenis sekolah menengah (X2), daerah asal
(X3) dan pekerjaan orang tua (X4) tidak berpengaruh secara signifikan atau dapat dikatakan
bahwa variabel prediktor tersebut memiliki pengaruh yang kecil terhadap variabel respon.

4. Model Terbaik Regresi Logistik Ordinal


Berikut ini adalah hasil pengujian untuk mengetahui model terbaik dari regresi logistik
ordinal:
Tabel 10 Hasil Pengujian Model Terbaik

Variabel
P-value
Konstanta (1)
-2,360
0,004
Konstanta (2)
0,754
0,027
X1
-1,515
0,000
X5
1,521
0,000
Berdasarkan pengujian terhadap variabel prediktor yang berpengaruh signifikan
terhadap variavel respon untuk mendapatkan model terbaik, diperoleh bahwa pada semua
variabel prediktor dan kedua konstanta model logit memiliki nilai P-value yang kurang dari
= 0,05 sehingga Tolak H0, yang berarti bahwa model telah sesuai. Berikut adalah model
logit pada yang digunakan dalam model regresi logistik ordinal:

10

5. Interpretasi Model
Interpretasi model regresi logistik ordinal dapat dilakukan dengan menggunakan nilai
Odds Ratio. Berikut adalah nilai Odds Ratio untuk masing-masing variabel prediktor yang
signifikan:
Tabel 11 Nilai Odds Ratio

Variabel
Nilai Odds Ratio
X1
0,22
X5
4,58
Pada variabel X1, yaitu jenis kelamin didapatkan nilai Odds Ratio sebesar 0,22 yang
artinya adalah mahasiswa perempuan memiliki resiko 4,54 kali lebih besar untuk
mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa laki-laki. Pada
variabel X5, yaitu lama studi didapatkan nilai Odds Ratio sebesar 4,58 yang artinya adalah
mahasiswa yang memiliki lama studi antara 3,66 < X5 < 5,33 resiko 4,58 kali lebih besar
untuk mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa yang memiliki
lama studi antara 5,33 < X5 < 7.

11