Anda di halaman 1dari 4

PEMILIHAN MODEL REGRESI LOGISTIK MULTINOMIAL

DAN ORDINAL TERBAIK BERDASARKAN R 2 MC. FADDEN


Virgiana Nanda Sari, Eni Sumarminingsih, Maria Bernadetha3
123

Jurusan Matematika, F.MIPA, Universitas Brawijaya Malang, Indonesia


Email:red.virgi@gmail.com

Abstrak. Regresi Logistik digunakan untuk mencari hubungan antara peubah respon bersifat kategorik berskala nominal,
ordinal dengan satu atau lebih peubah penjelas kontinyu maupun kategorik. Pendugaan parameter model regresi logistik
multinomial dan ordinal dilakukan dengan metode Maximum Likelihood Estimation (MLE). Indikator pemilihan model
terbaik untuk fungsi MLE adalah Akaike Information Criteria (AIC), untuk contoh berukuran kecil dan jumlah kategori sama
dan R2 Mc Fadden, digunakan untuk contoh berukuran besar dengan jumlah kategori berbeda. Berdasarkan tingkatan skala
data mulai dari yang tertinggi hingga terendah, dapat dibuktikan bahwa peubah respon berskala ordinal selain dianalisis
menggunakan regresi logistik ordinal dapat pula dianalisis menggunakan regresi logistik multinomial. Hasil pemilihan model
regresi logistik multinomial dan ordinal terbaik pada tingkat tekanan darah penderita hipertensi, tingkat status gizi balita serta
tingkat gangguan penglihatan mata berdasarkan R2 Mc. Fadden menghasilkan regresi logistik multinomial sebagai model
terbaik.
Kata Kunci: R2 Mc.Fadden, AIC, MLE, Multinomial, Ordinal.

1. PENDAHULUAN
Regresi Logistik merupakan salah satu metode regresi yang digunakan untuk mencari hubungan
antara peubah respon bersifat kategorik berskala nominal, ordinal dengan satu atau lebih peubah
penjelas kontinyu maupun kategorik. Jika peubah respon berskala nominal digunakan regresi logistik
multinomial (Fahmeir dan Tutz, 1994), sedangkan pada peubah respon berskala ordinal digunakan
regresi logistik ordinal. Menurut Husaini (2006), tingkatan skala data dimulai dari (tertinggi) rasional,
interval, ordinal dan nominal (terendah). Data berskala lebih tinggi dapat diubah ke skala lebih rendah,
sehingga data berskala ordinal dapat dipandang sebagai data yang berskala nominal. Jadi data yang
dapat dianalisis menggunakan regresi logistik ordinal dapat pula dianalisis dengan regresi logistik
multinomial, sehingga analisis regresi logistik ordinal dapat pula dipandang sebagai analisis regresi
logistik multinomial. Pendugaan parameter model regresi logistik multinomial dan ordinal dilakukan
dengan metode Maximum Likelihood Estimation (MLE). Beberapa metode pemilihan model terbaik
untuk fungsi MLE adalah metode Akaike Information Criteria (AIC), digunakan pada contoh
berukuran kecil dan jumlah kategori sama dan R2 Mc Fadden, digunakan untuk contoh berukuran
besar dengan jumlah kategori berbeda (Powell, 1997). Manfaat penelitian ini adalah memperoleh
informasi serta pemahaman lebih mendalam tentang model terbaik antara model logistik multinomial
dan regresi logistik ordinal pada peubah respon berskala ordinal berdasarkan R2 Mc Fadden.
2. METODOLOGI
2.1 Sumber Data
Data sekunder untuk aplikasi bersumber pada :
1. Aprilia, 2007. Hubungan Antara Status Gizi, Konsumsi Garam, serta Keteraturan Minum Obat
dengan Tekanan Darah Penderita Hipertensi di Puskesmas Dr. Soetomo Kecamatan Tegalsari,
Kota Surabaya.
2. Rizki, 2009. Hubungan Pengetahuan Gizi Ibu, Pola Asuh, dan Food Taboo dengan Status Gizi
Balita di PAUD Harapan Bunda, Kota Pasuruan.
3. Bambang, 2009. Analisis Regresi Ordinal pada Kajian Faktor Penyebab Gangguan Penglihatan
Pemeriksaan VISUS di Balai Kesehatan Mata Masyarakat, Surabaya.

2.2 Prosedur penelitian


Untuk mencapai tujuan penelitian, prosedur yang ditetapkan pada data adalah :
1. Menentukan model regresi logistik.
a. Multinomial
Langkah pertama adalah menguji asumsi multikolinearitas. Uji khi-kuadrat Pearson digunakan
untuk mendeteksi ada tidaknya multikolinearitas yang mengukur besarnya peningkatan ragam
penduga bagi koefisien regresi. Besarnya nilai p yang dihasilkan dari uji khi-kuadrat Pearson dapat
mengindikasikan adanya multikolinearitas. Jika nilai p > , maka antar peubah penjelas saling bebas
(tidak terjadi multikolinearitas). Jika H0 benar, statistik uji
:
(|

|)

(p)

Jika P [| | >
] < , menunjukkan bahwa antar peubah penjelas terdapat multikolinearitas
yang merupakan suatu masalah, karena akan sulit mengetahui pengaruh masing-masing peubah
penjelas terhadap peubah respon.
Langkah kedua melakukan pendugaan parameter menggunakan Maximum Likelihood
Estimation (MLE). Hasil pendugaan parameter diuji secara simultan. Hosmer dan Lemeshow (2000)
menyatakan pengujian koefisien secara simultan yang bertujuan untuk membandingkan nilai
pengamatan respon dengan penduga nilai respon untuk model penuh dan model intersep. Statistik uji
G atau likelihood ratio test :
( )
( )
Kemudian parameter juga diuji secara parsial. Hosmer dan Lemeshow (2000), Pengujian
koefisien secara parsial didasarkan pada pembakuan pada penduga koefisien regresi yang mengikuti
sebaran normal baku (Z). berdasarkan statistik uji Wald :

()
Langkah ketiga melakukan pengujian kesesuaian model (Goodness 0f Fit). Siegel (1992)
menyatakan suatu ukuran yang menjelaskan perbedaan antara frekuensi pengamatan dengan frekuensi
harapan dinyatakan oleh statistik
maka ferkuensi
( ) , di mana v = m(k1)-p. Jika
( )
pengamatan sama dengan frekuensi harapan. sedangkan ( )
, menunjukkan bahwa frekuensi
pengamatan berbeda dari frekuensi harapan.
b. Ordinal
Langkah-langkah untuk menduga model regresi logistik ordinal sama dengan multinomial,
namun pada langkah kedua menggunakan MLE untuk model regresi logistik ordinal.
2. Menerapkan R2 Mc Fadden untuk memilih model tepat.
R2 Mc. Fadden adalah indikator pemilihan model terbaik. dan juga digunakan untuk mengetahui
indeks likelihood-ratio yang didasarkan pada nisbah likelihood model penuh yang mengandung semua
parameter (L1) dengan model yang hanya memuat intersep (L0) :
=1
3. Menggunakan model terpilih untuk memodelkan kembali data, menginterpretasikan model dan
mengambil kesimpulan.
3. HASIL DAN PEMBAHASAN
3.1 Kajian tingkat tekanan darah penderita hipertensi
3.1.1 Pengujian asumsi multikolinearitas
Berdasarkan pengujianmenggunakan statistik uji khi-kuadrat Pearson, diperoleh korelasi antara
X5 (umur) dengan X6 (tingkat pengetahuan ) menghasilkan nilai p < 0,05 menunjukan terdapat
multikolinearitas, namun tidak dihilangkan dari model karena diduga mempengaruhi tingkat tekanan
darah, sedangkan antar peubah penjelas lain bersifat nonmultikolinearitas.

78

3.1.2 Pendugaan dan Pengujian Parameter


Parameter diduga menggunakan MLE, dengan memanfaatkan software minitab 15. Pengujian
koefisien regresi secara simultan menghasilkan nilai p < 0,005, maka H0 ditolak yang menunjukkan
bahwa paling sedikit ada satu peubah penjelas yang menentukan tingkat tekanan darah penderita
hipertensi.
Pada regresi logistik ordinal, status gizi, jenis kelamin, tingkat pendidikan, umur, serta
keteraturan minum obat penderita hipertensi tidak berpengaruh terhadap tingkat tekanan darah
penderita hipertensi, sedangkan genetika, tingkat pengetahuan, serta konsumsi garam mempengaruhi
tingkat tekanan darah penderita hipertensi, sedangkan pada regresi logistik multinomial model logit 1
(2/3) yaitu perbandingan antara tekanan darah normal dengan tekanan darah tinggi, semua peubah
penjelas menghasilkan nilai p > 0,05 menunjukkan bahwa secara parsial tidak ada peubah penjelas
yang berpengaruh terhadap tekanan darah normal. Model logit 2 (1/3) yaitu tekanan darah rendah
dengan tekanan darah tinggi sebagai kategori pembanding, faktor genetik, tingkat pengetahuan, serta
konsumsi berpengaruh terhadap tekanan darah rendah, sedangkan status gizi, jenis kelamin, tingkat
pendidikan, umur, serta keteraturan minum obat tidak berpengaruh terhadap tekanan darah rendah.
Hasil pengujian kesesuaian model menggunakan Pearson dan Deviance :
Tabel 1. Nilai p untuk statistik uji Pearson dan Deviance
Nilai p
Regresi logistik ordinal
Regresi logistik multinomial
Pearson
0,319
0,070
Deviance
0,540
0,631
Karena nilai p > 0,05 sehingga H0 diterima yang menunjukkan bahwa model sesuai
3.1.3 Pemilihan model terbaik
Kriteria pemilihan model terbaik dipilih berdasarkan nilai Mc. R2 terbesar.
Tabel 2. Nilai R2 Mc. Fadden setiap metode
Metode
Log-likelihood
Regresi logistik ordinal
-74,598
Regresi logistik multinomial
-66,755

G
31,992
47,678

R2 Mc. Fadden
0,088262
0,174835

Berdasarkan Tabel 2. model logistik multinomial lebih baik dibandingkan model logistik
ordinal, sehingga :
1. Logit 1 (2/3), yaitu tingkat tekanan darah kategori 2 dengan kategori 3 (tinggi) sebagai kategori
pembanding mempunyai model logit 1 :
( )
2. Logit 2 (1/3), yaitu tingkat tekanan darah kategori 1 dengan kategori 3 sebagai kategori pembanding
mempunyai model logit 2 :
( )
Adapun untuk kajian tingkat status gizi balita dan tingkat gangguan penglihatan mata pasien
diterapkan langkah-langkah yang sama dengan kajian tingkat tekanan darah penderita hipertensi untuk
mendapatkan model (hasil tertera pada lampiran).
4. KESIMPULAN
Berdasarkan pengujian kesesuaian model pada ketiga data menggunakan uji Pearson dan
Deviance, baik regresi logistik multinomial maupun ordinal diperoleh model yang sesuai (frekuensi
pengamatan sama dengan frekuensi harapan) sehingga dapat dilakukan pemilihan model yang lebih

79

baik antara keduanya. Hasil pemilihan model regresi logistik multinomial dan ordinal terbaik pada
data tingkat tekanan darah penderita hipertensi, data tingkat status gizi balita serta tingkat gangguan
penglihatan mata berdasarkan R2 Mc. Fadden menunjukkan bahwa regresi logistik multinomial
merupakan model terbaik.
5. UCAPAN TERIMA KASIH
Terima kasih kepada dosen pembimbing skripsi Ibu Eni Sumarminingsih dan Ibu Maria
Bernadetha Theresia Mitakda atas bimbingan yang diberikan selama penelitian yang menghasilkan
skripsi ini.
DAFTAR PUSTAKA
Aprilia, B, (2007), Hubungan antara Status Gizi, Konsumsi Garam, serta Keteraturan Minum Obat
dengan
Tekanan
Darah
Penderita
Hipertensi,
Skripsi,
Fakultas
Kesehatan
Masyarakat.Universitas Airlangga, Surabaya.
Fahmeir, L. dan Tutz. G., (1994), Multivariate Statistical Modelling Based on Generalized Linier
Models, John Willey and Sons, Inc. New York.
Hosmer, D. W. dan Lemeshow, S., (2000), Applied Logistic Regression, John Willey and Sons,
Inc.New York.
Heriyanto, B., (2009), Analisis Regresi Ordinal pada Kajian Faktor Penyebab Gangguan Penglihatan
Berdasarkan Pemeriksaan VISUS di Balai Kesehatan Mata Masyarakat Surabaya, Tesis,
Fakultas Kesehatan Masyarakat.Universitas Airlangga, Surabaya.
Husaini, U., (2006), Pengantar Statistika.Bumi Aksara, Jakarta.
Powell, R.G., (1997), Modelling Takeover Likelihood,. Journal of Bussines Finance and Accounting,
Willey Blackwell, 24 (7&8), hal. 1009-1030.
Rizki, M., (2009), Hubungan Pengetahuan Gizi Ibu, Pola Asuh, dan Food Taboo dengan Status Gizi
Balita di PAUD Harapan Bunda Kota Pasuruan, Skripsi, Fakultas Kesehatan
Masyarakat.Universitas Airlangga, Surabaya.
Siegel,S., (1992), Nonparametric Statistics for The Behavioral Sciences, PT Gramedia, Jakarta.
LAMPIRAN
Tabel 3. Nilai R2 Mc. Fadden setiap metode (kajian tingkat status gizi balita)
Metode
Log-likelihood G
R2 Mc. Fadden
Regresi logistik ordinal
-47,192
27,167 0,091871
Regresi logistik multinomial -44,163
33,224 0,141703
Tabel 4. Nilai R2 Mc. Fadden setiap metode (kajian tingkat gangguan penglihatan mata pasien)
Metode
Log-likelihood G
R2 Mc. Fadden
Regresi logistik ordinal
-126,164
31,478 0,054537
Regresi logistik multinomial -122,027
39,753 0,0893694

80

Anda mungkin juga menyukai