Pendahuluan
a. Data Nominal
Data berskala nominal adalah data yang diperoleh dengan cara kategorisasi atau
klasifikasi. Ciri-cirinya adalah posisi data setara tidak bisa dilakukan operasi
matematika (+, -, x, :). Contoh : jenis kelamin, jenis pekerjaan (Sukoco dan
Satirianingrum, 2012).
b. Data Ordinal
Data berskala ordinal adalah data yang dipeoleh dengan cara kategorisasi atau
klasifikasi, tetapi di antara data tersebut terdapat hubungan. Ciri-cirinya adalah posisi
data tidak setara dan tidak bisa dilakukan operasi matematika (+, -, x, :). Contoh :
kepuasan kerja, motivasi (Sukoco dan Satirianingrum, 2012).
c. Data Interval
Data berskala interval adalah data yang diperoleh dengan cara pengukuran, dimana
jarak antara dua titik skala sudah diketahui. Ciri-cirinya adalah tidak ada kategorisasi
dan bisa dilakukan operasi matematika. Contoh : temperatur yang diukur berdasarkan
0C dan 0F, sistem kalender (Sukoco dan Satirianingrum, 2012).
d. Data Rasio
Data berskala rasio adalah data yang diperoleh dengan cara pengukuran, dimana jarak
antara dua titik skala sudah diketahui dan mempunyai titik 0 absolut. Ciri-cirinya
adalah tidak ada kategorisasi dan bisa dilakukan operasi matematika. Contoh : gaji,
skor ujian, jumlah buku (Sukoco dan Satirianingrum, 2012).
Analisis regresi merupakan salah satu teknik analisis data dalam statistika yang
seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal
suatu variabel (Kutner, Nachtsheim dan Neter, 2004). Istilah “regresi” pertama kali
dikemukakan oleh Sir Francis Galton (1822-1911), seorang antropolog dan ahli
meteorologi terkenal dari Inggris. Dalam makalahnya yang berjudul “Regression towards
mediocrity in hereditary stature”, yang dimuat dalam Journal of the Anthropological
Institute, volume 15, hal. 246-263, tahun 1885. Galton menjelaskan bahwa biji keturunan
tidak cenderung menyerupai biji induknya dalam hal besarnya, namun lebih medioker
(lebih mendekati rata-rata) lebih kecil daripada induknya kalau induknya besar dan lebih
besar daripada induknya kalau induknya sangat kecil (Draper dan Smith, 1998).
Metode regresi merupakan komponen integral dari suatu analisis data yang
menggambarkan hubungan antara variabel respon dan satu atau lebih variabel prediktor
(Hosmer, 2000). Analisis regresi ini sering digunakan dalam berbagai bidang studi, seperti
kesehatan, teknik, sains, ekonomi, manajemen, dan sosial. Seringkali ditemukan kasus
dimana data mempunyai variabel respon diskrit. Untuk data yang mempunyai variabel
respon berskala ordinal, yaitu mempunyai lebih dari 2 kategori dan setiap kategori dapat
diperingkat, dapat digunakan analisis regresi ordinal. Sebagai contoh, beberapa peneliti
ingin mengetahui apakah suatu terapi yang baru mereka temukan berhasil meningkatkan
tingkat kesembuhan pasien yang mempunyai kebiasaan merokok. Tingkat kesembuhan
pasien dibagi menjadi 3 kategori, yaitu 1=memburuk, 2=tidak ada perubahan, dan
3=meningkat. Untuk menyelesaikan permasalahan ini, diambil sejumlah sampel acak dari
beberapa rumah sakit yang menerapkan terapi ini, lalu digunakan analisis regresi ordinal
untuk mengetahui hubungan antara tingkat kesembuhan pasien dan kebiasaan merokok.
1.2 Rumusan Masalah
Apakah pengertian regresi?
Apakah pengertian regresi ordinal?
Bagaimana bentuk umum dari regresi ordinal?
Bagaimana contoh penerapan regresi ordinal?
1.3 Tujuan
Mahasiswa mampu memahami analisis regresi ordinal.
BAB II
PEMBAHASAN
2.1 Pengertian
Analisis regresi merupakan metode statistika yang digunakan untuk meramalkan
sebuah variabel respon y dari satu atau lebih variabel bebas x, selain itu juga digunakan
untuk menaksir pengaruh-pengaruh variabel bebas x terhadap variabel respon y (Johnson
& Wichern, 2007).
Regresi logistik ordinal adalah perluasan dari regresi logistik biner dimana regresi
logistik ordinal merupakansalah satu metode statistika untuk menganalisis data dengan
variabel respon merupakan skala ordinal yang terdiri dari tiga kategori atau lebih dan
variabel prediktor merupakan covariate (jika menggunakan skala interval atau rasio) atau
bisa merupakan faktor (jika menggunakan skala nominal atau ordinal) (Iban, 2017).
Isnadia (2012) dalam skripsinya yang berjudul “Penduga Penalti Ganda Likelihood
dalam Model Regresi Logistik” juga mencari solusi terhadap multikolinearitas pada regresi
logistik. Pada skripsi tersebut dijelaskan estimasi regresi logistik ganda dengan Newton-
Raphson, dijelaskan pula multikolinearitas, pengaruhnya terhadap regresi logistik, serta
cara pemeriksaannya.
Aguilera dkk. (2006) dalam jurnalnya “Using Principal Components for Estimating
Logistic Regression with High-Dimensional Multicollinear Data” juga 4 menjelaskan
estimasi komponen utama pada regresi logistik secara lebih lengkap. Pada jurnal ini
dijelaskan cara mendapatkan komponen utama dengan matriks kovarian, formulasi model,
hingga diperoleh nilai estimator komponen utama tersebut.
2
Ketika P [{𝑋 2 | > 𝑋𝑃𝑒𝑎𝑟𝑠𝑜𝑛 ] < α, menunjukkan bahwa antar peubah penjelas terdapat
multikolinearitas yang merupakan suatu masalah, karena akan sulit mengetahui pengaruh
masing- masing peubah penjelas terhadap peubah respon (Sari, 2013).
Langkah pertama model logistik ordinal sama dengan multinomial, namun langkah
keduanya menggunakan MLE untuk model logistik ordinal. Langkah kedua model logistik
ordinal berbeda dengan multinomial (Sari, 2013).
Pada model logit sifat ordinal dari respon Y dituangkan dalam peluang kumulatif.
Jika variabel respon Y memilih J buah kategori berskala ordinal dan 𝑋𝑖 menyatakan vektor
variabel prediktor sebanyak p, maka 𝑋𝑖 =(𝑋𝑖1 𝑋𝑖2 . . . 𝑋𝑖𝑝 )𝑇 dan 𝑋 =(𝑋1 𝑋2 . . . 𝑋𝑝 )𝑇 dengan
i= 1,2 ... n. Sehingga peluang kumulatif ke j dapat dinyatakan:
Apabila peluang kurang dari atau sama dengan kategori respon ke- j dibandingkan dengan
peluang lebih besar dari kategori respon ke-j, maka diperoleh hasil sebagai berikut:
Bila suatu variabel respon terdiri dari 3 kategori, maka model regresi logistik ordinal yang
terbentuk adalah sebagai berikut:
Dimana,
Dari kedua peluang kumulatif tersebut, maka bisa didapatkan peluang dari masing- masing
kategori variabel respon sebagai berikut
Nilai klasifikasi pada persamaan tersebut akandijadikan pedoman untuk
pengklasifikasian. Suatu pengamatan akan masuk dalam respon kategori j berdasarkan
nilai 𝜋𝑗 (𝑋𝑖 ) yang terbesar (Putranto & Mashuri, 2012).
2.3 Contoh Penerapan
Contoh penerapan regresi logistik ordinal adalah studi akreditasi SMA di sebuah
provinsi. Sertifikat akreditasi sekolah memuat nilai masing-masing komponen (dalam
angka) dan peringkat/status akreditasi sekolah yang dinyatakan dengan huruf A (amat
baik), B (baik), dan C (cukup). Ditinjau dari skala data, peringkat/status akreditasi
merupakan data dengan skala ordinal. Oleh karena itu, penentuan peringkat/status ini
adalah klasifikasi data yang bersifat ordinal. Salah satu metode statistika yang dapat dipakai
untuk klasifikasi data yang bersifat ordinal adalah regresi logistik ordinal. Sebagai variabel
respon adalah peringkat atau status akreditasi yaitu:
1=C
2=B
3=A
sedangkan sebagai variabel prediktor atau independen adalah aspek-aspek yang terdapat
dalam profil sekolah yaitu:
1. Status sekolah (0=swasta, 1=negeri)
2. Lama berdiri sekolah
3. Jumlah siswa
4. Jumlah guru
5. Jumlah alumni yang diterima di dunia usaha dan industri setahun terakhir
6. Nilai rata-rata jumlah ujian nasional sekolah setahun terakhir
2.4 Contoh dalam SPSS
Contoh kasus : Seorang dosen ingin mengetahui hubungan antara gender dan minat belajar
di sebuah universitasnya. Variabel independen terdiri dari gender dan nilai prestasi
sedangkan variabel dependen (Y) adalah minat belajar yang diukur dalam 3 tingkatan yaitu
rendah, sedang dan tinggi.
Langkah-langkah analisis regresi ordinal :
1. Analyze >> Regression >> Ordinal
2. Masukan variabel Minat belajar ke kotak Dependent, Gender ke kotak Factor(s) dan
Nilai prestasi ke Covariate.
Menu Regresi Ordinal
5. Klik OK
Goodness of fit
Tabel Goodness of Fit menunjukkan uji kesesuaian model dengan data. Nilai Pearson
sebesar 317,892 dengan signifikansi 0,991 (> 0,05) dan Deviance sebesar 350,797
dengan signikansi 0,856 (> 0,05). Hal ini berarti model sesuai dengan data empiris atau
model layak digunakan.
Pseudo R-Square
Tabel Pseudo R-Square menunjukkan bahwa seberapa besar variabel bebas (gender
dan nilai prestasi) mampu menjelaskan variabel independen (minat belajar). Nilai ini
seperti halnya koefesien determinasi pada regresi. Nilai Cox and Snell sebesar 0,044
(4,4%) dan Nagelkerke sebesar 0,052 (5,2%).
Parameter Estimates
Tabel Parameter Estimate di atas, perhatikan nilai Wald dan nilai signifikansinya.
Variabel nilai prestasi sebesar 6.177 dengan sig. 0,013 (< 0,05) dan variabel gender
sebesar 9,163 dengan sig.0,02 (< 0,05). Hal ini menunjukkan faktor nilai prestasi dan
gender berpengaruh terhadap minat belajar.
Draper, N.R. and Smith, H. 1998. Applied Regression Analysis,Second Edition. John Wiley
and sons, Inc. New York.
Hosmer, D.W. dan S. Lemeshow, (2000) : Applied Logistic Regression. Second Edition, John
Willey & Sons, New York.
Iban, Marius. 2017. Perbandingan Regresi Logistik Ordinal Model Logit dan Model Probit
pada Analisis Pengaruh Faktor Ibu Terhadap Bayi Berat Rendah (BBLR). Skripsi.
Universitas Airlangga: Surabaya.
Johnson, R. A. and Wichern, D. W. 2007. Applied Multivariate Analysis, Third Edition,
Prentice Hall Inc, New Jersey.
Kutner, M.H., C.J. Nachtsheim dan J. Neter. 2004. Applied Linear regression Models. Fourth
Ed. The McGraw-Hill Company, Inc. New york.
Putranto, R. T., dan Muhammad M. 2012. Analisis Statistik tentang Faktor- Faktor yang
Mempengaruhi Waktu Tunggu Kerja Fresh Graduate di Jurusan Statistika Institut
Teknologi Sepuluh Nopember (ITS) dengan Metode Regresi Logistik Ordinal. JURNAL
SAINS DAN SENI ITS. Vol. 1: No.1.
Sari, V. N., Eni, S., dan Maria, B.2013. Pemilihan Model Regres Logistik Multinomial dan
Ordinal Terbaik Berdasarkan 𝑅 2 MC. FADDEN. Indonesia:UB
Sukoco, Agus dan Soenbandhi, Satirianingrum. 2012. Modul 2 : Statistik dan Statistika.
Indonesia: Fakultas Ekonomi.