Anda di halaman 1dari 14

Makalah UAB Praktikum

Blok Epidemiologi dan Biostastika


Regresi Ordinal

Radin Ahmad Hizdbul Maulana


161610101083

Fakultas Kedokteran Gigi


Universitas Jember
2017
BAB I

Pendahuluan

1.1 Latar Belakang


Statistik yang tidak memerlukan pembuatan asumsi tentang bentuk distribusi atau
bebas distribusi, sehingga tidak memerlukan asumsi terhadap populasi yang akan diuji.
Statistika nonparametrik digunakan, apabila :
1. Apabila ukuran sampel sedemikian kecil sehingga distribusi sampel atau populasi tidak
mendekati normal, dan tidak ada asumsi yang dapat dibuat tentang bentuk distribusi
populasi yang menjadi sumber populasi.
2. Apabila hasil pengukuran menggunakan data ordinal atau data berperingkat. Data
ordinal hanya menyatakan lebih baik, lebih buruk atau sedang atau bentuk ukuran
lainnya. Data ini sama sekali tidak menyatakan ukuran perbedaan.
3. Apabila hasil pengukuran menggunakan data nominal. Data nominal hanya merupakan
“kode” dan tidak mempunyai implikasi atau konsekuensi apa-apa. Jenis kelamin
diberikan kode “laki-laki” dan “perempuan”, pengkodean tersebut tidak berimplikasi
lebih rendah atau lebih tinggi, hanya sekadar kode.

Data dalam statistik dapat dibagi menjadi 3 kelompok, yaitu :

a. Berdasarkan sumber data terbagi data primer dan data sekunder.


b. Berdasarkan jenis data, terbagi menjadi Data Kualitatif dan Kuantitatif, data kuantitatif
terbagi menjadi data Diskret dan Kontinu.
c. Berdasarkan skala pengukuran, terbagi menjadi Data Nominal, Data Ordinal, Data
Interval dan Data Rasio.

Data berdasarkan skala pengukuran :

a. Data Nominal
Data berskala nominal adalah data yang diperoleh dengan cara kategorisasi atau
klasifikasi. Ciri-cirinya adalah posisi data setara tidak bisa dilakukan operasi
matematika (+, -, x, :). Contoh : jenis kelamin, jenis pekerjaan (Sukoco dan
Satirianingrum, 2012).
b. Data Ordinal
Data berskala ordinal adalah data yang dipeoleh dengan cara kategorisasi atau
klasifikasi, tetapi di antara data tersebut terdapat hubungan. Ciri-cirinya adalah posisi
data tidak setara dan tidak bisa dilakukan operasi matematika (+, -, x, :). Contoh :
kepuasan kerja, motivasi (Sukoco dan Satirianingrum, 2012).
c. Data Interval
Data berskala interval adalah data yang diperoleh dengan cara pengukuran, dimana
jarak antara dua titik skala sudah diketahui. Ciri-cirinya adalah tidak ada kategorisasi
dan bisa dilakukan operasi matematika. Contoh : temperatur yang diukur berdasarkan
0C dan 0F, sistem kalender (Sukoco dan Satirianingrum, 2012).
d. Data Rasio
Data berskala rasio adalah data yang diperoleh dengan cara pengukuran, dimana jarak
antara dua titik skala sudah diketahui dan mempunyai titik 0 absolut. Ciri-cirinya
adalah tidak ada kategorisasi dan bisa dilakukan operasi matematika. Contoh : gaji,
skor ujian, jumlah buku (Sukoco dan Satirianingrum, 2012).
Analisis regresi merupakan salah satu teknik analisis data dalam statistika yang
seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal
suatu variabel (Kutner, Nachtsheim dan Neter, 2004). Istilah “regresi” pertama kali
dikemukakan oleh Sir Francis Galton (1822-1911), seorang antropolog dan ahli
meteorologi terkenal dari Inggris. Dalam makalahnya yang berjudul “Regression towards
mediocrity in hereditary stature”, yang dimuat dalam Journal of the Anthropological
Institute, volume 15, hal. 246-263, tahun 1885. Galton menjelaskan bahwa biji keturunan
tidak cenderung menyerupai biji induknya dalam hal besarnya, namun lebih medioker
(lebih mendekati rata-rata) lebih kecil daripada induknya kalau induknya besar dan lebih
besar daripada induknya kalau induknya sangat kecil (Draper dan Smith, 1998).
Metode regresi merupakan komponen integral dari suatu analisis data yang
menggambarkan hubungan antara variabel respon dan satu atau lebih variabel prediktor
(Hosmer, 2000). Analisis regresi ini sering digunakan dalam berbagai bidang studi, seperti
kesehatan, teknik, sains, ekonomi, manajemen, dan sosial. Seringkali ditemukan kasus
dimana data mempunyai variabel respon diskrit. Untuk data yang mempunyai variabel
respon berskala ordinal, yaitu mempunyai lebih dari 2 kategori dan setiap kategori dapat
diperingkat, dapat digunakan analisis regresi ordinal. Sebagai contoh, beberapa peneliti
ingin mengetahui apakah suatu terapi yang baru mereka temukan berhasil meningkatkan
tingkat kesembuhan pasien yang mempunyai kebiasaan merokok. Tingkat kesembuhan
pasien dibagi menjadi 3 kategori, yaitu 1=memburuk, 2=tidak ada perubahan, dan
3=meningkat. Untuk menyelesaikan permasalahan ini, diambil sejumlah sampel acak dari
beberapa rumah sakit yang menerapkan terapi ini, lalu digunakan analisis regresi ordinal
untuk mengetahui hubungan antara tingkat kesembuhan pasien dan kebiasaan merokok.
1.2 Rumusan Masalah
 Apakah pengertian regresi?
 Apakah pengertian regresi ordinal?
 Bagaimana bentuk umum dari regresi ordinal?
 Bagaimana contoh penerapan regresi ordinal?
1.3 Tujuan
Mahasiswa mampu memahami analisis regresi ordinal.
BAB II
PEMBAHASAN
2.1 Pengertian
Analisis regresi merupakan metode statistika yang digunakan untuk meramalkan
sebuah variabel respon y dari satu atau lebih variabel bebas x, selain itu juga digunakan
untuk menaksir pengaruh-pengaruh variabel bebas x terhadap variabel respon y (Johnson
& Wichern, 2007).
Regresi logistik ordinal adalah perluasan dari regresi logistik biner dimana regresi
logistik ordinal merupakansalah satu metode statistika untuk menganalisis data dengan
variabel respon merupakan skala ordinal yang terdiri dari tiga kategori atau lebih dan
variabel prediktor merupakan covariate (jika menggunakan skala interval atau rasio) atau
bisa merupakan faktor (jika menggunakan skala nominal atau ordinal) (Iban, 2017).

Schaefer (1986) dalam jurnalnya “Alternative Estimators in Logistic Regression


when the Data are Collinear” menyatakan bahwa dalam banyak penerapan regresi logistik
terdapat situasi dimana variabel-variabel independennya mengalami kolinearitas. Hal
tersebut berdampak serius terhadap estimator conditional maximum likelihood. Disebutkan
variansi dari estimator tersebut meningkat drastis dan begitu pula variansi dari estimator
kuadrat terkecil pada regresi linear ganda. Schaefer memberikan beberapa estimator
alternatif dengan menggunakan kesamaan antara regresi linear ganda dan regresi logistik
ganda, salah satunya adalah estimator komponen utama.

Isnadia (2012) dalam skripsinya yang berjudul “Penduga Penalti Ganda Likelihood
dalam Model Regresi Logistik” juga mencari solusi terhadap multikolinearitas pada regresi
logistik. Pada skripsi tersebut dijelaskan estimasi regresi logistik ganda dengan Newton-
Raphson, dijelaskan pula multikolinearitas, pengaruhnya terhadap regresi logistik, serta
cara pemeriksaannya.

Aguilera dkk. (2006) dalam jurnalnya “Using Principal Components for Estimating
Logistic Regression with High-Dimensional Multicollinear Data” juga 4 menjelaskan
estimasi komponen utama pada regresi logistik secara lebih lengkap. Pada jurnal ini
dijelaskan cara mendapatkan komponen utama dengan matriks kovarian, formulasi model,
hingga diperoleh nilai estimator komponen utama tersebut.

2.2 Bentuk Umum


Langkah- langkah untuk menduga model logistik ordinal sama saja dengan
multinomial. Akan tetapi, pada model logistik ordinal, langkah keduanya menggunakan
MLE. Berikut penjelasannya:
Langkah pertama ialah menguji asumsi multikolinearitas. Uji yang digunakan
untuk mengetahui ada tidaknya multikolonearitas ialah uji khi- kuadrat Pearson. Besarnya
nilai p yang dihasilkan dari uji khi- kuadrat Pearson dapat mengindikasikan adanya
multikolinearitas. Jika nilai p > α artinya tidak terjadi multikolinearitas. Jika 𝐻𝑜 benar,
2
statistika uji 𝑋𝑃𝑒𝑎𝑟𝑠𝑜𝑛 :

2
Ketika P [{𝑋 2 | > 𝑋𝑃𝑒𝑎𝑟𝑠𝑜𝑛 ] < α, menunjukkan bahwa antar peubah penjelas terdapat
multikolinearitas yang merupakan suatu masalah, karena akan sulit mengetahui pengaruh
masing- masing peubah penjelas terhadap peubah respon (Sari, 2013).
Langkah pertama model logistik ordinal sama dengan multinomial, namun langkah
keduanya menggunakan MLE untuk model logistik ordinal. Langkah kedua model logistik
ordinal berbeda dengan multinomial (Sari, 2013).
Pada model logit sifat ordinal dari respon Y dituangkan dalam peluang kumulatif.
Jika variabel respon Y memilih J buah kategori berskala ordinal dan 𝑋𝑖 menyatakan vektor
variabel prediktor sebanyak p, maka 𝑋𝑖 =(𝑋𝑖1 𝑋𝑖2 . . . 𝑋𝑖𝑝 )𝑇 dan 𝑋 =(𝑋1 𝑋2 . . . 𝑋𝑝 )𝑇 dengan
i= 1,2 ... n. Sehingga peluang kumulatif ke j dapat dinyatakan:

Apabila peluang kurang dari atau sama dengan kategori respon ke- j dibandingkan dengan
peluang lebih besar dari kategori respon ke-j, maka diperoleh hasil sebagai berikut:

Maka model regresi logistik (logit) ordinal/ logit kumulatif adalah:


P(𝑌𝑖 ≤j| 𝑋𝑖 )= 𝜋𝑗 (𝑋𝑖 ) merupakan peluang kumulatif dari kejadian (𝑌𝑖 ≤ f), 𝛽𝑜𝑗 merupakan
parameter intersep yang tidak diketahui dan memenuhi kondisi 𝛽𝑜1 ≤ 𝛽02 ≤ ... ≤ 𝛽0,𝐽−1
dan Β= (𝛽1 , 𝛽2 , . . . , 𝛽𝑝 )𝑇 merupakan vektor koefisen regresi yang tidak diketahui yang
bersesuaian dengan 𝑋𝑖 . Peluang masing masing J kategori respon dapat dinyatakan sebagai
berikut:

Bila suatu variabel respon terdiri dari 3 kategori, maka model regresi logistik ordinal yang
terbentuk adalah sebagai berikut:

Dimana,

Dari kedua peluang kumulatif tersebut, maka bisa didapatkan peluang dari masing- masing
kategori variabel respon sebagai berikut
Nilai klasifikasi pada persamaan tersebut akandijadikan pedoman untuk
pengklasifikasian. Suatu pengamatan akan masuk dalam respon kategori j berdasarkan
nilai 𝜋𝑗 (𝑋𝑖 ) yang terbesar (Putranto & Mashuri, 2012).
2.3 Contoh Penerapan
Contoh penerapan regresi logistik ordinal adalah studi akreditasi SMA di sebuah
provinsi. Sertifikat akreditasi sekolah memuat nilai masing-masing komponen (dalam
angka) dan peringkat/status akreditasi sekolah yang dinyatakan dengan huruf A (amat
baik), B (baik), dan C (cukup). Ditinjau dari skala data, peringkat/status akreditasi
merupakan data dengan skala ordinal. Oleh karena itu, penentuan peringkat/status ini
adalah klasifikasi data yang bersifat ordinal. Salah satu metode statistika yang dapat dipakai
untuk klasifikasi data yang bersifat ordinal adalah regresi logistik ordinal. Sebagai variabel
respon adalah peringkat atau status akreditasi yaitu:

1=C

2=B

3=A

sedangkan sebagai variabel prediktor atau independen adalah aspek-aspek yang terdapat
dalam profil sekolah yaitu:
1. Status sekolah (0=swasta, 1=negeri)
2. Lama berdiri sekolah
3. Jumlah siswa
4. Jumlah guru
5. Jumlah alumni yang diterima di dunia usaha dan industri setahun terakhir
6. Nilai rata-rata jumlah ujian nasional sekolah setahun terakhir
2.4 Contoh dalam SPSS
Contoh kasus : Seorang dosen ingin mengetahui hubungan antara gender dan minat belajar
di sebuah universitasnya. Variabel independen terdiri dari gender dan nilai prestasi
sedangkan variabel dependen (Y) adalah minat belajar yang diukur dalam 3 tingkatan yaitu
rendah, sedang dan tinggi.
Langkah-langkah analisis regresi ordinal :
1. Analyze >> Regression >> Ordinal
2. Masukan variabel Minat belajar ke kotak Dependent, Gender ke kotak Factor(s) dan
Nilai prestasi ke Covariate.
Menu Regresi Ordinal

3 Pilih Option. Kita pilih Link logit. Klik Continue.

Ordinal Regression Option

4. Pilih Output dan tik kotak Predicted category, Estimated response


probabilities dan Test of parallel lines. Klik Continue.
Ordinal Regression Output

5. Klik OK

Hasil Output seperti di bawah ini.

Model Fitting Information

Pada Model Fitting Information -2log Likelihood menerangkan bahwa tanpa


memasukkan variabel independen (intercept only) nilainya 522.977. Namun dengan
memasukkan variabel independen ke model (final) terjadi penurunan nilai menjadi
505.167. Perubahan nilai ini merupakan nilai chi-square yaitu 17,808 dan signifikan
pada taraf nyata 5% (sig.0.00).

Goodness of fit
Tabel Goodness of Fit menunjukkan uji kesesuaian model dengan data. Nilai Pearson
sebesar 317,892 dengan signifikansi 0,991 (> 0,05) dan Deviance sebesar 350,797
dengan signikansi 0,856 (> 0,05). Hal ini berarti model sesuai dengan data empiris atau
model layak digunakan.

Pseudo R-Square

Tabel Pseudo R-Square menunjukkan bahwa seberapa besar variabel bebas (gender
dan nilai prestasi) mampu menjelaskan variabel independen (minat belajar). Nilai ini
seperti halnya koefesien determinasi pada regresi. Nilai Cox and Snell sebesar 0,044
(4,4%) dan Nagelkerke sebesar 0,052 (5,2%).

Parameter Estimates

Tabel Parameter Estimate di atas, perhatikan nilai Wald dan nilai signifikansinya.
Variabel nilai prestasi sebesar 6.177 dengan sig. 0,013 (< 0,05) dan variabel gender
sebesar 9,163 dengan sig.0,02 (< 0,05). Hal ini menunjukkan faktor nilai prestasi dan
gender berpengaruh terhadap minat belajar.

Test of Parallel Lines


Tabel Test of Parallel Lines digunakan untuk menguji asumsi bahwa setiap kategori
memiliki parameter yang sama atau hubungan antara variabel independen dengan logit
adalah sama untuk semua persamaan logit. Oleh karena nilai signifikansi 0,648 (>
0,05), maka terima H0 bahwa model yang dihasilkan memiliki parameter yang sama
sehingga pemilihan link function adalah sesuai. Namun sebaliknya bila asumsi ini tidak
terpenuhi, maka pemilihan link function logit tidak tepat.
BAB III
PENUTUP
3.1 Kesimpulan
Analisis regresi merupakan metode statistika yang digunakan untuk meramalkan
sebuah variabel respon y dari satu atau lebih variabel bebas x, selain itu juga digunakan
untuk menaksir pengaruh-pengaruh variabel bebas x terhadap variabel respon y. Regresi
logistik ordinal adalah perluasan dari regresi logistik biner dimana regresi logistik ordinal
merupakansalah satu metode statistika untuk menganalisis data dengan variabel respon
merupakan skala ordinal yang terdiri dari tiga kategori atau lebih dan variabel prediktor
merupakan covariate (jika menggunakan skala interval atau rasio) atau bisa merupakan
faktor (jika menggunakan skala nominal atau ordinal).

Penerapan regresi logistik terdapat situasi dimana variabel-variabel independennya


mengalami kolinearitas. Hal tersebut berdampak serius terhadap estimator conditional
maximum likelihood. Disebutkan variansi dari estimator tersebut meningkat drastis dan
begitu pula variansi dari estimator kuadrat terkecil pada regresi linear ganda. Schaefer
memberikan beberapa estimator alternatif dengan menggunakan kesamaan antara regresi
linear ganda dan regresi logistik ganda, salah satunya adalah estimator komponen utama.
Daftar Pustaka

Draper, N.R. and Smith, H. 1998. Applied Regression Analysis,Second Edition. John Wiley
and sons, Inc. New York.
Hosmer, D.W. dan S. Lemeshow, (2000) : Applied Logistic Regression. Second Edition, John
Willey & Sons, New York.
Iban, Marius. 2017. Perbandingan Regresi Logistik Ordinal Model Logit dan Model Probit
pada Analisis Pengaruh Faktor Ibu Terhadap Bayi Berat Rendah (BBLR). Skripsi.
Universitas Airlangga: Surabaya.
Johnson, R. A. and Wichern, D. W. 2007. Applied Multivariate Analysis, Third Edition,
Prentice Hall Inc, New Jersey.
Kutner, M.H., C.J. Nachtsheim dan J. Neter. 2004. Applied Linear regression Models. Fourth
Ed. The McGraw-Hill Company, Inc. New york.
Putranto, R. T., dan Muhammad M. 2012. Analisis Statistik tentang Faktor- Faktor yang
Mempengaruhi Waktu Tunggu Kerja Fresh Graduate di Jurusan Statistika Institut
Teknologi Sepuluh Nopember (ITS) dengan Metode Regresi Logistik Ordinal. JURNAL
SAINS DAN SENI ITS. Vol. 1: No.1.
Sari, V. N., Eni, S., dan Maria, B.2013. Pemilihan Model Regres Logistik Multinomial dan
Ordinal Terbaik Berdasarkan 𝑅 2 MC. FADDEN. Indonesia:UB
Sukoco, Agus dan Soenbandhi, Satirianingrum. 2012. Modul 2 : Statistik dan Statistika.
Indonesia: Fakultas Ekonomi.