Anda di halaman 1dari 20

REGRESI LOGISTIK ORDINAL

BAB I
PENDAHULUAN

Seiring dengan perkembangan zaman, era reformasi terus bergulir


beriringan dengan waktu yang terus berlalu. Perkembangan ilmu pengetahuan dan
teknologi semakin maju. Salah satu ilmu pengetahuan yang berkembang adalah
statistika yang tanpa disadari dalam kehidupan sehari-hari sesungguhnya telah
banyak digunakan walaupun dalam bentuk yang sangat sederhana baik di rumah, di
kantor, maupun di tempat lain. Statistika adalah pengetahuan yang berkaitan
dengan metode, teknik, atau cara untuk mengumpulkan data, mengolah data,
menganalisis data, dan menarik kesimpulan atau menginterpretasikan data.
Statistika memegang peranan yang penting pada aspek perencanaan dalam
mengambil suatu keputusan dan membantu peneliti dari berbagai disiplin ilmu
untuk merancang studi, mengumpulkan dan mengolah data serta menarik
kesimpulan berdasarkan hasil studinya. Statistika berkembang dengan pesat, salah
satunya adalah analisis regresi yaitu analisis yang berkaitan dengan hubungan antar
variabel.
Analisis regresi merupakan salah satu analisis yang digunakan untuk
mengetahui hubungan antara variabel respon atau biasa disebut dengan variabel
dependen terhadap satu atau lebih variabel prediktor atau variabel independen
(bebas). Atau dengan kata lain, metode regresi merupakan analisis data yang
mendeskripsikan antara sebuah variabel respon dan satu atau lebih variabel penjelas
(Homes dan Lemeshow, 2000).
Untuk beberapa kasus yang biasanya terjadi dalam kehidupan ini, tidak serta
merta dapat dimodelkan atau dapat langsung dianalisis dengan analisis regresi
linear sederhana. Berbagai cara pemodelan yang dapat digunakan dalam analisis
regresi namun penggunaan terhadap suatu data haruslah sesuai dengan kasus yang
diperoleh sehingga dalam penginterpretasian model dapat mewakili data yang
diperoleh tersebut.
Umumnya, banyak penelitian yang menggunakan analisis regresi dalam
penelitiannya. Biasanya dengan variabel dependen yang merupakan skala kontinyu
ataupun rasio. Dalam penyusunan instrument penelitian, harus mengetahui dan
paham tentang jenis skala pengukuran agar instrumen bisa diukur sesuai apa yang
hendak diukur dan bisa dipercaya.
Maksud dari skala pengukuran ini untuk mengklasifikasikan variabel yang
akan diukur supaya tidak terjadi kesalahan dalam menentukan analisis data dan
langkah penelitian selanjutnya. Jenis-jenis skala pengukuran ada empat yaitu skala
nominal, skala interval, skala ordinal, dan skala rasio (Riduwan dan Akdon, 2010).
Dalam regresi, apabila pada variabel respon tersebut menggunakan skala
nominal atau ordinal maka analisis regresi tersebut yang dikenal sebagai analisis
regresi logistik. Tergantung bagaimana dan berapa jenis kategorik yang digunakan.
Berdasarkan jenis skala data variabel respon yang digunakan dibagi menjadi 3
macam yaitu regresi logistik biner, regresi logistik multinomial, dan regresi logistik
ordinal (Wulandari, dkk. 2009).
Regresi logistik adalah regresi dimana variabel terikatnya adalah dummy
yaitu 1 dan 0. Analisis regresi ordinal merupakan suatu analisis atau metode
statistika untuk menganalisis variabel respon yang mempunyai skala data ordinal
yang terdiri dari tiga kategorik atau lebih. Variable prediktor yang digunakan dalam
model berupa data kategorik atau data kontinyu.
Menurut Hosmer dan Lemeshow (2000), salah satu metode regresi yang
tepat digunakan untuk variabel respon berskala ordinal yaitu regresi logistik
ordinal. Banyak penelitian yang menggunakan metode regresi logistik ordinal yang
menghubungkan antara variabel respon berskala ordinal dengan variabel prediktor
yang berupa data kategorik atau kuantitatif.
Berdasarkan penjabaran yang telah dijelaskan, terdapat berbagai contoh
data yang telah diteliti sebelumnya. Penelitian semacam ini dimaksudkan guna
memperoleh kisaran kesuksesan dan kegagalan suatu terapan data dengan
menggunakan regresi logistik ordinal tersebut. Penerapan yang biasa kita temui
dalam lingkungan keseharian meliputi pengkategorian suatu data terhadap apa yang
akan diteliti. Salah satu penerapannya yaitu pada bidang pendidikan.
Dalam rangka mewujudkan tujuan nasional di bidang pendidikan maka
pemerintah berupaya meningkatkan kualitas pendidikan dengan mengeluarkan PP
No.19 Tahun 2005, tentang Standar Nasional Pendidikan (SNP) diantaranya yaitu
sistem evaluasi. yaitu mencakup pencapaian Standar Kompetensi Lulusan (SKL).
Pencapaian Standar Kompetensi Lulusan (SKL) dapat diukur dengan nilai
ujian nasional. Hal ini sesuai dengan Peraturan Menteri Pendidikan nomor 34
tahun 2007, bahwa ujian nasional adalah kegiatan pengukuran dan penilaian
kompetensi peserta didik secara nasional untuk jenjang pendidikan dasar dan
menengah yang bertujuan untuk menilai pencapaian kompetensi lulusan secara
nasional pada mata pelajaran yang ditentukan dari kelompok mata pelajaran ilmu
pengetahuan dan teknologi, dalam rangka pencapaian standar nasional. Hasil ujian
nasional digunakan sebagai salah satu pertimbangan untuk penentuan kelulusan
peserta didik dari suatu satuan pendidikan, seleksi masuk jenjang pendidikan
berikutnya, pemetaan mutu satuan atau program pendidikan, akreditasi satuan
pendidikan serta pembi-naan dan pemberian bantuan kepada satuan pendidikan
dalam upaya pening-katan mutu pendidikan.
BAB II
TINJAUAN PUSTAKA

2.1 Regresi Logistik Ordinal


Regresi logistik digunakan jika variabel terikatnya Y  berupa variabel
kategori klasifikasi. Perbedaan antara regresi linear dengan regresi logistik adalah
jika regresi linear merupakan suatu metode statistik yang menganalisis hubungan
antara variabel respon dengan variabel prediktor. Selain itu, variabel responnya
berskala interval atau rasio. Persamaan umumnya adalah sebagai berikut:
Y  x   (2.1)
Di mana errornya berdistribusi normal dengan meannya nol dan variansinya
konstan. Sedangkan regresi logistik merupakan suatu metode statistik yang
bertujuan menganalisis variabel respon untuk memperoleh hubungan antara
variabel prediktor dengan probabilitas dari suatu kejadian yang diakibatkan oleh
variabel prediktor. Variabel responnya biasanya berskala ordinal atau nominal,
sedangkan variabel prediktornya bisa diskrit atau kontinyu.
Regresi logistik untuk respon berskala nominal dapat dibedakan menjadi
dua, yaitu regresi logistik biner (binary logistic regression) dan regresi logistik
multinomial (multinomial logistic regression). Regresi logistik biner digunakan
ketika hanya ada dua kemungkinan variabel respon Y  , misal membeli dan tidak
membeli. Sedangkan regresi logistik multinomial digunakan ketika pada variabel
respon Y  terdapat lebih dari dua kategori.
Model logit kumulatif pertama kali diperkenalkan oleh Walker dan Duncan
(1967) dan kemudian disebut model odds proporsional (proportional odds model)
oleh McCullagh (1980). Jika variabel prediktor 𝒙 = (𝑥1 𝑥2 ⋯ 𝑥𝑝 )𝑇 , maka peluang
kumulatif logit didefinisikan (Agresti, 2002) sebagai
𝑃(𝑌 ≤ ⃓𝑥
𝑗 ) = 𝜋1 (𝑥 ) + 𝜋2 (𝑥) + ⋯ + 𝜋𝑗 (𝑥), 𝑗 = 1, 2, ⋯ , 𝐽
Kumulatif logit didefinisikan sebagai
𝑃 (𝑌 ≤ ⃓
𝑗𝑥 ) 𝑃(𝑌 ≤ ⃓𝑥
𝑗 )
𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ ⃓
𝑗𝑥 ) = ln [ ] = ln [ ]
1 − 𝑃 (𝑌 ≤ ⃓
𝑗𝑥 ) 𝑃(𝑌 > ⃓𝑥
𝑗 )
𝜋1 (𝑥) + 𝜋2 (𝑥 ) + ⋯ + 𝜋𝑗 (𝑥 )
= ln [ ], 𝑗 = 1, 2, ⋯ , 𝐽
𝜋𝑗=1 (𝑥 ) + 𝜋𝑗=2 (𝑥 ) + ⋯ + 𝜋𝑗 (𝑥 )

Anggap suatu variabel respon multinomial Y dengan keluaran kategori yang


dinyatakan oleh 1,2,...,J dan misalkan x menyatakan suatu vektor kovariat
berdimensi p. Dependensi peluang kumulatif Y terhadap x untuk model
proportional odds sering dinyatakan dalam bentuk
𝑃 (𝑌 ≤ ⃓
𝑗𝑥 )
ln [ ] = 𝛽0𝑗 + 𝛽 𝑇 𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1
𝑃 (𝑌 > ⃓
𝑗𝑥 )
Persamaan di atas dapat diubah dalam bentuk
𝜋1 (𝑥 ) + 𝜋2 (𝑥 ) + ⋯ + 𝜋𝑗 (𝑥 )
ln [ ] = 𝛽0𝑗 + 𝛽 𝑇 𝑥, 𝑗 = 1, 2, ⋯ , 𝐽 − 1
𝜋𝑗=1 (𝑥 ) + 𝜋𝑗=2 (𝑥) + ⋯ + 𝜋𝑗 (𝑥)
Model yang secara simultan menggunakan semua kumulatif logit (Agresti, 2002)
adalah
𝑗𝑥 )] = 𝛽0𝑗 + 𝛽 𝑇 𝑥,
𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ ⃓ 𝑗 = 1, 2, ⋯ , 𝐽 − 1
𝛾𝑗 (𝑥 ) = 𝑃(𝑌 ≤ ⃓
𝑗𝑥 ) merupakan peluang kumulatif dari kejadian (𝑌 ≤ 𝑗).
{𝛽01 , 𝛽02 , ⋯ , 𝛽0𝐽−1 } meruapakan parameter intersep yang tidak diketahui yang
𝑇
memenuhi kondisi 𝛽01 ≤ 𝛽02 ≤ ⋯ ≤ 𝛽0𝐽−1 dan 𝜷 = (𝛽1 , 𝛽2 , ⋯ , 𝛽𝑝 ) merupakan
vektor koefisien regresi yang tidak diketahui yang bersesuaian dengan x.
Jika 𝛾𝑗 (𝑥 ) = 𝜋1 (𝑥 ) + 𝜋2 (𝑥 ) + ⋯ + 𝜋𝑗 (𝑥 ) maka 𝛾1 (𝑥 ) = 𝜋1 (𝑥), 𝛾2 (𝑥 ) =
𝜋1 (𝑥 ) + 𝜋2 (𝑥) dan 𝛾𝐽 (𝑥 ) = 𝜋1 (𝑥 ) + 𝜋2 (𝑥 ) + ⋯ + 𝜋𝐽 (𝑥 ) = 1. Model regresi
logistik ordinal yang terbentuk jika terdapat J kategori respon adalah

𝛾1 (𝑥 )
𝑙𝑜𝑔𝑖𝑡 𝛾1 (𝑥 ) = ln [ ] = 𝛽01 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑝 𝑥𝑝
1 − 𝛾1 (𝑥 )
𝛾2 (𝑥 )
𝑙𝑜𝑔𝑖𝑡 𝛾2 (𝑥 ) = ln [ ] = 𝛽02 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑝 𝑥𝑝
1 − 𝛾2 (𝑥)

𝛾𝐽−1 (𝑥 )
𝑙𝑜𝑔𝑖𝑡 𝛾𝐽−1 (𝑥 ) = ln [ ] = 𝛽0,𝐽−1 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑝 𝑥𝑝
1 − 𝛾𝐽−1 (𝑥 )
exp(𝛽0𝑗 + 𝛽𝑇 𝑥)
dimana 𝛾𝑗 (𝑥 ) = 𝑃(𝑌 ≤ ⃓
𝑗𝑥 ) = , 𝑗 = 1, 2, ⋯ , 𝐽 − 1 𝑑𝑎𝑛 𝛾𝑗 (𝑥 ) = 1
1− exp(𝛽0𝑗 + 𝛽𝑇 𝑥)

Model ini disebut model logistik kumulatif karena rasio odds dari suatu kejadian
(𝑌 ≤ 𝑗) adalah independen pada setiap indikator kategori.
Selanjutnya untuk mendapatkan pendugaan parameter regresi logistik
ordinal dapat diperoleh dengan menggunakan metode pendugaan maximum
likelihood estimation ( MLE). Metode MLE dipilih karena mempunyai beberapa
kelebihan dibandingkan dengan metode lain, diantaranya dapat digunakan untuk
model tidak linier seperti regresi logistik, serta hasil penaksirannya unbiased
(Hosmer dan Lemeshow, 2000).
Pendugaan parameter regresi logistik ordinal didapatkan dengan
menurunkan fungsi log likelihood terhadap parameter yang akan diestimasi dan
𝜕 𝐿(𝛽)
disamakan dengan nol. Persamaan = 0 digunakan untuk menaksir intersep
𝜕 𝛽𝑘

𝜕 𝐿(𝛽)
parameter 𝛽𝑘 dimana 𝑘 = 1, 2, ⋯ , 𝑝 dan = 0 dipergunakan untuk menaksir
𝜕 𝛽0𝑗

intersep 𝜃𝑗 𝑑𝑖𝑚𝑎𝑛𝑎 𝑗 = 1, 2, ⋯ , 𝐽 − 1.
𝜕 𝐿(𝛽) 𝜕 𝐿(𝛽)
Hasil dari persamaan = 0 dan = 0 merupakan fungsi nonlinear
𝜕 𝛽𝑘 𝜕 𝛽0𝑗

sehingga diperlukan metode iterasi untuk memperoleh estimasi parameternya.


Metode iterasi yang dipergunakan adalah metode iterative Weighted Least Square
(WLS) yaitu algoritma Newton-Raphson. Iterasi akan berhenti jika terpenuhi
kondisi konvergen, yaitu selisih ‖𝛽 (𝑡+1) − 𝛽 𝑡 ‖ ≤ 𝜀, dimana 𝜀 adalah bilangan
yang sangat kecil.

2.2. Odds Ratio


Odds ratio ( ) adalah ukuran asosiasi yang menggambarkan seberapa
besar kemungkinan untuk income itu terjadi. Odds ratio digunakan untuk
interpetasi parameter, bertujuan untuk menentukan hubungan fungsional antara
variabel prediktor dangan variabel respon dan menentukan unit perubahan dalam
variabel prediktor, interpertasi model logit tergantung pada jenis variabel
prediktornya. Interpertasi dari model diskrit adalah sebagai berikut (Hosmer and
Lemeshow, 1989).
a. Variabel Prediktor Dikatomus
Variabel prediktor dengan dua kategori yang dinotasikan dengan kategori X2 dan
X1 disebut variabel prediktor dikatomus, pada variabel prediktor kategori X 2
dibandingkan dengan kategori X1 dirumuskan sebagai berikut.

 P(Y  j / X  x2 
 
 j / X  x2 

P(Y
 (X 2 X1 )
 P(Y  j / X  x1 
 
 P(Y  j / X  x1 
= exp 1 ( x2  x1 

Log dari odds ratio adalah sebagai berikut.


ln  x2 ; x1   ln exp 1 ( x2  x1 ) = 1 x2  x1 
Interpertasi persamaan adalah jika suatu respon yang jatuh pada kategori lebih kecil
atau sama dengan j dibandingkan dengan respon yang jatuh pada kategori j+1 untuk
X=x2 adalah sebesar 1 x2  x1  kali dari X=x1.
b. Variabel Prediktor Polikatomus
Variabel prediktor dengan kategori lebih dari dua disebut variabel prediktor
polikatomus, seperti halnya pada variabel prediktor dikatomus nilai odds ratio salah
satu kategori dijadadikan pembanding. Perhitungan dan interpertasinya sama
dengan variabel dikatomus.
c. Variabel Prediktor Kontinyu
Interpertasi dari variabel kontinyu secara matematis dapat dituliskan sebagai
berikut.
g ( x)   0  1 x
dimana
1  g ( x  1)  g ( x) dan s1  g ( x  s)  g ( x) .
Berdasarkan bentuk matematis maka perubahan satu unit pada variabel
prediktor akan memberikan perubahan pada g(x) sebesar 𝛽1 , apabila pada variabel
prediktor terjadi perubahan sebesar s unit akan memberikan perubahan pada g(x)
sebesar s 1 .
Model logistik ordinal yang telah diperoleh perlu diuji kesesuaiannya.
Pengujian yang dilakukan adalah sebagai berikut.

Uji Univariabel (Parsial)


Hipotesis pengujian ini adalah
𝐻𝑜 ∶ 𝛽𝑘 = 0
𝐻1 ∶ 𝛽𝑘 ≠ 0 , 𝑘 = 1, 2, ⋯ , 𝑝
̂ 2
𝛽
Statistik uji yang digunakan adalah statistik Wald : 𝑊𝑘2 = (𝑆𝐸(𝛽
𝑘
̂) 𝑘

Daerah penolakan;
2
𝐻𝑜 ditolak bila 𝑊𝑘2 > 𝜒(𝛼,1) atau p-value kurang dari α

Uji Multivariabel (Serentak)


Hipotesis pengujian ini adalah
𝐻𝑜 ∶ 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑝 = 0
𝐻1 ∶ 𝑃𝑎𝑙𝑖𝑛𝑔 𝑠𝑒𝑑𝑖𝑘𝑖𝑡 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑘 ≠ 0, 𝑘 = 1, 2, ⋯ , 𝑝
Statistik uji yang digunakan statistik uji 𝐺 2 atau Likelihood Ratio Test;
ℓ0
𝐺 = −2 ln ( ) = −2 (𝐿0 − 𝐿1 )
ℓ1
Dimana ℓ0 = nilai yang dimaksimalkan dari fungsi likelihood di bawah 𝐻0
ℓ1 = nilai yang dimaksimalkan secara keseluruhan (𝐻0 ∪ 𝐻1 )
Daerah penolakan;
2
𝐻0 ditolak bila 𝐺 > 𝜒(𝛼,𝑝) dimana p menunjukkan nilai variabel random pada tabel
distribusi chi-square pada derajat bebas p.

Uji Kesesuaian Model


Setelah dilakukan pengujian parameter secara serentak dan parsial, selanjutnya
dilakukan pengujian terhadap kebaikan model yang telah dibentuk. Hipotesis yang
digunakan sebagai berikut.
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi)
α = 5%
Statistik uji Deviance:
𝑛
𝜋̂𝑖𝑗 1 − 𝜋̂𝑖𝑗
𝐷 = −2 ∑ [𝑦𝑖𝑗 ln ( ) + (1 − 𝑦𝑖𝑗 ) ln ( )]
𝑦𝑖𝑗 1 − 𝑦𝑖𝑗
𝑖=1

Tolak H0 jika p-value kurang dari α.

Uji Parallel Lines


Pada saat membuat model regresi logistik ordinal, diasumsikan bahwa
hubungan antara variabel independen dengan logit adalah sama untuk semua logit.
Ini berarti bahwa hasil model berupa sebuah garis paralel untuk setiap kategori
variabel respon. Untuk membuktikannya dapat menggunakan Test of parallel lines,
dimana uji tersebut digunakan untuk membuktikan terpenuhinya asumsi bahwa
setiap kategori memiliki hubungan antara variabel independen dengan logit yang
sama untuk semua persamaan logit. Jika nilai signifikansi > α, maka hasil
menyatakan bahwa model yang dihasilkan memiliki parameter yang sama sehingga
pemilihan model link function logit adalah sesuai. Namun jika nilai signifikansi
kurang dari α maka pemilihan link function logit tidak tepat dan analisis pada data
cukup menggunakan regresi logistik multinomial.
Untuk model regresi logistik ordinal yang telah terbentuk sebelumnya,
pengujian parallel lines dilakukan dengan hipotesis sebagai berikut.
H0 : hubungan antara variabel independen dengan logit sama untuk semua
persamaan logit
H1 : hubungan antara variabel independen dengan logit tidak sama untuk semua
persamaan logit
α = 5%

Kekuatan Asosiasi
Ada beberapa R2 yang dapat digunakan untuk mengukur kekuatan asosiasi
antara variabel dependen dengan variabel prediktor. R2 yang dimaksud disini tidak
sepenting pada regresi biasa, karena interpretasi R2 pada regresi logistik tidak kaku
seperti pada regresi biasa. Pengukuran kekuatan asosiasi pada pembahasan ini
menggunakan 3 metode, yaitu sebagai berikut.
1. Cox danSnell R2
2

2
𝐿(𝑩(0) ) 𝑛
𝑅𝐶𝑆 =1−( )
̂)
𝐿(𝑩
2. Nagelkerke’s R2
2
𝑅𝐶𝑆
𝑅𝑁2 = 2
1 − 𝐿(𝐵(0) )𝑛
3. McFadden’s R2
̂)
𝐿(𝑩
2
𝑅𝐶𝑆 =1−( )
𝐿(𝑩(0) )
Dimana
̂
𝐿(𝑩 ) : fungsi log-likelihood model dengan estimasi parameter.
𝐿(𝑩(0) ) : fungsi log-likelihood dengan hanya memuat thresholds.
n : banyaknya kasus

Pengujian Signifikansi Hasil Pendugaan Parameter


Pengujian terhadap parameter model dilakukan untuk memeriksa pengaruh dari
variabel prediktor terhadap respon. Pengujian dilakukan dengan menggunakan
statistik uji Wald (Hosmer dan Lemeshow, 1989:20).
Hipotesis dari pengujian ini adalah :
H 0 : c  0

H 1 : paling sedikit ada satu   0, c  1,2,..., p


c

ˆc
Statistik ujinya : W 
 
SE ˆc
Statistik uji Wald untuk jumlah sampel besar mengikuti distribusi normal
standart dengan mean 0 dan varians 1. Jika uji Wald ini dikuadratkan, maka akan
didapatkan uji W 2 yang mengikuti distribusi Chi-Square dengan derajat bebas 1
untuk sampel besar juga (Hosmer dan Lemeshow, 1989:21).
Daerah penolakannya adalah jika W  Z a atau jika dapat pula dilihat dari nilai p,
2

bila nilai P   yang ditetapkan maka tolak H 0 .


BAB III
STUDI KASUS

Data yang digunakan dalam tugas ini adalah data dari tesis Jumaidin yang
berjudul “FAKTOR-FAKTOR YANG MEMPENGARUHI NILAI UNAS
DENGAN ANALISIS REGRESI LOGISTIK ORDINAL DAN REGRESI
PROBIT ORDINAL (Studi Kasus: Nilai UNAS SMA Negeri 2 Amahai
Kabupaten Maluku Tengah)” yang merupakan data sekunder pada tahun
pembelajaran 2007/2008 yang terdiri:

1. Jurusan Ilmu Pengetahuan Alam (IPA) sebanyak 19 orang


2. Jurusan ilmu Pengetahuan Sosial (IPS) sebanyak 42 orang

Variabel Respon (Y) adalah nilai UNAS SMA dengan tiga kategori yaitu
UNAS  65 Cukup (0), 65 <UNAS < 75 Baik (1) dan UNAS  75 amat baik
(2), hal ini sesuai dengan pengkategorian rata-rata nilai UNAS tiap mata pelajaran
oleh Dinas Pendidikan Propinsi Maluku. Adapun variabel-variabel yang diduga
mempengaruhi probabilitas seorang siswa bernilai kategori cukup, baik dan amat
baik adalah rata-rata nilai UNAS SMP (X1), rata-rata nilai UAS (X2), rata-rata nilai
tryout (X3), rata-rata nilai raport SMA (X4), pendapatan orang tua (X5), jumlah
saudara (X6) dan jurusan yang diambil siswa (X7).
Metode yang digunakan dalam penelitian ini untuk mencapai tujuan
penelitian adalah mengkategorikan variabel respon dengan tiga kategori yaitu Y =
0, Y = 1 dan Y = 2, membuat model regresi logistik ordinal untuk mengetahui ada
tidaknya pengaruh dari setiap variabel bebas terhadap variabel respon.
BAB IV
PEMBAHASAN

Statistika Deskriptif dan Estimasi Parameter


Nilai UNAS SMA Negeri 2 Amahai dibedakan menjadi tiga predikat
(kategori) diantaranya cukup baik (y = 0), baik (y = 1) dan sangat baik (y = 2). Dari
61 siswa, 9,8 persen memiliki nilai UNAS yang sangat baik dan 47,6 persen
terbilang baik, sedangkan sisanya yaitu sebesar 42,6 persen menyandang predikat
cukup baik. Secara ringkas, informasi responden tersebut ditunjukkan pada Gambar
1.

Amat Baik
10%

Cukup
Baik
43%
Baik
47%

Gambar 1. Informasi Responden Berdasarkan Nilai UNAS

Dalam setiap analisis regresi, penentuan variabel prediktor yang memiliki


pengaruh signifikan terhadap variabel respon sangat perlu untuk diketahui, yaitu
dengan cara meregresikannya kemudian dilakukan pengujian. Adapun model
regresi logistik ordinal yang terbentuk adalah sebagai berikut.
  
Logit ( 1 )  log  1   274.62  20,909 X1  13,169X 2 - 1,695X 3 - 0,877X 4  0,803X 5 
1 1 
 1,22 X 6 - 1,347 7 (0)
 2 
Logit ( 2 )  log    304.061  20,909 X1  13,169X 2 - 1,695X 3 - 0,877X 4  0,803X 5 
1  2 
 1,22 X 6 - 1,347X 7 (0)

Ketujuh variabel dalam model logit tersebut kemudian dilakukan pengujian


kebermaknaan atau uji signifikansi untuk diketahui apakah variabel-variabel
tersebut memiliki pengaruh signifikan terhadap nilai UNAS di SMAN 2 Amahai.
Pengujian dilakukan secara serentak dan kemudian secara parsial. Hipotesis dalam
pengujian serentak pada kasus ini diantaranya sebagai berikut.
H0 : β1 = β2 =... = β7 = 0
H1 : paling sedikit ada satu  k  0 , dimana k=1,2,…,7

Tabel 1 Pengujian Signifikansi Variabel Prediktor Terhadap Respon Secara Serentak


-2 Log
Model Chi-Square df Sig.
Likelihood
Intercept Only 115,301
Final 0 115,301 7 0,000

Berdasarkan Tabel 1, diperoleh penurunan nilai chi-square sebesar 115,301


dan signifikan pada taraf nyata 5%. Hal ini berarti bahwa terjadi tolak H 0 atau
terdapat paling sedikit satu variabel yang berpengaruh signifikan terhadap nilai
UNAS. Untuk mengetahui variabel mana saja yang memiliki pengaruh bila
dimodelkan secara bersama, maka perlu dilakukan uji signifikansi secara parsial.
Statistik uji yang digunakan adalah uji Wald dan hipotesis yang diberikan adalah
sebagai berikut.
H0 : βk = 0, dimana k = 1,2,…,7
H1 : βk ≠ 0
Hasil pengujian signifikansi secara parsial yang ditampilkan pada Tabel 2
menunjukkan bahwa pada taraf kepercayaan 95%, terdapat beberapa variabel yang
tidak berpengaruh parsial terhadap nilai UNAS di SMA Negeri 2 Amahai. Hal ini
ditunjukkan dari nilai p-valuenya yang lebih besar dari taraf nyata 5% atau nilai uji
2
Wald lebih kecil dari 𝑋1,0.05 = 3,841. Sedangkan variabel yang memiliki pengaruh
parsial terhadap nilai UNAS SMA 2 Amahai diantaranya adalah nilai UNAS SMP
(X1), nilai UAS SMA (X2) dan nilai raport (X4) , karena nilai p-value lebih kecil
dari 5%.
Tabel 2 Pengujian Signifikansi Variabel Prediktor terhadap Variabel Respon Secara Parsial
Estimasi Std. Nilai Uji
Variabel P-Value Keputusan
Parameter Eror Wald
Nilai UNAS SMP (X1) 20,909 8,601 5,910 0,015 Signifikan
Nilai UAS SMA (X2) 13,169 5,847 5,072 0,024 Signifikan
Nilai tryout (X3) -1,695 1,620 1,095 0,295 Tidak Signifikan
Nilai raport (X4) 0,877 0,371 5,598 0,018 Signifikan
Pendapatan ortu (X5) -3,803 2,830 1,806 0,179 Tidak Signifikan
Jumlah keluarga (X6) 0,122 0,303 0,164 0,686 Tidak Signifikan
Jurusan (X7=0) -1,347 1,906 0,500 0,480 Tidak Signifikan 0

Uji Kesesuaian Model


Setelah dilakukan pengujian parameter secara serentak maupun parsial,
selanjutnya dilakukan pengujian terhadap kebaikan model yang telah dibentuk.
Konsep pengujian ini didasarkan pada perbandingan antara hasil prediksi dengan
kenyataannya. Pengujian dilakukan dengan menggunakan statistik uji deviance
dengan α = 5%, dimana hipotesis yang digunakan sebagai berikut.
H0 : Model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi)
H1 : Model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi)
Tolak H0 jika p-value kurang dari α.

Tabel 3 Uji Kesesuaian Model dengan Metode Deviance


𝜒2 Derajat bebas p-value
Deviance 19,404 113 1.000

Berdasarkan Tabel 3, maka keputusan yang diambil adalah terima H 0, dan


menunjukkan bahwa model yang terbentuk sesuai. Hal ini berarti bahwa tidak ada
perbedaan antara hasil observasi dengan hasil prediksi.

Uji Parallel Lines


Untuk model regresi logistik ordinal yang telah terbentuk sebelumnya,
pengujian parallel lines dilakukan dengan hipotesis sebagai berikut.
H0 : hubungan antara variabel independen dengan logit sama untuk semua
persamaan logit
H1 : hubungan antara variabel independen dengan logit ada yang tidak sama pada
persamaan logit
α = 5%
Hasil pengujian ditampilkan pada Tabel 4 berikut ini.

Tabel 4 Uji Kesesuaian Model dengan Metode Deviance


𝜒2 Derajat bebas p-value
0 7 1.000

Berdasarkan Tabel 4, maka keputusan yang diambil adalah terima H0. Ini
berarti bahwa pemilihan model link function logit sudah sesuai karena memenuhi
asumsi setiap kategori memiliki hubungan antara variabel independen dengan logit
sama untuk semua persamaan logit.

Kekuatan Asosiasi
Adapun pengukuran kekuatan asosiasi dari model yang sudah terbentuk
adalah seperti pada Tabel 5 berikut ini.
Tabel 5 Kekuatan Asosiasi
R2
Cox and Snell 0,849
Nagelkerke 1,000
McFadden 1,000

Berdasarkan Tabel 5, nilai R2 (kekuatan asosiasi) dari berbagai metode


bernilai cukup besar, dengan nilai sebesar 0,849 untuk metode Cox dan Snell, dan
sebesar 1 untuk metode Nagelkerke dan McFadden. Ini menunjukkan bahwa
hubungan variabel dependen dan variabel prediktor cukup erat.

Ketepatan Klasifikasi
Berdasarkan model regresi logistik ordinal yang telah terbentuk, diperoleh
ketepatan klasifikasi yang ditampilkan pada Tabel 6 berikut ini.
Tabel 6 Ketepatan Klasifikasi
Prediksi
Ketepatan
Cukup Sangat
Baik Total Klasifikasi
baik baik
(Y=1) Relatif (%)
Observasi (Y=0) (Y=2)
Cukup
baik 24 2 0 26 92.31%
(Y=0)
Kategori
Baik
Nilai 2 26 1 29 89.66%
(Y=1)
UNAS
Sangat
baik 0 0 6 6 100.00%
(Y=2)
Total 27 26 28 7
Ketepatan Klasifikasi Keseluruhan 90.80%

Tabel 6 menunjukkan bahwa ketepatan klasifikasi dari model adalah sebesar


90,80%. Ketepatan klasifikasi tersebut cukup tinggi, yang menunjukkan bahwa
model regresi ordinal yang terbentuk tepat dalam memprediksi observasi.
BAB V
KESIMPULAN

Berdasarkan uraian pembahasan sebelumnya, didapatkan model regresi


logistik ordinal sebagai berikut.
  
Logit ( 1 )  log  1   274.62  20,909 X1  13,169X 2 - 1,695X 3 - 0,877X 4 
1 1 
 0,803X 5  1,22X 6 - 1,347 7 (0)
 2 
Logit ( 2 )  log    304.061  20,909 X1  13,169X 2 - 1,695X 3 - 0,877X 4 
1  2 
 0,803X 5  1,22X 6 - 1,347X 7 (0)
Secara serentak, kesimpulan yang didapatkan adalah sedikitnya terdapat
satu variabel yang signifikan terhadap model. Adapun secara parsial, variabel yang
signifikan pengaruhnya terhadap model regresi logistik ordinal adalah variabel X 1,
X2, dan X4.
LAMPIRAN

Anda mungkin juga menyukai