Adk 1 Logistik Multinomial
Adk 1 Logistik Multinomial
MAKALAH
Disusun Oleh:
KELOMPOK 1
STATISTIKA B 2022
NAMA NIM
Muhammad Nur Alfi Syahri 2207016039
Syarifah Nasywa 2207016040
Aliya Khairunnisa 2207016042
Aprillia Elsada Rinindah 2207016043
Khairin Nabila Rizky 2207016045
Fadilla 2207016046
Nisrina Nur Rahman 2207016048
Devita Dwi Putri 2207016050
Ahmad Zulfikar Khoiruddin 2207016053
Muhammad Azra Firdaus 2207016055
Olivia Anasin Tukan 2207016056
Diego Christian 2207016057
Dinda Angelia 2207016060
Deswita Istiyanti 2207016062
Sakila Armayani 2207016061
Debora Natania 2207016066
Indra Angeline Seru 2207016067
DAFTAR ISI
DAFTAR ISI ..................................................................................................................... i
MATERI ........................................................................................................................... 1
1. Regresi Logistik ........................................................................................................ 1
2. Jenis-Jenis Regresi Logistik..................................................................................... 1
3. Regresi Logistik Multinomial .................................................................................. 2
4. Fungsi Logit & Model Matematis ........................................................................... 3
5. Estimasi Parameter .................................................................................................. 4
6. Uji Signifikansi Parameter ...................................................................................... 5
7. Odds Ratio ................................................................................................................. 6
8. Evaluasi Model ......................................................................................................... 8
STUDI KASUS ............................................................................................................... 10
1. Studi Kasus 1 .......................................................................................................... 10
2. Studi Kasus 2 .......................................................................................................... 20
DAFTAR PUSTAKA ..................................................................................................... 30
i
MATERI
1. Regresi Logistik
Regresi Logistik adalah suatu metode analisis statistika untuk
mendeskripsikan hubungan antara peubah respon (dependent variable) yang
memiliki dua kategori atau lebih dengan satu atau lebih peubah penjelas
(independent variable) berskala kategori atau interval (Hosmer dan Lemeshow,
2000). Regresi Logistik merupakan regresi non linear, digunakan untuk
menjelaskan hubungan antara X dan Y yang bersifat tidak linear, ketidak normalan
sebaran Y, keragaman respon tidak konstan yang tidak dapat dijelaskan dengan
model regresi linear biasa (Agresti, 1996).
2. Jenis-Jenis Regresi Logistik
Adapun jenis-jenis dari regresi logistik yang digunakan dibagi menjadi 3
macam, yaitu regresi logistik biner, regresi logistik multinomial, dan regresi logistik
ordinal.
2.1. Regresi Logistik Biner (Binary Logistic Regression)
Regresi logistik biner digunakan ketika variabel dependen hanya memiliki
dua kemungkinan hasil atau kategori, misalnya ya/tidak, sukses/gagal. Model ini
memperkirakan probabilitas terjadinya salah satu dari dua kategori tersebut
berdasarkan satu atau lebih variabel independen. Contohnya, dalam penelitian
medis, regresi logistik biner dapat digunakan untuk memprediksi apakah seorang
pasien akan terkena penyakit tertentu (ya/tidak) berdasarkan faktor-faktor seperti
usia, tekanan darah, dan riwayat keluarga.
2.2. Regresi Logistik Multinomial (Multinomial Logistic Regression)
Regresi logistik multinomial digunakan ketika variabel dependen memiliki
lebih dari dua kategori yang tidak memiliki urutan atau peringkat. Model ini
memprediksi probabilitas masing-masing kategori berdasarkan variabel
independen. Misalnya dalam penelitian pemasaran, regresi logistik multinomial
dapat digunakan untuk memprediksi preferensi produk pelanggan (misalnya,
memilij produk A, B, atau C) berdasarkan data demografis dan perilaku pembelian.
2.3. Regresi Logistik Ordinal (Ordinal Logistic Regression)
1
Regresi logistik ordinal digunakan ketika variabel dependen memiliki lebih
dari dua kategori yang memiliki urutan atau peringkat. Model ini memprediksi
probabilitas masing-masing kategori berdasarkan urutan atau peringkat tersebut.
Contohnya, dalam survei kepuasan pelanggan, regresi logistik ordinal dapat
digunakan untuk memprediksi tingkat kepuasan pelanggan (misalnya, sangat tidak
puas, tidak puas, netral, sangat puas) berdasarkan berbagai faktor seperti kualitas
layanan dan harga. Model ini mempertimbangkan bahwa kategori memliki
hubungan urutan, yang membedakannya dari regresi logistik multinomial.
2
Berdasarkan kedua fungsi logit tersebut maka didapatkan model regresi logistik
polychotomus sebagai berikut:
𝑒𝑥𝑝 𝑔1 (𝑥)
𝜋1 (𝑥) = 𝑃(𝑌 = 1|𝑥) = (3.4)
1 + 𝑒𝑥𝑝 𝑔1 (𝑥) + 𝑒𝑥𝑝 𝑔2 (𝑥)
𝑒𝑥𝑝 𝑔2 (𝑥) (3.5)
𝜋2 (𝑥) = 𝑃(𝑌 = 2|𝑥) =
1 + 𝑒𝑥𝑝 𝑔1 (𝑥) + 𝑒𝑥𝑝 𝑔2 (𝑥)
1 (3.6)
𝜋3 (𝑥) = 𝑃(𝑌 = 3|𝑥) =
1 + 𝑒𝑥𝑝 𝑔1 (𝑥) + 𝑒𝑥𝑝 𝑔2 (𝑥)
Model logistik untuk kategori variabel dependen lebih dari satu atau
polychotomous, yaitu:
𝜋𝑗 𝑗
𝑘
𝑗
ln [ ] = 𝛽0 + ∑ 𝛽𝑖 𝑥𝑖 , 𝑗 = 1, … , 𝑞 − 1 (3.7)
𝜋𝑞 𝑖=1
𝑃(𝑌 = 1)2|𝑥
𝑃2 (𝑥) = ln ( ) = 𝛽20 + 𝛽21 𝑥1 + 𝛽22 𝑥2 + ⋯ + 𝛽2𝑏 𝑥𝑏 = 𝑥 ′ 𝛽2 (4.3)
𝑃(𝑌 = 1)0|𝑥
Berdasarkan kedua fungsi logit tersebut maka didapatkan model regresi logistik
yang terdapat pada persamaan:
3
1
𝜋0 (𝑥) = (4.4)
1 + 𝑒𝑥𝑝 𝑃1 (𝑥) + exp 𝑃2 (𝑥)
𝑒𝑥𝑝 𝑃1 (𝑥) (4.5)
𝜋1 (𝑥) =
1 + 𝑒𝑥𝑝 𝑃1 (𝑥) + exp 𝑃2 (𝑥)
𝑒𝑥𝑝 𝑃2 (𝑥) (4.6)
𝜋2 (𝑥) =
1 + 𝑒𝑥𝑝 𝑃1 (𝑥) + exp 𝑃2 (𝑥)
5. Estimasi Parameter
Pada regresi linier, metode yang paling sering digunakan untuk mengestimasi
parameter yang tidak diketahui adalah least square. Metode ini akan
meminimumkan jumlah kuadrat residual. Metode ini akan menghasilkan estimator
yang valid apabila digunakan pada data dengan asumsi IIDN yang terpenihi.
Sebaliknya, metode ini akan menghasilkan estimator yang bias jika diaplikasikan
pada variabel respon yang bersifat polikotomus. Metode yang mengarah pada
fungsi least square dalam model regresi linier disebut maximum likelihood dengan
logaritma likelihood yang terdapat pada persamaan 1.
𝑛
𝑦 𝑦 𝑦
𝑙(𝛽) = ∏ 𝜋1𝑖1𝑖 𝜋2𝑖2𝑖 𝜋3𝑖3𝑖
𝑖=1 (5.1)
= (1 − 𝜋1𝑖 − 𝜋2𝑖 − 𝜋3𝑖 )1−𝑦1𝑖 −𝑦2𝑖 −𝑦3𝑖
dengan, ∑𝑛𝑖=1 𝑦𝑗𝑖 = 1
Dilakukan transformasi logaritma, sehingga didapat persamaan logaritma
likelihood dengan fungsi linier.
𝐿(𝛽) = log [𝑙(𝛽)]
𝑛 (5.2)
=∑ (𝑦1𝑖 𝑥𝑖 𝛽1 + 𝑦2𝑖 𝑥𝑖 𝛽2 + 𝑦3𝑖 𝑥𝑖 𝛽3 + ln (1 − 𝜋1𝑖 − 𝜋2𝑖 − 𝜋3𝑖 )
𝑖=1
4
𝜕𝐿(𝛽) 𝑎
= ∑ 𝑥𝑖 (𝑦𝑗𝑖 − 𝜋𝑗𝑖 (5.3)
𝜕𝛽𝑗 𝑖−1
dengan; 𝑗 = 1,2, … , 𝑏
(Zahroh, 2018).
dengan,
𝜋𝑘 (𝑥𝑖 ) ∶ peluang kategori respon ke-k pada pengamatan ke−𝑖.
𝑦𝑘𝑖 ∶ anggota peubah respon pada kategori ke−𝑘 pengamatan ke−𝑖.
2
Tolak H0 jika 𝐺 > 𝜒(𝛼;𝑝)
(Kurniawan, 2016).
6.2 Uji Parsial
Pengujian parsial digunakan untuk memeriksa kemaknaan koefisien 𝛽 secara
parsial dengan membandingkan dugaan 𝛽 dengan penduga standar errornya,
dengan kata lain uji parsial digunakan untuk mengetahui apakah variabel prediktor
5
berpengaruh signifikan atau tidak terhadap variabel respon secara tunggal (Tulong,
Mans, et al, 2018).
Pada uji parsial digunakan uji hipotesis sebagai berikut:
𝐻0 : 𝛽𝑗 = 0 (Tidak ada pengaruh variabel prediktor secara parsial terhadap
variabel respon)
𝐻1 : 𝛽𝑗 ≠ 0 (Ada pengaruh variabel prediktor secara parsial terhadap variabel
respon)
Dengan Statistik Uji:
𝛽̂𝑗
2 (6.4)
2
𝑊 = 2
𝑆𝐸(𝛽̂𝑗 )
Keterangan:
2
𝑆𝐸(𝛽̂𝑗 ) : Standar error koefisien
𝛽̂𝑗 : Nilai koefisien dugaan variabel prediktor
(Zahroh, 2018).
Kriteria penolakan pada uji ini yaitu dengan membandingkan nilai dari 𝑊 2
2
dengan 𝑋(𝛼,𝑣) atau dengan membandingkan nilai P-value dengan 𝛼, dimana v
2
adalah banyaknya variabel prediktor. Jika nilai 𝑊 2 > 𝑋(𝛼,𝑣) atau 𝑃 − 𝑉𝑎𝑙𝑢𝑒 < 𝛼
maka diputuskan 𝐻0 ditolak (Zahroh, 2018).
7. Odds Ratio
Interpretasi pada metode regresi logistik, menggunakan nilai odds ratio.
Untuk dapat menjelaskan odds ratio, digunakan dengan Tabel 1. Dimana
dicontohkan variabel respon dengan tiga kategori dan variabel prediktor dengan dua
kategori
Tabel 1. Nilai Regresi Logistik untuk Variabel Prediktor
Variabel Respon Variabel bebas (x) X=0
1
(y) Y=0 𝜋0 (0) =
1 + exp (𝛽10 − 𝛽20 )
6
Variabel Respon Variabel bebas (x) X=1
(y) 1
𝜋1 (0) =
Y=1 1 + exp (𝛽10 − 𝛽20 )
1
Y=2 𝜋2 (0) =
1 + exp (𝛽10 − 𝛽20 )
1
𝜋1 (0) =
Y=1 1 + exp(𝛽10 + 𝛽11 ) + exp(𝛽20 + 𝛽21 )
1
Y=2 𝜋2 (0) =
1 + exp(𝛽10 + 𝛽11 ) + exp(𝛽20 + 𝛽21 )
7
8. Evaluasi Model
8.1 Uji Kesesuaian Model
Uji kesesuaian model bertujuan untuk menilai apakah model yang dihasilkan
dari analisis regresi logistik sudah layak, yaitu tidak terdapat perbedaan signifikan
antara data yang diamati dengan prediksi model. Prosedur ini juga membantu
memastikan bahwa model mampu merepresentasikan data dengan baik. Pengujian
ini dilakukan dengan menggunakan hipotesis sebagai berikut:
𝐻0 : Model sesuai (tidak terdapat perbedaan antara hasil pengamatan dengan
kemungkinan hasil prediksi model)
𝐻1 : Model tidak sesuai (terdapat perbedaan antara hasil pengamatan dengan
kemungkinan hasil prediksi model)
Statistik uji yang digunakan, yaitu:
𝑔
(𝑂𝑘 − 𝑛𝑘′ 𝜋̅𝑘)2
𝐶=∑ (8.1)
𝑛𝑘′ 𝜋̅𝑘(1 − 𝜋̅𝑘)
𝑘=1
dengan:
𝐶
𝑘
𝑂𝑘 = ∑𝑗=1 𝑦𝑗 = Jumlah nilai variabel respon pada grup ke-k
𝐶 𝑚𝑗 𝜋(𝑥𝑗 )
𝑘
𝜋̅𝑘 = ∑𝑗=1 ′ = Rata-rata taksiran probabilitas
𝑛𝑘
g = Jumlah grup
𝑛𝑘′ = Banyaknya subjek pada grup ke-k
𝐶𝑘 = Kategori variable respon
Tolak 𝐻0 , apabila 𝐶̂ > 𝑋𝛼,𝑣
2
yang menyatakan bahwa model tidak sesuai
(terdapat perbedaan antara hasil pengamatan dengan kemungkinan hasil prediksi
model) (Hosmer & Lemeshow, 2000).
Interpretasi model dalam regresi logistik didasarkan pada nilai odds ratio,
yang menunjukkan seberapa banyak peningkatan atau penurunan kemungkinan
terjadinya 𝑌 = 𝑗 dibandingkan dengan 𝑌 = 1 sebagai kategori pembanding, ketika
nilai variabel prediktor (x) mengalami perubahan tertentu, sebagaimana pada
persamaan berikut:
𝑃(𝑌 = 𝑗|𝑥 = 𝑎)/𝑃(𝑌 = 1|𝑥 = 𝑎)
𝜓𝑎𝑏 = 𝑂𝑅𝑗 (𝑎, 𝑏) = (8.2)
𝑃(𝑌 = 𝑗|𝑥 = 𝑏)/𝑃(𝑌 = 1|𝑥 = 𝑏)
8
Hubungan antara odds ratio terhadap parameter model (𝛽) adalah: 𝜓𝑎𝑏 = exp(𝛽̂ )
(Tulong, dkk, 2018).
8.2 Uji Ketepatan Model
Prosedur klasifikasi yang bisa digunakan untuk mengukur ketepatan
klasifikasi adalah Apparent Error Rate (APER). Nilai APER menyatakan proporsi
sampel yang salah diklasifikasikan oleh fungsi klasifikasi. Kesalahan klasifikasi
dapat dilihat pada tabel matriks konfusi berikut:
Taksiran
Hasil Observasi
y1 y2
y1 n11 n12
y2 n21 n22
Maka nilai APER dapat dihitung dengan rumus:
n12 + n21
APER = (8.3)
n11 + n12 + n21 + n22
Akurasi = 1 – APER
9
STUDI KASUS
1. Studi Kasus 1
Komisi Pemberantasan Korupsi (KPK) memiliki data tindak pidana korupsi
pada tahun 2015 yang melibatkan berbagai jenis pelaku. Peneliti ingin mengetahui
apakah jenis kelamin, profesi, dan institusi asal pelaku memengaruhi jenis perkara
tindak pidana korupsi yang dilakukan dengan data sebagai berikut :
Y X1 X2 X3
Pengadaan.Barang.jasa laki-laki Manager Kementrian
Pengadaan.Barang.jasa laki-laki Karyawan PEMKOT
penyuapan laki-laki Karyawan Kementrian
penyuapan perempuan Dirut PEMPROV
penyuapan laki-laki Dirut Kementrian
penyuapan laki-laki Dirut Swasta
penyuapan perempuan Karyawan Swasta
penyuapan laki-laki Karyawan Swasta
penyuapan laki-laki K.Bagian Kementrian
penyuapan laki-laki Karyawan Kementrian
penyuapan laki-laki Karyawan Swasta
Pengadaan.Barang.jasa laki-laki Dirut Swasta
Pengadaan.Barang.jasa laki-laki K.Bagian Swasta
P.anggaran laki-laki Dirut Kementrian
P.anggaran laki-laki Manager Kementrian
Pengadaan.Barang.jasa laki-laki Manager Kementrian
penyuapan laki-laki Dirut PEMKOT
penyuapan laki-laki Dirut Swasta
penyuapan laki-laki Dirut Swasta
penyuapan laki-laki Dirut PEMKOT
penyuapan perempuan Karyawan PEMPROV
penyuapan laki-laki Dirut Swasta
penyuapan laki-laki Manager Kementrian
10
penyuapan laki-laki Dirut Kementrian
penyuapan laki-laki Dirut Swasta
penyuapan laki-laki Dirut Kementrian
Pengadaan.Barang.jasa laki-laki Manager Swasta
Pengadaan.Barang.jasa laki-laki Dirut Kementrian
Pengadaan.Barang.jasa laki-laki Manager Kementrian
P.anggaran laki-laki Dirut Swasta
P.anggaran laki-laki Dirut PEMKOT
penyuapan laki-laki Karyawan DPRRI
penyuapan laki-laki Karyawan DPRRI
penyuapan laki-laki Dirut PEMKOT
penyuapan laki-laki Dirut PEMKOT
Pengadaan.Barang.jasa laki-laki Dirut PEMPROV
penyuapan laki-laki Dirut PEMKOT
penyuapan laki-laki Dirut Kementrian
Y = Jenis Perkara Tindak Pidana Korupsi
X1 = Jenis Kelamin
X2 = Profesi
X3 = Institusi
Sintax Software R:
#REGRESI LOGISTIK MULTINOMIAL#
library(stats)
library(MASS)
library(lmtest)
library(pscl)
library(aod)
library(dplyr)
library(car)
library(generics)
library(caret)
data<-read.table(file.choose(),header=T)
data
11
#Dataset
head(data)
str(data)
data$Y<-as.factor(data$Y)
data$X1<-as.factor(data$X1)
data$X2<-as.factor(data$X2)
data$X3<-as.factor(data$X3)
str(data)
#RegMultinom
library(nnet)
data$Y <-relevel(data$Y, ref =
"Pengadaan.Barang.jasa")
data$X1<-relevel(data$X1, ref="perempuan")
data$X2<-relevel(data$X2, ref="Dirut")
data$X3<-relevel(data$X3, ref="Swasta")
model_multi<-multinom(Y~X1+X2+X3,data=data)
#exp odd ratio
summary(model_multi)
#Kesesuaian Model
library(generalhoslem)
logitgof(data$Y,fitted(model_multi))
12
#Odds-Ratio
exp(coef(model_multi))
#Klasifikasi
klasifikasi<-model_multi$fitted.values
klasifikasi
pred_multi<- predict(model_multi, data=data)
confmatMultinomial<-
confusionMatrix(pred_multi,as.factor(data$Y))
confmatMultinomial
Pembahasan:
Fungsi, Model dan Odds Rasio Regresi Logistik Multinomial
13
𝜋2 (𝑥)
exp(12.7625 + 31.4663𝑋1 (2) + 14.8002𝑋2 (1) + 18.2029𝑋2 − 1,2902𝑋2 )
=
1 + exp (−4.3215 − 23.1687𝑋1 (2) + 17.0289𝑋2 (1) + 18.8593𝑋2 + 2.5374𝑋2 )
+𝑒𝑥𝑝(12.7625 + 31.4663𝑋1 (2) + 14.8002𝑋2 (1) + 18.2029𝑋2 − 1,2902𝑋2 )
𝜋3 (𝑥)
1
=
1 + exp(−4.3215 − 23.1687𝑋1 (2) + 17.0289𝑋2 (1) + 18.8593𝑋2 + 2.5374𝑋2 )
+𝑒𝑥𝑝(12.7625 + 31.4663𝑋1 (2) + 14.8002𝑋2 (1) + 18.2029𝑋2 − 1,2902𝑋2 )
Sehingga diperoleh odds rasio sebagai berikut:
14
• Karyawan dan organisasi (terutama PEMKOT dan PEMPROV) memiliki
pengaruh sangat besar untuk kategori "Pengadaan Barang Jasa".
• Gender (Perempuan) memiliki pengaruh sangat besar untuk kategori
"Penyuapan".
Kategori organisasi (PEMKOT dan PEMPROV) sangat mendominasi peluang
untuk kategori "Pengadaan Barang Jasa", tetapi berkontribusi negatif pada
kategori "Penyuapan".
Manager memiliki pengaruh berbeda, meningkatkan peluang untuk kategori
"Pengadaan Barang Jasa" tetapi menurunkan peluang untuk kategori
"Penyuapan".
Uji Simultan
Hipotesis
H 0 : 𝛽1 = 𝛽2 = 𝛽3 = 0
(Semua koefisien variabel independen (𝑋1 , 𝑋2 , 𝑋3 ) sama dengan nol,
yaitu model tanpa variabel independen (model dengan intercept saja)
sama baiknya dengan model penuh.)
H1 : Minimal ada satu parameter 𝛽𝑖 ≠ 0
(Setidaknya satu koefisien variabel independen tidak sama dengan
nol, yaitu model penuh lebih baik dibandingkan model dengan
intercept saja.)
Taraf Signifikansi
𝛼 = 0.05
Statistik Uji
𝐿𝑅 = −2 ∗ (𝐿𝑜𝑔 − 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑀𝑜𝑑𝑒𝑙 𝑁𝑜𝑙 − 𝐿𝑜𝑔 −
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑀𝑜𝑑𝑒𝑙 𝑃𝑒𝑛𝑢ℎ)
𝐿𝑅 = −2 ∗ (−32.436— 22.926) = 19.021
Daerah Kritis
15
2
Tolah 𝐻0 jika nilai LR > nilai 𝑋𝑑𝑓,𝛼
Keputusan
2
Karena nilai LR = 19.021 < 𝑋𝑑𝑓,𝛼 = 26.296 Dn nilai p-value (0.2676) >
0.05, maka 𝐻0 gagal ditolak
Kesimpulan
Semua koefisien variabel independen (𝑋1 , 𝑋2 , 𝑋3 ) sama dengan nol, yaitu
model tanpa variabel independen (model dengan intercept saja) sama
baiknya dengan model penuh.
Uji Parsial
Hipotesis
H 0I : 0 = 0
16
Taraf Signifikansi
= 0, 05
Statistik Uji
k
W =
( )
SE k
Daerah Kritis
Tolak H 0 jika p − value
17
PEMPROV terhadap
model regresi
Tidak terdapat
Institusi = 𝐻0 gagal pengaruh institusi
0,95
PEMKOT ditolak PEMKOT terhadap
model regresi
Tidak terdapat
Institusi = 𝐻0 gagal pengaruh institusi
0,40
Kementrian ditolak kementrian terhadap
model regresi
Tidak terdapat
𝐻0 gagal
Institusi = DPRRI 0 pengaruh DPRRI
ditolak
terhadap model regresi
18
manager terhadap
model regresi
Tidak terdapat
Institusi = 𝐻0 gagal pengaruh institusi
0
PEMPROV ditolak PEMPROV terhadap
model regresi
Tidak terdapat
Institusi = 𝐻0 gagal pengaruh institusi
0,86
PEMKOT ditolak PEMKOT terhadap
model regresi
Tidak terdapat
Institusi = 𝐻0 gagal pengaruh institusi
0,46
Kementrian ditolak kementrian terhadap
model regresi
Tidak terdapat
𝐻0 gagal
Institusi = DPRRI 0 pengaruh DPRRI
ditolak
terhadap model regresi
Uji Kesesuaian Model Dengan Hosmer & Lemeshow Test
Hipotesis
H 0 : Model regresi logistik sudah tepat digunakan
19
Daerah Kritis
Tolak H 0 jika p − value
Keputusan
Karena p − value = 0, 9942 = 0, 05 maka diputuskan H 0 gagal ditolak
Kesimpulan
Model regresi logistik sudah tepat digunakan
Ketepatan Klasifikasi
2. Studi Kasus 2
Penelitian oleh Zahroh, 2018 melakukan untuk mengetahui faktor-faktor yang
mempengaruhi sumber air bersih rumah tangga [𝑌 = 3 (sebagian kecil sumber air
bersih dibeli), 𝑌 = 4 (seluruh sumber air bersih tidak dibeli)] di Jawa Timur,
variabel 𝑋 yang digunakan adalah pendidikan terakhir kepala rumah tangga [𝑋1 =
1 (≤SD), 𝑋1 = 2 (SMP), 𝑋1 = 3 (𝑆MA), 𝑋1 = 4 (Perguruan Tinggi)], status
kepemilikan bangunan [𝑋2 = 1 (≤ Bukan Milik Sendiri), 𝑋2 = 2 (≤Milik Sendiri)],
20
penyaluran air yang digunakan [𝑋3 = 1 (≤ Perpipaan/Hidran Umum), 𝑋3 = 2
(≤Tidak Semua)], dan Jumlah Anggota Keluarga (𝑋5 ). Adapun data diberikan
sebagai berikut:
𝑋1 𝑋2 𝑋3 𝑋4 𝑌
3 2 1 2 4
1 2 2 5 4
1 2 1 2 4
1 2 1 2 4
3 2 1 4 4
1 2 1 4 4
1 2 1 2 4
1 2 1 4 4
2 2 1 3 4
2 2 1 2 4
1 2 1 5 4
1 2 1 5 4
1 2 1 3 3
1 2 1 2 4
1 2 1 2 4
1 2 1 3 4
1 2 1 4 4
4 2 1 5 4
1 2 1 3 4
1 2 2 1 4
1 2 1 3 4
4 2 1 3 4
1 2 1 3 4
1 2 1 3 4
3 2 1 4 4
1 2 1 4 4
1 2 1 4 4
1 2 2 4 4
1 2 1 4 4
4 2 1 3 4
21
1 2 1 2 4
1 2 1 5 4
1 2 1 5 4
1 2 1 1 4
1 2 1 2 4
1 2 1 5 4
1 2 1 2 4
1 2 1 3 4
1 2 1 5 4
3 2 1 4 4
1 2 2 1 4
1 2 2 2 4
1 2 2 5 4
1 2 2 2 3
1 2 2 5 4
1 2 2 4 4
3 2 2 3 3
3 2 2 4 4
1 1 2 3 3
22
Hipotesis
𝐻0 : 𝛽0 = 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 0
(Tidak terdapat pengaruh variabel, pendidikan terakhir kepala rumah
tangga, status kepemilikan bangunan, penyaluran air yang digunakan, dan
jumlah anggota keluarga terhadap variabel sumber air bersih)
𝐻1 : Minimal terdapat satu 𝛽𝑗 ≠ 0 ; 𝑗 = 0,1,2,3,4
(Terdapat pengaruh variabel, pendidikan terakhir kepala rumah tangga,
status kepemilikan bangunan, penyaluran air yang digunakan, dan jumlah
anggota keluarga terhadap variabel sumber air bersih)
Taraf Signifikansi
𝛼 = 0,05
Statistik Uji
𝑛 𝑛0 𝑛 𝑛1 𝑛 𝑛2 𝑛 𝑛3 𝑛 𝑛4
( 0) ( 1) ( 2) ( 3) ( 4)
𝐺 2 = −2 ln [∏𝑛 𝑛 𝑛 𝑛 𝑛 𝑛
𝑦0𝑖 𝜋 (𝑥 )𝑦1𝑖 𝜋 (𝑥 )𝑦2𝑖 𝜋 (𝑥 )𝑦3𝑖 𝜋 (𝑥 )𝑦4𝑖 ]
𝑖=1[𝜋0 (𝑥𝑖 ) 1 𝑖 2 𝑖 3 𝑖 4 𝑖
Daerah Kritis
Tolak 𝐻0 jika 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼
Keputusan
𝐻0 gagal ditolak karena 𝑝 − 𝑣𝑎𝑙𝑢𝑒(0,1262) > 𝛼(0,05)
Kesimpulan
Tidak terdapat pengaruh variabel, pendidikan terakhir kepala rumah tangga,
status kepemilikan bangunan, penyaluran air yang digunakan, dan jumlah
anggota keluarga terhadap variabel sumber air bersih
b) Uji Parsial
23
Hipotesis
𝐻0 : 𝛽0 = 0
(Tidak terdapat pengaruh konstanta terhadap model regresi)
𝐻1 : 𝛽0 ≠ 0
(Terdapat pengaruh konstanta terhadap model regresi)
𝐻0 ′ : 𝛽1 = 0
(Tidak terdapat pengaruh pendidikan terakhir kepala rumah tangga
terhadap model regresi)
𝐻1 ′ : 𝛽1 ≠ 0
(Terdapat pengaruh pendidikan terakhir kepala rumah tangga terhadap
model regresi)
𝐻0 ′′ : 𝛽2 = 0
(Tidak terdapat pengaruh status kepemilikan bangunan terhadap model
regresi)
𝐻1 ′′ : 𝛽2 ≠ 0
(Terdapat pengaruh status kepemilikan bangunan terhadap model
regresi)
𝐻0 ′′′ : 𝛽3 = 0
(Tidak terdapat pengaruh penyaluran air yang digunakan terhadap
model regresi)
𝐻1 ′′′ : 𝛽3 ≠ 0
(Terdapat pengaruh penyaluran air yang digunakan terhadap model
regresi)
𝐻0 ′′′′ : 𝛽4 = 0
(Tidak terdapat pengaruh jumlah anggota keluarga terhadap model
regresi)
𝐻1 ′′′′ : 𝛽4 ≠ 0
(Terdapat pengaruh jumlah anggota keluarga terhadap model regresi)
Taraf Signifikansi
𝛼 = 0,05
Statistik Uji
̂
𝛽
𝑊 = 𝑆𝐸(𝛽𝑘̂
𝑘)
24
Daerah Kritis
Tolak 𝐻0 jika 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼
Keputusan dan Kesimpulan
Variabel/Parameter 𝑝 − 𝑣𝑎𝑙𝑢𝑒 Keputusan Kesimpulan
Tidak terdapat
pengaruh
Konstanta 0,9689780 𝐻0 gagal ditolak konstanta
terhadap model
regresi
Tidak terdapat
pengaruh
pendidikan
𝑋1 = 2 0,9896005 𝐻0 gagal ditolak terakhir kepala
rumah tangga
SMP terhadap
model regresi
Tidak terdapat
pengaruh
pendidikan
𝑋1 = 3 0,3272289 𝐻0 gagal ditolak terakhir kepala
rumah tangga
SMA terhadap
model regresi
Tidak terdapat
pengaruh
pendidikan
terakhir kepala
𝑋1 = 4 0,981330 𝐻0 gagal ditolak
rumah tangga
Perguruan Tinggi
terhadap model
regresi
25
Tidak terdapat
pengaruh status
kepemilikan
𝑋2 = 2 0,9626579 𝐻0 gagal ditolak
bangunan milik
sendiri terhadap
model regresi
Tidak terdapat
pengaruh
penyaluran air
𝑋3 = 2 0,1618959 𝐻0 gagal ditolak yang digunakan
tidak semua
terhadap model
regresi)
Tidak terdapat
pengaruh jumlah
𝑋4 0,353979 𝐻0 gagal ditolak anggota keluarga
terhadap model
regres
26
Dengan model regresi logistik sebagai berikut:
𝜋̅1
exp(−10,92 + 10,67𝑋1 (2) − 1,44𝑋1 (3) + 9,33𝑋1 (4) + 13,15𝑋2 (2) − 1,84𝑋3 (2) + 0,50𝑋4 )
=
1 + exp(−10,92 + 10,67𝑋1 (2) − 1,44𝑋1 (3) + 9,33𝑋1 (4) + 13,15𝑋2 (2) − 1,84𝑋3 (2) + 0,50𝑋4 )
𝜋̅0
1
=
1 + exp(−10,92 + 10,67𝑋1 (2) − 1,44𝑋1 (3) + 9,33𝑋1 (4) + 13,15𝑋2 (2) − 1,84𝑋3 (2) + 0,50𝑋4 )
Interpretasi:
• Peluang rumah tangga dengan tingkat pendidikan terakhir SMP yang seluruh
sumber air bersihnya tidak dibeli adalah 4,32 × 104 kali lebih besar dibanding
rumah tangga dengan tingkat pendidikan terakhir SD yang sebagian kecil
sumber air bersihnya dibeli (𝛽̂12 )
• Peluang rumah tangga dengan tingkat pendidikan terakhir SMA yang seluruh
sumber air bersihnya tidak dibeli adalah 2,36 × 10−1 kali lebih besar dibanding
rumah tangga dengan tingkat pendidikan terakhir SD yang sebagian kecil
sumber air bersihnya dibeli (𝛽̂13 )
• Peluang rumah tangga dengan tingkat pendidikan terakhir Perguruan Tinggi
yang seluruh sumber air bersihnya tidak dibeli adalah 1,12 × 104 kali lebih
27
besar dibanding rumah tangga dengan tingkat pendidikan terakhir SD yang
sebagian kecil sumber air bersihnya dibeli (𝛽̂14 )
• Peluang rumah tangga dengan status kepemilikan bangunan milik sendiri yang
seluruh sumber air bersihnya tidak dibeli adalah 5,13 × 105 kali lebih besar
dibanding rumah tangga dengan status kepemilikan bangunan bukan milik
sendiri yang sebagian kecil sumber air bersihnya dibeli (𝛽̂22 )
• Peluang rumah tangga yang tidak menggunakan penyaluran air dan seluruh
sumber air bersihnya tidak dibeli adalah 1,59 × 10−1 kali lebih besar dibanding
rumah tangga yang menggunakan saluran air perpipaan/hidran umum dan
sebagian kecil sumber air bersihnya dibeli (𝛽̂32 )
• Ketika jumlah anggota keluarga bertambah 1, maka peluang rumah tangga yang
seluruh sumbe air bersihnya tidak dibeli adalah 1,64 × 100 (𝛽̂4 )
Ketepatan Klasifikasi
28
29
DAFTAR PUSTAKA
30