Anda di halaman 1dari 12

Checking Model

1. Likelihood-Ratio Model Comparison Test


Salah satu cara untuk mendeteksi ketidakcocokan model adalah dengan menggunakan tes rasio
likelihood untuk membandingkan model dengan yang lebih kompleks.

UJI SIMULTAN
Hipotesis:
H0 : Tidak ada satupun variabel independen yang secara statistik signifikan memengaruhi variabel
dependen (𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑝 = 0)
H1 : Minimal terdapat satu buah variabel independen yang secara statistik signifikan memengaruhi
variabel dependen. ( 𝛽𝑖 ≠ 0 , i= 1,2,…,p)
Statistik Uji :
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 (𝑀𝑜𝑑𝑒𝑙 𝐵)
𝐺 = −2𝑙𝑛 ( )
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 (𝑀𝑜𝑑𝑒𝑙 𝐴)
dengan
Model B : model yang hanya terdiri dari konstanta
Model A : model yang mengandung semua variabel

 Statistik G berdistribusi Chi-Square (G ~ 𝜒𝑝2 )


 2
H0 ditolak jika G > 𝜒𝛼,𝑝 atau nilai-p < α
 Jika H0 ditolak, maka model A memengaruhi model

UJI PARSIAL
Pengujian dilakukan dengan Uji Wald. Statistik Wald membantu untuk mengidentifikasi parameter mana
yang secara signifikan berpengaruh terhadap model yang dibentuk.
Hipotesis:
H0 : 𝛽𝑘 = 0, untuk k = 0, 1, …, p
H1 : 𝛽𝑘 ≠ 0, untuk k = 0, 1, …, p
Statistik Uji:

̂𝑘 2
𝛽
𝑊𝑗 = ( ̂ )
𝑠𝑒(𝛽𝑘 )
- 𝑊𝑗 berdistribusi Chi-Square dengan df = 1, 𝑊𝑗 ~ 𝜒12
2
- H0 ditolak jika 𝑊𝑗 > 𝜒𝛼,1 atau nilai-p < α
- Jika H0 ditolak, maka parameter tersebut secara signifikan memengaruhi model yang dibentuk.
2. Goodness of Fit (Pearson) dan Deviance

Misalkan model kita terdiri dari p peubah bebas 𝑥 ′ = (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑝 )

J adalah banyaknya nilai pengamatan 𝑥 yang berbeda. Jika beberapa subjek memiliki nilai x yang
sama maka 𝐽 < 𝑛.
Notasikan banyaknya subjek dengan nilai 𝑥 = 𝑥𝑗 dengan 𝑚𝑗 , j = 1, 2, …, J. Maka ∑ 𝑚𝑗 = 𝑛
𝑌𝑗 adalah banyaknya 𝑦 = 1 diantara 𝑚𝑗 subjek dengan 𝑥 = 𝑥𝑗 . Sehingga ∑ 𝑦𝑗 = 𝑛 yaitu
banyaknya subjek dengan 𝑦 = 1.

- Pearson Residual:
𝑦𝑗 − 𝑚𝑗 𝜋̂𝑗
𝑟(𝑦𝑖 , 𝜋̂𝑗 ) =
√𝑚𝑗 𝜋̂𝑗 (1 − 𝜋̂𝑗 )

2
statistik 𝜒 2 𝑃𝑒𝑎𝑟𝑠𝑜𝑛 adalah 𝜒 2 = ∑𝐽𝑗=1 𝑟(𝑦𝑖 , 𝜋̂𝑗 )

- Deviance Residual
1/2
𝑦𝑖 (𝑚𝑗 − 𝑦𝑖 )
𝑑(𝑦𝑖 , 𝜋̂𝑗 ) = ± {2 [𝑦𝑖 ln ( ) + (𝑚𝑗 − 𝑦𝑖 ) ln ( )]}
𝑚𝑗 𝜋̂𝑗 𝑚𝑗 (1 − 𝜋̂𝑗 )
Tanda + atau − , sama dengan tanda dari 𝑦𝑖 − 𝑚𝑗 𝜋̂𝑗
2
Statistik Deviance adalah 𝐷 = ∑𝐽𝑗=1 𝑑(𝑦𝑖 , 𝜋̂𝑗 )

Statistik 𝜒 2 dan Deviance menyebar 𝜒 2 dengan derajat bebas J – (p+1)

3. Diagnostik Residual Plot


Jika model regresi logistic tepat, maka E(𝑌𝑖 )= 𝜋𝑖 sehingga E(𝑌𝑖 − 𝜋̂𝑖 )= E(𝑒𝑖 )= 0. Jadi jika model
benar/tepat maka plot antara 𝜋̂𝑖 dan residual akan menunjukkan pola garis horizontal dengan intersep
nol.
Berikut disajikan contoh penerapan Checking Model pada regresi Logistik:
Penerapan dilakukan pada sebuah penelitian yang dilakukan oleh Azizah dengan tujuan pemilihan alat
transportasi yang digunakan dari kedatangan bandara Lombok Internasional.
Variabel penelitian:
 Variabel Independent (Y)
- Bus =0
- Taksi = 1
- Travel = 2
 Variabel dependen (X)
- Jenis kelamin (X1)
Laki-laki =1
Perempuan =2
- Jenis Pekerjaan (X2)
PNS = 1
Swasta = 2
Pelajar = 3
- Pendapatan (X3)
Rendah =1
Sedang =2
Tinggi =3

Transportasi (Y)
jenis kelamin Pekerjaan Pendapatan
(X1) (X2) (X3) bus taxi travel

rendah 4 3 0

PNS sedang 0 3 0

tinggi 1 0 0

rendah 8 2 5

laki-laki Swasta sedang 13 7 9

tinggi 9 1 1

rendah 6 0 0

pelajar sedang 6 2 6

tinggi 5 4 0

rendah 1 3 2
perempuan PNS
sedang 0 0 0
tinggi 0 0 0

rendah 13 13 4

Swasta sedang 5 6 1

tinggi 2 1 0

rendah 4 0 0

pelajar Sedang 2 1 1

tinggi 0 2 0

1. Likelihood-Ratio Model Comparison Test


Uji Signifikansii Model
H0 : Tidak ada satupun variabel independen yang secara statistik signifikan memengaruhi variabel
dependen
H1 : Minimal terdapat satu buah variabel independen yang secara statistik signifikan memengaruhi
variabel dependen.

Model Fitting Information

Model Fitting
Criteria Likelihood Ratio Tests

-2 Log
Model Likelihood Chi-Square df Sig.

Intercept Only 96.059

Final 76.024 20.035 10 .029

 Kriteria pengujian : jika P-value < Alpha, makak tolak Ho.


 Keputusan : Tolak Ho, karena nilai signifikan lebih kecil dari Alpha 5% yaitu 0,029 < 0,05 maka
Ho ditolak.
 Kesimpulan : Dengan taraf nyata 5% data menyediakan cukup bukti bahwa semua variabel
independen (Jenis Kelamin, Jenis Pekerjaan dan Pendapatan) secara bersama – sama berpengaruh
signifikan terhadap variabel dependen (alat transportasi)
Uji Parsial
Likelihood Ratio Tests

Model Fitting
Criteria Likelihood Ratio Tests

-2 Log
Likelihood of
Effect Reduced Model Chi-Square df Sig.

Intercept 76.024a .000 0 .


Jenis_kelamin 84.175 8.151 2 .017
Jenis_Pekerjaan 77.971 1.947 4 .746
Pendapatan 86.064 10.040 4 .040

The chi-square statistic is the difference in -2 log-likelihoods between the final


model and a reduced model. The reduced model is formed by omitting an effect
from the final model. The null hypothesis is that all parameters of that effect are
0.
a. This reduced model is equivalent to the final model because omitting the
effect does not increase the degrees of freedom.

1. Jenis Kelamin
H0: Variabel jenis kelamin secara statistik tidak signifikan memengaruhi variabel alat transportasi
H1: Variabel Jenis kelamin secara statistik signifikan memengaruhi variabel alat transportasi
 Keputusan : Tolak H0: dapat dilihat pada output diatas nilai sig. lebih kecil dari Alpha 5% yaitu
0,017 < 0,05
 Kesimpulan : Dengan taraf nyata 5% data menyediakan cukup bukti bahwa variabel Jenis
Kelamin secara statistik berpengaruh nyata terhadap variabel dependen (alat transportasi)

2. Jenis Pekerjaan
H0: Variabel Jenis Pekerjaan secara statistik tidak signifikan memengaruhi variabel alat transportasi
H1: Variabel Jenis Pekerjaan secara statistik signifikan memengaruhi variabel alat transportasi
 Keputusan : Terima H0: dapat dilihat pada output diatas nilai sig. lebih besar dari Alpha 5% yaitu
0,746 > 0,05
 Kesimpulan : Dengan taraf nyata 5% data menyediakan cukup bukti bahwa variabel Jenis
Pekerjaan secara statistik tidak berpengaruh nyata terhadap variabel dependen (alat transportasi)

3. Pendapatan
H0: Variabel pendapatan secara statistik tidak signifikan memengaruhi variabel alat transportasi
H1: Variabel pendapatan secara statistik signifikan memengaruhi variabel alat transportasi
Keputusan : Terima H0: dapat dilihat pada output diatas nilai sig. lebih kecil dari Alpha 5% yaitu 0,040
< 0,05
Kesimpulan : Dengan taraf nyata 5% data menyediakan cukup bukti bahwa variabel pendapatan secara
statistik berpengaruh nyata terhadap variabel dependen (alat transportasi)

2. Goodness of Fit (Pearson) dan Deviance


Goodness-of-Fit

Chi-Square df Sig.

Pearson 21.897 18 .237


Deviance 24.579 18 .137

Dilakukan uji simultan yang dilihat pada nilai Pearson variabel Sig. yaitu 0.237 yang artinya model
layak digunakan karena p-value > α (0.237 > 0.05).

Parameter Estimasi
Parameter Estimates

95% Confidence Interval for


Exp(B)
Std.
Transportasia B Error Wald df Sig. Exp(B) Lower Bound Upper Bound

bus Intercept 3,398 1,168 8,471 1 ,004

[Jenis_kelamin=0] -,387 ,512 ,571 1 ,450 ,679 ,249 1,853

[Jenis_kelamin=1] 0b . . 0 . . . .

[Jenis_Pekerjaan=1] -,300 ,996 ,091 1 ,763 ,741 ,105 5,219

[Jenis_Pekerjaan=2] -,253 ,534 ,225 1 ,635 ,776 ,272 2,213

[Jenis_Pekerjaan=3] 0b . . 0 . . . .

[Pendapatan=1] -1,820 1,106 2,708 1 ,100 ,162 ,019 1,416

[Pendapatan=2] -2,492 1,075 5,371 1 ,020 ,083 ,010 ,681

[Pendapatan=3] 0b . . 0 . . . .

taxi Intercept 2,986 1,215 6,042 1 ,014

[Jenis_kelamin=0] -1,325 ,545 5,920 1 ,015 ,266 ,091 ,773

[Jenis_kelamin=1] 0b . . 0 . . . .

[Jenis_Pekerjaan=1] ,718 1,058 ,461 1 ,497 2,050 ,258 16,302

[Jenis_Pekerjaan=2] ,031 ,608 ,003 1 ,959 1,031 ,313 3,395


[Jenis_Pekerjaan=3] 0b . . 0 . . . .

[Pendapatan=1] -1,918 1,164 2,714 1 ,099 ,147 ,015 1,439

[Pendapatan=2] -2,086 1,127 3,425 1 ,064 ,124 ,014 1,131

[Pendapatan=3] 0b . . 0 . . . .

a. The reference category is: 2.


b. This parameter is set to zero because it is redundant.

Pada penelitian ini kategori variabel respon yang digunakan sebagai pembanding adalah kategori
TRAVEL, sehingga terbentuk dua fungsi logit , dimana logit 1 untuk kategori Bus dan logit 2 untuk
kategori Taxi. Model regresi logistik multinomial dapat ditulis seperti dibawah ini :

𝑒 3,398−0,387𝐽𝐾0−3,000𝐽𝑃1−0,253𝐽𝑃2−1,820𝑃1−2,492𝑃2
𝑝𝑟𝑜𝑏 (𝑦 = 1) =
1 + 𝑒 3,398−0,387𝐽𝐾0−3,000𝐽𝑃1−0,253𝐽𝑃2−1,820𝑃1−2,492𝑃2
𝑒 2,986−1,325𝐽𝐾0+0,718𝐽𝑃1+0,031𝐽𝑃2−1,918𝑃1−2,086𝑃2
𝑝𝑟𝑜𝑏 (𝑦 = 2) =
1 + 𝑒 2,986−1,325𝐽𝐾0+0,718𝐽𝑃1+0,031𝐽𝑃2−1,918𝑃1−2,086𝑃2

Keterangan:
Jenis Kelamin JK0: Laki-laki
JK1: Perempuan
Jenis Pekerjaan JP1: PNS
JP2: Swasta
JP3: Pelajar
Pendapatan P1: rendah
P2: sedang
P3: tinggi
INTERPRETASI
Dalam analisis regresi logistik multinomial parameter yang dapat kita interpretasi/artikan yaitu odd
rationya. Sehingga kita peroleh interpretasi sebagai berikut :
1. Interpretasi jenis kelamin laki-laki pada alat transportasi bus
Kecenderungan penumpang dengan jenis kelamin laki-laki untuk menggunakan alat transportasi Bus
dibandingkan alat transportasi travel sebesar 0,679 kali lipat dari penumpang dengan jenis kelamin
wanita
Atau
kecenderungan penumpang jenis kelamin wanita untuk menggunakan alat transportasi bus
dibandingkan travel sebesar 1,473 kalinya dari penumpang dengan jenis kelamin laki-laki.
2. Interpretasi jenis pekerjaan PNS pada alat transportasi bus
Kecenderungan penumpang dengan jenis pekerjaan PNS untuk menggunakan alat transportasi Bus
dibandingkan alat transportasi travel sebesar 0,741 kali lipat dari penumpang dengan jenis pekerjaan
pelajar.
Atau
Kecenderungan penumpang dengan jenis pekerjaan pelajar untuk menggunakan alat transportasi
Bus dibandingkan alat transportasi travel sebesar 1,349 kali lipat dari penumpang dengan jenis
pekerjaan PNS.
3. Interpretasi jenis pekerjaan Swasta pada alat transportasi Bus
Kecenderungan penumpang dengan jenis pekerjaan Swasta untuk menggunakan alat transportasi
Bus dibandingkan alat transportasi travel sebesar 0,776 kali lipat dari penumpang dengan jenis
pekerjaan pelajar
Atau
Kecenderungan penumpang dengan jenis pekerjaan pelajar untuk menggunakan alat transportasi
Bus dibandingkan alat transportasi travel sebesar 1,288 kali lipat dari penumpang dengan jenis
pekerjaan Swasta.
4. Interpretasi pendapatan rendah pada alat transportasi Bus
Kecenderungan penumpang dengan pendapatan rendah untuk menggunakan alat transportasi Bus
dibandingkan alat transportasi travel sebesar 0,162 kali lipat dari penumpang dengan pendapatan
tinggi.
Atau
Kecenderungan penumpang dengan pendapatan tinggi untuk menggunakan alat transportasi bus
dibandingkan alat transportasi travel sebesar 6,173 kalinya dari penumpang dengan pendapatan
rendah.
5. Interpretasi pendapatan sedang pada alat transportasi Bus
Kecenderungan penumpang dengan pendapatan sedang untuk menggunakan alat transportasi Bus
dibandingkan alat transportasi travel sebesar 0,083 kali lipat dari penumpang dengan pendapatan
tinggi.
Atau
Kecenderungan penumpang dengan pendapatan tinggi untuk menggunakan alat transportasi Bus
dibandingkan alat transportasi travel sebesar 12,048 kali lipat dari penumpang dengan pendapatan
sedang.
6. Interpretasi jenis kelamin laki-laki pada alat transportasi taxi
Kecenderungan penumpang dengan jenis kelamin laki-laki untuk menggunakan alat transportasi taxi
dibandingkan alat transportasi travel sebesar 0,266 kali lipat dari penumpang dengan jenis kelamin
wanita.
Atau
Kecenderungan penumpang dengan jenis kelamin wanita untuk menggunakan alat transportasi taxi
dibandingkan alat transportasi travel sebesar 3,759 kali lipat dari penumpang dengan jenis kelamin
laki-laki.
7. Interpretasi jenis pekerjaan PNS pada alat transportasi taxi
Kecenderungan penumpang dengan jenis pekerjaan PNS untuk menggunakan alat transportasi taxi
dibandingkan alat transportasi travel sebesar 2,050 kali lipat dari penumpang dengan jenis pekerjaan
pelajar.

8. Interpretasi jenis pekerjaan Swasta pada alat transportasi taxi


Kecenderungan penumpang dengan jenis pekerjaan Swasta untuk menggunakan alat transportasi
taxi dibandingkan alat transportasi travel sebesar 1,031 kali lipat dari penumpang dengan jenis
pekerjaan pelajar.

9. Interpretasi pendapatan rendah pada alat transportasi taxi


Kecenderungan penumpang dengan pendapatan rendah untuk menggunakan alat transportasi taxi
dibandingkan alat transportasi travel sebesar 0,147 kali lipat dari penumpang dengan pendapatan
tinggi.
Atau
Kecenderungan penumpang dengan pendapatan tinggi untuk menggunakan alat transportasi taxi
dibandingkan alat transportasi travel sebesar 6,803 kali lipat dari penumpang dengan pendapatan
rendah.
10. Interpretasi pendapatan sedang pada alat transportasi taxi
Kecenderungan penumpang dengan pendapatan sedang untuk menggunakan alat transportasi taxi
dibandingkan alat transportasi travel sebesar 0,124 kali lipat dari penumpang dengan pendapatan
tinggi.
Atau
Kecenderungan penumpang dengan pendapatan tinggi untuk menggunakan alat transportasi taxi
dibandingkan alat transportasi travel sebesar 8,064 kali lipat dari penumpang dengan pendapatan
sedang.

Sampel Size Regresi Logistik


𝑙𝑜𝑔𝑖𝑡(𝜋) = 𝛽0 + 𝛽1 𝑋
Ukuran sampel yang diperlukan untuk menguji H0: β1 = 0 tergantung pada distribusi nilai X. Menduga
probabilitas keberhasilan 𝜋̅ pada rata-rata X. Ukuran efeknya adalah odd ratio θ membandingkan 𝜋̅
dengan probabilitas keberhasilan satu standar deviasi di atas rata-rata X. Misalkan λ = log (θ). Rumus
ukuran sampel untuk tes satu sisi adalah
2
𝑛 = [𝑍𝛼 + 𝑍𝛽 exp(−𝜆2 ⁄4)] (1 + 2𝜋̅𝛿)/(𝜋̅𝜆2 )
𝛿 = [1 + (1 + 𝜆2 )exp(5𝜆2 /4)]/[1 + exp(−𝜆2 /4)]
𝜆 : log(odd ratio)
α : kesalahan tipe 1
β : kesalahan tipe 2

Diketahui
𝜋̅ = 0.08 , Rasio odds sama dengan 1.57, 𝜆 = log(1.57) = 0.45, 𝜆2 = 0.202, 𝛽 = 0.1, 𝛼 = 0.05,
𝑍𝛼 = 1.64, 𝑍𝛽 = 1.28

0.202
[1 + (1 + 0.202) exp (5 ×
𝛿= 4 )]
0.202
[1 + exp (− 4 )]
2.548
= = 1.306
1.951
[1.64 + 1.28 exp(−0.202⁄4)]2 (1 + 2 × 0.08 × 1.306)
𝑛= = 612
(0.08 × 0.202)
Power
Power adalah peluang untuk mendeteksi suatu efek, dengan syarat efek itu ada.

Power seharusnya sudah dihitung pada tahap perancangan studi sebelum penelitian dimulai, biasanya
digunakan 80%. Penurunan power dapat diperlambat dengan memperbesar ukuran sampel. Analisis
power dilakukan setelah penelitian dilakukan, yaitu jika ukuran sampel yang diinginkan tidak tercapai,
yaitu menghitung ulang power sesuai dengan ukuran sampel yang sebenarnya diperoleh. Jika pada
perhitungan ukuran sampel sebelum penelitian didapatkan ukuran sampel n1, tetapi pada pelaksanaan
penelitian hanya diperoleh ukuran sampel n2, maka setelah penelitian harus dilakukan analisis power
untuk menghitung ulang besar power yang sesungguhnya tercapai. Power dan beta tidak boleh
dispesifikasikan secara bersama (hanya salah satu yang dispesifikasikan), dengan hubungan 𝑝𝑜𝑤𝑒𝑟 =
1 − 𝛽.

Berdasar contoh soal sample size, diketahui kesalahan tipe 2 (𝛽 = 0.1) dan jumlah sampel minimal (n)
sebesar 612, maka dapat diketahui bahwa nilai power yaitu:
𝑝𝑜𝑤𝑒𝑟 = 1 − 𝛽 = 1 − 0.1 = 0.9
Maka dapat disimpulkan bahwa power yang ditargetkan sebesar 0.9 pada ukuran sampel minimal 612.

Refferensi:
Agresti, Alan. 2002. Categorical Data Analysis, Second Edition. Canada: John Willey & Sons.

Luthfatul, A. Modul Kelas Analisis Data Kategorik (Model Logistik)

Anda mungkin juga menyukai