Anda di halaman 1dari 3

INFERENSI UNTUK REGRESI LOGISTIK

5.2.1 Tipe Inferensi Untuk model dengan sebuah predictor: logit[ ( )] Uji signifikansi fokus pada H0 : 0 (hipotesis independensi). Uji Wald atau kuadratnya. Di

menggunakan log Likelihood pada , dengan statistik uji bawah H0, z2 adalah asimtotik .

Uji Likelihood-rasio menggunakan dua kali deferens di antara maximized log likelihood pada dan pada 0 dan juga mempunyai asimtotik .

Uji score menggunakan log likelihood pada

0 melalui derivatif log likelihood

pada titik tersebut. tatistik uji membandingkan sufisien statistik untuk dengan nilai harapannya, standardized yang sesuai [N(0,1) atau ].

Untuk sampel besar, ketiga tes tersebut biasanya memberikan hasil yang sama. Uji Likelihood-rasio lebih disukai daripada Uji Wald. Likelihood-rasio menggunakan informasi yang lebih karena hal itu menggabungkan log likelihood pada H0 sebaik pada . Ketika | | relatif besar, maka uji Wald tidak sekuat uji Likelihood-rasio dan bahkan dapat menunjukkan perilaku menyimpang. Selang kepercayaan lebih informatif daripada uji-uji. elang untuk dihasilkan dari pembalikan uji dari H0 : 0. Interval adalah kumpulan dari 0 dimana statistik uji Chi( ) . Untuk pendekatan Wald, hal ini berarti ( ).

Squarenya tidak lebih besar daripada [( ) ]

; intervalnya adalah

Untuk meringkas hubungan, karakteristik lain mungkin memiliki kepentingan yang lebih besar daripada , seperti (x) pada berbagai nilai x. Untuk fixed logit [ ( )] dari: ( ) ( ) () ( , ) , . Substitusi ,

, memiliki SE sampel besar yang diberikan oleh estimasi square root

Selang kepercayaan 95% untuk logit [ ( )] adalah setiap endpoint ke transformasi inverse ( ) interval yang sesuai untuk ( ). exp(logit) [

exp(logit)] memberikan

Tiap metode inferensi juga dapat menghasilkan selang kepercayaan dan uji untuk sampel kecil.

5.2.3 Checking Goodness of Fit; Ungrouped and Grouped Data Dalam prakteknya, tidak ada jaminan bahwa model regresi logistik tertentu sesuai dengan data. Untuk beberapa tipe data biner, salah satu cara untuk mendeteksi lack of fit adalah menggunakan uji Likelihood-rasio untuk membandingkan model dengan model yang lebih kompleks. Model yang lebih kompleks mungkin berisi sebuah efek nonlinier, seperti bentuk kuadratik. Model-model dengan multiple prediction akan

mempertimbangkan interaksi. Jika model yang lebih kompleks tidak memberikan kesesuaian yang lebih baik, maka ini akan menyediakan beberapa jaminan bahwa model yang dipilih adalah masuk akal. Pendekatan lain untuk mendeteksi lack of fit search untuk banyak cara model gagal. Hali ini simpel ketika variabel penjelas hanya kategori. Pada masing-masing pengaturan x, salah satu akan mengalikan perkiraan probability dari dua hasil banyaknya subjek yang

diatur untuk memenuhi frekuensi ekspektasi estimasi untuk y = 0 dan y = 1. Itu semua adalah fitted value. Uji dari model membandingkan jumlah observasi dan fitted value menggunakan statistik Pearson X2 atau Likelihood-rasio G2. Untuk jumlah pengaturan yang tetap, sebagai peningkatan jumlah, X2 dan G2 mendekati distribusi Chi-Square. Derajat bebas disebut residual df untuk model, mengurangi banyaknya parameter di dalam model dari banyaknya parameter di dalam saturated model. Alasan pembatasan untuk prediktor kategori untuk uji secara umum berhubungan dengan perbedaan di Section 4.5.3 bahwa kita menyebutkan diantara grouped and ungrouped data untuk model binomial. Saturated model berbeda pada dua kasus. Sebuah asimtotik distribusi Chi-Square hasil deviance sebagai dengan banyaknya

parameter yang tetap di dalam model dan karenanya sebuah jumlah yang tetap dari pengaturan nilai prediktor.

Anda mungkin juga menyukai