exp ( α+ βx )
π (x )= (5.1). Log odds mempunyai hubungan linear
1+exp ( α + βx )
π (x)
logit [ π ( x ) ]=log =α + βx (5.2).
1−π ( x )
eα
memusatkan predictor di 0, α menjadi logit di x=x́, dan π ( x́ ) = .
1+e α
yaitu merupakan estimator yang setidaknya bias dari bentuk tersebut untuk log
yang sebenarnya.
Plot 5.2 berisi titik titik dengan y i=0 dan y i=1 ,garis x yang menunjukan
female crab carapace width dan simbol yang bernomer menunjukan banyaknya
observasi dari setiap titik. Dari plot dapat terlihat bahwa y i=1 (female crab
minimal memiliki satu satelit) cenderung lebih sering terjadi pada nilai x
(female crab carapace width) yang lebih besar. Dengan catatan bahwa setiap
crab dengan carapace width lebih dari 29 cm memiliki satelit.
Dari setiap carapace width akan dibuat proporsi sampel dari crab yang
mempunyai sateit dan rata rata carapace width untuk setiap kategori. Plot 5.2
menunjukan 8 titik yang memperlihatkan proporsi sampel dari female crab
yang memiliki satelit diplot terhadap rata rata carapace width.
Plot 5.2 juga memperlihatkan kurva berdasarkan smoothing dengan
menggunakan metode generalized additive modelling dengan asumsi respon
binomial dan link logit. Kurva ini membentuk tren yang meningkat. Ini
menunjukan bahwa regresi s-shaped dapat menjelaskan hubungan secara baik,
karena baik 8 titik sampel proporsi maupun metode generalized additive
modelling (GAM) memperlihatkan tren yang meningkat sehingga akan
digunakan model regresi logistik dengan carapace width sebagai predictor
linear.
1 α^ 12.351
probability sama dengan ketika x= ^ = =24.8
2 β 0.497
Plot 5.3 adalah plot ^π ( x ) dari regresi logistic terhadap carapace width. Terlihat
bahwa kurva mengikuti tren dengan cukup baik dalam proporsi tersebut.
Estimated odds dari satelit dikalikan dengan exp ( β^ ) =exp ( 0.497 )=1.64 untuk
setiap peningkatan satu satuan pada carapace width (yaitu 64% peningkatan).
Pada rata rata carapace width ^π ( x ) =0.674 dan ^π ( x ) meningkat sekitar
^β ¿¿=0.497 (0.674)(0.326)=0.11
Untuk setiap peningkatan satu satuan carapace width. Misalkan ingin dilihat
berdasarkan quantil. Quantil bawah, median da quantil atas dari carapace width
yaitu 24.9,26.1, dan 27.7 sehingga ^π ( x ) untuk setiap quantil yaitu 0.51,0.65, dan
0.81, meningkat sebesar 0.30.
Akan dilihat juga perbandingan dari efek predictor dari setiap unit. Misalnya
female crab weight sebagai predictor, logit [ ^π ( x ) ] =−3.695+1.815 x
Untuk peningkatan 1 kg carapace width tidak sebanding dengan peningkatan 1
cm carapace width sehingga ^β=1.815 untuk x=carapace width tidak
sebanding dengan ^β=0.497 untuk x=carapace width.
Pada studi retrospektif, kita dapat mengestimasi odds ratio. Efek pada model
regresi logistik mengacu pada odds ratio. Kita dapat mengkonstruksi model dan
mengestimasi efek pada studi kasus kontrol.
∑ [ P ( Z=1| y= j , x ) P ( Y = j|x ) ]
j=0
ρ1 exp ( α + βx)
P ( Y =1|z=1 , x )=
ρ0+ ρ 1 exp (α + βx)
logit [ P ( Y =1|z=1 , x ) ] =α ¿ + βx
¿
dengan α =α + log ( ρ1 / ρ0 ). Model regresi logistik memiliki efek parameter β yang
sama seperti pada model untuk P ( Y =1|x ). Jika rasio sampling dari kasus lebih
besar dari yang control, estimasi intercept akan lebih besar daripada yang
diestimasi dengan stusi prospektif.
Dalam studi kasus control, tidak dapat diestimasi β pada model respon
berpasangan dengan hubungan yang bukan logit. Tidak seperti odds ratio, efek
dari distribusi X bersyarat y tidak sama dengan Y bersyarat x.
model logistic dengan β=(μ1−μ0 )/σ 2. Jadi, jika populasinya adalah mixture dari
dua tipe subjek, yang pertama y=1 berdistribusi normal dan yang kedua y=0
berdistribusi normal dengan variansi yang serupa, regresi logistic akan memiliki
aproksimasi yang baik untuk kurva π ( x ) . Jika berdistribusi normal tetapi memili
variansi yang jauh berbeda, maka model menerapkan bentuk quadratic. Pada kasus
ini hubungan yang terjadi tidak monoton, dengan π ( x ) meningkat kemudian
menurun, atau sebaliknya.
Model logistic dengan satu prediktor: logit [ π ( x ) ]=α+ βx. Tes signifikansi
dengan Hipotesis: H 0 : β=0 , hipotesis independensi
Uji Wald menggunakan log likelihood ^β , dengan statistic uji
β^
z= atau kuadratnya dibawah H 0
SE
Uji Likelihood-ratio menggunakan dua kali perbedaan antara maksimum log
pada ^β dan pada β=0 dan memiliki distribusi null X 12
Uji Score memiliki log likelihood saat β=0 melalui turunan log likelihood
pada titik itu.
Statistik Uji membandingkan statistic cukup untuk β dengan nilai nol yang
diharapkan sesuai standar ¿
^ 2
β−β ^
] ≤ z α / 2 maka intervalnya adalah β ± z α ( SE ) .
0 2
Untuk pendekatan Wald, [
SE 2
setiap titik akhir ke dalam invers transformasi π ( x0 ) =exp ( logit ) /[1+ exp ( logit ) ]
dimana
Karena nilai corr(α ̂, β ̂) mendekati 1.0, untuk penghitungan yang lebih baik,
gunakan model dengan prediktor x* = x – 26.5, sehingga α ̂ dan SE nya menjadi
estimasi logit dan SE. Gambar 5.4 menunjukkan confidence bands di sekitar nilai
prediksi untuk π(x) sebagai fungsi dari x.
Kita dapat menggunakan hanya proporsi sampel. Enam kepiting perempuan
pada sampel memiliki x = 26.5 dan empat dari mereka memiliki satelit. CI 95%
berdasarkan dari 6 observasi ini bernilai (0.30 , 0.90); sementara CI 95% untuk
model bernilai (0.61 , 0.77). Daripada menggunakan hanya 6 observasi, model
yang menggunakan seluruh 173 observasi menghasilkan estimasi parameter yang
lebih tepat.