Diajukan untuk memenuhi salah satu tugas mata kuliah Analisis Data Kategorik
Dosen Pengampu : Dr. Yusep Suparman, S.Si., M.Sc.
Oleh:
(𝑦𝜃 − 𝑏(𝜃)
𝑓(𝑦; 𝜃, 𝜙) = 𝑒𝑥𝑝 [ 𝑎(𝜙)
+ 𝑐(𝑦, 𝜙)] (1)
1. Distribusi Bernoulli
1
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(𝑝) + 𝑙𝑜𝑔(1 − 𝑝) + 𝑦 𝑙𝑜𝑔 ( )}
1−𝑝
𝑝
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔 ( ) + 𝑙𝑜𝑔(1 − 𝑝)}
1−𝑝
𝑝 𝑒𝑥𝑝 (𝜃)
𝜃 = 𝑙𝑜𝑔 ( ) 𝑝=
1−𝑝 1+𝑒𝑥𝑝 (𝜃)
𝑎(𝜙) = 1
𝑒𝑥𝑝(𝜃)
𝑏(𝜃) = − 𝑙𝑜𝑔(1 − 𝑝) = −𝑙𝑜𝑔 (1 − ) = 𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))
1 + 𝑒𝑥𝑝(𝜃)
𝑐(𝑦, 𝜃) = 0
𝜕 𝑒𝑥𝑝(𝜃)
𝐸(𝑦) = 𝑏 ′ (𝜃) = (𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))) = =𝑝
𝜕𝜃 1 + 𝑒𝑥𝑝(𝜃)
𝜕2 𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(𝜃) 1
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = 1. 2
(𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))) = 2
= .
𝜕𝜃 (1 + 𝑒𝑥𝑝(𝜃)) 1 + 𝑒𝑥𝑝(𝜃) 1 + 𝑒𝑥𝑝(𝜃)
𝜕2
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = (𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))) = 𝑝(1 − 𝑝)
1. 𝜕𝜃 2
Link Function:
𝑒𝑥𝑝(𝜃)
𝐸(𝑦) = 𝜇 = 1+𝑒𝑥𝑝(𝜃) = 𝑝
𝑝 𝜇
𝑔(𝜇) = 𝑙𝑜𝑔 ( ) = 𝑙𝑜𝑔 ( )
1−𝑝 1−𝜇
Maka link function untuk distribusi bernoulli adalah logit link function.
2. Distribusi Geometrik
1
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(1 − 𝑝) + 𝑙𝑜𝑔 ( ) + 𝑙𝑜𝑔(𝑝)}
1−𝑝
𝑝
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(1 − 𝑝) + 𝑙𝑜𝑔 ( )}
1−𝑝
𝜃 = 𝑙𝑜𝑔(1 − 𝑝) 𝑝 = 1 − 𝑒𝑥𝑝(𝜃)
𝑎(𝜙) = 1
𝑝 1 − 𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(𝜃)
𝑏(𝜃) = − 𝑙𝑜𝑔 ( ) = −𝑙𝑜𝑔 ( ) = 𝑙𝑜𝑔 ( )
1−𝑝 𝑒𝑥𝑝(𝜃) 1 − 𝑒𝑥𝑝(𝜃)
𝑐(𝑦, 𝜃) = 0
𝜕 𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(𝜃) 1 1
𝐸(𝑦) = 𝑏 ′ (𝜃) = (𝑙𝑜𝑔 ( )) = 1 + = =
𝜕𝜃 1 − 𝑒𝑥𝑝(𝜃) 1 − 𝑒𝑥𝑝(𝜃) 1 − 𝑒𝑥𝑝(𝜃) 1 − 𝑝
Link Function:
1
𝐸(𝑦) = 𝜇 =
1 − 𝑒𝑥𝑝(𝜃)
1 1
Misal 𝛾 = =
1−𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(−𝜃)−1
Diinverskan:
𝛾 −1 = 𝑒𝑥𝑝(−𝜃) − 1
𝛾 −1 = 𝑒𝑥𝑝(−𝜃) − 1
𝛾 −1 + 1 = 𝑒𝑥𝑝(−𝜃)
𝑙𝑜𝑔(𝛾 −1 + 1) = −𝜃
1
𝑙𝑜𝑔 ( )=𝜃
𝛾 −1 +1
1 1 1+𝜇
𝑙𝑜𝑔 (1 ) = 𝜃 , dimana +1=
⁄𝜇+1 𝜇 𝜇
𝜇
𝑔(𝜇) = 𝑙𝑜𝑔 (1+𝜇)
Maka link function untuk distribusi geometrik adalah logit link function.
𝑓(𝑦; 𝑟, 𝑝) = (𝑦+𝑟−1
𝑦
) (1 − 𝑝)𝑦 𝑝𝑟 untuk 𝑟 > 0, 0 ≤ 𝑦 ≤ ∞, 0 ≤ 𝑝 ≤ 1
𝑦+𝑟−1
𝑓(𝑦; 𝑟, 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(1 − 𝑝) + 𝑟 𝑙𝑜𝑔(𝑝) + 𝑙𝑜𝑔 ( )}
𝑦
𝜃 = 𝑙𝑜𝑔(1 − 𝑝) 𝑝 = 1 − 𝑒𝑥𝑝(𝜃)
𝑎(𝜙) = 1
𝑦+𝑟−1
𝑐(𝑦, 𝜃) = 𝑙𝑜𝑔 ( )
𝑦
𝜕 𝑟 𝑒𝑥𝑝(𝜃) 𝑟(1 − 𝑝)
𝐸(𝑦) = 𝑏 ′ (𝜃) = (−𝑟 𝑙𝑜𝑔(1 − 𝑒𝑥𝑝(𝜃))) = =
𝜕𝜃 1 − 𝑒𝑥𝑝(𝜃) 𝑝
𝜕2 𝑟. 𝑒𝑥𝑝(𝜃) 𝑟(1 − 𝑝)
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = 2 (−𝑟 𝑙𝑜𝑔(1 − 𝑒𝑥𝑝(𝜃))) = 2
=
𝜕𝜃 (1 − 𝑒𝑥𝑝(𝜃)) 𝑝2
Link Function:
𝑟 𝑒𝑥𝑝(𝜃)
𝐸(𝑦) = 𝜇 =
1 − 𝑒𝑥𝑝(𝜃)
𝑟 𝑒𝑥𝑝(𝜃) 𝑟
Misal 𝛾 = 1−𝑒𝑥𝑝(𝜃) = 𝑒𝑥𝑝(−𝜃)−1
Diinverskan:
𝑒𝑥𝑝(−𝜃) − 1
𝛾 −1 =
𝑟
𝑟 𝛾 −1 = 𝑒𝑥𝑝(−𝜃) − 1
𝑟 𝛾 −1 + 1 = 𝑒𝑥𝑝(−𝜃)
𝑙𝑜𝑔(𝑟 𝛾 −1 + 1) = −𝜃
1
𝑙𝑜𝑔 ( )=𝜃
𝑟 𝛾 −1 + 1
1 𝑟 𝑟+𝜇
𝑙𝑜𝑔 (𝑟 ) = 𝜃 , dimana +1=
⁄𝜇+1 𝜇 𝜇
𝜇
𝑔(𝜇) = 𝑙𝑜𝑔 (𝑟+𝜇), merupakan salah satu bentuk link function, yaitu logit link function.
Maka link function untuk distribusi binomial negatif adalah logit link function.
4. Distribusi Gamma
𝛽𝛼
𝑓(𝑦; 𝛼, 𝛽) = Γ(𝛼) 𝑦 𝛼−1 𝑒 −𝛽𝑦 untuk 𝑦 > 0 𝛼, 𝛽 > 0
𝛽
− 𝛼 𝑦 + 𝑙𝑜𝑔𝛽
𝑓(𝑥; 𝛼, 𝛽) = 𝑒𝑥𝑝 ( + (𝛼 − 1)𝑙𝑜𝑔𝑦 − log(Γ(𝛼)))
1⁄
𝛼
𝛽
𝑦 − 𝑙𝑜𝑔𝛽
𝑓(𝑥; 𝛼, 𝛽) = 𝑒𝑥𝑝 (𝛼 + (𝛼 − 1)𝑙𝑜𝑔𝑦 − log(Γ(𝛼)))
− 1⁄𝛼
𝛽
𝜃= , ∴ 𝛽 = 𝜃𝛼 atau 𝛽 = 𝜃⁄𝜙 <=> 𝑙𝑜𝑔𝛽 = 𝑙𝑜𝑔𝜃 − 𝑙𝑜𝑔𝜙
𝛼
𝛽
𝜃=𝛼
𝑎(𝜙) = −𝜙
𝑏(𝜃) = 𝑙𝑜𝑔(𝜃)
𝑙𝑜𝑔𝜙 1 1
𝑐(𝑦, 𝜃) = + ( − 1) 𝑙𝑜𝑔𝑦 − 𝑙𝑜𝑔 (𝛤 ( ))
𝜙 𝜙 𝜙
𝜕 1 𝛼
𝐸(𝑦) = 𝑏 ′ (𝜃) = 𝑙𝑜𝑔(𝜃) = =
𝜕𝜃 𝜃 𝛽
𝜕2 𝜙 1 𝛼2 𝛼
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = −𝜙. 𝑙𝑜𝑔(𝜃) = = . =
𝜕𝜃2 𝜃2 𝛼 𝛽2 𝛽2
Link Function:
1
𝐸(𝑦) = 𝜇 = 𝜃 Maka : 𝑔(𝜇) = 𝜃 −1
𝜆 𝜆(𝑦−𝜇)2
𝑓(𝑦; 𝜇, 𝜆) = √ 𝑒𝑥𝑝 (− ) untuk 𝑦 > 0 𝜇>0 𝜆>0
2𝜋𝑦 3 2𝜇2 𝑦
1 1 𝜆(𝑦 − 𝜇)2
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) −
2 2 2𝜇2 𝑦
1 1 𝜆(𝑦 2 − 2𝜇𝑦 + 𝜇2 )
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) −
2 2 2𝜇2 𝑦
1 1 𝜆𝑦 2 − 2𝜆𝜇𝑦 + 𝜆𝜇2
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) −
2 2 2𝜇2 𝑦
1 1 𝜆𝑦 𝜆 𝜆
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) − 2 + −
2 2 2𝜇 𝜇 2𝑦
1 1 𝜆𝑦 𝜆 𝜆
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 ( 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) − 2 + − )
2 2 2𝜇 𝜇 2𝑦
𝜆𝑦 𝜆 𝜆 1 1
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 (− 2
+ − + 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ))
2𝜇 𝜇 2𝑦 2 2
𝜆𝑦 𝜆 𝜆 1 𝜆
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 (− + − + 𝑙𝑜𝑔 ( ))
2𝜇2 𝜇 2𝑦 2 2𝜋𝑦 3
1 1
( 2 𝑦 − 𝜇) 𝜆 1 𝜆
2𝜇
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 − + 𝑙𝑜𝑔 ( )
− 1⁄𝜆 2𝑦 2 2𝜋𝑦 3
( )
1 1
𝜃 = 𝜇2 ∴ √𝜃 = 𝜇
𝜃𝑦 − 2√𝜃 1 1 1
𝑒𝑥𝑝 ( − + 𝑙𝑜𝑔 ( ))
−2𝜙 2𝜙𝑦 2 2𝜋𝜙𝑦 3
1 1
𝜃 = 𝜇2 𝜇 = √𝜃
𝑎(𝜙) = −2𝜙
𝑏(𝜃) = 2√𝜃
1 1 1
𝑐(𝑦, 𝜃) = − + 𝑙𝑜𝑔 ( )
2𝜙𝑦 2 2𝜋𝜙𝑦 3
𝜕 1
𝐸(𝑦) = 𝑏 ′ (𝜃) = 2√𝜃 = =𝜇
𝜕𝜃 √𝜃
𝜕2 1 1 𝜇3
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = −2𝜙. 𝜕𝜃2 2√𝜃 = 𝜙 3 = 𝜆 . 𝜇3 =
(𝜃) ⁄2 𝜆
Link Function:
1 1
Canonical link: 𝑔 ( ) = 𝜇2
√𝜃
1 1
𝐸(𝑦) = 𝜇 = Maka : 𝑔(𝜇) =
√𝜃 𝜇2
Sehingga link function untuk distribusi inverse Gaussian adalah inverse square link.
Tabel 1. Ringkasan
Model ini juga disebut sebagai model probit, yaitu GLM dengan distribusi binomial dan probit
link. Model probit mengasumsikan bahwa random errors memiliki distribusi multivariate
normal. Asumsi ini membuat model probit lebih menarik karena distribusi normal merupakan
pendekatan yang baik untuk banyak distribusi. Model ini juga tidak bergantung pada asumsi
error independence.
Pada Regresi Binomial, peluang 𝑝𝑖 = 𝑃(𝑦𝑖 = 1) diprediksi dengan menerapkan link function ke
kombinasi linear dari variable prediktor yang mengikuti model :
𝐹 −1 (𝑝𝑖 ) = 𝑥𝑖, 𝛽
dimana 𝐹 −1 (. ) disebut sebagai link function. Binomial regresi model, menerapkan inverse dari
Eksponensial-Eksponensial Logistic (EEL) cdf yang dinamai glogit. Link function Glogit dibentuk
dari fungsi kuantil distribusi EEL standar pada saat 𝜇 = 0 dan 𝑠 = 1.
Model Regresi Glogit dari 𝐹 −1𝑔𝑙 diatas dapat dinyatakan sebagai berikut :
1⁄
1⁄
𝑔𝑙𝑜𝑔𝑖𝑡(𝑝𝑖 ) = log (1 − (1 − 𝑝𝑖 𝛼 ) 𝜆) = 𝑥′𝑖 𝛽 ; 𝑖 = 1,2, … , 𝑛
′ −𝜆 𝛼
Dengan 𝑝𝑖 = 𝐹𝑔𝑡 (𝑥 ′ 𝑖 𝛽 ) = (1 − (1 + 𝑒 (𝑥 𝑖 𝛽) ) ) dimana 𝐹𝑔𝑡 (. ) adalah cdf dari distribusi EEL
Model log-log komplementer kadang-kadang disebut juga sebagai model nilai-ekstrem (Lawal,
2003) dan dicirikan oleh
ln [− ln(1 − 𝜋)] = 𝛽0 + 𝛽1
Akan mentransformasikan π(x) ke dalam bentuk model linear. Fungsi hubung ln[–ln(1 – π)] disebut
juga sebagai fungsi log-log komplementer. Menurut Lawal (2003) model ini biasanya lebih banyak
digunakan dibandingkan model probit dan logit untuk π yang bernilai mendekati 0 atau 1.
Parameter dari model dengan inverse link sulit untuk diinterpretasikan maka link log biasanya
dianggap lebih berguna, oleh karena itu log link biasanya lebih disukai (Jong & Heller, 2008).
Maka non-canonical link function untuk IGR adalah:
𝜂 = 𝑙𝑜𝑔(𝜇)
Maka 𝜇𝑖 = 𝑒𝑥𝑝(𝒙𝒊 𝑻 𝜷), i = 1,2, … , n
𝜇𝑖2
dan kita asumsikan parameter ukuran 𝛼 > 0 diketahui. Karena 𝑉𝑎𝑟(𝑦𝑖 ) = 𝜇𝑖 + 𝛼
, distribusi
binomial negatif lebih siap untuk menangani zero-inflated count data dari distribusi Poisson. Untuk
𝜇𝑖
respon binomial negatif, parameter alaminya adalah 𝜃𝑖 = log ( ). Dengan fungsi tautan log,
(𝜇𝑖 +𝛼
kita punya 𝑏(𝑢) = −𝛼 log(1 − 𝑒 𝑢 ) dan 𝜆 = 1 dan g(u) = log(u) . Dapat dilihat bahwa 𝐸(𝑦𝑖 ) =
𝑏 ′ (𝜃𝑖 ) = 𝜇𝑖 . Mendefinisikan fungsi 𝜉 = (𝑔𝑜𝑏 ′ )−1 , kita memiliki 𝜉𝑢 = −log (𝛼𝑒 −𝑢 + 1) .
Dimana 𝜉𝑢 ≠ 𝑢, negative regresi binomial dengan log link adalah contoh model regresi dengan
fungsi non-kanonik link.