Anda di halaman 1dari 12

DISTRIBUSI KELUARGA EKSPONENSIAL

DAN GLM DENGAN NONCANONICAL LINK FUNCTION

Diajukan untuk memenuhi salah satu tugas mata kuliah Analisis Data Kategorik
Dosen Pengampu : Dr. Yusep Suparman, S.Si., M.Sc.

Oleh:

Irvan Saeful Hamzah (140720210001)


Maryanto Rompon (140720210007)
Tilas Notapiri (140720210009)

PROGRAM STUDI MAGISTER STATISTIKA TERAPAN


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
2022
Distribusi Keluarga Eksponensial

Disebut distribusi keluarga eksponensial jika fungsi peluangnya dinyatakan sebagai:

(𝑦𝜃 − 𝑏(𝜃)
𝑓(𝑦; 𝜃, 𝜙) = 𝑒𝑥𝑝 [ 𝑎(𝜙)
+ 𝑐(𝑦, 𝜙)] (1)

1. Distribusi Bernoulli

𝑓(𝑦; 𝑝) = 𝑝 𝑦 (1 − 𝑝)1−𝑦 untuk 𝑦 ∈ {0,1}, 0 ≤ 𝑝 ≤ 1

1
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(𝑝) + 𝑙𝑜𝑔(1 − 𝑝) + 𝑦 𝑙𝑜𝑔 ( )}
1−𝑝

𝑝
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔 ( ) + 𝑙𝑜𝑔(1 − 𝑝)}
1−𝑝

Berdasarkan persamaan (1), maka canonical form-nya adalah

𝑝 𝑒𝑥𝑝 (𝜃)
𝜃 = 𝑙𝑜𝑔 ( ) 𝑝=
1−𝑝 1+𝑒𝑥𝑝 (𝜃)

𝑎(𝜙) = 1

𝑒𝑥𝑝(𝜃)
𝑏(𝜃) = − 𝑙𝑜𝑔(1 − 𝑝) = −𝑙𝑜𝑔 (1 − ) = 𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))
1 + 𝑒𝑥𝑝(𝜃)

𝑐(𝑦, 𝜃) = 0

Mean dan varians:

𝜕 𝑒𝑥𝑝(𝜃)
𝐸(𝑦) = 𝑏 ′ (𝜃) = (𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))) = =𝑝
𝜕𝜃 1 + 𝑒𝑥𝑝(𝜃)

𝜕2 𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(𝜃) 1
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = 1. 2
(𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))) = 2
= .
𝜕𝜃 (1 + 𝑒𝑥𝑝(𝜃)) 1 + 𝑒𝑥𝑝(𝜃) 1 + 𝑒𝑥𝑝(𝜃)

𝜕2
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = (𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃))) = 𝑝(1 − 𝑝)
1. 𝜕𝜃 2

Link Function:

Canonical link: 𝑔(𝜇) = 𝜃

𝑒𝑥𝑝(𝜃)
𝐸(𝑦) = 𝜇 = 1+𝑒𝑥𝑝(𝜃) = 𝑝

𝑝 𝜇
𝑔(𝜇) = 𝑙𝑜𝑔 ( ) = 𝑙𝑜𝑔 ( )
1−𝑝 1−𝜇
Maka link function untuk distribusi bernoulli adalah logit link function.

2. Distribusi Geometrik

𝑓(𝑦; 𝑝) = (1 − 𝑝)𝑦−1 𝑝 untuk 𝑦 ∈ {1,2,3, … }, 0 ≤ 𝑝 ≤ 1

1
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(1 − 𝑝) + 𝑙𝑜𝑔 ( ) + 𝑙𝑜𝑔(𝑝)}
1−𝑝

𝑝
𝑓(𝑦; 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(1 − 𝑝) + 𝑙𝑜𝑔 ( )}
1−𝑝

Berdasarkan persamaan (1), maka canonical form-nya adalah

𝜃 = 𝑙𝑜𝑔(1 − 𝑝) 𝑝 = 1 − 𝑒𝑥𝑝(𝜃)

𝑎(𝜙) = 1

𝑝 1 − 𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(𝜃)
𝑏(𝜃) = − 𝑙𝑜𝑔 ( ) = −𝑙𝑜𝑔 ( ) = 𝑙𝑜𝑔 ( )
1−𝑝 𝑒𝑥𝑝(𝜃) 1 − 𝑒𝑥𝑝(𝜃)

𝑐(𝑦, 𝜃) = 0

Mean dan varians:

𝜕 𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(𝜃) 1 1
𝐸(𝑦) = 𝑏 ′ (𝜃) = (𝑙𝑜𝑔 ( )) = 1 + = =
𝜕𝜃 1 − 𝑒𝑥𝑝(𝜃) 1 − 𝑒𝑥𝑝(𝜃) 1 − 𝑒𝑥𝑝(𝜃) 1 − 𝑝

𝜕2 𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(𝜃) 1−𝑝


𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = 1. 2
(𝑙𝑜𝑔 ( )) = 2
= 2
𝜕𝜃 1 − 𝑒𝑥𝑝(𝜃) (1 − 𝑒𝑥𝑝(𝜃)) 𝑝

Link Function:

1
𝐸(𝑦) = 𝜇 =
1 − 𝑒𝑥𝑝(𝜃)

1 1
Misal 𝛾 = =
1−𝑒𝑥𝑝(𝜃) 𝑒𝑥𝑝(−𝜃)−1

Diinverskan:

𝛾 −1 = 𝑒𝑥𝑝(−𝜃) − 1

𝛾 −1 = 𝑒𝑥𝑝(−𝜃) − 1

𝛾 −1 + 1 = 𝑒𝑥𝑝(−𝜃)

𝑙𝑜𝑔(𝛾 −1 + 1) = −𝜃
1
𝑙𝑜𝑔 ( )=𝜃
𝛾 −1 +1

Masukkan kembali 𝛾 = 𝐸(𝑦) = 𝜇, maka

1 1 1+𝜇
𝑙𝑜𝑔 (1 ) = 𝜃 , dimana +1=
⁄𝜇+1 𝜇 𝜇

𝜇
𝑔(𝜇) = 𝑙𝑜𝑔 (1+𝜇)

Maka link function untuk distribusi geometrik adalah logit link function.

3. Distribusi Binomial Negatif

𝑓(𝑦; 𝑟, 𝑝) = (𝑦+𝑟−1
𝑦
) (1 − 𝑝)𝑦 𝑝𝑟 untuk 𝑟 > 0, 0 ≤ 𝑦 ≤ ∞, 0 ≤ 𝑝 ≤ 1

𝑦+𝑟−1
𝑓(𝑦; 𝑟, 𝑝) = 𝑒𝑥𝑝 {𝑦 𝑙𝑜𝑔(1 − 𝑝) + 𝑟 𝑙𝑜𝑔(𝑝) + 𝑙𝑜𝑔 ( )}
𝑦

Berdasarkan persamaan (1), maka canonical form-nya adalah

𝜃 = 𝑙𝑜𝑔(1 − 𝑝) 𝑝 = 1 − 𝑒𝑥𝑝(𝜃)

𝑎(𝜙) = 1

𝑏(𝜃) = −𝑟 𝑙𝑜𝑔(𝑝) = −𝑟 𝑙𝑜𝑔(1 − 𝑒𝑥𝑝(𝜃))

𝑦+𝑟−1
𝑐(𝑦, 𝜃) = 𝑙𝑜𝑔 ( )
𝑦

Mean dan varians:

𝜕 𝑟 𝑒𝑥𝑝(𝜃) 𝑟(1 − 𝑝)
𝐸(𝑦) = 𝑏 ′ (𝜃) = (−𝑟 𝑙𝑜𝑔(1 − 𝑒𝑥𝑝(𝜃))) = =
𝜕𝜃 1 − 𝑒𝑥𝑝(𝜃) 𝑝

𝜕2 𝑟. 𝑒𝑥𝑝(𝜃) 𝑟(1 − 𝑝)
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = 2 (−𝑟 𝑙𝑜𝑔(1 − 𝑒𝑥𝑝(𝜃))) = 2
=
𝜕𝜃 (1 − 𝑒𝑥𝑝(𝜃)) 𝑝2

Link Function:

𝑟 𝑒𝑥𝑝(𝜃)
𝐸(𝑦) = 𝜇 =
1 − 𝑒𝑥𝑝(𝜃)

𝑟 𝑒𝑥𝑝(𝜃) 𝑟
Misal 𝛾 = 1−𝑒𝑥𝑝(𝜃) = 𝑒𝑥𝑝(−𝜃)−1

Diinverskan:
𝑒𝑥𝑝(−𝜃) − 1
𝛾 −1 =
𝑟

𝑟 𝛾 −1 = 𝑒𝑥𝑝(−𝜃) − 1

𝑟 𝛾 −1 + 1 = 𝑒𝑥𝑝(−𝜃)

𝑙𝑜𝑔(𝑟 𝛾 −1 + 1) = −𝜃

1
𝑙𝑜𝑔 ( )=𝜃
𝑟 𝛾 −1 + 1

Masukkan kembali 𝛾 = 𝐸(𝑦) = 𝜇, maka

1 𝑟 𝑟+𝜇
𝑙𝑜𝑔 (𝑟 ) = 𝜃 , dimana +1=
⁄𝜇+1 𝜇 𝜇

𝜇
𝑔(𝜇) = 𝑙𝑜𝑔 (𝑟+𝜇), merupakan salah satu bentuk link function, yaitu logit link function.

Maka link function untuk distribusi binomial negatif adalah logit link function.

4. Distribusi Gamma

𝛽𝛼
𝑓(𝑦; 𝛼, 𝛽) = Γ(𝛼) 𝑦 𝛼−1 𝑒 −𝛽𝑦 untuk 𝑦 > 0 𝛼, 𝛽 > 0

𝑓(𝑥; 𝛼, 𝛽) = 𝑒𝑥𝑝(𝛼𝑙𝑜𝑔𝛽 − log(Γ(𝛼)) + (𝛼 − 1)𝑙𝑜𝑔𝑦 − 𝛽𝑦)

𝑓(𝑥; 𝛼, 𝛽) = 𝑒𝑥𝑝(−𝛽𝑦 + 𝛼𝑙𝑜𝑔𝛽 + (𝛼 − 1)𝑙𝑜𝑔𝑦 − log(Γ(𝛼)))

𝛽
− 𝛼 𝑦 + 𝑙𝑜𝑔𝛽
𝑓(𝑥; 𝛼, 𝛽) = 𝑒𝑥𝑝 ( + (𝛼 − 1)𝑙𝑜𝑔𝑦 − log(Γ(𝛼)))
1⁄
𝛼

𝛽
𝑦 − 𝑙𝑜𝑔𝛽
𝑓(𝑥; 𝛼, 𝛽) = 𝑒𝑥𝑝 (𝛼 + (𝛼 − 1)𝑙𝑜𝑔𝑦 − log(Γ(𝛼)))
− 1⁄𝛼

Untuk mendapatkan bentuk seperti persamaan (1), misal:

𝑎(𝜙) = − 1⁄𝛼 , 𝜙 = 1⁄𝛼

𝛽
𝜃= , ∴ 𝛽 = 𝜃𝛼 atau 𝛽 = 𝜃⁄𝜙 <=> 𝑙𝑜𝑔𝛽 = 𝑙𝑜𝑔𝜃 − 𝑙𝑜𝑔𝜙
𝛼

jika disubstitusikan kembali, maka:


𝑦𝜃 − 𝑙𝑜𝑔𝜃 𝑙𝑜𝑔𝜙 1 1
𝑒𝑥𝑝 [ + + ( − 1) 𝑙𝑜𝑔𝑦 − 𝑙𝑜𝑔 (𝛤 ( ))]
−𝜙 𝜙 𝜙 𝜙

Sehingga canonical form untuk distribusi gamma adalah:

𝛽
𝜃=𝛼

𝑎(𝜙) = −𝜙

𝑏(𝜃) = 𝑙𝑜𝑔(𝜃)

𝑙𝑜𝑔𝜙 1 1
𝑐(𝑦, 𝜃) = + ( − 1) 𝑙𝑜𝑔𝑦 − 𝑙𝑜𝑔 (𝛤 ( ))
𝜙 𝜙 𝜙

Mean dan varians:

𝜕 1 𝛼
𝐸(𝑦) = 𝑏 ′ (𝜃) = 𝑙𝑜𝑔(𝜃) = =
𝜕𝜃 𝜃 𝛽

𝜕2 𝜙 1 𝛼2 𝛼
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = −𝜙. 𝑙𝑜𝑔(𝜃) = = . =
𝜕𝜃2 𝜃2 𝛼 𝛽2 𝛽2

Link Function:

Canonical link: 𝑔(𝐸(𝑦)) = 𝜃

1
𝐸(𝑦) = 𝜇 = 𝜃 Maka : 𝑔(𝜇) = 𝜃 −1

Sehingga link function untuk distribusi gamma adalah inverse link.

5. Distribusi Inverse Gaussian

𝜆 𝜆(𝑦−𝜇)2
𝑓(𝑦; 𝜇, 𝜆) = √ 𝑒𝑥𝑝 (− ) untuk 𝑦 > 0 𝜇>0 𝜆>0
2𝜋𝑦 3 2𝜇2 𝑦

Log pada kedua sisi:

1 1 𝜆(𝑦 − 𝜇)2
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) −
2 2 2𝜇2 𝑦

1 1 𝜆(𝑦 2 − 2𝜇𝑦 + 𝜇2 )
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) −
2 2 2𝜇2 𝑦

1 1 𝜆𝑦 2 − 2𝜆𝜇𝑦 + 𝜆𝜇2
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) −
2 2 2𝜇2 𝑦
1 1 𝜆𝑦 𝜆 𝜆
𝑙𝑜𝑔 𝑓(𝑦; 𝜇, 𝜆) = 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) − 2 + −
2 2 2𝜇 𝜇 2𝑦

Kedua sisi di exponentialkan:

1 1 𝜆𝑦 𝜆 𝜆
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 ( 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ) − 2 + − )
2 2 2𝜇 𝜇 2𝑦

𝜆𝑦 𝜆 𝜆 1 1
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 (− 2
+ − + 𝑙𝑜𝑔𝜆 − 𝑙𝑜𝑔(2𝜋𝑦 3 ))
2𝜇 𝜇 2𝑦 2 2

𝜆𝑦 𝜆 𝜆 1 𝜆
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 (− + − + 𝑙𝑜𝑔 ( ))
2𝜇2 𝜇 2𝑦 2 2𝜋𝑦 3

1 1
( 2 𝑦 − 𝜇) 𝜆 1 𝜆
2𝜇
𝑓(𝑦; 𝜇, 𝜆) = 𝑒𝑥𝑝 − + 𝑙𝑜𝑔 ( )
− 1⁄𝜆 2𝑦 2 2𝜋𝑦 3
( )

Untuk mendapatkan bentuk seperti persamaan (1), misal:

1 1
𝜃 = 𝜇2 ∴ √𝜃 = 𝜇

𝜙 = 1⁄𝜆 ∴ 𝑎(𝜙) = − 2⁄𝜆 = −2𝜙

jika disubstitusikan kembali, maka:

𝜃𝑦 − 2√𝜃 1 1 1
𝑒𝑥𝑝 ( − + 𝑙𝑜𝑔 ( ))
−2𝜙 2𝜙𝑦 2 2𝜋𝜙𝑦 3

Sehingga canonical form untuk distribusi inverse Gaussian adalah:

1 1
𝜃 = 𝜇2 𝜇 = √𝜃

𝑎(𝜙) = −2𝜙

𝑏(𝜃) = 2√𝜃

1 1 1
𝑐(𝑦, 𝜃) = − + 𝑙𝑜𝑔 ( )
2𝜙𝑦 2 2𝜋𝜙𝑦 3

Mean dan varians:

𝜕 1
𝐸(𝑦) = 𝑏 ′ (𝜃) = 2√𝜃 = =𝜇
𝜕𝜃 √𝜃
𝜕2 1 1 𝜇3
𝑉𝑎𝑟(𝑦) = 𝑎(𝜙)𝑏 ′′ (𝜃) = −2𝜙. 𝜕𝜃2 2√𝜃 = 𝜙 3 = 𝜆 . 𝜇3 =
(𝜃) ⁄2 𝜆

Link Function:

1 1
Canonical link: 𝑔 ( ) = 𝜇2
√𝜃

Canonical link: 𝑔(𝐸(𝑦)) = 𝜃

1 1
𝐸(𝑦) = 𝜇 = Maka : 𝑔(𝜇) =
√𝜃 𝜇2

Sehingga link function untuk distribusi inverse Gaussian adalah inverse square link.
Tabel 1. Ringkasan

Binomial Negatif Gamma Inverse Gaussian


Item Bernoulli Geometrik
NB(r,p) 𝚪(𝜶, 𝜷) 𝑰𝑮(𝝁, 𝝀)

𝑦+𝑟−1 𝛽 𝛼 𝛼−1 −𝛽𝑦 𝜆 𝜆(𝑦 − 𝜇)2


𝑓(𝑦; 𝑝) = 𝑝 𝑦 (1 − 𝑝)1−𝑦 𝑓(𝑦; 𝑝) = (1 − 𝑝)𝑦−1 𝑝 𝑓(𝑦; 𝑟, 𝑝) = ( ) (1 − 𝑝)𝑦 𝑝𝑟 𝑓(𝑦; 𝛼, 𝛽) = 𝑦 𝑒 𝑓(𝑦; 𝜇, 𝜆) = √ 𝑒𝑥𝑝 (− )
𝑦 Γ(𝛼) 2𝜋𝑦 3 2𝜇 2 𝑦
Pdf untuk 𝑦 ∈ {0,1} untuk 𝑦 ∈ {1,2,3, … } untuk 𝑟 > 0 untuk 𝑦 > 0 untuk 𝑦 > 0
0≤𝑝≤1 0≤𝑝≤1 0≤𝑦≤∞ 𝛼, 𝛽 > 0 𝜇>0
0≤𝑝≤1 𝜆>0

𝑎(𝜙) 1 1 1 − 1⁄𝛼 − 2⁄𝜆


𝑒𝑥𝑝(𝜃)
𝑏(𝜃) 𝑙𝑜𝑔(1 + 𝑒𝑥𝑝(𝜃)) 𝑙𝑜𝑔 ( ) −𝑟 𝑙𝑜𝑔(1 − 𝑒𝑥𝑝(𝜃)) 𝑙𝑜𝑔(𝜃) 2√𝜃
1 − 𝑒𝑥𝑝(𝜃)
𝑦+𝑟−1 𝑙𝑜𝑔𝜙 1 1 1 1 1
𝑐(𝑦, 𝜃) 0 0 𝑙𝑜𝑔 ( ) + ( − 1) 𝑙𝑜𝑔𝑦 − 𝑙𝑜𝑔 (𝛤 ( )) − + 𝑙𝑜𝑔 ( )
𝑦 𝜙 𝜙 𝜙
2𝜙𝑦 2 2𝜋𝜙𝑦 3
𝑝 𝛽 1
𝜃 𝑙𝑜𝑔 ( ) 𝑙𝑜𝑔(1 − 𝑝) 𝑙𝑜𝑔(1 − 𝑝)
1−𝑝 𝛼 𝜇2
𝑒𝑥𝑝 (𝜃) 1
𝜇(𝜃) 1 − 𝑒𝑥𝑝(𝜃) 1 − 𝑒𝑥𝑝(𝜃) 𝜃𝛼 √
1 + 𝑒𝑥𝑝 (𝜃) 𝜃
1 𝑟(1 − 𝑝) 𝛼
𝐸(𝑦) 𝑝 𝜇
1−𝑝 𝑝 𝛽
1−𝑝 𝑟(1 − 𝑝) 𝛼 𝜇3
𝑉𝑎𝑟(𝑦) 𝑝(1 − 𝑝)
𝑝2 𝑝2 𝛽2 𝜆
𝜇 𝜇 𝜇 1
Link 𝑔(𝜇) = 𝑙𝑜𝑔 ( ) 𝑔(𝜇) = 𝑙𝑜𝑔 ( ) 𝑔(𝜇) = 𝑙𝑜𝑔 ( ) 𝑔(𝜇) = 𝜇−1 𝑔(𝜇) =
1−𝜇 1+𝜇 𝑟+𝜇 𝜇2
function
(Logit link) (Logit link) (Logit link) (Inverse link) (inverse square link)
GLM dengan Non Canonical Link Function

1. GLM dengan Binomial dan probit link


• 𝑌𝑖 berdistribusi binomial dengan mean 𝑛𝑝 dan varians 𝑛𝑝(1 − 𝑝). Variabel respon Y, berasal
dari distribusi keluarga eksponensial dengan fungsi kepadatan peluang:

𝑓(𝑦; 𝑝) = (𝑛𝑦) 𝑝 𝑦 (1 − 𝑝)𝑛−𝑦 untuk 𝑦 = 0,1, … , 𝑛 0<𝑝<1

• Komponen sistematik adalah 𝜂(𝑋𝑖1 , … , 𝑋𝑖𝑞 ) = 𝛼 + 𝛽1 𝑋𝑖1 + ⋯ + 𝛽𝑖𝑞 , untuk 𝑖 = 1,2, … , 𝑛


• Fungsi penghubung (link function) yang menghubungkan 𝐸(𝑌𝑖 ) dengan prediktor linear
𝜂(𝑋𝑖1 , … , 𝑋𝑖𝑞 ) adalah inverse CDF dari distribusi normal standar untuk merubah probabilitas
menjadi varibel normal standar.
Berdasarkan penjelasan di atas maka model GLM dapat dituliskan sebagai berikut:
𝑌𝑖 ~𝐵𝐼𝑁(𝑛, 𝑝)
𝐸(𝑌𝑖 ) = 𝑛𝑝 dan 𝑉𝑎𝑟(𝑌𝑖 ) = 𝑛𝑝(1 − 𝑝)
Φ−1 (𝑝𝑖 ) = 𝜂(𝑋𝑖1 , … , 𝑋𝑖𝑞 )
dimana
𝑧
1 1 2
Φ(𝑧) = ∫ 𝑒 −2𝑡 𝑑𝑡
−∞ √2𝜋

Model ini juga disebut sebagai model probit, yaitu GLM dengan distribusi binomial dan probit
link. Model probit mengasumsikan bahwa random errors memiliki distribusi multivariate
normal. Asumsi ini membuat model probit lebih menarik karena distribusi normal merupakan
pendekatan yang baik untuk banyak distribusi. Model ini juga tidak bergantung pada asumsi
error independence.

2. GlM dengan Binomial Glogit link

Pada Regresi Binomial, peluang 𝑝𝑖 = 𝑃(𝑦𝑖 = 1) diprediksi dengan menerapkan link function ke
kombinasi linear dari variable prediktor yang mengikuti model :

𝐹 −1 (𝑝𝑖 ) = 𝑥𝑖, 𝛽

dimana 𝐹 −1 (. ) disebut sebagai link function. Binomial regresi model, menerapkan inverse dari
Eksponensial-Eksponensial Logistic (EEL) cdf yang dinamai glogit. Link function Glogit dibentuk
dari fungsi kuantil distribusi EEL standar pada saat 𝜇 = 0 dan 𝑠 = 1.

Link function Glogit 𝐹 −1𝑔𝑙 dapat didefinisikan sebagai berikut:


1⁄
1⁄
𝐹 −1𝑔𝑙 (𝑝) = 𝑔𝑙𝑜𝑔𝑖𝑡(𝑝) = log (1 − (1 − 𝑝 𝛼) 𝜆) ; 𝛼=𝜆=1

Model Regresi Glogit dari 𝐹 −1𝑔𝑙 diatas dapat dinyatakan sebagai berikut :

1⁄
1⁄
𝑔𝑙𝑜𝑔𝑖𝑡(𝑝𝑖 ) = log (1 − (1 − 𝑝𝑖 𝛼 ) 𝜆) = 𝑥′𝑖 𝛽 ; 𝑖 = 1,2, … , 𝑛

′ −𝜆 𝛼
Dengan 𝑝𝑖 = 𝐹𝑔𝑡 (𝑥 ′ 𝑖 𝛽 ) = (1 − (1 + 𝑒 (𝑥 𝑖 𝛽) ) ) dimana 𝐹𝑔𝑡 (. ) adalah cdf dari distribusi EEL

pada saat 𝜇 = 0 dan 𝑠 = 1.

3. GLM dengan Binomial complementary loglog link

Model log-log komplementer kadang-kadang disebut juga sebagai model nilai-ekstrem (Lawal,
2003) dan dicirikan oleh

𝑓(𝑦) = 𝛽1 exp[(𝛽0 + 𝛽1 𝑦) − 𝑒𝑥𝑝(𝛽0 + 𝛽1 𝑦)]


dan

𝜋(𝑥) = 1 − exp[−𝑒𝑥𝑝(𝛽0 + 𝛽1 𝑦)]


Suatu transformasi dalam bentuk

ln [− ln(1 − 𝜋)] = 𝛽0 + 𝛽1
Akan mentransformasikan π(x) ke dalam bentuk model linear. Fungsi hubung ln[–ln(1 – π)] disebut
juga sebagai fungsi log-log komplementer. Menurut Lawal (2003) model ini biasanya lebih banyak
digunakan dibandingkan model probit dan logit untuk π yang bernilai mendekati 0 atau 1.

4. GLM dengan Invers Gaussian Regression


Fungsi kepadatan probabilitasnya dapat didefinisikan sebagai berikut :
2
1 1 𝑦−𝜇
𝑓(𝑦, 𝜇, 𝜏) = 𝑒𝑥𝑝 {− ( ) } ; 𝑦, 𝜇, 𝜏 > 0
3
√2𝜋𝑦 𝜏 2𝑦 𝜇√𝜏

Dengan 𝐸(𝑦) = 𝜇 dan 𝑉𝑎𝑟(𝑦) = 𝜏𝜇3


Model Invers Gaussian Regression (IGR) dianggap juga sebagai anggota keluarga GLM.
Mengikuti metodologi GLM, persamaan diatas dapat ditulis ulang ke dalam bentuk keluarga
eksponensial sebagai berikut:
Dalam GLM, fungsi penghubung merupakan fungsi yang monoton dan terdiferensiasi yang
menghubungkan rata-rata variabel respons dengan prediktor linier 𝜂𝑖 = 𝒙𝒊 𝑻 𝜷 . Karena 𝜂𝑖
bergantung pada 𝜷 dan mean dari variabel respon adalah fungsi dari 𝜂𝑖 , maka 𝐸[𝑦𝑖 ] = 𝜇𝑖 =
𝑔−1 (𝒙𝒊 𝑻 𝜷). Dan canonical link function untuk IGR adalah:
1
𝜂=
𝜇2
1
Maka 𝜇𝑖 = , i = 1,2, … , n
√𝒙𝒊 𝑻 𝜷

Parameter dari model dengan inverse link sulit untuk diinterpretasikan maka link log biasanya
dianggap lebih berguna, oleh karena itu log link biasanya lebih disukai (Jong & Heller, 2008).
Maka non-canonical link function untuk IGR adalah:
𝜂 = 𝑙𝑜𝑔(𝜇)
Maka 𝜇𝑖 = 𝑒𝑥𝑝(𝒙𝒊 𝑻 𝜷), i = 1,2, … , n

5. GLM dengan Negative Binomial log link


Karena mean dan varians sama untuk distribusi Poisson, Poisson regresi mungkin tidak sesuai
untuk memodelkan jumlah data dengan banyak nol. Dalam hal ini, mungkin lebih tepat
menggunakan regresi binomial negatif; yaitu, kita asumsikan bahwa yi Negative Binomial(α, i), di
mana probability density function (pdf) untuk setiap yi, i = 1, . . . , n, adalah
Γ(𝑦𝑖 + 𝛼) 𝜇𝑖 𝑦𝑖 𝛼 𝛼
𝑓(𝑦𝑖 Ι 𝛼, 𝜇𝑖 ) = ( ) ( ) 𝑦𝑖 = 0,1,2, . . ..
𝑦𝑖 ! Γ(𝛼) 𝜇𝑖 + 𝛼 𝜇𝑖 + 𝛼

𝜇𝑖2
dan kita asumsikan parameter ukuran 𝛼 > 0 diketahui. Karena 𝑉𝑎𝑟(𝑦𝑖 ) = 𝜇𝑖 + 𝛼
, distribusi

binomial negatif lebih siap untuk menangani zero-inflated count data dari distribusi Poisson. Untuk
𝜇𝑖
respon binomial negatif, parameter alaminya adalah 𝜃𝑖 = log ( ). Dengan fungsi tautan log,
(𝜇𝑖 +𝛼

kita punya 𝑏(𝑢) = −𝛼 log(1 − 𝑒 𝑢 ) dan 𝜆 = 1 dan g(u) = log(u) . Dapat dilihat bahwa 𝐸(𝑦𝑖 ) =
𝑏 ′ (𝜃𝑖 ) = 𝜇𝑖 . Mendefinisikan fungsi 𝜉 = (𝑔𝑜𝑏 ′ )−1 , kita memiliki 𝜉𝑢 = −log (𝛼𝑒 −𝑢 + 1) .
Dimana 𝜉𝑢 ≠ 𝑢, negative regresi binomial dengan log link adalah contoh model regresi dengan
fungsi non-kanonik link.

Anda mungkin juga menyukai