Anda di halaman 1dari 17

D10F-6006 / 4 (3-1) SKS

ADK (Analisis
(A li i Data
D t Kategori)
K t i) -Tim Teaching ADK-

5
‐5‐
GENERALIZED LINEAR MODELS (GLM)
( )
• Komponen GLM
• GLM untuk data biner
• GLM untuk count data
• Inferens GLM

Genaralized Linear Models (GLM)

• Diperkenalkan
i oleh McCullagh dan Nelder
(1989)

• GLM digunakan untuk menyelesaikan


bentuk hubungan
g antara variabel p
prediktor
dengan variabel respon yang bersifat
kategori.

ADK 5: Generalized Linear Model (GLM) # Page: 2


Genaralized Linear Models (GLM)

ADK 5: Generalized Linear Model (GLM) # Page: 3

1 Komponen GLM
Komponen
p GLM

Untuk mempelajari
p j GLM p perlu diperhatikan
p 3
komponen yang terdapat didalamya

Komponen acak (Random Component)


1.

2. Komponen sistematik (Systematic Component)

3. Fungsi penghubung (Link function)

ADK 5: Generalized Linear Model (GLM) # Page: 5

1. Komponen acak (Random Component)

Komponen
p acak dari GLM
adalah
nilai-nilai
il i il i pengamatant respon Y
yang saling bebas dari
berdistribusi keluarga eksponen

ADK 5: Generalized Linear Model (GLM) # Page: 6


1. Komponen acak (Random Component)

f ( y ; θ ) = s ( y ) t (θ ) exp a ( y ) b (θ )

ADK 5: Generalized Linear Model (GLM) # Page: 7

1. Komponen
p acak ((Random Component)
p )

f ( y;θ ) = exp( a ( y )b (θ ) + c(θ ) + d ( y ))

s( y ) = exp d ( y ) t (θ ) = exp c (θ )

contoh
ADK 5: Generalized Linear Model (GLM) # Page: 8
Contoh :

a. Distribusi Poisson
λ ye−λ
f (y :λ) = , y = 0,1, 2, ...
y!
f ( y : λ ) = exp [ y log λ − λ − log y !]

a ( y ) b ( λ ) = y log λ
c (λ ) = − λ
d (y) = − log y !

ADK 5: Generalized Linear Model (GLM) # Page: 9

Contoh :

b. Distribusi Normal
Y ~ N ( μ , σ 2 )
1 ⎡ 1 2⎤
2 (
f (y : μ) = exp ⎢ − y−μ) ⎥
( 2πσ ) 2 1/ 2
⎣ 2σ ⎦
atau :
⎡ y2 y⋅μ μ2 ⎤
− log ( 2πσ 2 ) ⎥
1
f ( y : μ ) = exp ⎢ − + −
⎣ 2σ σ 2σ
2 2 2
2 ⎦

μ2
− log ( 2πσ 2 )
1
a ( y) = y ; c (μ ) = −
2σ 2
2
μ y2
b (μ ) = 2 ; d (y) = −
σ 2σ 2
ADK 5: Generalized Linear Model (GLM) # Page: 10
Contoh :

ADK 5: Generalized Linear Model (GLM) # Page: 11

2. Komponen
p Sistematik ((Systematic
y Component
p

Komponen sistematik dari GLM adalah satu set


parameter β1, β2, …, βp dan variabel explanatory
X = [ X1T, X2T, …, XnT ]T.

atau X yang membentuk kombinasi linier dari β :

η = α + β 1 X 1 + β 2 X 2 + β 3 X 3 + ... + β p X p

linier predictor
ADK 5: Generalized Linear Model (GLM) # Page: 12
3 Link Function
3.

ADK 5: Generalized Linear Model (GLM) # Page: 13

3 Link Function
3.
• Kita dapat memodelkan secara langsung atau
memodelkan suatu fungsi monoton :

Fungsi rerata yang merupakan kombinasi linier dari X

ADK 5: Generalized Linear Model (GLM) # Page: 14


Contoh :

ADK 5: Generalized Linear Model (GLM) # Page: 15

2 GLM Untuk Data Biner


GLM untuk Data Biner

ADK 5: Generalized Linear Model (GLM) # Page: 17

GLM untuk Data Biner

ADK 5: Generalized Linear Model (GLM) # Page: 18


GLM untuk Data Biner

ADK 5: Generalized Linear Model (GLM) # Page: 19

Tabel 3.1
Kebiasaan Mendengkur dan Penyakit Jantung
Contoh berikut diambil dari Agresti (2007) bagian 3.2.2. Data yang
digunakan
g didasarkan ppada survei epidemiologi
p g dari 2484 orangg
responden (subjek) yang diduga mendengkur pada saat tidur dan
mempunyai resiko terkena serangan jantung. Subjek dikelompokkan
berdasarkan tingkat dengkurannya yang di jelaskan oleh pasangan
mereka Data disajikan dalam tabel berikut ini
mereka.

Penyakit Jantung
Level Dengkuran Proporsi Ya
Ya Tidak
Tidak Pernah 24 1355 0.017
Kadang kadang
Kadang-kadang 35 603 0 06
0.06
Sering 21 192 0.1
Selalu 30 224 0.12

ADK 5: Generalized Linear Model (GLM) # Page: 20


GLM untuk Data Biner

ADK 5: Generalized Linear Model (GLM) # Page: 21

GLM untuk Data Biner

ADK 5: Generalized Linear Model (GLM) # Page: 22


GLM untuk Data Biner

ADK 5: Generalized Linear Model (GLM) # Page: 23

GLM untuk Data Biner

ADK 5: Generalized Linear Model (GLM) # Page: 24


GLM untuk Data Biner

π (x)
π (x) <0 
> 0 

0 X 0 X

ADK 5: Generalized Linear Model (GLM) # Page: 25

GLM untuk Data Biner


ƒ Besarnya β menentukan kecuraman kurva. Ketika β = 0
kurva mendatar sejajar dengan garis horizontal.
horizontal

ƒ Untuk data p pada Tabel 3.1 dengan


g bantuan software
untuk link function logit didapat :

ƒ β=0 4 mencerminkan kenaikan kena penyakit jantung


0,4
pada level mendengkur yang lebih tinggi.

Alternatif Lain :

ADK 5: Generalized Linear Model (GLM) # Page: 26


GLM untuk Data Biner
• Link Function Probit

Contoh:
• probit (0,05) = ‐1.645 karena P(X≤‐1.645)=0.05
• probit (0.5) = 0
• probit (0.95) = 1.645
• probit (0.975) = 1.96

ADK 5: Generalized Linear Model (GLM) # Page: 27

GLM untuk Data Biner


• Untuk data pada Tabel 3.1 dengan scores (0,2,4,5) melalui
bantuan software diperoleh:

• Untuk level mendengkur X=0,


X=0 probit menghasilkan:

• Atau

• Sehingga

• Dalam Tabel 3.1 ditunjukkan fitted value untuk setiap model


pada yang diberikan (Gambar 3.1). Dari ketiga link
f
function
ti i i mana model
ini, d l yang paling
li cocok?
k?

ADK 5: Generalized Linear Model (GLM) # Page: 28


Gambar 3.1
Grafik Peluang Prediksi dari tiga link function

ksi
Peluang Predik

Tingkat Dengkuran
ADK 5: Generalized Linear Model (GLM) # Page: 29

GLM untuk Data Biner

Untuk mengetahui model mana yang paling cocok ?


lakukan Uji Kecocokan Model (Goodness of Fit) dengan
statistik Wald atau Rasio Likelihood

ADK 5: Generalized Linear Model (GLM) # Page: 30


3 GLM Untuk Data Cacah/Count
Cacah/Count

GLM untuk Data Cacah ((Count Data))

ADK 5: Generalized Linear Model (GLM) # Page: 32


GLM untuk Data Cacah (Count Data)

ADK 5: Generalized Linear Model (GLM) # Page: 33

GLM untuk Data Cacah (Count Data)


• Overdispersi dapat diindikasikan dengan nilai dispersi
Chi Kuadrat Pearson dan Devians dibagi derajat
bebasnya.
Jika kedua nilai ini >1, maka terjadi overdispesi pada
data.

• Overdispersi dapat pula terjadi karena missing data


padad var independen,
i d d adanya
d pencilan,
il perlunya
l
interaksi dlm model, var bebas perlu ditransformasi, atau
kesalahan dalam spesifikasi link function.(Hardin and
Hilbe,
ilb 2007)
200 )

• Salah satu solusi untuk mengatasi overdispersi adalah


dengan menggunakan model Regresi Binom Negatif

ADK 5: Generalized Linear Model (GLM) # Page: 34

Anda mungkin juga menyukai