OLEH:
KELOMPOK 4
2
B. ESTIMASI FREKUENSI HARAPAN
Estimasi frekuensi harapan merupakan perkiraan yang terjadi dari nilai masing-
masing kategori pada setiap variabelnya. Misal diasumsikan sebuah model (AC, BC)
dengan A dan B adalah variabel bebas dan C adalah variabel terikat memenuhi:
𝑝𝑖+𝑘 𝑝+𝑗𝑘
𝑝𝑖𝑗𝑘 = 𝑝++𝑘
, untuk semua i, j dan k
Menurut Bishop (2007), untuk sampel berdistribusi Poisson digunakan rumus yang
berkaitan dengan frekuensi harapan
𝑚𝑖+𝑘 𝑚+𝑗𝑘
𝑚𝑖𝑗𝑘 = 𝛿𝑖𝑗𝑘
𝑚++𝑘
dari persamaan tersebut kemudian diperoleh estimasi m_ijk yaitu
𝑛𝑖+𝑘 𝑛+𝑗𝑘
𝑚̂ 𝑖𝑗𝑘 = 𝛿𝑖𝑗𝑘
𝑛++𝑘
Keterangan :
1,𝑢𝑛𝑡𝑢𝑘 𝑠𝑒𝑙 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑖𝑠𝑖
𝛿𝑖𝑗𝑘 = {0,𝑢𝑛𝑡𝑢𝑘 𝑠𝑒𝑙 𝑘𝑜𝑠𝑜𝑛𝑔
3
Untuk 3 Dimensi
2
2
(𝑛𝑖𝑗𝑘 − 𝑚𝑖𝑗𝑘 )
∗
𝜒 =Σ
𝑚𝑖𝑗𝑘
keterangan ∶
𝑛𝑖𝑗𝑘 ∶ 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖 𝑝𝑎𝑑𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙 𝑖, 𝑗 𝑑𝑎𝑛 𝑘
𝑚𝑖𝑗𝑘 ∶ 𝑁𝑖𝑙𝑎𝑖 𝐻𝑎𝑟𝑎𝑝𝑎𝑛 𝑝𝑎𝑑𝑎 𝑠𝑒𝑙 𝑖 , 𝑗 𝑑𝑎𝑛 𝑘
Σ ∗ menunjukkan bahwa sel yang digunakan hanya sel yang terisi saja (Bishop, 2007),
2 2
Apabila 𝜒ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝜒𝑡𝑎𝑏𝑒𝑙 dengan taraf signifikansi 𝛼=0,05 maka gagal tolak 𝐻0 yang berarti
model Log Linear yang digunakan sesuai dengan keadaan sebenarnya.
Selain statistik chi square, dapat juga menggunakan statistik rasio Likelihood dengan
rumus sebagai berikut:
Untuk 2 Dimensi
(𝑛𝑖𝑗 )
𝐺 2 = 2Σ ∗ 𝑛𝑖𝑗 log
𝑚𝑖𝑗
Untuk 3 Dimensi
(𝑛𝑖𝑗𝑘 )
𝐺 2 = 2Σ ∗ 𝑛𝑖𝑗𝑘 log
𝑚𝑖𝑗𝑘
Derajat bebas dalam uji Goodness of Fit ini adalah selisih antara jumlah sel yang bebas
dengan model yang ditentukan. Perhitungan derajat bebas pada tabel kontingensi tak
sempurna yaitu derajat bebas pada tabel kontingensi sempurna dikurangi banyaknya sel
kosong.
Jika dihitung secara manual, maka derajat bebas pada tabel sempurna dapat dihitung
sebagai berikut:
Tabel 5 Tabel Derajat Bebas
Model Log Linear Derajat bebas
(A,B,C) IJK – I – J – K + 2
(AB,C) (IJ - 1) (K - 1)
(AC,B) (IK - 1) (J - 1)
(BC,A) (JK - 1) (I - 1)
(AB,BC) J (I - 1) (K - 1)
(AC,BC) K (I - 1) (J - 1)
(AB,AC) I (J -1) (K - 1)
(AB,AC,BC) (I - 1) (J - 1) (K - 1)
(ABC) 0
4
D. ESTIMASI PARAMETER MODEL LOG LINEAR
1. Tabel 2 Dimensi
1.1 Model Bebas (Independen)
Diketahui probabilitas dari sel kategori 2 dimensi yang saling bebas sehingga
𝑝𝑖𝑗 = 𝑝𝑖+ . 𝑝+𝑗
dalam bentuk logaritma diperoleh persamaan
log (𝑝𝑖𝑗 ) = log(𝑝𝑖+ . 𝑝+𝑗 )
dan jika diketahui 𝑚𝑖𝑗 = 𝑛. 𝑝𝑖𝑗
𝑚𝑖+ = 𝑛 . 𝑝𝑖+
𝑚𝑖𝑗 = 𝑛 . 𝑝𝑖+ . 𝑝+𝑗
𝑚𝑖+ = 𝑛 . 𝑝𝑖+ 𝑑𝑎𝑛 𝑚+𝑗 = 𝑛. 𝑝+𝑗
maka
𝑚𝑖𝑗 𝑚𝑖+ 𝑚+𝑗
=( )( )
𝑛 𝑛 𝑛
(𝑚𝑖+ )(𝑚+𝑗 )
𝑚𝑖𝑗 =
𝑛
sehingga
dan bila variabel baris dilambangkan dengan A, variabel kolom dengan B. Maka model bebasnya
dapat disajikan dalam persamaan berikut ini:
5
∑𝐽𝑗=1 log(𝑚𝑖𝑗 )
𝜆𝑖𝐴 = −μ
𝐽
∑𝐼𝐼=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝑗𝐵 = −μ
𝐼
Dengan syarat
𝐼 𝐽
∑ 𝜆𝑖𝐴 = ∑ 𝜆𝐵𝑖 = 0
𝑖=1 𝑗=1
keterangan :
𝑚𝑖𝑗 =frekuensi harapan dalam sel-ij
μ = parameter rata-rata keseluruhan
𝜆𝑖𝐴 =parameter pengaruh tingkat i faktor A
𝜆𝐵𝑖 = parameter pengaruh tingkat j faktor B
𝐴𝐵
𝜆𝑖𝑗 =parameter pengaruh faktor interaksi sel – ij
dimana,
∑𝐼𝑖=1 ∑𝐽𝑗=1 log(𝑚𝑖𝑗 )
μ=
𝐼𝐽
∑𝐽𝑗=1 log(𝑚𝑖𝑗 )
𝜆𝑖𝐴 = −μ
𝐽
∑𝐼𝐼=1 log(𝑚𝑖𝑗 )
𝜆𝐵𝑖 = −μ
𝐼
∑𝐽𝑗=1 𝑚𝑖𝑗 ∑𝐼𝐼=1 𝑚𝑖𝑗 ∑𝐼𝑖=1 ∑𝐽𝑗=1 𝑚𝑖𝑗
𝐴𝐵
𝜆𝑖𝑗 = log 𝑚𝑖𝑗 − − + − μ
𝐽 𝐼 𝐼𝐽
Dengan syarat
𝐼 𝐽 𝐼 𝐽
∑ 𝜆𝑖𝐴 = ∑ 𝜆𝐵𝑖 == ∑ 𝐴𝐵
𝜆𝑖𝑗 =∑ 𝐴𝐵
𝜆𝑖𝑗 =0
𝑖=1 𝑗=1 𝑖=1 𝑗=1
6
2. Tabel 3 Dimensi
Model log linear merupakan salah satu cara menganalisis data kategorik jika variabel
yang diperhatikan dalam suatu data kategorik tersebut berbentuk variabel kategorik. Ada dua
model log linear untuk tabel kontingensi yaitu model bebas dan model lengkap.
sehingga
(𝑚𝑖++ )(𝑚+𝑗+ )(𝑚++𝑘 )
log(𝑚𝑖𝑗𝑘 ) = log [ ]
𝑛2
log(𝑚𝑖𝑗𝑘 ) = log 𝑚𝑖++ + log 𝑚+𝑗+ + log 𝑚++𝑘 − 2 log 𝑛
dan bila variabel baris dilambangkan dengan A, variabel kolom dengan B dan variabel layer
dengan C, maka
7
𝜆𝐶𝑖 =parameter pengaruh tingkat k faktor C
Untuk mencari nilai parameter dari μ, 𝜆𝑖𝐴 , 𝜆𝐵𝑖 , 𝑑𝑎𝑛 𝜆𝐶𝑖
∑𝐼𝑖=1 ∑𝐽𝑗=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
μ=
𝐼𝐽𝐾
∑𝐽𝑗=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝑖𝐴 = −μ
𝐽𝐾
∑𝐼𝐼=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝐵𝑖 = −μ
𝐼𝐾
∑𝐼𝑖=1 ∑𝐽𝑗=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝐶𝑖 = −μ
𝐼𝐽
Dengan syarat
𝐼 𝐽 𝐾
∑ 𝜆𝑖𝐴 = ∑ 𝜆𝐵𝑖 =∑ 𝜆𝐶𝑖 = 0
𝑖=1 𝑗=1 𝑘=1
8
∑𝐼𝐼=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝐵𝑖 = −μ
𝐼𝐾
∑𝐼𝑖=1 ∑𝐽𝑗=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝐶𝑖 = −μ
𝐼𝐽
∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
∑𝐽𝑗=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 ) ∑𝐼𝐼=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
𝐴𝐵
𝜆𝑖𝑗 = − − − μ
𝐾 𝐽𝐾 𝐼𝐾
∑𝐽𝑗=1 log(𝑚𝑖𝑗𝑘 ) ∑𝐽𝑗=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 ) ∑𝐼𝑖=1 ∑𝐽𝑗=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝐵𝐶
𝑖 = − − −μ
𝐽 𝐽𝐾 𝐼𝐽
∑𝐼𝑖=1 log(𝑚𝑖𝑗𝑘 ) ∑𝐼𝐼=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
∑𝐼𝑖=1 ∑𝐽𝑗=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝑖𝐴𝐶 = − − −μ
𝐼 𝐼𝐾 𝐼𝐽
𝐽
∑𝐼𝑖=1 log(𝑚𝑖𝑗𝑘 ) ∑𝑗=1 log(𝑚𝑖𝑗𝑘 ) ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
𝜆𝑖𝐴𝐵𝐶 = log(𝑚𝑖𝑗𝑘 ) − − −
𝐼 𝐽 𝐾
∑𝐼𝑖=1 ∑𝐽𝑗=1 log(𝑚𝑖𝑗𝑘 ) ∑𝐼𝐼=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
∑𝐽𝑗=1 ∑𝐾
𝑘=1 log(𝑚𝑖𝑗𝑘 )
+ + +
𝐼𝐽 𝐼𝐾 𝐽𝐾
Dengan syarat
𝐼 𝑗 𝐾
𝐼 𝐽 𝐾 𝐼 𝐽
∑ 𝜆𝑖𝐴 =∑ 𝜆𝐵𝑖 = ∑ 𝜆𝐶𝑖 =∑ 𝐴𝐵
𝜆𝑖𝑗 =∑ 𝐴𝐶
𝜆𝑖𝑗 = ⋯ = ∑ ∑ ∑ 𝜆𝐶𝑖 = 0
𝑖=1 𝑗=1 𝑘=1 𝑖=1 𝑗=1
𝑖=1 𝑗=1 𝑘=1
9
Contoh 1:
Tentukan estimasi parameter log linier dan berikan kesimpulan dari data 964 orang yang
terdiri dari dua kategori, yaitu diagnosa penyakit diabetes dan kebiasaan minum kopi yang
termuat pada tabel berikut:
Penyelesaian :
Kebiasaan
Diagnosa
No Tidak Minum Total
Diabetes Tipe 2 Minum Kopi
Kopi
1 Normal 148 334 482
2 DM Tipe 2 242 240 482
Jumlah 390 574 964
Model log linier :
Keterangan :
𝑣𝑖𝑗 = Logaritma natural (ln) dari peluang sel (i,j)
𝜇 = Rataan Umum
𝜆𝑖𝐴 = Kontribusi Diagnosa Diabetes tipe 2
𝜆𝑗𝐵 = Kontribusi kebiasaan
𝐴𝐵
𝜆𝑖𝑗 = interaksi (menunjukkan bebas tidaknya A dan B dalam membentuk 𝑃𝑖𝑗 )
ln 𝑛𝑖𝑗 :
Kebiasaan
Diagnosa Diabetes
No Tidak Minum
Tipe 2 Minum Kopi
Kopi
1 Normal 4.99 5.81
2 DM Tipe 2 5.49 5.48
Sehingga:
Estimasi Parameter
𝑣11 +𝑣12 −𝑣21 −𝑣22 4.99+5.81−5.49−5.48
𝜆̂1𝐴 = = = −0.04 → 𝜆̂2𝐴 = 0.04
4 4
𝑣11 −𝑣12 +𝑣21 −𝑣22 4.99−5.81+5.49−5.48
𝜆̂1𝐵 = = = −0.20 → 𝜆̂𝐵2 = 0.20
4 4
10
𝑣11 −𝑣12 −𝑣21 +𝑣22 4.99−5.81−5.49+5.48
𝜆̂11
𝐴𝐵
= = = −0.21 → 𝜆̂12
𝐴𝐵
= 0.21; 𝜆̂21
𝐴𝐵
= 0.21; 𝜆̂22
𝐴𝐵
=
4 4
−0.21
𝜇̂ = 5.44
Hipotesis :
𝐻0 : A dan B bebas (𝑃𝑖𝑗 = 𝑃𝑖. 𝑃.𝑗 , ∀𝑖𝑗 )
Kebiasaan
Diagnosa
No Tidak Minum
Diabetes Tipe 2 Minum Kopi
Kopi
1 Normal 195 287
2 DM Tipe 2 195 287
ln 𝑒𝑖𝑗 :
Kebiasaan
Diagnosa
No Tidak Minum
Diabetes Tipe 2 Minum Kopi
Kopi
1 Normal 5.27 5.66
2 DM Tipe 2 5.27 5.66
Estimasi Parameter
𝑣11 +𝑣12 −𝑣21 −𝑣22 5.27+5.66−5.27−5.66
𝜆̂1𝐴 = = = 00 → 𝜆̂2𝐴 = 0
4 4
𝑣11 −𝑣12 +𝑣21 −𝑣22 5.27−5.66+5.27−5.66
𝜆̂1𝐵 = = = −0.19 → 𝜆̂𝐵2 = 0.19
4 4
𝜇̂ = 5.46
11
Evaluasi 𝜆̂𝑖𝑗
𝐴𝐵
dilakukan dengan cara membandingkan model 𝑣𝑖𝑗 = 𝜇 + 𝜆𝑖𝐴 + 𝜆𝑗𝐵 + 𝜆𝑖𝑗
𝐴𝐵
Contoh 2:
Tentukan estimasi parameter log linier dan berikan kesimpulan dari data BPS Kabupaten
Sleman yang diperoleh pada table, dimana memuat data 238.275 orang dan diklasifikasikan
berdasarkan tiga kategori yaitu pendidikan, jenis kelamin dan umur sebagai berikut:
Keterangan:
Kategori anak-anak umur 7-12 tahun
Kategori muda umur 13-15 tahun
12
Kategori
Variabel 1: 1 (Anak-Anak)
2 (Muda)
Variabel 2: 1 (SD)
2 (SMP)
Variabel 3: 1 (Laki-laki)
2 (Perempuan)
i j k frekuensi ln frek
1 1 1 38587 10.5607
1 1 2 34365 10.4448
1 2 1 2797 7.9363
1 2 2 3298 8.10107
2 1 1 3006 8.00837
2 1 2 1503 7.31522
2 2 1 20201 9.91349
2 2 2 18750 9.83895
Estimasi parameter
∑2𝑗=1 ∑2𝑘=1 ln 𝑚1𝑗𝑘 ∑2𝑖=1 ∑2𝑗=1 ∑2𝑘=1 ln 𝑚𝑖𝑗𝑘
𝜆1𝐴 = − = 9.260 – 9.014 = 0.2458
𝑗𝑘 𝑖𝑗𝑘
13
𝐴𝐵𝐶 ln 𝑚111 + ln 𝑚122 + ln 𝑚212 + ln 𝑚221 ∑2𝑖=1 ∑2𝑗=1 ∑2𝑘=1 ln 𝑚𝑖𝑗𝑘
𝜆111 = − = 8.972– 9.014 = -0.442
𝑖𝑘 𝑖𝑗𝑘
Estimasi parameter
K-way and Higher Order Effect
1. Untuk k = 3
H0 : Efek order ke-3 = 0 (log (eijk) = λ + λi A + λj B + λkC + λij AB + λik AC + λ jkBC)
H1 : Efek order ke-3 ≠ 0 (log (eijk) = λ +λi A + λj B + λkC + λij AB + λik AC + λ jkBC + λ
ABC
ijk )
𝑚
𝐺 2 = 2 ∑2𝑖=1 ∑2𝑗=1 ∑2𝑘=1 𝑚𝑖𝑗𝑘 ln ( 𝑒 𝑖𝑗𝑘 ) = 335.66
𝑖𝑗𝑘
(𝑚𝑖𝑗𝑘 −𝑒𝑖𝑗𝑘 )2
𝜒 2 = ∑2𝑖=1 ∑2𝑗=1 ∑2𝑘=1 = 328.845
𝑒𝑖𝑗𝑘
P-value = 0.000 (baikdenganmetode likelihood maupunpearson)
α = 0.05
2. Untuk k = 2
H0 : Efek order ke-3 = 0 (log (eijk) = λ + λi A + λj B + λkC)
H1 : Efek order ke-3 ≠ 0 (log (eijk) = λ +λi A + λj B + λkC + λij AB + λik AC + λ jkBC + λ
ABC
ijk )
(𝑚𝑖𝑗𝑘 −𝑒𝑖𝑗𝑘 )2
𝜒 2 = ∑2𝑖=1 ∑2𝑗=1 ∑2𝑘=1 = 81042.47
𝑒𝑖𝑗𝑘
14
P-value = 0.000 (baikdenganmetode likelihood maupunpearson)
α = 0.05
3. Untuk k = 1
H0 : Efek order ke-3 = 0 (log (eijk) = λ)
H1 : Efek order ke-3 ≠ 0 (log (eijk) = λ +λi A + λj B + λkC + λij AB + λik AC + λ jkBC + λ
ABC
ijk )
(𝑚𝑖𝑗𝑘 −𝑒𝑖𝑗𝑘 )2
𝜒 2 = ∑2𝑖=1 ∑2𝑗=1 ∑2𝑘=1 = 103409.7
𝑒𝑖𝑗𝑘
15