Anda di halaman 1dari 10

Tugas Analisis Data Kategorik

MODEL LOG LINEAR DENGAN


MODEL LOGIT

Oleh :

Kelompok 5
Amelia Andriani (H 121 15 008)
Fitriani S (H 121 15 014)
Nurul Hidayanti A. (H 121 15 017)
Andi Asriani (H 121 15 021)
Elsa Resa Sari (H 121 15 309)
Windi Wilda Ningsi (H 121 15 313)
Hesti Erdayanti (H 121 15 507)

PROGRAM STUDI STATISTIKA


JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS HASANUDDIN
2017
1. Pengantar

Akan dijabarkan statistik cukup dan persamaan likelihood terhadap pemodelan loglinear
berupa tabel tiga arah. Selanjutnya tentang perhitungan nilai maksimum likelihood
(ML) dari beberapa kemungkinan dan frekuensi harapan. Bagian ketiga tentang uji
kesesuaian model, dan terakhir tentang estimasi parameter model. Beberapa contoh juga
ditunjukkan dalam bab ini, sebagai bahan pembelajaran tentang model log linear.
2. Relevansi

Model log linear juga memiliki model logit, sehingga penyesuaian model log linear dengan
model logitnya perlu dipahami. Penggunaan model logit selalu ada dalam model log linear
yang bertujuan untuk membentuk model linear yang akan lebih mudah untuk
diinterpretasikan. Kajian teori, mulai statistic cukup hingga uji kesesuaian mode l, menjadi
penting keberadaannya supaya lebih memahami ketika berhubungan dengan data riil.
3. Statistik Cukup dan Likelihood Pemodelan Loglinear
3.1 Statistik Cukup Minimal
Asumsikan model pengambilan sampel yang paling mudah, sampel tersebut
menghitung { } untuk penggolongan silang dari X Y, dan Z adalah variable bebas acak
Poisson dengan nilai yang diharapkan { } . Hasil yang sama terjadi ketika sel
hitung adalah sebuah sampel multinomial dengan sel peluang.

Banyaknya fungsi peluang bersama Poisson dari { } adalah






Dimana memberikan hasil kali dari semua sel dalam table. Kernel log

likehoodnya adalah

() = log ( ) (7.1)

Sekarang pertimbangkan model umum loglinier untuk { }



log { } = + + + + + + +

Log likelihoodnya (7.1) setara

() = + ++ 1 + ++ + ++ + + +
+ + + + exp[ + + +

+ + + + ]
Karena distribusi Poisson berada dalam suku eksponensial, maka koefisien dari
parameter pada log likelihood ini adalah statistik cukup. Untuk model yang penuh

ini, { }adalah koefisien dari { }, jadi tidak terdapat reduksi pada data. Untuk
model yang lebih sederhana, beberapa parameter lamda bernilai nol, Sehingga
persamaan (7.2) disederhanakan menjadi:

log = + + +

Statistic cukup adalah koefisien pada persamaan (7.2) dari { }, { }, { }, dinamakan


{++ }, {++ } dan { ++ }

Table 7.1 memuat statistic cukup minimal untuk beberapa model loglinier. Model
sederhana (X, Y, Z) hanya membutuhkan factor-tunggal distribusi marginal, sedangkan
model (XY, Z) juga membutuhkan dua-faktor X-Y distribusi marginal. Statistik cukup
minimal adalah distribusi marginal yang sederhana yang sesuai dengan syarat-syarat pada
symbol model. Untuk model (XY, XZ, YZ) memiliki semua dua -faktor terikat, singkatnya,
statistic cukup minimal adalah marginal table dua -cara {+ }, {+ } dan { + }

3.2 Persamaan Likelihood untuk Model Loglinear

Nilai { ijk } untuk model loglinear (XZ,YZ) merupakan solusi untuk persamaan
likelihood. Misalkan turunan dari persamaan likelihood menggunakan model loglinier
(XZ, YZ), dimana untuk setiap X dan Y adalah independen untuk Z . Untuk model ini,
persamaan (7.2) dapat disederhanakan menjadi

Tabel 7.1 Statistik Cukup Minimal untuk Model Loglinear

Dari persamaan (7.3) ditentukan turunan L(m) terhadap masing-masing


parameter

(, , , +

, ) untuk memperoleh persamaan Likelihood. Misalnya,
perhatikan (6.4) dan (6.5) sama dengan persamaan yang diperoleh sebelumnya pada
table 6.1 untuk model (XZ,YZ) dan merupakan Maximum Likelihood Estimasi.
3.3 Kesimpulan Birch

Untuk model (XY,YZ), Table 7.1 bahwa statistik yang cukup minim
merupakan estimasi ML dari distribusi marjinal yang sesuai frekuensi harapkan.
Birchs (1963) menunjukkan bahwa persamaan likelihood untuk model loglinier
cocok dengan statistik yang cukup minimal untuk nilai-nilai yang diharapkan.

Birch menunjukan ada solusi yang unik {


ijk } bahwa keduanya memenuhi
model dan data kecocokan sampel dalam statistik yang cukup minim. Oleh
karena itu, untuk menyimpulkan solusi tersebut, maka harus menjadi solusi ML.
Berikut merupakan model independen dari tabel dua arah sebagai gambaran awal

log = + +

memiliki statistik yang cukup minim { i+} dan { n j+ }


Persamaan likelihoodnya adalah

Nilai-nilai yang telah sesuai memenuhi persamaan itu dan juga


memenuhi syarat pemodelan, sehingga kesimpulan birch menyiratkan bahwa itu
merupakan perkiraan ML. Singkatnya, nilai yang sesuai merupakan bentuk
pelurusan untuk model loglinier dari sejumlah sampel yang cocok dalam distribusi
marjinal tertentu, tetapi memiliki asosiasi dan interaksi yang memenuhi pola model
tersirat tertentu.

Birch menunjukkan bahwa perkiraan ML untuk pengambilan sampel multinomial


sama seperti pengambilan sampel poisson independen. Dia menunjukkan
perkiraan juga sama untuk pengambilan sampel multinomial independen, asalkan
rancangan sampling mengandung distribusi majinal yang telah disesuaikan oleh
desain sampel. Sebagai gambaran, anggaplah pada setiap kombinasi dari IJ
tingkat X dan Y terdapat sampel multinomial independen untuk jumlah sel pada
tingkat K Z. Kemudian, { ij+} adalah tetap.Model harus bernilai sehingga
nilai-nilai dipasang memuaskan, semua I dan j
4. Memperkirakan Frekuensi Harapan
Nilai frekuensi harapan untuk model-model log linier pada tabel tiga arah
4.1 Hasil Persamaan Likelihood
Untuk menggambarkan cara memecahkan persamaan likelihood, akan dilanjutkan
analisis dari model (XZ,YZ) . Dari (6.14), memenuhi model

Estimasi ML memenuhi persamaan Likelihood dan

karena estimasi ML dari parameter hanya fungsi yang sama untuk estimasi
ML
dari beberapa paramater, dimana

(6.6)
4.2 Perkiraan Iteratif dan Perkiraan Langsung

Berdasarkan ketiga pemodelan awal pada Tabel 6.2, terdapat persamaan jelas dan
perkiraannya dapat dikatakan langsung. Nmun, banyak juga pemodelan loglinear
yang tidak dapat diperkirakan secara langsung. Bagi pemodelan seperti itu,
perhitungan ML membutuhkan metode iteratif. Pemodelan yang telah dipelajari
melibatkan dua dan tiga variabel, dimana variabel yang tidak dapat diperkirakan
secara langsung yakni (XY,XZ,YZ), pemodelan tanpa hubungan antara ketiga
variabel. Meskipun tabel marginal dua arah merupakan statistic minimal cukup
dari pemodelan, ( ijk ) tidak mungkin bisa dijabarkan secara langsung dalam ( ij+
), ( i+j ) dan ( +ij )
* Rumus pemodelan tidak dicantumkan dan diperoleh berdasarkan pola. Contohnya
untuk

(XZ,Y),

Alasan serupa menghasilkan { } untuk semua kecuali satu model pada tabel
7.2. Tabel 7.2 menunjukkan formula. Tabel itu juga mengungkapkan { } dalam hal
probabilitas marjinal. Ekspresi dan persamaan ini menentukan formula ML, dengan
menggunakan pendekatan yang baru saja dijelaskan.
Untuk model yang memiliki rumus eksplisit untuk , perkiraannya
dikatakan langsung Estimasi ML kemudian membutuhkan metode iteratif. Dari model
pada Tabel 7.1 dan 7.2, satu-satunya yang tidak memiliki perkiraan langsung adalah
XY, XZ, YZ. Meskipun tabel marginal dua arah adalah statistik minimal yang
memadai, maka tidak mungkin untuk mengungkapkan secara langsung dalam
istilah dari {++ }, {++ }, {++ }, Perkiraan langsung tidak ada untuk model tak
jenuh yang berisi semua asosiasi dua faktor. Dalam prakteknya, tidak penting untuk
mengetahui model mana yang memiliki perkiraan langsung. Metode Iteratif untuk
model yang tidak memiliki perkiraan langsung juga berlaku dengan model yang
memiliki perkiraan langsung. Perangkat lunak statistik untuk model loglinear
menggunakan metode iteratif untuk semua kasus.
4.3 Contoh Soal

Tabel 7.3 daftar nilai hasil pencocokan untuk beberapa model. Dalam
simbol, D adalah ras terdakwa, V adalah ras korban dan P adalah vonis
hukuman mati. Misalkan { ijk } menunjukkan nilai yang cocok pada tingkat I
dari ras terdakwa, tingkat j dari ras korban, dan k tingkat vonis hukuman mati.
Misalnya, untuk model (D, V, P),
++
++++

= = (160x214x36)/(326)2 = 11,60. Nilai yang cocok untuk
2
model merupakan model (VP, DP) dan (VP, DP, DV), dimana adalah hamper sama
dengan data yang diamati.

Tabel 7.4 menggambarkan pola berbagai hubungan dengan menunjukkan


taksiran odds rasio untuk hubungan marginal dan parsial untuk model yang tercantum
dalam Tabel 7.3 misalnya, entri 1.0 untuk hubungan parsial untuk model (VP, DP)
adalah nilai umum dari odds ratio bersyarat D P dari {
}pada tingkat dua dari
V, yaitu:
21.17 x 54.17 0.48 97.48
1.0 = =
129.83 x 8.83 8.52 5.52
Entri 1.64 untuk hubungan marginal D P pada model yang sama adalah table odds
(21.17+0.48)(54.17+97.48)
ratio dari D P, yaitu: 1.65 =( 129.83+8.52 )(8.83+5.52 )
*Nilai di dalam kurung untuk model ( DVP ) diperoleh setelah penambahan 0,5 untuk
setiap cell.
Odds rasio untuk data yang diamati adalah yang dilaporkan untuk (DVP),
dimana = . Untuk model itu, entri
121 = 0menyebabkan beberapa odds
rasio parsial yang sama dengan 0 atau . Sehingga, untuk model (DVP)
diketahui bahwa odds rasio diperoleh setelah menambahkan 0.5 untuk setiap jumlah
sel.

Untuk setiap model dalam Tabel 7.4, odds rasio diperkirakan menggambarkan
keterkaitan antara hubungan marjinal dan parsial dijelaskan oleh kondisi
collapsibility, misalnya:
(D, V, P)
Semua odds rasio parsial yang sama dengan 1.0 dan pasti akan selalu sama dengan
odds rasio marjinal, karena kondisi collapsibility terpenuhi.
(P, DV)
Hanya D V odds rasio yang tidak sama dengan 1.0 maka semua odds rasio parsial
pasti tidak akan selalu sama dengan odds rasio marjinal. Karena {nijk} merupakan
statistic cukup yang minimal untuk semua model. Dengan demikian, marjinal odds
rasio D V adalah sama untuk { } seperti untuk data yang diamati.

(VP, DV)

Hanya odds rasio partial D P yang sama dengan 1.0, V P dan odds ratio
parsial D V pasti akan sama dengan odds rasio marjinal. Hal ini tidak tepat untuk
parsial dan marjinal odds ratios D P, karena V tidak bebas pada P atau D. Odds
rasio marjinal dari V P dan D V adalah sama untuk { } pada data yang
diamati, karena semua = dan + = +

(DP, VP, DV)

Semua variabel yang bepasangan adalah variable tidak bebas. Tidak ada odds rasio
yang sama dengan 1.0, dan tidak satupun dari variable tersebut yang perlu sama
dengan odds rasio marginal yang terkait. Taksiran odds rasio marjinal sama
dengan data yang diamati, karena semua
+ = +,
+ =
+ ,
+ = +

(DVP)
Karena model ini memungkinkan interaksi tiga-faktor, dua odds rasio parsial untuk
sepasang variabel yang ada tidak lagi sama. Variabel tersebut dekat (setelah 0,5
ditambahkan ke sel masing-masing), bagaimanapun ada indikasi yang
menunjukkan mengapa model (DV, VP, DV) cocok.

Nilai-nilai odds rasio diperkirakan dalam Tabel 7.4 berguna untuk menerjemahkan
hubungan antara variabel. Misalnya, pertimbangkan model (DV, VP, DV), yang
cocok tetapi memberikan smoothing dari data. Oddsrasio D P berarti bahwa
kemungkinan estimasi vonis hukuman mati "ya" adalah (a) 1.2 kali lebih tinggi untuk
seorang tersangka berkulit putih, (b) 0.6 kali lebih tinggi untuk tersangka berkulit
hitam, dalam setiap tingkat ras korban.

Anda mungkin juga menyukai