Anda di halaman 1dari 51

DIKTAT

ANALISIS DATA KATEGORIK

1
 ( x) 
1  eg x 

 
0
g(x)

OLEH:

MADE SUSILAWATI

PROGRAM STUDI MATEMATIKA


FMIPA UNIVERSITAS UDAYANA
1

BAB I
PENDAHULUAN
Analis data kategorik adalah analisis yang meliputi:

1. Proses Multinom : Tabel Kontingensi, model Log Linier


2. Proses Binom : Regresi Logistik
3. Proses Poisson : Regresi Poisson

Secara lebih jelas, struktur analisis Statistika dilihat dari sekala pengukuran variabel-
variabelnya adalah:

Tabel 1.1 Skala Pengukuran untuk Berbagai Analisis Statistika

Y (respon) X (penjelas) Metode Statistika


Kontinu Diskrit Analisis Ragam
Kontinu Diskrit/Kontinu Analisis Regresi
Deskrit Diskrit/Kontinu Analisis Data Kategorik

Analisis ragam dipakai secara luas pada percobaan dalam bidang Pertanian dan
ilmu-ilmu Biologi, Analisis Regresi dipakai selain pada bidang pertanian juga pada bidang
Ekonomi. Sedangkan Analisis data Kategorik dipakai , misalnya: pada pertanian, contohnya
mengamati daya kecambah dari bibit jagung, amatanya adalah biji jagung, dan responnya
adalah tumbuh, mati. Contoh 2: pada klimatologi, mengamati hari hujan dalam sebulan,
misal: tanggal 1. → hujan

tanggal 2.→ hujan

tanggal 3.→ tidak hujan

dst

tanggal 31.→ tidak hujan

maka responnya adalah hujan, tidak hujan. Contoh 3: pada bidang sosial, mengukur sikap
dan opini pada berbagai masalah dan karakteristik demografi, seperti: gender, ras dan kelas
2

sosial. Pada kedokteran, mengukur faktor-faktor seperti parahnya luka, tingkat keparahan
suatu penyakit, dll.

Skala Pengukuran

Skala pengukuran secara garis besarnya dapat dibagi dalam kategori data kategorik
dan data kontinu. Data diskrit diperoleh dari hasil membilang atau mencacah, misalnya
jumlah anak, jumlah anggota keluarga, sedangkan data kontinu diperoleh dari hasil
mengukur, misalnya hasil tanaman padi dalam ton/ha, nilai mutu rata-rata mahasiswa, dll.
Dari skala diskrit dan skala kontinu ini, skala pengukuran dapat dibagi dalam empat skala,
yaitu nominal, ordinal, interval dan rasio.

1. Skala Nominal

Skala yang tidak mempunyai level urutan, sifatnya hanya membedakan, misalnya: agama, jenis-
jenis transportasi, pilihan tempat tinggal, ras, gender, status kawin, dll.

2. Skala Ordinal

Skala yang mempunyai sifat membedakan dan mengurutkan, misalnya: kelas sosial (rendah,
menengah, tinggi), sikap (sangat tidak setuju, tidak setuju, setuju, sangat setuju).

3.Skala Interval

Skala yang mempunyai sifat membedakan, mengurutkan, dan mempunyai jarak numeric antara
dua level skala, misalnya: umur (0-3 tahun, 4-6 tahun, dll), pendapatan (0-Rp.500.000,-,
Rp.600.000,--Rp.1.000.000,-) dll.

4.Skala Rasio

Kelebihan skala ini dengan yang lainnya adalah mempunyai perbandingan, misalnya berat
badan, tinggi badan, dll.

Suatu variable bisa diukur berdasarkan metode statistika apa yang akan digunakan.
Misalnya pendidikan, akan mempunyai skala nominal bila diukur berdasarkan tipe pendidikan
(sekolah umum, sekolah khusus), dapat diukur dengan skala ordinal bila berdasarkan tingkat
3

pendidikan (pendidikan dasar, mengah, atas, universitas, Pascasarjana), dan menggunakan skala
interval jika diukur berapa lama pendidikannya (0,1,2,3,…).

Latihan

1.Dalam pernyataan berikut, bedakan antara variabel respon dan variabel bebas.

a. Sikap terhadap tindakan aborsi (setuju, menentang); gender (laki-laki, wanita)

b. Penyakit pada hati (ada, tidak); tingkat kolestrol

c. Warna kulit (putih, tidak putih); gender (laki-laki, wanita); keputusan dalam memilih partai
politik (Republik, Demokrat, lainnya); pendapatan.

d. Rumah sakit (A, B); perlakuan (T1, T2); keadaan pasien setelah berobat (sembuh, mati).

2. Apa skala pengukuran yang paling tepat untuk variabel berikut:

a. Anggota sebuah partai politik (Demokrat, Republik, lainnya)

b. Tingkat pendidikan tertinggi yang diselesaikan (SD,SMP, SMA, S1, S2, S3)

c. Kondisi pasien (bagus, kurang bagus, serius, kritis)

d. Lokasi Rumah Sakit (Denpasar, Singaraja, Gianjar).

3. Gambarkan sebuah rencana penelitian yang variabel responnya kategorik. Uraikan variabel-
variabel penting yang mendukung penelitian tersebut, bedakan antara respon dan variabel
penjelas. Untuk setiap variabel, tentukan skala pengukurannya.
4

BAB II
TABEL KONTINGENSI (Tabel dua arah)
Dalam survey biasanya menggunakan kuisioner sebagai alat untuk mengumpulkan data,
dengan tujuan untuk mendapatkan informasi. Jawaban dari responden kalau berupa jawaban
kategorik maka didapat respon kategorik. Hasil dari survey bila disajikan dalam bentuk tabel
akan diperoleh table kontingensi. Misalnya: pendapat siswa terhadap penerapan ujian nasional
didapat data sebagai berikut:

Tabel 2.1. Tabel Kontingensi pendapat responden terhadap wanita bekerja malam hari

Jenis Kelamin Siswa

Pendapat Pria Wanita Jumlah

Setuju 78 28 106

Tidak Setuju 17 60 77

Jumlah 95 88 185

Tabel 2x2 seperti di atas merupakan yang paling sederhana dari table silang secara umum.

Tabel 2.2. Tabel Kontingensi 2x2

Kategori B

Kategori A B1 B2 Jumlah

A1 f11 f12 f10

A2 f21 f21 f20

Jumlah f01 f02 f00

fij = frekuensi amatan, yaitu banyaknya responden yang termasuk dalam kategori atau sel (i,j)
atau jumlah subyek atau obyek dalam sampel kita yang jatuh dalam variasi kategorik pada
variable yang diamati. f0j atau fi0 = total marjinal pada lajur/baris responden.
5

Ada dua kemungkinan cara peneliti sampai pada table kontingensi tertentu:

1. Peneliti mengambil responden sebanyak f00, kemudian dari jawaban responden dilakukan
klasifikasi. Hal ini akan membawa kita pada pengujian: apakah antara dua klasifikasi A
dan B ada saling ketergantungan? (Uji Kebebasan)

2. Peneliti mengambil responden kategori A1 sebanyak f10 dan responden kategori A2


sebanyak f20 . Kemudian dari tiap-tiap kategori A1 dan A2 diperiksa berapa responden
yang termasuk ke dalam kategori B1 dan B2. Ini akan membawa pada pengujian apakah
ada perbedaan respon dari kelompok responden A1 dan A2 terhadap kategori B1 dan B2
(Uji Pembandingan).

Pengujian Kebebasan A dan B

Jika A dan B bebas maka jawaban responden terhadap pertanyaan A tidak tergantung
f11 f
terhadap jawaban pertanyaan B, sehingga dapat diharapkan:  21 demikian pula
f10 f 20

f11 f
 12
f 01 f 02

Untuk itu perlu pengujian hipotesis tentang kebebasan A terhadap B. Misalkan Pij adalah peluang
individu masuk ke dalam kategori/sel (i,j) maka untuk setiap sel didapat:

Kategori B
Kategori A B1 B2 Jumlah
A1 P11 P12 P10
A2 P21 P21 P20
Jumlah P01 P02 P00

f11 f 01 f  f 21
Dengan: P11  dan P01   11
f 00 f 00 f 00

P11 P12
Jika A dan bebas maka:  , Artinya P(AiBj) = P(AiBj)
P01 P02
6

f i1  f i 2 f1 j  f 2 j
PB j  
f f0 j
P Ai    i 0  Pi 0 dan   P0 j
 f ij f 00 f ij f 00

Kalau A dan B bebas maka: Pij  Pi 0 .P0 j

Pij didapat dari populasi, sehingga sangat jarang bisa mengetahui Pij . Karena itu nilai Pij diduga

dari frekuensi relatifnya:

f f f f
Pˆ11  11 ; Pˆ12  12 ; Pˆ21  21 ; Pˆ22  22
f 00 f 00 f 00 f 00

Dengan didapat dugaan dari Pij, selanjutnya perlu dihitung frekuensi harapan. Frekuensi harapan
adalah jumlah subyek atau obyek dalam sampel yang diambil yang diharapkan untuk diobservasi
jika hipotesi nol tentang variable tersebut benar, maka frekuensi harapannya adalah

f10 . f 01
Sel(1,1)  e11  P11 f 00  P10 .P01  f 00 
f 00

f10 . f 02
Sel(1,2)  e12  P12 f 00  P10 .P02  f 00 
f 00

f 20 . f 01
Sel(2,1)  e21  P21 f 00  P20 .P01  f 00 
f 00

f 20 . f 02
Sel(2,2)  e22  P22 f 00  P20 .P02  f 00 
f 00

Sehingga kita memiliki frekuensi amatan dan frekuensi harapan, dan ini menjadi dasar untuk
menguji apakah A dan B bebas atau tidak. Jika f (frekuensi amatan) dan e (frekuensi harapan)
sangat berbeda, maka cenderung menganggap A dan B tidak bebas, sebaliknya jika f dan e mirip
(nilai hamper sama), maka cenderung menganggap A dan B bebas. Uji bagi kebebasan antara A
dan B adalah uji χ2, dengan hipotesis:

H 0 : Pij  Pi 0 .P0 j
H 1 : Pij  Pi 0 .P0 j
7

Atau Ho : dua populasi saling bebas

H1 : dua populasi tidak saling bebas atau saling ketergantungan

Dengan statistic ujinya adalah:

f  eij 
2

    tabel
2 ij 2
hit ( db, ) (2.1)
eij

Dengan db = (r-1)(k-1).

Teladan 1.

Lihat table 1.1. kita akan melakukan uji kebebasan, dengan hipotesisnya adalah:

H0: Pendapat setuju atau tidak setuju, tidak berkaitan dengan jenis kelamin responden

(pendapat dan jenis kelamin bebas)

H1: Ada kaitan antara jenis kelamin responden dengan pendapatnya

Langkah pertama yaitu menghitung nilai harapan tiap sel:

(106)(95) (77 )(95)


e11   53,03 e21   39,97
183 183

(106)(88) (77)(88)
e12   50,97 e22   37,03
183 183

Langkah kedua, membuat table seperti berikut:

Tabel 2.4. Hasil perhitungan teladan 1.

fij eij fij - eij (fij - eij )2 (fij - eij)2/eij

78 55,03 22,97 527,6209 9,59


28 50,97 -22,97 527,6209 10,35
17 39,97 -22,97 527,6209 13,20
60 37,03 22,97 527,6209 14,25
8

 hit
2
=47,39

Nilai  hit
2
nya adalah: 47,39, dengan  tabel
2
(1; 0, 05 )  3,84; Karena  hit
2
 χ2 tabel

Maka H0 ditolak, artinya ada kaitan antara jenis kelamin dengan pendapat setuju tidak setuju.
Tetapi dengan uji ini tidak berarti bahwa factor yang satu bergantung dari atau penyebab dari
atau mengakibatkan factor lain.

Alternatif untuk perhitungan diatas adalah rumus:


N (ad  bc) 2
 2
 (2.2)
(a  b)(b  d )(c  d )(a  c)
hit

Dengan N= a+b+c+d

Catatan

Bila harga eij<5, maka statistic  hit


2
di atas tidak dapat digunakan, tetapi menggunakan koreksi
kontinyuitas atau koreksi Yates.

1 2
N ( ad  bc  N)
 Yates
2
 2 (2.3)
(a  b)(b  d )(c  d )( a  c)

Teladan 2.

Suatu penelitian tentang peran serta karyawan dalam membuat keputusan manajemen, missal ada
system manajemen (setuju, tidak setuju). Data yang terkumpul adalah sebagai berikut:

Tabel 2.5. Data Frekuensi Peran serta Karyawan dalam Membuat Keputusan Manajemen

Peran Serta

Keputusan Ikut Serta Tidak Ikut Serta Jumlah

Setuju 7 6 13

Tidak Setuju 47 25 72
9

Jumlah 54 31 85

Jika nilai harapan setiap sel dihitung, terlihat bahwa sel (1,2) mempunyai nilai harapan 4,74
kurang dari 5, karena itu pengujiannya menggunakan statistic uji  Yates
2

1
85( 7  25  6  47  85) 2
 Yates
2
 2  0,226
13  72  54  31

Berdasarkan perhitungan di atas diputuskan H0 diterima, yang berarti persetujuan terhadap


keputusan manajemen tidak ada kaitannya pada diajak atau tidaknya karyawan berperan serta
dalam membuat keputusan manajemen.
Latihan
1. Seorang mahasiswa matematika menyelidiki tentang kecendrungan stress mahasiswa
matematika menghadapi perkulihan di jurusan Matematika FMIPA Unud, diduga perbedaan
gender mempunyai kecendrungan yang berbeda terhadap ada tidaknya stress pada mahasiswa.
Rumuskan variable yang terlibat dalam penelitian di atas dan tuliskan hipotesis penelitiannya.

2.Penelitian dilakukan untuk mengetahui pendapat masyarakat mengenai pernikahan dini, diduga
pendapat orang muda (remaja) berbeda dengan pendapat orang tua (dewasa); Rumuskan variable
yang terlibat dalam penelitian di atas dan tuliskan hipotesis penelitiannya.
10

BAB III
PENGUKURAN TERJADINYA PERISTIWA
1. PREVALENSI
Prevalensi suatu peristiwa atau kasus tertentu (penyakit, kematian, dsb), didefinisikan
sebagai banyaknya kasus tersebut yang telah atau tercatat pada saat tertentu atau titik waktu
tertentu. Angka prevalensi suatu kasus didefinisikan sebagai rasio antara prevalensi kasus
tersebut dengan jumlah seluruh individu yang mempunyai risiko, yang dinyatakan sebagai
individu berisiko, pada suatu titik waktu.

Jika jumlah kasus yang diobservasi (terdaftar atau tercacah) pada suatu titik waktu dalam
suatu wilayah sebanyak n dan seandainya diketahui seluruh individu berisiko sebanyak N, maka
prevalensi kasus tersebut adalah n, dan angka prevalensi di wilayah itu adalah:

PV = k*n/N .................... (3.1)

Di mana k menyatakan faktor pengali yang ditentukan dan telah disepakati untuk kasus tersebut.

2. UKURAN ASOSIASI

Contoh asosiasi antar variabel:

1. Hubungan Timbal Balik

a. Misal, V1 = status pemakaian KB (1. Ya; 0. Tidak)

V2 = Jumlah anak yang dilahirkan

Maka V1 bisa merupakan penyebab dari V2 , bisa juga merupakan akibat dari V2.

b. Misal, V3 = pendidikan

V4 = Pekerjaan

Maka V3 dapat merupakan penyebab mendapat V4, bisa juga merupakan akibat dari V4.

2. Hubungan searah
11

a. Misal, V1 = pola makan ibu waktu hamil

V2 = berat badan bayi pada saat dilahirkan

V3 = pendidikan ibu

Maka V1 merupakan penyebab dari V2, begitu pula V3 merupakan penyebab dari V2, tetapi
bukan sebaliknya.

b. Misal, V4 = pendapatan

V5 = simpanan dalam bentuk uang

Maka V4 merupakan penyebab dari V5.

3. Hubungan yang tidak meyakinkan

a. Misal, penolong persalinan (1. Dokter, 2. Bidan, 3. Dukun) dengan berat badan bayi
saat lahir.

b. Pemilik usaha memelihara anjing atau tidak, dengan status kreditnya (0. Macet,

1. Tidak).

3. Perbedaan Resiko (RD) Antara Dua Proporsi

Tabel 3.1. Peristiwa Pada Kelompok Kasus dan Kontrol

Kelompok Peristiwa
1.Ya 2. Tidak Total

1. Kasus d1 h1 n1
2. Kontrol d0 h0 n0

Total d h n

Perbedaan resiko digunakan untuk melihat seberapa besar resiko pada kelompok kasus menurun
atau meningkat bila terjadi peristiwa ya. RD dihitung dengan rumus:

RD = P1 – P0
12

d1
Dengan P1  adalah proporsi dalam kasus pada peristiwa ya
n1

d0
Dan P0  adalah proporsi dalam kontrol pada peristiwa ya
n0

Nilai RD yang negative menunjukkan resiko yang menurun pada kelompok kasus pada
peristiwa ya, sedangkan nilai RD yang positif menunjukkan resiko yang meningkat pada
kelompok kasus pada peristiwa ya.

Selang kepercayaan untuk perbedaan diantara dua proporsi adalah

CI   p1  p0   z   s.e. p1  p0 

Dengan z’ adalah nilai peluang di bawah sebaran normal untuk α yang ditetapkan.

s.e. p1  p0    p1 1  p1  n1  p0 1  p0  n0   s.e. p 
1
2

 s.e. p0  ………………………… (3.2)
2

Pengujian Perbedaan Antara Dua Proporsi

Statistik uji yang digunakan untuk membandingkan dua proporsi berdasar pada normal tes, yaitu:
p1  p0
z
s.e. p1  p0 

Dengan s.e. p1  p0  seperti (1), bisa juga dihitung dengan rumus:

s.e. p1  p0    p1  p 1 n1  1 n0  P


d
n

Hipotesis yang diuji adalah H0 = perbedaan resiko adalah nol atau sama, versus

H1 = perbedaan resiko adalah tidak sama.

Contoh

Penelitian tentang efektifan pemberian vaksin untuk mencegah influenza


13

Tabel 3.2. Tabel 2 x 2 Mengenai Hasil Percobaan Vaksin Influensa

Kelompok Influensa
1.Ya 2. Tidak Total
Vaksin 20 (8,3%) 220 (91,7%) 240
Kontrol 80 (36,4%) 140 (63,6%) 220
Total 100 (21,7%) 360 (78,3%) 460

Perbedaan Resiko nya adalah: p1 – p0 = 0.083-0.364 = -0.281

Nilai -0.281 menunjukkan resiko terinfeksi influenza akan menurun sebesar 0.281 bila diberi
vaksin.

Selang kepercayaan untuk perbedaan resiko terkena influensa yang divaksin dengan tidak
divaksin adalah: s.e. p1  p0   0.0831  0.083 240  0.3641  0.364 220  0.037

Sehingga selang kepercayaanya adalah:

CI   p1  p0   z   s.e. p1  p0 

95%CI  0.083  0.364   0.196  0.037


  0.353,0.208

Interpretasinya adalah: kita percaya 95% bahwa populasi yang di vaksin akan berkurang
resikonya terinfeksi influenza sebesar 0.208 sampai 0.353.

Pengujian hipotesis mengenai perbedaan proporsi langkah-langkahnya sbb.:

p1  p0
z
s.e. p1  p0 

Dengan: s.e. p1  p0   0.2171  0.217 1 240  1 220  0.0385

0.083  0.364  0.281


Sehingga: z   7.299
0.0385 0.0385

Bila dibandingkan dengan z tabel (α = 0.05) = 1.96 maka Ho di tolak, ini menunjukkan adanya
pengurangan resiko yang signifikan pada populasi yang divaksin terinfeksi influenza.
14

4. Risk Ratio (RR)

p1 d d
Berdasarkan Tabel 2.1. RR dihitung dengan rumus: RR  dengan P1  1 dan P0  0
p0 n1 n0

P1 sering disebut sebagai resiko pada kelompok kasus atau kelompok percobaan, sedangkan p0
disebut sebagai kelompok control.

Nilai RR = 1 terjadi jika resiko pada kelompok kasus dan control sama, ini sama artinya tidak
ada asosiasi antara resiko pada kasus dengan resiko pada control. Nilai RR > 1 terjadi ketika
resiko terjadinya peristiwa pada kasus lebih besar dibandingkan dengan control. Dan Nilai RR <
1 terjadi ketika resiko terjadinya peristiwa pada kasus lebih kecil dibandingkan dengan control.

Perbedaan nilai RR dengan RD adalah RR lebih umum digunakan untuk mengukur kekuatan
asosiasi/hubungan daripada RD. Ini dikarenakan RR lebih menunjukkan seberapa kali resiko
kasus terhadap control.

Contoh

Kembali pada kasus influensa dengan data pada Tabel 2.2, penghitungan nilai RR diperoleh
0.028
RR   0.077
0.364

Interval kepercayaan untuk RR adalah: CI  RR  z   s.e.RR ,

Karena sering kali nilai s.e.(RR) sangat besar, sedangkan RR sangat kecil yang menyebabkan
pengurangan RR terhadap z  s.e.RR  bernilai negative, maka rumus CI ditransformasi menjadi

CI  log(RR)  z   s.e. logRR  dengan s.e.(log RR )  1 d1  1 n1  1 d 0  1 n0  .

log RR
Pengujian Hipotesis untuk RR adalah: z
s.e.log RR 
15

5. ODDS RATIO/OR

Dapat dilihat bahwa d1/h1 menyatakan rasio antara jumlah orang yang sakit dalam kelompok
kasus. Rasio ini adalah sebuah statistik yang menyatakan kecendrungan (odd) sakit dalam
kelompok kasus. Dengan keterangan yang sama rasio d0/h0 menyatakan kecendrungan sakit
dalam kelompok control. Selanjutnya, statistik rasio relative (odds ratio) didefinisikan sebagai
 d   d  d h
berikut: OR   1  :  0   1 0 .......................... (3.3)
 h1   h0  d 0  h1

Karena OR merupakan rasio antara kecendrungan sakit dalam kelompok kasus dangan kelompok
kontrol, dengan kata lain, kelompok kasus mempunyai risiko sebesar OR kali kelompok kontrol.

Contoh

Penduduk suatu desa sama-sama memiliki peluang yang sama untuk terkena infeksi
semacam virus. Setelah epidemik berlalu, diambil sebuah sampel acak dari orang-orang yang
tidak disuntik dan disuntik, lalu yang terkena infeksi dicacat. Hasil pengamatan diberikan di
bawah ini:

Tabel 3.3. Keadaan Terkena Infeksi Virus pada Kelompok Kasus dan Kelompok Kontrol

Kelompok Peristiwa

1.Terinfeksi 2. Tidak Terinfeksi

1.Tidak disuntik 37 42
1. Disuntik 12 29

37
menyatakan nilai odds yang berarti rasio antara jumlah yang terinfeksi dengan jumlah yang
42
12
tidak terinfeksi dalam kelompok tidak disuntik. menyatakan rasio antara jumlah yang
29
terinfeksi dengan jumlah yang tidak terinfeksi dalam kelompok disuntik. Sehingga resiko relative
 37   12 
atau OR adalah: OR    /    2,13
 42   29 
16

Nilai 2,13 berarti rasio antara kecendrungan terinfeksi dalam kelompok tidak disuntik dengan
kelompok disuntik sebesar 2,13. Atau dapat dikatakan bahwa kelompok masyarakat yang tidak
disuntik mempunyai risiko terinfeksi virus sebesar 2,13 kali kelompok masyarakat yang disuntik.

Pengujian Hipotesis untuk OR

Untuk melakukan estimasi dan pengujian hipotesis, statistik OR ini pada umumnya
diperhatikan sebagai logaritma natural dari OR yang diobservasi, yaitu:

ln (OR) = ln (a) – ln (b) – ln (c) + ln (d) ................ (3.4)

Untuk sampel yang berukuran besar, standar deviasinya adalah:

1 1 1 1
s(ln OR )     ......................... (3.5)
a b c d

Hipotesis untuk mempelajari perbedaan resiko antara kedua kelompok tertentu adalah

H0 : ln (OR) = 0 → (OR = 1) artinya kedua kelompok mempunyai risiko yang sama

H1 : ln (OR) ≠ 0 → artinya kedua kelompok mempunyai risiko yang tidak sama

Dengan staistik uji menggunakan statistik Z yaitu

ln(OR)
Z hit  ........................... (3.6)
s(ln OR )

Dapat pula diperoleh selang kepercayaan (l -α) % utuk OR yaitu :

ln(OR) ± Zα/2-Sln(OR) .......................... (3.7)

Teladan 2.

Tabel di bawah menunjukan data hipotesis suatu eksperimen dengan pelakuan, dimana terdapat
444 subjek dalam kelompok kasus yaitu diberi pelakuan dan 6025 sabjek dalam kelompok
Kontrol. Dalam teladan ini diperhatikan peristiwa berdampak negative terhadap subyek
penelitian, seperti kematian, kegagalan dan sebagainya.
17

Tabel 3.4.Teladan pengujian hipotesis untuk OR

Pristiwa

Perlakuan 1.Ya 2. Tidak Jumlah Odd

1. Ya 9 435 444 0,026069

2. Tidak 42 5983 6025 0,007020

Jumlah 51 6418 6469 0,007930

Jawab

1. Perhitungan

*ln(OR) = ln(9)-ln(435)-ln(42)+ln(5983)

= 1,08089

1 1 1 1
 s(ln OR )      0,370567
9 435 42 5983

1,08089
 Z hit   2,917
0,370567

 Zα/2 untuk α = 0,05 adalah ± 1,96

 Kesimpulan: Tolak H0, artinya kelompok kasus dan kelompok kontrol mempunyai
perbedaan risiko yang signifikan untuk mengalami peristiwa tertentu.

Latihan

Suatu percobaan bertujuan untuk mengetahui pengaruh pemberian diazepam 5 mg dalam


mengurangi timbulnya serangan. Hasilnya adalah sebagai berikut:
18

Kelompok Peristiwa

1.Berkurang 2. Tidak

1. Diazepam 2 81
2. Kontrol 14 72

Pertanyaan:

a. Hitung OR dan interpretasikan hasilnya

b. Uji Hipotesis:

H0 : ln (OR) = 0

H1 : ln (OR) ≠ 0

c. Cari selang kepercayaan 95% untuk OR dan interpretasikan hasilnya.


19

BAB IV
MODEL LOG LINIER
Metode regresi merupakan metode statistika yang memanfaatkan hubungan antara dua

atau lebih peubah kuantitatif sehingga satu peubah bisa diramalkan dari peubah lainnya (Neter

dan Kutner, 1997). Secara umum model regresi linear dengan suku sisaan menyebar normal

dengan rataan nol dan ragam satu dapat dituliskan sebagai berikut:

i   0  1  i1   2  i 2  ...   p  ip   i

i    0  1  i1   2  i 2  ...   p  ip   i  .

Dengan asumsi  menyebar normal dengan rataan 0 dan ragam 1, maka fungsi respon untuk

model regresi persamaan tersebut adalah sebagai berikut:

 
   1 ,  2 ,...,  p   0  1  1  ...   p  p , (4.1)

model regresi linear umum dengan suku sisaan menyebar normal berimplikasi bahwa amatan-

amatan i adalah peubah acak normal yang bebas, dengan rataan i  dengan ragam konstan

2.

Dalam penggunaan metode regresi linear terdapat beberapa asumsi yang harus dipenuhi

seperti kehomogenan ragam dan kenormalan sisaan. Asumsi kehomogenan ragam dan

kenormalan sisaan mendasari penggunaan metode kuadrat terkecil untuk menduga parameter

model regresi. Selain asumsi-asumsi tersebut penggunaan skala pengukuran juga harus

diperhatikan karena pada metode regresi linear peubah tak bebas merupakan peubah kontinu

(Agresti,1990).
20

Dalam permasalahan-permasalahan di lapangan seringkali metode regresi linear tidak

dapat diterapkan, selain karena asumsi kehomogenan ragam dan kenormalan sisaan yang tidak

terpenuhi juga disebabkan karena peubah tak bebas dalam bentuk biner walaupun asumsi

kenormalan dan kehomogenannya terpenuhi. Untuk mengatasi permasalahan tersebut, dapat

dipergunakan salah satu metode yaitu model log-linear.

4.1 Metode Log-Linear

Model log-linear merupakan suatu model yang merepresentasikan hubungan antara dua

peubah atau lebih dimana semua peubah bersifat kategorik dan kesahihan dari model-modelnya

diuji dengan pendekatan tabel kontingensi (Agresti, 1990).

Suatu penelitian jika berhadapan dengan suatu data yang bukan merupakan hasil

pengukuran tetapi berupa data frekuensi atau jumlahan pengamatan dari suatu peubah kategorik

yang bersifat diskrit, maka analisis statistik yang sesuai adalah analisis data kategori yaitu

analisis log-linear (Agresti, 2007). Analisis log-linear digunakan untuk mengetahui ada tidaknya

hubungan antar peubah yaitu dengan menggunakan uji ketergantungan dan memodelkan pola

hubungan antar peubah. Pada model log-linear akan dapat diketahui sel mana yang cenderung

menimbulkan hubungan (ketidakbebasan).

4.1.1 Model Log-Linear untuk Tabel Dua Dimensi

Salah satu cara untuk menyajikan data kualitatif adalah dengan menyatakan masing-

masing kategori dari peubah yang satu dalam kategori-kategori peubah lain. Tabel yang

terbentuk dengan cara demikian disebut tabel kontingensi (Agresti, 2007).

Suatu tabel kontingensi dikatakan mempunyai dua dimensi apabila tabel tersebut

mencatat data hasil pengamatan dengan melibatkan dua peubah, yaitu X dan Y (Christensen,
21

1997). Peubah X (peubah bebas) terdiri dari I kategori, dan peubah Y (peubah tak bebas) terdiri

dari J kategori. Jadi tabel kontingensinya berukuran I × J. Sel yang dibentuk dalam baris ke-i

dan kolom ke-j mempunyai frekuensi pengamatan nij . Tabel 4.1 menunjukkan frekuensi

pengamatan tabel kontigensi dua dimensi. Jika peluang pengamatan pada baris ke-i kolom ke-j

nij
dinyatakan dengan Pij  , maka peluang tiap-tiap sel dalam tabel kontigensi ditunjukkan
n 

pada Tabel 4.2.

Tabel 4.1 Tabel Kontingensi Dua Dimensi

Y1 Y2 … … … YJ Total
X1 n11 n12 … … … n1J n1
X2 n 21 n 22 … … … n2 J n 2
.. ..
.. … … … … … … ..
.. ..
XI nI1 nI 2 … … … n IJ nI 

Total n1 n 2 … … … n J n 

Sumber: Christensen (1997)

Tabel 4.2 Sel Peluang Tabel Kontingensi Dua Dimensi

Y1 Y2 … … … YJ Total

X1 P11 P12 … … … P1J P1


X2 P21 P22 … … … P2 J P2
.. ..
.. … … … … … … ..
.. ..
XI PI 1 PI 2 … … … PIJ PI 
Total P1 P2 … … … P J P

Sumber: Christensen (1997)


22

Model log-linear dapat digunakan untuk mengetahui ada tidaknya hubungan antara

peubah pada data kategori, serta dapat menunjukkan kelas mana yang menjadi penyebab

terjadinya hubungan (Agresti, 1990). Jadi, dapat dikatakan bahwa model log-linear merupakan

model yang berguna untuk mempelajari pola hubungan secara lengkap.

Model log-linear dapat dicari dengan cara:

mij  nij   N  Pij

mij  N  Pi  P j

log mij  logN  Pi  P j  (4.2)

Jika dijumlahkan semua baris I, maka akan didapatkan persamaan sebagai berikut:

I I

 log m
i 1
ij  I log N   log Pi  I log P j
i 1
(4.3)

dan jika dijumlahkan semua kolom J:

J J

 log mij  J log N  J log Pi   log P j


j 1 j 1
(4.4)

Apabila persamaan (4.3) dan (4.4) dijumlahkan, maka akan diperoleh persamaan:

I J I J

 log mij  IJ log N  J  log Pi  I  log P j


i 1 j 1 i 1 j 1
(4.5)

 I   
J
  log Pi    log P j 
ambil: U  log N   i 1    j 1 
I J
I

 log P i
U 1i   log Pi  i 1

 log P
j 1
j

U 2 j   log P j 
J
23

maka persamaan (4.5) menjadi:

log mij  U  U 1i   U 2 j  (4.6)

I J
dengan ketentuan U 1 j  dan U 2 j  memenuhi U    U    0
i 1
1i
j 1
2 j

dimana:

mij = frekuensi harapan sel (i,j)


nij = frekuensi pengamatan pada baris ke-i kolom ke-j
n  = N = jumlah seluruh pengamatan
Pij = peluang pengamatan pada baris ke-i kolom ke-j
Pi = peluang pengamatan baris ke-i
P j = peluang pengamatan kolom ke-j
U = pengaruh rata-rata secara umum dari seluruh nilai harapan
U1i  = pengaruh utama kategori ke-i dari peubah pertama
U 2 j  = pengaruh utama kategori ke-j dari peubah kedua

Model dalam persamaan (4.6) berarti bahwa ada dua buah peubah dalam satu model

dimana antara peubah pertama dengan peubah kedua tidak ada kecenderungan/hubungan. Untuk

model dua dimensi, dalam model jenuh akan terjadi interaksi antara kedua peubah, dan model

tersebut adalah sebagai berikut:

log mij  U  U1i   U 2 j   U12 ij  (4.7)

dimana U 12 ij  menyatakan pengaruh interaksi antara kategori ke-i peubah pertama dengan

I J
kategori ke-j peubah kedua, dan U 12 ij  memenuhi ketentuan U
i 1 j 1
12 ij   0.

Derajat bebas yang digunakan adalah jumlah seluruh sel dikurangi dengan jumlah

parameter yang dihitung (Powers, 1999). Untuk tabel log-linear dua dimensi ditunjukkan

sebagai berikut:
24

Tabel 4.3 Tabel Derajat Bebas Model Dua Dimensi

Parameter Derajat bebas


U 1
U1i  I 1
U 2 j  J 1
U 12 ij  I  1J  1
Total IJ
Sumber: Powers (1999)

2.3.2 Model Log-Linear untuk Tabel Tiga Dimensi

Tabel tiga dimensi terdiri dari tiga peubah X, Y, dan Z, masing-masing peubah

mempunyai kategori I, J, dan K, dan antara ketiga peubah saling bebas, maka estimasi frekuensi

harapan dari masing-masing sel adalah (Agresti, 1990):

mˆ ijk  N .Pˆijk

mˆ ijk  N .Pˆi Pˆ  j  Pˆ k

n  n j   n k 
mˆ ijk  N  i   
 N  N  N 

n i   n  j  n  k
mˆ ijk  (4.8)
N2

Jika kedua ruas persamaan (4.8) dinyatakan dalam bentuk logaritma, maka estimasi nilai

harapannya adalah:

ˆ ijk  log ni  log n j   log n k  2 log N


log m (4.9)

yang analog dengan:

log mijk  U  U1i   U 2 j   U 3k  (4.10)


25

dengan ketentuan U 1i  ,U 2 j  ,U 3k  memenuhi U    U    U    0 , ini berarti bahwa


1i 2 j 3k

dalam model terdapat tiga peubah, dan antar peubah tidak ada interaksi, dimana:

1 I J K
U  log mˆ ijk
IJK i 1 j 1 k 1

1 J K
U  U 1i    log mˆ ijk
JK j 1 k 1

1 I K
U  U 2 j    log mˆ ijk
IK i 1 k 1

I J
1
U  U 3 k  
IJ
 log mˆ
i 1 j 1
ijk

Karena U  U1i  ,U  U 2 j  , dan U  U 3k  menunjukkan deviasi penyimpangan, maka

I J K

U    U    U    0 .
i 1
1i
j 1
2 j
k 1
3k

Pada model tiga dimensi, dalam model jenuh akan terjadi interaksi antara ketiga peubah,

dan modelnya yaitu:

log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk   U123 ijk  (4.11)

Model pada persamaan (4.11) mempunyai asumsi yang harus dipenuhi adalah

I J I K J K I J K

U
i 1 j 1
12 ij   U 13 ik   U 23  jk   U 123 ijk   0 ,
i 1 k 1 j 1 k 1 i 1 j 1 k 1

dimana:
n i  = jumlah pengamatan pada baris ke-i
n j  = jumlah pengamatan pada baris ke-j
nk = jumlah pengamatan pada baris ke-k
N = jumlah seluruh pengamatan
m̂ijk = estimasi nilai harapan pada baris ke-i, baris ke-j, baris ke-k
P̂ijk = estimasi peluang pada baris ke-i, baris ke-j, baris ke-k
P̂i = estimasi peluang baris ke-i
26

P̂ j  = estimasi peluang baris ke-j


Pˆk = estimasi peluang baris ke-k
U = pengaruh rata-rata secara umum dari seluruh nilai harapan
U1i  = pengaruh utama kategori ke-i dari peubah pertama
U 2 j  = pengaruh utama kategori ke-j dari peubah kedua
U 3 k  = pengaruh utama kategori ke-k dari peubah ketiga
U 12 ij  = pengaruh interaksi kategori ke-i peubah pertama dengan kategori ke-j peubah kedua
U13ik  = pengaruh interaksi kategori ke-i peubah pertama dengan kategori ke- k peubah
ketiga
U 23 jk  = pengaruh interaksi kategori ke-j peubah kedua dengan kategori ke-k
peubah ketiga
U 123 ijk  = pengaruh interaksi kategori ke-i peubah pertama, kategori ke-j
peubah kedua, dan kategori ke-k peubah ketiga

4.1.2 Model Log Linear untuk Tabel Empat Dimensi

Model Log linier untuk tabel empat dimensi merupakan perluasan dari tabel tiga dimensi.

Interpretasinya berdasarkan pada independensi dan conditional independensi. Tabel empat

dimensi terdiri dari empat peubah W, X, Y, dan Z, masing-masing peubah mempunyai kategori

I, J, K, dan L, dan antara keempat peubah saling bebas, maka estimasi frekuensi harapan dari

masing-masing sel adalah (Agresti, 1990):

mˆ ijkl  N .Pˆijkl

n  n j   n k   nl 
mˆ ijkl  N  i    
 N  N  N  N 

n i   n  j   n   k  n   l
mˆ ijkl  (4.12)
N3

Jika kedua ruas pada persamaan (4.12) dinyatakan dalam bentuk log-aritma, maka

estimasi nilai harapannya adalah:

ˆ ijkl  log ni  log n j   log nk   log nl  3 log N


log m (4.13)
27

Pada model empat dimensi, dalam model jenuh akan terjadi interaksi antara keempat peubah,

dan modelnya yaitu:

log mijkl  U  U 1i   U 2 j   U 3k   U 4l   U 12 ij   U 13 ik   U 14 il 


 U 23  jk   U 24  jl   U 34 kl   U 123 ijk   U 124 ijl   U 134 ikl (4.14)
 U 234  jkl   U 1234 ijkl 

Model pada persamaan (4.14) mempunyai asumsi yang harus dipenuhi adalah
I J I K I L J K J L

U 12 ij   U 13ik   U 14 il  U 23 jk   U 24  jl  


i 1 j 1 i 1 k 1 i 1 l 1 j 1 k 1 j 1 l 1
K L I j K I J L I K L

U
k 1 l 1
34  kl    U 123 ijk    U 124 ijl    U 134 ikl 
i 1 j 1 k 1 i 1 j 1 l 1 i 1 k 1 l 1
J K L I J K L

U
j 1 k 1 l 1
234  jkl    U 1234 ijkl   0
i 1 j 1 k 1 l 1

Derajat bebas yang digunakan adalah jumlah seluruh sel dikurangi dengan jumlah

parameter yang dihitung (Powers, 1999). Untuk tabel log-linear empat dimensi ditunjukkan

sebagai berikut:

Tabel 4.4 Derajat Bebas Model Empat Dimensi

Parameter Derajat Bebas

U 1
U1i  I-1
U 2 j  J-1
U 3 k  K-1
U 4 l  L-1
U 12 ij  (I-1)(J-1)
U13ik  (I-1)(K-1)
U 14 il  (I-1)(L-1)
U 23 jk  (J-1)(K-1)

U 24  jl  (J-1)(L-1)
28

U 34 kl (K-1)(L-1)

U 123 ijk  (I-1)(J-1)(K-1)

U 124 ijl  (I-1)(J-1)(L-1)

U 134 ikl (I-1)(K-1)(L-1)

U 234  jkl  (J-1)(K-1)(L-1)

U 1234 ijkl  (I-1)(J-1)(K-1)(L-1)

Total IJKL

Sumber: Agresti (1990)

4.2 Estimasi Nilai Harapan

Estimasi nilai harapan untuk tabel lengkap dalam analisis log-linear dapat dibedakan

menjadi dua, yaitu (Agresti, 1990):

4.2.1 Estimasi Langsung

Adapun model yang dapat digunakan, yaitu:

a. Model Independen Lengkap

Model: log mijk  U  U1i   U 2 j   U 3k  (4.15)

I J K
dengan asumsi yang harus dipenuhi yaitu U 1i   U 2 j   U 3k   0 , dan estimasi nilai
i 1 j 1 k 1

harapannya:

n i   n  j  n  k
mˆ ijk 
N2

Model dalam persamaan (4.15) menjelaskan bahwa tidak terdapat interaksi antar peubahnya

sehingga model ini disebut model independen lengkap.


29

b. Jointly Independent

Ada tiga macam model yang termasuk dalam jointly independent, yaitu:

(i) Model: log mijk  U  U 1i   U 2 j   U 3k   U12 ij  (4.16)

I J K I J
dengan asumsi U 1i   U 2 j   U 3k   U 12 ij   0 ,
i 1 j 1 k 1 i 1 j 1
dan estimasi nilai

harapannya:

nij n k
mˆ ijk 
N2

Model dalam persamaan (4.16) menyatakan adanya hubungan antara peubah pertama dan

peubah kedua, dimana peubah ketiga tetap dalam model.

(ii) Model: log mijk  U  U 1i   U 2 j   U 3k   U 13ik  (4.17)

I J K I K
dengan asumsi U 1i   U 2 j   U 3k   U 13ik   0 ,
i 1 j 1 k 1 i 1 k 1
dan estimasi nilai

harapannya:

ni  k n j 
mˆ ijk 
N2

Model dalam persamaan (4.17) menyatakan adanya hubungan antara peubah pertama dan

peubah ketiga, dimana peubah kedua tetap dalam model.

(iii) Model: log mijk  U  U1i   U 2 j   U 3k   U 23 jk  (4.18)

I J K J K
dengan asumsi U    U    U    U
i 1
1i
j 1
2 j
k 1
3k
j 1 k 1
23  jk   0 , dan estimasi nilai

harapannya:

n jk ni
mˆ ijk 
N2
30

Model dalam persamaan (4.18) menyatakan adanya hubungan antara peubah kedua dan

peubah ketiga, dimana peubah pertama tetap dalam model.

c. Conditionally Independent

Ada tiga macam model yang termasuk dalam conditionaly independent, yaitu:

(i) Model: log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik  (4.19)

dengan asumsi:

I J K I J I K

U 1i   U 2 j   U 3k   U 12 ij   U 13ik   0 ,


i 1 j 1 k 1 i 1 j 1 i 1 k 1
dan estimasi nilai

harapannya:

nij nik
m̂ijk 
n i 

Model dalam persamaan (4.19) menyatakan adanya hubungan antara peubah pertama

dengan peubah kedua, dan peubah pertama dengan peubah ketiga. Sedangkan antara

peubah kedua dan peubah ketiga saling bebas. Sehingga yang menyebabkan hubungan

adalah peubah pertama.

(ii) Model: log mijk  U  U1i   U 2 j   U 3k   U12 ij   U 23 jk  (4.20)

dengan asumsi:

I J K I J J K

U 1i   U 2 j   U 3k   U 12 ij   U 23 jk   0 ,


i 1 j 1 k 1 i 1 j 1 j 1 k 1
dan estimasi nilai

harapannya:

nij n jk
m̂ijk 
n j 

Model dalam persamaan (4.20) menyatakan adanya hubungan antara peubah pertama

dengan peubah kedua, dan peubah kedua dengan peubah ketiga. Sedangkan antara
31

peubah pertama dengan peubah ketiga saling bebas. Sehingga yang menyebabkan

hubungan adalah peubah kedua.

(iii) Model: log mijk  U  U 1i   U 2 j   U 3k   U13ik   U 23 jk  (4.21)

dengan asumsi:

I J K I K J K

U 1i   U 2 j   U 3k   U 13ik   U 23 jk   0 ,


i 1 j 1 k 1 i 1 k 1 j 1 k 1
dan estimasi nilai

harapannya:

nik n jk
mˆ ijk 
n  k

Model dalam persamaan (4.21) menyatakan adanya hubungan antara peubah pertama

dengan peubah ketiga, dan peubah kedua dengan peubah ketiga. Sedangkan antara

peubah pertama dengan peubah kedua saling bebas. Sehingga yang menyebabkan

hubungan adalah peubah ketiga.

d. Model tanpa Interaksi Tiga Faktor

Model: log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk  (4.22)

dengan asumsi:

I J K I J I K J K

U 1i   U 2 j   U 3k   U 12 ij   U 13ik   U 23 jk   0 ,


i 1 j 1 k 1 i 1 j 1 i 1 k 1 j 1 k 1
dan estimasi

nilai harapannya:

nij nik n jk
mˆ ijk 
n i   n  j  n  k

Model dalam persamaan (4.22) menyatakan adanya hubungan antara peubah pertama dengan

peubah kedua, peubah pertama dengan peubah ketiga, dan peubah kedua dengan peubah

ketiga.
32

e. Model Jenuh

Model jenuh adalah model yang didalamnya memuat semua parameter bebas dan juga

semua kemungkinan interaksi antar peubah yang terjadi, sehingga model tersebut tidak dapat

dimasuki parameter-parameter lainnya. Adapun modelnya, yaitu:

log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk   U123 ijk 

Pada model jenuh, frekuensi pengamatan sama dengan estimasi frekuensi harapan.

4.2.2 Estimasi Tidak Langsung

Cara yang digunakan untuk memperoleh estimasi dengan cara tidak langsung adalah

dengan prosedur iterasi. Dalam model log-linear tiga dimensi yaitu:

log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk 

Model ini menyatakan bahwa terdapat interaksi dua faktor. Tetapi dalam model tidak

terdapat interaksi antara ketiga peubah U 123 ijk   0 . Dengan kata lain, dalam model terdapat

asosiasi parsial. Untuk mendapatkan estimasi nilai harapan harus dilakukan prosedur iterasi

sebagai berikut:

0 
1. Ambil mˆ ijk  1 , untuk setiap ijk

Untuk U  1 maka:

3U 1 nij 3U 


2. mˆ ijk  3U  mˆ ijk
mˆ ij

3U  2  ni  k 3U 1


3. mˆ ijk  3U 1 mˆ ijk
mˆ ik

3U  3  n jk 3U  2 
4. mˆ ijk  3U  2  mˆ ijk
mˆ  jk
33

5. langkah 1 sampai 4 diulang untuk U  1,2,..... sampai konvergen atau mencapai nilai tertentu

sesuai tingkat ketelitian yang diinginkan. Setelah kondisi konvergen dicapai, maka akan

diperoleh estimasi nilai harapan sebagai berikut:

nij nik n jk
mˆ ijk 
n i   n  j  n  k

4.3 Uji Independensi (Uji Ketergantungan)

Uji independensi (uji ketergantungan) digunakan untuk mengetahui ada tidaknya

hubungan antara dua peubah yang telah ditetapkan (Christensen, 1997). Dalam tabel dua dimensi

yang mempunyai peubah X dan peubah Y dengan banyaknya baris I dan kolom J, maka hipotesis

untuk menguji independensi adalah sebagai berikut:

H 0 : Pij  P i P  j (tidak ada hubungan asosiasi antara peubah X dan peubah Y atau

independen)
H 1 : Pij  Pi P j (ada hubungan asosiasi antara peubah X dan peubah Y atau dependen)

dimana:
Pi = peluang pengamatan baris ke-i
P j = peluang pengamatan kolom ke-j
i = 1, 2,……,I
j = 1, 2, ……,J

Maka uji statistik yang sesuai adalah Chi-Square Pearson, dimana estimasi nilai harapannya

adalah sebagai berikut:

ni  n  j
mˆ ij  (4.23)
n 

dan statistik ujinya adalah:

I J n  mˆ ij 
2

  
2 ij
(4.24)
mˆ ij
hitung
i 1 j 1
34

dimana:
nij = frekuensi pengamatan pada baris ke-i kolom ke-j
ni  = frekuensi pengamatan pada baris ke-i
n j = frekuensi pengamatan pada kolom ke-j
n  = N = jumlah seluruh pengamatan
i = 1,2, ……, I
j = 1, 2, ……,J

Statistik uji tersebut, selanjutnya dibandingkan dengan distribusi  2 dengan derajat

bebas I  1J  1 dan risiko kesalahan  , serta kriteria penolakan H0 adalah:

 hitung
2
   , I 1 J 1) . Untuk tabel tiga dan tabel empat dimensi, pengujian independensi memiliki

cara yang sama dengan tabel dua dimensi.

4.4 Pengujian Residual

Pengujian residual bertujuan untuk menguji kesesuaian model (melihat kecukupan

model) (Agresti, 1990). Residual adalah selisih antara nilai pengamatan dan nilai harapan dari

masing-masing sel. Residual mempunyai rumus sebagai berikut:

nij  mˆ ij
eij  (4.25)
mˆ ij
12

sedangkan nilai adjusted residual rij  adalah residual dibagi dengan akar estimasi varian dari

residual.

nij  mˆ ij
rij 
mˆ 1  P 1  P 
ij i j
1
2

Suatu estimasi dikatakan cukup baik jika nilai adjusted residualnya mendekati distribusi

normal dengan nilai   0 dan  2  1 , atau berdistribusi normal N 0,1 . Apabila mengambil

  5%, maka 95% dari nilai adjusted residual yang masih diijinkan terletak -1,96 sampai
35

+1,96. Pada tabel tiga dimensi dan empat dimensi, pengujian residual memiliki cara yang sama

dengan tabel dua dimensi.

4.5 Uji Kesesuaian Model

Uji kesesuaian model atau Goodness of Fit Test merupakan dasar peluang untuk

membandingkan dan menentukan ada tidaknya kesenjangan antara pengamatan dengan model

(Agresti, 1990). Hipotesis yang digunakan dalam uji ini adalah:

H 0 : tidak ada kesesuaian antara pengamatan dengan model

H 1 : ada kesesuaian antara pengamatan dengan model

dengan kriteria penolakan H 0 yaitu G 2   2 , IJK  I  J  K 2  .

 
Pada uji rasio likelihood G 2 , nilai pengamatan dinotasikan dengan nijk dan nilai

harapannya m̂ijk , sehingga statistik ujinya adalah:

 I J K I J K 
G 2  2  nijk log mˆ ijk   nijk log nijk 
 i 1 j 1 k 1 i 1 j 1 k 1 
I J K  mˆ ijk 
G 2  2 nijk log  
i 1 j 1 k 1  nijk 

I J K  nijk 
G 2  2  nijk log   (4.26)
i 1 j 1 k 1  mˆ ijk 

Apabila model yang ditentukan benar dan N cukup besar, maka baik  hitung
2
atau G 2

mendekati distribusi  2 dengan derajat bebas sama dengan jumlah sel dikurangi jumlah

parameter bebas yang masuk model. Berikut ini akan disajikan tabel derajat bebas untuk tabel

tiga dimensi:
36

Tabel 4.5 Derajat Bebas Model Tiga Dimensi

Parameter Derajat Bebas

U 1
U1i  I-1
U 2 j  J-1
U 3 k  K-1
U 12 ij  (I-1)(J-1)
U13ik  (I-1)(K-1)
U 23 jk  (J-1)(K-1)
U 123 ijk  (I-1)(J-1)(K-1)
Total IJK
Sumber: Agresti (1990)

Dalam model log-linear, G 2 hampir sama dengan jumlah kuadrat sisaan (Sum Square

Error) dalam regresi linear (Christensen, 1997). Jika X 0 merupakan model jenuh dan X

merupakan model log-linear terbaik, maka:

G 2 X 0   G 2 X 
R 
2
(4.27)
G 2 X 0 

dimana G 2  X  dan G 2  X 0  adalah rasio likelihood untuk menguji model X dan model X 0

terhadap model jenuh. Untuk tabel empat dimensi, uji kesesuaian model memiliki cara yang

sama dengan tabel tiga dimensi.

4.6 Seleksi Model

Seleksi model dilakukan untuk memperoleh model terbaik (Garson, 2009). Seleksi model

dalam analisis model log-linear dapat dilakukan dengan beberapa pendekatan, antara lain:

4.6.1 Uji Pengaruh ke-K (Test of K-way effects)


37

Uji ini digunakan untuk mengetahui interaksi K suku atau lebih yaitu lebih tinggi sama

dengan nol dan sama dengan nol. Uji pengaruh ke-K (Test of K-way effects) dibagi menjadi dua,

yaitu:

a. Uji Pengaruh ke-K atau lebih sama dengan nol (Test that K-way and higher order effects are

zero)

Uji ini berdasarkan pada hipotesis bahwa pengaruh orde ke-K atau lebih sama dengan

nol. Uji dimulai dari orde tertinggi sampai dengan orde terendah. Pada model log-linear

empat dimensi, hipotesisnya adalah:

Untuk K=4; H 0 : pengaruh orde ke-4 atau lebih = 0

H1 : H 0

Untuk K=3; H 0 : pengaruh orde ke-3 atau lebih = 0

H1 : H 0

Untuk K= 2; H 0 : pengaruh orde ke-2 atau lebih = 0

H1 : H 0

Untuk K= 1; H 0 : pengaruh orde ke-1 atau lebih = 0

H1 : H 0

 
Statistik uji yang digunakan adalah nilai likelihood rasio chi-square G 2 . Apabila

nilai peluang dari G 2 yang diperoleh kurang dari  , maka H 0 ditolak.

b. Uji Pengaruh ke-K sama dengan nol (Test that K-way effects are zero)

Uji ini berdasarkan pada hipotesis bahwa pengaruh orde ke-K sama dengan nol. Pada

model log-linear empat dimensi, hipotesisnya adalah:

Untuk K= 1; H 0 : pengaruh orde ke-1 = 0

H1 : H 0
38

Untuk K= 2; H 0 : pengaruh orde ke-2 = 0

H1 : H 0

Untuk K= 3; H 0 : pengaruh orde ke-3 = 0

H1 : H 0

Untuk K=4; H 0 : pengaruh orde ke-4 = 0

H1 : H 0

 
Statistik uji yang digunakan adalah nilai likelihood rasio chi-square G 2 . Apabila

nilai peluang dari G 2 yang diperoleh kurang dari  , maka H 0 ditolak.

4.6.2 Uji Asosiasi Parsial

Uji ini bertujuan untuk menguji hubungan antara dua peubah dalam tiap level peubah

lainnya.

Hipotesisnya adalah:

H 0 : pengaruh interaksi peubah satu atau peubah dua sama dengan nol.

H 1 : pengaruh interaksi peubah satu atau peubah dua tidak sama dengan nol.

 
Statistik uji yang digunakan adalah nilai likelihood rasio chi-square G 2 . Apabila nilai

peluang dari G 2 yang diperoleh kurang dari  , maka H 0 ditolak.

4.7 Metode Backward

Metode backward dilakukan dengan menyeleksi model, dari model terlengkap menuju

model yang lebih sederhana (Agresti, 1990). Adapun prosedur metode backward yaitu sebagai

berikut:

1. Anggap model terlengkap sebagai model terbaik, misalnya sebagai model (0).
39

2. Mengeluarkan interaksi empat faktor dari model, sehingga menjadi model (1).

3. Dengan uji statistik conditional (Test conditional independence), dilakukan pengujian apakah

model (1) masih merupakan model terbaik, dengan hipotesis sebagai berikut:

H 0 : model (1) = model terbaik

H 1 : model (0) = model terbaik

Uji statistik conditional (Test conditional independence), yaitu:

G210   G21  G20 

dimana G21 : statistik likelihood G 2 untuk model (1)


G20  : statistik likelihood G 2 untuk model (0)
4. Membandingkan nilai p (p-value) dengan  , dengan kriteria penolakan jika p-value <  ,

maka H 0 ditolak.

5. Jika H 0 ditolak, artinya model (0) adalah model terbaik. Apabila H 0 diterima, maka model

(1) dibandingkan dengan model (2).

6. Untuk menentukan interaksi mana yang dikeluarkan terlebih dahulu, dipilih nilai G 2 terkecil.

7. Jika salah satu interaksi dari tiga faktor dikeluarkan, maka ulangi langkah 3 sampai 5 hingga

tidak ada lagi faktor yang harus dikeluarkan dari model, sehingga diperoleh model yang

terbaik.
40

BAB V
ANALISIS REGRESI LOGISTIK

5.1. Analisis Regresi

Analisis regresi merupakan alat statistic yang memanfaatkan hubungan antara dua atau
lebih peubah kuantitatif, sehingga salah satu peubah bisa diramalkan dari peubah lainnya.
Analisis Regresi memperlihatkan hubungan dan pengaruh antara peubah bebas terhadap peubah
respon.

Asumsi-asumsi yang harus dipenuhi dalam penggunaan model regresi linier yaitu:

1. Harus diketahui dengan pasti bentuk hubungan antara peubah respon dengan peubah
bebas.
2. Sisaan mengikuti sebaran normal.
3. Kehomogenan ragam sisaan.
Jika hubungan respon dengan peubah bebas bersifat linier dan asumsi di atas terpenuhi,

maka model regresi linier merupakan model terbaik. Adapun model dari regresi linier adalah:

y( x)   0  1 x1   2 x2     p x p   (5.1)

dengan:

y = peubah respon

x = peubah bebas

ε = sisaan

dengan asumsi ε menyabar normal dengan rataan 0 dan ragam 1. Jika x hanya satu maka disebut
model regresi linier sederhana.
41

5.2. ANALISIS REGRESI LOGISTIK

Menurut Hosmer dan Lemeshow (2000) analisis regresi logistic merupakan metode
regresi dengan peubah respon Y merupakan kategorik atau dikotomi, sedangkan peubah
bebasnya merupakan peubah kategorik dan atau kontinu. Myers (1990) menyatakan jika peubah
respon Y terdiri dari dua kategori yaitu sukses dan gagal, maka peubah y tersebut mengikuti
sebaran Bernoulli dengan fungsi sebaran sebagai berikut:

F (Y  y)  p y (1  p)1 y (5.2)

dengan p adalah peluang sukses, dan y = 0, 1.

Misalkan nilai harapan dari Y untuk nilai peubah bebas x yang diberikan adalah E(Y/x)
dan untuk memudahkan notasi dimisalkan juga g ( x)   0  1 x1   2 x2     p x p dan

π(x) = E(Y/x), maka π(x) menjelaskan rataan bersyarat dari Y untuk nilai x yang diberikan.
Untuk menggambarkan hubungan π(x) dan g(x) sangat tepat digunakan regresi logistic berikut:

expg ( x)
   x   x
e 0 11 p p

 ( x)   (5.3)
1  expg ( x) 1  e  0  1x1   p x p

1
 ( x) 
1  eg x 

 
0
g(x)
42

Penggunaan regresi logistic tepat karena plot antara π(x) dengan g(x) untuk nilai π(x) menuju -∞
konvergen ke 0, sedangkan untuk π(x) menuju +∞ konvergen ke 1.

Dari persamaan (5.3) dapat juga dinyatakan sebagai berikut:

expg ( x)
f g ( x)   ( x)  ;  g ( x)   (5.4)
1  expg ( x)

Apabila nilai g(x) pada persamaan (5.4) ditetapkan, maka didapat:

lim f g ( x)  0
g ( x ) 
(5.5)
lim f g ( x)  1
g ( x ) 

Persamaan (5.5) menerangkan bahwa nilai f[g(x)] berkisar antara 0 dan 1 berapapun nilai
g(x). Hal tersebut menunjukkan bahwa model logistic menggambarkan peluang suatu kejadian
atau risiko dari suatu tindakan yang maksimal bernilai 1.

Transformasi logit merupakan teknik analisis yang digunakan untuk memperoleh fungsi
linier yaitu dengan cara melakukan transformasi model logistic sehingga diperoleh bentuk
sebagai berikut:

  ( x) 
g ( x)  ln     0  1 x1   2 x2     p x p (5.6)
1   ( x) 

Persamaan (5.6) merupakan bentuk linier setelah ditransformasi.

Pendugaan Parameter

Metode yang digunakan untuk menduga parameter dalam regresi logistic adalah Metode
Kemungkinan Maksimum (Method of Maximum Likelihood). Prinsip dasar metode ini adalah
untuk memperoleh penduga parameter dengan memaksimumkan fungsi likelihood. Bila Y1,…,Yn
adalah amatan-amatan yang bebas, maka fungsi peluang bersama bagi sampel ini adalah:
43

n
g Y1 ,, Yn    f Yi ;  . Bila fungsi peluang bersama ini dipandang sebagai suatu fungsi
i 1

n
likelihood L(θ) maka L    f Yi ;  dengan memaksimumkan L(θ) relative terhadap θ akan
i 1

diperoleh penduga kemungkinan maksimum bersifat konsisten dan cukup.

Jika Y dikodekan 0 dan 1 maka menurut persamaan (1),  x   P(Y  1 x) dan

1   x   P(Y  0 x) sehingga, untuk pasangan-pasangan (xi,yi) berlaku yi = 1 dengan fungsi

kemungkinan maksimumnya adalah π(xi) dan jika yi = 0 fungsi kemungkinan maksimumnya


adalah 1 – π(xi).

Secara matematik fungsi kemungkinan maksimum untuk pasangan (xi,yi) adalah sebagai
berikut:  xi  y 1   ( xi )1 y
i i
(5.7)

Apabila amatan-amatan diasumsikan saling bebas, fungsi kemungkinan maksimum dapat


ditulis sebagai berikut:

n
(  )    xi  i 1   ( xi )
y 1 yi
(5.8)
i 1

Metode kemungkinan maksimum memberikan nilai penduga dari vector


 '  ( 0 1   p ) dengan memaksimumkan fungsi kemungkinan bersama pada persamaan (5.8),
secara matematik bentuk logaritma dari fungsi kemungkinan bersama sebagai berikut:

n
L(  )  ln(  )   yi ln[ xi ]  (1  yi ) ln1   ( xi ) (5.9)
i 1

n  e  0  1x1   p x p      x   p x p



L(  )  ln    y i ln    e 0 11
   x   p x p   1  y i ln  1     x   p x p 
(5.10)
i 1 1  e 0 1 1   1  e 0 1 1 

Untuk mendapatkan nilai penduga dari  '  ( 0 1   p ) yang memaksimumkan L(β),

didapat dengan menurunkan persamaan (5.10) terhadap  '  ( 0 1   p ) . Hasil penurunannya

disamakan dengan nol.


44

n  e  0  1x1   p x p      x   p x p



L(  )  ln    y i ln    e 0 11
   x   p x p   1  y i ln  1     x   p x p 
i 1 1  e 0 1 1   1  e 0 1 1 

n  e  0  1x1   p x p  1  e  0  1x1   p x p  e  0  1x1   p x p 


  y i ln     x   p x p   1  y i  ln     x   p x p 
i 1 1  e 0 1 1   1 e 0 1 1 

n  e  0  1x1   p x p   
 1  y i  ln 
1
  y i ln   0  1 x1   p x p   0  1 x1   p x p 
i 1 1  e  1  e 

   ln 1  e 
n
1 1
  yi ln e
 0  1 x1   p x p  0  1 x1   p x p
 ln 1  e  0  1 x1   p x p   yi ln  0  1 x1   p x p
i 1   1 e

   ln1  ln1  e  y ln1  ln1  e 


n
  yi ln e
 0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p
 yi ln 1  e i
i 1

   0  ln1  e  y 0  ln1  e 


n
  y i ln e
 0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p
 y i ln 1  e i
i 1

   ln1  e   y ln1  e 
n
  y i ln e
 0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p
 y i ln 1  e i
i 1

 
n
  y i ln e
 0  1 x1   p x p  0  1 x1   p x p
 ln 1  e
i 1

Persamaan yang diperoleh setelah diturunkan dan disamakan dengan nol sebagai berikut:

   x   x    x   x
L(  ) n
e 0 11 p p
e 0 11 p p

  yi 0  1x1   p x p  0
 0 i 1 e
   x   p x p
1 e 0 1 1

n  0  1 x1   p x p
e
  yi   0  1 x1   p x p
0
i 1 1 e

L(  ) n
   y i   ( xi )   0
 0 i 1
45

   
L(  )  y1 ln e  0  1x1  ln 1  e  0  1x1  y2 ln e  0  1x1   2 x2  ln 1  e  0  1x1   2 x2   
yn ln e
 0  1 x1   p x p

 ln 1  e
 0  1 x1   p x p

L(  ) e  0  1 x1 e  0  1 x1 e  0  1 x1   2 x2 e  0  1 x1   2 x2
 y1 x1  0  1 x1  x1  0  1 x1  y 2 x 2  0  1 x1   2 x2  x 2  0  1 x1   2 x2   
 1 e e e e
 0  1 x1   p x p  0  1 x1   p x p
e e
y n xn  0  1 x1   p x p
 xn  0  1 x1   p x p
e e

 x1  y1   x1    y 2   x2      y n   xn 

L(  ) n
  xi  y i   ( xi )
 i i 1

Persamaan yang diperoleh disamakan dengan nol, sehingga:

L(  ) n
  xij  yi   ( xi )  0 (5.12)
 j i 1

Dengan:

i adalah subskrip menyatakan banyaknya sampel, i = 1, 2, …, n

j adalah subskrip menyatakan banyaknya peubah, j = 1, 2, …, p

Metode pendugaan ragam dan koragam dari koefisien penduga diperoleh berdasarkan
teori pendugaan maksimum. Penduga ragam dan koragam yang diperoleh adalah suatu matrik
yang berasal dari turunan parsial kedua dari persamaan (5.8). Turunan kedua dari persamaan
tersebut adalah sebagai berikut:

 2 L(  ) n

 j2
  
i 1
xij2 i (1   i ) (5.13)

 2 L(  ) n
  xij xil  i (1   i ) (5.14)
 j  l i 1
46

Untuk j = 0, 1 dan l = 0, 1, 2, …, p dengan πi dinotasikan π(xi). Selanjutnya didefinisikan


I(β) suatu matrik berukuran (p+1) x (p+1) yang elemen-elemennya adalah negative dari nilai
pada persamaan pada persamaan (5.13) dan (5.14). Matrik tersebut disebut dengan matrik
informasi. Notasi Var(βj) digunakan untuk menyatakan unsure diagonal ke-j dari matrik I-1(β)
yang merupakan ragam dari ˆ j . Cov(  j ,  l ) dipakai untuk menyatakan unsure sembarang yang

bukan unsure diagonal dari matrik I-1(β) yang merupakan koragam dari ˆ j dan ̂ l . Penduga dari

ragam dan koragam adalah Vaˆr (ˆ ) , yang diperoleh dengan mengevaluasi Var(β) pada ˆ .

Didapat Vaˆr ( ˆ j ) dan Coˆv( ˆ j , ˆl ); j , l  0,1,2,  , p untuk nilai-nilai didalam matrik. Simpangan

baku dugaan dari koefisien dugaan ditulis dengan persamaan sebagai berikut:

  
SˆE ( ˆ j )  Vaˆr ˆ j
1/ 2
(5.15)

Untuk j = 0, 1, 2, …,p.

Matrik informasi yang digunakan dalam pengujian kecocokan model adalah



Iˆ ˆ  X 'VX . Matrik X dan V dapat ditulis dalam bentuk sebagai berikut:

1 X 11  X 1 p 
1 
X 21  X 2 p 
X  
(5.16)
 
 
1 X n1  X np 

ˆ1 1  ˆ1  0  0 
 
V  0 ˆ 2 1  ˆ 2   0  (5.17)
0 0  ˆ n 1  ˆ n 

Dalam regresi linier, untuk menentukan parameter yang masuk dalam model berdasarkan
fungsi dari selisih nilai pengamatan dengan nilai dugaan y  yˆ  . Prinsip dasar dalam regresi

logistic adalah sama dengan pada regresi linier yaitu membandingkan nilai pengamatan dari
variansi respon dengan nilai dugaan berdasarkan fungsi likelihood yang didefinisikan dalam
47

persamaan (5.9). Perbandingan nilai amatan dengan dugaan menggunakan fungsi likelihood
berdasarkan pada pernyataan adalah:

 likelihooddari mod eldugaan 


D  2 ln   (5.18)
 likelihooddari mod elama tan 

Berdasarkan persamaan (5.9) maka persamaan (5.18) menjadi:

n 
 ˆ   1  ˆ i 
D  2  y i ln  i   (1  y i ) ln   (5.19)
i 1   yi   1  yi 

Statistik D dalam persamaan di atas disebut devian. Devian dalam regresi logistic
kegunaannya sama dengan jumlah kuadrat galat (SSE) dalam regresi linier. Untuk memeriksa
signifikansi dari peubah-peubah bebas digunakan:

G = D (untuk model sebelum peubah masuk) – D (untuk model setelah peubah masuk).

Untuk memeriksa keberartian koefisien β secara keseluruhan digunakan hipotesis:

H 0 :  0  1     p  0
H 1 :Minimal adasatu  j  0 : j  0,1,2,  , p

Dengan Statistik ujinya adalah statistikG sebagai berikut:

 n1  n1  n0  n0 
    
G  2 ln   n  n 
 n 
 ˆ i y i 1  ˆ i 1 yi 
 i 1 

Jika H0 benar maka statistic G akan mengikuti sebaran Khi Kuadrat (χ2) dengan derajat
bebas p-1 dengan p adalah banyaknya peubah bebas yang ada didalam model.

Pengujian keberartian koefisien β secara parsial digunakan statistic Wald. Hipotesisnya


adalah sebagai berikut:

H0 :  j  0
H 1 : j  0 : j  0,1,2,  , p
48

Secara matematik uji-wald sebagai berikut:

j
W 
SE ˆ(  j )

H0 benar jika statistik uji-Wald akan mengikuti sebaran normal baku

(Hosmer dkk,2000), sehingga pengujian secara individual bisa dilakukan dengan

membandingkan nilai statistik uji tersebut dengan nilai ZTabel. Interpretasi koefisien dilakukan

pada peubah-peubah yang berpengaruh nyata. Dalam regresi linear dengan satu peubah bebas,

koefisien 1 merupakan beda antara nilai y pada x  x  1 dengan nilai y pada x = x. Misalnya

jika y(x)=  0  1 x maka pada 1  y ( x  1)  y ( x) . Dalam regresi logistik koefisien 1

merupakan beda logit. Perubahan nilai logit untuk setiap satu unit perubahan pada peubah bebas

x ialah 1  g ( x  1)  g ( x) . Interpretasi koefisien pada regresi logistik menggunakan odds rasio.

Model regresi logistik dengan peubah bebas dikotomi dapat diilutrasikan dalam table 2.1 berikut:

Tabel 5.1 Nilai-nilai dari Model Logistik untuk Peubah Bebas Dikotomi

Peubah tak bebas Peubah Bebas (independent)

(dependent) x=1 x=0

e 0  1 e 0
y=1  (1)   (0) 
1  e 0  1 1  e 0

1 1
y=0 1   (1)  1   (0) 
1  e  0  1 1  e 0

Jumlah 1.0 1.0

Sumber: Hosmer & Lemeshow, 2000


49

Nilai odds rasio antara y = 1 dengan y = 0 untuk x = 1 adalah  1


1   1
, sedangkan nilai odds

rasio antara y = 1 dengan y = 0 untuk x = 0 adalah  0


1   0 .
 e  0  1   1 
  /   0  1 
1  e  0  1  1 e 
OR  
 e 0   1 
 0
 /  0 
1 e  1 e 
e  0  1

e 0
( 0   ) 0
e
 e 1 (5.20)

Persamaan (5.20) dapat diinterpretasikan bahwa odd rasio (OR) = 1 berarti bahwa

individu dengan nilai x = 1 mempunyai peluang yang sama dengan individu dengan nilai x = 0

dalam kaitannya dengan Y = 1. Jika 1 < OR <  , maka individu dengan x = 1 mempunyai

peluang yang lebih besar dibanding dengan x = 0, sebaliknya jika 0 < OR < 1 individu dengan x

= 1 mempunyai peluang lebih kecil dibandingkan x = 0 dalam kaitannya dengan Y = 1.


50

DAFTAR PUSTAKA

1. Agresti, A. 1990. Categorical Data Analysis, John Wiley& Sons, USA.

2. Christensen, R. 1997. Log Linear Models and Logistic Regression. Springer-Verlag,


New York.

3. Kleinbaum, D.G. 2002. Logistic Regression; A Self-Learning Text. 2ed. Springer-


Verlag, New York.

4. Hosmer, D.W.2000. Appllied Logistic Regression, 2ed. John Wiley & Sons, USA.

Anda mungkin juga menyukai