Diktat Adk Made Susilawati

DIKTAT
ANALISIS DATA KATEGORIK
1
 ( x) 
1  eg x 
 
0
g(x)
OLEH:
MADE SUSILAWATI
PROGRAM STUDI MATEMATIKA

FMIPA UNIVERSITAS UDAYANA
1
BAB I
PENDAHULUAN
Analis data kategorik adalah analisis yang meliputi:
1. Proses Multinom : Tabel Kontingensi, model Log Linier

2. Proses Binom : Regresi Logistik
3. Proses Poisson : Regresi Poisson
Secara lebih jelas, struktur analisis Statistika dilihat dari sekala pengukuran variabel-
variabelnya adalah:
Tabel 1.1 Skala Pengukuran untuk Berbagai Analisis Statistika
Y (respon) X (penjelas) Metode Statistika

Kontinu Diskrit Analisis Ragam
Kontinu Diskrit/Kontinu Analisis Regresi
Deskrit Diskrit/Kontinu Analisis Data Kategorik
Analisis ragam dipakai secara luas pada percobaan dalam bidang Pertanian dan
ilmu-ilmu Biologi, Analisis Regresi dipakai selain pada bidang pertanian juga pada bidang
Ekonomi. Sedangkan Analisis data Kategorik dipakai , misalnya: pada pertanian, contohnya
mengamati daya kecambah dari bibit jagung, amatanya adalah biji jagung, dan responnya
adalah tumbuh, mati. Contoh 2: pada klimatologi, mengamati hari hujan dalam sebulan,
misal: tanggal 1. → hujan
tanggal 2.→ hujan
tanggal 3.→ tidak hujan
dst
tanggal 31.→ tidak hujan
maka responnya adalah hujan, tidak hujan. Contoh 3: pada bidang sosial, mengukur sikap
dan opini pada berbagai masalah dan karakteristik demografi, seperti: gender, ras dan kelas
2
sosial. Pada kedokteran, mengukur faktor-faktor seperti parahnya luka, tingkat keparahan
suatu penyakit, dll.
Skala Pengukuran
Skala pengukuran secara garis besarnya dapat dibagi dalam kategori data kategorik
dan data kontinu. Data diskrit diperoleh dari hasil membilang atau mencacah, misalnya
jumlah anak, jumlah anggota keluarga, sedangkan data kontinu diperoleh dari hasil
mengukur, misalnya hasil tanaman padi dalam ton/ha, nilai mutu rata-rata mahasiswa, dll.
Dari skala diskrit dan skala kontinu ini, skala pengukuran dapat dibagi dalam empat skala,
yaitu nominal, ordinal, interval dan rasio.
1. Skala Nominal
Skala yang tidak mempunyai level urutan, sifatnya hanya membedakan, misalnya: agama, jenis-
jenis transportasi, pilihan tempat tinggal, ras, gender, status kawin, dll.
2. Skala Ordinal
Skala yang mempunyai sifat membedakan dan mengurutkan, misalnya: kelas sosial (rendah,
menengah, tinggi), sikap (sangat tidak setuju, tidak setuju, setuju, sangat setuju).
3.Skala Interval
Skala yang mempunyai sifat membedakan, mengurutkan, dan mempunyai jarak numeric antara
dua level skala, misalnya: umur (0-3 tahun, 4-6 tahun, dll), pendapatan (0-Rp.500.000,-,
Rp.600.000,--Rp.1.000.000,-) dll.
4.Skala Rasio
Kelebihan skala ini dengan yang lainnya adalah mempunyai perbandingan, misalnya berat
badan, tinggi badan, dll.
Suatu variable bisa diukur berdasarkan metode statistika apa yang akan digunakan.
Misalnya pendidikan, akan mempunyai skala nominal bila diukur berdasarkan tipe pendidikan
(sekolah umum, sekolah khusus), dapat diukur dengan skala ordinal bila berdasarkan tingkat
3
pendidikan (pendidikan dasar, mengah, atas, universitas, Pascasarjana), dan menggunakan skala
interval jika diukur berapa lama pendidikannya (0,1,2,3,…).
Latihan
1.Dalam pernyataan berikut, bedakan antara variabel respon dan variabel bebas.
a. Sikap terhadap tindakan aborsi (setuju, menentang); gender (laki-laki, wanita)
b. Penyakit pada hati (ada, tidak); tingkat kolestrol
c. Warna kulit (putih, tidak putih); gender (laki-laki, wanita); keputusan dalam memilih partai
politik (Republik, Demokrat, lainnya); pendapatan.
d. Rumah sakit (A, B); perlakuan (T1, T2); keadaan pasien setelah berobat (sembuh, mati).
2. Apa skala pengukuran yang paling tepat untuk variabel berikut:
a. Anggota sebuah partai politik (Demokrat, Republik, lainnya)
b. Tingkat pendidikan tertinggi yang diselesaikan (SD,SMP, SMA, S1, S2, S3)
c. Kondisi pasien (bagus, kurang bagus, serius, kritis)
d. Lokasi Rumah Sakit (Denpasar, Singaraja, Gianjar).
3. Gambarkan sebuah rencana penelitian yang variabel responnya kategorik. Uraikan variabel-
variabel penting yang mendukung penelitian tersebut, bedakan antara respon dan variabel
penjelas. Untuk setiap variabel, tentukan skala pengukurannya.
4
BAB II
TABEL KONTINGENSI (Tabel dua arah)
Dalam survey biasanya menggunakan kuisioner sebagai alat untuk mengumpulkan data,
dengan tujuan untuk mendapatkan informasi. Jawaban dari responden kalau berupa jawaban
kategorik maka didapat respon kategorik. Hasil dari survey bila disajikan dalam bentuk tabel
akan diperoleh table kontingensi. Misalnya: pendapat siswa terhadap penerapan ujian nasional
didapat data sebagai berikut:
Tabel 2.1. Tabel Kontingensi pendapat responden terhadap wanita bekerja malam hari
Jenis Kelamin Siswa
Pendapat Pria Wanita Jumlah
Setuju 78 28 106
Tidak Setuju 17 60 77
Jumlah 95 88 185
Tabel 2x2 seperti di atas merupakan yang paling sederhana dari table silang secara umum.
Tabel 2.2. Tabel Kontingensi 2x2
Kategori B
Kategori A B1 B2 Jumlah
A1 f11 f12 f10
A2 f21 f21 f20
Jumlah f01 f02 f00
fij = frekuensi amatan, yaitu banyaknya responden yang termasuk dalam kategori atau sel (i,j)
atau jumlah subyek atau obyek dalam sampel kita yang jatuh dalam variasi kategorik pada
variable yang diamati. f0j atau fi0 = total marjinal pada lajur/baris responden.
5
Ada dua kemungkinan cara peneliti sampai pada table kontingensi tertentu:
1. Peneliti mengambil responden sebanyak f00, kemudian dari jawaban responden dilakukan
klasifikasi. Hal ini akan membawa kita pada pengujian: apakah antara dua klasifikasi A
dan B ada saling ketergantungan? (Uji Kebebasan)
2. Peneliti mengambil responden kategori A1 sebanyak f10 dan responden kategori A2

sebanyak f20 . Kemudian dari tiap-tiap kategori A1 dan A2 diperiksa berapa responden
yang termasuk ke dalam kategori B1 dan B2. Ini akan membawa pada pengujian apakah
ada perbedaan respon dari kelompok responden A1 dan A2 terhadap kategori B1 dan B2
(Uji Pembandingan).
Pengujian Kebebasan A dan B
Jika A dan B bebas maka jawaban responden terhadap pertanyaan A tidak tergantung
f11 f
terhadap jawaban pertanyaan B, sehingga dapat diharapkan:  21 demikian pula
f10 f 20
f11 f
 12
f 01 f 02
Untuk itu perlu pengujian hipotesis tentang kebebasan A terhadap B. Misalkan Pij adalah peluang
individu masuk ke dalam kategori/sel (i,j) maka untuk setiap sel didapat:
Kategori B
Kategori A B1 B2 Jumlah
A1 P11 P12 P10
A2 P21 P21 P20
Jumlah P01 P02 P00
f11 f 01 f  f 21
Dengan: P11  dan P01   11
f 00 f 00 f 00
P11 P12
Jika A dan bebas maka:  , Artinya P(AiBj) = P(AiBj)
P01 P02
6
f i1  f i 2 f1 j  f 2 j
PB j  
f f0 j
P Ai    i 0  Pi 0 dan   P0 j
 f ij f 00 f ij f 00
Kalau A dan B bebas maka: Pij  Pi 0 .P0 j
Pij didapat dari populasi, sehingga sangat jarang bisa mengetahui Pij . Karena itu nilai Pij diduga
dari frekuensi relatifnya:
f f f f
Pˆ11  11 ; Pˆ12  12 ; Pˆ21  21 ; Pˆ22  22
f 00 f 00 f 00 f 00
Dengan didapat dugaan dari Pij, selanjutnya perlu dihitung frekuensi harapan. Frekuensi harapan
adalah jumlah subyek atau obyek dalam sampel yang diambil yang diharapkan untuk diobservasi
jika hipotesi nol tentang variable tersebut benar, maka frekuensi harapannya adalah
f10 . f 01
Sel(1,1)  e11  P11 f 00  P10 .P01  f 00 
f 00
f10 . f 02
Sel(1,2)  e12  P12 f 00  P10 .P02  f 00 
f 00
f 20 . f 01
Sel(2,1)  e21  P21 f 00  P20 .P01  f 00 
f 00
f 20 . f 02
Sel(2,2)  e22  P22 f 00  P20 .P02  f 00 
f 00
Sehingga kita memiliki frekuensi amatan dan frekuensi harapan, dan ini menjadi dasar untuk
menguji apakah A dan B bebas atau tidak. Jika f (frekuensi amatan) dan e (frekuensi harapan)
sangat berbeda, maka cenderung menganggap A dan B tidak bebas, sebaliknya jika f dan e mirip
(nilai hamper sama), maka cenderung menganggap A dan B bebas. Uji bagi kebebasan antara A
dan B adalah uji χ2, dengan hipotesis:
H 0 : Pij  Pi 0 .P0 j
H 1 : Pij  Pi 0 .P0 j
7
Atau Ho : dua populasi saling bebas
H1 : dua populasi tidak saling bebas atau saling ketergantungan
Dengan statistic ujinya adalah:
f  eij 
2
    tabel
2 ij 2
hit ( db, ) (2.1)
eij
Dengan db = (r-1)(k-1).
Teladan 1.
Lihat table 1.1. kita akan melakukan uji kebebasan, dengan hipotesisnya adalah:
H0: Pendapat setuju atau tidak setuju, tidak berkaitan dengan jenis kelamin responden
(pendapat dan jenis kelamin bebas)
H1: Ada kaitan antara jenis kelamin responden dengan pendapatnya
Langkah pertama yaitu menghitung nilai harapan tiap sel:
(106)(95) (77 )(95)

e11   53,03 e21   39,97
183 183
(106)(88) (77)(88)
e12   50,97 e22   37,03
183 183
Langkah kedua, membuat table seperti berikut:
Tabel 2.4. Hasil perhitungan teladan 1.
fij eij fij - eij (fij - eij )2 (fij - eij)2/eij
78 55,03 22,97 527,6209 9,59

28 50,97 -22,97 527,6209 10,35
17 39,97 -22,97 527,6209 13,20
60 37,03 22,97 527,6209 14,25
8
 hit
2
=47,39
Nilai  hit
2
nya adalah: 47,39, dengan  tabel
2
(1; 0, 05 )  3,84; Karena  hit
2
 χ2 tabel
Maka H0 ditolak, artinya ada kaitan antara jenis kelamin dengan pendapat setuju tidak setuju.
Tetapi dengan uji ini tidak berarti bahwa factor yang satu bergantung dari atau penyebab dari
atau mengakibatkan factor lain.
Alternatif untuk perhitungan diatas adalah rumus:

N (ad  bc) 2
 2
 (2.2)
(a  b)(b  d )(c  d )(a  c)
hit
Dengan N= a+b+c+d
Catatan
Bila harga eij<5, maka statistic  hit

2
di atas tidak dapat digunakan, tetapi menggunakan koreksi
kontinyuitas atau koreksi Yates.
1 2
N ( ad  bc  N)
 Yates
2
 2 (2.3)
(a  b)(b  d )(c  d )( a  c)
Teladan 2.
Suatu penelitian tentang peran serta karyawan dalam membuat keputusan manajemen, missal ada
system manajemen (setuju, tidak setuju). Data yang terkumpul adalah sebagai berikut:
Tabel 2.5. Data Frekuensi Peran serta Karyawan dalam Membuat Keputusan Manajemen
Peran Serta
Keputusan Ikut Serta Tidak Ikut Serta Jumlah
Setuju 7 6 13
Tidak Setuju 47 25 72
9
Jumlah 54 31 85
Jika nilai harapan setiap sel dihitung, terlihat bahwa sel (1,2) mempunyai nilai harapan 4,74
kurang dari 5, karena itu pengujiannya menggunakan statistic uji  Yates
2
1
85( 7  25  6  47  85) 2
 Yates
2
 2  0,226
13  72  54  31
Berdasarkan perhitungan di atas diputuskan H0 diterima, yang berarti persetujuan terhadap

keputusan manajemen tidak ada kaitannya pada diajak atau tidaknya karyawan berperan serta
dalam membuat keputusan manajemen.
Latihan
1. Seorang mahasiswa matematika menyelidiki tentang kecendrungan stress mahasiswa
matematika menghadapi perkulihan di jurusan Matematika FMIPA Unud, diduga perbedaan
gender mempunyai kecendrungan yang berbeda terhadap ada tidaknya stress pada mahasiswa.
Rumuskan variable yang terlibat dalam penelitian di atas dan tuliskan hipotesis penelitiannya.
2.Penelitian dilakukan untuk mengetahui pendapat masyarakat mengenai pernikahan dini, diduga
pendapat orang muda (remaja) berbeda dengan pendapat orang tua (dewasa); Rumuskan variable
yang terlibat dalam penelitian di atas dan tuliskan hipotesis penelitiannya.
10
BAB III
PENGUKURAN TERJADINYA PERISTIWA
1. PREVALENSI
Prevalensi suatu peristiwa atau kasus tertentu (penyakit, kematian, dsb), didefinisikan
sebagai banyaknya kasus tersebut yang telah atau tercatat pada saat tertentu atau titik waktu
tertentu. Angka prevalensi suatu kasus didefinisikan sebagai rasio antara prevalensi kasus
tersebut dengan jumlah seluruh individu yang mempunyai risiko, yang dinyatakan sebagai
individu berisiko, pada suatu titik waktu.
Jika jumlah kasus yang diobservasi (terdaftar atau tercacah) pada suatu titik waktu dalam
suatu wilayah sebanyak n dan seandainya diketahui seluruh individu berisiko sebanyak N, maka
prevalensi kasus tersebut adalah n, dan angka prevalensi di wilayah itu adalah:
PV = k*n/N .................... (3.1)
Di mana k menyatakan faktor pengali yang ditentukan dan telah disepakati untuk kasus tersebut.
2. UKURAN ASOSIASI
Contoh asosiasi antar variabel:
1. Hubungan Timbal Balik
a. Misal, V1 = status pemakaian KB (1. Ya; 0. Tidak)
V2 = Jumlah anak yang dilahirkan
Maka V1 bisa merupakan penyebab dari V2 , bisa juga merupakan akibat dari V2.
b. Misal, V3 = pendidikan
V4 = Pekerjaan
Maka V3 dapat merupakan penyebab mendapat V4, bisa juga merupakan akibat dari V4.
2. Hubungan searah
11
a. Misal, V1 = pola makan ibu waktu hamil
V2 = berat badan bayi pada saat dilahirkan
V3 = pendidikan ibu
Maka V1 merupakan penyebab dari V2, begitu pula V3 merupakan penyebab dari V2, tetapi
bukan sebaliknya.
b. Misal, V4 = pendapatan
V5 = simpanan dalam bentuk uang
Maka V4 merupakan penyebab dari V5.
3. Hubungan yang tidak meyakinkan
a. Misal, penolong persalinan (1. Dokter, 2. Bidan, 3. Dukun) dengan berat badan bayi
saat lahir.
b. Pemilik usaha memelihara anjing atau tidak, dengan status kreditnya (0. Macet,
1. Tidak).
3. Perbedaan Resiko (RD) Antara Dua Proporsi
Tabel 3.1. Peristiwa Pada Kelompok Kasus dan Kontrol
Kelompok Peristiwa
1.Ya 2. Tidak Total
1. Kasus d1 h1 n1
2. Kontrol d0 h0 n0
Total d h n
Perbedaan resiko digunakan untuk melihat seberapa besar resiko pada kelompok kasus menurun
atau meningkat bila terjadi peristiwa ya. RD dihitung dengan rumus:
RD = P1 – P0
12
d1
Dengan P1  adalah proporsi dalam kasus pada peristiwa ya
n1
d0
Dan P0  adalah proporsi dalam kontrol pada peristiwa ya
n0
Nilai RD yang negative menunjukkan resiko yang menurun pada kelompok kasus pada
peristiwa ya, sedangkan nilai RD yang positif menunjukkan resiko yang meningkat pada
kelompok kasus pada peristiwa ya.
Selang kepercayaan untuk perbedaan diantara dua proporsi adalah
CI   p1  p0   z   s.e. p1  p0 
Dengan z’ adalah nilai peluang di bawah sebaran normal untuk α yang ditetapkan.
s.e. p1  p0    p1 1  p1  n1  p0 1  p0  n0   s.e. p 
1
2

 s.e. p0  ………………………… (3.2)
2
Pengujian Perbedaan Antara Dua Proporsi
Statistik uji yang digunakan untuk membandingkan dua proporsi berdasar pada normal tes, yaitu:
p1  p0
z
s.e. p1  p0 
Dengan s.e. p1  p0  seperti (1), bisa juga dihitung dengan rumus:
s.e. p1  p0    p1  p 1 n1  1 n0  P

d
n
Hipotesis yang diuji adalah H0 = perbedaan resiko adalah nol atau sama, versus
H1 = perbedaan resiko adalah tidak sama.
Contoh
Penelitian tentang efektifan pemberian vaksin untuk mencegah influenza

13
Tabel 3.2. Tabel 2 x 2 Mengenai Hasil Percobaan Vaksin Influensa
Kelompok Influensa
1.Ya 2. Tidak Total
Vaksin 20 (8,3%) 220 (91,7%) 240
Kontrol 80 (36,4%) 140 (63,6%) 220
Total 100 (21,7%) 360 (78,3%) 460
Perbedaan Resiko nya adalah: p1 – p0 = 0.083-0.364 = -0.281
Nilai -0.281 menunjukkan resiko terinfeksi influenza akan menurun sebesar 0.281 bila diberi
vaksin.
Selang kepercayaan untuk perbedaan resiko terkena influensa yang divaksin dengan tidak
divaksin adalah: s.e. p1  p0   0.0831  0.083 240  0.3641  0.364 220  0.037
Sehingga selang kepercayaanya adalah:
CI   p1  p0   z   s.e. p1  p0 
95%CI  0.083  0.364   0.196  0.037

  0.353,0.208
Interpretasinya adalah: kita percaya 95% bahwa populasi yang di vaksin akan berkurang
resikonya terinfeksi influenza sebesar 0.208 sampai 0.353.
Pengujian hipotesis mengenai perbedaan proporsi langkah-langkahnya sbb.:
p1  p0
z
s.e. p1  p0 
Dengan: s.e. p1  p0   0.2171  0.217 1 240  1 220  0.0385
0.083  0.364  0.281

Sehingga: z   7.299
0.0385 0.0385
Bila dibandingkan dengan z tabel (α = 0.05) = 1.96 maka Ho di tolak, ini menunjukkan adanya
pengurangan resiko yang signifikan pada populasi yang divaksin terinfeksi influenza.
14
4. Risk Ratio (RR)
p1 d d
Berdasarkan Tabel 2.1. RR dihitung dengan rumus: RR  dengan P1  1 dan P0  0
p0 n1 n0
P1 sering disebut sebagai resiko pada kelompok kasus atau kelompok percobaan, sedangkan p0
disebut sebagai kelompok control.
Nilai RR = 1 terjadi jika resiko pada kelompok kasus dan control sama, ini sama artinya tidak
ada asosiasi antara resiko pada kasus dengan resiko pada control. Nilai RR > 1 terjadi ketika
resiko terjadinya peristiwa pada kasus lebih besar dibandingkan dengan control. Dan Nilai RR <
1 terjadi ketika resiko terjadinya peristiwa pada kasus lebih kecil dibandingkan dengan control.
Perbedaan nilai RR dengan RD adalah RR lebih umum digunakan untuk mengukur kekuatan
asosiasi/hubungan daripada RD. Ini dikarenakan RR lebih menunjukkan seberapa kali resiko
kasus terhadap control.
Contoh
Kembali pada kasus influensa dengan data pada Tabel 2.2, penghitungan nilai RR diperoleh
0.028
RR   0.077
0.364
Interval kepercayaan untuk RR adalah: CI  RR  z   s.e.RR ,
Karena sering kali nilai s.e.(RR) sangat besar, sedangkan RR sangat kecil yang menyebabkan
pengurangan RR terhadap z  s.e.RR  bernilai negative, maka rumus CI ditransformasi menjadi
CI  log(RR)  z   s.e. logRR  dengan s.e.(log RR )  1 d1  1 n1  1 d 0  1 n0  .
log RR
Pengujian Hipotesis untuk RR adalah: z
s.e.log RR 
15
5. ODDS RATIO/OR
Dapat dilihat bahwa d1/h1 menyatakan rasio antara jumlah orang yang sakit dalam kelompok
kasus. Rasio ini adalah sebuah statistik yang menyatakan kecendrungan (odd) sakit dalam
kelompok kasus. Dengan keterangan yang sama rasio d0/h0 menyatakan kecendrungan sakit
dalam kelompok control. Selanjutnya, statistik rasio relative (odds ratio) didefinisikan sebagai
 d   d  d h
berikut: OR   1  :  0   1 0 .......................... (3.3)
 h1   h0  d 0  h1
Karena OR merupakan rasio antara kecendrungan sakit dalam kelompok kasus dangan kelompok
kontrol, dengan kata lain, kelompok kasus mempunyai risiko sebesar OR kali kelompok kontrol.
Contoh
Penduduk suatu desa sama-sama memiliki peluang yang sama untuk terkena infeksi
semacam virus. Setelah epidemik berlalu, diambil sebuah sampel acak dari orang-orang yang
tidak disuntik dan disuntik, lalu yang terkena infeksi dicacat. Hasil pengamatan diberikan di
bawah ini:
Tabel 3.3. Keadaan Terkena Infeksi Virus pada Kelompok Kasus dan Kelompok Kontrol
Kelompok Peristiwa
1.Terinfeksi 2. Tidak Terinfeksi
1.Tidak disuntik 37 42
1. Disuntik 12 29
37
menyatakan nilai odds yang berarti rasio antara jumlah yang terinfeksi dengan jumlah yang
42
12
tidak terinfeksi dalam kelompok tidak disuntik. menyatakan rasio antara jumlah yang
29
terinfeksi dengan jumlah yang tidak terinfeksi dalam kelompok disuntik. Sehingga resiko relative
 37   12 
atau OR adalah: OR    /    2,13
 42   29 
16
Nilai 2,13 berarti rasio antara kecendrungan terinfeksi dalam kelompok tidak disuntik dengan
kelompok disuntik sebesar 2,13. Atau dapat dikatakan bahwa kelompok masyarakat yang tidak
disuntik mempunyai risiko terinfeksi virus sebesar 2,13 kali kelompok masyarakat yang disuntik.
Pengujian Hipotesis untuk OR
Untuk melakukan estimasi dan pengujian hipotesis, statistik OR ini pada umumnya
diperhatikan sebagai logaritma natural dari OR yang diobservasi, yaitu:
ln (OR) = ln (a) – ln (b) – ln (c) + ln (d) ................ (3.4)
Untuk sampel yang berukuran besar, standar deviasinya adalah:
1 1 1 1
s(ln OR )     ......................... (3.5)
a b c d
Hipotesis untuk mempelajari perbedaan resiko antara kedua kelompok tertentu adalah
H0 : ln (OR) = 0 → (OR = 1) artinya kedua kelompok mempunyai risiko yang sama
H1 : ln (OR) ≠ 0 → artinya kedua kelompok mempunyai risiko yang tidak sama
Dengan staistik uji menggunakan statistik Z yaitu
ln(OR)
Z hit  ........................... (3.6)
s(ln OR )
Dapat pula diperoleh selang kepercayaan (l -α) % utuk OR yaitu :
ln(OR) ± Zα/2-Sln(OR) .......................... (3.7)
Teladan 2.
Tabel di bawah menunjukan data hipotesis suatu eksperimen dengan pelakuan, dimana terdapat
444 subjek dalam kelompok kasus yaitu diberi pelakuan dan 6025 sabjek dalam kelompok
Kontrol. Dalam teladan ini diperhatikan peristiwa berdampak negative terhadap subyek
penelitian, seperti kematian, kegagalan dan sebagainya.
17
Tabel 3.4.Teladan pengujian hipotesis untuk OR
Pristiwa
Perlakuan 1.Ya 2. Tidak Jumlah Odd
1. Ya 9 435 444 0,026069
2. Tidak 42 5983 6025 0,007020
Jumlah 51 6418 6469 0,007930
Jawab
1. Perhitungan
*ln(OR) = ln(9)-ln(435)-ln(42)+ln(5983)
= 1,08089
1 1 1 1
 s(ln OR )      0,370567
9 435 42 5983
1,08089
 Z hit   2,917
0,370567
 Zα/2 untuk α = 0,05 adalah ± 1,96
 Kesimpulan: Tolak H0, artinya kelompok kasus dan kelompok kontrol mempunyai
perbedaan risiko yang signifikan untuk mengalami peristiwa tertentu.
Latihan
Suatu percobaan bertujuan untuk mengetahui pengaruh pemberian diazepam 5 mg dalam

mengurangi timbulnya serangan. Hasilnya adalah sebagai berikut:
18
Kelompok Peristiwa
1.Berkurang 2. Tidak
1. Diazepam 2 81
2. Kontrol 14 72
Pertanyaan:
a. Hitung OR dan interpretasikan hasilnya
b. Uji Hipotesis:
H0 : ln (OR) = 0
H1 : ln (OR) ≠ 0
c. Cari selang kepercayaan 95% untuk OR dan interpretasikan hasilnya.

19
BAB IV
MODEL LOG LINIER
Metode regresi merupakan metode statistika yang memanfaatkan hubungan antara dua
atau lebih peubah kuantitatif sehingga satu peubah bisa diramalkan dari peubah lainnya (Neter
dan Kutner, 1997). Secara umum model regresi linear dengan suku sisaan menyebar normal
dengan rataan nol dan ragam satu dapat dituliskan sebagai berikut:
i   0  1  i1   2  i 2  ...   p  ip   i
i    0  1  i1   2  i 2  ...   p  ip   i  .
Dengan asumsi  menyebar normal dengan rataan 0 dan ragam 1, maka fungsi respon untuk
model regresi persamaan tersebut adalah sebagai berikut:
 
   1 ,  2 ,...,  p   0  1  1  ...   p  p , (4.1)
model regresi linear umum dengan suku sisaan menyebar normal berimplikasi bahwa amatan-
amatan i adalah peubah acak normal yang bebas, dengan rataan i  dengan ragam konstan
2.
Dalam penggunaan metode regresi linear terdapat beberapa asumsi yang harus dipenuhi
seperti kehomogenan ragam dan kenormalan sisaan. Asumsi kehomogenan ragam dan
kenormalan sisaan mendasari penggunaan metode kuadrat terkecil untuk menduga parameter
model regresi. Selain asumsi-asumsi tersebut penggunaan skala pengukuran juga harus
diperhatikan karena pada metode regresi linear peubah tak bebas merupakan peubah kontinu
(Agresti,1990).
20
Dalam permasalahan-permasalahan di lapangan seringkali metode regresi linear tidak
dapat diterapkan, selain karena asumsi kehomogenan ragam dan kenormalan sisaan yang tidak
terpenuhi juga disebabkan karena peubah tak bebas dalam bentuk biner walaupun asumsi
kenormalan dan kehomogenannya terpenuhi. Untuk mengatasi permasalahan tersebut, dapat
dipergunakan salah satu metode yaitu model log-linear.
4.1 Metode Log-Linear
Model log-linear merupakan suatu model yang merepresentasikan hubungan antara dua
peubah atau lebih dimana semua peubah bersifat kategorik dan kesahihan dari model-modelnya
diuji dengan pendekatan tabel kontingensi (Agresti, 1990).
Suatu penelitian jika berhadapan dengan suatu data yang bukan merupakan hasil
pengukuran tetapi berupa data frekuensi atau jumlahan pengamatan dari suatu peubah kategorik
yang bersifat diskrit, maka analisis statistik yang sesuai adalah analisis data kategori yaitu
analisis log-linear (Agresti, 2007). Analisis log-linear digunakan untuk mengetahui ada tidaknya
hubungan antar peubah yaitu dengan menggunakan uji ketergantungan dan memodelkan pola
hubungan antar peubah. Pada model log-linear akan dapat diketahui sel mana yang cenderung
menimbulkan hubungan (ketidakbebasan).
4.1.1 Model Log-Linear untuk Tabel Dua Dimensi
Salah satu cara untuk menyajikan data kualitatif adalah dengan menyatakan masing-
masing kategori dari peubah yang satu dalam kategori-kategori peubah lain. Tabel yang
terbentuk dengan cara demikian disebut tabel kontingensi (Agresti, 2007).
Suatu tabel kontingensi dikatakan mempunyai dua dimensi apabila tabel tersebut
mencatat data hasil pengamatan dengan melibatkan dua peubah, yaitu X dan Y (Christensen,
21
1997). Peubah X (peubah bebas) terdiri dari I kategori, dan peubah Y (peubah tak bebas) terdiri
dari J kategori. Jadi tabel kontingensinya berukuran I × J. Sel yang dibentuk dalam baris ke-i
dan kolom ke-j mempunyai frekuensi pengamatan nij . Tabel 4.1 menunjukkan frekuensi
pengamatan tabel kontigensi dua dimensi. Jika peluang pengamatan pada baris ke-i kolom ke-j
nij
dinyatakan dengan Pij  , maka peluang tiap-tiap sel dalam tabel kontigensi ditunjukkan
n 
pada Tabel 4.2.
Tabel 4.1 Tabel Kontingensi Dua Dimensi
Y1 Y2 … … … YJ Total
X1 n11 n12 … … … n1J n1
X2 n 21 n 22 … … … n2 J n 2
.. ..
.. … … … … … … ..
.. ..
XI nI1 nI 2 … … … n IJ nI 
Total n1 n 2 … … … n J n 
Sumber: Christensen (1997)
Tabel 4.2 Sel Peluang Tabel Kontingensi Dua Dimensi
Y1 Y2 … … … YJ Total
X1 P11 P12 … … … P1J P1

X2 P21 P22 … … … P2 J P2
.. ..
.. … … … … … … ..
.. ..
XI PI 1 PI 2 … … … PIJ PI 
Total P1 P2 … … … P J P
Sumber: Christensen (1997)

22
Model log-linear dapat digunakan untuk mengetahui ada tidaknya hubungan antara
peubah pada data kategori, serta dapat menunjukkan kelas mana yang menjadi penyebab
terjadinya hubungan (Agresti, 1990). Jadi, dapat dikatakan bahwa model log-linear merupakan
model yang berguna untuk mempelajari pola hubungan secara lengkap.
Model log-linear dapat dicari dengan cara:
mij  nij   N  Pij
mij  N  Pi  P j
log mij  logN  Pi  P j  (4.2)
Jika dijumlahkan semua baris I, maka akan didapatkan persamaan sebagai berikut:
I I
 log m
i 1
ij  I log N   log Pi  I log P j
i 1
(4.3)
dan jika dijumlahkan semua kolom J:
J J
 log mij  J log N  J log Pi   log P j

j 1 j 1
(4.4)
Apabila persamaan (4.3) dan (4.4) dijumlahkan, maka akan diperoleh persamaan:
I J I J
 log mij  IJ log N  J  log Pi  I  log P j

i 1 j 1 i 1 j 1
(4.5)
 I   
J
  log Pi    log P j 
ambil: U  log N   i 1    j 1 
I J
I
 log P i
U 1i   log Pi  i 1
 log P
j 1
j
U 2 j   log P j 
J
23
maka persamaan (4.5) menjadi:
log mij  U  U 1i   U 2 j  (4.6)
I J
dengan ketentuan U 1 j  dan U 2 j  memenuhi U    U    0
i 1
1i
j 1
2 j
dimana:
mij = frekuensi harapan sel (i,j)

nij = frekuensi pengamatan pada baris ke-i kolom ke-j
n  = N = jumlah seluruh pengamatan
Pij = peluang pengamatan pada baris ke-i kolom ke-j
Pi = peluang pengamatan baris ke-i
P j = peluang pengamatan kolom ke-j
U = pengaruh rata-rata secara umum dari seluruh nilai harapan
U1i  = pengaruh utama kategori ke-i dari peubah pertama
U 2 j  = pengaruh utama kategori ke-j dari peubah kedua
Model dalam persamaan (4.6) berarti bahwa ada dua buah peubah dalam satu model
dimana antara peubah pertama dengan peubah kedua tidak ada kecenderungan/hubungan. Untuk
model dua dimensi, dalam model jenuh akan terjadi interaksi antara kedua peubah, dan model
tersebut adalah sebagai berikut:
log mij  U  U1i   U 2 j   U12 ij  (4.7)
dimana U 12 ij  menyatakan pengaruh interaksi antara kategori ke-i peubah pertama dengan
I J
kategori ke-j peubah kedua, dan U 12 ij  memenuhi ketentuan U
i 1 j 1
12 ij   0.
Derajat bebas yang digunakan adalah jumlah seluruh sel dikurangi dengan jumlah
parameter yang dihitung (Powers, 1999). Untuk tabel log-linear dua dimensi ditunjukkan
sebagai berikut:
24
Tabel 4.3 Tabel Derajat Bebas Model Dua Dimensi
Parameter Derajat bebas

U 1
U1i  I 1
U 2 j  J 1
U 12 ij  I  1J  1
Total IJ
Sumber: Powers (1999)
2.3.2 Model Log-Linear untuk Tabel Tiga Dimensi
Tabel tiga dimensi terdiri dari tiga peubah X, Y, dan Z, masing-masing peubah
mempunyai kategori I, J, dan K, dan antara ketiga peubah saling bebas, maka estimasi frekuensi
harapan dari masing-masing sel adalah (Agresti, 1990):
mˆ ijk  N .Pîjk
mˆ ijk  N .Pî Pˆ  j  Pˆ k
n  n j   n k 
mˆ ijk  N  i   
 N  N  N 
n i   n  j  n  k
mˆ ijk  (4.8)
N2
Jika kedua ruas persamaan (4.8) dinyatakan dalam bentuk logaritma, maka estimasi nilai
harapannya adalah:
ˆ ijk  log ni  log n j   log n k  2 log N

log m (4.9)
yang analog dengan:
log mijk  U  U1i   U 2 j   U 3k  (4.10)

25
dengan ketentuan U 1i  ,U 2 j  ,U 3k  memenuhi U    U    U    0 , ini berarti bahwa

1i 2 j 3k
dalam model terdapat tiga peubah, dan antar peubah tidak ada interaksi, dimana:
1 I J K
U  log mˆ ijk
IJK i 1 j 1 k 1
1 J K
U  U 1i    log mˆ ijk
JK j 1 k 1
1 I K
U  U 2 j    log mˆ ijk
IK i 1 k 1
I J
1
U  U 3 k  
IJ
 log mˆ
i 1 j 1
ijk
Karena U  U1i  ,U  U 2 j  , dan U  U 3k  menunjukkan deviasi penyimpangan, maka
I J K
U    U    U    0 .
i 1
1i
j 1
2 j
k 1
3k
Pada model tiga dimensi, dalam model jenuh akan terjadi interaksi antara ketiga peubah,
dan modelnya yaitu:
log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk   U123 ijk  (4.11)
Model pada persamaan (4.11) mempunyai asumsi yang harus dipenuhi adalah
I J I K J K I J K
U
i 1 j 1
12 ij   U 13 ik   U 23  jk   U 123 ijk   0 ,
i 1 k 1 j 1 k 1 i 1 j 1 k 1
dimana:
n i  = jumlah pengamatan pada baris ke-i
n j  = jumlah pengamatan pada baris ke-j
nk = jumlah pengamatan pada baris ke-k
N = jumlah seluruh pengamatan
m̂ijk = estimasi nilai harapan pada baris ke-i, baris ke-j, baris ke-k
P̂ijk = estimasi peluang pada baris ke-i, baris ke-j, baris ke-k
P̂i = estimasi peluang baris ke-i
26
P̂ j  = estimasi peluang baris ke-j

Pˆk = estimasi peluang baris ke-k
U = pengaruh rata-rata secara umum dari seluruh nilai harapan
U1i  = pengaruh utama kategori ke-i dari peubah pertama
U 2 j  = pengaruh utama kategori ke-j dari peubah kedua
U 3 k  = pengaruh utama kategori ke-k dari peubah ketiga
U 12 ij  = pengaruh interaksi kategori ke-i peubah pertama dengan kategori ke-j peubah kedua
U13ik  = pengaruh interaksi kategori ke-i peubah pertama dengan kategori ke- k peubah
ketiga
U 23 jk  = pengaruh interaksi kategori ke-j peubah kedua dengan kategori ke-k
peubah ketiga
U 123 ijk  = pengaruh interaksi kategori ke-i peubah pertama, kategori ke-j
peubah kedua, dan kategori ke-k peubah ketiga
4.1.2 Model Log Linear untuk Tabel Empat Dimensi
Model Log linier untuk tabel empat dimensi merupakan perluasan dari tabel tiga dimensi.
Interpretasinya berdasarkan pada independensi dan conditional independensi. Tabel empat
dimensi terdiri dari empat peubah W, X, Y, dan Z, masing-masing peubah mempunyai kategori
I, J, K, dan L, dan antara keempat peubah saling bebas, maka estimasi frekuensi harapan dari
masing-masing sel adalah (Agresti, 1990):
mˆ ijkl  N .Pîjkl
n  n j   n k   nl 
mˆ ijkl  N  i    
 N  N  N  N 
n i   n  j   n   k  n   l
mˆ ijkl  (4.12)
N3
Jika kedua ruas pada persamaan (4.12) dinyatakan dalam bentuk log-aritma, maka
estimasi nilai harapannya adalah:
ˆ ijkl  log ni  log n j   log nk   log nl  3 log N

log m (4.13)
27
Pada model empat dimensi, dalam model jenuh akan terjadi interaksi antara keempat peubah,
dan modelnya yaitu:
log mijkl  U  U 1i   U 2 j   U 3k   U 4l   U 12 ij   U 13 ik   U 14 il 

 U 23  jk   U 24  jl   U 34 kl   U 123 ijk   U 124 ijl   U 134 ikl (4.14)
 U 234  jkl   U 1234 ijkl 
Model pada persamaan (4.14) mempunyai asumsi yang harus dipenuhi adalah
I J I K I L J K J L
U 12 ij   U 13ik   U 14 il  U 23 jk   U 24  jl  

i 1 j 1 i 1 k 1 i 1 l 1 j 1 k 1 j 1 l 1
K L I j K I J L I K L
U
k 1 l 1
34  kl    U 123 ijk    U 124 ijl    U 134 ikl 
i 1 j 1 k 1 i 1 j 1 l 1 i 1 k 1 l 1
J K L I J K L
U
j 1 k 1 l 1
234  jkl    U 1234 ijkl   0
i 1 j 1 k 1 l 1
Derajat bebas yang digunakan adalah jumlah seluruh sel dikurangi dengan jumlah
parameter yang dihitung (Powers, 1999). Untuk tabel log-linear empat dimensi ditunjukkan
sebagai berikut:
Tabel 4.4 Derajat Bebas Model Empat Dimensi
Parameter Derajat Bebas
U 1
U1i  I-1
U 2 j  J-1
U 3 k  K-1
U 4 l  L-1
U 12 ij  (I-1)(J-1)
U13ik  (I-1)(K-1)
U 14 il  (I-1)(L-1)
U 23 jk  (J-1)(K-1)
U 24  jl  (J-1)(L-1)
28
U 34 kl (K-1)(L-1)
U 123 ijk  (I-1)(J-1)(K-1)
U 124 ijl  (I-1)(J-1)(L-1)
U 134 ikl (I-1)(K-1)(L-1)
U 234  jkl  (J-1)(K-1)(L-1)
U 1234 ijkl  (I-1)(J-1)(K-1)(L-1)
Total IJKL
Sumber: Agresti (1990)
4.2 Estimasi Nilai Harapan
Estimasi nilai harapan untuk tabel lengkap dalam analisis log-linear dapat dibedakan
menjadi dua, yaitu (Agresti, 1990):
4.2.1 Estimasi Langsung
Adapun model yang dapat digunakan, yaitu:
a. Model Independen Lengkap
Model: log mijk  U  U1i   U 2 j   U 3k  (4.15)
I J K
dengan asumsi yang harus dipenuhi yaitu U 1i   U 2 j   U 3k   0 , dan estimasi nilai
i 1 j 1 k 1
harapannya:
n i   n  j  n  k
mˆ ijk 
N2
Model dalam persamaan (4.15) menjelaskan bahwa tidak terdapat interaksi antar peubahnya
sehingga model ini disebut model independen lengkap.

29
b. Jointly Independent
Ada tiga macam model yang termasuk dalam jointly independent, yaitu:
(i) Model: log mijk  U  U 1i   U 2 j   U 3k   U12 ij  (4.16)
I J K I J
dengan asumsi U 1i   U 2 j   U 3k   U 12 ij   0 ,
i 1 j 1 k 1 i 1 j 1
dan estimasi nilai
harapannya:
nij n k
mˆ ijk 
N2
Model dalam persamaan (4.16) menyatakan adanya hubungan antara peubah pertama dan
peubah kedua, dimana peubah ketiga tetap dalam model.
(ii) Model: log mijk  U  U 1i   U 2 j   U 3k   U 13ik  (4.17)
I J K I K
dengan asumsi U 1i   U 2 j   U 3k   U 13ik   0 ,
i 1 j 1 k 1 i 1 k 1
dan estimasi nilai
harapannya:
ni  k n j 
mˆ ijk 
N2
Model dalam persamaan (4.17) menyatakan adanya hubungan antara peubah pertama dan
peubah ketiga, dimana peubah kedua tetap dalam model.
(iii) Model: log mijk  U  U1i   U 2 j   U 3k   U 23 jk  (4.18)
I J K J K
dengan asumsi U    U    U    U
i 1
1i
j 1
2 j
k 1
3k
j 1 k 1
23  jk   0 , dan estimasi nilai
harapannya:
n jk ni
mˆ ijk 
N2
30
Model dalam persamaan (4.18) menyatakan adanya hubungan antara peubah kedua dan
peubah ketiga, dimana peubah pertama tetap dalam model.
c. Conditionally Independent
Ada tiga macam model yang termasuk dalam conditionaly independent, yaitu:
(i) Model: log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik  (4.19)
dengan asumsi:
I J K I J I K
U 1i   U 2 j   U 3k   U 12 ij   U 13ik   0 ,

i 1 j 1 k 1 i 1 j 1 i 1 k 1
dan estimasi nilai
harapannya:
nij nik
m̂ijk 
n i 
Model dalam persamaan (4.19) menyatakan adanya hubungan antara peubah pertama
dengan peubah kedua, dan peubah pertama dengan peubah ketiga. Sedangkan antara
peubah kedua dan peubah ketiga saling bebas. Sehingga yang menyebabkan hubungan
adalah peubah pertama.
(ii) Model: log mijk  U  U1i   U 2 j   U 3k   U12 ij   U 23 jk  (4.20)
dengan asumsi:
I J K I J J K
U 1i   U 2 j   U 3k   U 12 ij   U 23 jk   0 ,

i 1 j 1 k 1 i 1 j 1 j 1 k 1
dan estimasi nilai
harapannya:
nij n jk
m̂ijk 
n j 
dengan peubah kedua, dan peubah kedua dengan peubah ketiga. Sedangkan antara
31
peubah pertama dengan peubah ketiga saling bebas. Sehingga yang menyebabkan
hubungan adalah peubah kedua.
(iii) Model: log mijk  U  U 1i   U 2 j   U 3k   U13ik   U 23 jk  (4.21)
dengan asumsi:
I J K I K J K
U 1i   U 2 j   U 3k   U 13ik   U 23 jk   0 ,

i 1 j 1 k 1 i 1 k 1 j 1 k 1
dan estimasi nilai
harapannya:
nik n jk
mˆ ijk 
n  k
dengan peubah ketiga, dan peubah kedua dengan peubah ketiga. Sedangkan antara
peubah pertama dengan peubah kedua saling bebas. Sehingga yang menyebabkan
hubungan adalah peubah ketiga.
d. Model tanpa Interaksi Tiga Faktor
Model: log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk  (4.22)
dengan asumsi:
I J K I J I K J K
U 1i   U 2 j   U 3k   U 12 ij   U 13ik   U 23 jk   0 ,

i 1 j 1 k 1 i 1 j 1 i 1 k 1 j 1 k 1
dan estimasi
nilai harapannya:
nij nik n jk
mˆ ijk 
n i   n  j  n  k
Model dalam persamaan (4.22) menyatakan adanya hubungan antara peubah pertama dengan
peubah kedua, peubah pertama dengan peubah ketiga, dan peubah kedua dengan peubah
ketiga.
32
e. Model Jenuh
Model jenuh adalah model yang didalamnya memuat semua parameter bebas dan juga
semua kemungkinan interaksi antar peubah yang terjadi, sehingga model tersebut tidak dapat
dimasuki parameter-parameter lainnya. Adapun modelnya, yaitu:
log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk   U123 ijk 
Pada model jenuh, frekuensi pengamatan sama dengan estimasi frekuensi harapan.
4.2.2 Estimasi Tidak Langsung
Cara yang digunakan untuk memperoleh estimasi dengan cara tidak langsung adalah
dengan prosedur iterasi. Dalam model log-linear tiga dimensi yaitu:
log mijk  U  U1i   U 2 j   U 3k   U12 ij   U13ik   U 23 jk 
Model ini menyatakan bahwa terdapat interaksi dua faktor. Tetapi dalam model tidak
terdapat interaksi antara ketiga peubah U 123 ijk   0 . Dengan kata lain, dalam model terdapat
asosiasi parsial. Untuk mendapatkan estimasi nilai harapan harus dilakukan prosedur iterasi
sebagai berikut:
0 
1. Ambil mˆ ijk  1 , untuk setiap ijk
Untuk U  1 maka:
3U 1 nij 3U 

2. mˆ ijk  3U  mˆ ijk
mˆ ij
3U  2  ni  k 3U 1

3. mˆ ijk  3U 1 mˆ ijk
mˆ ik
3U  3  n jk 3U  2 
4. mˆ ijk  3U  2  mˆ ijk
mˆ  jk
33
5. langkah 1 sampai 4 diulang untuk U  1,2,..... sampai konvergen atau mencapai nilai tertentu
sesuai tingkat ketelitian yang diinginkan. Setelah kondisi konvergen dicapai, maka akan
diperoleh estimasi nilai harapan sebagai berikut:
nij nik n jk
mˆ ijk 
n i   n  j  n  k
4.3 Uji Independensi (Uji Ketergantungan)
Uji independensi (uji ketergantungan) digunakan untuk mengetahui ada tidaknya
hubungan antara dua peubah yang telah ditetapkan (Christensen, 1997). Dalam tabel dua dimensi
yang mempunyai peubah X dan peubah Y dengan banyaknya baris I dan kolom J, maka hipotesis
untuk menguji independensi adalah sebagai berikut:
H 0 : Pij  P i P  j (tidak ada hubungan asosiasi antara peubah X dan peubah Y atau
independen)
H 1 : Pij  Pi P j (ada hubungan asosiasi antara peubah X dan peubah Y atau dependen)
dimana:
Pi = peluang pengamatan baris ke-i
P j = peluang pengamatan kolom ke-j
i = 1, 2,……,I
j = 1, 2, ……,J
Maka uji statistik yang sesuai adalah Chi-Square Pearson, dimana estimasi nilai harapannya
adalah sebagai berikut:
ni  n  j
mˆ ij  (4.23)
n 
dan statistik ujinya adalah:
I J n  mˆ ij 
2
  
2 ij
(4.24)
mˆ ij
hitung
i 1 j 1
34
dimana:
nij = frekuensi pengamatan pada baris ke-i kolom ke-j
ni  = frekuensi pengamatan pada baris ke-i
n j = frekuensi pengamatan pada kolom ke-j
n  = N = jumlah seluruh pengamatan
i = 1,2, ……, I
j = 1, 2, ……,J
Statistik uji tersebut, selanjutnya dibandingkan dengan distribusi  2 dengan derajat
bebas I  1J  1 dan risiko kesalahan  , serta kriteria penolakan H0 adalah:
 hitung
2
   , I 1 J 1) . Untuk tabel tiga dan tabel empat dimensi, pengujian independensi memiliki
cara yang sama dengan tabel dua dimensi.
4.4 Pengujian Residual
Pengujian residual bertujuan untuk menguji kesesuaian model (melihat kecukupan
model) (Agresti, 1990). Residual adalah selisih antara nilai pengamatan dan nilai harapan dari
masing-masing sel. Residual mempunyai rumus sebagai berikut:
nij  mˆ ij
eij  (4.25)
mˆ ij
12
sedangkan nilai adjusted residual rij  adalah residual dibagi dengan akar estimasi varian dari
residual.
nij  mˆ ij
rij 
mˆ 1  P 1  P 
ij i j
1
2
Suatu estimasi dikatakan cukup baik jika nilai adjusted residualnya mendekati distribusi
normal dengan nilai   0 dan  2  1 , atau berdistribusi normal N 0,1 . Apabila mengambil
  5%, maka 95% dari nilai adjusted residual yang masih diijinkan terletak -1,96 sampai
35
+1,96. Pada tabel tiga dimensi dan empat dimensi, pengujian residual memiliki cara yang sama
dengan tabel dua dimensi.
4.5 Uji Kesesuaian Model
Uji kesesuaian model atau Goodness of Fit Test merupakan dasar peluang untuk
membandingkan dan menentukan ada tidaknya kesenjangan antara pengamatan dengan model
(Agresti, 1990). Hipotesis yang digunakan dalam uji ini adalah:
H 0 : tidak ada kesesuaian antara pengamatan dengan model
H 1 : ada kesesuaian antara pengamatan dengan model
dengan kriteria penolakan H 0 yaitu G 2   2 , IJK  I  J  K 2  .
 
Pada uji rasio likelihood G 2 , nilai pengamatan dinotasikan dengan nijk dan nilai
harapannya m̂ijk , sehingga statistik ujinya adalah:
 I J K I J K 
G 2  2  nijk log mˆ ijk   nijk log nijk 
 i 1 j 1 k 1 i 1 j 1 k 1 
I J K  mˆ ijk 
G 2  2 nijk log  
i 1 j 1 k 1  nijk 
I J K  nijk 
G 2  2  nijk log   (4.26)
i 1 j 1 k 1  mˆ ijk 
Apabila model yang ditentukan benar dan N cukup besar, maka baik  hitung
2
atau G 2
mendekati distribusi  2 dengan derajat bebas sama dengan jumlah sel dikurangi jumlah
parameter bebas yang masuk model. Berikut ini akan disajikan tabel derajat bebas untuk tabel
tiga dimensi:
36
Tabel 4.5 Derajat Bebas Model Tiga Dimensi
Parameter Derajat Bebas
U 1
U1i  I-1
U 2 j  J-1
U 3 k  K-1
U 12 ij  (I-1)(J-1)
U13ik  (I-1)(K-1)
U 23 jk  (J-1)(K-1)
U 123 ijk  (I-1)(J-1)(K-1)
Total IJK
Sumber: Agresti (1990)
Dalam model log-linear, G 2 hampir sama dengan jumlah kuadrat sisaan (Sum Square
Error) dalam regresi linear (Christensen, 1997). Jika X 0 merupakan model jenuh dan X
merupakan model log-linear terbaik, maka:
G 2 X 0   G 2 X 
R 
2
(4.27)
G 2 X 0 
dimana G 2  X  dan G 2  X 0  adalah rasio likelihood untuk menguji model X dan model X 0
terhadap model jenuh. Untuk tabel empat dimensi, uji kesesuaian model memiliki cara yang
sama dengan tabel tiga dimensi.
4.6 Seleksi Model
Seleksi model dilakukan untuk memperoleh model terbaik (Garson, 2009). Seleksi model
dalam analisis model log-linear dapat dilakukan dengan beberapa pendekatan, antara lain:
4.6.1 Uji Pengaruh ke-K (Test of K-way effects)

37
Uji ini digunakan untuk mengetahui interaksi K suku atau lebih yaitu lebih tinggi sama
dengan nol dan sama dengan nol. Uji pengaruh ke-K (Test of K-way effects) dibagi menjadi dua,
yaitu:
a. Uji Pengaruh ke-K atau lebih sama dengan nol (Test that K-way and higher order effects are
zero)
Uji ini berdasarkan pada hipotesis bahwa pengaruh orde ke-K atau lebih sama dengan
nol. Uji dimulai dari orde tertinggi sampai dengan orde terendah. Pada model log-linear
empat dimensi, hipotesisnya adalah:
Untuk K=4; H 0 : pengaruh orde ke-4 atau lebih = 0
H1 : H 0
Untuk K=3; H 0 : pengaruh orde ke-3 atau lebih = 0
H1 : H 0
Untuk K= 2; H 0 : pengaruh orde ke-2 atau lebih = 0
H1 : H 0
Untuk K= 1; H 0 : pengaruh orde ke-1 atau lebih = 0
H1 : H 0
 
Statistik uji yang digunakan adalah nilai likelihood rasio chi-square G 2 . Apabila
nilai peluang dari G 2 yang diperoleh kurang dari  , maka H 0 ditolak.
b. Uji Pengaruh ke-K sama dengan nol (Test that K-way effects are zero)
Uji ini berdasarkan pada hipotesis bahwa pengaruh orde ke-K sama dengan nol. Pada
model log-linear empat dimensi, hipotesisnya adalah:
Untuk K= 1; H 0 : pengaruh orde ke-1 = 0
H1 : H 0
38
H1 : H 0
H1 : H 0
Untuk K=4; H 0 : pengaruh orde ke-4 = 0
H1 : H 0
 
Statistik uji yang digunakan adalah nilai likelihood rasio chi-square G 2 . Apabila
nilai peluang dari G 2 yang diperoleh kurang dari  , maka H 0 ditolak.
4.6.2 Uji Asosiasi Parsial
Uji ini bertujuan untuk menguji hubungan antara dua peubah dalam tiap level peubah
lainnya.
Hipotesisnya adalah:
H 0 : pengaruh interaksi peubah satu atau peubah dua sama dengan nol.
H 1 : pengaruh interaksi peubah satu atau peubah dua tidak sama dengan nol.
 
Statistik uji yang digunakan adalah nilai likelihood rasio chi-square G 2 . Apabila nilai
peluang dari G 2 yang diperoleh kurang dari  , maka H 0 ditolak.
4.7 Metode Backward
Metode backward dilakukan dengan menyeleksi model, dari model terlengkap menuju
model yang lebih sederhana (Agresti, 1990). Adapun prosedur metode backward yaitu sebagai
berikut:
1. Anggap model terlengkap sebagai model terbaik, misalnya sebagai model (0).
39
2. Mengeluarkan interaksi empat faktor dari model, sehingga menjadi model (1).
3. Dengan uji statistik conditional (Test conditional independence), dilakukan pengujian apakah
model (1) masih merupakan model terbaik, dengan hipotesis sebagai berikut:
H 0 : model (1) = model terbaik
H 1 : model (0) = model terbaik
Uji statistik conditional (Test conditional independence), yaitu:
G210   G21  G20 
dimana G21 : statistik likelihood G 2 untuk model (1)

G20  : statistik likelihood G 2 untuk model (0)
4. Membandingkan nilai p (p-value) dengan  , dengan kriteria penolakan jika p-value <  ,
maka H 0 ditolak.
5. Jika H 0 ditolak, artinya model (0) adalah model terbaik. Apabila H 0 diterima, maka model
(1) dibandingkan dengan model (2).
6. Untuk menentukan interaksi mana yang dikeluarkan terlebih dahulu, dipilih nilai G 2 terkecil.
7. Jika salah satu interaksi dari tiga faktor dikeluarkan, maka ulangi langkah 3 sampai 5 hingga
tidak ada lagi faktor yang harus dikeluarkan dari model, sehingga diperoleh model yang
terbaik.
40
BAB V
ANALISIS REGRESI LOGISTIK
5.1. Analisis Regresi
Analisis regresi merupakan alat statistic yang memanfaatkan hubungan antara dua atau
lebih peubah kuantitatif, sehingga salah satu peubah bisa diramalkan dari peubah lainnya.
Analisis Regresi memperlihatkan hubungan dan pengaruh antara peubah bebas terhadap peubah
respon.
Asumsi-asumsi yang harus dipenuhi dalam penggunaan model regresi linier yaitu:
1. Harus diketahui dengan pasti bentuk hubungan antara peubah respon dengan peubah
bebas.
2. Sisaan mengikuti sebaran normal.
3. Kehomogenan ragam sisaan.
Jika hubungan respon dengan peubah bebas bersifat linier dan asumsi di atas terpenuhi,
maka model regresi linier merupakan model terbaik. Adapun model dari regresi linier adalah:
y( x)   0  1 x1   2 x2     p x p   (5.1)
dengan:
y = peubah respon
x = peubah bebas
ε = sisaan
dengan asumsi ε menyabar normal dengan rataan 0 dan ragam 1. Jika x hanya satu maka disebut
model regresi linier sederhana.
41
5.2. ANALISIS REGRESI LOGISTIK
Menurut Hosmer dan Lemeshow (2000) analisis regresi logistic merupakan metode
regresi dengan peubah respon Y merupakan kategorik atau dikotomi, sedangkan peubah
bebasnya merupakan peubah kategorik dan atau kontinu. Myers (1990) menyatakan jika peubah
respon Y terdiri dari dua kategori yaitu sukses dan gagal, maka peubah y tersebut mengikuti
sebaran Bernoulli dengan fungsi sebaran sebagai berikut:
F (Y  y)  p y (1  p)1 y (5.2)
dengan p adalah peluang sukses, dan y = 0, 1.
Misalkan nilai harapan dari Y untuk nilai peubah bebas x yang diberikan adalah E(Y/x)
dan untuk memudahkan notasi dimisalkan juga g ( x)   0  1 x1   2 x2     p x p dan
π(x) = E(Y/x), maka π(x) menjelaskan rataan bersyarat dari Y untuk nilai x yang diberikan.
Untuk menggambarkan hubungan π(x) dan g(x) sangat tepat digunakan regresi logistic berikut:
expg ( x)
   x   x
e 0 11 p p
 ( x)   (5.3)
1  expg ( x) 1  e  0  1x1   p x p
1
 ( x) 
1  eg x 
 
0
g(x)
42
Penggunaan regresi logistic tepat karena plot antara π(x) dengan g(x) untuk nilai π(x) menuju -∞
konvergen ke 0, sedangkan untuk π(x) menuju +∞ konvergen ke 1.
Dari persamaan (5.3) dapat juga dinyatakan sebagai berikut:
expg ( x)
f g ( x)   ( x)  ;  g ( x)   (5.4)
1  expg ( x)
Apabila nilai g(x) pada persamaan (5.4) ditetapkan, maka didapat:
lim f g ( x)  0
g ( x ) 
(5.5)
lim f g ( x)  1
g ( x ) 
Persamaan (5.5) menerangkan bahwa nilai f[g(x)] berkisar antara 0 dan 1 berapapun nilai
g(x). Hal tersebut menunjukkan bahwa model logistic menggambarkan peluang suatu kejadian
atau risiko dari suatu tindakan yang maksimal bernilai 1.
Transformasi logit merupakan teknik analisis yang digunakan untuk memperoleh fungsi
linier yaitu dengan cara melakukan transformasi model logistic sehingga diperoleh bentuk
sebagai berikut:
  ( x) 
g ( x)  ln     0  1 x1   2 x2     p x p (5.6)
1   ( x) 
Persamaan (5.6) merupakan bentuk linier setelah ditransformasi.
Pendugaan Parameter
Metode yang digunakan untuk menduga parameter dalam regresi logistic adalah Metode
Kemungkinan Maksimum (Method of Maximum Likelihood). Prinsip dasar metode ini adalah
untuk memperoleh penduga parameter dengan memaksimumkan fungsi likelihood. Bila Y1,…,Yn
adalah amatan-amatan yang bebas, maka fungsi peluang bersama bagi sampel ini adalah:
43
n
g Y1 ,, Yn    f Yi ;  . Bila fungsi peluang bersama ini dipandang sebagai suatu fungsi
i 1
n
likelihood L(θ) maka L    f Yi ;  dengan memaksimumkan L(θ) relative terhadap θ akan
i 1
diperoleh penduga kemungkinan maksimum bersifat konsisten dan cukup.
Jika Y dikodekan 0 dan 1 maka menurut persamaan (1),  x   P(Y  1 x) dan
1   x   P(Y  0 x) sehingga, untuk pasangan-pasangan (xi,yi) berlaku yi = 1 dengan fungsi
kemungkinan maksimumnya adalah π(xi) dan jika yi = 0 fungsi kemungkinan maksimumnya

adalah 1 – π(xi).
Secara matematik fungsi kemungkinan maksimum untuk pasangan (xi,yi) adalah sebagai
berikut:  xi  y 1   ( xi )1 y
i i
(5.7)
Apabila amatan-amatan diasumsikan saling bebas, fungsi kemungkinan maksimum dapat

ditulis sebagai berikut:
n
(  )    xi  i 1   ( xi )
y 1 yi
(5.8)
i 1
Metode kemungkinan maksimum memberikan nilai penduga dari vector

 '  ( 0 1   p ) dengan memaksimumkan fungsi kemungkinan bersama pada persamaan (5.8),
secara matematik bentuk logaritma dari fungsi kemungkinan bersama sebagai berikut:
n
L(  )  ln(  )   yi ln[ xi ]  (1  yi ) ln1   ( xi ) (5.9)
i 1
n  e  0  1x1   p x p      x   p x p


L(  )  ln    y i ln    e 0 11
   x   p x p   1  y i ln  1     x   p x p 
(5.10)
i 1 1  e 0 1 1   1  e 0 1 1 
Untuk mendapatkan nilai penduga dari  '  ( 0 1   p ) yang memaksimumkan L(β),
didapat dengan menurunkan persamaan (5.10) terhadap  '  ( 0 1   p ) . Hasil penurunannya
disamakan dengan nol.

44
n  e  0  1x1   p x p      x   p x p


L(  )  ln    y i ln    e 0 11
   x   p x p   1  y i ln  1     x   p x p 
i 1 1  e 0 1 1   1  e 0 1 1 
n  e  0  1x1   p x p  1  e  0  1x1   p x p  e  0  1x1   p x p 

  y i ln     x   p x p   1  y i  ln     x   p x p 
i 1 1  e 0 1 1   1 e 0 1 1 
n  e  0  1x1   p x p   
 1  y i  ln 
1
  y i ln   0  1 x1   p x p   0  1 x1   p x p 
i 1 1  e  1  e 
   ln 1  e 
n
1 1
  yi ln e
 0  1 x1   p x p  0  1 x1   p x p
 ln 1  e  0  1 x1   p x p   yi ln  0  1 x1   p x p
i 1   1 e
   ln1  ln1  e  y ln1  ln1  e 

n
  yi ln e
 0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p  0  1 x1   p x p
 yi ln 1  e i
i 1
   0  ln1  e  y 0  ln1  e 

n
  y i ln e
 y i ln 1  e i
i 1
   ln1  e   y ln1  e 
n
  y i ln e
 y i ln 1  e i
i 1
 
n
  y i ln e
 0  1 x1   p x p  0  1 x1   p x p
 ln 1  e
i 1
Persamaan yang diperoleh setelah diturunkan dan disamakan dengan nol sebagai berikut:
   x   x    x   x
L(  ) n
e 0 11 p p
e 0 11 p p
  yi 0  1x1   p x p  0
 0 i 1 e
   x   p x p
1 e 0 1 1
n  0  1 x1   p x p
e
  yi   0  1 x1   p x p
0
i 1 1 e
L(  ) n
   y i   ( xi )   0
 0 i 1
45
   
L(  )  y1 ln e  0  1x1  ln 1  e  0  1x1  y2 ln e  0  1x1   2 x2  ln 1  e  0  1x1   2 x2   
yn ln e
 0  1 x1   p x p

 ln 1  e
 0  1 x1   p x p

L(  ) e  0  1 x1 e  0  1 x1 e  0  1 x1   2 x2 e  0  1 x1   2 x2
 y1 x1  0  1 x1  x1  0  1 x1  y 2 x 2  0  1 x1   2 x2  x 2  0  1 x1   2 x2   
 1 e e e e
 0  1 x1   p x p  0  1 x1   p x p
e e
y n xn  0  1 x1   p x p
 xn  0  1 x1   p x p
e e
 x1  y1   x1    y 2   x2      y n   xn 
L(  ) n
  xi  y i   ( xi )
 i i 1
Persamaan yang diperoleh disamakan dengan nol, sehingga:
L(  ) n
  xij  yi   ( xi )  0 (5.12)
 j i 1
Dengan:
i adalah subskrip menyatakan banyaknya sampel, i = 1, 2, …, n
j adalah subskrip menyatakan banyaknya peubah, j = 1, 2, …, p
Metode pendugaan ragam dan koragam dari koefisien penduga diperoleh berdasarkan
teori pendugaan maksimum. Penduga ragam dan koragam yang diperoleh adalah suatu matrik
yang berasal dari turunan parsial kedua dari persamaan (5.8). Turunan kedua dari persamaan
tersebut adalah sebagai berikut:
 2 L(  ) n
 j2
  
i 1
xij2 i (1   i ) (5.13)
 2 L(  ) n
  xij xil  i (1   i ) (5.14)
 j  l i 1
46
Untuk j = 0, 1 dan l = 0, 1, 2, …, p dengan πi dinotasikan π(xi). Selanjutnya didefinisikan

I(β) suatu matrik berukuran (p+1) x (p+1) yang elemen-elemennya adalah negative dari nilai
pada persamaan pada persamaan (5.13) dan (5.14). Matrik tersebut disebut dengan matrik
informasi. Notasi Var(βj) digunakan untuk menyatakan unsure diagonal ke-j dari matrik I-1(β)
yang merupakan ragam dari ˆ j . Cov(  j ,  l ) dipakai untuk menyatakan unsure sembarang yang
bukan unsure diagonal dari matrik I-1(β) yang merupakan koragam dari ˆ j dan ̂ l . Penduga dari
ragam dan koragam adalah Vaˆr (ˆ ) , yang diperoleh dengan mengevaluasi Var(β) pada ˆ .
Didapat Vaˆr ( ˆ j ) dan Coˆv( ˆ j , ˆl ); j , l  0,1,2,  , p untuk nilai-nilai didalam matrik. Simpangan
baku dugaan dari koefisien dugaan ditulis dengan persamaan sebagai berikut:
  
SÊ ( ˆ j )  Vaˆr ˆ j
1/ 2
(5.15)
Untuk j = 0, 1, 2, …,p.
Matrik informasi yang digunakan dalam pengujian kecocokan model adalah


Iˆ ˆ  X 'VX . Matrik X dan V dapat ditulis dalam bentuk sebagai berikut:
1 X 11  X 1 p 
1 
X 21  X 2 p 
X  
(5.16)
 
 
1 X n1  X np 
ˆ1 1  ˆ1  0  0 
 
V  0 ˆ 2 1  ˆ 2   0  (5.17)
0 0  ˆ n 1  ˆ n 
Dalam regresi linier, untuk menentukan parameter yang masuk dalam model berdasarkan
fungsi dari selisih nilai pengamatan dengan nilai dugaan y  yˆ  . Prinsip dasar dalam regresi
logistic adalah sama dengan pada regresi linier yaitu membandingkan nilai pengamatan dari
variansi respon dengan nilai dugaan berdasarkan fungsi likelihood yang didefinisikan dalam
47
persamaan (5.9). Perbandingan nilai amatan dengan dugaan menggunakan fungsi likelihood
berdasarkan pada pernyataan adalah:
 likelihooddari mod eldugaan 

D  2 ln   (5.18)
 likelihooddari mod elama tan 
Berdasarkan persamaan (5.9) maka persamaan (5.18) menjadi:
n 
 ˆ   1  ˆ i 
D  2  y i ln  i   (1  y i ) ln   (5.19)
i 1   yi   1  yi 
Statistik D dalam persamaan di atas disebut devian. Devian dalam regresi logistic
kegunaannya sama dengan jumlah kuadrat galat (SSE) dalam regresi linier. Untuk memeriksa
signifikansi dari peubah-peubah bebas digunakan:
G = D (untuk model sebelum peubah masuk) – D (untuk model setelah peubah masuk).
Untuk memeriksa keberartian koefisien β secara keseluruhan digunakan hipotesis:
H 0 :  0  1     p  0
H 1 :Minimal adasatu  j  0 : j  0,1,2,  , p
Dengan Statistik ujinya adalah statistikG sebagai berikut:
 n1  n1  n0  n0 
    
G  2 ln   n  n 
 n 
 ˆ i y i 1  ˆ i 1 yi 
 i 1 
Jika H0 benar maka statistic G akan mengikuti sebaran Khi Kuadrat (χ2) dengan derajat
bebas p-1 dengan p adalah banyaknya peubah bebas yang ada didalam model.
Pengujian keberartian koefisien β secara parsial digunakan statistic Wald. Hipotesisnya

adalah sebagai berikut:
H0 :  j  0
H 1 : j  0 : j  0,1,2,  , p
48
Secara matematik uji-wald sebagai berikut:
j
W 
SE ˆ(  j )
H0 benar jika statistik uji-Wald akan mengikuti sebaran normal baku
(Hosmer dkk,2000), sehingga pengujian secara individual bisa dilakukan dengan
membandingkan nilai statistik uji tersebut dengan nilai ZTabel. Interpretasi koefisien dilakukan
pada peubah-peubah yang berpengaruh nyata. Dalam regresi linear dengan satu peubah bebas,
koefisien 1 merupakan beda antara nilai y pada x  x  1 dengan nilai y pada x = x. Misalnya
jika y(x)=  0  1 x maka pada 1  y ( x  1)  y ( x) . Dalam regresi logistik koefisien 1
merupakan beda logit. Perubahan nilai logit untuk setiap satu unit perubahan pada peubah bebas
x ialah 1  g ( x  1)  g ( x) . Interpretasi koefisien pada regresi logistik menggunakan odds rasio.
Model regresi logistik dengan peubah bebas dikotomi dapat diilutrasikan dalam table 2.1 berikut:
Tabel 5.1 Nilai-nilai dari Model Logistik untuk Peubah Bebas Dikotomi
Peubah tak bebas Peubah Bebas (independent)
(dependent) x=1 x=0
e 0  1 e 0
y=1  (1)   (0) 
1  e 0  1 1  e 0
1 1
y=0 1   (1)  1   (0) 
1  e  0  1 1  e 0
Jumlah 1.0 1.0
Sumber: Hosmer & Lemeshow, 2000

49
Nilai odds rasio antara y = 1 dengan y = 0 untuk x = 1 adalah  1

1   1
, sedangkan nilai odds
rasio antara y = 1 dengan y = 0 untuk x = 0 adalah  0

1   0 .
 e  0  1   1 
  /   0  1 
1  e  0  1  1 e 
OR  
 e 0   1 
 0
 /  0 
1 e  1 e 
e  0  1

e 0
( 0   ) 0
e
 e 1 (5.20)
Persamaan (5.20) dapat diinterpretasikan bahwa odd rasio (OR) = 1 berarti bahwa
individu dengan nilai x = 1 mempunyai peluang yang sama dengan individu dengan nilai x = 0
dalam kaitannya dengan Y = 1. Jika 1 < OR <  , maka individu dengan x = 1 mempunyai
peluang yang lebih besar dibanding dengan x = 0, sebaliknya jika 0 < OR < 1 individu dengan x
= 1 mempunyai peluang lebih kecil dibandingkan x = 0 dalam kaitannya dengan Y = 1.

50
DAFTAR PUSTAKA
1. Agresti, A. 1990. Categorical Data Analysis, John Wiley& Sons, USA.
2. Christensen, R. 1997. Log Linear Models and Logistic Regression. Springer-Verlag,

New York.
3. Kleinbaum, D.G. 2002. Logistic Regression; A Self-Learning Text. 2ed. Springer-

Verlag, New York.
4. Hosmer, D.W.2000. Appllied Logistic Regression, 2ed. John Wiley & Sons, USA.

Diktat Adk Made Susilawati

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Diktat Adk Made Susilawati

Diunggah oleh

Hak Cipta:

Format Tersedia

DIKTAT

ANALISIS DATA KATEGORIK

PROGRAM STUDI MATEMATIKA

1. Proses Multinom : Tabel Kontingensi, model Log Linier

Tabel 1.1 Skala Pengukuran untuk Berbagai Analisis Statistika

Y (respon) X (penjelas) Metode Statistika

tanggal 2.→ hujan

tanggal 3.→ tidak hujan

tanggal 31.→ tidak hujan

a. Sikap terhadap tindakan aborsi (setuju, menentang); gender (laki-laki, wanita)

b. Penyakit pada hati (ada, tidak); tingkat kolestrol

2. Apa skala pengukuran yang paling tepat untuk variabel berikut:

a. Anggota sebuah partai politik (Demokrat, Republik, lainnya)

c. Kondisi pasien (bagus, kurang bagus, serius, kritis)

d. Lokasi Rumah Sakit (Denpasar, Singaraja, Gianjar).

Jenis Kelamin Siswa

Pendapat Pria Wanita Jumlah

Tabel 2.2. Tabel Kontingensi 2x2

A1 f11 f12 f10

A2 f21 f21 f20

Jumlah f01 f02 f00

2. Peneliti mengambil responden kategori A1 sebanyak f10 dan responden kategori A2

Pengujian Kebebasan A dan B

Kalau A dan B bebas maka: Pij  Pi 0 .P0 j

dari frekuensi relatifnya:

Atau Ho : dua populasi saling bebas

H1 : dua populasi tidak saling bebas atau saling ketergantungan

Dengan statistic ujinya adalah:

(pendapat dan jenis kelamin bebas)

H1: Ada kaitan antara jenis kelamin responden dengan pendapatnya

Langkah pertama yaitu menghitung nilai harapan tiap sel:

(106)(95) (77 )(95)

Langkah kedua, membuat table seperti berikut:

Tabel 2.4. Hasil perhitungan teladan 1.

fij eij fij - eij (fij - eij )2 (fij - eij)2/eij

78 55,03 22,97 527,6209 9,59

Alternatif untuk perhitungan diatas adalah rumus:

Bila harga eij<5, maka statistic  hit

Keputusan Ikut Serta Tidak Ikut Serta Jumlah

Berdasarkan perhitungan di atas diputuskan H0 diterima, yang berarti persetujuan terhadap

PV = k*n/N .................... (3.1)

Contoh asosiasi antar variabel:

1. Hubungan Timbal Balik

a. Misal, V1 = status pemakaian KB (1. Ya; 0. Tidak)

V2 = Jumlah anak yang dilahirkan

a. Misal, V1 = pola makan ibu waktu hamil

V2 = berat badan bayi pada saat dilahirkan

V5 = simpanan dalam bentuk uang

Maka V4 merupakan penyebab dari V5.

3. Hubungan yang tidak meyakinkan

3. Perbedaan Resiko (RD) Antara Dua Proporsi

Tabel 3.1. Peristiwa Pada Kelompok Kasus dan Kontrol

Selang kepercayaan untuk perbedaan diantara dua proporsi adalah

Pengujian Perbedaan Antara Dua Proporsi

Dengan s.e. p1  p0  seperti (1), bisa juga dihitung dengan rumus:

s.e. p1  p0    p1  p 1 n1  1 n0  P

H1 = perbedaan resiko adalah tidak sama.

Penelitian tentang efektifan pemberian vaksin untuk mencegah influenza

Tabel 3.2. Tabel 2 x 2 Mengenai Hasil Percobaan Vaksin Influensa

Perbedaan Resiko nya adalah: p1 – p0 = 0.083-0.364 = -0.281

Sehingga selang kepercayaanya adalah:

95%CI  0.083  0.364   0.196  0.037

Pengujian hipotesis mengenai perbedaan proporsi langkah-langkahnya sbb.:

Dengan: s.e. p1  p0   0.2171  0.217 1 240  1 220  0.0385