Anda di halaman 1dari 56

ANALISIS DATA KATEGORIK

- PERTEMUAN III -

INFERENSIA TABEL KONTINGENSI


DAN UKURAN ASOSIASI
(LANJUTAN)

SISKAROSSA IKA OKTORA


MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
INFERENSIA TABEL KONTINGENSI

1 Penduga Selang Parameter Ukuran


Asosiasi (sampel besar)

2 Uji Independensi tabel 2 arah


Uji Pearson Chi Square

Uji Rasio Likelihood


INTERVAL KONFIDENSI UNTUK ODDS RATIO

Distribusi sampling nilai penduga OR tidak simetris, meliputi nilai


nol s.d positif tak hingga

Solusi: menggunakan log (θ) atau log (𝜃),


መ nilainya meliputi
negatif tak hingga s.d positif tak hingga dan distribusinya menjadi
asymptotic normal sehingga memudahkan dalam inferensi

(1-𝛼)100% CI untuk menduga odds ratio adalah

෡ ± 𝒛𝜶Τ𝟐 ෝ𝝈 𝒍𝒐𝒈 𝜽
𝒍𝒐𝒈 𝜽 ෡
dimana
𝟏 𝟏 𝟏 𝟏

ෝ 𝒍𝒐𝒈 𝜽
𝝈 = + + +
𝒏𝟏𝟏 𝒏𝟏𝟐 𝒏𝟐𝟏 𝒏𝟐𝟐
INTERVAL KONFIDENSI UNTUK RELATIVE RISK

(1-𝛼)100% CI untuk menduga absolute risk

ෝ𝟏
𝝅 ෝ𝟏
𝝅
𝒍𝒐𝒈 ± 𝒛𝜶Τ𝟐 ෝ𝝈𝒍𝒐𝒈
ෝ𝟐
𝝅 ෝ𝟐
𝝅
dimana
ෝ𝟏
𝝅 (𝟏 − 𝝅𝟏 ) (𝟏 − 𝝅𝟐 )
ෝ 𝒍𝒐𝒈
𝝈 = +
ෝ𝟐
𝝅 𝝅𝟏 𝒏𝟏 𝝅𝟐 𝒏𝟐
INGAT...!!

▪ Yang biasa digunakan adalah interval


konfidensi 95%, yang berarti bahwa estimasi
range yang kita lakukan memiliki 95%
kesempatan mengandung nilai populasi yang
benar atau
▪ Masih memiliki 5% kesempatan bahwa range
yang kita buat tidak mengandung nilai
populasi yang benar
INGAT...!!

• Jika kita menginginkan peluang yang lebih


kecil untuk terjadinya error, maka bisa
digunakan interval konfidensi 99%.
Konsekuensinya adalah range-nya lebih lebar
• Jika peluang terjadinya error lebih besar masih
bisa diterima maka bisa menggunakan interval
konfidensi 90%
UJI INDEPENDENSI TABEL DUA ARAH

Secara umum, uji hipotesis yang ingin diuji


dalam tabel kontingensi 2x2 adalah:

Ho: Tidak terdapat hubungan antara variabel X dan Y


H1: Terdapat hubungan antara variabel X dan Y
Statistik Uji
𝟐
Pearson 𝝌
Untuk tabel kontingensi i x j, rumus umunya dinyatakan
sebagai:

𝟐
𝟐
𝑶 𝒊𝒋 − 𝑬 𝒊𝒋
𝝌 = ෍෍
𝑬𝒊𝒋
𝒊 𝒋
i : indeks baris dan j = indeks kolom
𝐸𝑖𝑗 : frekuensi harapan jika Ho diterima, dinyatakan sebagai
𝑛𝑖 𝑚𝑗
𝐸𝑖𝑗 ∶ ,
𝑛𝑡𝑜𝑡𝑎𝑙
dengan 𝑛𝑖 merupakan jumlah observasi berdasarkan baris
ke-i dan 𝑚𝑗 menyatakan jumlah observasi berdasarkan
kolom ke-j
Statistik Uji
𝟐
Pearson 𝝌

Bentuk statistik uji 𝜒 2 khusus untuk tabel 2x2:

𝑎𝑑−𝑏𝑐 2 𝑛
𝜒2 =
𝑚1 𝑚2 𝑛1 𝑛2

Distribusi statistik uji 𝜒 2 mendekati distribusi chi-square


dengan derajat bebas (banyak baris dikurangi satu) dikalikan
dengan (banyak kolom dikurangi satu), jika Ho benar.
(Karl Pearson, 1904)
Statistik Uji
𝟐
Pearson 𝝌

• Untuk tabel 2x2, statistik uji 𝜒 2 akan mendekati


distribusi chi-square dengan derajat bebas 1, jika
tidak ada hubungan antara paparan dan penyakti,
sehingga tabel untuk distribusi ini dapat digunakan
untuk mendapatkan tingkat signifikansi (p-value)
• Statistik uji 𝜒 2 valid digunakan jika tidak ada sel yang
memiliki frekuensi cukup kecil. SPSS, expected count
kurang dari 5
Statistik Uji
𝟐
Pearson 𝝌

• Khusus untuk tabel 2x2, Yates (1934) mengusulkan


rumus yang memuat koreksi (continuity correction)
ketidaksesuaian pendekatan distribusi kontinu chi-
square pada distribusi sampling statistik uji 𝜒 2 yang
bersifat diskrit:
1 2 𝑛 2
𝑂−𝐸 − 𝑛 𝑎𝑑−𝑏𝑐−
2 2
𝜒 = σ𝑠𝑒𝑙 2
atau 𝜒 = 2
𝑒 𝑛1 𝑛2 𝑚1 𝑚2
Statistik Uji
Uji Rasio Likelihood

𝟐
𝑶𝒊𝒋
𝑮 = 𝟐 ෍ ෍ 𝑶𝒊𝒋 𝒍𝒏
𝑬𝒊𝒋
𝒊 𝒋

• Kriteria pengambilan keputusan sama dengan


apabila digunakan statistik 𝜒 2 , karena distribusi
pendekatan 𝐺 2 adalah juga 𝜒 2 (𝑏−1)(𝑘−1)
• Jarang digunakan, rumit
• Nilai 𝐺 2 tidak akan jauh berbeda dengan 𝜒 2
Contoh 1

Tabel berikut adalah hasil dari case control study


yang dilakukan di sebuah restoran.
Solusi
OR = ad/bc = (218)(85) = 19.6
(45)(21)

• Interval konfidensi 95% adalah


11.0-34.9 (Peluang range 11.0-34.9
mengandung OR yang benar adalah
95%)
• Batas Bawah CI = 11.0 (>1)
• Kesimpulan: orang yang makan
salsa benar-benar lebih cenderung
untuk menderita Hepatitis A
dibandingkan dengan orang yang
tidak makan salsa
Contoh 2

Penelitian berkaitan dengan wabah Salmonella


di sebuah kapal pesiar.

Adakah perbedaan signifikan pada jumlah orang


yang terkena wabah Salmonella antara orang
yang makan tomat dengan yang tidak ?
Solusi
• Untuk melakukan uji chi-square,
kondisi ini harus terpenuhi:
– Jumlah observasi total minimal
adalah 30
– Setiap sel dalam tabel harus
berisi 5 atau lebih
• Untuk melakukan uji Chi-Square,
kita membandingkan data
observasi (hasil penelitian) dengan
data yang kita harapkan
Solusi
• Penghitungan frekuensi harapan:

Row Total x Column Total


Grand Total
• Menghitung statistik chi-square-nya:
[(Observed – Expected)2/Expected]
untuk tiap sel di dalam table
• The chi-square (χ2) adalah 19.2
8.7 + 2.2 + 6.6 + 1.7 = 19.2
(Chi square tabel dengan df 1 = 3.84)
Tolak Ho, ada hubungan antara makan tomat dengan
wabah salmonella
Contoh 3

Dalam suatu studi longitudinal yang dilaksanakan di suatu perusahaan,


karyawan perusahaan ditanya tentang berbagai pertanyaan mengenai
lingkungan kerjanya dan kemudian karyawan ini diikuti selama periode
waktu 10 tahun. Data hasil pengamatan disajikan dalam tabel berikut.
.

Kejadian
CHD Total
Ya Tidak
Apakah anda bekerja Ya 97 307 404
di bawah tekanan? Tidak 200 1409 1609
Total 297 1716 2013
bekerja di bwh tekanan * kej adian CHD Crosstabulati on

Count
kejadian CH D
ya tidak Tot al
bek erja di bwh ya 97 307 404
tekanan tidak 200 1409 1609
Tot al 297 1716 2013

Chi-Square Tests P-value


Exact Exact
Asy mptotic Signif icance Signif icance
Value df Signif icance (2-sided) (1-sided)
Pears on C hi-Square 34.428b 1 .000
a
Continuity C orrection 33.513 1 .000
Likelihood Ratio 31.133 1 .000
Fisher's Exact Tes t .000 .000
Linear-by -Linear
34.411 1 .000
Assoc iation
N of Valid Cas es 2013
a. Computed only f or a 2x2 table
Nilai statistik uji
b. 0 cells (.0%) expf < 5. Min ex p = 59.61... chi-square
𝑅𝑅෠
Risk Esti mate

95% Conf idence


Interv al
Value Lower Upper
Odds Rat io f or bekerja di
2. 226 1. 696 2. 922
bwh t ekanan (y a / tidak)
For cohort k ejadian CHD
1. 932 1. 555 2. 399
= ya
For cohort k ejadian CHD
.868 .819 .919
= tidak
N of Valid Cas es 2013

interval konfidensi
95% untuk RR
Catatan

• Uji Chi Square mengasumsikan


bahwa observasinya adalah
independent (nilai dari satu
observasi tidak bergantung dari
nilai observasi lainnya)
• Jangan gunakan Chi-Square pada:
– Pengulangan observasi pada
kelompok orang yang sama
(misalnya: pre dan post tes)
MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
UKURAN ASOSIASI DATA ORDINAL
Jika X dan Y ordinal, maka asosiasi antara X dan Y, bisa sejalan X naik, Y
naik - vice versa. Selanjutnya, untuk masing-masing pasangan variabel
dinyatakan sebagai pasangan;
Concordant,
jika subjek memberikan ranking tinggi pada variabel X dan Y
Discordant,
jika subjek memberikan ranking tinggi pada variabel X namun
memberikan ranking rendah pada Y
UKURAN ASOSIASI DATA ORDINAL

Ukuran Asosiasi Gamma

dengan estimasi :

Contoh: Agresti, page 57-59


Interpretasi nilai Gamma
Income Job Satisfaction
(Dollars)
Very Little Moderately Very
Dissatisfied Dissatisfied Satisfied Satisfied
<15000 1 3 10 6

15000-25000 2 3 10 7

25000-40000 1 6 14 12

>40000 0 1 9 11
UJI INDEPENDENSI TABEL 2 ARAH DATA ORDINAL

Agresti, page 86-87


UJI INDEPENDENSI TABEL 2 ARAH DATA ORDINAL
MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
UKURAN ASOSIASI : COHEN’S KAPPA
• Digunakan jika variabel kolom dan baris memiliki
level/kategori yang sama, maka asosiasi terhadap
variabel tersebut adalah ukuran kesepakatan.
• Contoh:
– penelitian untuk melihat penilaian terhadap produk
– Penilaian juri kontes X Factor

• Interpretasi nilai Cohen’s Kappa:


– Independent, jika nilainya sama dengan nol
– Akan menunjukkan hubungan jika lebih dari nol
– Jika mendekati 1, maka semakin tinggi level agreement/asosiasi
diantara penilai.
Contoh : Azen, page 61
Nilai k > 0
Klasifikasi yang diberikan oleh kedua
juri dikatakan in agreement &
berasosiasi (dependence)
MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
MATERI

Inferensia Tabel Kontingensi

Ukuran Asosiasi Data Ordinal

Ukuran Asosiasi : Cohen’s Kappa

Marginal dan Conditional Association


(Tabel Kontingensi 3 Arah)
MARGINAL AND CONDITIONAL

INDEPENDENCE
HUBUNGAN ANTAR TIGA VARIABEL
ATAU LEBIH
Dalam prakteknya, penelitian lebih sering melibatkan sejumlah besar variabel
sekaligus

Contoh:

▪ Apakah terdapat hubungan antara jenis kelamin, afiliasi politik, dan usia?

▪ Bagaimana usia mempengaruhi hubungan antara status merokok dan


kemampuan seseorang bernafas secara normal (kesehatan pernafasan)?

▪ Apakah ada hubungan antara pendidikan, sikap berkeyakinan, dan


pendapatan?

▪ Apakah ada hubungan antara status pernikahan dan kebahagiaan,


menurut gender?
HUBUNGAN ANTAR TIGA VARIABEL ATAU
LEBIH

Analisis dapat dilakukan (seringkali lebih mudah & bermakna) melalui tabel
yang lebih sederhana, yaitu:

1. Partial table
2. Marginal table
PARTIAL TABLE & CONDITIONAL ASSOCIATION
Tabel Parsial (partial table) adalah tabel yang lebih sederhana yang
diperoleh dengan hanya melihat pada salah satu kategori variabel lain.

Contoh:
Pada tabel tiga arah antara jenis kelamin, afiliasi politik, dan kelompok usia
jika dibuat/dipisahkan tabel sederhana antara afiliasi politik dan
kelompok usia, untuk jenis kelamin tertentu misalkan laki-laki (male),
maka tabel ini merupakan tabel parsial
• Pengujian hipotesis tentang ada/tidaknya hubungan antar variabel
kategorik dapat dilakukan pada tabel parsial
• Ukuran asosiasi pada tabel parsial disebut dengan conditional
association
PARTIAL TABLE & CONDITIONAL ASSOCIATION
PARTIAL TABLE & CONDITIONAL ASSOCIATION
MARGINAL TABLE & MARGINAL ASSOCIATION
Tabel Marginal (marginal table) adalah tabel yang lebih sederhana yang
diperoleh tanpa melihat kategori variabel lain (kategori variabel lain
digabungkan).

Contoh:
Pada tabel tiga arah antara jenis kelamin, afiliasi politik, dan kelompok usia
jika dibuat tabel sederhana antara afiliasi politik dan kelompok usia,
dimana frekuensi untuk jenis kelamin laki-laki (male) dan perempuan
(female) digabungkan, maka tabel ini merupakan tabel marginal
▪ Pengujian hipotesis tentang ada/tidaknya hubungan antar variabel
kategorik dapat dilakukan pada tabel marginal
▪ Ukuran asosiasi pada tabel m disebut dengan marginal association
MARGINAL TABLE & MARGINAL ASSOCIATION
CONDITIONAL & MARGINAL ASSOCIATION
Ukuran asosiasi (odds ratio), baik conditional maupun
marginal, dapat dihitung dari tabel 2x2 yg dapat dibentuk.
Yang terjadi bisa:

MARGINAL INDEPENDENCE
1 3
tidak ada asosiasi/hubungan antar CONDITIONAL INDEPENDENCE
variabel pada marginal table (nilai tidak ada asosiasi/hubungan
odd ratio untuk setiap 2x2 tabel antar variabel pada partial table
pada marginal table bernilai 1)

MARGINAL DEPENDENCE
2 4
ada asosiasi/hubungan antar CONDITIONAL DEPENDENCE
variabel pada marginal table (nilai ada asosiasi/hubungan antar
odd ratio untuk setiap 2x2 tabel variabel pada partial table
pada marginal table ≠1)
CONDITIONAL & MARGINAL ASSOCIATION
HOMOGENEOUS ASSOCIATION
• Jika conditional association antara dua variabel X dan Y bernilai
sama untuk semua partial table (semua level variabel Z) disebut
dengan homogeneous association (asosiasi homogen/sama)

• Conditional independence merupakan kasus khusus dari


homogeneous association dimana
MENGUJI HOMOGENEOUS ASSOCIATION
PADA 3-WAY TABLES
Breslow-Day test: untuk menguji ada/tidaknya 3-way interaction/association

H0: terdapat asosiasi homogen (tidak ada 3-way interaction/association)

H1: tidak terdapat asosiasi homogen (ada 3-way interaction/association)


Tolak H0 berarti ada 3-way interaction

Gagal tolak H0 berarti terjadi homogeneous association dan


conditional association antar setiap 2 variabel adalah sama pada setiap
level variabel ketiga (terdapat homogeneous associations dalam data)

Uji ini hanya bisa digunakan pada tabel 2x2xK


MENGUJI CONDITIONAL INDEPENDENCE
PADA 3-WAY TABLES
Cochran–Mantel–Haenszel (CMH) test: untuk menguji ada/tidaknya
conditional independence dalam three-way tables (apakah terjadi two-
way interaction)

H0: semua conditional odds ratios bernilai 1


Tolak H0 berarti minimal ada satu conditional odds ratio ≠ 1 dan
terjadi partial/conditional association dalam data

Statistik uji:
~ Chi-Square
MENGUJI HOMOGENEOUS ASSOCIATION PADA 3-WAY TABLES
Suatu penelitian retrospective telah dilakukan
Latihan 1 pada semua orang laki-laki yang berumur 50-54
tahun selama periode 1 bulan menunjukkan
bahwa 55 orang yang meninggal karena cardio
vascular disease (CVD), 15 orang pada kelompok
high salt diet sebelum meninggal; sedangkan dari
35 orang meninggal karena penyebab lain, 5 dalam
kelompok high salt diet.
Buatlah :
– tabel 2x2
– kemudian hitung ukuran keeratan hubungan
antara high salt diet dengan kematian
karena CVD
– hitung 95% interval konfidensi untuk ukuran
keeratan hubungan tsb,
Hayo..sampeyan – selanjunya lakukan uji asosiasi apakah ada
bisa ndak?? hubungan antara high salt diet dengan CVD
Seorang dokter ingin meneliti apakah penyakit
Cervical Cancer pada wanita disebabkan oleh usia
pada kehamilan pertama. Dari 48 wanita penderita
kanker ternyata ada 36 wanita yang usia kehamilan
pertamanya ≤25 tahun. Sedangkan dari 77 wanita
bukan penderita kanker, ternyata ada 35 wanita
yang usia kehamilan pertamanya>25 tahun.

a) Buatlah tabel kontingensi 2 x 2


Latihan 2 b) Kemudian hitung ukuran keeratan
hubungan antara usia perkawinan
pertama dengan Cervical Cancer
c) Hitung 95% interval konfidensi untuk
ukuran keeratan hubungan tsb
d) Lakukan uji asosiasi, apakah ada hubungan
antara cervical cancer dengan usia
kehamilan pertama
Buku Agresti Halaman 62-63 No. 2.12

1. Hitunglah nilai conditional odds ratio AG, dan ujilah independensi dari setiap tabel parsialnya!
2. Hitunglah nilai marginal odds ratio AG, dan ujilah independensi dari tabel marginalnya!
3. Dari poin 1 dan 2 apakah terjadi Sympson’s Paradox?
4. Deteksi apakah terjadi homogeneous assosiation?
5. Jika jawaban pada pin 4 adalah ya, maka deteksi apakah terjadi conditional independence!

Anda mungkin juga menyukai