Anda di halaman 1dari 12

2.

5 PENGUJIAN KEMAMPUAN DATA ORDINAL

Bila baris dan/atau kolomnya ordinal, uji independen chi-kuadrat


menggunakan statistik uji 2 atau 2 mengabaikan informasi pemesanan. Uji
statistik yang menggunakan ordinalitas dengan memperlakukan variabel ordinal
sebagai kuantitatif daripada kualitatif (skala nominal) biasanya lebih tepat dan
memberikan kekuatan yang lebih besar.

2.5.1 Trend Linear Alternatif untuk Kemerdekaan

Bila variabelnya ordinal, asosiasi kecenderungan adalah hal biasa.


Seiring tingkat kenaikan X, respons pada Y cenderung meningkat ke tingkat yang
lebih tinggi, atau respons Y cenderung menurun ke tingkat yang lebih rendah.

Untuk mendeteksi asosiasi tren, analisis sederhana memberikan skor pada


kategori dan mengukur tingkat kecenderungan linier. Statistik uji, yang sensitif
terhadap tren linier positif atau negatif, menggunakan informasi korelasi dalam
data. Biarkan u1 u2 uI menunjukkan nilai untuk baris, dan misalkan v1
v2 vJ menunjukkan nilai untuk kolom. Skor memiliki urutan yang sama
dengan tingkat kategori. Anda harus memilih nilai untuk mencerminkan jarak
antara kategori, dengan jarak yang lebih jauh antara keduanyakategori yang
dianggap terpisah jauh.
Misalkan = + menunjukkan mean sampel pada baris dan =
+ menunjukkan mean sampel dari nilai kolom. Jumlah
Bobot-bobot produk silang dari nilai penyimpangan dengan frekuensi relatifnya.
Ini adalah contoh kovariansi X dan Y. Korelasi r antara X dan Y sama dengan
kovarians dibagi dengan produk dari standar deviasi sampel X dan Y.
Artinya,
,( )( )
=
[(( )2 + ][( )2

Mudah untuk menghitung r menggunakan perangkat lunak,


memasukkan setiap nilai skor pada setiap klasifikasi. Korelasi turun antara -1 dan
+1. Kemandirian antara variabel menunjukkan bahwa nilai populasinya sama
dengan nol. Semakin besar korelasi dalam nilai absolut, semakin jauh data turun
dari kemandirian dalam dimensi linier.Untuk pengujian H0: independensi
terhadap Ha dua sisi: 0, statistik uji adalah

2 = ( 1) 2
Statistik uji ini meningkat seiring bertambahnya r dan besarnya ukuran
n tumbuh. Untuk n besar, 2 memiliki kira-kira distribusi chi-kuadrat dengan df =
1.
Nilai besar bertentangan dengan independensi, jadi, seperti pada
2 dan 2 , nilai P adalah probabilitas ekor kanan di atas nilai yang teramati. Akar
kuadrat, = ( 1), memiliki kira-kira distribusi normal normal nol. Ini
berlaku untuk hipotesis alternatif satu sisi, seperti Ha > 0
Seperti 2 dan 2 , 2 tidak membedakan antara variabel respon dan
explanatory. Kita mendapatkan nilai yang sama terlepas dari variabel row dan
variabel kolom mana.

2.5.2 Contoh: Penggunaan Alkohol dan Malformasi Bayi

Tabel 2.7 mengacu pada studi prospektif tentang minum ibu dan
malformasi bawaan. Setelah 3 bulan pertama kehamilan, wanita dalam sampel
menyelesaikan kuesioner tentang konsumsi alkohol. Setelah melahirkan,
pengamatan dicatat karena ada atau tidak adanya malformasi organ kelamin
bawaan. Konsumsi Alco-hol, yang diukur dengan rata-rata jumlah minuman per
hari, adalah variabel penjelasan dengan kategori pesanan. Malformasi, variabel
responnya adalah nominal.
Bila sebuah variabel bersifat nominal namun hanya memiliki dua
kategori, statistik (seperti M2) yang memperlakukan variabel sebagai ordinal
masih valid. Sebagai contoh, kita dapat secara artifisial menganggap malformasi
sebagai ordinal, memperlakukan "absen" sebagai "rendah" dan "hadir" sebagai
"tinggi."

pilihan dua nilai, seperti 0 untuk "absen" dan 1 untuk "sekarang," menghasilkan
nilai M2 yang sama.

Tabel 2.7 memiliki campuran jumlah yang sangat kecil, sedang, dan
sangat besar. Meskipun ukuran sampelnya besar ( = 32,574), dalam kasus
seperti itu, distribusi sampling aktual 2 atau 2 mungkin tidak mendekati chi-
kuadrat. Untuk data ini, dengan = 4, 2 = 6,2 ( = 0,19) dan 2 =
12,1( = 0,02) memberikan sinyal campuran. Bagaimanapun, mereka
mengabaikan orisinalitas konsumsi alkohol.

Dari Tabel 2.7, persentase kasus malformasi secara kasar merupakan


tren yang meningkat di tingkat konsumsi alkohol. Dua yang pertama serupa dan
dua berikutnya juga serupa, namun, dan tiga perubahan terakhir lainnya berubah
secara dramatis-jika kita melakukan analisis sensitivitas dengan menghapus satu
kasus malformasi. Tabel 2.7 juga melaporkan residu standar untuk kategori
"sekarang". Mereka negatif pada tingkat konsumsi alkohol rendah dan positif
pada tingkat konsumsi yang tinggi, walaupun sebagian besar kecil dan mereka
juga berubah secara substansial dengan sedikit perubahan pada
data. Persentase sampel dan residu standar keduanya menunjukkan kemungkinan
kecenderungan malformasi lebih mungkin terjadi pada tingkat konsumsi alkohol
yang lebih tinggi.

Untuk menggunakan statistik uji ordinal 2 , kami memberikan skor


untuk konsumsi alkohol yang merupakan titik tengah kategori; yaitu 1 = 0, 2 =
0,5, 3 = 1,5, 4 = 4,0, 5 = 7.0, skor terakhir agak acak. Dari PROC FREQ di
SAS, korelasi antara konsumsi alkohol dan malformasi adalah r = 0,0142.
Statistik uji 2 = (32,573) (0,0142) 2 = 6,6 memiliki nilai = 0,01,
menunjukkan bukti korelasi non-nol yang kuat. Statistik normal standar =
2,56 memiliki = 0.005 untuk : > 0.
Untuk nilai yang dipilih, = 0,014 nampaknya lemah. Namun, untuk
tabel seperti ini yang sangat diskrit dan tidak seimbang, tidak mungkin
mendapatkan nilai r yang besar, dan r tidak terlalu berguna untuk
menggambarkan asosiasi. Bab-bab selanjutnya menyajikan tes seperti 2 sebagai
bagian dari analisis berbasis model. Pendekatan berbasis model menghasilkan
perkiraan ukuran efek serta perkiraan probabilitas sel yang merapikan. Perkiraan
ini lebih informatif daripada sekadar tes signifikansi.

2.5.3 Kekuatan Ekstra dengan Tes Ordinal

Untuk pengujian H0: independensi, 2 dan 2 mengacu pada


kemungkinan Ha yang paling umum, dimana probabilitas sel menunjukkan semua
jenis ketergantungan statistik. Nilai df ( 1) ( 1) mencerminkan bahwa Ha
memiliki ( 1) ( 1) lebih banyak parameter daripada H0 (ingat
pembahasannya pada akhir Seksi 2.4.3). Statistik ini dirancang untuk mendeteksi
semua jenis pola untuk parameter tambahan. Dalam mencapai generalitas ini,
mereka mengorbankan kepekaan untuk mendeteksi pola tertentu.

Bila variabel baris dan kolom bersifat ordinal, seseorang dapat


mencoba untuk menggambarkan asosiasi menggunakan satu parameter
tambahan. Sebagai contoh, statistik uji 2 didasarkan pada ukuran korelasi dari
tren linier. Bila statistik uji chi-squared mengacu pada satu parameter tunggal, ia
memiliki df = 1.

Bila asosiasi benar-benar memiliki tren positif atau negatif, tes ordinal
menggunakan 2 memiliki keunggulan daya dibandingkan tes berdasarkan 2
atau 2 . Karena df sama dengan rata-rata distribusi chi-kuadrat, nilai 2 yang
relatif besar berdasarkan = 1 jatuh lebih jauh dari ekor kanannya daripada
nilai sebanding 2 atau 2 berdasarkan = ( 1) ( 1). Jatuh lebih jauh
di ekor menghasilkan nilai P yang lebih kecil. Bila benar-benar ada tren linier,
2 sering memiliki ukuran yang sama dengan 2 atau 2 , sehingga cenderung
memberikan nilai P yang lebih kecil.

Keuntungan lain dari uji chi-kuadrat yang memiliki nilai df kecil


berkaitan dengan akselerasi perkiraan chi-kuadrat. Untuk ukuran sampel kecil
sampai sedang, distribusi sampling sebenarnya cenderung mendekati chi-squared
jika lebih kecil. Bila jumlah beberapa sel kecil, perkiraan chi-kuadrat biasanya lebih
buruk untuk 2 atau 2 daripada untuk 2 .

2.5.4 Pilihan Skor

Untuk kebanyakan kumpulan data, pilihan skor memiliki pengaruh


yang kecil terhadap hasilnya. Pilihan yang berbeda dari skor teratur biasanya
memberikan hasil yang serupa. Ini mungkin tidak terjadi, bagaimanapun,

TABEL KONTINGENSI

Bila datanya sangat tidak seimbang, seperti ketika beberapa kategori


memiliki lebih banyak pengamatan daripada kategori lainnya. Tabel 2.7
mengilustrasikan hal ini. Untuk nilai baris yang sama jaraknya (1, 2, 3, 4, 5), 2 =
1,83, memberikan kesimpulan yang jauh lebih lemah ( = 0,18). Besarnya r dan
2 tidak berubah dengan transformasi nilai yang mempertahankan jarak relatif
yang sama antara kategori. Misalnya, skor (1, 2, 3, 4, 5) menghasilkan korelasi
yang sama dengan skor (0, 1, 2, 3, 4) atau (2, 4, 6, 8, 10) atau (10, 20, 30, 40, 50).

Pendekatan alternatif memberi peringkat pada subjek dan


menggunakannya sebagai nilai kategori. Untuk semua subjek dalam suatu
kategori, seseorang menetapkan rata-rata peringkat yang akan mengajukan
peringkat lengkap sampel dari 1 sampai n. Ini disebut midranks. Misalnya, pada
Tabel 2.7, 17.114 subjek pada level 0 untuk pangsa konsumsi alkohol menempati
urutan 1 sampai 17.114. Kami menetapkan masing-masing rata-rata peringkat ini,
yaitu midrank (1 + 17.114) / 2 = 8557.5. 14.502 subjek pada level <1 untuk
pangsa konsumsi alkohol menempati 17.115 sampai 17.114 + 14.502 =
31.616, untuk midrank (17.115 + 31.616) / 2 = 24.365,5. Demikian pula
midranks untuk tiga kategori terakhir adalah 32.013, 32.473, dan 32.555.5. Skor
ini menghasilkan 2 = 0,35 dan kesimpulan yang lebih lemah ( = 0,55).
Mengapa ini terjadi? Kategori berdekatan yang memiliki pengamatan
relatif sedikit tentu memiliki tingkat menengah yang sama. Tingkat menengah
(8557,5, 24,365,5, 32,013, 32,473, 32,555,5) untuk Tabel 2.7 serupa untuk tiga
kategori terakhir, karena kategori tersebut memiliki pengamatan yang jauh lebih
sedikit daripada dua kategori pertama. Konsekuensinya adalah skema penilaian ini
memperlakukan tingkat konsumsi alkohol 1-2 (kategori 3) mendekati tingkat
konsumsi 6 (kategori 5) daripada tingkat konsumsi 0 (kategori 1). Hal ini
tampaknya tidak tepat. Sebaiknya gunakan penilaian Anda dengan memilih skor
yang mencerminkan jarak antara kategori dengan baik. Bila tidak pasti, lakukan
analisis sensitivitas. Pilih dua atau tiga pilihan yang masuk akal, dan periksa
hasilnya sama untuk masing-masing. Skor yang sama juga sering merupakan
kompromi yang masuk akal ketika label kategori tidak menyarankan pilihan yang
jelas, seperti kategori (liberal, moderat, konservatif) untuk filsafat politik.

Statistik M2 yang menggunakan nilai midrank untuk masing-masing


variabel sensitif terhadap deteksi nilai nol dari korelasi rank yang disebut
Spearman's rho. Uji ordinal alternatif untuk tabel I J menggunakan versi
tindakan asosiasi ordinal lainnya. Misalnya, gamma dan Kendall's tau-b adalah
generalisasi kontingensi-tabel ordinal mea-sure Kendall's tau. Nilai sampel dari
ukuran tersebut dibagi dengan kesalahan standarnya yang memiliki distribusi
normal standar sampel yang besar untuk menguji independensi. Seperti tes
berdasarkan M2, tes ini berbagi keuntungan kekuatan potensial yang dihasilkan
dari penggunaan satu parameter untuk menggambarkan asosiasi.

2.5.5 Tes Trend untuk Tabel

Bila X adalah biner, tabel memiliki ukuran 2 . Tabel seperti itu


terjadi dalam perbandingan dua kelompok, seperti saat baris mewakili dua
perlakuan. Statistik 2 kemudian mendeteksi perbedaan antara dua baris berarti
skor {vj} pada Y. Nilai P kecil menunjukkan bahwa perbedaan sebenarnya dalam
deret berarti tidak nol. Dengan nilai midrank untuk Y,

2.5.6 Tabel Nominal-Ordinal

Statistik uji 2 memperlakukan kedua klasifikasi sebagai ordinal. Bila


satu variabel (katakanlah X) adalah nominal tetapi hanya memiliki dua kategori,
kita tetap bisa menggunakannya. Bila X nominal dengan lebih dari dua kategori,
itu tidak tepat. Satu statistik uji yang mungkin menemukan respons rata-rata pada
variabel ordinal (untuk nilai yang dipilih) di setiap baris dan merangkum variasi di
antara mean baris. Statistik, yang memiliki distribusi chi-kuadrat sampel besar
dengan = ( 1), agak rumit secara komputasi. Kami menunda
pembahasan kasus ini ke Bagian 6.4.3. Ketika saya = 2, itu identik dengan M2.
2.7 ASOSIASI TIGA WAKTU TABEL

Bagian penting dari sebagian besar penelitian adalah pilihan variabel


kontrol. Dalam mempelajari pengaruh variabel penjelas X pada variabel respon Y,
kita harus menyesuaikan variabel perancu yang dapat mempengaruhi hubungan
tersebut karena keduanya terkait dengan X dan Y. Jika tidak, asosiasi XY yang
diamati mungkin hanya mencerminkan efek dari variabel tersebut pada X dan Y.
Hal ini sangat penting untuk penelitian observasional, di mana seseorang tidak
dapat menghapus efek dari variabel semacam itu dengan secara acak
menugaskan subjek untuk mendapatkan perawatan yang berbeda.

Pertimbangkan studi tentang efek merokok pasif; Artinya, efeknya


pada non-perokok hidup dengan perokok. Untuk menganalisis apakah merokok
pasif dikaitkan dengan kanker paru-paru, sebuah penelitian cross-sectional dapat
membandingkan tingkat kanker paru-paru di antara bukan perokok yang
pasangannya merokok dan bukan perokok yang pasangannya tidak merokok.
Dengan demikian, penelitian ini harus berusaha mengendalikan usia, status sosial
ekonomi, atau faktor lain yang mungkin terkait baik dengan apakah pasangan
seseorang merokok dan apakah seseorang memiliki kanker paru-paru. Kontrol
statistik akan menahan variabel seperti itu konstan saat mempelajari asosiasi.
Tanpa kontrol seperti itu, hasilnya akan memiliki kegunaan yang terbatas.

Anggaplah bahwa pasangan bukan perokok cenderung lebih muda dari


pasangan perokok dan orang muda cenderung tidak terkena kanker paru-paru.
Kemudian, proporsi yang lebih rendah dari kasus kanker paru-paru di antara
pasangan yang tidak merokok hanya mencerminkan usia rata-rata mereka yang
lebih rendah dan bukan efek merokok pasif.

Termasuk variabel kontrol dalam analisis memerlukan analisis


multivariat daripada analisis bivariat. Kami menggambarkan konsep dasar untuk
variabel kontrol tunggal Z, yang kategoris. Tabel kontingensi tiga arah
menampilkan jumlah untuk tiga variabel.

2.7.1 Tabel Parsial

Irisan cross-sectional dua arah dari salib tiga arah melintasi klasifikasi X
dan Y pada tingkat turunan Z. Penampang melintang ini disebut tabel parsial.
Mereka menampilkan hubungan XY pada tingkat Z tetap, maka menunjukkan efek
X pada Y sambil mengendalikan Z. Tabel parsial menghapus efek Z dengan
menahan konstanta nilainya.

Tabel kontingensi dua arah yang dihasilkan dari penggabungan tabel


parsial disebut tabel marginal XY. Setiap jumlah sel di dalamnya adalah jumlah
hitungan dari lokasi sel yang sama pada tabel parsial. Tabel marginal tidak
mengandung informasi tentang Z, jadi alih-alih mengendalikan Z, ia mengabaikan
Z. Ini hanyalah tabel dua arah yang berhubungan dengan X dan Y. Metode untuk
tabel dua arah tidak memperhitungkan efek akun dari variabel lain.
Asosiasi dalam tabel parsial disebut asosiasi kondisional, karena
mengacu pada efek X on Y conditional pada penetapan Z pada tingkat tertentu.
Asosiasi kondisional dalam tabel parsial bisa sangat berbeda dari asosiasi dalam
tabel marginal, seperti contoh berikut.

2.7.2 Asosiasi Marjinal Bersyarat Versus: Contoh Penalti Kematian

Tabel 2.10 adalah tabel kontingensi 2 2 2 - dua baris, dua kolom, dan dua
lapisan

Dari sebuah artikel yang mempelajari efek karakteristik rasial apakah subjek

dihukum karena pembunuhan mendapat hukuman mati. 674 subjek adalah


terdakwa dalam dakwaan yang melibatkan kasus dengan banyak pembunuhan, di
Florida antara tahun 1976 dan 1987. Variabelnya adalah Y = vonis hukuman mati,
memiliki kategori (ya, tidak), dan X= ras terdakwa dan Z = ras korban, masing-
masing memiliki kategori (putih, hitam). Kami mempelajari pengaruh ras terdakwa
atas keputusan hukuman mati, memperlakukan balapan korban sebagai variabel
kontrol. Tabel 2.10 memiliki tabel parsial 2x2 yang berkaitan dengan ras terdakwa
dan putusan hukuman mati di setiap tingkat balapan korban.
Untuk setiap kombinasi lomba terdakwa dan ras korban, Tabel 2.10
daftar dan Gambar 2.3 menampilkan persentase terdakwa yang menerima
hukuman mati.

Kami menggunakan ini untuk menggambarkan hubungan kondisional antara ras


terdakwa dan putusan hukuman mati, yang mengendalikan balapan korban.
Ketika korban berkulit putih, hukuman mati dijatuhkan 22,9 - 11,3% = 11,6% lebih
sering untuk terdakwa kulit hitam daripada terdakwa kulit putih. Ketika korban
berkulit hitam, hukuman mati dikenakan 2,8 - 0,0% = 2,8% lebih sering untuk
terdakwa hitam daripada terdakwa kulit putih. Dengan demikian, mengendalikan
balapan korban dengan tetap dijaga, persentase putusan hukuman mati "ya" lebih
tinggi untuk terdakwa kulit hitam daripada terdakwa kulit putih.

Bagian bawah Tabel 2.10 menampilkan tabel marginal untuk lomba


terdakwa dan vonis hukuman mati. Kami memperolehnya dengan menjumlahkan
jumlah sel pada Tabel 2.10 di atas dua tingkat balapan korban, sehingga
menggabungkan dua tabel parsial (mis., 11 + 4 = 15). Kami melihat secara
keseluruhan, 11,0% terdakwa kulit putih dan 7,9% terdakwa kulit hitam menerima
hukuman mati. Mengabaikan balapan korban, persentase hukuman mati "ya"
lebih rendah untuk terdakwa kulit hitam daripada terdakwa kulit putih. Asosiasi
membalikkan arah dibandingkan dengan tabel parsial.
2.7.3 Paradoks Simpson

Hasilnya bahwa asosiasi marjinal dapat memiliki arah yang berbeda


dari asosiasi kondisional yang disebut paradoks Simpson. Hasil ini berlaku untuk
variabel kuantitatif maupun kategoris.

Dalam contoh hukuman mati, mengapa hubungan antara vonis


hukuman mati dan ras terdakwa sangat berbeda saat kita mengabaikan vs
balapan korban kontrol? Hal ini berkaitan dengan sifat hubungan antara variabel
kontrol, ras korban, dan variabel lainnya. Pertama, hubungan antara ras korban
dan ras terdakwa sangat kuat. Tabel marginal yang menghubungkan variabel-
variabel ini memiliki rasio (467 143) / (48 16) = 87,0.
Kemungkinan terdakwa kulit putih memiliki korban kulit putih diperkirakan 87,0
kali kemungkinan terdakwa hitam memiliki korban kulit putih. Kedua, Tabel 2.10
menunjukkan bahwa, terlepas dari ras terdakwa, hukuman mati jauh lebih
mungkin terjadi saat korban berkulit putih daripada saat korban berkulit hitam.
Jadi, orang kulit putih cenderung membunuh orang kulit putih, dan membunuh
orang kulit putih lebih cenderung menghasilkan hukuman mati. Ini menunjukkan
bahwa asosiasi marjinal harus menunjukkan kecenderungan yang lebih besar bagi
terdakwa kulit putih untuk menerima hukuman mati daripada asosiasi kondisional.
Sebenarnya, Tabel 2.10 menunjukkan pola ini.

Gambar 2.4 dapat menjelaskan mengapa paradoks Simpson terjadi.


Untuk setiap ras terdakwa, angka tersebut menggambarkan proporsi hukuman
mati di setiap tingkat balapan korban. Setiap proporsi diberi label dengan simbol
huruf yang memberi tingkat ras korban. Sekitar pengamatan masing-masing
adalah lingkaran yang memiliki luas sebanding dengan jumlah pengamatan pada
kombinasi ras terdakwa dan ras korban. Misalnya, W dalam lingkaran terbesar
mewakili proporsi 0,113 yang menerima hukuman mati untuk kasus dengan
terdakwa kulit putih dan korban kulit putih. Lingkaran itu terbesar, karena jumlah
kasus pada kombinasi tersebut (53 + 414 = 467) lebih besar daripada tiga
kombinasi lainnya. Lingkaran terbesar berikutnya berkaitan dengan kasus di mana
orang kulit hitam membunuh orang kulit hitam.

Untuk mengendalikan balapan korban, kami membandingkan


lingkaran yang memiliki surat ras korban yang sama di pusatnya. Garis yang
menghubungkan dua lingkaran W memiliki kemiringan positif, sama seperti garis
yang menghubungkan dua lingkaran B. Mengontrol balapan korban, ini
mencerminkan
kesempatan yang lebih tinggi untuk hukuman mati bagi terdakwa kulit hitam
daripada terdakwa kulit putih. Ketika kita menambahkan hasil pada balapan
korban untuk mendapatkan hasil rangkuman untuk efek marjinal ras terdakwa
pada putusan hukuman mati, lingkaran yang lebih besar memiliki jumlah kasus
lebih banyak memiliki pengaruh lebih besar. Jadi, rangkuman proporsi untuk
setiap ras terdakwa, yang ditandai pada angka berdasarkan periode, jatuh lebih
dekat ke pusat lingkaran yang lebih besar daripada lingkaran yang lebih kecil.
Garis yang menghubungkan ringkasan proporsi marginal memiliki kemiringan
negatif. Hal ini menunjukkan bahwa terdakwa kulit putih lebih mungkin daripada
terdakwa kulit hitam untuk menerima hukuman mati.

2.7.4 Kondisi dan MajinalOdds Rasio


Asosiasi kondisional, seperti asosiasi marjinal, dapat digambarkan
dengan menggunakan rasio odds. Kami mengacu pada rasio odds untuk tabel
parsial sebagai rasio peluang bersyarat. Untuk biner X dan Y, dalam level k k yang
stabil, biarkan XY (k) menunjukkan rasio odds antara X dan
dihitung untuk probabilitas sebenarnya.

Pertimbangkan hubungan kondisional antara ras terdakwa dan


hukuman mati. Dari Tabel 2.10, perkiraan rasio odds pada tabel parsial pertama,
dimana balita korban berkulit putih, sama dengan
53 37
= = 0,43
414 11

Kemungkinan sampel untuk terdakwa kulit putih yang menerima


hukuman mati adalah 43% dari kemungkinan sampel untuk terdakwa kulit hitam.
Di meja parsial kedua, untuk mana balapan korban
(2) = (0 139) / (16 4) = 0. 0, karena hukuman mati tidak pernah
diberikan kepada terdakwa kulit putih yang memiliki korban hitam.

Rasio odds bersyarat dapat sangat berbeda dari rasio odds marjinal,
dimana variabel ketiga diabaikan daripada dikontrol. Rasio odds marjinal untuk
ras terdakwa dan hukuman mati menggunakan tabel marginal 2 2 pada Tabel
2.10, runtuh di atas balapan korban. Perkiraan sama dengan (53 176) / (430
15) = 1,45. Contoh kemungkinan hukuman mati adalah 45% lebih tinggi untuk
terdakwa kulit putih daripada terdakwa kulit hitam. Namun, kami hanya
mengamati bahwa kemungkinan tersebut lebih kecil untuk terdakwa kulit putih
daripada terdakwa kulit hitam, di dalam setiap tingkat balapan korban.
Pembalikan dalam asosiasi saat kita mengendalikan balapan korban
menggambarkan paradoks Simpson.

2.7.5 Kemandirian Bersyarat Versus Kemunduran Marjinal

Jika X dan Y independen dalam setiap tabel parsial, maka X dan Y


dikatakan independen, diberikan Z. Semua rasio odds bersyarat antara X dan Y
kemudian sama dengan 1. Independensi bersyarat X dan Y, mengingat Z, tidak
tidak menyiratkan independensi marjinal X dan Y. Artinya, bila rasio odds antara X
dan Y sama dengan 1 pada setiap tingkat Z, rasio odds marjinal mungkin berbeda
dari 1.

Dengan adanya klinik, respon dan pengobatan kondisional independen.


Meja marginal menambahkan tabel untuk kedua klinik tersebut. Rasio odds untuk
itu
Tabel marginal sama dengan (20 40) / (20 20) = 2.0, jadi variabelnya
tidak sedikit independen.

Mengapa peluang sukses dua kali lebih tinggi untuk pengobatan A


sebagai pengobatan B, kapan kita mengabaikan klinik? Rasio XZ dan Y Z bersyarat
memberi petunjuk. Rasio odds antara Z dan X atau Y, pada masing-masing tingkat
tetap dari variabel lainnya, sama dengan 6,0. Misalnya, rasio odds XZ pada tingkat
pertama Y sama (18 8) / (12 2) = 6.0. Kemungkinan bersyarat
untuk menerima pengobatan A enam kali lebih tinggi di klinik 1 daripada di klinik 2,
dan kemungkinan keberhasilan bersyarat enam kali lebih tinggi di klinik 1 daripada
di klinik 2. Klinik 1 cenderung menggunakan pengobatan A lebih sering, dan klinik
1 juga cenderung memiliki lebih banyak kesuksesan. Misalnya, jika subjek yang
menghadiri klinik cenderung lebih sehat atau cenderung lebih muda daripada
mereka yang pergi ke klinik 2, mungkin mereka memiliki tingkat keberhasilan yang
lebih baik daripada subjek di klinik 2 terlepas dari perlakuan yang diterima.
Hal ini menyesatkan untuk hanya mempelajari tabel marginal, menyimpulkan
bahwa keberhasilan lebih mungkin terjadi dengan pengobatan A dibandingkan
dengan pengobatan B. Subjek di dalam klinik tertentu cenderung lebih homogen
daripada keseluruhan sampel, dan responsnya tidak tergantung pada pengobatan
di setiap klinik.
Misalkan K menunjukkan jumlah kategori untuk Z. Bila X dan Y adalah biner, ada
asosiasi XY homogen saat

XY (1) = XY (2) = = XY (K )

Independensi bersyarat X dan Y adalah kasus khusus di mana masing-masing rasio


kemungkinan bersyarat sama dengan 1,0.

Tabel , asosiasi XY homogen berarti bahwa setiap rasio


odds bersyarat yang terbentuk menggunakan dua tingkat X dan dua tingkat Y
sama pada setiap tingkat Z. Bila ada asosiasi XY homogen, ada juga homogen XZ
asosiasi dan asosiasi YZ yang homogen. Asosiasi homogen adalah properti simetris,
berlaku untuk sepasang variabel yang dilihat di tingkat ketiga. Ketika terjadi,
dikatakan tidak ada interaksi antara dua variabel dalam pengaruhnya terhadap
variabel ketiga.

Bila tidak ada asosiasi homogen, rasio odds kondisional untuk setiap
pasangan variabel berubah di tingkat variabel ketiga. Untuk X = merokok (ya,
tidak),X= kanker paru-paru (ya, tidak), dan Z = usia (< 45, 45 65, > 65),
misalkan (1) = 1,2, (2) = 2,8, (3) = 6.2. Kemudian,
merokok memiliki efek lemah pada kanker paru-paru bagi kaum muda, namun
efeknya sangat meningkat seiring bertambahnya usia.