Anda di halaman 1dari 8

Exact McNemar’s Test and Matching Confidence

Intervals
Michael P. Fay

April 25, 20161

McNemar’s Original Test

Pertimbangkan data respons biner berpasangan. Sebagai contoh, misalkan Anda memiliki anak
kembar secara acak untuk dua kelompok perlakuan (Test and Control) kemudian diuji pada hasil
biner (lulus atau gagal). Ada 4 kemungkinan hasil untuk masing-masing pasangan: (a) kedua
kembar gagal, (b) kembar pada kelompok kontrol gagal dan yang di kelompok uji lolos, (c) kembar
pada kelompok uji gagal dan yang di kelompok kontrol lolos, atau (d) kedua kembar melewatinya.
Berikut adalah tabel dimana jumlah set kembar yang jatuh di masing-masing dari empat kategori
dilambangkan a, b, c dan d:

Test
Control Fail Pass
Fail a b
Pass c d

Untuk menguji apakah perawatannya bermanfaat, kita hanya menggunakan jumlah pasangan
sumbang kembar, b dan c, karena pasangan kembar lainnya tidak memberi tahu kita tentang apakah
pengobatan itu bermanfaat atau tidak. Ujian McNemar adalah
Q ≡ Q(b, c) = (b −c)2
b+c

yang untuk sampel besar didistribusikan seperti distribusi chi-kuadrat dengan 1 derajat kebebasan.
2
Pendekatan yang lebih dekat dengan chi-squared distributin menggunakan koreksi kontinuitas:
QC ≡ QC (b, c) (|b −c|−1)
= b+c

1
Pada R tes ini diberikan oleh fungsi 'mcnemar.test'.
Data kasus-kontrol dapat dianalisis dengan cara ini juga. Misalkan Anda memiliki seperangkat
orang dengan beberapa penyakit langka (mis., Jenis kanker tertentu); ini disebut kasus. Untuk
desain ini, Anda mencocokkan setiap kasus dengan contol yang serupa dengan layak pada semua
kovariat penting kecuali pemaparan yang menarik. Berikut adalah tabel2:

Control
Case Exposed Not Exposed
Exposed a b
Not Exposed c d

Untuk kasus ini juga kita bisa menggunakan Q atau QC untuk menguji tidak ada hubungan antara kasus / status kontrol dan
status pemaparan.
Untuk kedua desain, kita dapat memperkirakan rasio odds dengan b / c, yang merupakan perkiraan likelihood maksimum
(lihat Breslow and Day, 1980, hal 165).
Pertimbangkan beberapa data hipotetis (dipilih untuk menyoroti beberapa poin):
Test
Control Fail Pass
Fail 21 9
Pass 2 12

Saat kita melakukan tes McNemar dengan koreksi kontinuitas yang kita dapatkan
> x<-matrix(c(21,9,2,12),2,2)
> mcnemar.test(x)
McNemar✬s Chi-squared test with continuity correction data: x

McNemar✬s chi-squared = 3.2727, df = 1, p-value = 0.07044

Tanpa koreksi kontinuitas yang kita dapatkan

> mcnemar.test(x,correct=FALSE)
McNemar✬s Chi-squared test
data: x
2
McNemar✬s chi-squared = 4.4545, df = 1, p-value = 0.03481

Karena kesimpulan sangat banyak, dan berada di kedua sisi signifikansi signifikansi 0,05, akan
bagus jika memiliki versi pengujian yang tepat agar lebih jelas tentang signifikansi pada tingkat
0,05. Kami mempelajari hal itu di bagian selanjutnya.

Exact Version of McNemar’s Test

Setelah pengkondisian pada jumlah total pasangan sumbang, b + c, kita dapat memperlakukan
masalahnya sebagai B ~ Binomial (b + c, θ), di mana B adalah variabel acak yang terkait dengan b.
Rasio odds
dari model tanpa syarat sama dengan peluang yang terkait dengan θ dari model kondisional,
θ
Odds Ratio ≡ φ = (1)
1 −θ

(Breslow dan Day, 1980, hal 166). Lihat Lampiran A untuk penjelasan lengkap tentang persamaan
1. Di bawah hipotesis nol θ = .5. Karena mudah untuk melakukan tes yang tepat pada parameter
binomial,

kita dapat melakukan versi yang tepat dari pengujian McNemar dengan menggunakan fungsi
'binom.exact' dari paket 'exactci' lalu mengubah hasilnya menjadi rasio odds melalui persamaan 1.
Inilah bagaimana perhitungan dilakukan pada fungsi 'exact2x2' saat dipasangkan = BENAR.
Pilihan 'alternatif' dan 'tsmethod' bekerja sesuai dengan yang kita harapkan. Jadi, walaupun uji
McNemar dikembangkan sebagai tes dua sisi, kita dapat dengan mudah mendapatkan Tes
McNemar tipe satu sisi. Untuk tes dua sisi kita bisa mendapatkan tiga versi berbeda dari tes
McNemar dua sisi persis menggunakan tiga opsi 'tsmethod'. Pada Lampiran B kami menunjukkan
bahwa ketiga metode dua sisi tersebut memberikan nilai p yang sama dan semuanya setara dengan
versi pastinya dari uji McNemar. Jadi hanya ada satu tes McNemar yang pasti. Perbedaan antara
opsi 'tsmethod' adalah dalam perhitungan interval kepercayaan. Defaultnya adalah menggunakan
kepercayaan 'sentral'
3
interval sehingga probabilitas bahwa parameter sebenarnya kurang dari yang di bawah 100 (1 -
α)%
interval kepercayaan dijamin kurang dari atau sama dengan α / 2, dan sama dengan yang di atas
interval kepercayaan Jaminan ini pada setiap ekor tidak benar untuk 'minlike' dan 'blaker'
interval kepercayaan dua sisi.
Dengan menggunakan x yang didefinisikan sebelumnya, berikut adalah tes McNemar yang tepat
dengan interval kepercayaan utama:

> mcnemar.exact(x)

Exact McNemar test (with central confidence intervals)

data: x
b = 2, c = 9, p-value = 0.06543
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.02336464 1.07363844
sample estimates:
odds ratio
0.2222222

Lampiran A: Hubungan Odds untuk Data Bersyarat dan Rasio Odds untuk Data
Tanpa Syarat

Biarkan Yij menjadi respon biner ke-j dari pasangan ith. Sebagai contoh, Yi1 bisa menjadi respon
biner dari kembar yang diacak ke kelompok kontrol dalam rangkaian kembar, dan Yi2 bisa menjadi
respon biner dari kembar yang diacak kelompok uji di rangkaian kembar satu. Misalkan πij = P r
[Yij = 1]. Kemudian rasio odds (yaitu rasio odds (uji) / odds (kontrol)) untuk himpunan kembar
πi2 / (1 - πi2)

4
Dimana saya [j = 2] = 1 ketika j = 2 dan 0 ketika j = 1, μi adalah efek kembar acak, dan exp (β)
adalah efek dari pengujian dibandingkan dengan kontrol pada log odds. Di bawah model ini,
φi ≡ φ = exp (β). Dengan kata lain, rasio odds tidak berubah dari set kembar menjadi set kembar.
Sekarang pertimbangkan pengkondisian pada Yi1 + Yi2 = 1, sehingga kita hanya
mempertimbangkan pasangan dengan satu
respon positif Kemudian probabilitas bahwa anggota uji melewati model di atas
pengkondisian yang salah satu anggota dari twin set lewat adalah
θi = P r[Yi2 = 1|Yi1 + Yi2 = 1, µi , β]
Pr[Yi2 = 1 and Yi1 = 0|µi ,β]
=
P r[(Yi2 = 1 and Yi1 = 0) or (Yi2 = 0 and Yi1 = 1) |µi , β]
πi2 (1 −πi1 )
=
π (1 − πi1 ) + πi1 (1 −
. i2
πi2 )

Maka kemungkinan bahwa anggota uji di himpunan i melewati, pengkondisian hanya pada satu
anggota yang lewat, adalah
θi πi2 (1 −πi1 )
= = φ.
1 − θi πi1 (1 − πi2 )

Dengan aljabar, kita dapat menulis ulang probabilitas bersyarat untuk himpunan I, θi, dalam hal
probabilitas bersyarat sebagai
φ
θi = .
1+φ
Jadi, saya tidak bergantung pada saya dan kita menulis θi ≡ θ.
Jika kita mengambil n = b + c dari pasangan kondisional ini, maka B = Pi: Yi1 + Yi2 = 1 Yi2
adalah binomial
dengan parameter n dan θ, di mana θ = P r [Yi2 = 1 | Yi1 + Yi2 = 1] adalah probabilitas dari
postive

5
respon pada anggota tes satu set dengan hanya satu respon positif. Kemudian jika kita mengubah
probabilitas itu menjadi peluang kita mendapatkan θ / (1 - θ) = φ. Dengan kata lain, kemungkinan
kondisional
Variabel acak sama dengan rasio odds interest berdasarkan full unconditional model.

Lampiran B: Ekuivalensi nilai p dua sisi

Untuk pengujian dua sisi yang tepat, ruang sampel adalah B ∈ {0, 1,. . . , b + c}. Misalkan n = b +
c dan misalkan fungsi massa binomial di bawah hipotesis nol dari θ = .5 (yaitu, φ = 1) menjadi

! !
n 1 x 1 n−x n
n
f (x) =
x 2 2 = 2− .
x

6
Nilai p value McNemar yang tepat didefinisikan sebagai
X
pe =
x:Q(x,n−x)≥Q(b,c)
f (x)
Berikut adalah definisi nilai p yang tepat untuk tiga metode dua sisi. Untuk
Metode 'sentral', memang begitu
n
pc = min 1, 2 ∗ min F (x), F̄ (x)

7
Daftar pustaka

Breslow, N.E. and Day, N.E. (1980). Statistical Methods in Cancer Research: Volume 1:
Analysis of Case Control Studies International Agency for Research in Cancer: Lyon,
France.

McNemar, Q. (1947). “Note on the sampling error of the difference between correlated
proportions or percentages” Psychometrika 12:153-157.