Kami tidak menganggap uji coba cross-over secara rinci tetapi analisis
dari
percobaan sederhana semacam ini digambarkan oleh Koch (1972) dan
rekening yang
lebih umum dari desain tersebut diberikan oleh Senn (1992). Selain itu,
jenis studi ini
hanya dapat dilakukan dengan kondisi kronis di mana pengobatan pertama
yang
diterima tidak mungkin menyebabkan pemulihan lengkap atau kematian.
gingivitis
ulseratif adalah suatu kondisi seperti (asma dan eksim yang lain) di mana
banyak
pasien, peningkatan di bawah pengobatan cepat tetapi kondisi memburuk
setelah
pengobatan ditarik. Penilaian ulserasi oleh seorang dokter gigi ini sangat
subjektif,
namun, seperti penilaian pasien nyeri. Untuk memungkinkan untuk ini buta
ganda Prosedur
harus digunakan di mana baik pasien maupun dokter gigi membuat
penilaian tahu urutan presentasi (yang harus random). Obat kumur
dapat dibuat untuk memiliki penampilan yang identik dan rasa.
Solusi yang diidentifikasi oleh kode yang tersedia hanya untuk
pekerja riset atau administrator yang tidak memiliki kontak
langsung dengan pasien (jika tablet yang digunakan mereka harus
dengan ukuran yang sama, warna dan rasa). Ganda membutakan
juga dapat digunakan untuk memungkinkan efek plasebo yang
merupakan respon psikologis yang ditunjukkan oleh beberapa
pasien dengan pengetahuan bahwa pengobatan yang diterima
meskipun solusi atau tablet (dikenal sebagai plasebo) tidak
mengandung bahan aktif. aspek-aspek studi harus hati-hati
dijelaskan dalam lembar informasi pasien jika berlaku. masalah
etika mungkin menghalangi penggunaan pasien yang sama untuk
membandingkan dua perlakuan. Misalnya, dalam perbandingan dua
metode untuk mengobati kanker mulut, yang keduanya melibatkan
radiasi, diperkirakan dosis radiasi dari perawatan gabungan dapat
dianggap sangat tinggi bagi pasien.
Jika diinginkan untuk alasan etis atau praktis untuk memberikan pasien
kedua perawatan, kita mungkin menggunakan pasangan individu dipilih
sehingga para anggota masing-masing pasangan adalah sebagai seperti
mungkin dalam semua karakteristik yang relevan. Proses ini dikenal sebagai
pencocokan. Sebagai contoh, seorang wanita berusia 30 tahun mungkin
dicocokkan dengan seorang wanita berusia sama dari kelompok etnis yang
sama, masing-masing menunjukkan bersangkutan yang sama
individu diberikan dalam Tabel 4.1. Meja ini menunjukkan lebih cepat
waktu respon di RVF untuk semua tapi subjek 10. Tidak ada
perbedaan melebihi 33ms, sedangkan di baik bidang perbedaan
antara beberapa individu melebihi 100ms. Sebagai contoh, adalah
580-467 = 113 antara subjek 9 dan 12 di LVF. Tanpa pasangan yang
cocok perbedaan-perbedaan ini mungkin rawa perbedaan kecil tapi
relatif konsisten antara bidang bagi individu. Kami menjelajahi lebih
lanjut dalam Latihan 5.11 .
AKU AKU AKU. Menggunakan double blind menandai (metode yang disukai
oleh beberapa lembaga) satu dapat membandingkan konsistensi antara dua
pemeriksa. Dua pemeriksa menandai seri yang sama esai tanpa mengungkapkan
penilaian mereka satu sama lain. Perbedaan antara tanda diberikan oleh masing-
masing penguji untuk setiap esai kemudian dibandingkan untuk melihat apakah
salah satu pemeriksa konsisten penghargaan tanda yang lebih tinggi, atau
apakah perbedaan memiliki beberapa pola yang lain atau apakah mereka tampak
murni acak.
contoh 4.1
Masalah. Menggunakan LVF, data yang RVF di tabel 4.1 , Menilai kekuatan
bukti perbedaan respon yang konsisten antara dua bidang bagi
individu. Mendapatkan 95 interval kepercayaan persen untuk
perbedaan itu.
Formulasi dan asumsi. Kami menunjukkan pengamatan pada subjek saya di RVF oleh
x saya dan bahwa dalam LVF oleh y saya dan menganalisis perbedaan d i= y saya -x saya, i = 1,
2,. . . . n. Itu d saya independen karena masing-masing mengacu pada individu yang
berbeda. Dibawah H 0: median dari perbedaan adalah nol itu d saya sama-sama cenderung
positif atau negatif dan uji tanda dibenarkan.
Jika kita mengasumsikan distribusi simetris dari d saya dibawah H 0 kita dapat
menggunakan Wilcoxon signed-rank (atau nilai normal) tes. Ada beberapa pola
respon yang berbeda di dua bidang visual yang dapat mengakibatkan distribusi
simetris perbedaan di bawah H 0. Secara khusus, jika kita menganggap waktu
respon yang identik dan independen (tetapi tidak harus simetris) didistribusikan
dalam dua kolom untuk setiap individu (tapi distribusi ini tidak perlu sama untuk
setiap individu) perbedaan untuk setiap individu akan simetris tentang nol
( karena jika X dan Y memiliki distribusi independen yang sama, maka X
- Y dan Y - X masing-masing akan memiliki distribusi yang sama dan karena itu
harus didistribusikan secara simetris tentang nol). Kami juga mendapatkan
distribusi simetris perbedaan jika LVF dan RVF untuk setiap individu memiliki
distribusi simetris yang berbeda memberikan masing-masing memiliki mean yang
sama. Hal ini juga untuk menyadari seluk-beluk seperti itu, tapi tes Wilcoxon jelas
dibenarkan ketika kita menganggap distribusi identik untuk LVF dan RVF untuk
setiap individu di bawah hipotesis null; hipotesis alternatif yang menarik biasanya
bahwa ada pergeseran sentralitas saja, seperti yang ditunjukkan oleh pergeseran
dalam satu bidang atau yang lain di median dari distribusi dinyatakan identik.
seringkali d saya nilai sendiri menunjukkan apakah ada asimetri serius yang
menunjukkan kondisi ini mungkin tidak berlaku.
Prosedur. Kami bekerja dengan sampel tunggal yang terdiri dari perbedaan d saya
dan prosedur penggunaan dikembangkan di Bab 2 , Rincian sehingga kita hanya sketsa.
Yang menunjukkan parameter sentralitas atau ukuran efek pengobatan (dengan asumsi ini
menjadi hanya 'sentralitas' atau shift 'lokasi') oleh θ, hipotesis nol H 0: θ = 0, sehingga
penyimpangan menandatangani memerintahkan hanya perbedaan memerintahkan diperoleh
dari
tabl e 4.1 yaitu:
-12345.55.578.58.5101112
Menggunakan uji tanda untuk nol perbedaan median kita memiliki 1 dikurangi dan 11
tanda-tanda plus. Sesuai tabel atau perangkat lunak segera memberikan P = 0,0063,
memberikan bukti yang sangat kuat bahwa respon berbeda antara bidang. Nominal
95 per interval kepercayaan persen berdasarkan uji tanda (7, 22) karena kita
menolak H 0 pada nominal P = tingkat 0,05 hanya untuk 2 atau lebih sedikit atau 10
atau lebih tanda-tanda dikurangi. Untuk uji Wilcoxon S -= 1, sesuai dengan dua ekor
P < 0,001. Memang, Anda hanya perlu kalkulator saku untuk menunjukkan bahwa P
≈ 0,00098 dalam contoh ini! Untuk interval kepercayaan dengan cakupan minimal 95
meja persen menunjukkan kita membutuhkan 14 terbesar dan paling Walsh rata-
rata. rata-rata ini dapat diperoleh dengan menggunakan Minitab, yang lain StatXact
dapat digunakan untuk menemukan interval. Banyak paket perangkat lunak lain
termasuk program memberikan setidaknya perkiraan asimtotik. interval ternyata
(9,5, 23,5). The Hodges-Lehmann titik estimator dari median (yaitu median dari rata-
rata Walsh) adalah 17,25.
Jika kita asumsikan normalitas, dua ekor t tes memberikan P < 0,001 dan 95 persen
confidence interval (10.1, 22.9) berpusat sekitar mean 16,5. Teori yang normal
memberikan interval kepercayaan terpendek dan fakta bahwa interval hanya
sedikit pengungsi untuk uji tanda menyiratkan simetri yang wajar. Lilliefors' uji
statistik,
0,152, yang jauh di bawah nilai yang diperlukan untuk signifikansi dan untuk itu uji
StatXact memberikan perkiraan Monte Carlo untuk tepat P = 0,617. Untuk Shapiro-
Wilk tes StatXact memberi P = 0,685, sehingga tidak ada bukti nonnormality.
Kesimpulan. tanda, Wilcoxon dan t tes semua titik untuk bukti kuat terhadap
hipotesis nol dan kami menyimpulkan bahwa waktu respon di RVF yang lebih
cepat. Konsistensi interval kepercayaan yang diberikan oleh pendekatan tersebut
menunjukkan perbedaan rata-rata adalah antara 10 dan 22 ms.
contoh 4.2
Prosedur. Kami menganggap penyimpangan dari 10 untuk perbedaan tanda di baris terakhir dari
Tabel 4.2.
penyimpangan tersebut adalah:
-2-44-50-8-191-6-5
Perbedaan diatur dalam urutan besarnya dengan tanda-tanda
yang tepat adalah
0-11-2-44-5-5-6-89
Menggunakan aturan yang diberikan dalam bagian 2.2.3 untuk mid-barisan dengan ikatan
bersama-sama dengan konvensi yang disebutkan di akhir yang bagian untuk menggantikan
peringkat 1 terkait dengan perbedaan nol 0, kita mendapatkan ditandatangani jajaran:
0 -2,5 2,5 -4 -5,5 5,5 -7,5 -7,5 -9 -10 11 statistik kami adalah jumlah dari jajaran
positif S + = 0 + 2,5 + 5,5 + 11 = 19. Untuk tes permutasi tepat StatXact
memberikan Pr ( S + ≤ 19,0) = 0,124. Dua kali lipat nilai ini untuk uji dua ekor
kami segera melihat tidak ada bukti yang kuat terhadap
H 0, sejak P = 0,248.
tes pertama 45 61 33 29 21 47 53 32 37 25
81
tes kedua 53 67 47 34 31 49 62 51 48 29
86
Kedua - Pertama 8 6 14 5 10 2 91911 4 5
Kesimpulan. Tidak ada bukti kuat terhadap hipotesis bahwa peningkatan rata-rata
mungkin
10.
Komentar. 1. Bagaimana seseorang memutuskan apakah dua tes aritmatika sama-sama
sulit? tidak mungkin tanda membaik pada tes kedua menyiratkan itu mudah?
statistik harus mencari jaminan dari pendidik melakukan tes yang tindakan
pencegahan telah diambil untuk memastikan kesulitan yang sama. tes kadang-
kadang standar yang telah mencoba pada kelompok besar siswa dengan hasil
yang menunjukkan secara meyakinkan bahwa mereka adalah untuk semua
tujuan praktis kesulitan yang sama, digunakan dalam situasi seperti itu.
3. Ini mungkin tidak realistis untuk menguji hanya untuk pergeseran sentralitas. Terkadang
contoh 4.3
Masalah. Data di bawah ini adalah perbedaan tekanan darah sistolik setelah
latihan - tekanan darah sistolik sebelum latihan diukur dalam mm Hg untuk
sampel acak dari 24 dari kelompok 77 siswa. Mendapatkan 95 per batas
kepercayaan persen untuk perbedaan penduduk berdasarkan (i) uji tanda, (ii)
Wilcoxon signed-rank test dan (iii) t tes, dan komentar pada riateness approp-
masing-masing. Untuk kenyamanan kami telah mengatur perbedaan dalam
urutan yang meningkat.
--
5025101515151
8202020202230
3034404040414
7 80 85
Formulasi dan asumsi. Kami menggunakan metode standar yang
dikembangkan pada Bab 2 dan dalam bab ini.
Prosedur. Kami menghilangkan rincian komputasi (lihat Latihan 4.16 ) Sejak contoh
perhitungan serupa telah diberikan. Interval dikutip di bawah ini
diperoleh dengan menggunakan software statistik yang relevan.
contoh 4.4
pendakian
pertama Digantikan Gagal
kedua pendakian berhasil 73 14
Gagal 9 12
________________________________________________
'plus' memiliki B ( n, 2) distribusi mana n adalah jumlah total plus dan minus tanda-tanda.
Prosedur. Ada 9 tanda-tanda plus dan 14 dikurangi sehingga n = 23. StatXact memberikan
tes yang tepat P = 0,4049. Atau, menggunakan pendekatan normal untuk distribusi binomial
kita menemukan, menggunakan ( 2.2 ), Yang Z = ( 9,5-11,5) / √ ( 23/4) = - 0,83 memberikan
dua ekor P = 0,4065, sehingga tidak ada bukti bahwa salah satu pendakian lebih mudah.
pada kesulitan relatif tanjakan ini mungkin tampak data yang terbuang, tapi
'terbuang' data seperti memberikan indikasi seberapa besar atau kecil perbedaan
mungkin. Dalam beberapa situasi kita perlu banyak observasi karena kami sedang
mencari perbedaan kecil yang mungkin tidak jelas dibedakan ketika satu-satunya
kriteria yang relevan adalah keberhasilan / kegagalan atau kategori kegagalan /
keberhasilan. Dalam konteks data ini ada kemungkinan bahwa sebagian besar dari
mereka yang gagal di kedua kurang berpengalaman atau kurang antusias dari
mereka yang mencapai satu keberhasilan dan juga bahwa mereka yang berhasil di
kedua adalah lebih berpengalaman atau lebih antusias.
aspek komputasi. StatXact dan juga banyak paket umum termasuk program
untuk tes sederhana ini yang dapat digunakan untuk mendapatkan yang
relevan P Nilai untuk uji tanda.
contoh 4.5 untuk 4.7 mencakup tiga situasi di mana kita menggunakan uji tanda
untuk median θ form H 0: θ=θ 0 melawan H 1: θ>θ 0 di mana alternatif yang
spesifik H 1: θ=θ 0+ 1 mencerminkan keberangkatan minimal dari
H 0 kepentingan, yaitu hanya pergeseran positif dalam median
dari setidaknya satu unit penting praktis. Tanpa kehilangan umum
(lihat, misalnya
contoh 4.2 ) Kita set θ 0 = 0. Kami membatasi perhatian pada uji
satu-ekor, tapi modifikasi untuk uji dua-ekor mudah jika
menggunakan prinsip penggandaan satu-ekor P Nilai untuk
setara dua ekor. Jika kita menghitung kekuatan tes untuk
alternatif H 1: θ = 1 maka jika pergeseran benar melebihi satu
unit daya akan secara umum lebih besar. Dari contoh-contoh ini
akan muncul bahwa untuk tiga distribusi populasi yang berbeda
semua memiliki varians yang sama kekuatan dari tes setara
berbeda untuk masing-masing, membenarkan pernyataan di
atas kekuatan yang tidak properti distribusi bebas. Ini harus
menyebabkan tidak mengherankan dalam terang hasil yang
terkenal bahwa efisiensi Pitman tes tergantung pada distribusi
penduduk yang mendasari.
contoh 4.5
Masalah. Untuk sampel dari 10 dari distribusi normal dengan mean diketahui
θ dan standar deviasi 2 apa adalah kekuatan uji tanda untuk H 0: θ = 0 terhadap
H 1: θ = 1 ketika probabilitas dari kesalahan tipe I adalah α = 0.05? Berapa
ukuran sampel akan memastikan tes dengan kekuatan 0,9?
Formulasi dan asumsi. Dibawah H 0 jumlah nilai sampel positif (plus) memiliki B (10, 2)
distribusi. Jika
1
jumlah tanda plus adalah uji statistik kemudian di bawah H 1 ini masih akan
memiliki distribusi binomial, tetapi nilai p sekarang diberikan oleh Pr ( X> 0) = p 1,
mengatakan, di mana X memiliki N (1, 4) distribusi.
Dengan demikian tes ini setara dengan pengujian H 0: p = 2 melawan H 1: p = p 1 dan sekali
p 1 dihitung studi 1
standar distribusi normal, mana p 1= Pr ( X > 0) = Pr ( Z> - 2) = 0,6915, nilai yang dapat
diperoleh dari tabel atau perangkat lunak yang sesuai. Kekuatan kemudian dapat
diperoleh dari tabel atau perangkat lunak dalam cara yang dijelaskan di contoh 3.3 , Di
mana di sini kita menguji H 0: p = 0,5 terhadap H 1: p = 0,6915. Menggunakan perangkat
lunak komputer adalah lebih baik, karena tidak mungkin bahwa tabel akan tersedia
untuk tepatnya nilai akhir p dan perkiraan seperti p = 0,7 maka mungkin harus
digunakan. Dengan nilai-nilai ini dari p, StatXact memberikan kekuatan sebagai 0,1365
untuk ukuran sampel 10. Namun, diskontinuitas yang berpengaruh di sini sebagai
terkecil yang mungkin ekor satu- tepat P nilai-nilai di bawah H 0 adalah P = 0,001, P =
0,011 dan P = 0,055. Telah kita diganti
Kesimpulan. Untuk sampel n = 10 daya hanya 0,1365 tapi kekuatan ini rendah di
bagian mencerminkan kesenjangan yang besar antara yang mungkin P nilai 0,011
dan
0,055. Untuk daya setidaknya 0,90 untuk uji satu-ekor ukuran sampel harus setidaknya
58.
Komentar. 1. Pitman efisiensi uji tanda relatif terhadap t tes untuk sampel
dari populasi normal adalah 0,64. Ini berarti bahwa untuk besar n efisiensi
relatif kurang dari dua pertiga, menunjukkan bahwa sampel pertiga tentang dua
ukuran harus memiliki kekuatan yang sama jika kita menerapkan t uji. Banyak
paket statistik memungkinkan perhitungan daya untuk t Tes bila optimal, dan
dalam hal ini ini menunjukkan bahwa untuk N ( θ, 4) distribusi ukuran sampel
yang diperlukan dengan kekuatan 0,90 dengan nilai-nilai yang dipilih kami θ di
H 0 dan H 1 aku s n = 36, secara luas sejalan dengan yang disarankan oleh
efisiensi Pitman.
2. dihitung kami p 1= 0,6915 didasarkan pada asumsi yang kuat bahwa kami
sampel adalah dari N ( θ, 4) distribusi. Kita jarang mengetahui varians
populasi tetapi tidak berarti dan jika kita memiliki informasi tersebut (atau
hanya bisa berasumsi normalitas dengan tidak diketahui varians) jelas salah
satu harus memilih normal inferensi berbasis teori itu menggunakan uji
tanda. Namun, hasil yang diperoleh di sini menerangi untuk perbandingan
dengan situasi tertutup contoh 4.6
dan 4.7 di mana populasi tidak normal lagi dengan varians dari 4 diasumsikan.
contoh 4.6
diperlukan untuk memastikan kekuatan minimal 0,90. Minitab dalam hal ini memberikan n
= 30. Finer tala menggunakan hasil yang tepat menegaskan minimum yang diperlukan
ukuran sampel ini sesuai dengan sebuah tepat P = 0,0494 dan memberikan daya yang
tepat 0,9023.
Komentar. 1. Ukuran sampel 30 adalah sekitar setengah ukuran (58) yang dibutuhkan
untuk kekuatan yang sama ketika menggunakan uji tanda dengan distribusi
normal dengan varians yang sama. Hal ini sejalan dengan efisiensi Pitman dari
uji tanda relatif terhadap t Tes yang 2 ketika sampling dari distribusi ganda
eksponensial. Kita harus ingat, bagaimanapun, bahwa t tes itu sendiri memiliki
efisiensi yang lebih rendah untuk sampel dari distribusi ganda-eksponensial
daripada memiliki untuk distribusi normal dengan mean dan varians yang sama.
Contoh 4.7.
Formulasi dan asumsi. Distribusi ditentukan oleh (4,2) adalah condong dengan ekor
panjang yang
tepat. Seperti pada contoh sebelumnya di bawah H 0 jumlah nilai sampel positif (plus)
memiliki B (10, 2) distribusi.
1
Menggunakan jumlah tanda plus sebagai uji statistik di tribusi binomial di bawah
s
ini juga memiliki H 1 tapi
sekarang p 1 = Pr ( X > 0). Dengan demikian tes asli setara dengan 1
pengujian H 0: p = 2
melawan H 1: p = Pr ( X > 0) dan studi daya untuk ukuran sampel yang diberikan dan untuk
menentukan ukuran sampel yang diperlukan untuk setiap kekuasaan yang ditentukan lagi
lanjutkan seperti dijelaskan dalam bagian 3.1.3 .
Prosedur. Hal ini mudah ditunjukkan oleh integrasi langsung dari fungsi kepadatan
probabilitas lebih (0, ∞) bahwa di bawah H 1 Pr ( X > 0) = 0,8244 ( Latihan 4.18 ). untuk
pengujian H 0: p = 2 melawan H 1: p = 0,8244 saat α = 0,05
1
2. Sebagaimana ditunjukkan di atas contoh tidak realistis dari sudut pandang praktis
karena kita jarang bertemu distribusi eksponensial di mana kita tertarik
© 2001 CRC Press LLC
pergeseran sederhana dari distribusi yang lengkap yang mempengaruhi mean atau median
saja. Kami lebih sering tertarik apakah sampel berasal dari satu atau lain dari satu set
distribusi eksponensial di mana semua nilai-nilai positif X yang mungkin tetapi di mana
parameter skala λ tidak diketahui. Perubahan dalam λ menyebabkan perubahan dalam tidak
hanya berarti atau median tetapi juga dalam varians dan saat-saat yang lebih tinggi. Ini
lebih rumit daripada pergeseran sentralitas sederhana. Namun demikian uji tanda masih
berlaku untuk mempelajari perubahan tersebut memberikan kita mendasarkan pengujian
kami pada alokasi tanda-tanda untuk pengamatan tergantung pada apakah mereka berada
di atas atau di bawah rata-rata yang ditentukan dalam H 0. Latihan 4.19 ditujukan untuk
pembaca yang tertarik dalam mengeksplorasi kekuatan dan sampel-ukuran hubungan untuk
kasus ini.
θ
dengan asumsi distribusi X adalah benar-benar sebuah double-eksponensial
dengan
varians sama dengan varians sampel. Dalam situasi seperti ini, kita tahu
distribusi
populasi yang sebenarnya kita secara efektif dengan asumsi bahwa yang
benar p 1 mungkin
sedikit berbeda dari yang untuk asumsi distribusi eksponensial ganda.
Misalkan untuk
hipotesis alternatif
bunga p 1= 0,82 untuk ganda-eksponensial
distribusi, maka kita mungkin konservatif dan bekerja di luar kekuasaan
untuk situasi ini dan juga bahwa untuk sedikit lebih rendah p 1,
dimana p 1 telah makna yang ditugaskan untuk itu seluruh bagian ini dan
z α adalah nilai dari variabel normal standar yang harus melebihi yang
sesuai dengan P nilai α kapan H 0 memegang. Sebagai contoh, dalam
uji satu-ekor dengan = 0,05, z α = 1,645. Sebuah makna yang miripα
melekat z β.
contoh 4.8
Kami menganggap topik ini dalam waktu kurang rinci daripada yang
kita lakukan untuk uji tanda sebagian karena kesulitan tambahan
dalam melakukan tes tepat tetapi juga karena keterbatasan
pendekatan ditunjukkan dalam diskusi kami untuk uji tanda berarti
bahwa hasil perkiraan sering semua bisa kita dapatkan di praktek.
juga nilai di median ini fungsi frekuensi untuk jumlah dari dua
variabel independen yang memiliki distribusi yang sama ini.
Kecuali untuk beberapa distribusi seperti biasa dimana jumlah
ini juga memiliki distribusi normal, perhitungan yang terakhir
membutuhkan pemahaman yang baik tentang teori distribusi
dan kalkulus.
yang independen N (1, 4) dan ini bersama-sama dengan nilai yang sesuai dari z α. z β yang
diganti di (4,3) untuk memperkirakan n. Prosedur. Menggunakan teori distribusi normal
konvensional kita tahu bahwa U = X 1+ X 2 didistribusikan N (2, 8) di bawah H 1. Jadi Z = (U - 2) /
(2 √ 2) memiliki distribusi normal standar dan itu berikut bahwa Pr ( U > 0) menyiratkan p 1= Pr
( Z > -1 / √ 2) = Pr ( Z > -0,7071) = 0,7601. Jelas z α= 1,645 ketika = 0,05 dan untuk daya 0,8 kita
memiliki β = 0,2 dan z β= 0,842. Pergantian dari nilai-nilai ini di ( 4.3 ) memberikan n ≈ 23.
α
Dua merek yang berbeda dari instrumen konon mengukur hal yang
sama (misalnya tekanan darah, kadar hormon, kadar gula urin, kadar
bakteri dari dahak), tetapi masing-masing tunduk pada beberapa
error. Sampel dari, katakanlah, masing-masing 15 pasien mungkin
dibagi menjadi dua subsampel, pertama yang dianalisis dengan satu
jenis instrumen, yang kedua dengan yang lain. Sebuah tes Wilcoxon
tepat untuk menguji
Biologi
kedokteran kerja
Pertanian
Psikologi
set diberikan kembar identik, itu yang dikenal untuk setiap pasangan
yang pertama kelahiran, untuk setiap individu dalam pasangan kali
untuk melaksanakan tugas manual yang diamati untuk melihat
apakah ada indikasi bahwa sulung cenderung lebih cepat. Pilihannya
mungkin terletak antara
Keamanan Jalan
pendidikan
Kebijakan sosial
4,5 RINGKASAN
tes sampel cocok pasangan perbedaan sentralitas
dipertimbangkan dalam bab ini mengurangi untuk tes
tunggal-sampel analog
LATIHAN
4.1 Verifikasi interval kepercayaan yang diberikan dalam Komentar 2 pada contoh 4.2 .
4.2 Tekanan darah 11 pasien diukur sebelum dan setelah
pemberian obat. Perbedaan tekanan darah sistolik (tekanan
sebelum - tekanan setelah) untuk setiap pasien adalah:
7512-3-5214181921-1
Gunakan tes nonparametrik yang tepat untuk melihat apakah sampel (diasumsikan
random)
bertentangan dengan hipotesis tidak ada perubahan sistematis dalam tekanan darah.
adalah:
__________________________________________________________
Lab saya 11,7 12,1 13,3 15,1 15,9 15,3 11,9 16,2 15,1 13,6
Lab II 10,9 11,9 13,4 15,4 14,8 14,8 12,3 15,0 14,2 13,1
__________________________________________________________ Gunakan Uji Peringkat
Bertanda Wilcoxon untuk menilai bukti untuk setiap perbedaan yang
konsisten antara laboratorium untuk Subsamples dari susu yang sama.
Mendapatkan juga nominal 95 dan 99 interval kepercayaan persen untuk
mean
4.4 Hormon ditambahkan ke salah satu diet dinyatakan identik diberikan kepada masing-
masing 40 pasang anak domba kembar. perbedaan pertumbuhan selama periode 3
minggu dicatat untuk setiap pasangan dan jajaran menandatangani dialokasikan
untuk 40 perbedaan. Semakin rendah jumlah peringkat adalah S 1= 242. Hanya ada
satu peringkat dasi. Menyelidiki bukti bahwa hormon dapat mempengaruhi
(meningkat atau menurun) tingkat pertumbuhan.
4,5 A wawancara psikolog ayah dan ibu masing-masing 17 anak yang tidak
berhubungan dengan kesulitan belajar, meminta setiap individu serangkaian
pertanyaan yang dirancang untuk menguji seberapa baik mereka memahami
masalah anak mereka kemungkinan menghadapi dalam kehidupan dewasa.
Catatan psikolog apakah ayah (F) atau ibu (M) menunjukkan pemahaman yang
lebih baik dari masalah-masalah potensial. Untuk 17 keluarga temuan ini
4.6 Untuk setiap sembilan pasangan yang cocok dari siswa, satu siswa
dialokasikan untuk serangkaian kuliah dan yang lainnya ke komputer
yang sesuai dibantu belajar (CAL) material. Pada akhir kursus siswa
diberi kertas ujian yang sama. Tanda dicapai (dari 100) adalah:
_____________________________________________________
Pasangan 1 2 3 4 5 6 7 8 9
_____________________________________________________
CAL 50 56 51 46 88 79 81 95
73
Kuliah 25 58 65 38 91 32 31 13
49
____________________________________________________ Menganalisis hasil ini dengan apa yang
4.9 Apakah data dalam Latihan 4.8 dukungan klaim bahwa sebanyak 75 persen
dari mereka yang memiliki preferensi dapat memilih formula baru?
4.10 Untuk memproduksi baja berkualitas tinggi salah satu dari dua agen pengerasan A, B
dapat ditambahkan ke logam cair. Kekerasan baja bervariasi dari batch ke batch,
sehingga untuk menguji dua agen batch yang dibagi menjadi dua bagian, untuk
setiap agen bets A ditambahkan ke satu bagian, agen B yang lain. Untuk
membandingkan kekerasan, spesimen diasah untuk setiap pasangan yang
digunakan untuk membuat goresan pada satu sama lain; yang membuat goresan
yang lebih dalam di sisi lain adalah spesimen sulit. Untuk 40 pasang, B diputuskan
lebih keras dalam 24 kasus dan A di 16. Apakah bukti yang cukup ini untuk menolak
hipotesis kekerasan yang sama?
4.11 Untuk subsampel dari 10 pasang dari batch baja di Latihan 4.10 tes
yang lebih mahal digunakan untuk menghasilkan indeks kekerasan.
Semakin tinggi nilai indeks, semakin sulit baja. Indeks dicatat adalah:
____________________________________________________________
Batch tidak ada. 1 2 3 4 5 6 7 8 9 10
____________________________________________________________
aditif A 22 26 29 22 31 34 31 20 33
34
aditif B 27 25 31 27 29 41 32 27 32
34
____________________________________________________________ Gunakan uji yang tepat
untuk menentukan apakah data ini mendukung clusion con dicapai dalam
Latihan 4.10.
4.12 Pada hari putaran ketiga dari Golf Kejuaraan Terbuka pada tahun 1987
sebelum bermain mulai komentator televisi mengatakan bahwa kondisi
tersebut membuat skor rata-rata pemain yang mungkin setidaknya tiga
lebih tinggi daripada mereka untuk putaran kedua. Untuk sampel acak
dari 10 dari 77 pemain yang berpartisipasi di kedua putaran skor adalah:
__________________________________________________________
Ronde 2 73 73 74 66 71 73 68 72 73 72
round 3 72 79 79 77 83 78 70 78 78 77
_________________________________________________________ Apakah data ini
mendukung klaim komentator? Pertimbangkan dengan hati-hati
apakah tes satu atau dua ekor sesuai.
4.13 Pearson dan Sprent (1968) memberikan data untuk gangguan pendengaran (dalam
desibel di bawah norma-norma yang ditentukan) pada berbagai frekuensi. Data di
bawah ini menunjukkan kerugian ini selama 10 individu berusia antara 46 dan 54 di
frekuensi 0,125 dan 0,25 kc s -1. Sebuah kerugian negatif menunjukkan mendengar di
atas normal. Apakah ada indikasi kerugian yang berbeda pada dua frekuensi?
____________________________________________________________
0.125 kc s -1 2,5 -7,5 11,25 7,5 10,0 5,0 7,5 2,5 5,0 8,75
0.25 kc s -1 2,5 -5,0 6,35 6,25 7,5 3,75 1,25 0,0 2,5 5,0
____________________________________________________________
4.14 Terapkan tes skor yang normal untuk data dalam contoh 4.2 .
4.15 Scott, Smith dan Jones (1977) memberikan tabel perkiraan
persentase pemilih UK diprediksi untuk memilih Konservatif oleh
dua organisasi polling pendapat, A dan B, di setiap bulan di tahun
1965-1970. Untuk sampel acak dari 15 bulan selama periode bahwa
persentase dipasangkan adalah:
SEBUAH 43,5 51,2 46,8 55,5 45,5 42,0 36,0 49,8 42,5 50,8 36,6 47,6 41,9 48,4
53,5
B 45,5 44,5 45,0 54,5 49,5 43,5 41,0 53,0 48,0 52,5 41,0 47,5 42,5 45,0
52,5
4.16 Verifikasi kebenaran interval keyakinan dan hasilnya untuk uji Lilliefors'
dikutip dalam contoh
4.3 .
4.17 Konfirmasi nilai yang diberikan di contoh 4.6 untuk Pr ( X > 0 | θ = 1)
untuk distribusi yang diberikan di ( 4.1 ). Apa yang sesuai
probabilitas bersyarat θ = 2?
4.19. Menentukan ukuran sampel yang diperlukan untuk memiliki kekuatan minimal 0,80
untuk uji tanda bahwa median θ aku s H 0: θ = 1 terhadap alternatif H 1: θ=2
dengan satu ekor P = 0.05 jika pengamatan diketahui sampel acak dari distribusi
eksponensial dengan fungsi frekuensi f (x) = e -_ x, x
≥ 0. (Petunjuk: Anda akan perlu menemukan nilai-nilai λ yang memberikan
medianλ sesuai dengan yang ditetapkan dalam hipotesis nol dan
alternatif.)
© 2001 CRC Press LLC
5
Metode untuk dua sampel independen
contoh 5.1
grup A 23 18 17 25 22 19 31 26
29 33
grup B 21 28 32 30 41 24 35 34
27 39 36
Apakah data menunjukkan bahwa salah satu model kalkulator unggul (yaitu
mengarah ke komputasi yang lebih cepat)?
Formulasi dan asumsi. Sebuah tes dua ekor yang sesuai. Kami memerlukan
jumlah jajaran terkait dengan sampel yang lebih kecil, Grup A, di peringkat
bersama dari semua data, atau alternatif rank sum untuk grup B bisa digunakan.
Itu P nilai yang terkait dengan jumlah ini memungkinkan kita menilai kekuatan
bukti terhadap H 0: median populasi adalah identik, di mana alternatif adalah
bahwa satu sampel adalah dari populasi dengan median yang lebih besar. Kami
lebih memilih untuk berpikir dalam hal median bukan berarti karena tidak ada
kebutuhan untuk membuat asumsi simetri. Tes ini juga akan berlaku untuk
alternatif dominasi, yaitu untuk kecenderungan untuk perhitungan harus
dilakukan lebih cepat dengan satu model kalkulator, meskipun perbedaan waktu
dapat bervariasi terhadap antara murid.
Prosedur. Ukuran sampel yang m = 10 dan n = 11. program perangkat lunak Kebanyakan
untuk uji Wilcoxon akan menghitung jajaran otomatis, tetapi untuk mendapatkan secara manual
membantu untuk mengatur data dalam urutan menaik dalam setiap sampel dan kemudian
mengalokasikan jajaran. Kami meninggalkan sebagai latihan bagi pembaca untuk menunjukkan
bahwa jika ini adalah
diberikan dalam banyak tabel. Untuk contoh ini kita menggunakan program di
StatXact yang menunjukkan bahwa untuk uji dua ekor relevan tepat P = 0,0159.
output juga menegaskan nilai S m yang diberikan di atas.
aspek komputasi. StatXact dan Testimate memberikan tepat P nilai-nilai yang sesuai
dengan yang diamati S menyediakan M N tidak terlalu besar. Banyak paket statistik
umum menghitung S m tapi tinggalkan pengguna untuk berkonsultasi tabel atau
memberikan hasil asimtotik yang mungkin tidak memuaskan jika, misalnya, satu
sampel besar tapi kecil yang lain, atau jika ada banyak jajaran terikat.
Sebuah statistik U, yang merupakan fungsi dari jumlah rank S, dapat dihitung
untuk kedua kelompok untuk menentukan kekuatan bukti terhadap hipotesis
nol. Untuk pertama dari dua sampel statistik ini diberikan oleh U m= S m - 1/2 m (m
+ 1), dengan statistik yang setara untuk (mungkin lebih besar) sampel makhluk
U n= S n - 1/2 n (n + 1). Kita hanya perlu menghitung salah satu dari S m atau S n,
U m= MN-U n (5.1)
sehingga lagi hanya satu dari U m, U n perlu dihitung. Entah dapat
digunakan dalam tes, meskipun U m umumnya diberikan dalam
tabel.
contoh 5.2
grup A 17 18 19 22 23 25 26 29
31 33
grup B 21 24 27 28 30 32 34 35
36 39 41
contoh 5.3
Masalah. Kami menganggap satu set data dari percobaan kedua mirip dengan yang di
contoh 5.1 dan 5.2 tetapi di mana sekarang ada beberapa hubungan di masa yang diambil
oleh peserta yang berbeda. Untuk kenyamanan data diberikan dalam urutan menaik tapi
ini tidak penting, terutama jika software yang cocok digunakan.
grup A 16 18 19 22 22 25 28 28 28 31 33
grup B 22 23 25 27 27 28 30 32 33 35 36 38 38 Apakah data
menunjukkan bahwa salah satu model kalkulator unggul (yaitu mengarah ke
komputasi yang lebih cepat)?
Formulasi dan asumsi. Kami menggunakan tes WMW dengan pertengahan jajaran untuk ikatan.
grup A 1 23 5
5 8,5 13,5 13,5 13,5 17
19,5
grup B 5 7 8,5 10,5 10,5 13,5 16 18 19,5 21 22
23,5 23,5
Kecuali kita perlu S m khusus dan tidak memiliki perangkat lunak untuk menghitung itu
tidak perlu untuk mengalokasikan jajaran. Hal ini lebih mudah untuk mendapatkan U n
dengan menghitung untuk setiap nilai sampel pertama jumlah pengamatan melebihi dalam
sampel kedua (mencetak satu setengah untuk ikatan) dan menjumlahkan ini. Misalnya,
untuk setiap nilai 22 di Grup A ada satu nilai terikat, mencetak sebagai 1/2 dan 12 nilai
melebihi 22 di Grup B memberikan kontribusi 12,5 untuk U n. Melanjutkan dengan cara ini
kita menemukan
U n= 13 + 13 13 + 12,5 + 12,5 + 10,5 + 7,5 7,5 + 7,5 + + 6 + 4,5 = 107,5
hanya membutuhkan data asli untuk melakukannya, dan untuk uji dua ekor memberikan tepat
P = 0,0359.
3. Seperti yang kita ditunjukkan dalam contoh 2.5 , Jika ikatan hasil dari pembulatan dan
akurasi yang lebih besar memungkinkan kita untuk memutuskan hubungan, cara ikatan istirahat
dapat mengubah lumayan kesimpulan mengenai signifikansi.
A 'dasi' situasi umum adalah salah satu di mana kita tidak diberi
pengukuran yang
tepat, tetapi hanya dikelompokkan data. Misalnya, alih-alih nilai sampel
lengkap
dalam contoh 5.3 kita dapat diberikan angka saja dari peserta
mengambil antara 10
dan 19 menit, 20 dan 29 menit, 30 dan 39 menit. Kita mungkin masih
menghitung U atau
S
statistik membuat tunjangan untuk dasi, tapi sekarang mungkin
menyesatkan untuk menggunakan nilai-nilai kritis ditabulasi untuk statistik
ini.
contoh 5.4
Masalah. Bukan data di contoh 5.3 misalkan kita hanya diberikan nomor
mengambil 10-19, 20-29, 30-39 menit mengarah ke data yang diberikan di
bawah ini. Lakukan tes di contoh 5.3 menggunakan informasi berkurang ini.
Jumlah menit 10-19 20-19 30-39
grup A 3 6 2
grup B 0 6 7