Bab 16
Statistik Nonparametrik
16.1 Tes Nonparametrik
Sebagian besar prosedur pengujian hipotesis yang dibahas dalam bab-bab sebelumnya
didasarkan pada dengan asumsi bahwa sampel acak dipilih dari populasi normal. Untungnya,
sebagian besar tes ini masih dapat diandalkan ketika kami menggunakan sedikit
keunggulan.tures dari normalitas, terutama ketika ukuran sampel besar. Secara tradisional,
prosedur pengujian ini telah disebut sebagai metode parametrik. Di dalam bab kami
mempertimbangkan sejumlah prosedur pengujian alternatif, yang disebut nonparamet-ric atau
metode bebas distribusi, yang sering kali menganggap tidak ada pengetahuan sama sekali
tentang distribusi populasi yang mendasarinya, kecuali mungkin bahwa mereka terus
menerus.
Tanda Tes
Pembaca harus ingat bahwa prosedur yang dibahas dalam Bagian 10.7 untuk
pengujian
hipotesis nol bahwa p = µ0 arc hanya valid jika populasinya mendekati normal atau jika
sampelnya besar. Namun, jika n < 30 dan populasinya pasti tidak normal, kita harus
menggunakan uji nonparametrik.
Uji tanda digunakan untuk menguji hipotesis pada median populasi . Dalam kasus ini
dari banyak prosedur nonparametrik, mean diganti dengan median sebagai parameter lokasi
terkait yang sedang diuji. Ingatlah bahwa median sampel adalah didefinisikan dalam Bagian
1.4. Pasangan populasi, dilambangkan dengan ṕ memiliki analogi definisi.
Diberikan variabel acak X, hal. didefinisikan sedemikian rupa sehingga P(X > μ́) < 0,5 dan
P(X < ṕ) < 0,5. Dalam kasus terus menerus.
Tentu saja, jika distribusinya simetris, rata-rata populasi dan median adalah
setara. Dalam menguji hipotesis nol H0 bahwa ṕ — µ0 terhadap yang sesuai alternatif,
berdasarkan sampel acak berukuran n, kami mengganti setiap sampel nilai melebihi μₒ ´
dengan tanda plus dan setiap nilai sampel kurang dari μₒdengan
´ a tanda minus . Jika
hipotesis nol benar dan populasi simetris, maka jumlah tanda plus harus kira-kira sama
dengan jumlah tanda minus. Ketika satu tanda muncul lebih sering dari yang seharusnya,
berdasarkan kebetulan saja, kita tolak hipotesis bahwa median populasi p sama dengan μₒ.
´
Secara teori, uji tanda hanya dapat diterapkan dalam situasi di mana μₒ tidak
´ bisa
sama nilai dari salah satu pengamatan. Meskipun ada kemungkinan nol untuk mendapatkan-
ing sampel pengamatan persis sama dengan μₒketika
´ populasi kontinu,
Namun, dalam praktiknya nilai sampel yang sama dengan po akan sering terjadi karena
kurangnya ketelitian dalam merekam data. Ketika nilai sampel sama dengan μₒ diamati,
´
mereka dikeluarkan dari analisis dan ukuran sampel juga dikurangi. Statistik uji yang sesuai
untuk uji tanda adalah variabel acak binomial X, mewakili jumlah tanda plus dalam sampel
acak kami. Jika hipotesis nol-esis bahwa ṕ= μₒ benar,
´ probabilitas bahwa nilai sampel
menghasilkan salah satu plus atau tanda minus sama dengan 1/2. Oleh karena itu, untuk
menguji hipotesis nol bahwa μ́ = μₒ.kami
´ sebenarnya menguji hipotesis nol bahwa jumlah
tanda plus adalah nilai dari variabel acak yang memiliki distribusi binomial dengan parameter
p = 1/2. Nilai-P untuk alternatif satu sisi dan dua sisi kemudian dapat dihitung menggunakan
distribusi binomial ini.
Ho: μ́ = ṕo
H1 : : μ́. < μₒ
´
kita akan menolak Ho demi H1 hanya jika proporsi tanda plus cukup kurang dari 1/2, yaitu,
ketika nilai x dari variabel acak kita kecil. Oleh karena itu, jika nilai P yang dihitung
kurang dari atau sama dengan beberapa tingkat signifikansi yang dipilih sebelumnya a, kami
menolak Ho mendukung dari H\. Misalnya, ketika n = 15 dan x = 3, kita temukan dari Tabel
A.1 bahwa
0
1
P = P(X < 3 bila p = 1/2) = ∑ b( x; 15, 2 ) = 0,0176,
x=0
Ho : p = ṕo
H1 : p > ṕo
kami menolak Ho demi H1 hanya jika proporsi tanda plus cukup besar dari 1/2, yaitu,
ketika x besar. Oleh karena itu, jika nilai-P yang dihitung
Ho: p = μₒ ´
H1 μ́ ≠ μₒ
´
kami menolak. Ho mendukung H1 ketika proporsi tanda plus secara signifikan lebih sedikit
dari atau lebih besar dari 1/2. Ini, tentu saja, setara dengan x yang cukup kecil atau cukup
besar. Oleh karena itu, jika x < n/2 dan nilai-P yang dihitung
kurang dari atau sama dengan a, atau jika x > n/2 dan nilai-P yang dihitung
Kapan pun n > 10, probabilitas binomial dengan p = 1/2 dapat didekati dari kurva
normal, karena np = nq > 5. Misalkan, misalnya, kita ingin menguji hipotesis
μ́= np= (20)(0.5) = 10
dan
6.5−10
z= = - 1.57.
2.236
Karena itu.
Contoh 16.1:1
Data berikut menunjukkan jumlah jam pemangkas lindung nilai yang dapat diisi
ulang:
beroperasi sebelum pengisian ulang diperlukan:
1.5,2.2,0.9,1.3,2.0,1.6,1.8,1.5,2.0,1.2,1.7.
Gunakan uji tanda untuk menguji hipotesis pada tingkat signifikansi 0,05 bahwa
pemangkas tertentu beroperasi dengan median 1,8 jam sebelum membutuhkan pengisian
ulang.
Larutan:
1. Ho : ~p = 1.8
2. H1 =~μ ≠ 1.8.
3. a = 0,05.
4. Uji statistik: Variabel binomial X dengan p = 1/2
5. Perhitungan: Mengganti setiap nilai dengan simbol "+" jika melebihi 1,8, dengan
simbol "—‘’' : jika kurang dari 1,8, dan buang satu ukuran yang sama dengan 1,8, kami
memperoleh urutan
-+--+--+
Dimana n = 10, x = 3, dan n/2 = 5. Oleh karena itu, dari Tabel Al nilai P yang dihitung adalah
3
P = 2P(X < 3 bila p = -) = 2 2 ∑ b (x; 10, -) = 0,3438 > 0,05.
x=0
6. Keputusan: Jangan menolak hipotesis nol dan simpulkan bahwa median waktu operasi
tidak berbeda secara signifikan dari .1,8 jam. Kita juga dapat menggunakan uji tanda untuk
menguji hipotesis nol flic pi — fi 2 = do for pengamatan berpasangan. Disini kita ganti
setiap perbedaan, di, dengan plus atau minus tanda tergantung pada apakah elifferensi sel
penyesuaian, <7,- — e/ n , positif: atau negatif. Sepanjang bagian ini kita telah
mengasumsikan bahwa populasi simetris. Namun, bahkan jika populasi miring kita dapat
melakukan prosedur pengujian yang sama, tetapi hipotesis mengacu pada median populasi
daripada sarana. Contoh 16.2:1 Sebuah perusahaan taksi sedang mencoba untuk
memutuskan apakah penggunaan ban radial bukan ban biasa dan berikat meningkatkan
penghematan bahan bakar. Mobil Sixte-en dilengkapi dengan ban radial dan didorong
melalui kursus tes yang ditentukan. Tanpa berganti pengemudi, mobil yang sama adalah
kemudian dilengkapi dengan ban berikat biasa dan elrive'ii sekali lagi selama pengujian
saja Konsumsi bensin, dalam kilometer per liter, diberikan pada Tabel 16.1. Dapatkah wc
menyimpulkan pada tingkat signifikansi 0,05 bahwa mobil yang dilengkapi dengan radial?
Mobil 1 2 3 4 5 6 7 8
Ban Radial 4.2 4.7 6.6 7.0 6.7 .5 5.7 6.0
Ban berikat 1.1 4.9 6.2 6.9 6.8 .4 5.7 5.8
Mobil 9 10 11 12 13 14 15 16
Ban Radial 7.4 4.9 GJ 5.2 5.7 6.9 6.8 4.9
Ban berikat 6.9 44.9 6.0 4.9 5.3 6.5 7.1 4.8
ban mendapatkan penghematan bahan bakar yang lebih baik daripada yang: dilengkapi
dengan ban berleher biasa?
1. Ho : ~
μ−μ = 0
2. H1 : ~
μ−μ > 0
3. a = 0,05.
Saya. Uji statistik: Variabel binomial A' dengan p = 1/2.
5. Perhitungan: Setelah mengganti setiap perbedaan positif dengan simbol ''— v dan
setiap perbedaan negatif dengan simbol "—", dan kemudian membuang dua nol perbedaan,
kami memperoleh urutan
+-++-+++++++-+
dimana n = 14 dan x = 11. Dengan menggunakan pendekatan kurva normal, kita temukan
10,5−7
z= = 1.87
√(14)(0.5)(0.5)
lalu
Pembaca harus memperhatikan bahwa tes tanda, hanya menggunakan: tanda plus dan
minus perbedaan antara pengamatan dan /Io hai kasus satu sampel, atautanda plus dan minus
dari perbedaan antara pasangan pengamatan di kasus sampel berpasangan, tetapi tidak
mempertimbangkan besarnya ini perbedaan. Sebuah tes memanfaatkan kedua arah dan
besarnya, diusulkan pada tahun 1945 oleh Frank Wilcoxon, sekarang sering disebut sebagai
uji peringkat bertanda Wilcoxon. Analis dapat mengekstrak lebih banyak informasi dari data
dalam nonparametrik mode jika masuk akal untuk meminta pembatasan tambahan pada
distribusi dari mana data kami diambil. Tes peringkat bertanda Wilcoxon berlaku dalam
kasus ini dari distribusi kontinu simetris. Dalam kondisi ini kita dapat menguji
hipotesis nol fi. = /lo. Kami pertama-tama mengurangi fio dari setiap nilai sampel, membuang
semua perbedaan sama dengan nol. Perbedaan yang tersisa kemudian diberi peringkat tanpa
memperhatikan untuk menandatangani. Peringkat 1 diberikan untuk: perbedaan absolut
terkecil (yaitu tanpa tanda), peringkat 2 ke yang terkecil berikutnya, dan seterusnya. Bila nilai
mutlak dari dua atau lebih perbedaan adalah sama, tetapkan untuk masing-masing rata-rata
peringkat yang akan diberikan jika perbedaannya: dapat dibedakan. Misalnya, jika
I he: perbedaan terkecil kelima dan keenam adalah sama dalam nilai absolut, masing-masing
adalah diberi peringkat 5,5. Jika hipotesis p = po benar:, jumlah pangkat sesuai dengan
perbedaan positif harus hampir sama dengan total 1 peringkat sesuai dengan perbedaan
negatif Mari kita nyatakan total ini dengan w + dan U/_, masing-masing. Wc menunjuk yang
lebih kecil dari M)+ dan tfl_ dengan w. Dalam memilih sampel berulang, kita mengharapkan
w+ dan u;_, dan oleh karena itu w, untuk bervariasi. Jadi kita dapat menganggap w + , «.'_,
dan w sebagai nilai-nilai yang sesuai variabel acak W+, W-, dan W. Hipotesis nol fi. =
po dapat ditolak mendukung alternatif p < po, hanya jika u.' + kecil dan u>_ besar. Juga,
alternatif fi > po dapat diterima hanya jika w^ besar dan W- kecil. Untuk alternatif dua sisi
yang mungkin kita tolak. HQ mendukung Hi jika *<;_ atau «;_ anel maka w cukup
kecil. Oleh karena itu, apa pun hipotesis alternatifnya mungkin, kami menolak hipotesis nol
ketika nilai statistik yang sesuai W+, W-, atau W cukup kecil. Dua Sampel dengan
Pengamatan Berpasangan Untuk menguji hipotesis nol bahwa kami mengambil sampel dua
pop-ulations dengan fix = p 2 untuk kasus sampel berpasangan, kami memberi peringkat
perbedaan dari pengamatan berpasangan tanpa memperhatikan tanda dan lanjutkan seperti
dengan sampel tunggal kasus. Berbagai tes, prosedur untuk kasus sampel tunggal dan
berpasangan adalah diringkas dalam Tabel 16.2.
Hal ini tidak sulit untuk menunjukkan bahwa setiap kali n < 5 dan tingkat signifikansi tidak
tidak melebihi 0,05 untuk uji satu sisi atau 0,10 untuk uji dua sisi, semua nilai yang mungkin
dari w + , «;_, atau w akan mengarah pada penerimaan hipotesis nol. Namun, ketika 5 < n
< 30, Tabel A.17 menunjukkan perkiraan nilai kritis W + dan W- untuk level signifikansi
sama dengan 0,01, 0,025. dan 0,05 untuk uji satu sisi, dan nilai kritis dari W untuk tingkat
signifikansi sebesar 0,02, 0,05, dan 0,10 untuk uji dua sisi. Hipotesis nol ditolak jika nilai
yang dihitung w +, W-, atau w adalah kurang dari atau sama dengan nilai tabel yang
sesuai. Misalnya, ketika n — 12, Tabel A. 17 menunjukkan bahwa nilai w+ < 17 diperlukan
untuk alternatif satu sisi p. < ke signifikan pada tingkat 0,05.
Contoh 16.3:1 Pengerjaan Ulang Contoh 16.1 dengan menggunakan uji peringkat bertanda.
Larutan:
1. Ho : ~p = 1.8
2. H1 =~μ ≠ 1.8.
3. a = 0,05.
4. Daerah kritis: Karena n = 10, setelah membuang satu pengukuran yang
sama dengan 1,8, Tabel A. 17 menunjukkan daerah kritis adalah w < 8.
5. Perhitungan: Kurangi 1,8 dari setiap pengukuran dan kemudian beri peringkat
perbedaan tanpa memperhatikan tanda, kita memiliki
Di -0.2 0.4 -0.9 -0.5 -.2 -0.2 -0.3 -.2 -0. -
0.1
Ranks 5.5 7 10 8 3 3 5.5 3 9 1
Sekarang iv-i- = 13 dan w- = 42 sehingga w = 13, semakin kecil dari w + dan iev_.
6. Keputusan: Seperti sebelumnya, jangan tolak Ho dan simpulkan bahwa operasi median
waktu tidak berbeda nyata dengan 1,8 jam.
Uji peringkat bertanda juga dapat digunakan untuk menguji hipotesis nol bahwa pi—p 2 =
do- Dalam hal ini populasi tidak perlu simetris. Seperti halnya uji tanda, kita
kurangi lakukan dari setiap perbedaan, beri peringkat perbedaan yang disesuaikan tanpa
memperhatikan menandatangani, dan menerapkan prosedur yang sama seperti di atas.
Contoh 16.4:1
Diklaim bahwa seorang senior perguruan tinggi dapat meningkatkan nilainya di
bidang bidang utama ujian catatan lulusan dengan setidaknya 50 poin jika dia diberikan
sampel masalah sebelumnya. Untuk menguji klaim ini, 20 senior perguruan tinggi dibagi
menjadi 10 pasang sedemikian rupa sehingga setiap pasangan yang cocok memiliki rata-rata
poin kualitas keseluruhan yang hampir sama untuk 3 tahun pertama mereka di perguruan
tinggi. Contoh soal dan jawaban disediakan secara acak kepada salah satu anggota dari setiap
pasangan 1 minggu sebelum ujian. Ujian skor diberikan pada Tabel 16.3.
Uji hipotesis nol pada tingkat signifikansi 0,05 bahwa sampel masalah
meningkatkan skor sebesar 50 poin terhadap hipotesis alternatif bahwa peningkatan
kurang dari 50 poin. Solusi: Biarkan px dan p 2 mewakili skor rata-rata semua siswa yang
mengikuti tes tersebut dengan dan tanpa masalah sampel, masing-masing.
6. Keputusan: Tolak Ho dan simpulkan bahwa contoh soal tidak, pada "av-erage,"
meningkatkan skor rekor kelulusan seseorang sebanyak 50 poin.
Ketika n > 15, distribusi sampling dari W + (atau VF_) mendekati normal distribusi dengan
rata-rata\
Latihan
16.1 Data berikut mewakili waktu, dalam min-utes, bahwa seorang pasien harus menunggu
selama 12 kunjungan ke a kantor dokter sebelum dilihat oleh dokter:
17 15 20 20 32 28
12 26 25 25 35 24
Gunakan uji tanda pada tingkat signifikansi 0,05 untuk menguji. klaim dokter bahwa median
waktu tunggu untuk pasiennya tidak lebih dari 20 menit sebelum diterima di ruang
pemeriksaan.
16.2 Data berikut mewakili, jumlah jam pelatihan penerbangan yang diterima oleh 18 siswa
pilot dari instruktur tertentu sebelum penerbangan solo pertama mereka:
9 12 18 14 12 14 12 10 16
11 9 11 13 11 13 15 13 14
Menggunakan probabilitas binomial dari Tabel Al, lakukan uji tanda pada taraf signifikansi
0,02 untuk menguji klaim instruktur bahwa waktu rata-rata yang diperlukan sebelumnya solo
siswanya adalah 12 jam pelatihan penerbangan.
16.3 Seorang inspektur makanan memeriksa 16 toples tertentu merek selai untuk menentukan
persentase impor asing kemurnian. Berikut data yang dicatat:
Menggunakan pendekatan normal untuk elis- binomial distribusi, lakukan uji tanda pada taraf
signifikansi 0,05. icance untuk menguji hipotesis nol bahwa median per-persen kotoran
dalam merek selai ini adalah 2,5% terhadap alternatif bahwa persentase rata-rata pengotor
bukan 2,5%.
16.4 Pemasok cat mengklaim bahwa aditif baru akan mengurangi waktu pengeringan cat
akriliknya. Untuk menguji ini klaim, 12 panel kayu dicat, masing-masing setengahnya
panel dengan cat yang mengandung aditif biasa dan setengah lainnya dengan cat yang
mengandung aditif baru. Waktu pengeringan, dalam jam, dicatat sebagai berikut:
Gunakan uji tanda pada tingkat 0,05 untuk menguji hipotesis nol. hipotesis bahwa aditif baru
tidak lebih baik dari aditif biasa dalam mengurangi waktu pengeringan ini
jenis cat.
16.5 Diklaim bahwa diet baru akan mengurangi berat badan anak laki-laki rata-rata 4,5
kilogram dalam periode 2 minggu. Bobot 10 wanita yang mengikuti ini diet dicatat sebelum
dan sesudah periode 2 minggu menghasilkan data sebagai berikut:
Berat Badan Wanita Sebelum Berat Badan Setelah
Gunakan uji tanda pada taraf signifikansi 0,05 untuk menguji hipotesis bahwa diet
mengurangi median berat sebesar 4,5 kilogram terhadap hipotesis alternatif esis bahwa
perbedaan rata-rata berat kurang dari 4,5 kilogram.
16.6 Dua jenis instrumen untuk mengukur: jumlah belerang monoksida di atmosfer lebih baik
dibandingkan dalam percobaan polusi udara. yang mengikuti- pembacaan rendah dicatat
setiap hari untuk jangka waktu 2 minggu.
Sulfur Monoksida
Menggunakan pendekatan normal untuk distribusi binomial tetapi, lakukan uji tanda untuk
menentukan apakah instrumen yang berbeda menghasilkan hasil yang berbeda. Gunakan
0,05 tingkat signifikansi.
16.7 Angka-angka berikut memberikan darah sistolik: tekanan 16 pelari sebelum dan sesudah
8 kilometer
Lari:
Gunakan uji tanda pada taraf signifikansi 0,05 untuk menguji hipotesis nol bahwa jogging 8
kilometer meningkat median tekanan darah sistolik sebesar 8 poin melawan alternatif bahwa
peningkatan median lebih kecil dari 8 poin.
16.8 Analisis data Latihan 16.1 dengan menggunakan tes peringkat bertanda.
16.10 Berat 5 orang sebelum mereka berhentimerokok dan 5 minggu setelah mereka berhenti
merokok, kilogram, adalah sebagai berikut:
Individu
Sebelum
66 80 69 52 75
Setelah
71 82 68 56 73
Gunakan tes peringkat bertanda untuk pengamatan berpasangan untuk diuji hipotesis, pada
tingkat signifikansi 0,05, bahwa berhenti merokok tidak berpengaruh pada berat badan
seseorang terhadap alternatif bahwa berat badan seseorang meningkat jika dia atau dia
berhenti merokok.
16.11 Kerjakan Ulang Latihan 16.5 dengan menggunakan sign-rank tes.
16.12 Berikut ini adalah jumlah resep: diisi oleh dua apotek selama periode 20 hari:
Gunakan uji peringkat bertanda pada tingkat signifikansi 0,01 cance untuk menentukan
apakah dua apotek, "pada rata-rata," isi jumlah resep yang sama dengan
alternatif bahwa apotek A mengisi lebih banyak resep dibandingkan apotek B.
16.13 Kerjakan Ulang Latihan 16.7 dengan menggunakan peringkat bertanda tes,
16.14 Kerjakan Ulang Latihan 16,6 dengan menggunakan sign-rank tes,
n 1+ n 2(n 1+ n 2−1)
W1 + W2 =
2
jumlah aritmatika bilangan bulat 1,2 ni + n 2 . Setelah kita menentukan Wi, mungkin lebih
mudah untuk menemukan w 2 dengan rumus
n 1+ n 2(n 1+ n 2−1)
w2 = w1
2
Dalam memilih sampel berulang dengan ukuran ' ni dan n 2 , kita harapkan -w\. Dan Oleh
karena itu w 2 . untuk bervariasi. Jadi kita dapat menganggap wj dan w 2 sebagai nilai-nilai
acak variabel W\ dan W 2 , masing-masing. Hipotesis nol ft\ = p 2 akan ditolak mendukung
alternatif p\ < ft- 2 hanya jika Wi kecil dan w 2 besar. Juga, alternatif px > ft 2 dapat diterima
hanya jika u>x besar dan w 2 kecil. Untuk sebuah uji dua sisi, wc dapat menolak Hi demi Hi
jika «i kecil dan u: 2 besar atau jika wj besar dan w 2 kecil. Dengan kata lain, alternatif' px <
ft 2 diterima jika ie:i cukup kecil: alternatif //| > ft 2 diterima jika w 2 cukup kecil; dan
alternatifnya: p.\ -£ ft 2 diterima jika minimum «;i dan w 2 adalah cukup kecil. Dalam praktik
sebenarnya, kami biasanya mendasarkan keputusan kami pada nilai
Dari rumus untu m dan u 2 kita melihat bahwa ui akan kecil ketika K,'I kecil
dan u 2 akan kecilketika w 2 kecil. Akibatnya, hipotesis nol akan ditolak setiap kali statistik
yang sesuai U\, U 2 , atau U mengasumsikan nilai lebih kecil dari atau sama dengan nilai
kritis yang diinginkan yang diberikan pada Tabel A. 18. Berbagai tes prosedur diringkas
dalam
Tabel 16.4.
nilai-nilai kritis Ui dan U 2 untuk tingkat signifikansi sama untuk ,001, 0,002, 0,01,
0,02, 0,025, dan 0,05 untuk uji satu sisi, dan nilai kritis dari U untuk tingkat signifikansi
sebesar 0,002, 0,02, 0,05, dan 0,10 untuk uji dua sisi. Jika nilai pengamatan u1: u 2 , atau
u kurang dari atau sama dengan nilai kritis yang ditabelkan nilai, hipotesis nol ditolak pada
tingkat signifikansi yang ditunjukkan oleh meja. Misalkan, misalnya, kita ingin menguji
hipotesis nol bahwa px = p 2 terhadap alternatif satu sisi bahwa pi < p 2 pada tingkat
signifikansi 0,05 untuk sampel acak berukuran n\ = 3 dan n 2 = 5 yang menghasilkan
nilai wx = 8. Berikut ini :
(3)(4 )
u 1=8− =2
2
.
Uji satu sisi kami didasarkan pada statistik Ux- Menggunakan Tabel A.18, kami menolak
hipotesis nol dari sarana yang sama ketika ux < 1. Karena ui = 2 tidak termasuk dalam
daerah penolakan, hipotesis nol tidak dapat ditolak.
Contoh 16.5:1
Ditemukan kandungan nikotin dari dua merek rokok, diukur dalam miligram menjadi
sebagai berikut:
(18)(19)
W2 = 93=lb.
2
Karena itu,
(8)(9) (10)(11)
U1 = 93− =57 U1 = 78− =23
2 2
6. Keputusan; Jangan menolak hipotesis nol Ho dan menyimpulkan bahwa ada tidak ada
perbedaan yang signifikan dalam konten median nikotin dari kedua merek rokok.
Pendekatan Teori Normal untuk Dua Sampel Ketika keduanya »i dan n 2 melebihi 8,
distribusi sampling Ux (atau U 2 ) mendekati distribusi normal dengan mean menit 2
Akibatnya, ketika n2 lebih besar dari 20, nilai maksimum pada Tabel A.18. dan n1 setidaknya
9, kita bisa menggunakan statistik
u1−μu1
σu1
untuk pengujian kami, dengan wilayah kritis jatuh di salah satu atau kedua ekor standar
distribusi normal, tergantung pada bentuk Hi. Penggunaan uji rank-sum Wilcoxon tidak
terbatas pada populasi yang tidak normal. tion. Ini dapat digunakan sebagai pengganti dua
sampel /-tes ketika populasinya normal, meskipun daya akan lebih kecil. Tes rank-sum
Wilcoxon selalu lebih unggul dari /-test untuk populasi yang jelas tidak normal.
Dalam Bab 13, II. anel 15, teknik analisis varians menonjol sebagai suatu teknik
analisis untuk menguji persamaan k > 2 rata-rata populasi. Lagi, namun, pembaca harus
mengingat bahwa normalitas harus diasumsikan agar F-test secara teoritis benar. Di bagian
ini kami menyelidiki nonparametrik alternatif untuk analisis varians. Uji Kruskal-Wallis, juga
disebut uji Kruskal-Wallis H, adalah eralisasi dari: uji rank-sum untuk kasus k > 2 sampel.
di mana r,- adalah nilai asumsi /?,-, untuk i = 1,2 k. Jika itu jatuh di kritis daerah II > y-
dengan v = k — 1 derajat kebebasan, tolak Hu pada tingkat makna; jika tidak, gagal menolak
HQ.
Contoh 16.6:1
Dalam percobaan untuk menentukan mana dari tiga sistem rudal yang berbeda yang
lebih disukai, laju pembakaran propelan diukur. Data, setelah coding, diberikan pada Tabel
16.5. gunakan uji Kruskal-Wallis dan tingkat signifikansi a = 0,05 untuk menguji hipotesis
bahwa tingkat pembakaran propelan sama untuk ketiga rudal sistem.
Tabel 16.5: Tingkat Pembakaran Propelan
Sistem Rudal
Larutan:
1. Ho: pi = p 2 = p 3 -
2. Hai: Ketiga cara tersebut tidak semuanya sama.
3. a = 0,05.
4. Daerah kritis: h > X0.05 = 5-991, untuk v = 2 derajat kebebasan.
5. Perhitungan: Pada Tabel 16.6 kami mengubah 19 pengamatan menjadi peringkat dan
jumlahkan peringkat untuk setiap sistem rudal.
6. Keputusan: Karena h = 1,66 tidak jatuh di daerah kritis h > 5,991, kita memiliki cukup
bukti untuk menolak hipotesis bahwa pembakaran propelan tarif yang sama untuk tiga sistem
rudal.
Latihan
16.15 Produsen rokok mengklaim bahwa tar kandungan rokok merek B lebih rendah dari
merek A. Untuk menguji klaim ini, penentuan berikut negara konten tar, dalam miligram,
dicatat:
brand A 1 12 9 13 11 14
brand B 8 10 7
Gunakan tes rank-sum dengan sebuah klaim itu sah. 0,05 untuk menguji apakah 16.16 Untuk
mengetahui apakah serum baru akan tertahan leukemia, 9 pasien, yang semuanya telah
mencapai stadium lanjut stadium penyakit, dipilih. Lima pasien menerima pengobatan dan
empat tidak. Waktu bertahan hidup, dalam tahun, sejak percobaan; dimulai adalah Perlakuan
Gunakan rank-sum agar, pada tingkat 0,05 o( signifikansi, untuk menentukan apakah: serum
efektif.
16.17 Data berikut menunjukkan banyaknyajam bahwa dua jenis yang berbeda dari saku
ilmiahKurator beroperasi sebelum pengisian ulang: diperlukan.
Kalkulator A I 5.5 5.6 6.3 4.6 5.3 5.0 6.2 5.8 5.1
Kalkulator B \ 3,8 4,8 4,3 4,2 4,9 4,5 5,2 4,5
16.18 Sebuah pancing sedang dibuat oleh dua proses. Untuk mengetahui ada tidaknya
perbedaan kekuatan putus rata-rata garis. 10 buah setiap proses dipilih dan kemudian diuji
untuk dipatahkan kekuatan. Hasilnya adalah sebagai berikut:
Gunakan uji rank-sum dengan a = 0,1 untuk menentukan jika ada perbedaan antara rata-rata
putus kekuatan garis yang diproduksi oleh dua pro-cesses.
16.19 Dari kelas matematika dari 12 sama-sama berkapasitas Jika siswa menggunakan materi
yang diprogram, 5 adalah se-dipilih secara acak dan diberi instruksi tambahan oleh
guru. Hasil ujian akhir adalah sebagai berikut:
Gunakan uji rank-sum dengan a = 0,05 untuk menentukan apakah instruksi tambahan
mempengaruhi nilai rata-rata.
16.20 Data berikut mewakili bobot, dalam: kilogram, barang bawaan pribadi yang dibawa
dalam berbagai penerbangan oleh anggota tim bisbol dan anggota a tim basket.
Gunakan uji rank-sum dengan a = 0,05 untuk menguji hipotesis nol. hipotesis bahwa kedua
atlet membawa jumlah yang sama, bagasi rata-rata terhadap alternatif hy- hipotesis bahwa
berat rata-rata bagasi untuk keduanya atlet berbeda.
16.21 Data berikut mewakili operasi waktu dalam jam untuk tiga jenis perhitungan saku
ilmiah kulator sebelum pengisian ulang diperlukan:
16.22 Dalam Latihan 13.8 di halaman 523, gunakan Kruskal-Uji Wallis, pada taraf
signifikansi 0,05 e>f untuk menentukan jika pelarut kimia organik berbeda secara signifikan
dalam tingkat penyerapan.
16.5 Uji Runtutan
Dalam menerapkan setiap konsep statistik yang dibicarakan dalam buku ini, selalu
diamsumsikan bahwa datanya diperoleh melalui suatu proses pengacakan. Uji Runtutan,
yang didasarkan pada urutan bagaimana data pengamatan ini diperoleh, merupakan suatu
teknik yang bermanfaat bagi pengujian hipotesis nol H0 bahwa penggamatan telah diambil
secara acak.
Untuk mengilustrakin Uji Runtutan, misalkan bahwa 12 orang telah ditanyai apakah
ia menggunakan produk tertentu. Seandainya 12 orang ternyata berjenis-kelamin sama, kita
mungkin akan sangat meragukan keacakannya. Lambangkan laki-laki dan perempuan
masing-masing dengan L dan P, dan tuliskan ke-12 orang itu menurut jenis kelamin sesuai
dengan urutan wawancaranya. Suatu basrisan hasil percobaan ini mungkin adalah
L-L P-P-P L P-P L-L-L-L,
Yang telah kita golongkan menjadi bebrapa barisan bagian menurut lambang yang
sama. Barisan-barisan bagian itulah yang disebut Runtutan
Definition 16.1: Runtutan adalah suatu barisan bagian yang teridiri atas satu atau lebih
lembang yang sama yang mennyatakan sifat tertentu data tersebut.
Tidak peduli apakah pengamatan kita kuantitatif atau kualitatif, Uji Runtutan
membagi data itu menjadi dua penggolongan yang tidak berpotongan: Laki-laki atau
perempuan; cacat atau takcacat; gambar atau skala; di atas atau di bawah median; dan lain
sebagainya. Dengan demikian, barisan hasil percobaannya hanya terdiri atas dua lambang.
Misalkan bahwa n1 adalah banyaknya lambang yang lebih sedikit, dan n2 adalah banyaknya
lambang yang lebih banyak, maka urutan contoh n = n1 + n2.
Untuk n = 12 lambang dalam ilustrasi kita di atas, kita mempunyai 5 runtutan, dengan
gaya yang pertama berupa dua L, yang kedua tiga P, dan demikian seterusnya. Apabila
banyaknya hipotesis bahwa contohnya bersifat acak harus kita tolak. Misalnya saja, suatu
contoh yang
L L L L L L L P P P P P
atau dalam urutan kebalikannya, sangat kecil kemungkinannya dihasilkan dari suatu proses
pengambilan yang acak. Urutan di atas menunjukan bahwa tujuh orang pertama yang
diwawancarai adalah laki-laki dan dilanjutkan dengan lima perempuan. Begitu pula, bila
contoh itu menghasilkan banyaknya runtutan maksimum, yaitu 12 runtutan, misalnya
L P L P L P L P L P L P
kita juga akan curiga mengenai keacakan contoh tersebut.
Uji Runtutan untuk memeriksa keacakan didasarkan peubah acak V, yaitu banyaknya
runtutan total dalam hasil percobaan atau contoh kita. Dalam Tabel A.19, nilai-nilai P ( V≤
V* bila H0 benar ) diberikan untuk V* = 2, 3, …, 20 runtutan, dan nilai-nilai n 1 dan n2 yang
lebih kecil atau sama dengan 10. Nilai P untuk kedua uji satu sisi dan dua sisi dapat diperoleh
dengan menggunakan nilai-nilai tabel ini.
Dalam ilustrasi di atas, kita mendapatkan 5 P dan 7 L. Dengan demikian, dengan n1 =
5, n2 = 7 dan, V = 5, kita mendapatkan dari tabel A.19 untuk uji dua sisi bahwa nilai P adalah
P = 2P ( V ≤ 5 bila H0 benar ) = 0.394 > 0.05.
Artinya, nilai V = 5 masuk akal pada tingkat signifikansi 0.05 ketika H0 benar, dan oleh
karena itu kita tidak memiliki cukup bukti untuk menolak hipotesis keacakan dalam sampel
kami.
Ketika jumlah runtutan besar ( misalnya jika V = 11, sedangkan n1 = 5 dan n2 = 7 ),
dan nilai-P dalam uji dua sisi adalah
P = 2P ( V ≥ 11 bila H0 benar ) =2 [1-P ( V ≤ 10 bila H0 benar )]
2( 1 - 0,992 ) = 0.016 < 0.05
Yang mengarahkan kita unutk menolak hipotesis bahwa nilai sampel terjadi secara acak.
Uji Runtutan juga dapat digunakan untuk memeriksa sifat keacakan suatu barisan
hasil pengamatan atau percobaan menurut waktu, yang disebabkan oleh kecenderungan atau
periodisitas. Dengan menggantikan setiap pengamatan sesuai dengan terjadinya dengan tanda
plus bila terletak di atas median dan tanda minus bila di bawah median, dan membuang
semua pengamatan yang persis sama dengan median, maka kita mendapatkan suatu barisan
tanda-tanda plus dan minus yang dapat diuji sifat keacakannya seperti diilustrasikan dalam
teladan berikut.
Contoh 16.7 :
Sebuah mesin diatur sehingga secara otomatis mengeluarkan minyak pengencer cat ke
dalam sebuah kaleng. Dapatkah kita mengatakan bahwa banyaknya pengencer yang
dikeluarkan oleh mesin ini bervariasi secara acak bila isi 15 kaleng berikut, berturut-turut,
adalah 3.6, 3.9, 4.1, 3.6, 3.8, 3.7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0, 3.8, 4.2 dan 4.1 liter? Gunakan
taraf nyata 0.1.
Jawab : dengan menggunakan prosedur 6 langkah, kita memperoleh
1. H0 : barisan itu acak
2. H1 : barisan tidak acak
3. α = 0.1
4. Test statistik, dengan V menyatakan banyaknya runtutan.
5. Pengamatan dengan tanda “ + “ bila lebih besar dari 3.9,dan tanda “ - “ bila lebih kecil
dari 3.9, dan membuang pengamatan yang sama dengan 3.9, maka kita memperoleh
barisan
- - +- - - - + + + + - + +
Yang menghasilkan n1 = 6, n2 = 7, dan V = 6.
6. Keputusan : karena V = 6 jatuh dalam wilayah penerimaan, maka kita terima hipotesis
bahwa isi kaleng itu bervariasi secara acak.
Uji Runtutan, meskipun kuasa ujinya lebih rendah, dapat juga digunakan sebagai
pilihan lain bagi uji jumlah-peringkat Wilcoxon untuk menguji bahwa dua contoh acak
berasal dari dua populasi yang sama sehingga mempunyai nilai tengah yang sama. Bila
populasinya setangkup, penolakan pendapat bahwa sebarannya sama setara dengan
penerimaan hipotesis alternatif bahwa kedua nilai tengah tidak sama. Untuk melakukan uji
ini, gabungkan semua pengamatan dari kedua contoh dan urutkan dari yang terkecil sampai
yang terbesar. Sekarang berikan huruf A pada pengamatan yang berasal dari populasi
pertama dan huruf B yang dari populasi kedua. Bila ada pengamatan dari populasi yang satu
sama dengan pengamatan dari populasi lainnya, maka barisan lambang-lambang A dan B
tidak khas (unik), sehingga banyaknya runtunannya pun tidak khas. Prosedur untuk
mengatasi ini biasanya menghasilkan perhitungan yang rumit, oleh karena itu kita lebih
menyukai menggunakan uji jumlah-peringkat Wilcoxon bila terjadi hal demikian.
Sebagai ilustrasi, perhatikan data pasien leukimia Latihan 16.16 pada halaman 686
yang menghasilkan
0.5 0.9 1.4 1.9 2.1 2.8 3.1 4.6 5.3
B, A, A, B, A, B, B, A, A
Sehingga diperoleh v = 6 turunan. Bila kedua posisi yang setangkup itu memiliki nilai tengah
yang sama, maka pengamatan dari kedua contoh dari kedua contoh itu saling bebaur,
sehingga akan diperoleh banyak runtutan. Akan tetapi, bila tengah populasinya berbeda
nyata, kita dapat membayangkan bahwa sebagian besar pengamatan dari salah satu contoh
akan lebih kecil daripada sebagian besar pengamatan dari contohnya lainnya. Dalam kasus
ekstrem dengan kedua populasi tidak berpotongan sama sekali, kita akan mendapatkan
barisan yang berbentuk.
A A A A A B B B B atau B B B B A A A A A
Yang menghasilkan hanya dua runtutan. Akibatnya, hipotesis kesamaan nilai tengah kedua
populasi akan ditolak bila v yang berimplikasi ujinya satu arah.
Kembali pada data latihan 16.16 pada halamanan 686 dengan n1 = 4 dan n2 = 5, kita
peroleh bahwa α = 2 untuk α = 0.05. karena nilai v = 6, kita mendapatkan dari Tabel A.19
bahwa
dengan demikian, bila n1 dan n2 keduanya lebih besar dari 10, kita menggunakan statistik
V −µv
Z=
Ov
Untuk menentukan wilayah kritiknya.
Batas toleransi untuk distribusi pengukuran normal dibahas dalam Bab 9. Pada bagian
ini kami mempertimbangkan metode untuk membangun interval toleransi yang independen
dari bentuk distribusi yang mendasarinya. Seperti yang mungkin dicurigai wc, untuk
tingkatonfielence c yang wajar, mereka akan jauh lebih lama daripada yang dibangun dengan
asumsi normalitas, dan ukuran sampel yang diperlukan umumnya sangat besar. Batas
toleransi non-parametrik dinyatakan dalam hal pengamatan terkecil dan terbesar, dalam
sampel kami.
Batas Toleransi Dua Sisi
Feir setiap distribusi pengukuran, batas toleransi dua sisi busur yang ditunjukkan oleh
pengamatan terkecil, dan terbesar dalam sampel ukuran n, di mana n ditentukan sehingga satu
e: an menegaskan dengan (1 - γ ) 100%keyakinan bahwa setidaknya proporsi 1 - 0. distribusi
termasuk antara sampel ekstrem.
Tabel A.20 memberikan ukuran sampel yang diperlukan untuk nilai yang dipilih 7
dan 1 - a. Misalnya, ketika 7 = 0,01 dan 1 - α = 0,95, kita harus memilih sampel acak ukuran
n = 130 agar 99% yakin bahwa setidaknya 95% dari distribusi pengukuran termasuk antara
ekstrem sampel.
Alih-alih menentukan ukuran sampel n sedemikian rupa sehingga proporsi
pengukuran tertentu terkandung antara sampel ekstrem, diharapkan dalam banyak proses
industri untuk menentukan ukuran sampel sehingga proporsi populasi tetap berada di bawah
pengamatan terbesar (atau di atas yang terkecil) dalam sampel. Batas-batas tersebut disebut
batas toleransi satu sisi.
Batas Toleransi Satu Sisi
Untuk setiap distribusi pengukuran, batas toleransi satu sisi ditentukan oleh
pengamatan terkecil (terbesar) dalam sampel ukuran n. di mana n ditentukan sehingga
seseorang dapat menegaskan dengan (1 - γ ) 100% keyakinan bahwa setidaknya proporsi 1 - α
distribusi akan melebihi pengamatan terkecil (kurang dari yang terbesar) dalam sampel.
Tabel A.21 menunjukkan ukuran sampel yang diperlukan sesuai dengan nilai yang
dipilih 7 dan 1 - α. Oleh karena itu, ketika 7 = 0,05 dan l - α = 0,70, WC harus memilih
sampel ukuran n = 9 agar 95% yakin bahwa 70% dari distribusi pengukuran kami akan
melebihi pengamatan terkecil dalam sampel.
16.7 Koefisien Korelasi Peringkat
di mana di adalah perbedaan antara peringkat yang ditugaskan ke xi dan iji, dan n adalah
jumlah pasangan data.
Dalam prakteknya rumus sebelumnya juga digunakan ketika ada ikatan antara
pengamatan rr atau y. Peringkat untuk pengamatan terikat ditugaskan seperti dalam tes
peringkat yang ditandatangani dengan rata-rata jajaran yang akan ditugaskan jika pengamatan
dapat dibedakan.
Nilai rs biasanya akan dekat dengan nilai yang diperoleh dengan menemukan r
berdasarkan pengukuran numerik dan ditafsirkan dengan cara yang sama. Seperti
sebelumnya, nilai rs akan berkisar dari -1 hingga +1. Nilai +1 atau -1 menunjukkan hubungan
sempurna antara X dan Y, tanda plus yang terjadi untuk peringkat identik dan tanda minus
yang terjadi untuk peringkat terbalik. Ketika rs mendekati nol, kami akan menyimpulkan
bahwa variabel tidak berkorelasi.
Contoh 16.8: Angka-angka yang tercantum dalam Tabic 16.7, yang dirilis oleh Komisi
Perdagangan Federal, menunjukkan miligram tar dan nikotin yang ditemukan dalam 10
merek rokok. Menghitung koefisien korelasi peringkat untuk mengukur tingkat hubungan
antara tar dan kandungan nikotin dalam rokok,
Solusi: Biarkan X dan Y mewakili isi tar dan nikotin, masing-masing. Pertama kita
menetapkan peringkat untuk setiap set pengukuran, dengan peringkat 1 ditugaskan ke angka
terendah di setiap set, peringkat 2 ke angka terendah kedua di setiap set. dan seterusnya,
sampai peringkat 10 ditugaskan ke nomor terbesar. Tabel 16.8 menunjukkan peringkat
individu pengukuran dan perbedaan peringkat untuk 10 pasang pengamatan.
( 6 ×5.50 )
r 5=1− =0,967
(10 )( 100−1 )
Menunjukkan korelasi positif yang tinggi antara jumlah tar dan nikotin yang ditemukan
dalam rokok.