Anda di halaman 1dari 52

MATERI STATISTIKA-NONPARAMETRIK SEM.

VIIA TA 2021/2022
KULIAH DIMULAI Tg 24 Agustus 2021

BAB I
1. Pengenalan Metode Nonparametrik
(Introducing Nonparametric Methods)
1.1 Statistika Dasar
1.2 Sampel dan Populasi
1.3 Perkiraan/Estimasi
1.4 Pengujian hipotesis

BAB II
2. Perkiraan Lokasi Untuk Sampel Tunggal
( Centrality Inference For Single Sample)
2.1 Uji Tanda
2.2 Kesimpulan Mengenai Median Berdasarkan Rank
2.3 Penduga Lokasi Lainnya
2.4 Bidang Penerapan

BAB III
3. Pengujian Distribusi dan Transformasi Rank untuk Sampel Tunggal
3.1 Mencocokkan Sampel dengan Distribusi
3.2 Kekekaran
3.3 Transformasi Rank
3.4 Implikasi Praktis dari Efisiensi
3.5 Asumsi-asumsi yang Dimodifikasi
Latihan

BAB IV
4. Metode untuk Sampel Berpasangan
4.1 Perbandingan Pasangan
4.2 Kelemahan Penggunaan Uji Tanda
4.3 Bidang Penerapan
Latihan

BAB V
5. Pengujian dan Perkiraan untuk Dua Sampel Bebas
5.1 Pengujian dan Perkiraan Lokasi
5.2 Selang kepercayaan Wilcoxon-Mann- Whitney
5.3 Pengujian Fungsi Rank
5.4 Uji untuk Kesamaan Varians
5.5 Pengujian untuk Distribusi Umum
5.6 Bidang Penerapan
Latihan
BAB VI
6. Tiga Sampel atau Lebih
6.1 Perluasan yang Mungkin
6.2 Pengujian Lokasi Untuk Sampel yang Bebas
6.3 Pengujian Heterogenitas Varians untuk Sampel yang Bebas
6.4 Pengujian Lanjutan Untuk Beberapa Sampel yang Bebas
6.5 Perbedaan Lokasi Untuk Sampel yang Berhubungan
6.6 Bidang Penerapan
Latihan

BAB VII s/d BAB IX

REFERENSI:
1. METODE STATISTIK NONPARAMETRIK TERAPAN
Oleh:
P. SPRENT
2. STATISTIK NONPARAMETRIK UNTUK ILMU-ILMU SOSIAL
Sydney Siegel ,
Gramedia – 1992
3. Dll

pi , α

1-α

p1 % n

x 1 , x 2 , .. . ,x n
BAB I
1. Pengenalan Metode Nonparametrik
(Introducing Nonparametric Methods)

1.1Statistika Dasar Tugas

1.2 Sampel dan Populasi

Serahkan dalam bentuk FILE kirim ke email rahmawatipane@usu.ac.id paling


lambat tg 29 Agustus 2021 jam 20.00

Bagi siapa yang tidak menyerahkan filenya pd waktu yg telah ditentukan berarti
ybs tdk menyerahkan TUGASnya yg pertama.

1 Statistika Dasar

Uraikan apa itu Jelaskan apa itu STATISTIKA


STATISTIK Termasuk pembahagian dan Jenis2nya

2. Sampel dan Populasi


Statistik Parameter

Data

Teknik Penarikan Sampel

Distribusi Sampling
Data Tunggal
Distribusi Frekuensi
Data Berkelompok
Sebelum kita membahas Statistik
Nonparametrik, perlu kita ketahui metode
parametrik.
Metode parametrik adalah suatu metode
dalam statistika yang sering digunakan dalam
kehidupan se-hari2 yang erat hubungannya
dengan kejadian/peristiwa yang mempunyai
distribusi, misalnya kebutuhan rumah tangga
pada umumnya berdistribusi normal, kegiatan
pemeriksaan kondisi suatu hsil produksi pada
umumnya berdistribusi binomial atau
multinomial. Sedangkan statistik
Nonparametrik bebas distribusi artinya tidak
dapat kita katakana apakah berdistribusi
normal, binomial atau yang lain.

Mengapa Kita Membutuhkan Metode


Nonparametrik???

1.1.2 hal 3 P.Sprent


Sebuah uji parametric tergantung keabsahannya
pada asumsi bahwa kita menarik sampel secara
acak dari sebuah distribusi yang memiliki sebuah
keluarga/kelompok tertentu. Jika terdapat
keraguan, maka uji nonparametrik yang sah
dengan asumsi yang lebih lemah dapat digunakan.
Metode-metode nonparametric tidak terhingga
nilainya, tentu saja metode-metode ini biasanya
hanya tersedia bila kita mempunyai data yang
tersususn secara urut atau rank atau proporsi dan
tidak teliti nilai pengamatannya.
Jadi, Statistik non parametrik adalah salah satu
metode statistik yang dapat digunakan sebagai
alternatif apabila metode statistik parametrik tidak
dapat dilakukan.
1.3 Perkiraan/Estimasi
1.3.1 PENGUJIAN HIPOTESIS

Selang Kepercayaan

UJI HIPOTESIS Ada tiga macam


H 
1. 0
H  
1

2. H0 = 0
H1 ¿ 0

3. H0 = 0
H1 ¿ 0

JENIS KESALAHAN(24- 08-2021)

Pada Pengujian Hipotesis ada dua jenis kesalahan yang


mungkin terjadi. Kemungkinan keadaan dalam pengujian
hipotesis Statistik. Kita mungkin menolak hipotesis nol, H0 ,

padahal H0 benar. Hal ini terjadi jika hasil pengujian kita


terletak pada daerah kritis( daerah untuk penolakan) di mana
hipotesis nol adalah benar. Jika terjadi seperti ini dikatakan bahwa
kita melakukan sebuah kesalahan dari jenis pertama.
Kita melakukan sebuah kesalahan jenis kedua jika kita tidak

menolak hipotesis nol, H0 , padahal H 0 , salah. Hal ini terjadi jika


hasil kita terletak di luar daerah penolakan, atau daerah

penerimaan, daerah dimana H 0 , adalah salah. Kita akan lebih suka

hasil kita terletak dalam daerah kritis padahal H 0 , salah, yaitu H1 ,


benar. Pernyataan di atas dapat ditulis dengan singkat seperti pada
tabel berikut:
Tabel 1. Kemungkinan keadaan dalam Pengujian Hipotesis
Statistik.

Keadaan Sebenarnya
Kesimpulan H 0 benar H 0 salah
H , Keputusan benar (benar) kesalahan jenis kedua ( keliru)
Terima 0
H , kesalahan jenis pertama. Keputusan benar (benar)
Tolak 0

Peluang melakukan kesalahan jenis pertama, disebut juga taraf


keberartian, dinyatakan dengan huruf Yunani  , dengan kata lain
P(galat jenis I ) =  .
Peluang melakukan kesalahan jenis kedua, dinyatakan  , yaitu

P(galat jenis II ) =  .
1.4 Perkiraan/Estimasi (31 Agustus 2021)
1.4.1 Selang Kepercayaan
Ada dua bentuk estimasi parameter populasi
(θ) dalam statistika, yaitu estimasi titik dan estimasi selang.
Peluang menghasilkan nilai parameter dengan menggunakan
estimasi titik biasanya sangat kecil. Oleh karena itu, dirancanglah
suatu bentuk estimasi parameter populasi yaitu dengan
menggunakan selang (interval) kepercayaan. Dengan estimasi
selang kepercayaan, peluang mendapatkan nilai parameter akan
menjadi lebih besar.

Jika θ adalah parameter populasi dan ˆ  adalah estimator titiknya,

maka bentuk selang kepercayaan dari parameter θ adalah P(ˆ - d <

 < ˆ +d)=(1- ) 100%. dimana d adalah margin of error,


(1−α) adalah tingkat kepercayaan dan α adalah tingkat signifikansi.
Selang kepercayaan biasanya juga ditulis dalam bentuk

ˆ - d <  < ˆ +d

Dari bentuk persamaan di atas, maka selang kepercayaan


adalah sebuah interval antara dua nilai yang memuat nilai
parameter. Selang yang terbaik dalam mengestimasi
parameter adalah selang yang terpendek dan mempunyai
tingkat kepercayaan paling tinggi.

Berikut ini adalah beberapa bentuk selang kepercayaan


dalam pendugaan parameter populasi yang sering
digunakan.

Rata-rata (mu)(μ)
Selang kepercayaan untuk rata-rata populasi dapat dilakukan jika 
x1 , x2 , x3 ,..., xn berasal dari populasi yang mengikuti Distribusi

Normal dengan rata- rata \muμ dan varian ( ). Selang


2

kepercayaan rata-rata ini memiliki dua kasus yaitu kasus:


1. varian populasi /sigma^2 / diketahui,
2

 2 2 
P  x - z   < x + z  = 1- 
 2
n 2
n 

x -Z_{\alpha/2}\sqrt{\frac{\sigma^2}{n}}<\mu<\bar{x}
+Z_{\alpha/2}\sqrt{\frac{\sigma^2}{n}}xˉ−Zα/2nσ2<μ<xˉ+Zα/2nσ2
2. varian populasi  
2
tidak diketahui (sampel kecil).

 s s 
P  x - t   < x + t  = 1- 
 2
n 2
n

bar{x}-t_{\alpha/2,df}\sqrt{\frac{\sigma^2}{n}}<\mu<\bar{x}
+t_{\alpha/2,df}\sqrt{\frac{\sigma^2}{n}}xˉ−tα/2,dfnσ2<μ<xˉ+tα/2,df
nσ2

Varians  ( )
2

Sama seperti selang kepercayaan untuk rata-rata, selang kepercayaan untuk


varian dapat dilakukan jika x_1,x_2,\cdots,x_nx1,x2,⋯,xn juga berasal dari
populasi yang berdistribusi normal dengan rata-rata dan varian. Selang
kepercayaan varian ini juga memiliki dua kasus yaitu kasus untuk:

1. varian populasi   diketahui,


2. varian populasi   tidak diketahui (sampel kecil).

Proporsi (p)(p) ( ) ( )
2 2

Selang kepercayaan untuk proporsi dapat dilakukan jika x_1,x_2,\cdots,x_nx1


,x2,⋯,xn berasal dari populasi yang berdistribusi binomial dengan jumlah
sampel (n)(n) dan proporsi (p)(p) atau bentuknya bisa ditulis
dengan \text{Binomial}(n,p).Binomial(n,p).

\hat{p}-Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}<p<\hat{p}
+Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}p^−Zα/2np^(1−p^)
<p<p^+Zα/2np^(1−p^)

Selisih Dua Rata-rata (\mu_1-\mu_2)(μ1−μ2) 1  2

Selang kepercayaan untuk selisih rata-rata \mu_1μ1 dan \mu_2μ2 dapat


dilakukan jika x_{11},x_{12},\cdots,x_{1n}x11,x12
,⋯,x1n dan x_{21},x_{22},\cdots,x_{2n}x21,x22,⋯,x2n masing-masing
berasal dari populasi yang berdistribusi normal dengan rata-
rata \mu_1μ1 dan \mu_2μ2 serta varian \sigma_1^2σ12 dan \sigma_2^2.σ22
. Selang kepercayaan rata-rata ini memiliki tiga kasus yaitu kasus untuk:
1. varian kedua populasi \sigma_1^2σ12 dan \sigma_2^2σ22 diketahui,

(\bar{x}_1-\bar{x}_2) - Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}
{n_1}+\frac{\sigma_2^2}{n_2}} <\mu_1-\mu_2<
(\bar{x}_1-\bar{x}_2) + Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}
{n_1}+\frac{\sigma_2^2}{n_2}}(xˉ1−xˉ2)−Zα/2n1σ12+n2σ22<μ1−μ2
<(xˉ1−xˉ2)+Zα/2n1σ12+n2σ22
2. varian kedua populasi \sigma_1^2σ12 dan \sigma_2^2σ22 tidak diketahui
dan diasumsikan sama,

(\bar{x}_1-\bar{x}_2) - t_{\alpha/2,df}\,S_p\sqrt{\frac{1}
{n_1}+\frac{1}{n_2}} <\mu_1-\mu_2< (\bar{x}_1-\bar{x}_2) +
t_{\alpha/2,df}\,S_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}(xˉ1−xˉ2)
−tα/2,dfSpn11+n21<μ1−μ2<(xˉ1−xˉ2)+tα/2,dfSpn11+n21
dimanaSp=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-
2}}Sp=n1+n2−2(n1−1)s12+(n2−1)s22dandf=n_1+n_2-2.df=n1+n2−2.
3. varian kedua populasi \sigma_1^2σ12 dan \sigma_2^2σ22 tidak diketahui
dan diasumsikan tidak sama.

(\bar{x}_1-\bar{x}_2) - t_{\alpha/2,df}\sqrt{\frac{s_1^2}
{n_1}+\frac{s_2^2}{n_2}} <\mu_1-\mu_2< (\bar{x}_1-\bar{x}_2)
+ t_{\alpha/2,df}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}(xˉ1
−xˉ2)−tα/2,dfn1s12+n2s22<μ1−μ2<(xˉ1−xˉ2)+tα/2,dfn1s12+n2s22
dimanadf=\frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}
{n_2}\right)^2}{\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-
1}+\frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}}df=n1−1(n1s12)2+n2
−1(n2s22)2(n1s12+n2s22)2

Perbandingan Dua Varian (\sigma_1^2 / \sigma_2^2)(σ12


/σ22)
Selang kepercayaan untuk perbandingan dua
varian \sigma_1^2σ12 dan \sigma_2^2σ22 dapat dilakukan
jika x_{11},x_{12},\cdots,x_{1n}x11,x12,⋯,x1n dan x_{21},x_{22},\cdots,
x_{2n}x21,x22,⋯,x2n masing-masing berasal dari populasi yang berdistribusi
normal dengan rata-rata \mu_1μ1 dan \mu_2μ2 serta
varian \sigma_1^2σ12 dan \sigma_2^2.σ22.

Selisih Dua Proporsi (p_1-p_2)(p1−p2)

Selang kepercayaan untuk selisih dua proporsi antara p_1p1 dan p_2p2 dapat


dilakukan jika x_{11},x_{12},\cdots,x_{1n}x11,x12
,⋯,x1n dan x_{21},x_{22},\cdots,x_{2n}x21,x22,⋯,x2n masing-masing
berasal dari populasi yang berdistribusi binomial dengan jumlah
sampel n_1n1 dan n_2n2 dan proporsi p_1p1 dan p_2p2 atau bentuk masing-
masing populasi bisa ditulis dengan \text{Bin}(n_1,p_1)Bin(n1,p1
) dan \text{Bin}(n_2,p_2).Bin(n2,p2).(\hat{p}_1-\hat{p}_2)-
Z_{\alpha/2}\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}
{n_1}+\frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}<p_1-
p_2<(\hat{p}_1-\hat{p}_2)+Z_{\alpha/2}\sqrt{\frac{\hat{p}_1(1-\hat{p}
_1)}{n_1}+\frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}(p^1−p^2)−Zα/2n1p^1
(1−p^1)+n2p^2(1−p^2)<p1−p2<(p^1−p^2)+Zα/2n1p^1(1−p^1)+n2p^2(1−p^2)

Artikel yang berhubungan:


 Selang Kepercayaan
 Uji t - Uji Hipotesis Rata-rata Data Berpasangan
 Uji Z - Uji Hipotesis Rata-rata Dua Populasi
 Uji t - Uji Hipotesis Rata-rata Dua Populasi
 Estimasi Parameter (Penaksiran Parameter)
 Pengujian Hipotesis
 Uji Independensi Chi Square
 Ciri-ciri Penduga yang Baik
 Uji t - Uji Hipotesis Rata-rata Satu Populasi
 Uji Z - Uji Hipotesis Proporsi Satu Populasi
1.4.2 Selang Toleransi

Konsep berguna lainnya adalah sebuah selang/interval


toleransi. Konsepnya adalah selang dengan sifat-sifat:

 Ditentukan
pi ,  adalah probabilitas pada paling

sedikit 1- yang selangnya mencakup


p1 %

dari populasi. Sebuah sampel dengan n pengamatan

x1 , x 2 , ... , x n dari sebuah distribusi kontinu, konsep selang


toleransi digunakan untuk menjawab pertanyaan:

“Berapa besar n sehingga probabilitas paling sedikit

95%, dan bahwa 90% populasi terletak antara nilai


sampel terkecil dan terbesar ?” Atau berapa besar sampel yang

dibutuhkan untuk menjamin bahwa dengan probabilitas


0,8

paling sedikit 75% dari populasinya melebihi nilai sampel


kedua terkecil.?

BAB II
2. Perkiraan Lokasi Untuk Sampel Tunggal
( Centrality Inference For Single Sample)
( 31 Agustus 2021)
2.1 Uji Tanda
Telah diperkenalkan uji tanda secara informal pada
contoh terdahulu ( mengenai halaman buku). Kita
melihat lebih dekat pada asumsi dan pada kesulitan-
kesulitan yang terjadi serta perluasan konsep yang
dihubungkan dengan masalah tersebut.
Dalam sebahagian besar masalah nonparametrik, kita
akan membahas masalah-masalahnya secara
berurutan dengan judul ;
Masalah
Formulasi dan asumsi
Prosedur
Kesimpulan
Komentar

2.1.1 Pengaruh dari Ukuran Sampel


Untuk uji tanda _ dan demi kesederhanaan seluruh metode
dalam pembicaraan ini sebuah sampel yang lebih besar
menambah kuasa/kekuatan pengujian dan memungkinkan
kita memperoleh selang kepercayaan yang lebih pendek
dengan tingkat signifikansi tertentu.
Contoh 2.1 :

Masalah
Kembali pada masalah-masalah buku statistic yang ada. Data jumlah halaman
untuk seluruh buku (114 buah buku) adalah sebagai berikut :
390 74 189 242 614 296 335 171 427 214 279 429
370 625 287 249 625 783 340 212 686 228 419 467
454 532 283 330 631 709 207 173 230 245 93 433
676 551 246 398 245 511 166 156 593 280 305 284
212 210 307 296 173 153 193 401 240 537 264 402
308 485 365 319 544 168 181 472 361 331 244 354
128 292 181 137 255 312 235 464 503 324 271 312
358 356 110 218 276 425 296 575 248 433 369 142
126 478 157 305 391 412 437 395 258 192 319 197
42 40 34 493 264 199

Pada contoh yang lalu kita membicarakan sebuah sampel


acak berukuran 12, diterapkan sebuah uji tanda dan tidak

menolak hipotesis
H 0 bahwa median jumlah halaman per
buku adalah 220. Apakah kita akan memperoleh kesimpulan
yang sama jika ukuran sampel digandakan menjadi 24?
Berikut ini adalah jumlah halaman, setelah disusun, untuk
sampel acak berukuran 24 buku dari 114 buku yang ada.

153 166 181 192 244 248 258 264 296 305 305 312
330 340 356 361 395 427 433 467 544 551 625 783

Formulasi dan asumsi


Jika median populasi  adalah 220 maka setiap buku dalam
sampel acak mempunyai kemungkinan yang sama untuk
mempunyai lebih dari atau kurang dari 220 halaman( dengan
mengabaikan untuk sesaat kemungkinan buku-buku
mempunyai tepat 220 halaman). Distribusi tanda positif
(jumlah buku dengan halaman lebih dari 220 ), adalah

1
p .
distribusi binomial dengan n  24 dan 2 Kita menguji

hipotesis ( Jumlah median halaman buku adalah 220)

H 0 :   220
H1 :   220
Merupakan pengujian dua arah yang sesuai.

Prosedur
Ada empat pengamatan dibawah 220, yaitu 153, 166, 181,
dan 192. Ini menyatakan 4 tanda negative dan 20 tanda positif
dalam sampel yang berukuran 24. Kita memerlukan

1
p
probabilitas binomial untuk n  24 dan 2 yang
diberikan pada Tabel 2.1 berikut ini untuk melihat jika ini
nyata.
Dengan memperhatikan distribusi binomial adalah simetrik di

1
p ,
mana 2 kita hanya perlu mencatat probabilita untuk

r  12; probabilita dari 24  r tanda positif sama

probabilita dengan r tanda negatif. Ini berarti kita juga


dapat melakukan pengujian dua arah dengan memperhatikan
jumlah tanda positif atau tanda negatif, karena jika jumlah
tanda positif terletak di atas daerah kritis, jumlah tanda
negatif terletak secara simetrik di bawah daerah kritis.
1
p
P, untuk n  24 dan 2
Tabel 2.1 Probabilitas Binomial,
0 1 2 3 4 5 6 7 8 9 10 11 12
p 0,000 0,00 0,00 0,000 0,00 0,002 0,00 0,021 0,04 0,07 0,117 0,148 0,162
0 0 1 8 4 8

Dengan menggunakan prinsip-prinsip yang diberikan pada


sub bab sebelumnya yaitu pada pengujian hipotesis, kita
memilih sebuah daerah kritis berukuran nominal 0,05 dengan
memilih masing-masing hasil dari arahnya dengan total
probabilita yang tidak lebih dari 0,025 pada sisi tersebut.
Jelasnya ini termasuk nilai 0 sampai 6 ( total probabilita
gabungannya adalah 0,011). Karena kesimetrikannya, nilai 18
sampai 24 dari sisi teratas mempunyai total probabilita yang
sama. Kita mengamati empat tanda minus(tanda negatif),
sehingga hasil kita terletak dalam daerah kritis untuk sebuah
pengujian pada tingkat nominalnya 5%( tingkat sebenarnya
untuk pengujian dua arah adalah (2x0,011)x100% = 2,2%)

Kesimpulan
Kita menolak hipotesis bahwa jumlah median halaman buku
adalah 220. Jumlah lebih besar dari tanda-tanda positif
menyarankan sebuah median lebih tinggi.

Komentar
1. Nilai 0 sampai 5 dari sisi terendah pada daerah kritis
untuk sebuah pengujian dua arah berukuran nominal
0,01(ukuran sebenarnya 2 x 0,003 = 0,006). Hasil ini
biasa, dan diperlukan untuk memperoleh tingkat nyata
terendah yang dimungkinkan dari tiga nilai nominal
yang umum digunakan yaitu 5%, 1% atau 0,1%.

2.1.2 Selang Kepercayaan (31 Agustus 2021)


Contoh 2.2
Masalah
Dapatkan selang kepercayaan 95% untuk median
panjang buku yang didasarkan pada uji tanda dengan
menggunakan data sampel pada contoh 2.1
153 166 181 192 244 248 258 264 296 305 305 312
330 340 356 361 395 427 433 467 544 551 625 783
Formulasi dan asumsi

Kita mencari seluruh nilai untuk  0 , yaitu nilai median

sebenarnya, yang tidak akan ditolak dalam pengujian dua


arah pada tingkat sigfikansi /nyata 5%.

Prosedur
Kita menggunakan Argumen yang dikembangkan pada sub
bab 1.4 yaitu Perkiraan/ selang kepercayaan. Dalam contoh 2.1
kita memperoleh daerah kritis untuk pengujian pada tingkat
nyata 5% dengan sampel berukuran 24 menjadi 0 sampai 6,
dan 18 sampai 24, yang menyatakan agar kita menolak dengan
6 tanda positif atau kurang dan 18 lebih tanda positif. Data
pada contoh 2.1 disusun, dan pengujiannya akan tampak jelas
bahwa kita tidak akan menolak setiap hipotesis yang
mediannya lebih besar dari 258(jika ini akan memberikan
paling sedikit 7 tanda negatif) tetapi kurang dari 427(jika ini
akan memberikan paling sedikit 7 tanda positif). Nilai-nilai
yang kurang dari 258 atau lebih besar dari 427 pada sisi lain
akan memberikan 6 atau kurang tanda negatif dan 6 atau lebih
tanda positif.
Kesimpulan
Selang kepercayaan nominal 95%( sebenarnya 100(1-0,222)%
= 97,8%) adalah 258 sampai 427.
Komentar
Selang kepercayaan 95% dengan asumsi kenormalan dan

berdasarkan pada distribusi- t adalah (291, 420); panjang


selang ini lebih pendek dibandingkan selang di atas
(258, 427); yang mencerminkan efisiensi yang lebih besar

beserta asumsi yang lebih kuat. Perhatikan bahwa selang


kepercayaan nominal dan sebenarnya adalah sama untuk
selang yang didasarkan pada uji tanda; sehingga selangnya
tidak dengan tepat dapat dibandingkan.
1. Pada sub bab 1.3.1 (selang kepercayaan) kita telah
menunjukkan bahwa dengan sebuah sampel berukuran
12, prosedur uji tanda memberikan selang kepercayaan

95% yaitu (156, 454), dan berkaitan dengan selang yang


didasarkan pada asumsi normal serta distribusi- t yaitu
(227, 405).
X  (227, 405). 227  X  405.
Artinya

2.1.3 Pendekatan Sampel Besar ( 7 September 2021)


Jika n > 20, sebuah pendekatan yang didasarkan pada
distribusi normal biasanya sesuai. Untuk setiap distribusi
binomial
 n 

B( x; n; p )   x  p x q n  x , x = 0, 1, 2, ..., n
0,
 , jika n cukup

besar dan p tidak terlalu kecil (sehinga np > 10 berguna


bagi pedoman pendekatan) dan X adalah jumlah sukses
maka
X  np
Z =
( npq )
(2.1)

dimana q = 1  p mengikuti distribusi normal dengan rata-


rata 0 dan simpangan baku 1(distribusi normal baku).

1  1 x2
f ( x)  e 2
X  N (0,1) ; 2

1  12  x 
2

f ( x)  e , - < x  
X N ( , 2 ) ; 2

Tabel-tabel yang memberikan probabilita bahwa Z


mempunyai nilai kurang dari atau sama untuk setiap nilai
tertentu (yaitu fungsi distribusi kumulatif cukup banyak
tersedia).

Untuk uji tanda p  q =


1
2 persamaan (2.1) menjadi :
X 1
2 n
Z =
1
2 n (2.2)
Pendekatan ini telah diperbaiki dengan koreksi kontinuitas yang
memungkinkan bagi penaksiran variabel diskrit yang mempunyai

nilai-nlai 0, 1, 2, ..., n dengan variabel kontinu yang mempunyai


nilai nyata. Jika r lebih besar daripada jumlah tanda positif atau

tanda negatif, kita mengurangi


1
2 dari r, yaitu
X = r  12
dalam (2.2). Jika r lebih kecil daripada jumlah tanda positif atau

tanda negatif, kita menambahkan


1
2 pada r , yaitu X = r  12
dalam persamaan (2.2).

Pengujian pada tingkat nyata


5%, kita menolak
H0 dalam

pengujian dua arah jika


Z > 1,96 atau kurang dari
- 1,96 ,

yaitu jika Z mempunyai nilai-nilai di luar selang

(1,96, 1,96). Hal ini sesuai pada kasus ini untuk menyatakan

Z  1,96
sebagai daerah kritis penolakan, dimana tanda
harga mutlak menunjukkan bahwa kita mengambil besarnya (nilai

positif) Z , juga ditujukan sebagai modul dari Z .


H 0 :   0
H1 :    0
kemungkinannya
  0 atau
  0

Untuk pengujian satu arah pada tingkat nyata 5%, kita

menggantikan 1,96 dengan 1, 64 (atau 1, 64 , jika sisi terbawah

relevan). Nilai – nilai penolakan untuk tingkat nyata 1%,

adalah 2,58 ( dua arah) dan 2,32 atau 2,32 (satu arah).

Contoh 2.3 :
Masalah.

Dengan data pada contoh 2.1, ujilah hipotesis


H 0 :   220
dengan menggunakan pendekatan normal sampel besar pada uji

tanda dua arah.


H1 :   220
Formulasi dan asumsi
Seperti dalam contoh (2.1) tetapi sekarang menggunakan
rumus (2.1) dengan sebuah koreksi berkelanjutan
Prosedur
Kita mengamati 4 tanda negatif dan 20 tanda positif, sehingga

r  20 ; dengan sebuah koreksi kontinuitas ,


X  20 - 1  19 1
2 2 . Karena n  24 dengan rumus (2.2)

X 1
2 n
memberikan Z =
1
2 n
(19,5  12)
Z =
1
2 24

Z = 3.06, yang menunjukkan tingkat nyata 1%.

Tabel distribusi normal menunjukkan bahwa


Pr( Z > 3, 06) = 0,0011. Karena sifat kesimetrikan dari distribusi

normal maka nilai tersebut sama dengan Pr( Z < 3, 06). Dari Tabel

2.2 dapat dilihat bahwa Pr(r < 4) = Pr(r > 20) = 0,001.
1
p
2 Probabilitas Binomial, P, untuk n  24 dan 2
Tabel 2.
0 1 2 3 4 5 6 7 8 9 10 11 12
p 0,000 0,00 0,00 0,000 0,00 0,003 0,01 0,032 0,07 0,15 0,271 0,419 0,581
0 0 1 1 6 4

Sebuah nilai yang lebih teliti untuk probabilita ini adalah 0, 0009 ,
dalam probabilita, yang sesuai dengan pendekatan normal, yaitu
0, 0011 .
Kesimpulan

H0 pada tingkat nyata nominal 1%.


Kita menolak

Komentar
Kita kembali mendapatkan kesimpulan yang sama jika

mengerjakan dengan arah terbawah, dengan mengambil

X =4+ 1 .
2

2.1.4 Nilai Kritis Sampel Besar dan Selang Kepercayaan


Kita dapat menuliskan kembali persamaan (2.2)
X 1
2 n
Z =
1
2 n

untuk mendapatkan taksiran nilai kritis


r0 ,

yang lebih kecil, dari jumlah tanda positif atau tanda negatif.

Jika kita menganggap X = r0 sebagai yang tidak diketahui,

tetapi menentukan Z =  1,96, maka untuk nilai n tertentu

kita dapat menghitung


r0 . Kita menolak H 0 jika r , yang

lebih kecil daripada jumlah tanda positif atau tanda negatif,

kurang atau sama dengan


r0 . Akan lebih baik menggunakan

koreksi kontinuitas, yaitu X  r0 + 1 2 untuk jumlah yang


lebih kecil. Manipulasi aljabar sederhana dari (2.2) dengan
Z  -1.96 selanjutnya memberikan

r0 = 1 2 n - 0,98 n -12 (2.3)


Dengan menggantikan n = 24 pada pers(2.3) menghasilkan

r0 = 12 - 0,98 24 - 0.5 r0 = 6.69.


Karena r hanya dapat mengambil nilai-nilai integral kita

menolak H 0 jika r  6, sesuai dengan kriteria pastinya.


Penghitungan yang sama dapat digunakan dengan tingkat
nyata lainnya untuk pengujian satu atau dua arah. Satu kali

nilai kriteria
r0 ditetapkan, selang kepercayaan dapat
diperoleh untuk pengujian yang tepat. Luas

TABEL NORMAL
0 z
z 0,00 0,06 0,07 … 0,09
-1,4
.
.
.
0,0
0,1 0,5398 0,5753
.
.
.
1,7 0,9616
3,0 0, 9989

2.1.5 Uji Tanda Yang Dimodifikasi


Kita telah membicarakan uji tanda untuk sebuah
median populasi. Jika populasinya simetrik maka rata-
rata dan median sama, karena itu uji ini merupakan

pengujian mengenai rata-rata populasi (  ).


Jika populasi tidak simetrik, kita tidak dapat
menggunakan uji tanda sebagai pengujian mengenai

rata-rata, misalnya  , adalah rata-rata dari variabel

acak X yang berdistribusi tidak simetrik, maka secara

umum Pr(x <  )  Pr(x >  ) sehingga


penyimpangan jumlah tanda positif dan tanda negatif
dari rata-rata tidak lebih panjang dari distribusi

binomial dengan p = 1 2.
Kita dapat menggunakan uji tanda yang dimodifikasi
untuk menguji hipotesis mengenai distribusi Kuantil
selain median. Kuantil ke-k dari sebuah distribusi

kontinu ditentukan sebagai nilai


qk dari variabel acak

x sehingga Pr(x < qk )  k dan Pr(x > qk )  1- k.

q 12
Jadi jelaslah adalah median. Untuk distribusi

kontinu
qk adalah unik; Untuk distribusi diskrit
khusus diperlukan konversi khusus untuk menentukan
r
k = , r = 1, 2, 3,
kuantil khas (unique). 4 kuantil-
kuantilnya adalah kuartil ke-r. Khususnya jika

k = 0,1r , dimana r adalah bilangan bulat antara 0

1
qk adalah desil ke-r, dan jika k = r
dan 9, 4 dimana

r = 1,2, atau 3, qk adalah kuartil ke-r. Kuartil


kedua adalah mediannya; begitu pula desil kelima.
Contoh 2.4
Masalah
Suatu badan pusat pengujian memberikan sebuah nilai
dalam persentase pada masing-masing peserta dan
menerbitkan informasi bahwa “tiga perempat dari
calon-calon mendapat nilai 40 atau lebih”. Sebuah
sekolah memasukkan 32 calon, 13 calon mendapat nilai
kurang dari 40. Ketua Perkumpulan Orang Tua Murid
berpendapat kejadian ini merupakan bukti bahwa
prestasi sekolah di bawah standar nominal. Kepala
sekolah menentang dengan menyatakan bahwa jika
seseorang mengambil sampel acak berukuran 32 calon,
tidaklah mungkin bahwa 13 calon mendapat nilai kecil
daripada nilai kuartil yang lebih rendah, meskipun 8
dalam 32 adalah proporsi nasional.
Apakah pernyataan kepala sekolah tersebut dapat
dibenarkan?
Formulasi dan Asumsi.
Secara formal, pernyataan kepala sekolah dapat diuji
dengan menggunakan sebuah uji hipotesis

H 0 : q 14 = 40
terhadap hipotesis alternatif
H1 : q 14  40
Prosedur
Misalkan tanda negatif dengan nilai calon di bawah 40,
tanda positif dengan setiap nilai calon di atas 40.
Kita mempunyai 13 tanda negatif ( dan 19 tanda positif)
untuk sampel kita yang berukuran 32. Jika nilai kuartil

1
,
pertama adalah 40 kemudian probabilitasnya 4

yaitu setiap calon pada sampel acak mempunyai nilai di


bawah 40(dan diberi skor sebagai sebuah tanda negatif)

1
dan probabilitasnya 4 untuk nilai di atas 40(diberi

skor sebuah tanda positif). Distribusi tanda negatif

1
p= .
karena itu binomial dengan n = 32, 4
Tabel-tabel probabilitas yang pasti untuk distribusi ini

1
p= .
memang ada ( tetapi kurang umum jika disbanding 2
1
p=
Neave(1981) memberikan table binomial dengan 4 dan
n  20.
Untuk pengujian dua arah bila n = 32, daerah kritisnya

dengan ukuran nominal 0, 05 terdiri dari 3 atau kurang


tanda negative atau 14 atau lebih tanda negatif.

Ukuran sebenarnya daerah kritis ini adalah 0,041.


Kesimpulan
Setelah mengamati 13 tanda negative kita tidak
menolak hipotesis nol bahwa median populasi adalah
40. Dalam arti bahwa pernyataan Kepala sekolah
memang benar.
Komentar:
1. Igat bahwa tidak menolak sebuah hipotesis tidaklah
membuktikan itu benar. Ini hanya sebuah
pernyataan bahwa bukti pada saat ini tidak cukup
untuk menolak hipotesis tersebut. Kita mungkin
masih dapat melakukan sebuah kesalahan jenis
kedua dengan tidak menolak.
2. Kita menggunakan sebuah pengujian dua arah.
Apakah pengujian satu arah dapat dibenarkan?
Banyak Banyak statistik akan menyatakan tidak,
kecuali ada informasi tambahan yang menunjukkan
bahwa sangatlah tidak mungkin prestasi sekolah
dapat lebih baik daripada ukuran nasional.

2.1.6 Uji Tanda Untuk Trend


Cox dan Stuart(1955) menyarankan sebuah penggunaan
uji tanda untuk menentukan keberadaan sebuah trend
yang monoton, yaitu trend yang menaik atau menurun.
Sebuah garis lurus adalah bentuk trend monoton yang
paling sederhana, dan dengan asumsi sederhana mengenai
asal trend linear, regresi kuadrat terkecil merupakan
sebuah metode pendekatan yang sering digunakan untuk
membuat kesimpulan. Tetapi trend monoton tidak perlu
linear; hal itu dapat dengan mudah menyatakan sebuah
kecenderungan untuk pengamatan-pengamatan guna
meningkatkan persoalan ketidakteraturan lokal atau acak.
Perhatikan sekumpulan pengamatan yang bebas
x1 , x 2 , x 3 , ... ,x n disusun menurut waktu. Jika mempunyai

sejumlah pengamatan yang genap, umpamanya n = 2m,


kita dapat membuat selisih- selisih
x m 1 - x1 , x m  2 - x 2 , x m 3  x 3 , ... , x 2 m - x m . Untuk sejumlah

pengamatan yang ganjil, 2m  1 , kita dapat menghasilkan


seperti di atas dengan menghilangkan nilai di tengah x m1

dan menghitung x m 2 - x1 dan seterusnya. Jika ada sebuah


trend yang menaik, kita dapat mengharapkan banyak
selisih ini menjadi positif, sedangkan jika tidak ada trend
dan pengamatannya berbeda fluktuasi acak mengenai
beberapa median, maka selisih-selisih ini ( dengan asumsi
kebebasan) mungkin sama untuk menjadi positif atau
negatif, Selisih-selisih negatif yang jumlahnya lebih besar
menyatakan sebuah trend yang menurun.
Hal ini menyimpulkan bahwa dengan hipotesis tidak ada
trend, tanda positif atau negatif mempunyai distribusi

binomial dengan parameter m dan p  1 2 .

Contoh:2.5
Masalah
Departemen perdagangan Amerika Serikat menerbitkan
perkiraan yang diperoleh dari sampel-sampel bebas
mengenai rata-rata jarak yang ditempuh oleh berbagai
jenis kenderaan di Amerika Serikat setiap tahun. Angka-
angka untuk mobil dan truk (dalam ribuan mil) diberikan
pada tabel di bawah ini dari tahun 1970-1983. Dalam kasus
ini apakah ada sebuah trend yang monoton?
1 mil = 1,609 km
Mobil 9.8 9.9 10.0 9.8 9.2 9.4 9.5 9.6 9.8 9.3 8.9 8.7 9.2 9.3
Truk 11.5 11.5 12.2 11.5 10.9 10.6 11.1 11.1 11.0 10.8 11.4 12.3 11.2 11.2

Formulasi dan Asumsi:


H 0 tidak ada trend yang monoton
H1 ada trend yang monoton
Karena angka-angka untuk masing-masing tahun
didasarkan pada sampel-sampel bebas, maka kita dapat
menggunakan Uji Cox Stuart untuk trend. Tanpa asumsi
lebih lanjut, sebuah pengujian dua arah adalah cocok
sebagai trend yang mungkin menaik atau menurun.

Prosedur

Untuk mobil-mobil, menurut data n = 2m,


jadi n = 14  m = 7
Rumus Cox Stuart untuk selisih-selisih adalah:
x m 1 - x1 , x m  2 - x 2 , x m 3  x 3 , ... , x 2 m - x m . Maka diperoleh

x 8 - x1 , x 9 - x 2 , x10  x 3 , x11 - x 4 , x12 - x 5 , x13 - x 6 , x14 - x 7 .


9.6  9.8, 9.8 - 9.9, 9.3  10.0, 8.9 - 9.8 , 8.7 - 9.2, 9.2 - 9.4, 9.3 - 9.5.

ternyata seluruhnya negatif. Dari Tabel A1 untuk n  7, kita


tentukan bahwa daerah kritis 0.05(ukuran sebenarnya 0.016)
terdiri dari 0 atau 7 tanda positif.
Kesimpulan
Ada bukti sebuah trend yang monoton. Dengan jelas ini adalah
trend yang menurun.

Komentar
Untuk truk, selisihnya mempunyai tanda ,  , , , +, +, +.
Ini menunjukkan 3 tanda positif atau 4 tanda negatif (atau 3
tanda negatif dan 4 tanda positif) memberikan bukti yang

paling kuat untuk mendukung hipotesis nol H 0 bahwa tidak


ada trend yang monoton.

2.2 Kesimpulan Mengenai Median Berdasarkan Rank

Berikut ini beberapa kesimpulan mengenai median


berdasarkan rank:
1. Uji tanda untuk sebuah median menggunakan sedikit
informasi dalam sekumpulan data, seperti jumlah
halaman buku pada contoh 2.1.
2. Kita hanya mencatat apakah masing-masing
pengamatan ada di atas atau di bawah median yang

disebutkan oleh Hipotesis nol H 0 .


3. Pada waktu yang sama, ini dapat digunakan pada
sampel-sampel acak yang hanya mempunyai nilai
ordinal dari populasi dan kesimpulan yang dibuat
untuk median populasi menjadi sah.
4. Cara ini sering menjadi sah jika kita hanya mempunyai
jumlah item-item yang dapat dihitung di atas atau di

bawah nilai  yang disebutkan pada H 0 .


5. Untuk memperoleh selang kepercayaan, kita perlu
nilai-nilai pengukuran.
6. Jika kita membuat tambahan asumsi bahwa distribusi
populasinya simetrik, maka titik simetrik adalah
median populasi atau rata-rata populasi (median dan
rata-rata nilainya sama) dan kita dapat membuat
kesimpulan dalam suatu cara yang membuat kegunaan
lebih besar dari data pengukuran.

2.2.1 Uji Rank Bertanda Wilcoxon


Sebuah sampel tertentu dengan n pengukuran yang
bebas, tidak termasuk tanda yang berasal dari median

atau rata-rata yang disebutkan pada H 0 , kita dapat

juga menentukan masing-masing besarnya. Jika H 0


menentukan median atau rata-rata sebenarnya dari
sebuah distribusi simetrik, asal dari setiap besar
mempunyai kemungkinan yang sama untuk menjadi

positif atau negatif; misalkan jika  adalah median


dari distribusi simetrik diantara nilai, umpanya 4 dan 5

unit di atas  mempunyai probabilitas yang sama


seperti nilai antara 4 dan 5 unit yang di bawah  . Jika
kita menyusun seluruh simpangan sampel dari median

yang dihipotesiskan,
 0 , dalam susunan besarnya dan
menggantinya dengan rank-rank ( 1 untuk simpangan

terkecil dan n untuk yang terbesar) dan kemudian


menempatkan sebuah tanda negatif pada rank-rank

yang di bawah nilai median


 0 , kita mengharapkan
sebuah scatter yang baik dari rank positif dan negatif

jika
 0 adalah median yang sebenarnya. Jika kita
mengambil jumlah seluruh rank positif dan jumlah
seluruh rank negatif, kita tidak mengharap kedua
jumlah ini jauh berbeda.
Besar atau kecilnya nilai dari jumlah rank positif atau
negatif relative terhadap jumlah rank negatif atau

positif yang menyatakan


 0 tidak mungkin menjadi
median atau rata-rata. Ide ini dimasukkan dalam uji
tanda yang diusulkan oleh Wilcoxon(1945).
Contoh 2.6

Masalah.
Pada pembahasan sebelumnya dalam Bab 1, kita telah
mempertimbangkan jumlah halaman buku sebuah
sampel acak berukuran 12 buku statistik yang diambil
dari 114 buku statistik. Jumlah halaman masing-masing
sampel adalah
126 142 156 228 245 246 370 419 433 454 478 503
Dalam Bab 1 kita telah menerima hipotesis
H 0 :  = 220 , H1 :   220 dengan menggunakan uji

tanda dua arah.

Untuk membuat asumsi tambahan bahwa jumlah


halaman adalah berdistribusi simetrik di sekitar
median sebenarnya, gunakanlah uji rank bertanda
Wilcoxon untuk pengujian hipotesis dua arah yang
sama.
Formulasi dan Asumsi
H 0 :  = 220
H1 :   220
Kita susun simpangan dari 220 halaman dalam susunan
yang menaik dan gabungkan masing-masing tanda rank
bersesuaian. Kemudian kita bandingkan lebih kecil
mana jumlah rank tanda positif atau negatif dengan
membuat tabel nilai-nilai untuk memperoleh tingkat
nyata.
Prosedur
Gunakan uji rank bertanda Wilcoxon, dengan
mengurangkan 220 halaman dari setiap nilai sampel,
kita peroleh selisih-selisihnya
-94, -78, -64, 8, 25, 26, 150, 199, 213, 234, 258, 283.
Dengan menyusun kembali nilai – nilai ini dalam susunan
yang menaik dan tetap menahan tanda-tandanya, kita akan
memperoleh: 8, 25, 26, -64, -78, -94, 150, 199, 213, 234, 258,
283. Kemudian dibuat rank dengan memasukkan tandanya
yaitu: 1, 2, 3, -4, -5, -6, 7, 8, 9, 10, 11, 12. Jelas jumlah rank

tanda negatif adalah


Sn = 15, dan kurang dari jumlah

Sp.
rank tanda positif, selanjutnya gunakan Tabel A2 di
bawah ini untuk melihat apakah ini nyata.

Tabel A2 Nilai untuk Uji rank Bertanda Wilcoxon


Nilai – nilai untuk nilai maksimum kurang dari Sp dan Sn untuk taraf nyata 5% dan

1% pada pengujian satu dan dua arah diberikan untuk 6  n  20


n 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Pengujian Satu arah
Taraf nyata 5% 2 3 5 8 10 13 17 21 25 30 35 41 47 53 60
Taraf nyata 1%  0 1 3 5 7 9 12 15 19 23 27 32 37 43
Pengujian dua arah
Taraf nyata 5% 0 2 3 5 8 10 13 17 21 25 29 34 40 46 52
Taraf nyata 1%   0 1 3 5 7 9 12 15 19 23 27 32 37

Isian-isian dalam tabel tersebut telah dihitung dengan


metode yang dibahas pada bagian 2. 2. 2. Tabel A2
menunjukkan jika n = 12 kita menolak
H 0 dengan
pengujian dua arah pada tingkat signifikansi 5% jika

lebih kecil dari


Sn , S p kurang dari atau sama dengan

13. Kita peroleh


Sn = 15.
Kesimpulan:

 Kita tidak menolak


H 0 pada tingkat

signifikansi 5%

 Tolak
H 0 jika S p tab < Sn

Komentar:
1. Apakah layak menganggap bahwa jumlah halaman
dalam sebuah buku berdistribusi simetrik di sekitar rata-
ratanya?
2. Kita telah menganggap kontinuitas dalam pembicraan
sebelumnya. Dengan jelas jumlah halaman adalah bilangan
bulat, tetapi dalam pandangan yang lebih luas ini adalah
seperti pengaruh pembulatan yang secara serius mengurangi
sahnya pengujian.

2.2.2 Teori Uji Rank Bertanda Wilcoxon


Hal ini dijelaskan untuk sampel kecil dengan tujuh
pengamatan. Secara intuisi kita mengharapkan penyimpangan
jumlah rank bertanda negatif dan positif kira-kira sama jika

H 0 adalah benar, padahal ada nilai yang tertinggi yang lebih


sesuaidari salah satu jumlahnya dibandingkan dengan nilai

lainnya jika
H 0 tidak benar. Dalam suatu kasus ekstrem

( jika seluruh nilai sampel di atas nilai yang disebutkan


H0

) maka seluruh rank akan menjadi positif, sehingga


Sn = 0 ;
kemudian untuk tujuh pengamata

S p = 1 + 2 + 3 +... +7 = 28, Sn = 0.
Untuk setiap

rank campuran positif dan negative bila n = 7,

Sn = 28 - S p .
Secara umum untuk n pengamatan dengan tidak ada nilai
yang sama tidak ada pengamatan yang nilainya sama dengan

1
 0 , Sn = 2 n(n  1) - S p , karena jumlah rank 1, 2, 3, …,

1
n( n  1)
n adalah 2 . Hubungan ini berarti kemungkinan jumlah
Sp
rank positif pada sama dengan kemungkinan jumlah rank
1
n(n  1) - S p
negative pada 2 .
28 Sept 2021
Setiap rank mungkin mempunyai salah satu dari sebuah tanda
negatif atau positif, sehingga tanda-tanda mungkin diperoleh
7
untuk 7 rank dengan 2 = 128 cara yang berbeda. Jika
tanda-tanda ditempatkan secara acak (misalkan dengan
melantun atau dengan toss, melempar mata uang) probabilita

seluruhnya akan menjadi positif ( yaitu


sn = 0 ) adalah

1 128. Jika hanya rank 1 yang negatif, jumlah rank negatif

adalah 1, juga dengan probabilita 1 128. Jika rank 1 dan 2


keduanya negatif, atau jika rank 3 yang negatif, pada salah

satu kasus,
S n = 3; Karena S n = 3 dapat terjadi dalam

dua cara maka probabilitanya 2 128. Mengingat

kesimetrikan, probabilita bahwa


S n  26,27 atau 28

masing-masing adalah 1 128, dan probabilita bahwa

S n = 25 adalah 2 128. Nilai ekstrem ini relevan dengan


sebuah daerah kritis untuk pengujian dua arah; nilai-nilai ini
tidaklah mungkin jika rata-rata populasi sebenarnya

mempunyai nilai yang dihipotesiskan pada


H 0 . Sebuah
daerah kritis pada ukuran nominal 0,05 untuk pengujian
dua arah (ukuran sebenarnya 0,047) diperoleh dengan

mengambil nilai-nilai jumlah rank 0, 1, 2 dari sisi bawah

dan dan 26, 27, 28 dari sisi atasnya. Mengingat simetrik ini

S p , Sn
menyatakan penolakan jika lebih kecil dari tidak
melebihi 2.
Untuk sebuah pengujian satu arah pada tingkat nominal

5%, kita menolak H 0 jika jumlah rank positif atau negatif


tidak melebihi 3; ukuran sebenarnya menjadi

5 128  0,039, yang menyatakan sebuah tingkat nyata

sebenarnya 3,9% .
2.2.3 Pendekatan Sampel Besar

Untuk ukuran sampel n > 20 pendekatan normal untuk uji


Wilcoxon dilakukan dengan baik. Notasikan Jumlah rank

positif atau negatif yang lebih kecil dari S; hal ini dapat

ditunjukkan bahwa S mempunyai rata-rata (n + 1) 4


dan varians n(n + 1) (2n + 1)/24, sedangkan

S + 12 - 1
4 n(n +1)
Z=
[ n( n  1)(2n + 1)/24] (2.4)
1
Mempunyai sebuah distribusi normal baku; 2 dalam

pembilang adalah koreksi kontinuitas. Nilai kritis Z untuk

pengujian dua arah pada tingkat nyata 5% adalah

Z < -1,96 dan pada tingkat nyata 1% adalah

Z < -2,58; sedangkan untuk pengujian satu arah adalah

-1, 64 pada tingkat signifikansi 5% dan -2,33 pada

tingkat signifikansi 1%.


NB:
Notasi utk Dist. Normal Baku

1  12 x 2
f ( x) = e , - < x < 
2

Tingkat Kepercayaan
80% 90% 95% 99% 100%
Z = 1,290 Z = 1,645 Z = 1,960 Z = 2, 58 Mendekai
3,0
Pada contoh 2.6 kita hanya mempunyai sebuah sampel

berukuran 12, tetapi dengan menggantikan S = 15 dalam

pers.(2.4) memberikan Z = -1, 84 sehingga kita tidak akan

menolak hipotesis nol


H 0 , konsisten dengan pengujian yang
kita dapatkan.

S + 12 - 1
4 n(n +1)
Z=
[ n( n  1)(2n + 1)/24]
15 + 12 - 14 12(12 +1)
=
[12(12  1)(2.12 + 1)/24]
Zhit = -1,84

Seperti yang kita lakukan untuk pendekatan normal sampel


besar untuk uji tanda, kita dapat menggunakan pers. (2. 4)

untuk mendapatkan sebuah nilai kritis s untuk sebuah n

tertentu dengan menghitung s untuk memperkirakan Z .


Mengingat bahwa pendekatannya mungkin tidak menjadi

sangat baik dengan n = 12, walaupun demikian kita jelaskan


prosedurnya untuk kasus pada tingkat nyata 5% dalam

pengujian dua arah, dimana Z = -1,96 adalah nilai


kritisnya. Dengan menggunakan kembali pers (2.4) dengan

S tidak diketahui, Z = -1,96 dan n = 12 kita peroleh

S = 13,51. Karena S hanya dapat mengambil nilai bulat,

kita menolak jumlah yang lebih kecil 13 atau kurang sesuai


dengan tabel-tabel untuk pengujian yang tepat. Untuk

pengujian satu arah pada tingkat nyata 5% , kita ambil

Z = -1,64, bila untuk n = 12, kita peroleh

S = 17,59, yang menunjukkan perolehan untuk jumlah


yang lebih kecil dari atau sama dengan 17, juga sesuai dengan

Tabel A2. Maka pada tingkat nyata 5% , taksirannya adalah

baik untuk n serendah 12; kita menguji pendekatan ini

pada tingkat nyata 1% dalam Latihan 2.8.

2.2.4 Uji Wilcoxon dengan Nilai-nilai yang Sama


Pert.ke-7 tg.5 Okt.2021
Dalam teori, jika sampel kita berasal dari sebuah
distribusi, kontinu probabilitas untuk memperoleh
pengamatan yang sama adalah nol: sehingga probabilitas
memperoleh sebuah nilai sampel yang tepat sama dengan rata-
rata atau median populasi. Dalam praktek, pengamatan-
pengamatan tidak secara tepat mempunyai distribusi kontinu
karena akibat pembulatan atau dibatasi ketelitian
pengukuran. Kita mengukur panjang dengan sentimeter atau
millimeter terdekat, berat kita ukur dengan kilogram, gram
atau milligram terdekat, jumlah halaman sebuah buku dalam
halaman lengkap, meskipun tata letak bab-bab sering dalam
sebagian halaman. Pembatasan praktis ini mungkin
menghasilkan rank yang sama atau selisih yang nol. Jika hal

ini terjadi, distribusi yang tepat untuk S , jumlah rank


terendah, menjadi sulit dan memerlukan penghitungan ulang
untuk jumlah selisih nilai yang sama dan nilai-nilai yang sama
pada posisi yang berbeda dalam susunan rank.
Salah satu penyelesaian praktis adalah dengan mengubah
pendekatan normal pada sub bab 2.2.2 setelah penyesuaian
metode skor untuk rank. Jika satu pengamatan atau lebih,

nilainya sama dengan rata-rata yang disebutkan pada


H0
(yaitu simpangannya dari rata-rata yang dihipotesiskan itu
nol) kita catat ini sebagai rank nol. Jumlah rank yang nol

dinotasikan dengan
d 0 . Jika dua rank atau lebih sama
besarnya ( tetapi biasanya tandanya tidak sama) kita
menggantikannya dengan apa yang disebut mid-rank;
misalkan juga tujuh simpangan pengamatan adalah 3, 4.7,
-5.2, 5.2, 7, 7, -7, kita buat rank utk 3 sebagai rank 1; 4.7
sebagai 2, nilai ‘sama’ - 5,2 dan + 5,2 masing-masing
digantikan dengan rata-rata dari 3 dan 4, yaitu 3.5 dan nilai 7,
7, – 7 memberikan rata-rata dari rank sisanya 5. 6. dan 7 yaitu
masing-masing diberi rank 6, dengan tanda yang bersesuaian.
Maka tanda rank terakhir adalah 1, 2, -3.5, 3.5, 6, 6, -6.
Perhatikan bahwa jumlah rank absolut atau besarnya rank
(yaitu dengan mengabaikan tanda minus) masih 28, yaitu

jumlah rank 1 sampai 7.


S n ( jumlah rank negatif) sekarang
adalah 9,5.
Untuk simpangan yang nol (pengamatan yang mempunyai

nilai sama dengan


 0 ), alokasi ranknya lebih sulit. Untuk
sementara waktu simpangan nol diberi rank 1, seperti jika
pada simpangan yang terkecil, tetapi karena nol merupakan
salah satu nilai positif maupun negatif, kita menggantikan 1
dengan 0 sebelum menjumlahkan rank-ranknya.
Maka selisih-selisih 0, 3, -7, 11, -13, 16, -18 diberi rank tanpa
tanda sebagai 1, 2, 3, 4, 5, 6, 7. Kita kemudian dapat
menempatkan tanda dan memperoleh nilai yang disesuaikan
dengan mengalikan masing-masing rank yang tidak bertanda
dengan + 1 jika selisihnya positif, dan 0 jika selisihnya 0, dan
dengan -1 jika selisihnya negatif, dan dalam kasus ini

diberikan tanda rank 0, 2, -3, 4, -5, 6, -7, dengan


S n = 15.
Jumlah rank absolut sekarang adalah 27, lebih baik daripada
28.
Untuk masing-masing kumpulan rank yang sama dan
disesuaikan dengan sebuah mid-rank, kita notasikan jumlah
pengamatan pada nilai yang sama ke-i dengan

di , i = 1, 2, ..., r jika ada kumpulan r dan nilai yang


berbeda. Jika tidak ada nilai yang sama pada rank, secara

formal kita tetapkan


d i = 1.
Contoh 2.7
Misalkan kita mempunyai susunan simpangan berikut dengan
sebuah uji rank bertanda Wilcoxon:
0, 0, 3, -7, 9, 9, -11, 11, 11, 14, 16, 17, 17, 18
Kita mempunyai rank-rank yang tidak pakai tanda:
1.5, 1.5, 3, 4, 5.5, 5.5, 8, 8, 8, 10, 11, 12. 5, 12.5, 14
Untuk memperoleh tanda rank yang bersesuaian kita

mengalikan dengan 1, 0, – 1 untuk selisih positif, nol, atau


negatif, sedang rank yang memakai tanda adalah:
0, 0, 3, -4, 5.5, 5. 5, -8, 8, 8, 10, 11, 12. 5, 12.5, 14

Dan
S n = 12. Di sini d 0 = 2; dan ada dua nilai yang sama
dari dua rank dan satu nilai yang sama dari tiga rank dimana

kita mengambil
d1 = d 2 = 2, d 3 = 3.

S + 12 - 1
4 n(n +1)
Z=
[ n( n  1)(2n + 1)/24]
Uji sampel besar kita adalah modifikasi dari persamaan (2.4).

Karena sekarang telah mungkin bagi S mengambil nilai

1
pecahan, kita hilangkan koreksi kontinuitas 2 dalam

pembilang dan menggantikan rata-rata


1
4
n(n  1) dengan

1
4 [ n(n  1)  d 0 ( d 0  1)], dan mengubah penyebut dengan

menggantikan akar dari n(n  1)(2n  1) / 24 dengan akar


dari
[n(n  1)(2n  1)  d 0 (d 0  1)(2d 0  1)] 24 - [d i
3
- d i ] 48

Perhatikan bahwa bila


d 0 = 0 ( tidak ada nol) dan seluruh

di = 1 (tidak ada rank yang sama) dan koreksi kekontinuannya

dikembalikan, kita peroleh (2.4).


Pada prinsipnya pendekatan normal adalah sebuah hasil sampel
besar. Jika ada beberapa nilai yang sama pada sampel yang
berukuran kurang dari 20, seseorang harus hati-hati
menggunakan perkiraan ini, dan bahkan seseorang mungkin
lebih aman menggunakan uji rank yang bertanda baku
dengan mid-rank tetapi mengabaikan nilai yang sama lainnya.
Akan tetapi, tingkat nyata tidak begitu serupa benar dengan
nilai-nilai untuk kasus dimana tidak ada nilai yang sama.
Diharapkan, dalam sampel kecil kita biasanya hanya akan
memperoleh sedikit nilai yang sama; jika kita menggunakan
mid-rank, pengaruhnya pada uji yang tepat menjadi kecil.
Untuk kasus hanya sedikit nilai yang sama atau nol, penyesuaian
yang disarankan di atas tidak terlalu mengubah nilai Z dalam
(2.4) seperti contoh ditunjukkan berikut. Jika jumlah nilai yang
sama atau nol cukup besar, pengaruhnya dapat menghasilkan
keputusan yang benar. Tidaklah merugikan untuk
menggunakan koreksinya dalam seluruh kasus yang setidak-
tidaknya sampai seseorang cukup berpengalaman untuk menilai
pengaruh seperti itu. Beberapa penulis memberikan metode
koreksi yang pada hakikatnya untuk merumuskan nilai yang
sama dengan cara yang berbeda. Pada dasarnya, hal ini
mencakup penghitungan langsung yang didasarkan pada rank
atau mid-rank dari simpangan baku dalam penyebut (2.4); lihat
komentar 2 pada Contoh 2.8 agar lebih jelas.
Contoh 2.8
Masalah.
Gunakan uji rank bertanda Wilcoxon untuk menguji hipotesis
H 0 :  = 220 versus H1 :   220 untuk data jumlah halaman

dalam contoh 2.1; yaitu jumlah halaman untuk sebuah sampel


berukuran 24:

153 166 181 192 244 248 258 264 296 305 305 312
330 340 356 361 395 427 433 467 544 551 625 783

Formulasi dan asumsi.


Untuk memperlihatkan kebenaran uji Wilcoxon, kita membuat
asumsi tambahan pada distribusi simetrik mengenai rata-rata
Sp
populasinya atau median. Kita tentukan atau Sn yang lebih
kecil setelah membuat rank simpangan dari 220 dan
menggunakan cara yang dimodifikasi dari (2.4).
Prosedur:
Simpangan sebenarnya yang diikuti tanda dari 220 disusun
dalam susunan yang menaik yaitu:
24 -28 28 38 -39 44 -54 67 76 85 85 92
110 120 136 141 175 207 213 247 324 331 405 563
Yang memberikan rank dengan tanda(mid-rank untuk nilai
yang sama)
1, -2.5, 2.5, 4, -5, 6, -7, -8, 9, 10. 5, 10. 5, 12, 13, 14, 15, 16, 17, 18,
19, 20, 21, 22, 23, 24.
Jelaslah bahwa Sn = 22.5 adalah lebih kecil daripada Sp. Dengan
dua nilai yang sama dan masing-masing mencakup dua
pengamatan, kita peroleh d1 = d2 = 2 dan n = 24.
Dengan menggunakan metode yang diberikan dalam bab ini,
hanya simpangan baku yang dimodifikasi( yaitu penyebut dalam
pers.(2.4)) dan koreksi kontinuitasnya dihilangkan dalam
penyebutnya. Dengan mudah dapat dibuktikan bahwa statistik
uji kita dengan menggunakan bentuk modifikasi ini dari pers.
(2.4) adalah:
Z= S – ¼[n(n+1)- d0(d0+1)]
√ [n(n+1)(2n+1)-d0(d0+1)(2do+1)]/24- ∑[di3-di]/48

Z= 22.5 – 150 = – 3,53 (2.5)


√(1225 – 0.25)

Kesimpulan :
Untuk α = 0.1% kita menolak H0 karena tabel distribusi
normal menunjukkan nilai kritis untuk pengujian dua
arah adalah Z = -3.29
Komentar:
1. Dalam contoh di atas,

Anda mungkin juga menyukai