VIIA TA 2021/2022
KULIAH DIMULAI Tg 24 Agustus 2021
BAB I
1. Pengenalan Metode Nonparametrik
(Introducing Nonparametric Methods)
1.1 Statistika Dasar
1.2 Sampel dan Populasi
1.3 Perkiraan/Estimasi
1.4 Pengujian hipotesis
BAB II
2. Perkiraan Lokasi Untuk Sampel Tunggal
( Centrality Inference For Single Sample)
2.1 Uji Tanda
2.2 Kesimpulan Mengenai Median Berdasarkan Rank
2.3 Penduga Lokasi Lainnya
2.4 Bidang Penerapan
BAB III
3. Pengujian Distribusi dan Transformasi Rank untuk Sampel Tunggal
3.1 Mencocokkan Sampel dengan Distribusi
3.2 Kekekaran
3.3 Transformasi Rank
3.4 Implikasi Praktis dari Efisiensi
3.5 Asumsi-asumsi yang Dimodifikasi
Latihan
BAB IV
4. Metode untuk Sampel Berpasangan
4.1 Perbandingan Pasangan
4.2 Kelemahan Penggunaan Uji Tanda
4.3 Bidang Penerapan
Latihan
BAB V
5. Pengujian dan Perkiraan untuk Dua Sampel Bebas
5.1 Pengujian dan Perkiraan Lokasi
5.2 Selang kepercayaan Wilcoxon-Mann- Whitney
5.3 Pengujian Fungsi Rank
5.4 Uji untuk Kesamaan Varians
5.5 Pengujian untuk Distribusi Umum
5.6 Bidang Penerapan
Latihan
BAB VI
6. Tiga Sampel atau Lebih
6.1 Perluasan yang Mungkin
6.2 Pengujian Lokasi Untuk Sampel yang Bebas
6.3 Pengujian Heterogenitas Varians untuk Sampel yang Bebas
6.4 Pengujian Lanjutan Untuk Beberapa Sampel yang Bebas
6.5 Perbedaan Lokasi Untuk Sampel yang Berhubungan
6.6 Bidang Penerapan
Latihan
REFERENSI:
1. METODE STATISTIK NONPARAMETRIK TERAPAN
Oleh:
P. SPRENT
2. STATISTIK NONPARAMETRIK UNTUK ILMU-ILMU SOSIAL
Sydney Siegel ,
Gramedia – 1992
3. Dll
pi , α
1-α
p1 % n
x 1 , x 2 , .. . ,x n
BAB I
1. Pengenalan Metode Nonparametrik
(Introducing Nonparametric Methods)
Bagi siapa yang tidak menyerahkan filenya pd waktu yg telah ditentukan berarti
ybs tdk menyerahkan TUGASnya yg pertama.
1 Statistika Dasar
Data
Distribusi Sampling
Data Tunggal
Distribusi Frekuensi
Data Berkelompok
Sebelum kita membahas Statistik
Nonparametrik, perlu kita ketahui metode
parametrik.
Metode parametrik adalah suatu metode
dalam statistika yang sering digunakan dalam
kehidupan se-hari2 yang erat hubungannya
dengan kejadian/peristiwa yang mempunyai
distribusi, misalnya kebutuhan rumah tangga
pada umumnya berdistribusi normal, kegiatan
pemeriksaan kondisi suatu hsil produksi pada
umumnya berdistribusi binomial atau
multinomial. Sedangkan statistik
Nonparametrik bebas distribusi artinya tidak
dapat kita katakana apakah berdistribusi
normal, binomial atau yang lain.
Selang Kepercayaan
2. H0 = 0
H1 ¿ 0
3. H0 = 0
H1 ¿ 0
Keadaan Sebenarnya
Kesimpulan H 0 benar H 0 salah
H , Keputusan benar (benar) kesalahan jenis kedua ( keliru)
Terima 0
H , kesalahan jenis pertama. Keputusan benar (benar)
Tolak 0
P(galat jenis II ) = .
1.4 Perkiraan/Estimasi (31 Agustus 2021)
1.4.1 Selang Kepercayaan
Ada dua bentuk estimasi parameter populasi
(θ) dalam statistika, yaitu estimasi titik dan estimasi selang.
Peluang menghasilkan nilai parameter dengan menggunakan
estimasi titik biasanya sangat kecil. Oleh karena itu, dirancanglah
suatu bentuk estimasi parameter populasi yaitu dengan
menggunakan selang (interval) kepercayaan. Dengan estimasi
selang kepercayaan, peluang mendapatkan nilai parameter akan
menjadi lebih besar.
ˆ - d < < ˆ +d
Rata-rata (mu)(μ)
Selang kepercayaan untuk rata-rata populasi dapat dilakukan jika
x1 , x2 , x3 ,..., xn berasal dari populasi yang mengikuti Distribusi
2 2
P x - z < x + z = 1-
2
n 2
n
x -Z_{\alpha/2}\sqrt{\frac{\sigma^2}{n}}<\mu<\bar{x}
+Z_{\alpha/2}\sqrt{\frac{\sigma^2}{n}}xˉ−Zα/2nσ2<μ<xˉ+Zα/2nσ2
2. varian populasi
2
tidak diketahui (sampel kecil).
s s
P x - t < x + t = 1-
2
n 2
n
bar{x}-t_{\alpha/2,df}\sqrt{\frac{\sigma^2}{n}}<\mu<\bar{x}
+t_{\alpha/2,df}\sqrt{\frac{\sigma^2}{n}}xˉ−tα/2,dfnσ2<μ<xˉ+tα/2,df
nσ2
Varians ( )
2
Proporsi (p)(p) ( ) ( )
2 2
\hat{p}-Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}<p<\hat{p}
+Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}p^−Zα/2np^(1−p^)
<p<p^+Zα/2np^(1−p^)
(\bar{x}_1-\bar{x}_2) - Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}
{n_1}+\frac{\sigma_2^2}{n_2}} <\mu_1-\mu_2<
(\bar{x}_1-\bar{x}_2) + Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}
{n_1}+\frac{\sigma_2^2}{n_2}}(xˉ1−xˉ2)−Zα/2n1σ12+n2σ22<μ1−μ2
<(xˉ1−xˉ2)+Zα/2n1σ12+n2σ22
2. varian kedua populasi \sigma_1^2σ12 dan \sigma_2^2σ22 tidak diketahui
dan diasumsikan sama,
(\bar{x}_1-\bar{x}_2) - t_{\alpha/2,df}\,S_p\sqrt{\frac{1}
{n_1}+\frac{1}{n_2}} <\mu_1-\mu_2< (\bar{x}_1-\bar{x}_2) +
t_{\alpha/2,df}\,S_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}(xˉ1−xˉ2)
−tα/2,dfSpn11+n21<μ1−μ2<(xˉ1−xˉ2)+tα/2,dfSpn11+n21
dimanaSp=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-
2}}Sp=n1+n2−2(n1−1)s12+(n2−1)s22dandf=n_1+n_2-2.df=n1+n2−2.
3. varian kedua populasi \sigma_1^2σ12 dan \sigma_2^2σ22 tidak diketahui
dan diasumsikan tidak sama.
(\bar{x}_1-\bar{x}_2) - t_{\alpha/2,df}\sqrt{\frac{s_1^2}
{n_1}+\frac{s_2^2}{n_2}} <\mu_1-\mu_2< (\bar{x}_1-\bar{x}_2)
+ t_{\alpha/2,df}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}(xˉ1
−xˉ2)−tα/2,dfn1s12+n2s22<μ1−μ2<(xˉ1−xˉ2)+tα/2,dfn1s12+n2s22
dimanadf=\frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}
{n_2}\right)^2}{\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-
1}+\frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}}df=n1−1(n1s12)2+n2
−1(n2s22)2(n1s12+n2s22)2
Ditentukan
pi , adalah probabilitas pada paling
BAB II
2. Perkiraan Lokasi Untuk Sampel Tunggal
( Centrality Inference For Single Sample)
( 31 Agustus 2021)
2.1 Uji Tanda
Telah diperkenalkan uji tanda secara informal pada
contoh terdahulu ( mengenai halaman buku). Kita
melihat lebih dekat pada asumsi dan pada kesulitan-
kesulitan yang terjadi serta perluasan konsep yang
dihubungkan dengan masalah tersebut.
Dalam sebahagian besar masalah nonparametrik, kita
akan membahas masalah-masalahnya secara
berurutan dengan judul ;
Masalah
Formulasi dan asumsi
Prosedur
Kesimpulan
Komentar
Masalah
Kembali pada masalah-masalah buku statistic yang ada. Data jumlah halaman
untuk seluruh buku (114 buah buku) adalah sebagai berikut :
390 74 189 242 614 296 335 171 427 214 279 429
370 625 287 249 625 783 340 212 686 228 419 467
454 532 283 330 631 709 207 173 230 245 93 433
676 551 246 398 245 511 166 156 593 280 305 284
212 210 307 296 173 153 193 401 240 537 264 402
308 485 365 319 544 168 181 472 361 331 244 354
128 292 181 137 255 312 235 464 503 324 271 312
358 356 110 218 276 425 296 575 248 433 369 142
126 478 157 305 391 412 437 395 258 192 319 197
42 40 34 493 264 199
menolak hipotesis
H 0 bahwa median jumlah halaman per
buku adalah 220. Apakah kita akan memperoleh kesimpulan
yang sama jika ukuran sampel digandakan menjadi 24?
Berikut ini adalah jumlah halaman, setelah disusun, untuk
sampel acak berukuran 24 buku dari 114 buku yang ada.
153 166 181 192 244 248 258 264 296 305 305 312
330 340 356 361 395 427 433 467 544 551 625 783
1
p .
distribusi binomial dengan n 24 dan 2 Kita menguji
H 0 : 220
H1 : 220
Merupakan pengujian dua arah yang sesuai.
Prosedur
Ada empat pengamatan dibawah 220, yaitu 153, 166, 181,
dan 192. Ini menyatakan 4 tanda negative dan 20 tanda positif
dalam sampel yang berukuran 24. Kita memerlukan
1
p
probabilitas binomial untuk n 24 dan 2 yang
diberikan pada Tabel 2.1 berikut ini untuk melihat jika ini
nyata.
Dengan memperhatikan distribusi binomial adalah simetrik di
1
p ,
mana 2 kita hanya perlu mencatat probabilita untuk
Kesimpulan
Kita menolak hipotesis bahwa jumlah median halaman buku
adalah 220. Jumlah lebih besar dari tanda-tanda positif
menyarankan sebuah median lebih tinggi.
Komentar
1. Nilai 0 sampai 5 dari sisi terendah pada daerah kritis
untuk sebuah pengujian dua arah berukuran nominal
0,01(ukuran sebenarnya 2 x 0,003 = 0,006). Hasil ini
biasa, dan diperlukan untuk memperoleh tingkat nyata
terendah yang dimungkinkan dari tiga nilai nominal
yang umum digunakan yaitu 5%, 1% atau 0,1%.
Prosedur
Kita menggunakan Argumen yang dikembangkan pada sub
bab 1.4 yaitu Perkiraan/ selang kepercayaan. Dalam contoh 2.1
kita memperoleh daerah kritis untuk pengujian pada tingkat
nyata 5% dengan sampel berukuran 24 menjadi 0 sampai 6,
dan 18 sampai 24, yang menyatakan agar kita menolak dengan
6 tanda positif atau kurang dan 18 lebih tanda positif. Data
pada contoh 2.1 disusun, dan pengujiannya akan tampak jelas
bahwa kita tidak akan menolak setiap hipotesis yang
mediannya lebih besar dari 258(jika ini akan memberikan
paling sedikit 7 tanda negatif) tetapi kurang dari 427(jika ini
akan memberikan paling sedikit 7 tanda positif). Nilai-nilai
yang kurang dari 258 atau lebih besar dari 427 pada sisi lain
akan memberikan 6 atau kurang tanda negatif dan 6 atau lebih
tanda positif.
Kesimpulan
Selang kepercayaan nominal 95%( sebenarnya 100(1-0,222)%
= 97,8%) adalah 258 sampai 427.
Komentar
Selang kepercayaan 95% dengan asumsi kenormalan dan
1 1 x2
f ( x) e 2
X N (0,1) ; 2
1 12 x
2
f ( x) e , - < x
X N ( , 2 ) ; 2
(1,96, 1,96). Hal ini sesuai pada kasus ini untuk menyatakan
Z 1,96
sebagai daerah kritis penolakan, dimana tanda
harga mutlak menunjukkan bahwa kita mengambil besarnya (nilai
adalah 2,58 ( dua arah) dan 2,32 atau 2,32 (satu arah).
Contoh 2.3 :
Masalah.
X 1
2 n
memberikan Z =
1
2 n
(19,5 12)
Z =
1
2 24
normal maka nilai tersebut sama dengan Pr( Z < 3, 06). Dari Tabel
2.2 dapat dilihat bahwa Pr(r < 4) = Pr(r > 20) = 0,001.
1
p
2 Probabilitas Binomial, P, untuk n 24 dan 2
Tabel 2.
0 1 2 3 4 5 6 7 8 9 10 11 12
p 0,000 0,00 0,00 0,000 0,00 0,003 0,01 0,032 0,07 0,15 0,271 0,419 0,581
0 0 1 1 6 4
Sebuah nilai yang lebih teliti untuk probabilita ini adalah 0, 0009 ,
dalam probabilita, yang sesuai dengan pendekatan normal, yaitu
0, 0011 .
Kesimpulan
Komentar
Kita kembali mendapatkan kesimpulan yang sama jika
X =4+ 1 .
2
yang lebih kecil, dari jumlah tanda positif atau tanda negatif.
nilai kriteria
r0 ditetapkan, selang kepercayaan dapat
diperoleh untuk pengujian yang tepat. Luas
TABEL NORMAL
0 z
z 0,00 0,06 0,07 … 0,09
-1,4
.
.
.
0,0
0,1 0,5398 0,5753
.
.
.
1,7 0,9616
3,0 0, 9989
binomial dengan p = 1 2.
Kita dapat menggunakan uji tanda yang dimodifikasi
untuk menguji hipotesis mengenai distribusi Kuantil
selain median. Kuantil ke-k dari sebuah distribusi
q 12
Jadi jelaslah adalah median. Untuk distribusi
kontinu
qk adalah unik; Untuk distribusi diskrit
khusus diperlukan konversi khusus untuk menentukan
r
k = , r = 1, 2, 3,
kuantil khas (unique). 4 kuantil-
kuantilnya adalah kuartil ke-r. Khususnya jika
1
qk adalah desil ke-r, dan jika k = r
dan 9, 4 dimana
H 0 : q 14 = 40
terhadap hipotesis alternatif
H1 : q 14 40
Prosedur
Misalkan tanda negatif dengan nilai calon di bawah 40,
tanda positif dengan setiap nilai calon di atas 40.
Kita mempunyai 13 tanda negatif ( dan 19 tanda positif)
untuk sampel kita yang berukuran 32. Jika nilai kuartil
1
,
pertama adalah 40 kemudian probabilitasnya 4
1
dan probabilitasnya 4 untuk nilai di atas 40(diberi
1
p= .
karena itu binomial dengan n = 32, 4
Tabel-tabel probabilitas yang pasti untuk distribusi ini
1
p= .
memang ada ( tetapi kurang umum jika disbanding 2
1
p=
Neave(1981) memberikan table binomial dengan 4 dan
n 20.
Untuk pengujian dua arah bila n = 32, daerah kritisnya
Contoh:2.5
Masalah
Departemen perdagangan Amerika Serikat menerbitkan
perkiraan yang diperoleh dari sampel-sampel bebas
mengenai rata-rata jarak yang ditempuh oleh berbagai
jenis kenderaan di Amerika Serikat setiap tahun. Angka-
angka untuk mobil dan truk (dalam ribuan mil) diberikan
pada tabel di bawah ini dari tahun 1970-1983. Dalam kasus
ini apakah ada sebuah trend yang monoton?
1 mil = 1,609 km
Mobil 9.8 9.9 10.0 9.8 9.2 9.4 9.5 9.6 9.8 9.3 8.9 8.7 9.2 9.3
Truk 11.5 11.5 12.2 11.5 10.9 10.6 11.1 11.1 11.0 10.8 11.4 12.3 11.2 11.2
Prosedur
Komentar
Untuk truk, selisihnya mempunyai tanda , , , , +, +, +.
Ini menunjukkan 3 tanda positif atau 4 tanda negatif (atau 3
tanda negatif dan 4 tanda positif) memberikan bukti yang
yang dihipotesiskan,
0 , dalam susunan besarnya dan
menggantinya dengan rank-rank ( 1 untuk simpangan
jika
0 adalah median yang sebenarnya. Jika kita
mengambil jumlah seluruh rank positif dan jumlah
seluruh rank negatif, kita tidak mengharap kedua
jumlah ini jauh berbeda.
Besar atau kecilnya nilai dari jumlah rank positif atau
negatif relative terhadap jumlah rank negatif atau
Masalah.
Pada pembahasan sebelumnya dalam Bab 1, kita telah
mempertimbangkan jumlah halaman buku sebuah
sampel acak berukuran 12 buku statistik yang diambil
dari 114 buku statistik. Jumlah halaman masing-masing
sampel adalah
126 142 156 228 245 246 370 419 433 454 478 503
Dalam Bab 1 kita telah menerima hipotesis
H 0 : = 220 , H1 : 220 dengan menggunakan uji
Sp.
rank tanda positif, selanjutnya gunakan Tabel A2 di
bawah ini untuk melihat apakah ini nyata.
signifikansi 5%
Tolak
H 0 jika S p tab < Sn
Komentar:
1. Apakah layak menganggap bahwa jumlah halaman
dalam sebuah buku berdistribusi simetrik di sekitar rata-
ratanya?
2. Kita telah menganggap kontinuitas dalam pembicraan
sebelumnya. Dengan jelas jumlah halaman adalah bilangan
bulat, tetapi dalam pandangan yang lebih luas ini adalah
seperti pengaruh pembulatan yang secara serius mengurangi
sahnya pengujian.
lainnya jika
H 0 tidak benar. Dalam suatu kasus ekstrem
S p = 1 + 2 + 3 +... +7 = 28, Sn = 0.
Untuk setiap
Sn = 28 - S p .
Secara umum untuk n pengamatan dengan tidak ada nilai
yang sama tidak ada pengamatan yang nilainya sama dengan
1
0 , Sn = 2 n(n 1) - S p , karena jumlah rank 1, 2, 3, …,
1
n( n 1)
n adalah 2 . Hubungan ini berarti kemungkinan jumlah
Sp
rank positif pada sama dengan kemungkinan jumlah rank
1
n(n 1) - S p
negative pada 2 .
28 Sept 2021
Setiap rank mungkin mempunyai salah satu dari sebuah tanda
negatif atau positif, sehingga tanda-tanda mungkin diperoleh
7
untuk 7 rank dengan 2 = 128 cara yang berbeda. Jika
tanda-tanda ditempatkan secara acak (misalkan dengan
melantun atau dengan toss, melempar mata uang) probabilita
satu kasus,
S n = 3; Karena S n = 3 dapat terjadi dalam
dan dan 26, 27, 28 dari sisi atasnya. Mengingat simetrik ini
S p , Sn
menyatakan penolakan jika lebih kecil dari tidak
melebihi 2.
Untuk sebuah pengujian satu arah pada tingkat nominal
sebenarnya 3,9% .
2.2.3 Pendekatan Sampel Besar
positif atau negatif yang lebih kecil dari S; hal ini dapat
S + 12 - 1
4 n(n +1)
Z=
[ n( n 1)(2n + 1)/24] (2.4)
1
Mempunyai sebuah distribusi normal baku; 2 dalam
1 12 x 2
f ( x) = e , - < x <
2
Tingkat Kepercayaan
80% 90% 95% 99% 100%
Z = 1,290 Z = 1,645 Z = 1,960 Z = 2, 58 Mendekai
3,0
Pada contoh 2.6 kita hanya mempunyai sebuah sampel
S + 12 - 1
4 n(n +1)
Z=
[ n( n 1)(2n + 1)/24]
15 + 12 - 14 12(12 +1)
=
[12(12 1)(2.12 + 1)/24]
Zhit = -1,84
dinotasikan dengan
d 0 . Jika dua rank atau lebih sama
besarnya ( tetapi biasanya tandanya tidak sama) kita
menggantikannya dengan apa yang disebut mid-rank;
misalkan juga tujuh simpangan pengamatan adalah 3, 4.7,
-5.2, 5.2, 7, 7, -7, kita buat rank utk 3 sebagai rank 1; 4.7
sebagai 2, nilai ‘sama’ - 5,2 dan + 5,2 masing-masing
digantikan dengan rata-rata dari 3 dan 4, yaitu 3.5 dan nilai 7,
7, – 7 memberikan rata-rata dari rank sisanya 5. 6. dan 7 yaitu
masing-masing diberi rank 6, dengan tanda yang bersesuaian.
Maka tanda rank terakhir adalah 1, 2, -3.5, 3.5, 6, 6, -6.
Perhatikan bahwa jumlah rank absolut atau besarnya rank
(yaitu dengan mengabaikan tanda minus) masih 28, yaitu
Dan
S n = 12. Di sini d 0 = 2; dan ada dua nilai yang sama
dari dua rank dan satu nilai yang sama dari tiga rank dimana
kita mengambil
d1 = d 2 = 2, d 3 = 3.
S + 12 - 1
4 n(n +1)
Z=
[ n( n 1)(2n + 1)/24]
Uji sampel besar kita adalah modifikasi dari persamaan (2.4).
1
pecahan, kita hilangkan koreksi kontinuitas 2 dalam
1
4 [ n(n 1) d 0 ( d 0 1)], dan mengubah penyebut dengan
153 166 181 192 244 248 258 264 296 305 305 312
330 340 356 361 395 427 433 467 544 551 625 783
Kesimpulan :
Untuk α = 0.1% kita menolak H0 karena tabel distribusi
normal menunjukkan nilai kritis untuk pengujian dua
arah adalah Z = -3.29
Komentar:
1. Dalam contoh di atas,