NONPARAMETRIK
Beberapa analisis statistik seperti uji t, uji chi-square (X 2), dan uji F,
analisis regresi, analisis time series, dan analisis multivariat. Analisis
mempunyai asumsi bahwa data mengikuti distribusi populasi tertentu, dalam
hal ini, distribusi normal. Analisis seperti ini dalam statistik dikenal dengan
analisis statistik yang menggunakan prosedur parametrik. Selain harus
mengikuti distribusi normal, analisis statistik parametrik mensyaratkan pula
untuk memiliki banyak data (n > 30) dan menggunakan skala data kontinyu
(skala rasio dan interval).
Pada kenyataannya, data sering tidak mengikuti distribusi normal.
Hal ini salah satunya karena jumlah data sampel yang didapat tidak cukup
banyak sehingga tidak memenuhi distribusi normal. Tidak hanya itu,
kesulitan pengukuran secara kuantitatif menyebabkan banyak pengukuran
data dilakukan secara kualitatif sehingga skala datanya adalah biner, ordinal
atau nominal. Memaksakan analisis statistik parametrik bila asumsi-asumsi
yang disyaratkan belum dapat terpenuhi akan menghasilkan suatu
kesimpulan yang kurang bisa diandalkan. Kesulitan-kesulitan dalam data
tetap harus diatasi supaya analisis data bisa dilakukan dan menghasilkan
suatu kesimpulan yang valid, memuaskan dan dapat diandalkan. Statistika
menyediakan suatu metode analisis data tanpa distribusi awal yang
mendasari data. Prosedur analisis statistik tersebut sering dikenal
distribution free test. Salah satu cabang distribution free test adalah
nonparametrik.
Statistik nonparametrik berawal dari kenyataan bahwa dalam dunia
nyata, tidak semua data yang akan dianalisis dapat memenuhi asumsi yang
disyaratkan suatu metode analisis data statistik seperti distribusi yang
mendasari data. Nonparametrik tidak memerlukan pemodelan awal populasi
ke dalam bentuk distribusi tertentu. Dalam statistik nonparametrik, kita
tidak perlu mengubah skala data kualitatif menjadi skala data kuantitatif
(numerik) karena tidak akan berpengaruh pada hasil analisis.
Uji nonparametrik telah mendapat perhatikan karena beberapa
alasan. Pertama, perhitungan yang diperlukan sederhana dan dapat
dikerjakan dengan cepat. Kedua, datanya tidak harus merupakan
Dua metode uji statistik untuk 1 populasi, yaitu sign test dan
Wilcoxon signed test untuk 1 populasi. Salah satu analisis statistik
nonparametrik paling sederhana adalah sign test atau uji tanda digunakan
untuk menguji dengan median suatu populasi berdistribusi kontinyu. Uji
tanda disebut pula uji lokasi karena median merupakan salah satu ukuran
pemusatan. Tabel 1 menunjukkan elemen-elemen uji hipotesis dalam sign
test.
Dalam uji tanda pengujian hipotesis nol Ho bahwa = o lawan
alternatifnya yang diinginkan berdasarkan pada contoh acak berukuran n, uji
ini mengganti setiap nilai pengamatan yang melebihi o dengan tanda plus
dan setiap nilai contoh yang lebih kecil dari o dengan tanda minus. Bila
hipotesis nol benar dan populasinya setangkup, jumlah yang bertanda plus
kira-kira sama dengan yang bertanda minus. Bila salah satu tanda
tampaknya muncul lebih sering dari seharusnya, berdasarkan faktor
kebetulan belaka, kita tolak hipotesis bahwa nilai tengah populasinya
sama dengan o.
Uji tanda hanya dapat diterapkan bila o tidak sama dengan nilai
pengamatan. Meskipun secara teoritis peluangnya nol mendapatkan suatu
nilai pengamatan yang persis sama dengan o bila populasinya kontinu,
tetapi dalam prakteknya nilai contoh yang sama dengan nol sering terjadi.
Bila demikian halnya, semua nilai yang sama dengan o itu harus
dikeluarkan dari analisis sehingga ukuran contohnya berkurang.
Statistik uji bagi uji tanda adalah peubah acak X yang menyatakan
banyaknya tanda plus dalam contoh acak kita. Bila hipotesis nol bahwa =o
benar, peluang bahwa suatu nilai contoh menghasilkan tanda plus atau
minus adalah sama dengan ½. Akibatnya, statistik uji X memiliki sebaran
peluang binom dengan parameter p= ½ bila Ho benar, dan dari sini kita
dapat menghitung taraf uji bagi hipotesis alternatif yang satu-arah maupun
yang dua-arah.
Karena X adalah peubah acak diskret, wilayah kritiknya besar
kemungkinan tidak mungkin sama dengan . Akan tetapi kita selalu dapat
mengambilnya sehingga wilayah kritik itu sedekat mungkin dari tetapi
tidak pernah melampauinya. Biasanya ini menjadi masalah hanya bila
ukuran contohnya kecil.
Statistik Uji:
Daerah penolakan:
z>z z > z/2
x- μ
zH =
σ
dengan:
x = jumlah tanda (+) atau (-)
μ = n p, dimana p= 0,5
σ = n p (1-p)
n = jumlah sampel
41 33 43 55 56 46
37 42 47 53 30 35
Para ahli manajemen pengairan telah menentukan bahwa bakteri aktif yang
dikumpulkan dari limbah pabrik mengikuti distribusi tertentu dengan
median 40%. Apabila bakteri aktif dalam limbah melebihi 40%, maka
pabrik akan membuat proses pengolahan limbah pabrik.
Kita tolak Ho dan terima H1 hanya bila proporsi tanda plus cukup lebih
besar dari ½, artinya bila x besar. Dengan demikian wilayah kritik terbesar
yang berukuran tidak melebihi adalah;
x ≥ k
Kita tolak Ho dan terima H1 bila proporsi plus cukup jauh dari ½,
lebih besar ataupun lebih kecil. Dengan demikian, wilayah kritik terbesar
berukuran yang tidak melebihi adalah:
x ≤ k’/2 atau x ≥ k/2
Karena nilai k’ dan k dapat diperoleh dari tabel peluang binom
dengan p=1/2 hanya bila ukuran contohnya kecil, maka kita dapat
menggunakan kurva normal bila n > 10. Sebagai contoh kita ingin menguji
hipotesis
Ho : = o
H1 : < o
Pada taraf nyata untuk suatu contoh acak berukuran n=20 dengan
x = 6 tanda plus. Dengan menggunakan sebaran normal, wilayah kritiknya
diberikan oleh z < -1,645. Dengan demikian
= np = (20) (0,5) = 10
Σ= npq= (20) (0,5) (0,5) = 2,236
Dan
6 - 10
z= = -1,79
2,236
Dalam contoh ini kita menguji apakah program fitness tersebut dapat
menurunkan berat badan, dengan kata lain proporsi peserta fitness yang
beratnya berkurang lebih banyak dibandingkan proporsi peserta fitness yang
beratnya bertambah, karena itu digunakan uji hipotesis satu sisi (one-sided
atau one-tailed test) dengan hipotesis;
Ho : ≤ o
H1 : > o
Dimana adalah proporsi perubahan berat badan peserta fitness.
NPar Tests
Binomial Test
Total 17 1.00
Interpretasi Hasil
1. Dari output uji tanda terlihat Test Proportion p =0,50
2. Untuk kolom proporsi yang diobservasi (observed
prop):Proporsi Group 1 = 13/17 = 0,76 dan Proporsi Group 2 = 4/17 =
0,24
3. Karena P-value=0,049 lebih kecil dari = 0,05 maka Ho:
≤ 0,05 ditolak. Sehingga dapat disimpulkan bahwa program fitness
tersebut dapat menurunkan berat badan.
n1n2 (n1+n2 - 1)
σ= 12
Hipotesis
Daerah Penolakan
P-value <
18 104 135
19 111 112
20 89 93
21 78 76
22 100 116
23 89 78
24 85 101
25 88 123
kanan = median waktu untuk membuka pintu dengan desain pegangan pintu
putar kanan.
kiri = median waktu untuk membuka pintu dengan desain pegangan pintu
putar kiri.
1. Pada lembar Variable View dari SPSS Data Editor kita definisikan
variable waktu untuk membuka pintu dengan desain pegangan pintu
putar kanan dengan nama kanan dan variable waktu untuk membuka
pintu dengan desain pegangan pintu putar kiri dengan nama kiri.
2. Pada lembar Data View dari SPSS Data Editor, masukkan data
waktu untuk membuka pintu dengan desain pegangan putar kanan
dan putar kiri atas ke dalam SPSS.
3. Klik Analyze Nonparametric Test 2 Related Sample.
Gambar 7.
4. Klik OK. Output dari uji Peringkat Bertanda Wilcoxon adalah sebagai
berikut:
NPar Tests
Wilcoxon Signed Ranks Test
Ranks
Sum of
N Mean Rank Ranks
Total 25
a. Waktu untuk membuka putar kekiri < Waktu untuk membuka putar kekanan
b. Waktu untuk membuka putar kekiri > Waktu untuk membuka putar kekanan
c. Waktu untuk membuka putar kekiri = Waktu untuk membuka putar kekanan
Test Statisticsb
Waktu untuk
membuka putar
kekiri - Waktu
untuk membuka
putar kekanan
Z -2.672a
Interpretasi Hasil
1. Uji Peringkat Bertanda Wilcoxon menguji Ho : kanan ≥ kiri,
memberikan nilai z =-2,672. Karena kita melakukan uji hipotesis satu
sisi (one tail) H1 : kanan < kiri , maka nilai p value harus dibagi dua
0,008/2=0,004. Nilai p value uji satu sisi ini lebih kecil dari = 0,05,
sehingga merupakan bukti kuat menolak Ho : kanan ≥ kiri.
2. Kesimpulan median waktu untuk membuka pintu dengan desain
pegangan pintu putar kanan untuk orang yang tidak kidal akan lebih
cepat dibandingkan median waktu untuk membuka pintu dengan
desain pegangan pintu putar kiri.
58 55
71 26
43 62
49 37
61 33
44 41
67 19
49 54
53 20
56 85
59 46
52 10
62 17
54 60
57 53
33 42
46 37
43 42
57 55
28
48
NPar Tests
Mann-Whitney Test
Ranks
Total 44
Test Statisticsa
Skor DRP
Mann-Whitney U 135.000
Wilcoxon W 411.000
Z -2.504
Interpretasi Hasil
Uji Mann-Whitney atau uji Wilcoxon rank sum tidak bisa digunakan
apabila ada lebih dari 2 populasi. Pada data yang mengikuti distribusi
normal, kita menggunakan metode desain eksperimen untuk
membandingkan 2 percobaan (populasi). Namun, bila asumsi dalam desain
eksperimen tidak bisa dipenuhi, maka analisisnya tidak bisa dilakukan.
Statistik menyediakan beberapa prosedur nonparametrik untuk
membandingkan beberapa populasi (lebih dari 3 populasi), antara lain uji
Kruskal-Wallis dan Uji Friedman. Kita akan melakukan uji untuk
membandingkan lebih dari 2 populasi dengan menggunakan kedua metode
tersebut.
Hipotesis
Statistik Uji
12 k T i2
H= - 3(n+1)
N(n+1) i=1 ni
Dimana
ni = jumlah dalam i sampel
Ti = jumlah dari rangking i sampel
Rangking dihitung relatif terhadap jumlah data untuk k sampel
n = jumlah total sampel= n1+n2+nk
Daerah Penolakan
H > 2 pada derajat bebas (k – 1)
Daerah Penolakan
Uji menggunakan level toleransi sebesar 5%. Adapun derajat
bebasnya adalah:
df = k – 1 = 3 - 1
Oleh karena itu, daerah penolakannya adalah H > 22. Lihat Tabel Chi-
Square menunjukkan 22 = 5,99147.
H = 0.64 DF = 2 P = 0.728
H = 0.64 DF = 2 P = 0.728 (adjusted for ties)
Hipotesis
Statistik Uji
12 k
Fr = Ti2 – 3b(k+1)
bk(k+1) i=1
Dimana
b = jumlah pengamatan dalam suatu perlakuan.
k = banyaknya perlakuan
n = jumlah rangkin untuk perlakuan ke i.
Dalam hal ini, rangking tiap pengamatan mulai dari rangking 1 sampai k.
Kemudian, rangking-rangking di tiap blok dijumlahkan dan akan
menghasilkan T1,T2, ....Tk.
Daerah Penolakan
Fr > 2 dengan derajat bebasnya adalah: (k – 1).
Tabel 5. Data jumlah korosi tiap logam untuk berbagai jenis segel.
Jenis Segel
Logam 1 2 3
1 21 23 15
2 29 30 21
3 16 19 18
4 20 19 18
5 13 10 14
6 5 12 6
7 8 18 12
8 26 32 21
9 17 20 9
10 4 10 2
S = 7.80 DF = 2 P = 0.020
Est Sum of
Perlakuan N Median Ranks
1 10 16.167 18.0
2 10 19.833 27.0
3 10 13.500 15.0
Grand median = 16.500
Statistik
Ada beberapa hal yang harus dipenuhi dalam uji satu sampel Kolmogorov-
Smirnov, yaitu:
Data
Data yang digunakan yaitu data kuantitatif (dengan skala pengukuran
interval atau rasio).
Asumsi
Uji Kolmogorov-Smirnov berasumsi bahwa parameter uji distribusi
ditentukan. Prosedur estimasi parameter menggunakan data dari sampel.
Mean dan standar deviasi sampel adalah parameter untuk distribusi normal,
nilai minimum dan maksimum sampel menentukan range distribsui uniform.
Mean sampel adalah parameter untuk distribusi poisson dan eksponensial.
Contoh
Dari data sampel kemasan gula pasir PT Sinar Mentari pada contoh uji
binomial ingin diketahui apakah data yang diambil berdistribusi normal
atau tidak.
Dalam kasus ini, hipotesis yang diuji adalah kenormalan data sampel berat
gula pasir.
1. Hipotesis
H0: Data sampel berdistribusi normal
Ha:Data sampel tidak berdistribusi normal
Uji Tanda
Uji tanda akan dilakukan berdasarkan tanda, yakni (+) dan (-) yang didapat
dari selisih nilai pengamatan. Misalkan hasil pengamatan Xi dan Yi masing-
Dalanm hal ini, pengaruh diukur oleh rata-rata, sehingga sebenarnya, dalam
hal ini, uji tanda ini dapat digunakan untuk menguji kesamaan dua rata-rata
populasi.. Kriteria adalah: tolak H0 jika harga h dari perhitungan lebih
kecil atau sama dengan harga h yang terdapat dari daftar untuk taraf nyata
yang dipilih. Dalam hal lainnya H1 diterima. Supaya pengujian dapat
ditentukan hasilnya, diperlukan paling sedikit n = 6.
Contoh mengenai hasil dua macam kacang tanah (dinyatakan dalam ons),
untuk tiap rumpun dari berbagai lokasi.
Lokasi
(1) Macam X (2) Macam Y (3) Tanda (Xi - Yi)
1 3,4 3 +
2 3,7 3,9 -
3 2,8 3,2 -
4 4,2 4,6 -
5 4,6 4,3 +
6 3,8 3,4 +
7 3,6 3,5 +
8 2,9 3 -
9 3 2,9 +
10 3,8 3,7 +
11 4 3,7 +
12 3,9 4 -
13 3,8 3,5 +
14 4,2 4,5 -
15 4,7 3,9 +
16 4 3,7 +
17 3,6 3,2 +
18 3,2 2,9 +
19 3,4 3 +
20 2,9 3,5 -
Apabila n lebih besar dari 95, maka harga h dapat dihitung dengan jalan
mengambil bilangan bulat terdekat yang lebih kecil dari:
½ (n – 1) – k √ n + 1
Dengan k = 1,2879 untuk = 0,01 dan k = 0,9800 untuk = 0,05.
Uji Wilcoxon
Uji ini merupakan perbaikan daripada uji tanda. Dalam uji Wilcoxon, bukan
saja tanda yang diperhatikan tetapi juga nilai selisih (X – Y).
b. Untuk tiap nomor urut berikan pula tanda yang didapat dari selisih
(X-Y).
c. Hitunglah jumlah nomor urut yang bertanda positif dan juga jumlah
nomor urut yang bertanda negatif.
d. Untuk jumlah nomor urut yang didapat di c), ambillah jumlah yang
harga mutlaknya paling kecil. Sebutlah jumlah ini sama dengan J.
Jumlah J inilah yang dipakai untuk menguji hipotesis:
Untuk menguji hipotesis di atas dengan taraf nyata = 0,01 atau = 0,05,
kita bandingkan J di atas dengan J yang diperoleh dari daftar. Jika J dari
perhitungan lebih kecil atau sama dengan J dari daftar berdasarkan taraf
nyata yang dipilih maka H0 ditolak. Dalam hal lainnya H0 diterima.
Jika dimulai dari data terkecil, maka nomor urut 1 dan nomor urut 2 (untuk
sementara) diberikan kepada 8. Rata-ratanya = ½ (1+2)= 1,5. dan inilah
yang merupakan nomor urut seri untuk 8. Nomor urut 3 diberikan 9. Data
bernilai 10 mempunyai nomor urut sementara 4,5,6, dan 7. rata-ratanya= ¼
(4+5+6+7)=5,5 dan inilah yang menjadi nomor urut seri untuk 10.
Selanjutnya nilai 12 diberi nomor urut 8. Data 17 mempunyai nomor urut 10
yang didapat dan 1/3 (9+10+11). Akhirnya nomor urut 12 diberikan kepada
nilai 20.
12 3,9 4 -0,1 3 3
13 3,8 3,5 0,3 9,5 9,5
14 4,2 4,5 -0,3 9,5 9,5
15 4,7 3,9 0,8 20 20
16 4 3,7 0,3 9,5 9,5
17 3,6 3,2 0,4 15,5 15,5
18 3,2 2,9 0,3 9,5 9,5
19 3,4 3 0,4 15,5 15,5
20 2,9 3,5 -0,6 19 19
Jumlah 138,5 71,5
Dari daftar di atas didapat harga J=71,5 yaitu jumlah yang harga mutlaknya
paling kecil. Dengan = 0,05 dan n = 20, dari daftar didapat J=52. Karena
J=71,5 dari perhitungan lebih besar dari 52, maka hipotesis H0 diterima.
Keterbatasan Nonparametrik
1. Sampelnya harus acak (random sample)
2. Rancangan percobaan yang komplek dengan interaksi tidak dapat
diakomodasi dengan statistik non parametrik
3. Uji non parametrik bersifat less powerfull.
1. Jelaskan kriteria level data nominal, ordinal, interval dan rasio. Berikan
contoh masing-masing?