Gambar 8.2 Kiri: W.H. Kruskal (1919-2005); kanan: w.A. Wallis (1912-1998)
8.1 UJI KRUSKAL-WALLIS H.
Uji Kruskal-Wallis H merupakan alternatif dari uji F untuk menguji kesamaan
nilai rata-rata dari lebih dari 2 sampel dalam analisis variansi (ANOVA), sehingga
disebut juga analisis variansi satu arah berdasarkan peringkat Kruskal-Wallis, atau
disingkat analisis varians Kruskal-Wallis. Uji ini pertama kali diperkenalkan oleh
William Hendry Kruskal dan Wilson Allen Wallis pada tahun 1952. Mereka
menurunkan uji ini dari uji Wilcoxon untuk tiga atau lebih sampel bebas. Jika yang
dibandingkan hanya 2 sampel bebas, maka uji Kruskal-Wallis akan setara dengan uji
Mann-Whitney U yang dibahas pada Bab 6. Uji Kruskal-Wallis H merupakan
perluasan dari uji Mann-Whitney U.
8.1.1 Langkah-langkah Uji Kruskal-Wallis H
Misalkan terdapat k sampel yang masing-masing berukuran n1 untuk sampel
kesatu, n2 untuk sampel kedua, n3 untuk sampel ketiga, dan seterusnya, sampai n k
untuk sampel ke-k. Sehingga ukuran sampel totalnya adalah N=n1+ n2 +⋯+ nk . Data
sampel dinotasikan dengan Y ij , yang berarti data ke-j dalam sampel diambil dari
sampel ke-i, disajikan dalam Tabel 8.1.
Sampel ke-
1 2 3 … k
Y 11 Y 21 Y 31 … Yk1
Y 12 Y 22 Y 32 … Yk2
Y 13 Y 23 Y 33 … Yk3
Data hasil …
. . . .
pengamatan …
. . . .
. . . … .
Y 1n Y 2n Y 3n … Ykn
1 2 3 k
Tabel 8.2 Data berbentuk rank dari k sampel
Sampel ke-
1 2 3
R11 R21 R31 … Rk 1
R12 R22 R32 … Rk 2
R13 R23 R33 … Rk 3
Rank data hasil …
. . . .
pengamatan …
. . . .
. . . … .
R1 n R2 n R3 n … Rk n
1 2 3 k
Jumlah R1 R2 R3 … Rk
Semua (k) sampel dikatakan sama atau tidak berbeda jika nilai rank, baik yang kecil
maupun yang besar, tersebar secara merata ke semua sampel. Sehingga jumlah rank
(jika ukuran sampel sama) atau rata-rata jumlah rank (jika ukuran sampel tidak sama)
untuk k sampel adalah relatif sama. Untuk itu, Kruskal-Wallis merumuskan statistik
uji H sebagai berikut:
[ ]
2
12 1
k
ni (N +1)
H= ∑
N (N +1) i=1 ni
R i−
2
………………....(8.1)
ni (N +1)
di mana Ri adalah jumlah rank sampel ke-i dan adalah jumlah rank yang
2
diharapkan. Persamaan (8.1) dapat disederhanakan menjadi:
12
k
R2i
H= ∑ −3(N +1)……………………(8.2)
N (N +1) i=1 n i
Statistik uji H akan mengikuti distribusi Chi-kuadrat dengan derajat bebas (k-1).
Berikut disajikan langkah-langkah uji Kruskal-Wallis H untuk menguji kesamaan k
sampel saling independen (bebas) yang terdiri atas 5 langkah:
1. Merumuskan hipotesis
H 0 : Ke-k sampel memiliki distribusi yang sama ( μ1=μ 2=⋯=μk )
H 1 : Minimal ada satu sampel yang berbeda ( μi ≠ μ j ;i, j =1, 2 , … , k )
2. Menentukan tingkat signifikansi
Tingkat signifikansi biasa dinotasikan dengan α, biasanya 5% atau 1%.
3. Menentukan nilai kritis
Nilai kritis digunakan sebagai pedoman menerima atau menolak H 0. Caranya
adalah membandingkan nilai statistik uji H dengan nilai tabel distribusi Chi-
kuadrat (Lampiran B) dengan derajat bebas (k-1). H 0 ditolak jika:
H hit >❑2( k−1) ;α
4. Menghitung statistika uji
Statistik uji yang digunakan adalah H, seperti pada persamaan (8.2).
k 2
12 Ri
H= ∑
N (N +1) i=1 n i
−3( N +1)
5. Membuat kesimpulan
Keputusan menolak atau menerima H 0 dilakukan setelah membandingkan nilai
hasil perhitungan statistik uji dengan nilai kritis. Jika nilai statistik uji H berada
dalam daerah penolakan, maka H 0 ditolak.
Contoh 1:
Empat macam obat penurun panas diberikan kepada 16 anak yang memiliki tingkat
sakit yang diperkirakan sama. Pada tingkat kepercayaan 95%, selidikilah apakah
keempat merek obat tersebut mampu menurunkan panas dałam jangka waktu yang
sama.
1. Hipotesis:
H 0 : Keempat merek obat menurunkan panas dałam waktu yang sama
( μ1=μ 2=μ3=μ 4 )
H 1 : Minimal ada satu pasang jenis obat yang berbeda satu sama lain dałam
jangka hal waktu (menit) menurunkan panas.
2. Telah ditetapkan bahwa tingkat signifikansi yang digunakan adalah 5% (tingkat
kepercayaan 95%).
3. Nilai kritisnya didasarkan pada tabel Chi-kuadrat (Lampiran B) dengan derajat (4
– 1) = 3 dan tingkat signifikan 5%, yaitu ❑23 ;0,05=7,81. Jadi daerah kritis atau
penolakan H 0 jika nilai statistik uji H > 7,81.
4. Perhitungan statistik uji:
Pertama-tama, urutkan data dari terkecil ke data terbesar dan tentukan rank-nya
(Tabel 8.4), kemudian sajikan data dałam bentuk rank tersebut ke bentuk tabel
dan hitung jumlah rank untuk setiap merek obat (Tabel 8.5).
Tabel 8.4 Penentuan nilai rank data Tabel 8.3
Data Nomor Urut Ran
k
22,9 1 1
24,4 2 2
25,0 3 4
25,0 4 4
25,0 5 4
26,5 6 6
26,9 7 7
27,0 8 8
27,1 9 9,5
27,1 10 9,5
27,5 11 11
27,8 12 12
28,9 13 13
29,6 14 14
30,2 15 15
31,5 16 16
Tabel 8.5 Data Tabel 8.3 dalam bentuk rank
Merek obat (i) A(1) B(2) C(3) D(4)
4 12 16 1
8 7 14 4
Rank data 6 9,5 13 9,5
11 15 - 2
4 - - -
R
Jumlah rank ( i ) 33 43,5 43 16,5
Ukuran sampel i (n ) 5 4 3 4
Rata-rata rank (R i) 6,60 10,88 14,33 4,12
Menggunakan persamaan (8.2), dapat dicari statistik uji H:
k 2
12 Ri
H= ∑
N (N +1) i=1 n i
−3( N +1)
( )
2 2 2 2
12 33 43,5 43 16,5
= + + + −3( 16−1)
16(16+1) 5 4 3 4
= 22,38
5. Kesimpulan:
Tampak bahwa H = 22,38 > 7,82, yang berarti statistik uji H berada pada daerah
kritis (daerah penolakan H 0), jadi H 0 ditolak. Sehingga dapat disimpulkan bahwa
minimal ada satu pasang merek obat berbeda satu sama lain dalam hal jangka
waktu (menit) menurunkan panas.
8.1.2 Uji Perbandingan Ganda Kruskal-Wallis H
Jika H 0 ditolak, yaitu minimal ada satu pasang sampel yang berbeda satu sama
lain dari sebanyak C 2k pasangan sampel. Sehingga perlu dilakukan uji lanjutan yang
salah satunya diketengahkan oleh Dunn pada tahun 1964. Untuk penyelidikan lebih
lanjut uji Kruskal-Wallis H, dapat menggunakan suatu uji pasangan berganda yang
analog dengan prosedur pasangan Benferroni yang didasarkan pada data rank sebagai
berikut:
( R i−R j ) ± Z
1−
α
k(k−1) √ 12 (
N (N +1) 1 1
+
)
ni n j
…………..…(8.3)
Jika interval pada persamaan (8.3) mengandung 0 (nol), maka pasangan sampel yang
dibandingkan tersebut sama (tidak berbeda) atau sebaliknya. Jika interval tersebut
mengandung 0 (nol), maka pasangan sampel tersebut berbeda.
Atau berdasarkan persamaan (8.3), pasangan sampel dikatakan tidak berbeda jika
berlaku:
|R i−R j|≤ Z
1−
α
k (k −1 ) √ 12 ( )
N (N + 1) 1 1
+
ni n j
……………(8.4a)
|R i−R j|> Z
1−
α
k(k−1) √ 12 (
N (N +1) 1 1
)
+ …………….(8.4b)
ni n j
Contoh 2:
Berdasarkan Contoh 1 di atas, tampak bahwa H 0 ditolak atau minimal ada satu
pasang obat berbeda satu sama lain dalam hal jangka waktu (menit) menurunkan
panas. Untuk itu, selidikilah merek obat mana yang berbeda (gunakan tingkat
kepercayaan 95%).
Untuk kasus di atas, terdapat 4 merek obat (A, B, C, D), sehingga terdapat
2 4!
C 4= =6 pasangan yang perlu diuji, yaitu A vs B, A vs C, A vs D, B vs C,
2 ! ( 4−2 ) !
B vs D, dan C vs D. Selanjutnya, dihitung nilai
Z α =Z 0,05 =Z 0,9958 =2,64
1− 1−
k (k−1) 4 (4−1)
(Lampiran A) dan telah diketahui rata-rata rank untuk setiap merek obat pada Tabel
8.5 adalah:
Tabel 8.5 Rata-rata rank untuk setiap merek obat
Pasanga
n
A vs B
⌈ Ri−R j⌉
4,28
2,64
√ N ( N +1) 1 1
12
8,43
+
(
ni n j ) Tanda
(≤ atau >)
≤
Keterangan
Tidak berbeda
A vs C 7,73 9,18 ≤ Tidak berbeda
A vs D 2,48 8,43 ≤ Tidak berbeda
B vs C 3,45 9,60 ≤ Tidak berbeda
B vs D 6,76 8,89 ≤ Tidak berbeda
C vs D 10,21 9,60 > Berbeda
Berdasarkan hasil pada Tabel 8.6, tampak bahwa pasangan berbeda adalah C vs D, di
mana obat D cenderung lebih cepat menurunkan panas dibanding obat B.
8.1.3 Koreksi Data yang Sama pada Uji Kruskal-Wallis H
Jika terdapat cukup banyak data dengan nilai yang sama, maka statistik uji H
perlu disesuaikan. Faktor penyesuaian yang dapat digunakan adalah:
1−
∑T
N (N ¿¿ 2−1) ¿
Dengan T = t3 – t dan t adalah banyaknya nilai pengamatan yang sama dalam
sekelompok skor yang bernilai sama.
Sehingga statistik uji Kruskal-Wallis setelah dikoreksi adalah:
H
H c=
1−
∑T ................................................ (8.5)
2
N (N −1)
Contoh 3:
Asam arakhidonat diketahui berpengaruh terhadap metabolisme okuler. Pemberian
asam arakhidonat menyebabkan gejala dan tanda antara lain penutupan kelopak mata,
gatal-gatal, dan kotoran mata. Sebuah eksperimen berminat mempelajari efektivitas
anti-inflamasi okuler 3 jenis obat (Indomethacine, Aspirin, dan Piroxicam) terhadap
penutupan kelopak mata setelah pemberian asam arakhidonat.
Untuk itu, 13 ekor kelinci digunakan sebagai percobaan dengan memberikan asam
arakhidonat pada kedua belah matanya. Sepuluh menit kemudian, mata kiri diberi
larutan saline dan mata kanan diberi salah satu obat anti-inflamasi. 15 menit
kemudian, perubahan pembukaan kelopak mata dinilai dengan skor 0 sampai 3,
sebagai berikut:
( )
2 2 2
12 45,5 15,5 30
= + + −3( 13+1)
13(13+1) 5 4 4
= 4,095
Karena terdapat beberapa data (rank) yang sama pada masing-masing sampel,
maka perlu dilakukan koreksi terhadap nilai H.
Rank yang sama pada:
a. Kelompok 1 = 3 T1 = 33 – 3 = 24
b. Kelompok 2 = 2 T2 = 23 – 2 = 6
c. Kelompok 3 = 2 T3 = 23 – 2 = 6
Jadi, ∑ T =24+6+ 6=36 .
36
Faktor koreksinya adalah 1− =0,9836.
3 ( 3 −1 )
2
Uji median merupakan salah satu metode nonparametrik yang paling sederhana
yang dapat digunakan untuk menguji apakah dua atau lebih sampel dari populasi
independen mempunyai median yang sama atau tidak. Jika yang diselidiki terdiri atas
2 sampel independen, cukup disebut uji median saja; dan jika yang diselidiki lebih
dari 2 sampel, biasa disebut uji perluasan median.
Misalkan diketahui data terbagi dalam k sampel, seperti yang disajikan pada
Tabel 8.9 berikut:
Untuk keperluan uji median, perlu ditentukan nilai median dari data gabungan dari k
sampel. Kemudian untuk masing-masing sampel, data dibagi menjadi 2 kelompok,
yaitu data yang nilainya sama atau lebih kecil dari nilai median dan data yang
nilainya lebih besar dari nilai median. Selanjutnya, hitung jumlah data (frekuensi) dua
kelompok data tersebut untuk masing-masing sampel dan sajikan dalam tabel
kontingensi 2 x k, seperti berikut:
Tabel 8.10 Data uji median untuk k sampel
Sampel ke-
Kelompok (i) Jumlah
1 2 3 … k
Ukuran sampel n1 n2 n3 … nk N
Oij adalah banyak data atau hasil pengamatan kelompok ke-i (i = 1, 2) pada sampel
ke-j (j = 1, 2, …, k) adalah banyaknya data gabungan di kelompok 1, yaitu banyaknya
data yang nilainya lebih kecil atau sama dengan median, b adalah banyaknya data
gabungan di kelompok 2, yaitu banyak data yang nilainya lebih besar dari median, ni
adalah ukuran sampel ke-i, dan N adalah jumlah total sampel gabungan.
Uji k sampel independen menggunakan uji median adalah membandingkan
median dari k sampe1 independen tersebut sama atau tidak. Caranya adalah
membandingkan proporsi banyaknya data yang berada di atas median dan banyaknya
data yang berada sama atau di bawah median. Hipotesis nol dalam uji median
menyatakan bahwa populasi-populasi dalam hal proporsi banyaknya data yang berada
di atas median dan banyaknya data yang berada sama atau di bawah median untuk
setiap sampel akan sama dengan populasi gabungan. Sehingga dengan menghitung
(
frekuensi-frekuensi harapan Eij =
nj
2 ), proses pengujian hipotesis dapat mengguna-
1. Merumuskan hipotesis
H 0 : Ke-k sampel memiliki median yang sama ( μ1=μ 2=⋯=μk )
H 1 : Minimal ada satu sampel yang memiliki median berbeda
( μi ≠ μ j ;i, j =1, 2 , … , k ).
2. Menentukan tingkat signifikan
Tingkat signifikansi biasa dinotasikan dengan α, biasanya 5% atau 1%.
3. Menentukan nilai kritis
Contoh 4:
Seorang manajer produksi perusahaan ingin mengetahui pengaruh ruangan dalam
meningkatkan produktivitas karyawan. Untuk itu, ia merancang 3 ruangan dengan
luas yang sama namun kondisi yang berbeda dan menempatkan masing-masing 10
karyawan untuk setiap ruangan. Ruang pertama bersuhu 220C, ruangan kedua bersuhu
180C, dan ruang ketiga awalnya bersuhu 220C secara perlahan diturunkan menjadi
180C, lalu diukur produktivitasnya dan diperoleh data sebagai berikut:
Pertama-tama, urutkan data dari terkecil ke data terbesar dan tentukan mediannya:
11 12 13 13 14 14 14 15 15 15
15 16 16 17 17 18 18 18 18 18
18 19 19 19 19 20 20 20 21 21
Karena data berjumlah 30, maka dapat ditentukan median terletak antara data ke-
15 dan data ke-16, jadi nilai mediannya adalah 17,5. Sehingga data pada Tabel
8.11 di atas dapat disusun dalam tabel kontingensi 2 × 3 sebagai berikut:
Tabel 8.12 Tabel kontigensi 2 × 3 hasil pengamatan Oij untuk data pada Tabel
8.11
Ruangan ke-
Kelompok (i) Jumlah
1 2 3
Lebih kecil atau sama dengan median
6 7 2 15
(1)
Lebih besar dari median (2) 4 3 8 15
Ukuran Sampel (ni) 10 10 10 30
Selanjutnya, dapat dihitung nilai frekuensi harapan untuk masing-masing sel,
yaitu:
ni
Eij = dan diperoleh sebagai berikut:
2
Tabel 8.13 Tabel kontingensi 2 × 3 frekuensi harapan (Eij untuk
data pada Tabel 8.12
Ruangan ke-
Kelompok (i) Jumlah
1 2 3
Lebih kecil atau sama dengan median
5 5 5 15
(1)
Lebih besar dari median (2) 5 5 5 15
Ukuran Sampel (ni) 10 10 10 30
Dengan menggunakan persamaan (8.6), dapat dicari statistik uji W.
2
2 k
( Oij −Eij )
W =∑ ∑
i=1 j=1 Eij
Tampak bahwa W = 5,60 < 5,99; yang berarti statistik uji W tidak berada pada
daerah kritis (daerah penolakan H 0). Jadi H 0 tidak ditolak. Sehingga dapat
disimpulkan pada tingkat kepercayaan 95% bahwa belum cukup alasan untuk
menyatakan produktivitas karyawan di 3 kondisi ruangan adalah berbeda.
Uji Kruskal-Wallis H dan uji median terbatas hanya untuk mengetahui apakah
k sampel independen memiliki nilai parameter lokasi (median) sama atau berbeda.
Beberapa kasus tertentu, peneliti ingin mengetahui apakah nilai parameter lokasi
untuk k sampel tersebut memiliki nilai yang berturutan. Misalkan:
1. Merumuskan hipotesis
H 0 : Ke-k sampel memiliki median sama ( μ1=μ 2=⋯=μk )
Contoh 5:
Seseorang menyelidiki perubahan-perubahan yang terjadi dalam hernosit larva
Drosophila algoquin selama ditumpangi oleh parasit hymenoptera yang disebut
Pseuduecoila bochei. Duapuluh tujuh jam setelah ditumpangi parasit, hitungan
plasmatosit diferensial (%) dilakukan terhadap tiga kelompok larva Drosophila
algoquin tersebut, yang masing-masing adalah: kelompok larva tuan rumah (host
larvae) dengan reaksi yang berhasil (S), kelompok larva dengan reaksi yang tidak
berhasil (U), dan kelompok larva yang tidak dapat memberikan reaksi (N). Hasil-hasil
penelitian tersebut dilampirkan dalam Tabel 8.15.
Tabel 8.15 Persentase hitungan plasmatosit diferensial
1. Hipotesis:
H 0 : Ketiga kelompok memiliki hitungan plasmatosit diferensial (%) yang sama
( μ S=μU =μ N )
H 1 : Hitungan plasmatosit diferensial (%) dari kelompok N hingga S menurun
( μ S ≤ μU ≤ μ N ) .
2. Telah ditetapkan bahwa tingkat signifikansi yang digunakan adalah 5%.
3. Nilai kritisnya didasarkan pada tabel harga kritis J statistik uji Jonckheere-
Terpstra (Lampiran N) dengan k = 3, ukuran sampel 7, 7, 8 dan α/ 2 = 0,025,
diperoleh nilai tabel senilai 114. Jadi daerah kritis atau penolakan H 0 jika nilai
statistik uji J >114.
4. Perhitungan statistik uji:
Tampak bahwa J = 159 > 114, yang berarti statistik uji J berada pada daerah kritis
(daerah penolakan H 0), jadi H 0 ditolak. Sehingga dapat disimpulkan pada tingkat
kepercayaan 95% bahwa hitungan plasmatosit diferensial (%) dari kelompok N
hingga S menurun ( μ S ≤ μU ≤ μ N ) .
Untuk ukuran-ukuran sampel yang besar, J kurang lebih memiliki distribusi normal
standar. Apabila menggunakan aproksimasi normal, maka dapat dihitung statistik uji
Z sebagai berikut:
[( ) ]
k
J − N −∑ ni / 4
2 2
i =1
Z= …………………………(8.8)
√[ ]
k
N 2 ( 2 N + 3 )−∑ n2i ( 2 ni +3 ) /72
i=1
Daerah penolakan H 0 adalah atau Z hit <−Z α / 2 atau Z hit > Z 1−α / 2
Contoh 6:
Sebagai contoh digunakan Contoh 5 di atas.
Rumusan hipotesisnya adalah:
H 0 : Ketiga kelompok memiliki median yang sama ( μ1=μ 2=μ3 )
H 0 : Ketiga kelompok memiliki median yang meningkat dari kelompok 1 ke
Sehingga jika akan digunakan pendekatan distribusi normal, maka statistik uji Z dapat
Shitung dengan menggunakan persamaan (8.8) di atas.
159−[ ( 22 −162 ) / 4 ]
2
Z= =4,73
√[ 222 ( 2× 22+ 3 )−2882 ] /72
Pada tingkat kepercayaan 95%, dapat dibentuk daerah kritis atau daerah penolakan
H 0 adalah:
Z hit <−Z 0,05 /2 atau Z hit > Z 1−0,05/ 2
Z hit <−Z 0,025 atau Z hit > Z 0,975
Z hit ←1,96 atau Z hit >1,96
Tampak bahwa nilai statistik uji Z = 4,73 > 1,96. Jadi Z berada dalam daerah
penolakan H 0. Dengan demikian, H 0 ditolak. Sehingga dapat disimpulkan bahwa
ketiga kelompok memiliki median yang meningkat dari kelompok 1 ke kelompok 3.
Latihan
1. Seorang staf bagian Research and Development sebuah perusahaan telepon
genggam (handphone) ingin menguji ketahanan 4 jenis baterai telepon genggam
yang diproduksi perusahaannya. Untuk iłu, ia mengambil 22 sampel dan
diperoleh data daya tahan hidup (jam) sebagai berikut:
Merek
Bulan
A B C D
1 50 47 33 31
2 45 36 32 33
3 48 33 37 36
4 36 38 35 39
5 39 49 42 38
6 41 51 41 35
7 42 35 43 32
8 35 42 45 29
9 60 40 41 40
10 65 39 40 43
11 60 42 44 38
12 64 40 50 36
4. Seorang dokter anak ingin mengetahui pengaruh kebiasaan merokok ibu pada
trimester pertama terhadap berat badan bayi. Untuk itu, ia mencatat berat bayi
baru lahir selama 1 bulan pada sebuah rumah sakit dan mengelompokkan
kebiasaan merokok ibu dalam 3 kelompok, yaitu: