Anda di halaman 1dari 11

BAB II

CHI-SQUARE (UJI SATU SAMPEL)

Uji Chi-kuadrat banyak digunakan untuk menguji keselarasan atau goodness of fit
pada satu sampel dan dapat juga digunakan untuk uji kebebasan serta homogenitas
untuk dua atau lebih sampel. Uji keselarasan dapat menjadi alat yang bermanfaat
untuk mengevaluasi sampai sejauh mana suatu model mampu mendeteksi situasi
nyata yang digambarkan.

Uji keselarasan populasi pertama kali diperkenalkan oleh Karl


Pearson pada tahun 1990-an. Beliau mempertanyakan
keselarasan data yang teramati dengan data-data frekuensi
teoritis yang didasarkan hipotesis. Ternyata banyak nilai
statistik dari data sampel yang dipilih secara acak tidak tepat
atau tidak sesuai hasil teoritisnya. Selaras tidaknya frekuensi
teramati dengan frekuensi teoritis (frekuensi harapan) diten-
tukan dengan cara membandingkan keselarasan dengan suatu
nilai distribusi Chi-kuadrat. Sehingga uji keselarasan ini
disebut juga dengan uji Chi-kuadrat.
Ilustrasi, sebuah perusahaan otomotif mengeluarkan mobil baru dengan 4 warna
dasar, yaitu hitam, abu-abu, putih, dan merah. Untuk itu bagian riset ingin
mengetahui penjualan keempat warna mobil tersebut sama atau tidak.
Tabel 2.1 Data warna dasar dan angka penjualan mobil
Warna Mobil Hitam Abu-abu Putih Merah
Angka Penjualan 30 25 25 20
II.1 Konsep Uji Chi-kuadrat
II.1.1 Data dan Frekuensi Harapan Uji Chi-kuadrat
Data yang digunakan dalam uji Chi-kuadrat adalah data berbentuk kategorik (nominal
atau ordinal), seperti jenis kelamin, jenis sekolah. Uji Chi-kuadrat dapat juga diguna-
kan untuk data berbentuk numerik (interval atau rasio) yang sudah disajikan dalam
bentuk kategorik, seperti usia (dikelompokkan menjadi; kurang dari 15 tahun, 15-24,
25-34, 35-44, 45-54, dan 55 ke atas).

7
Berikut adalah data untuk uji Chi-kuadrat yang terdiri atas r kategori dan frekuensi
pengamatan untuk setiap kategori (Oi), di mana i = 1, 2, 3, …, r.
Tabel 2.2 Bentuk data untuk uji Chi-kuadrat
Kategori Frekuensi Pengamatan Frekuensi Harapan
1 O1 E1 = Np1
2 O2 E2 = Np2
3 O3 E3 = Np3

r Or Er = Npr
Jumlah N N

Misalkan peluang sebuah hasil pengamatan yang dipilih secara acak masuk kategori
ke-i adalah pi, jadi untuk masing-masing kategori 1, 2, 3, …, r berturut-turut adalah
p1, p2, p3, …, pr. Dengan mengalikan jumlah pengamatan (N) dengan peluang masing-
masing (pi), dapat iperoleh frekuensi harapan untuk kategori yang bersesuaian (
). Sehingga frekuensi harapan untuk masing-masing kategori adalah Np1,
Np2, …, Npr.
Uji keselarasan dengan rumus

, untuk i = 1, 2, 3, …, r (2.1)

Untuk data sampel dengan ukuran besar, W akan mendekati distribusi Kai-kuadrat
dengan derajat bebas r – 1.

II.1.2 Langkah-langkah Uji Chi-kuadrat

Berikut ini diberikan langkah-langkah uji keselarasan dengan menggunakan uji Chi-
kuadrat:

1. Merumuskan hipotesis

H0: Data sampel diperoleh dari populasi yang mengikuti suatu distribusi yang
ditetapkan (frekuensi data yang diamati sesuai frekuensi yang diharapkan).
H1: Data sampel diperoleh bukan dari populasi yang mengikuti suatu distribusi
yang ditetapkan (frekuensi data yang diamati tidak sesuai frekuensi yang
diharapkan).
2. Menentukan tingkat signifikan

8
Tingkat signifikan  yang biasanya digunakan adalah 0,10 (10%), 0,05 (5%), atau
0,01 (1%) dan yang paling sering digunakan adalah 0,05. Besarnya  bergantung
pada keberanian pembuat keputusan, yang dalam hal ini menoleransi kesalahan
yang ada (resiko).

3. Menentukan nilai kritis


Nilai kritis digunakan sebagai pedoman menerima atau menolak H0. Caranya
adalah membandingkan nilai  tabel distribusinya (nilai kritis) dengan nilai
satistik ujinya, yaitu H0 ditolak jika

di mana:
W adalah nilai statistik uji
adalah nilai dari tabel Chi-kuadrat dengan tingkat signifikan  dan
derajat bebas r – 1.

Gambar 2.1 Daerah penolakan H0

4. Menghitung statistik uji


Statistik uji untuk uji Chi-kuadrat adalah W dengan

, untuk i = 1, 2, 3, …, r

di mana r adalah banyaknya kategori.

5. Membuat kesimpulan

9
Keputusan menolak atau menerima H0 dilakukan setelah membandingkan nilai
hasil perhitungan statistik uji dengan nilai kritis. Jika nilai statistik uji W berada
dalam daerah penolakan, maka H0 ditolak.
Contoh 1:
Pada pelemparan sebuah dadu sebanyak 300 kali, diperoleh data kemunculan mata
dadu sebagai berikut:
Tabel 2.3. Hasil pelemparan sebuah dadu
Mata Dadu 1 2 3 4 5 6
Frekuensi Kemunculan 48 55 40 45 60 52
Selidiki pada tingkat kepercayaan 95%, apakah dadu tersebut seimbang atau tidak.

Jawab:
Dadu dikatakan seimbang jika pada setiap pelemparan, setiap mata dadu meliliki
peluang yang sama untuk muncul, yaitu 1/6. Sehingga frekuensi harapan kemunculan
untuk masing-masing mata dadu adalah sama, yaitu 1/6  300 = 50.
i. Hipotesis
H0: Dadu seimbang
H1: Dadu tidak seimbang
ii. Tingkat signifikan
Dapat ditentukan bahwa r = 6 dan dengan menggunakan tingkat kepercayaan
95%, maka  = 0,05 (5%)
iii. Titik kritis
H0 ditolak jika , yaitu W > 11,071
iv. Statistik uji
Tabel 2.4 Perhitungan statistik uji W Contoh 1
Mata Dadu (Oi)
Jumlah
1 2 3 4 5 6
Frekuensi Pengamatan (Oi) 48 55 40 45 60 52 300
Frekuensi Harapan (Ei) 50 50 50 50 50 50 300

0,08 0,5 2 0,5 2 0,08 5,16

10
Gambar 2.2 Letak statistik uji W
v. Kesimpulan
Tampak bahwa W = 5,16 tidak masuk dalam daerah penolakan H0, artinya H0 tidak
ditolak. Sehingga dapat disimpulkan pada tingkat kepercayaan 95%, dadu yang
dilemparkan tersebut adalah seimbang.

Contoh 2:
Observasi 80 kelahiran kelinci, masing-masing terdiri dari 3 kelinci. Data pada Tabel
2.5 menunjukkan distribusi frekuensi banyaknya kelinci jantan setiap kelahiran.
Menurut model Bernoulli, untuk jenis kelamin kelinci, distribusi peluang banyak
jantan per kelahiran haruslah binomial dengan n = 3 dan p = peluang kelahiran jantan.
Tabel 2.5 Hasil pengamatan 80 kelahiran kelinci
Banyak Kelinci Jantan 0 1 2 3
Banyak Kelahiran 19 32 22 7
Lakukan uji hipotesis untuk menentukan apakah distribusi binomial cocok untuk data
tersebut pada tingkat kepercayaan 95%, di mana

Jawab:
Hipotesis:
H0: Distribusi peluang banyak kelahiran kelinci jantan adalah binomial.
H1: Distribusi peluang banyak kelahiran kelinci jantan bukan binomial.
Terdapat 4 kelompok banyak kelinci jantan (r = 4), dan dengan menggunakan tingkat
kepercayaan 95%, maka nilai  = 0,05 dan dapat disusun daerah penolakan H0
sebagai berikut:

W > 7,8147
Sebelum menghitung statistik uji W, didefinisikan:

11
X: Banyak kelinci jantan yang lahir
Hitung nilai p:

Sehingga dapat ditulis fungsi distribusi binomialnya sebagai berikut:

, x = 0, 1, 2, 3

Berikut hasil perhitungan untuk setiap nilai X:

Dan berikut disajikan tabel perhitungan statistik uji W:


Tabel 2.6 Perhitungan statistik uji W Contoh 2

X Oi p(Xi) Ei

0 19 0,212 16,96 0,245


1 32 0,431 34,48 0,178
2 22 0,292 23,36 0,079
3 7 0,065 5,20 0,623
Jumlah 80 1 80 1,126
Tampak bahwa W = 1,126 tidak masuk dalam daerah penolakan H0, artinya H0 tidak
ditolak. Sehingga dapat disimpulkan pada tingkat kepercayaan 95% bahwa distribusi
peluang banyak kelahiran kelinci jantan mengikuti distribusi binomial.
II.1.3 Uji Chi-kuadrat untuk Uji Normalitas
Telah dijelaskan bahwa uji Chi-kuadrat dapat digunakan untuk menguji kecocokan
atau goodness of fit pada satu sampel. Di satu sisi, dalam statistik parametrik meng-
asumsikan data mengikuti distribusi normal. Untuk itu, pendekatan uji Chi-kuadrat
dapat digunakan untuk menguji suatu data berdistribusi normal atau tidak, yaitu

12
dengan membandingkan frekuensi data teramati yang telah dikategorisasi dalam
bentuk kelas-kelas dengan distribusi normal teoritis. Rumusan hipotesisnya adalah:
H0: Data berdistribusi normal
H1: Data tidak berdistribusi normal
Prosedur uji hipotesis ini didasarkan atas distribusi pendekatan, maka prosedur ini
sebaiknya tidak digunakan jika frekuensi harapan sangat kecil. Aturan yang biasa
dijanjikan oleh ahli statistika dalam prosedur Chi-kuadrat, prosedur ini hanya diguna-
kan jika tidak ada frekuensi yang lebih kecil dari 5. Jika dalam perhitungan terdapat
frekuensi harapan suatu kategori yang lebih kecil dari 5, maka frekuensi ini dapat
digabungkan dengan frekuensi kategori terdekat agar autran di atas terpenuhi.
Contoh 3:
Berikut adalah daya tahan hidup (dalam tahun) 40 buah bola lampu yang diproduksi
sebuah perusahaan dalam rangka pengendalian kualitas produknya.
Tabel 2.7 Distribusi frekuensi daya tahan 40 bola lampu
Kelas Daya Tahan (tahun) Frekuensi
1 1,45 – 1,95 2
2 1,95 – 2,45 1
3 2,45 – 2,95 4
4 2,95 – 3,45 15
5 3,45 – 3,95 10
6 3,95 – 4,45 5
7 4,45 – 4,95 3
Jumlah - 40
Selidiki apakah data daya tahan bola lampu yang disajikan dalam distribusi frekuensi
tersebut berdistribusi normal atau tidak pada tingkat kepercayaan 95%.
Jawab:
1. Hipotesis
H0: Data berdistribusi normal
H1: Data tidak berdistribusi normal
2. Tingkat signifikan
Karena tingkat kepercayaan 95%, maka tingkat signifikan  = 0,05
3. Nilai kritis

13
Nilai kritis didasarkan pada tebel Chi-kuadrat dengan derajat bebas k – 3 dan  =
0,05, yaitu , di mana k adalah banyak kelas yang digunakan dalam
per-hitungan.

4. Perhitungan statistik uji

, i = 1, 2, …, k

Terlebih dahulu harus dihitung nilai mean dan standar deviasinya:

= dan s =

= 3,4125 = 0,6969
Selanjutnya kita hitung nilai Zi dengan rumus:

(2.2)

Misalkan:
a. Batas-batas kelas kedua

b. Batas-batas kelas keempat

c. Batas-batas kelas keenam

14
Selanjutnya dengan menggunakan tabel distribusi normal standar, dapat diperoleh
luas bagian-bagian kurva sebagai berikut:
LX (1,45 < x < 1,95)  LX ( < x < 1,95)
= LZ ( < z < -2,10) = 0,0179
LX (1,95 < x < 2,45) = LZ (2,10 < z < -1,38) = 0,0659
LX (2,45 < x < 2,95) = LZ (1,38 < z < -0,66) = 0,1708
LX (2,95 < x < 3,45) = LZ (0,66 < z < 0,05) = 0,2653
LX (3,45 < x < 3,95) = LZ (0,05 < z < 0,77) = 0,2595
LX (3,95 < x < 4,45) = LZ (0,77 < z < 1,49) = 0,1525
LX (4,45 < x < 4,95)  LX (4,45 < x < )
= LZ (1,49 < z < ) = 0,0681
Dengan demikian, maka frekuensi harapan {Ei} untuk masing-masing kelas dapat
dihitung, yaitu:
Kelas pertama : 0,0179  40 = 0,7
Kelas kedua : 0,0659  40 = 2,6
Kelas ketiga : 0,1708  40 = 6,8
Kelas keempat : 0,2653  40 = 10,6
Kelas kelima : 0,2595  40 = 10,4
Kelas keenam : 0,1525  40 = 6,1
Kelas ketujuh : 0,0681  40 = 2,8
Maka dapat disusun tabel frekuensi dengan frekuensi observasi {Oi} dan fre-
kuensi harapan {Ei} sebagai berikut:
Tabel 2.8 Distribusi frekuensi dengan Oi dan Ei
Kelas Daya Tahan (tahun) Oi Ei
1 1,45 – 1,95 2 0,7*
2 1,95 – 2,45 1 2,6* Digabung
3 2,45 – 2,95 4 6,8
4 2,95 – 3,45 15 10,6
5 3,45 – 3,95 10 10,4
6 3,95 – 4,45 5 6,1 Digabung
7 4,45 – 4,95 3 2,8*
Jumlah - 40
*) kurang dari 5, sehingga harus digabung dengan kelas lainnya.

15
Tabel 2.9 Distribusi frekuensi dengan Oi dan Ei digabung
Kelas Daya Tahan (tahun) Oi Ei
1,45 – 1,95
1 1,95 – 2,45 7 10,1
2,45 – 2,95
2 2,95 – 3,45 15 10,6
3 3,45 – 3,95 10 10,4
3,95 – 4,45
4 4,45 – 4,95 8 8,9
Jumlah - 40
Tampak bahwa jumlah kelas yang digunakan dalam perhitungan (k) adalah 4
(empat). Dan dari Tabel 2.9, dapat dihitung statistik uji W:

W =
= 2,8843
5. Kesimpulan
Tampak bahwa W = 2,8843 < 3,8415, yang berarti statistik uji W tidak berada pada
daerah kritis (daerah penolakan H0) sehingga H0 diterima. Jadi dapat disimpulkan
bahwa data daya tahan 40 bola lampu yang dihasilkan pada sebuah perusahaan
tersebut di atas adalah berdistribusi normal dengan mean 3,4125 dan standar deviasi
0,6969.

II.1.4 Latihan
1. Staf riset marketing mengatakan bahwa distribusi penjualan tablet warna hitam,
putih, merah, dan biru adalah sama. Berikut datanya:
Warna Tablet hitam putih merah biru
Jumlah Penjualan 60 65 35 40
Selidikilah pada tingkat kepercayaan 95%, apakah pernyataan staf riset marketing
itu benar atau salah.
2. Pada suatu eksperimen, pelemparan sebuah dadu sebanyak 180 kali diperoleh
hasil sebagai berikut:

16
Mata Dadu 1 2 3 4 5 6
Frekuensi Kemunculan 45 16 34 25 42 18
Apakah dapat disimpulkan bahwa frekuensi kemunculan mata dadu ganjil (1, 3,
dan 5) adalah dua kali lipat dari mata dadu genap (2, 4, dan 6) (perbandingan
frekuensi kemunculan mata dadu 1, 2, 3, 4, 5, 6 adalah 2 : 1 : 2 : 1 : 2 : 1)?
Gunakan tingkat kepercayaan 98%.
3.

17

Anda mungkin juga menyukai