Anda di halaman 1dari 16

CHI SQUARE

Oleh: Dwi Kurnia PS, S.Keb.Bd.M.Kes.


Institut Ilmu Kesehatan Nahdlatul Ulama Tuban

Di beberapa literature uji ini diberi nama Pearson’s X2 test karena pertama kali ditulis
oleh Karl Pearson (1857-1936) yang menemukan distribusi untuk n yang mendekati distribusi X 2
dengan derajat bebas (db) r-1.
Prinsipnya :
1. Dipergunakan untuk analisis data berskala nominal/ kualitatif/ kategori termasuk data
dikhotom.
2. Perhitungan akhir menunjukkan angka yang sebenarnya, bukan dalam bentuk persen atau
proporsi.
3. Untuk setiap kategori, perbedaan diperoleh dari selisih nilai Observasi (O) dengan nilai
Expected (E) atau harapan yang dihitung berdasarkan Ho.
Rumus yang digunakan X2 = ∑ (O-E)2/ E
4. Makin besar ukuran sampel makin besar (O-E)2/E. selanjutnya X2 mempunyai
kecenderungan lebih besar hasilnya dengan menjadi lebih besarnya ukuran sampel.
5. Jumlah kategori mempengaruhi besarnya derajat bebas yang akan mempengaruhi bentuk
distribusi X2. Makin besar derajat bebas makin besar titik kritisnya.
6. Bila mempunyai dua sampel atau lebih dan akan dibandingkan, uji yang sesuai adalah r x
c contingency X2 test, yang datanya disusun menjadi r-row dan c-colom dengan derajat
bebas (r-1) (c-1).
7. Nilai harapan (E) diperoleh dari perkalian antara jumlah total setiap sampel dengan
proporsi yang sesuai dengan jumlah total. Untuk lebih mudahnya lihat table kontingensi
dibawah ini.
Table kontingensi 2 X 2

Sampel Kategori A Kategori B Total


Sampel I a (O11) b (O12) a+b (n10)
Sampel II c (O21 d (O22) c+d (n20)
Total a+b (n01) b+d (n02) N = a+b+c+d
Nilai harapan (E)a= (a+b)(a+c)/N
Nilai harapan (E)b= (a+b)(b+d)/N
Nilai harapan (E)c= (c+d)(a+c)/N
Nilai harapan (E)d= (c+d)(b+d)/N
8. Bila distribusi sampel hendak dibandingkan dengan distribusi populasi dipakai test for
goodness of fit. Nilai harapan diperoleh dari proporsi di populasi dengan derajat bebas r-
1. Hipotesis statistic yang digunakan pada Pearson’s X2 test for goodness of fit adalah:
Ho: p1 = p10…..pk = pk0. Kriteria penolakan Ho, X2 ≥ Xα2 dengan Xα2 adalah titik atas α dari
distribusi X2 dengan db = r-1
9. Statistic distribusi sampel X2 akan sesuai dengan distribusi teoritis X2 untuk nilai harapan
disetiap kategori pada masing-masing sampel (setiap sel) tidak boleh < 1, dan tidak boleh
lebih dari 20% jumlah kategori yang ada (jumlah sel) yang ada mempunyai nilai harapan
< 5. Kedua syarat ini harus terpenuhi untuk memakai model tersebut.
Bila terjadi bahwa ada sel yang lebih dari 20% dan jumlah sel mempunyai nilai harapan <
5, apabila masih diinginkan menggunakan uji X2, maka beberapa sel atau kategori data
dapat digabung menjadi satu sampai syarat tersebut terpenuhi. Jika sampai
penyederhanaan sel/kategori minimal menjadi table 2 X 2 tetap belum terpenuhi syarat
tersebut, maka harus digunakan uji yang lain yaitu uji Exact Binomial Probability atau
yang kita kenal sebagai Uji Eksak dari Fisher (Exact Fisher’s test).
10. Untuk X2 dengan kategori table 2X2 dengan derajat bebas (2-1)(2-1)=1 digunakan suatu
korelasi yang dikenal dengan Yate’s Correction for Continuty = 0,5 yang bertujuan untuk
mengkompensasi suatu fakta bahwa distribusi kontinyu X2 dipergunakan untuk distribusi
yang diskrit (data kualitatif), sehingga rumusnya menjadi:
X2= ∑ (O-E)2/ E
Apabila X2 = Z2 maka nilai p2 (proporsi daripada populasi yang binomial) yang
berhubungan dengan X2 adalah sama dengan nilai P untuk normal deviate. Hipotesis
statistic yang digunakan adalah Ho: pij = pi0poj untuk semua sel (ij). Kriteria penolakan
Ho, X2 ≥ Xα2 dengan Xα2 adalah titik atas α dari distribusi X2 dengan db=(r-1)(c-1)

Banyak penelitian yang didesain untuk mengetahui jumlah subyek, obyek atau jawaban
yang jatuh pada berbagai kategori. Misalkan anak-anak dapat dikategorikan menurut frekuensi
jenis permainan yang sering di mainkan, hipotesis penelitiannya adalah jenis permainan ini akan
berbeda frekuensinya dengan cara tertentu. Orang dapat dikategorikan menurut apakah mereka
“lebih suka”, “netral”, atau “menolak” suatu opini sehingga sipeneliti dapat menguji hipotesis
bahwa response ini akan berbeda dalam frekuensinya.

Uji chi-square cocok untuk menganalisis data seperti di atas. Jumlah kategori dapat dua
atau lebih. Teknik yang digunakan adalah goodness of-fit dan dapat digunakan untuk menguji
apakah terdapat perbedaan signifikansi antara jumlah obyek atau response yang diobservasi yang
jatuh pada setiap kategori dan jumlah obyek yang diharapkan (expected) berdasarkan pada
hipotesis nol. Jadi uji goodness of fit menilai tingkat kesesuaian (correspondence) antara
observed dan expected observation dalam setiap kategori.

Contoh kasus 1 (test untuk goodness of fit)

Para penggemar balap kuda sering menyatakan bahwa dalam balapan kuda pada track berbentuk
lingkaran, kuda pada posisi start tertentu akan mendapatkan keuntungan secara signifikan. Posisi
kuda pada saat start terdiri dari posisi 1 adalah posisi paling dekat rail pada inside track,
sedangkan posisi 8 adalah lingkaran paling luar dan terjauh dari rail untuk pacuan kuda yang
diikuti 8 ekor kuda. Kita ingin menguji pengaruh posisi start dengan menganalisis hasil pacuan
kuda sesuai dengan posisi start mereka selama sebulan musim pacuan kuda pada track berbentuk
lingkaran. Hasil pengamatan dapat dilihat pada table berikut:

Hasil Pengamatan Pacuan Kuda, Jumlah Menang dan

Posisi Start Kuda

Posisi 1 2 3 4 5 6 7 8 Total
Start
Jumlah 29 19 18 25 17 10 15 11 144
Menang
Expected 18 18 18 18 18 18 18 18

Langkah Analisis:
1. Hipotesis Nol. H0: tidak ada perbedaan dalam jumlah pemenang yang diharapkan dengan
nomor sesuai dengan nomor start, dan jika ada perbedaan observasi semata-mata karena
variasi acak yang diharapkan dari sampel random yang diambil dari distribusi uniform.
H1: frekuensi teoritis semua tidak sama.
2. Uji Statistik. Oleh karena itu membandingkan data dari satu sampel dengan populasi yang
telah diasumsikan terlebih dahulu, maka uji chi-square goodness of fit adalah yang cocok
untuk analisis ini. Chi-square dipilih karena hipotesis yang diuji membandingkan frekuensi
yang diobservasi dengan frekuensi yang diharapkan dalam kategori diskrit. Dalam kasus ini
kedelapan nomor start merupakan kategori.
3. Tingkat Signifikansi. Tingkat signifikansi α=0.01 dan N=144 jumlah pemenang dalam 18
hari pacuan kuda.
4. Sampling Distribution. Sampling distribution X2 dihitung mengikuti distribusi chi-square
dengan df= k-1 = 8-1= 7
5. Daerah Penolakan. H0 akan ditolak jika nilai observasi X2 sedemikian rupa sehingga
probabilitas yang berkaitan dengan nilai hitung pada H0 untuk df=7 adalah < 0.01s
6. Keputusan. Pada table diatas memberikan data bahwa 29 pemenang untuk kuda dengan start
no.1, sedangkan dengan H0 hanya 18 pemenang yang diharapkan. Hanya ada 11 pemenang
untuk kuda dengan nomor start 8, sedangkan dengan H0 yang diharapkan menang adalah 18.
Maka X2 dapat dihitung sebagai berikut:
8
(Oi∨Ei) ²
X2=∑
i=1 Ei
(29∨18) ² (19−18) ² (18−18) ² (25−18)² (17−18)²
= + + + +
18 18 18 18 18

(10∨18) ² (15−18) ² (11−18) ²


+ + =16.3
18 18 18

Tabel chi-square menunjukkan bahwa P[X2 ≥ 16.3] dengan df=7 memiliki probabilitas antara p =
0.05 dan p = 0.02 jadi 0.05 > p < 0.02. oleh karena probabilitasnya lebih besar dari α = 0.01 ,
maka kita tidak dapat menolak H0. Naumn demikian, jika tingkat signifikansi α = 0.05, maka H0
dapat ditolak.
Uji Chi-Square dengan SPSS

1. Masukkan data

2. Dari menu SPSS, pilih menu Analyze kemudian pilih submenu Non-parametric, lalu pilih Legacy
Dialogs dan kemudian pilih Chisquare.
3. Tampak dilayar tampilan windows Chi-square Test

4. Isikan pada kotak Test Variable List: variabel pemenang dan pilih Get from data pada Expected
Range pilih all categoriesequal pada Expected Values.

5. Pada kotak Expected Range ada dua pilihan alternative. Pilihan Get from data merupakan default
yaitu masing-masing harga yang berbeda didefinisikan sebagai kategori. Jika pilihan adalah Use
specific range , maka diminta memasukkan nilai integer batas bawah dan batas atas. Nilai-nilai yang
terletak dalamkedua batas yang ditentukan tersebut yang akan dianalisis. Misalkan kita menentukan 1
sebagai batas bawah dan 5 sebagai batas atas, maka hanya ada 5 kategori yang akan dianalisis
sedangkan kategori 6,7 dan 8 diabaikan (tidak dianalisis).
6. Pada kotak Expected Value ada dua pilihan alternative. Pilihan All categories equal merupakan
default yaitu setiap kategori mempunyai nilai harapan yang sama(yaitu hasil bagi antara jumlah
seluruh nilai dengan banyaknya kategori). Pada pilihan alternative value, masing-masing kategori
memiliki proporsi harapan yang tidak sama sesuai dengan value yang kita masukkan. Misalkan
masukkan nilai-nilai yang lebih besar dari 0 untuk masing-masing kategori dari variabel yang diuji.
Harga pertama dalam kotak isian berkorespondensi dengan grup terkecil dari variabel uji, dan
harapan terakhir berkorespondensi dengan harga tertinggi.
7. Abaikan yang lain, lalu tekan OK
8. Tampilan Outpu SPSS

Pemenang

Observed N Expected N Residual

1.00 29 18.0 11.0


2.00 19 18.0 1.0
3.00 18 18.0 .0
4.00 25 18.0 7.0
5.00 17 18.0 -1.0
6.00 10 18.0 -8.0
7.00 15 18.0 -3.0
8.00 11 18.0 -7.0
Total 144

Test Statistics

Pemenang

Chi-Square 16.333a
df 7
Asymp. Sig. .022

a. 0 cells (0.0%) have


expected frequencies less
than 5. The minimum
expected cell frequency is
18.0.

Tampilan SPSS menunjukkan nilai observasi maupun nilai ekspektasi dari jumlah pemenang
dengan no start 1 sampai 8. Nilai statistic Chi-square sebesar 16,333 dengan degree of freedom
(df) = 7 dan menunjukkan probabilitas 0.22 dan nilai ini lebih besar dari α = 0.001, sehingga
dapat disimpulkan kita tidak dapat menolak H0 atau tidak ada perbedaan dalam jumlah
pemenang yang diharapkan dengan nomor sesuai dengan nomor start, dan jika ada perbedaan
observasi semata-mata karena variasi acak yang diharapkan dari sampel random yang diambil
dari distribusi uniform.

Contoh soal 2 (table 2 X 2 )


Secara random didapatkan 155 responden mengenai partisipasi mengikuti posyandu didapatkan data
sebagai berikut:

Tabel Partisipasi Mengikuti Posyandu

Wilayah Partisipasi mengikuti Poyandu


Tidak mengikuti Mengikuti Total
Kota 16 64 80
Desa 3 72 75
Total 19 136 155
Pertanyaannya: apakah ada perbedaan distribusi mengenai partisipasi mengikuti pemilu antara responden
dari kota dan dari desa? Digunakan α=0.05. db = (2-1)(2-1)=1.

Caranya: hitunglah masing-masing nilai harapan pada tiap-tiap sel, dan hasilnya didapat sebagai berikut.

Hipotesis statistic yang digunakan

H0: tidak ada perbedaan (ada kesesuaian) distribusi partisipasi mengikuti posyandu antara penduduk dari
kota dan dari desa.

H1: ada perbedaan ( tidak ada kesesuaian) distribusi partisipasi mengikuti posyandu antarapenduduk dari
kota dan dari desa.
Nilai harapan partisipasi mengikuti posyandu

Wilayah Partisipasi mengikuti Poyandu


Tidak mengikuti Mengikuti Total
Kota 16 64 80
(9.8) (70.2)
Desa 3 72 75
(9.2) (65.8)
Total 19 136 155
Gunakan rumus X2 = ∑(O-E-0.5)2/E

{(16-9.8-0.5)2/9.8} + {(64-70.2-0.5)2/70.2} + {3-9.2-0.5)2/9.2} + {(72-65.8-0.5)2/65.8} = 7.786

Titik kritis pada table X20.05(1) = 3.841

X2 hitung =7.786 > table X20.05(1) = 3.841. artinya H0 ditolak berarti ada perbedaan distribusi
partisipasimengikuti posyandu antara penduduk dari kota dan dari desa.
ANALISIS MENGGUNAKAN SPSS
1. Masukkan data

2. Langkah selanjutnya dari menu SPSS pilih menu Analyze, pilih Descriptive, lalu pili Crosstabs

3. Setelah kotak dialog Crosstabs, masukkan variabel wilayah ke kotak Row(s), masukkan variabel
partisipasi mengikuti posyandu ke kotak Column(s)
4. Langkah berikutnya klik Statistik, muncul kotak dialog dengan nama Crosstabs: Statistics. Beri tanda
centang pada bagian Chi-square.

5. Langkah berikutnya klik cells kemudian beri tanda centang pada bagian Expected dan terakhir Ok
6. Tampilan output SPSS

wilayah * partisipasi_mengikuti_posyandu Crosstabulation


Count

partisipasi_mengikuti_posyandu

mengikuti tidak mengikuti Total

wilayah desa 72 3 75

kota 64 16 80
Total 136 19 155

wilayah * partisipasi_mengikuti_posyandu Crosstabulation


partisipasi_mengikuti_posyandu

mengikuti tidak mengikuti Total

wilayah desa Count 72 3 75

Expected Count 65.8 9.2 75.0

kota Count 64 16 80

Expected Count 70.2 9.8 80.0


Total Count 136 19 155

Expected Count 136.0 19.0 155.0

Chi-Square Tests
Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1-
Value Df sided) sided) sided)

Pearson Chi-Square 9.214 a


1 .002
Continuity Correction b
7.786 1 .005
Likelihood Ratio 10.075 1 .002
Fisher's Exact Test .003 .002
N of Valid Cases 155

a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 9.19.
b. Computed only for a 2x2 table

Hasilnya menunjukkan X2 hitung= 7.786 sig= 0.005 < α = 0.05 artinya H0 ditolak berarti ada
perbedaan distribusi partisipasi mengikuti posyandu antara penduduk dari kota dan dari desa.

Contoh soal 3 (table 3 X 2 )

Secara random didapatkan 500 responden mengenai opini sehat dari kesehatan
lingkungan tempat tinggal responden. Didapatkan data setelah dibuat tabulasi silang sebagai
berikut:

Data Opini Partai

wilayah Opini Tentang Sehat


Sehat Tidak Sehat Tidak Tahu Total
Kota 138 83 64 285
Desa 64 67 84 215
Total 202 150 148 500

Pertanyaannya: apakah ada perbedaan distribusi mengenai opini sehat antara responden dari kota dan dari
desa? Digunakan α=0.05. db=(3-1)(2-1)=2
Hipotesis statistic yang digunakan:
Ho: tidak ada perbedaan (ada kesesuaian) distribusi opini sehat antara penduduk dari kota dan dari desa.
H1: ada perbedaan (tidak ada kesesuaian) distribusi opini sehat antara penduduk dari kota dan dari desa.
Caranya: hitunglah masing-masing nilai harapan pada tiap-tiap sel, dan hasilnya didapat sebagai berikut.
Nilai Harapan Opini Sehat

wilayah Opini Tentang Sehat


Sehat Tidak Sehat Tidak Tahu Total
Kota 138 83 64 285
(115.14) (85.5) (84.36)
Desa 64 67 84 215
(86.86) (64.5) (63.64)
Total 202 150 148 500
Gunakan rumus: X2 = ∑(O-E)2/E
{(138-115.14)2/115.14} + {(83-85.5)2/85.5} + {(64-84.36)2/84.36} + {(64-86.86)2/86.86} + {(67-
64.5)2/64.5} + {(84-63.64)2/63.64} = 22.153
Titik kritis pada table X20.05(2)=5.99
X2 hitung = 22.153 > table X20.05(2)=5.99 artinya H0 ditolak berarti ada perbedaan distribusi opini sehat
antara penduduk dari kota dan dari desa.
ANALISIS MENGGUNAKAN SPSS
1. Masukkan data

2. Langkah selanjutnya dari menu SPSS pilih menu Analyze, pilih Descriptive, lalu pili Crosstabs
3. Setelah kotak dialog Crosstabs, masukkan variabel wilayah ke kotak Row(s), masukkan variabel
opini tentang sehat ke kotak Column(s)

4. Langkah berikutnya klik Statistik, muncul kotak dialog dengan nama Crosstabs: Statistics. Beri tanda
centang pada bagian Chi-square.
5. Langkah berikutnya klik cells kemudian beri tanda centang pada bagian Expected dan terakhir Ok

6. Tampilan output SPSS

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

wilayah *
500 100.0% 0 0.0% 500 100.0%
opini_tentang_sehat
wilayah * opini_tentang_sehat Crosstabulation

opini_tentang_sehat

sehat tidak sehat tidak tahu Total

wilayah desa Count 64 67 84 215

Expected Count 86.9 64.5 63.6 215.0

kota Count 138 83 64 285

Expected Count 115.1 85.5 84.4 285.0


Total Count 202 150 148 500

Expected Count 202.0 150.0 148.0 500.0

Chi-Square Tests

Asymp. Sig. (2-


Value df sided)

Pearson Chi-Square 22.152a 2 .000


Likelihood Ratio 22.339 2 .000
N of Valid Cases 500

a. 0 cells (0.0%) have expected count less than 5. The minimum


expected count is 63.64.
Hasilnya menunjukkan X2 hitung = 22.152, sig = 0.000 < α=0.05 artinya H0 ditolak, berarti ada
perbedaan (tidak ada kesesuaian) distribusi opini sehat antara penduduk dari kota dan dari desa.

Anda mungkin juga menyukai