10 Chi Square Modul
10 Chi Square Modul
Jika dalam suatu percobaan atau eksperimen hanya memiliki dua hasil keluaran, seperti
halnya pelemparan mata uang, kita mendapatkan sisi depan dan sisi belakang, maka
distribusi normal dapat digunakan untuk menentukan apakah frekuensi kedua hasil
tersebut cukup signifikan terhadap frekuensi yang diharapkan.
Namun demikian, jika lebih dari dua hasil yang muncul, katakanlah ada k- hasil, maka
distribusi normal tidak dapat digunakan untuk menguji perbedaan signifikan antara
frekuensi hasil pengamatan dengan frekuensi yang diharapkan. Untuk melakukan uji
hipothesis dengan menggunakan hasil percobaan yang memiliki lebih dari dua hasil, kita
menggunakan Uji Chi-Kuadrat (Chi-Square Testing, dilambangkan dengan 2 ).
Jika kita mempunyai frekuensi observasi sebanyak k, yaitu o1, o2, o3, …., ok dan frekuensi
harapan (expectation) yaitu e1, e2, e3 , …, ek, maka rumusan chi-kuadrat dituliskan:
k (o e ) 2
2 i i
i1 ei
Jika 2 = 0, maka ada kesesuaian sempurna antara hasil observasi dan nilai harapan. Jika
2 > 0, maka antara hasil observasi dan nilai harapan tidak terjadi kesesuaian sempurna.
Semakin besar nilai 2 , ketidaksesuaian antara hasil observasi dan nilai harapan juga
semakin besar.
A. PERHITUNGAN PRAKTIS
Pada penghitungan praktis, kita akan menggunakan hipothesis awal (H0) dan hipothesis
alternatif (Ha) untuk melakukan uji hipothesis. Untuk melakukan uji statistika, kita
membandingkan nilai 2 dari hasi perhitungan dan nilai 2 dari tabel (disebut nilai
kritis 2 ). Nilai 2 dari tabel diperoleh dengan menggunakan derajat kebebasan (degree
of freedom, dilambangkan dengan dof atau v) dan derajat signifikansi (significance level,
dilambangkan dengan A atau α). Secara grafis jika derajat bebas semakin besar maka
grafik distribusi chi-kuadrat akan mendekati bentuk distribusi normal.
Sebuah dadu dilempar 120 kali dan hasilnya disajikan pada tabel di bawah ( sisi angka 1
diperoleh 13 kali, sisi 2 diperoleh 28 kali, dan seterusnya). Jika dadu tersebut dipandang
ideal, maka:
(a) Tentukan nilai 2
(b) Apabila digunakan derajat signifikan 5% apakah hasil tersebut menunjukkan
bahwa dadu itu tidak ideal?
1
Probabilitas dan Statistika – Jurusan Teknik Elektro dan Teknologi Informasi UGM (TKU 115)
Pembahasan Contoh 1:
Hasil nilai chi-kuadrat yaitu pada penjumlahan di kolom terakhir sebesar 2 = 18,70
Dalam contoh tersebut maka derajat bebas yaitu 6 – 1 = 5 ( angka 6 berasal dari adanya 6
sisi dadu kemudian dikurangi 1) dan derajat signifikan 5%. Dari tabel distribusi chi-
kuadrat didapat nilai kritis 2 = 11,07.
Kesimpulan:
Dari hasil perhitungan, nilai 2 hasil hitungan lebih besar dari nilai kritis (18,70 > 11,07),
hipothesis atau anggapan bahwa dadu tersebut ideal kita tolak karena ada beda cukup
signifikan antara hasil observasi dengan nilai harapan.
2
Probabilitas dan Statistika – Jurusan Teknik Elektro dan Teknologi Informasi UGM (TKU 115)
Misalkan kita menyilangkan dua kedelai, yaitu kedelai kuning dan kedelai hijau, dan
berdasarkan teori Mendel maka akan ada empat tipe kedelai A, B, C dan D dengan
perbandingan 9:3:3:1. Dari percobaan didapat kedelai A sebanyak 102, kedelai B
sebanyak 30, kedelai C sebanyak 42 dan kedelai D sebanyak 15. Apakah hasil percobaan
tersebut sesuai dengan teori untuk derajat signifikan 5% ?
Pembahasan Contoh 2:
Karena jumlah total kedelai hasil percobaan ini ada 189, maka kita harus menentukan
nilai harapan yang disesuaikan dengan teori atau hipotesis perbandingan 9:3:3:1, yaitu
kedelai A seharusnya ada (9/16) dari 189, atau 106,3 dan demikian seterusnya untuk
kedelai B, C, dan D.
Dari hitungan tersebut maka nilai 2 = 3,09, dan kalau kita melihat tabel distribusi chi-
kuadrat untuk derajat bebas v =3 (v = 4 - 1) dan derajat signifikan = 5% , nilai kritis
2 = 7,82.
Kesimpulan:
Dari hasil perhitungan, 2 hasil observasi lebih kecil dari nilai kritis 2 , anggapan atau
hipothesis bahwa hasil percobaan sesuai dengan teori Mendel kita terima karena tidak ada
beda signifikan antara observasi dan harapan
Tabel kontingensi adalah suatu susunan himpunan angka atau obyek yang
diklasifikasikan berdasar dua kriteria, satu kriteria dinyatakan dalam baris dan kriteria
lain dalam kolom. Pada tabel kontingensi biasa dituliskan untuk baris yaitu j dan untuk
kolom yaitu k, sehingga tabel kontingensi bersangkutan dinyatakan sebagai tabel j x k.
Tujuan penggunaan tabel kontingensi adalah menentukan ada atau tidaknya hubungan
antara dua kriteria yang kita uji (uji independensi).
3
Probabilitas dan Statistika – Jurusan Teknik Elektro dan Teknologi Informasi UGM (TKU 115)
Penelitian penggunaan media sosial Facebook dan Twitter di JTETI UGM mengambil
sampel mahasiswa laki-laki dan perempuan, berturut-turut sejumlah 55 dan 34 orang.
Dari hasil penelitian, diperoleh data sebagai berikut:
Dari hasil penelitian tersebut, dapatkah kita katakan bahwa mahasiswa perempuan
cenderung lebih menyukai Twitter daripada Facebook? Gunakan derajat signifikan
sebesar 5%.
Pembahasan Contoh 3:
Apabila kita melihat secara sekilas antara jumlah sampel dan hasil penelitian, kita tentu
akan mengatakan bahwa “perempuan cenderung tidak menyukai Facebook” atau
“perempuan cenderung lebih menyukai Twitter daripada Facebook”. Hal ini tentu asumsi
yang tidak berdasar karena kita tidak melandasinya dengan bukti empiris.
Untuk menguji pernyataan di atas dan mengambil kesimpulan dengan benar, kita harus
mengetahui independensi antara kriteria “jenis kelamin” dan “preferensi penggunaan FB
dan Twitter”. Oleh karena itu, definisikan hipothesis awal dan alternatif sebagai berikut:
Disini kita harus menentukan dulu nilai frekuensi harapan untuk masing-masing elemen
yang dianalisa dan beranggapan bahwa jumlah sampel mahasiswa laki-laki dan
perempuan independen (tidak saling mempengaruhi satu sama lain).
4
Probabilitas dan Statistika – Jurusan Teknik Elektro dan Teknologi Informasi UGM (TKU 115)
Maka didapat X = 19,8 , sehingga frekuensi harapan konsumen Twitter laki-laki didapat
dengan 55 – 19,8 = 35,2 . Demikian seterusnya digunakan cara yang sama untuk
menghitung frekuensi harapan konsumen FB dan Twitter perempuan.
Secara umum maka untuk tabel kontingensi j x k maka derajat bebasnya yaitu v = (j-1) (k-
1). Untuk tabel kontingensi 2 x 2 maka derajat bebasnya yaitu 1, dan dari tabel chi- kuadrat
untuk = 5% dan v = 1 maka nilai kritis 2 = 3,84.
Kesimpulan:
Dari hasil perhitungan, 2 hasil observasi lebih kecil dari nilai kritis 2 , sehingga tidak
ada beda signifikan antara hasil percobaan dan harapan. Maka, anggapan bahwa
mahasiswa perempuan cenderung lebih menyukai Twitter daripada Facebook tidak
dapat kita terima karena jenis kelamin tidak ada hubungannya dengan preferensi
pemilihan media jejaring sosial (atau jenis kelamin independen terhadap preferensi
pemilihan media jejaring sosial).
Catatan:
Apabila nilai 2 dari tabel kontingensi memberikan hasil yang signifikan (bila
dibandingkan dengan nilai kritis 2 ), hal tersebut mengindikasikan bahwa dua kriteria
yang kita uji berhubungan (tidak independen). Namun demikian, hal tersebut tidak selalu
mengindikasikan adanya hubungan sebab akibat (causal relationship) antara dua kriteria
yang kita uji.
5
Probabilitas dan Statistika – Jurusan Teknik Elektro dan Teknologi Informasi UGM (TKU 115)
Untuk tabel kontingensi 2 x2 maka nilai o – e akan sama, tetapi untuk tabel j x k dimana
kriteria baris dan kolom tidak sama maka akan memberi hasil lain. Mengapa derajat
bebas untuk tabel 2 x 2 ditentukan nilai 1, maka kita lihat bentuk umum berikut:
Total
a b A
c d N-A
Total B N-B N
a+b=A (1)
c+d=N–A (2)
a+c=B (3)
b+d=N–B (4)
empat persaman tersebut satu sama lain tidak independen, persaman (4) diperoleh
dengan mengurangkan persamaan (3) dari hasil penjumlahan persamaan (1) dan (2)
sehinga hanya ada tiga hubungan independen. Karena derajat bebas adalah banyaknya
variat (data) dikurangi banyaknya hubungan independen yang ada, sehingga
v = 4 – 3 = 1. Namun demikian, secara umum untuk tabel kontingensi j x k maka derajat
bebasnya adalah v = (j-1) (k-1).
Pembahasan Contoh 4:
Ini merupakan tabel kontingensi 2 x 4, kita akan menguji hipotesis bahwa dua kriteria
klasifikasi tersebut independen. Sebelum memulai, kita mendefinisikan secara formal
hipothesis awal dan hipothesis alternatif, yakni:
H0 : jenis komputer tidak berhubungan dengan musim atau bulan penjualan
Ha : jenis komputer berhubungan dengan musim atau bulan penjualan
6
Probabilitas dan Statistika – Jurusan Teknik Elektro dan Teknologi Informasi UGM (TKU 115)
Karena tabel 2 x 4 maka derajat bebasnya yaitu v = 1.3 = 3, dan jika dicari dari tabel
distribusi chi-kuadrat untuk v= 3 dan = 5% kita memperoleh nilai kritis 2 = 7,82.
Dari hasil perhitungan, dapat disimpulkan bahwa hasilnya signifikan (7,97 > 7,82)
Kita dapat pula menguji ulang dengan menggabungkan kedua data tersebut, menjadi data
per semester dan disajikan berikut:
Dimana hasil hitungannya 2 = 5,18 dan ini jauh lebih besar dibandingkan dengan dari
tabel 2 = 3,84 sehingga hasil lebih signifikan.
Kesimpulan:
Dari hasil perhitungan, dapat kita lihat bahwa 2 hasil observasi lebih besar dari nilai
kritis 2 , sehingga ada beda signifikan antara hasil percobaan dan harapan. Kita bisa
menyimpulkan bahwa tipe komputer yang terjual cenderung berhubungan dengan bulan
penjualan komputer.
Referensi:
(1) Alder, H.L. & Roessler, E.B., “Chapter 13: Chi-Square Distribution”, Introduction to Probability and
Statistics, W.H. Freeman and Company, p.227-240
(2) Spiegel, M.R. & Stephens, L.,J., “Chapter 12: The Chi-Square Test”, Schaum’s Outlines of Theory
and Problems of Statistics 4th Edition, Mc.Graw Hill, p. 294-299