Anda di halaman 1dari 14

ANALISIS DATA KATEGORIK

GENAP 2022.2023 Noor Ell Goldameir S.Si., M.Si

PERTEMUAN 4
CHI SQUARE UNTUK UJI INDEPENDENSI
Tabel kontigensi dua arah secara umum disajikan dalam tabel berikut
Tabel 4.1. Kontigensi Bxk Faktor A Dan Faktor B
CHI SQUARE UNTUK UJI INDEPENDENSI
Berkaitan dengan tabel tersebut, kita ingin menguji apakah Faktor I dan Faktor II
saling independen yang dapat dihipotesiskan sebagai berikut :
𝐻0 : Faktor I dan Faktor II independen
𝐻1 : Faktor I dan Faktor II tidak independen
Penjelasan hipotesis statistik dan statistik uji akan disampaikan pada pembahasan
berikutnya
Dalam tabel kontigensai dua arah, Chi-Kuadrat dapat digunakan untuk menguji
independensi dua variabel marginal
CHI SQUARE UNTUK UJI INDEPENDENSI
Uji Chi-Kuadrat sering dinamakan goodness-of-fit test tetapi sebenarnya yang diuji
adalah badness-of-fit test, karena besarnya nilai Chi-Kuadrat mengindikasikan
ketidak sesuaian antar frekuensi observasi (nij) dan frekuensi harapan (𝑒𝑖𝑗 )
Terdapat dua statistik Chi-Kuadrat yaitu Pearson Chi-Kuadrat (𝜒 2 ) dan likelihood
ratio Chi-Kuadrat (𝐺 2 )
STATISTIK CHI SQUARE PEARSON
Statistik Pearson Chi-Kuadrat adalah
2
𝑛𝑖𝑗 −𝜇𝑖𝑗
𝜒 2 = σ𝑏𝐼=1 σ𝑘𝑗=1
𝜇𝑖𝑗

𝑛𝑖𝑗 adalah frekuensi observasi sel pada baris ke 𝑖 dan kolom ke 𝑗


𝜇𝑖𝑗 merupakan parameter dari rata rata frekuensi sel pada baris ke 𝑖 dan kolom ke
𝑗
Statistik 𝜒 2 digunakan untuk menguji 𝐻0 (variabel baris dan kolom saling
independen), Statistik ini disampaikan pada tahun 1900 oleh Karl Pearson
Statistik ini mempunyai nilai minimum nol ketika 𝑛𝑖𝑗 = 𝜇𝑖𝑗
STATISTIK CHI SQUARE PEARSON
Pada sampel terbatas, besarnya nilai selisih (𝑛𝑖𝑗 − 𝜇𝑖𝑗 ) menghasilkan nilai 𝜒 2 yang
besar mengindikasikan bahwa sampel tidak sesuai dengan 𝐻0
Pada sampe mendekati distribusi Chi-Kuadrat dengan derajad bebas (𝑏 − 1)(𝑘 1)
Pendekatan ini akan baik jika 𝜇𝑖𝑗 semakin besar dan 𝜇𝑖𝑗 ≥ 5
Distribusi Chi-Kuadrat mempunyai mean sama dengan derajat bebasnya (df=
degrees of freedom) dan variansinya sama dengan 2 kali df
Semakin besar df maka semakin mendekati distribusi normal. Sebagaimana dalam
gambar berikut merupakan grafik distribusi Chi-Kuadrat pada df= 1, 5, 10, dan 20
STATISTIK CHI SQUARE PEARSON

Gambar 4.1 Distribusi Chi-Kuadrat


STATISTIK CHI SQUARE PEARSON
Grafik di atas dapat diperoleh menggunakan perintah
>fx<-function (x)dchisq(x,df=5)
>curve(fx,0,40,type = "l",ylab="Probability Density")
STATISTIK CHI SQUARE PEARSON
>fx1<-function (x) dohisd (x, dif=1)
>curve (fx1, type = "l", add=TRUE)
STATISTIK CHI SQUARE PEARSON
>fx2<-function (x) dohisq (x, df=10)
>curve (fx2, type = "l", add=TRUE)
STATISTIK CHI SQUARE PEARSON
>fx3<-function (x)dchisq(x,df=20)
>curve(fx3,type = "l",add=TRUE)
STATISTIK RASIO LIKELIHOOD
Uji rasio likelihood menentukan nilai parameter yang memaksimumkan fungsi
likelihood dibawah asumsi 𝐻0 benar.
Statistik ujinya merupakan logaritma dari rasio fungsi likelihood
𝑏 𝑘 𝑛𝑖𝑗
𝐺2 = 2 σ𝐼=1 σ𝑗=1 𝑛𝑖𝑗 𝑙𝑜𝑔
𝜇𝑖𝑗

Statistik uji ini mempunyai nilai non negatif dan berdistribusi Chi-Kuadrat dengan
derajad bebas (𝑏 − 1)(𝑘 − 1)
𝐺 2 disebut statistik likelihood-ratio Chi-Kuadrat yang bernilai besar ketika 𝐻0 salah
STATISTIK RASIO LIKELIHOOD
𝐺 2 mempunyai nilai minimum nol ketika 𝑛𝑖𝑗 = 𝜇𝑖𝑗
Besarnya nilai 𝐺 2 menandakan besarnya kecenderungan menolak 𝐻0
Ketika 𝐻0 benar dan uji besar, statistik 𝜒 2 dan 𝐺 2 mempunyai distribusi yang sama
yaitu Chi-Kuadrat dan nilainyapun juga relatif sama
TUGAS
Suatu penelitian dilakukan untuk megetahui keterkaian antara kanker payudara
yang diderita oleh Wanita dengan penggunaan pil KB. Data hasil pengamatan
yang dilakukan secara lengkap disajikan pada table berikut

Dengan menggunakan 𝛼 = 5%. Tentukan apakah ada keterkaitan antara kanker


payudara dengan penggunaan pil KB?

Anda mungkin juga menyukai