Anda di halaman 1dari 9

64 IX.

PENGUJIAN KHI-KUADRAT Jika kita ingin menguji apakah suatu populasi memiliki distribusi teoritik tertentu , atau kita ingin menguji kebebasan dua variabel, kita dapat menggunakan uji khi-kuadrat. IX.1. Uji Kecocokan (Goodness of Fit) Uji kecocokan adalah suatu uji untuk menentukan apakah suatu populasi atau variabel acak X mempunyai distribusi teoritik tertentu. Uji ini didasarkan pada seberapa baik kesesuaian /kecocokan antara frekuensi yang teramati dalam data sampel dengan frekuensi harapan yang didasarkan pada distribusi yang dihipotesiskan. Contoh : Misalkan pada pelemparan sebuah dadu, hipotesisnya adalah bahwa dadu seimbang atau distribusi dari hasil pelemparan dadu itu adalah seragam. Misalkan dadunya dilempar 120 kali dan setiap hasilnya dicatat. Secara teori, kalau dadunya seimbang maka setiap sisi akan muncul 20 kali. Dengan membandingkan frekuensi yang teramati dengan frekuensi yang diharapkan (frekuensi harapan), akan dapat disimpulkan apakah distribusi dari hasil pelemparan dadunya seragam atau tidak. Hasil pelemparannya ditampilkan dalam table berikut : 1 Teramati 20 Harapan 20 2 22 20 3 17 20 Sisi 4 18 20 5 19 20 6 24 20

Setiap kemungkinan hasil percobaan dinamakan sel, dalam kasus ini ada 6 sel. Statistik yang dapat digunakan sebagai landasan bagi pengambilan keputusan terkait uji kecocokan antara frekuensi yang teramati dengan frekuensi harapan adalah :

=
2 i =1

( oi ei )
ei

Dimana : 2 merupakan sebuah nilai dari suatu variable acak 2 yang mempunyai distribusi sampling mendekati distribusi chi-square dengan derajat bebas tertentu. Untuk kasus ini, derajat bebasnya adalah k-1 atau 5. oi adalah frekuensi yang teramati untuk sel ke-i, i = 1,2,..,k ei adalah frekuensi harapan untuk sel ke-i, i = 1,2,..,k

65 Bila frekuensi yang teramati sangat dekat nilainya dengan frekuensi harapannya maka nilai dari

2 akan kecil dan hal ini menunjukkan adanya kecocokan (membawa pada penerimaan Hipotesis
Nol). Sebaliknya, bila frekuensi yang teramati mempunyai perbedaan yang cukup besar dengan frekuensi harapannya, maka nilai dari 2 akan besar, dan hal ini menunjukkan adanya ketidakcocokan yang akan membawa pada penolakan Ho. Sehingga daerah kritis untuk uji ini adalah di ekor kanan dari distribusi chi-kuadrat. Misalkan tingkat signifikansi yang digunakan adalah , maka wilayah kritis untuk uji ini adalah 2 > 2 . Kriteria ini bisa digunakan asalkan tidak ada frekuensi harapan yang kurang dari 5. Bila ada, maka sel-sel yang berdekatan harus digabungkan. Secara Umum : Misalkan terdapat sebuah sampel acak berukuran n dimana didalamnya terdapat k kategori yaitu A1 , A2, A3, , Ak dan masing-masing kategori mempunyai o1,o2,ok pengamatan. Probabilitas masing-masing kategori dapat ditentukan sesuai dengan distribusi yang ada dalam hipotesis nol sehingga frekuensi harapan untuk masing-masing kategori dapat dihitung, yaitu : ei = npi ; pi=Pr(Ai) , i = 1, 2, , k dan A1 o1 e1 p1 + p2 + + pk = 1 A2 o2 e2 Ak ok ek

o1 + o2 + + ok = n Kategori Frekuensi pengamatan ( oi ) Frekuensi harapan

( ei )

Langkah-langkah dalam pengujian ini adalah : 1. Susun hipotesis : H 0 : Distribusi X ialah F ( x ) H1 : Distribusi X bukan F ( x ) 2. Pilih tingkat signifikasi 3. Tentukan frekuensi pengamatan oi 4. Hitung frekuensi harapan ei = npi ( frekuensi yang diharapkan jika H 0 benar ) 5. Gunakan statistik penguji :

=
2 i =1

( oi ei )
ei

o = e
i

=n

2 berdistribusi khi-kuadrat dengan derajat bebas ( d.b ) , dimana :

66 a. = k-1 jika frekuensi harapan dapat dihitung tanpa mengestimasi parameter populasi dari statistik sampel. Pengurangan dengan 1 dari k karena berdasarkan kondisi

o = e
i

= n,

yang artinya jika k-1 frekuensi harapan telah diketahui, maka frekuensi harapan yang tersisa dapat dihitung karena jumlah semua frekuensi harapan harus sama dengan n. b. = k m 1 , jika frekuensi harapan dapat dihitung hanya dengan mengestimasi m parameter populasi dari statistik sampel. k : banyak katagori ; m : banyak parameter yang diduga

2 6. Bandingkan nilai statistik penguji 2 dengan nilai kritik ;k m 1 2 2 Jika ;k m 1 maka H 0 ditolak.

7. Buat kesimpulan. Pendekatan pada distribusi khi-kuadrat ini baik jika frekuensi harapan setiap katagori/sel 5. Bila ada frekuensi harapan yang kurang dari 5, sebaiknya sel-sel yang berdekatan digabung. Contoh Seorang manager sedang meneliti banyaknya kedatangan pelanggan pada pasar swalayan yang dia pimpin. Pengamatan dilakukan berdasarkan periode waktu lima menit.Dalam periode ini dihitung banyaknya pelanggan yang datang.Dari suatu sampel 500 periode lima menitan ini terdapat 22 ,74, 115 , 95 , 94 , 80 dan 20 periode dimana masing-masing terdapat 0 , 1 , 2 , 3 , 4 , 5 dan lebih dari 5 pelanggan yang datang. Berdasarkan data diatas, apakah dapat disimpulkan bahwa banyaknya pelanggan yang datang per periode 5 menitan berdistribusi Poisson dengan = 3 ? Gunakan = 0, 05 Jawab X : banyak pelanggan yang datang per periode Banyak pelanggan ( X ) Banyak periode ( oi ) 1. Hipotesis : 0 22 1 74 2 115 3 95 4 94 5 80 >5 20

H 0 : X berdistribusi Poisson dengan = 3

67 H1 : Tidak demikian 2. Tingkat signifikansi = 0, 05 .

3. Menghitung nilai-nilai ei . Untuk menghitung frekuensi harapan ei , terlebih dahulu kita harus menghitung pi . p1 = P ( X = 0 ) = 0, 0498 p2 = 0,1493 p3 = 0,2241 e3 = 112, 05 ; ; p4 = 0,2240 e4 = 112 e1 = np1 = ( 500 ) ( 0, 0498 ) = 24,9 e2 = 74, 65 ; ; p5 = 0,1681 e5 = 84, 05 ; ; p6 = 0,1008 e6 = 50, 4 ; ; p7 = 0,0839 e7 = 41,95

4. Statistik penguji :

=
2 i =1

( oi ei )
ei

( 22 24,9 ) =
24,9

( 20 41,95) + +
41,95

= 33,049

d.b = 7-1= 6

2 ; = 0, 05 . Nilai kritik : 0,05;6 = 12,592 .

Karena 2 = 33, 049 > 12,592 maka H 0 ditolak pada = 0, 05 . 5. Kesimpulan : Banyaknya pelanggan yang datang per periode waktu lima menit tidak mengikuti distribusi Poisson dengan = 3 .

IX.2. Uji Independensi dan Uji Beberapa Proporsi Misalkan terdapat n pengamatan yang diklasifikasikan menurut dua variabel. Variabel pertama mempunyai b katagori , yaitu : A1 , A2 , , Ab dan variabel kedua mempunyai k katagori , yaitu : B1 , B2 , , Bk . Frekuensi pengamatan : oij ; i = 1,2, ,b , j = 1, 2, , k

Data disusun dalam tabel yang disebut tabel kontingensi b k Variabel 2 Variabel 1 A1 A2 B1 o11 o21 B2 o12 o22 Bk o1k o2k Jumlah n1. n 2.

Ab Jumlah ni g = oij dan


j =1 k

ob1 n.1
b

ob 2 n.2 obk n.k

nb . n

68

ngj = oij : disebut frekuensi marginal yang menyatakan total baris dan total
i =1

kolom pada table kontingensi di atas.

A. Uji Independensi 1. Hipotesis yang akan diuji : H 0 : variabel 1 dan variabel 2 saling bebas H1 : tidak demikian 2. Tentukan tingkat signifikansi 3. Tentukan oij dan eij Untuk menghitung frekuensi harapan eij , perhatikan tabel kontingensi 2 2 dibawah ini.

Kolom Baris A1 A2 Jumlah

B1 o11 o21 ng 1

B2 o12 o22 ng2

Jumlah n1g n2 g N

Jika H 0 benar,maka faktor baris dan kolom saling bebas. p11 = P ( A1 I B1 ) = P ( A1 ) P ( B1 ) = n1g ng 1 n n n2g ng2 n n ;

p22 = P ( A2 I B2 ) = P ( A2 ) P ( B2 ) = Frekuensi harapan : e11 = np11 = n

n1g ng ( n1g) ( ng ) 1 ; 1= n n n n2 g ng2 ( n2 g) ( ng2 ) = n n n

e22 = np22 = n

69 Rumus umum untuk menghitung frekuensi harapan : eij =

( ni g) ( ngj )
n

; i = 1, 2, , b

j = 1, 2, , k

4. Statistik penguji :

=
2 i =1 j =1

(o

ij

eij ) eij

: berdistribusi khi-kuadrat dengan d.b = ( b 1) ( k 1)

5. Wilayah kritik :
2 H 0 ditolak jika 2 ;( b 1) ( k 1)

6. Kesimpulan

Koreksi Kontinuitas Yate Statistik yang digunakan untuk dasar keputusan kita mendekati distribusi khi-kuadrat. Perhitungan

2 tergantung pada frekuensi sel. Pendekatan pada distribusi khi-kuadrat cukup baik jika derajat
bebasnya lebih besar dari satu. Untuk tabel kontingensi 2 x 2 yang mempunyai d.b = 1 , digunakan koreksi kontinuitas Yate dengan rumus :

2 kor = i =1 j =1

(o

ij

eij 0,5 eij

Contoh : Sebuah perusahaan asuransi yang menjual polis untuk berobat dirumah sakit ingin mengetahui apakah ada hubungan antara besarnya jaminan dari asuransi dan lamanya pasien (pemegang polis) dirawat dirumah sakit. Catatan dari 311 pasien pemegang polis yang diambil secara acak dari sebuah rumah sakit menunjukkan hasil sebagai berikut :

70 Lamanya dirawat (hari) Besar jaminan Asuransi < 25 % 25 % - 50 % 50 % - 75 % > 75 % 26 21 25 11 30 30 25 32 6 11 45 17 5 7 9 11 5 6 - 10 11 - 15 > 15

Apakah lamanya pasien dirawat dirumah sakit tidak bergantung pada besarnya jaminan asuransi ? Ujilah dengan menggunakan = 0, 01 Jawab Hipotesis : H 0 : Besarnya jaminan asuransi dan lamanya pasien dirawat di rumah sakit saling bebas. H1 : Tidak demikian Frekuensi harapan : e11 =

( 67 ) ( 83)
311

= 17,88 ; e12 =

( 67 ) ( 117 )
311

( = 25, 21 ; ; e44 =

71) ( 32 ) = 7,31 311

Statistik penguji :

=
2 i =1 j =1

(o

ij

eij ) eij

( 26 17,88)
17,88

( 11 7,31) + +
7,31

= 42,3307

2 = 0, 01 ; d.b = ( 4 1) ( 4 1) =9 ; nilai kritik : 0,01;9 = 21, 67

Karena 2 = 42,3307 > 21, 67 maka H 0 ditolak. Kesimpulan : Lamanya pasien (pemegang polis) dirawat dirumah sakit bergantung pada besarnya jaminan

B. Uji Beberapa Proporsi Pengujian khi-kuadrat yang digunakan untuk uji independensi juga dapat digunakan untuk menguji apakah k populasi binom memiliki parameter yang sama.

71 Hipotesisnya adalah : Ho : p1=p2==pk H1 : Tidak demikian Ho ekuivalen dengan pernyataan : Terjadinya keberhasilan atau kegagalan tidak tergantung pada populasi yang diambil sampelnya. Untuk melakukan uji ini, dilakukan pengambilan sampel acak yang saling bebas, masing-masing berukuran n1,n2,,nk dari k populasi dan susun dalam table kontingensi 2xk . 1 x1 n1-x1 Sampel 2 x2 n2-x2 k xk nk-xk

Sukses Gagal Statistik uji yang digunakan adalah

=
2 i =1

( oi ei )
ei

, i = 1,2,k

dengan derajat bebas : (2-1)(k-1) = (k-1) Contoh : Dalam suatu penelitian dikumpulkan data untuk menentukan apakah proporsi produk yang cacat oleh petugas yang bekerja pagi,sore dan malam hari sama atau tidak. Data yang diperoleh sbb :

Cacat Tidak Cacat

Pagi 45 905

Waktu Kerja Siang Malam 55 70 890 870

Tentukan apakah proporsi produk yang cacat sama untuk ketiga waktu kerja, dengan menggunakan tingkat signifikansi 0.025.

72 Jawab : Misalkan p1, p2 dan p3 adalah proporsi sebenarnya dari produk yang cacat yang diproduksi pada pagi, sore dan malam hari. 1. Ho : p1= p2 = p3 H1 : tidak demikian 2. = 0.025 3. Perhitungan : o1 = 45, o2 = 55 dan o3 = 70 e1 = 4. 2 = 6.288 5. Keputusan : Ho diterima dan dapat disimpulkan bahwa proporsi produk yang cacat kirakira sama untuk semua waktu kerja. (950)(170) (945)(170) = 57 , e2 = = 56.7 2835 2835

Anda mungkin juga menyukai