Anda di halaman 1dari 20

Bab 2

Landasan Teori
2.1. Pengertian Uji Chi-Square
Uji chi-square dibuat oleh Karl Pearson (1899) yang sering disebut juga
dengan pearson chi-square yang bisa digunakan untuk uji kecocokan
(goodness of fit test), uji kebebasan (test for independence), pengujian
homogenitas serta pengujian varians dan standar deviasi populasi tunggal.
Uji chi-square adalah pengujian hipotesis mengenai perbandingan antara
frekuensi observasi atau aktual dengan frekuensi harapan atau ekspektasi.
Frekuensi observasi (O) adalah nilai yang didapat dari hasil percobaan.
Sedangkan frekuensi harapan (E) adalah nilai yang dapat dihitung secara
teoritis. Rumus umum uji chi-square adalah:
X
2
=
O
i
-E
i

E
Beberapa hal yang perlu diketahui berkenaan dengan distribusi chi-square
adalah:
a. Distribusi chi-square memiliki satu parameter yaitu derajat bebas (db).
b. Nilai-nilai chi-square dimulai dari nol disebelah kiri sampai nilai-nilai
positif tak terhingga disebelah kanan.
c. Probabilitas nilai chi-square dimulai dari sisi sebelah kanan.
d. Luas daerah dibawah kurva normal adalah 1. Nilai dari chi-square bisa
dicari jika kita memiliki informasi luas daerah disebelah kanan kurva
serta derajat bebas. Derajat bebas adalah k-1 dimana k adalah jumlah
kategori. Misalnya jika luas daerah disebelah kanan adalah 0,1 dan
derajat bebas sebanyak 7, maka nilai chi-square adalah 12,017.
2.1.1. Faktor-Faktor Penting dalam Uji Chi-Square
Untuk menggunakan hipotesis chi-square kita harus mempunyai sampel
ukuran yang cukup besar untuk menjamin kesamaan antara teori
distribusi yang benar dan distribusi samplingchi-square (X
2
) akan ditaksir
terlalu tinggi dan akan mengakibatkan terlalu banyak penolakan H0.
Untuk menghindari terjadinya kesimpulan yang tidak benar dari uji
hipotesis chi-square (X
2
), ikutilah peraturan yang umum bahwa frekuensi
yang diharapkan lebih kecil dari 5, yang terdapat di dalam salah satu
bagian tabel kemungkinan terlalu kecil untuk digunakan. Pada saat tabel
mengandung lebih banyak bagian dengan frekuensi yang diharapkan
kurang dari 5, maka kita dapat mengkombinasikan ini semua untuk
memperoleh frekuensi yang diharapkan yaitu 5 atau lebih.Tetapi dengan
demikian kita mengurangi besarnya kategori data dan akan mencapai
atau memperoleh lebih sedikit informasi dari data tabel kemungkinan.
Dalam pengujian chi-square untuk memutuskan apakah menerima atau
menolak H0, yaitu hipotesis antara dua variabel yang saling bebas. Dua
variabel tersebut adalah:
a. Letaknya terhadap metode-metode penggantian.
b. Daerah geografis.
Uji chi-square dapat juga digunakan untuk memutuskan apakah
keterangan-keterangan distribusi peluang seperti binomial, poisson dan
normal adalah distribusi yang tepat. Uji chi-square memungkinkan kita
untuk bertanya sejauh mana kita dapat melakukan asumsi yang
mendasari keterangan-keterangan distribusi sebelum kita menyimpulkan
apakah distribusi itu tidak terlalu panjang untuk dipakai dan apakah ada
signifikansi yang berbeda antara pengamatan distribusi frekuensi dan
teori distribusi.
Dengan cara ini kita dapat kebaikan yang tepat. Dari distribusi ini dapat
menentukan apakah kita harus percaya bahwa pengamatan merupakan
sampel penutup dari hipotesa mengenai teori distribusi.
Berikut ini adalah beberapa hal penting yang perlu kita pertimbangkan
dalam prosedur pembuatan chi-square:
1. Uji chi-square dirancang untuk digunakan dengan data frekuensi,
sedangkan uji kolmogorv smirnov dirancang untuk digunakan dalam
data kontinyu.
2. Uji kolmogorov smirnov boleh digunakan baik dalam uji-uji satu sisi
maupun dua sisi. Uji chi-square tidak membedakan arah
ketidaksesuaian yang terjadi antara data teramati dan data harapan.
3. Uji chi-square mempersyaratkan agar data dikelompokkan data dalam
kategori, sementara uji kolmogorov smirnov tidak demikian. Dengan
demikian uji kolmogorov smirnov lebih efisien dalam menggunakan data
yang dikelompokkan.
4. Uji chi-square tepat bila digunakan dengan data nominal serta bila
distribusi yang dihipotesiskan ini adalah data diskrit.
5. Uji chi-square dilengkapi dengan data suatu prosedur koreksi yang jelas
apabila parameter-parameter yang dikehendaki masih harus diduga
dari data sampel.
2.2. Uji Kecocokan (Goodness of Fit Test)
Goodness of fit test adalah suatu test yang digunakan untuk
membandingkan distribusi frekuensi pengamatan dan pencocokan nilai
yang diharapkan atau teori-teori distribusi. Tekniknya adalah dengan
menggunakan tipe goodness of fit test, yakni bahwa test tersebut digunakan
untuk menguji apakah terdapat perbedaan yang cukup signifikan antar
banyaknya sampel yang diamati dari objek yang masuk dalam masing-
masing kategori dengan banyaknya yang diharapkan berdasarkan H0.
Untuk dapat membandingkan sekelompok frekuensi yang diamati
dengan kelompok frekuensi yang diharapkan, tentunya kita harus dapat
menyatakan frekuensi manakah yang kita harapkan itu. Hipotesis nol (H0)
menyatakan proporsi objek yang jatuh dalam masing-masing kategori di
dalam populasi yang ditetapkan. Ini berarti, dari hipotesis nolnya kita
dapat membuat deduksi apakah frekuensi yang diamati cukup mendekati
frekuensi yang diharapkan atau mempunyai kemungkinan besar untuk
terjadi di bawah H0.
Dalam goodness of fit test ada hal-hal yang harus diperhatikan adalah
antara lain:
a. Adanya frekuensi observasi atau frekuensi yang benar-benar terjadi
dalam eksperimen dan dilambangkan dengan O.
b. Adanya frekuensi yang diharapkan terjadi yang dilambangkan dengan
E, dimana E=np.
c. Derajat bebas adalah k-1.
d. Nilai chi-square.
e. Jumlah sampel yang digunakan harus mencukupi nilai harapan paling
sedikit 5 (e>5).
Untuk masing-masing kategori, terdapat suatu peluang bahwa suatu hasil
pengamatan yang dipilih secara acak dari populasi yang dihipotesiskan
akan masuk ke dalam kategori tersebut. Apabila hipotesis nolnya benar,
maka kita dapat memperoleh frekuensi harapan (expected frequency) untuk
masing-masing kategori. Untuk hipotesis nol, sampel ditarik dari sebuah
populasi yang mengikuti suatu distribusi yang telah ditetapkan.
Sedangkan untuk hipotesis tandingan, sampel bukan berasal dari
populasi dengan distribusi yang telah ditetapkan.
2.3.Uji Kolmogorov SmirnovGoodness of Fit Test
Uji kolmogorov smirnov adalah suatu uji nonparametrik untuk perbedaan
antar distribusi-distribusi kumulatif, sebuah sampel uji menyangkut
persesuaian antar distribusi kumulatif yang teliti dari nilai-nilai sampel
dan fungsi distribusi kontinyu yang spesifik, jadi hal tersebut merupakan
suatu goodness of fit test.
Uji dua sampel menyangkut persesuaian antara dua distribusi yang
diteliti yang menguji suatu hipotesis apakah dua sampel bebas berasal
dari distribusi kontinue identik, dan peka terhadap perbedaan populasi
dengan melihat pada lokasi, dispersi atau skewness.
Uji sebuah sampel kolmogorov smirnov secara umum lebih efisien
dibandingkan dengan uji chi-square untuk goodness of fit test dari sampel
dalam jumlah kecil, dan dapat digunakan untuk sampel yang sangat kecil,
dimana di dalam uji chi-square tidak dapat diterapkan. Namun harus
diingat bahwa uji chi-square dapat digunakan dalam hubungannya dengan
distribusi diskrit, mengingat uji kolmogorov smirnov tidak dapat digunakan.
Uji satu sampel didasarkan pada perbedaan absolut maksimum antara
nilai-nilai dari distribusi kumulatif sampel acak yang berukuran n dan
distribusi secara teoritis yang lebih spesifik.
Dalam pengujian satu sampel memperlihatkan perjanjian antar
pengamatan distribusi kumulatif dari nilai sampel dan menetapkan
distribusi kontinyu. Dengan demikian pengujian ini sangat baik.
Sedangkan pada pengujian dua sampel memperlihatkan perjanjian antara
dua pengamatan distribusi kumulatif, hipotesis dua sampel ini
menyatakan apakah kedua sampel saling bebas dari distribusi kontinyu
yang sama.
Uji dua sampel kolmogorov smirnov didasarkan pada perbedaan absolut
maksimum antara nilai-nilai dari dua distribusi kumulatif yang teliti
secara prinsip. Uji dua sampel sangat mirip dengan uji satu sampel, nilai-
nilai kritis yang diperlukan dapat diperoleh dari tabel-tabel khusus.
Uji sampel tunggal kolmogorov smirnov dapat kita ringkaskan dengan
langkah-langkah sebagai berikut:
1. Tetapkan fungsi kumulatif teoritis berdasarkan distribusi sampling
teoritis.
2. Tetapkan H0 yang akan diuji.
3. Susunlah skor observasi berdasarkan ranking.
4. Hitung proporsi masing-masing frekuensi untuk setiap interval.
5. Hitung proporsi kumulatif frekuensi observasi dan observasi teoritis.
6. Dengan rumus mencari deviasi maksimum maka dapat ditentukan
besarnya deviasi mengamati selisih maksimum dari suatu frekuensi
kumulatif yang telah dihitung.
7. Apabila sampel lebih besar dari 35, maka kriteria yang dipergunakan
adalah sesuai rumus yang diberikan pada bagian bawah tabel.
8. Bandingkan besarnya angka yang diperoleh pada deviasi maksimum
dengan angka dalam tabel.
9. Kriteria pengambilan keputusan adalah apabila harga deviasi
maksimum lebih kecil dari angka yang didapat dalam tabel maka H0
diterima.
Tes satu sampel kolmogorov smirnov adalah suatu goodness of fit test artinya
yang diperlihatkan adalah tingkat kesesuaian antara distribusi
serangkaian harga sampel (skor yang observasi) dengan suatu distribusi
teoritis tertentu. Tes ini menetapkan apakah skor-skor dalam sampel
dapat secara masuk akal dianggap berasal dari suatu populasi dengan
teoritis itu.
Singkatnya tes ini mencakup perhitungan distribusi frekuensi kumulatif
yang akan terjadi di bawah distribusi teoritisnya, serta membandingkan
distribusi frekuensi itu dengan distribusi frekuensi kumulatif hasil
observasi. Distribusi teoritis tersebut merupakan representatif dari apa
yang diharapkan di bawah H0. Tes ini menetapkan suatu titik dimana
kedua distribusi itu diyakini sebagai distribusi yang teoritis dan yang
terobservasi memiliki perbedaan terbesar.
Dengan melihat distribusi sampling-nya dapat kita ketahui apakah
perbedaan yang besar itu mungkin terjadi hanya karena kebetulan saja
artinya distribusi sampling itu menunjukkan apakah perbedaan besar
yang teramati itu mungkin terjadi apabila observasi itu benar-benar suatu
sampel dari distribusi teoritis itu.Misalkan f0(x) = suatu fungsi distribusi
frekuensikumulatif yang sepenuhnya ditentukan yakni distribusi
kumulatif teoritis di bawah H0. Artinya harga n yang sembarangan
besarnya, harga f0(x) adalah sembarangan proporsi kasus yang
diharapkan mempunyai skor yang sama atau kurang dari pada x.
Misalkan SN(x) = distribusi frekuensi kumulatif yang terobservasi dari
suatu sampel random dengan N buah observasi. Dimana x adalah
sembarangan skor yang mungkin, SN(x) = k/N, dimana k adalah
banyaknya observasi yang sama atau kurang dari x.
Dibawah hipotesis nol bahwa sampel itu telah ditarik dari distribusi
teoritis tertentu, maka diharapkan bahwa untuk setiap harga x, SN(x)
harus jelas mendekati f0(x) artinya di bawah nol kita akan mengharapkan
selisih antara SN(x) dan f0(x) adalah kecil dan ada dalam batas-batas
kesalahan random. Test kolmogorov smirnov memusatkan perhatian pada
penyimpangan terbesar. Harga f0(x) - SN(x) terbesar dinamakan deviasi
maksimum.
Dmaks = f0(x) - SN(x)
Distribusi sampling D di bawah H0 diketahui tabel E pada lampiran
memberikan harga-harga kritis tertentu distribusi sampling itu
perhatikanlah bahwa signifikan suatu harga D tertentu adalah bergantung
pada N.
Dalam perhitungan test kolmogorov smirnov dilakukan langkah-langkah
sebagai berikut:
1. Tetapkan fungsi kumulatif teoritis, yakni distribusi kumulatif yang
diharapkan di bawah H0.
2. Aturlah skor-skor yang diobservasi dalam suatu distribusi kumulatif
dengan memasangkan interval SN(x) dengan interval f0(x) yang
sebanding.
3. Untuk tiap-tiap jenjang pada distribusi kumulatif, kurangilah f0(x)
dengan SN(x).
4. Dengan memakai rumus yang ada, carilah nilai D (deviasi maksimum).
5. Lihatlah tabel E untuk menentukan harga kemungkinan dua sisi yang
dikaitkan dengan munculnya harga-harga sebesar harga observasi di
bawah H0. Jika P sama atau kurang dari , maka H0 ditolak.
Tes dua sampel kolmogorov smirnov adalah suatu tes apakah dua sampel
independen telah dicari dari populasi yang sama (dari populasi yang
memiliki distribusi yang sama). Tes dua sisi peka terhadap segala jenis
perbedaan dalam distribusi yang menjadi asal usul kedua sampel itu
perbedaan-perbedaan dalam lokasi (harga tengah) kemencengan
(skewness), pemencaran dan lain-lain.Seperti tes satu sampel kolmogorov
smirnov tes dua sampel ini memperhatikan kesesuaian antara dua sampel
distribusi kumulatif tes satu sampel dan meperhatikan kesesuaian antara
distribusi suatu himpunan harga sampel dengan suatu distribusi teoritis
tertentu, tes dua sampel ini memperhatikan kesesuaian antara dua
himpunan harga-harga sampel.
Jika kedua sampel itu pada kenyataannya memang telah ditarik dari
distribusi yang sama, maka distribusi kumulatif kedua sampel tadi dapat
diharapkan cukup pendekatan satu dengan yang lainnya karena
keduanya menunjukkan deviasi random saja dari pada distribusi populasi
itu. Jika kedua distribusi populasi kumulatif kedua sampel itu jauh
berbeda pada suatu titik manapun, ini menunjukkan bahwa sampel-
sampel berasal dari populasi yang berbeda. Dengan demikian suatu
deviasi yang cukup besar antara distribusi kumulatif kedua sampel
tersebut adalah fakta untuk menolak H0.
Uji dan sampel kolmogorov smirnov merupakan uji yang serba guna, karena
kepekaannya terhadap semua jenis perbedaan yang mungkin ada dalam
dua distribusi. Uji kolmogorov smirnov dapat kita ringkas dalam langkah-
langkah sebagai berikut:
1. Asumsi-Asumsi:
a. Data untuk analisis terdiri dari uji dua sampel acak bebas berukuran
m dan n.
b. Data yang paling tidak diukur menggunakan skala ordinat.
2. Hipotesis-Hipotesis
Pada dasarnya sama dengan hipotesis pada uji sampel kolmogorov
smirnov.
3. Uji Statistik
Uji statistik kolmogorov smirnov dapat dilihat pada persamaan berikut:
D = f0 - fe
dimana : f0 = frekuensi kumulati relatif observasi
fe = frekuensi kumulati relatif ekspektasi
4. Pengambilan Keputusan.
2.4.Uji Chi-SquareGoodness of Fit Test
Uji chi-squaregoodness of fit test adalah suatu uji untuk menentukan apakah
suatu populasi memiliki distribusi teoritik tertentu. Uji ini didasarkan
pada seberapa baik kesesuaian antara frekuensi yang teramati dalam data,
contoh dengan frekuensi harapan yang didasarkan pada distribusi yang
dihipotesiskan chi-square goodness of fit test antara frekuensi yang teramati
dengan frekuensi harapan didasarkan pada besaran:
X
2
=
O
i
-E
i

E
dimana: X
2
= suatu nilai bagi peubah acak x
2
yang distribusi penarikan
sampelnya sangat mendekati chi-square.
Oi= menyatakan frekuensi observasi (teramati).
Ei= menyatakan frekuensi harapan bagi sel ke satu (ekspektasi)
Bila frekuensi yang teramati sangat dekat dengan frekuensi harapannya,
nilai X
2
akan kecil, hal ini menunjukkan adanya kesesuaian yang baik. Bila
frekuensi yang teramati berbeda cukup besar tidak habis dari frekuensi
harapannya, nilai X
2
akan besar, sehingga kesesuaiannya akan buruk.
Kesesuaian yang buruk akan membawa penolakan H0, dengan demikian
wilayah kritisnya akan jatuh. Nilai kritis X
2
diperoleh dari tabel maka
wilayah kritisnya adalah X
2
> X
2
.
Kriteria keputusan ini tidak digunakan bila ada frekuensi harapan yang
kurang dari 5. Pernyataan ini mengakibatkan berkurangnya derajat
kebebasan. Besarnya derajat kebebasan yang berkaitan dengan distribusi
chi-square yang digunakan di sini tergantung pada dua faktor, yaitu:
- Banyaknya sel dalam percobaan yang bersangkutan.
- Banyaknya besaran yang diperoleh dari data pengamatan yang
diperlukan dalam perhitungan frekuensi harapan.
Rumus yang digunakan dalam uji chi-square goodness of fit test:
a. Uji Chi-Square 1 Sampel Diskrit
Tabel 5.2.1. Chi-Square 1 Sampel Diskrit
k Xi Oi = fi
x!
x
.

e
i
P

= Ei = n.Pi
E
2
Ei) (Oi
2
X

=
b. Uji Chi-Square 1 Sampel Kontinyu
Tabel 5.2.2.Chi-Square 1 Sampel Kontinyu
k
Interval
Oi Pi Ei = n.Pi
E
2
Ei) (Oi
2
X

=
LCB UCB
Dimana:
k = Jumlah kelas
P = Parameter dari distribusi yang diuji
Oi= Frekuensi observasi dari data ke-I
Pi= Probabilitas
Ei= Frekuensi ekspektasi atau frekuensi harapan
X
2
= Chi-square
c. Uji Chi-Square 2 SampelDiskrit atau Kontinyu
Tabel 5.2.3.Chi-Square 2 Sampel Diskrit atau Kontinyu
Kelas Ke-1 Kelas Ke-2 ... Kelas Ke-c Baris
N1
O11 E11 O12 E12
...
O1c E1c
A1
(O11 E11)
2
/E11 (O12 E12)
2
/E12 (O1c E1c)
2
/E1c
N2
O21 E21 O22 E22
...
O2c E2c
A2
(O21 E21)
2
/E21 (O22 E22)
2
/E22 (O2c E2c)
2
/E2c
... ... ... ... ...
nr
Or1 Er1 Or2 Er2
...
Orc Erc
Ar
(Or1 Er1)
2
/Er1 (Or2 Er2)
2
/Er2 (Orc Erc)
2
/Erc
Kolom B1 B2 ... Bc N
Untuk dapat membandingkan sekelompok frekuensi yang diamati
dengan kelompok yang diharapkan, tentunya kita harus dapat
menyatakan frekuensi manakah yang diharapkan itu. Hipotesis nol
menyatakan proporsi objek yang jatuh ke dalam masing-masing kategori
di dalam populasi yang ditetapkan. Ini berarti dari hipotesis nolnya kita
dapat membuat deduksi berapakah frekuensi yang diharapkan. Teknik X
2
menguji apakah frekuensi yang diamati mendekati frekuensi yang
diharapkan sehingga mempunyai kemungkinan besar untuk terjadi di
bawah H0.
Pada distribusi sampling statistik chi-square dapat diketahui dengan
menggunakan kurva. Dalam hal ini kita menggunakan distribusi t, untuk
menggambarkan distribusi chi-square yang mempunyai derajat kebebasan
yang berbeda. Jika harga derajat kebebasannya kecil maka kurva akan
semakin simetris mendekati kurva normal.
Dengan itu kita mencari selisih antara yang diamati dengan yang
diharapkan, mengkuadratkan selisih-selisih tersebut lalu membaginya
dengan jumlah yang diharapkan lalu menjumlahkan hasil bagi
tersebut.Sering terjadi penelitian yang dijalankan untuk mengetahui
banyaknya subjek, objek jawaban respon yang terdapat dalam berbagai
kategori misalnya sekelompok pasien diklasifikasikan menurut tipe
kecenderungan utama dalam hal jawaban Rorschach mereka, dan
penyelidik mungkin membuat ramalan bahwa tipe-tipe tertentu akan
lebih sering terdapat dibandingkan dengan tipe-tipe lainnya.
Ada beberapa persoalan yang dapat diselesaikan dengan cara mengambil
manfaat dari distribusi Chi-square, diantaranya seperti:
- Menaksir simpangan baku.
- Menguji homogenitas varians beberapa populasi.
- Menguji proporsi untuk data multinomial.
- Menguji independen antara dua faktor.
- Menguji kesesuaian antara data hasil pengamatan dengan model
distribusi, darimana data itu diduga kembali.
- Menguji model distribusi berdasarkan hasil pengamatan.
2.5. Menguji Proporsi Data Multinominal
Misalkan sebuah eksperimen menghasilkan peristiwa-peristiwa atau
kategori A1, A2, .., Ak yang saling terpisah masing-masing dengan
peluang P1 = P(A1), ..P2 = P(A2), ..PK = P(AK). Akan diuji pasangan
hipotesis H0 : Pi = P0, I = 1,2, , K, dengan Pi, sebuah harga yang
diketahui Hi : Pi = Pi0. Di sini tentu saja Pi = pi0 = 1.
Pengujian yang ditempuh akan menggunakan data sebuah sampel acak
berukuran n yang di dalamnya ada O1 dari kategori satu (A1), O2 dari
kategori dua (A2), , Ok dari kategori k (Ak).
Dengan harga Pi0 yang diberikan, kita dapat menghitung masing-masing
frekuensi yang diharapkan E1 = n.P10,E2 = n.P20, Ek = n.PK0, jelas
bahwa O1+ O2+.+ Ok = E1+ E1+.+ Ek = n. Harga-harga O1, O2, ., Ok
merupakan nilai-nilai yang tampak sebagai hasil pengamatan, sedangkan
E1, E2, . Ek merupakan nilai-nilai yang diharapkan terjadi atau nilai-nilai
teoritis.
Agar mudah diingat, adanya kategori Ai, hasil pengamatan Oi dan hasil
yang diharapkan Ei, sebaiknya disusun dalam daftar sebagai berikut:
Tabel 5.2.4.TabelEidanOi
Kategori A1 A2 Ak
Pengamatan O1 O2 Ok
Diharapkan E1 E2 Ek
Untuk menguji hipotesis di atas, digunakan statistik:
_
=

=
k
1 i Ei
2
Ei) (Oi
2
atau _
=
=
k
1 i
n
Ei
2
Oi
2

Ternyata bahwa statistik di atas berdistribusi chi-square dengan db = (k-1).


Kriteria pengujian adalah tolak H0 jika X
2
> X
2
(1-)(k-1) dengan = taraf
nyata untuk pengujian. Dalam hal lainnya, maka H0 diterima.
Sebagai hal khusus dari data multinomial adalah data binomial yang
didapat apabila banyak kelas k = 2. Jika dalam hal ini kedua kategori
disebut kategori I dan kategori II dengan peluang terjadinya kategori I
dan II masing-masing (I - II), maka untuk sebuah sampel acak berukuran
n diantaranya didapat x buah kategori I.
Kita lihat bahwa distribusi chi-square yang digunakan hanya mempunyai
derajat kebebasan satu ini mengakibatkan terlalu sering terjadi penolakan.
H0 yang seharusnya diterima apabila rumus di atas digunakan. Selain
daripada itu rumus di atas adalah pengkontinuitasan data diskrit yang
dengan sendirinya harus diadakan penyesuaian seperlunya.Sebagai hal
khusus dari data multinomial ialah data binomial yang didapat apabila
banyak kategori k = 2. Jika dalam hal ini kedua kategori disebut kategori I
dan kategori II dengan peluang terjadinya kategori I dan kategori II
masing-masing dan (1-), maka untuk sebuah sampel acak berukuran n
diantaranya didapat x buah kategori I, didapat dibuat daftar sebagai
berikut:
Tabel5.2.5.PengamatanPeluangTerjadinyaKategori I danKategori II
Kategori I II Jumlah
Pengamatan x n-x N
Diharapkan n. n.(1-) N
Statistik yang digunakan untuk menguji hipotesis H0 : = 0 melawan H1 :
0adalah:
)
0
(1
0
n.
2
)
0
n. (n
2
X

=
dan tolak H0 jika X
2
X
2
(1-)(1) : sedangkan dalam hal lain H0 diterima.
Kita lihat bahwa distribusi chi-square yang digunakan hanya mempunyai
satu derajat kebebasan. Ini mengakibatkan terlalu sering terjadinya
penolakan H0 yang sebenarnya diterima apabila rumus di atas digunakan.
Khusus dalam hal ini, yakni dalam hal data binomial dimana digunakan
distribusi chi-square dengan dk = 1. Rumus di atas perlu diperbaiki dengan
menggunakan koreksi kontinuitas, yaitu harga mutlak 1x n.0. I harus
dikurangi dengan setengah. Jadi rumus yang dipakai adalah:
)
0
(1
0
n.
2
1/2) - .1
0
n. (1x
2
X

=
2.6.Menguji Kesamaan Poisson
Misalkan ada k(k>2) buah distribusi poisson dengan parameter 1, 2, k.
Akan diuji pasangan hipotesis H0 : 1 = 2 = . = k. H1 : paling sedikit 1
randa sama dengan tidak berlaku ).
Dari setiap populasi diambil sebuah sampel acak, berukuran n1 dari
populasi ke-1, n2 dari populasi ke-2 dan seterusnya berukuran nk dari
populasi ke-k. Untuk tiap sampel dihitung banyak peristiwa yang
mengikuti distribusi poisson. Jika banyak peristiwa ini dinyatakan dengan
x1 + x2 +..+ xn, maka rata-rata x adalah:
k
n
x ...
2
x
1
x
x
+ + +
=
Statistik yang digunakan untuk menguji hipotesis Ho adalah:
_

=
x
) x
i
(x
2
X
dan tolak H0 jika X
2
X
2
(1-)(k-1). Dalam hal lain H0 diterima.
2.7.Banyak Independen Antar Dua Faktor
Banyak data hasil pengamatan yang dapat digolongkan ke dalam
beberapa faktor, karakteristik atau atribut dengan tiap faktor atau atribut
terdiri dari beberapa klasifikasi, kategori, golongan atau mungkin
tingkatan. Berdasarkan hasil pengamatan terhadap fenomena demikian
akan diselidiki mengenai hubungan, asosiasi dan kaitan antar faktor. Jika
ternyata tidak terdapat kaitan antara faktor-faktor, biasa dikatakan bahwa
faktor-faktor itu bersifat independen atau bebas, tepatnya bebas statistik.
Dengan kata lain akan dipelajari apakah terdapat atau tidak suatu kaitan
diantara faktor-faktor itu.
Dalam bagian ini hanya akan dipelajari fenomena yang terdiri dari paling
banyak dua faktor, selain daripada itu di sini akan dibahas juga ada
tidaknya pengaruh mengenai beberapa taraf atau tingkatan suatu faktor
terhadap kejadian fenomena.
2.7.1. Asosiasi antara Dua Faktor dalam Daftar Kontingensi B X K
Secara umum, untuk menguji independen antara dua faktor dapat
dijelaskan sebagai berikut:
- Misalkan sebuah sampel acak berukuran n telah diambil, dimana tiap
pengamatan tunggal diduga terjadi karena adanya dua macam faktor,
ialah faktor I dan faktor II. Faktor I terbagi atas B taraf atau tingkatan
dan faktor II terbagi atas K taraf. Banyak pengamatan yang terjadi
karena taraf ke-i faktor ke-I (I = 1,2,.., B) dan taraf ke-j faktor ke-II (j =
1,2,..,K) akan menyatakan dengan Oij. Hasilnya dapat dicatat dalam
sebuah daftar kontingensi B x K.
Tabel 5.2.6.Kontingensi B X K Untuk Hasil Pengamatan Terdiri Atas dua faktor
FAKTOR II (K TARAF) Jumlah
1 2 K
F
A
K
T
O
R

I

(
B
T
A
R
A
F
)
1 O11 O12 O1k n10
2 O21 O22 O2k N20

B nB1 nB2 OBK nB0
Jumlah nO1 nO2 nOK n
2.8. Uji Kebebasan
Uji kebebasan yang dibicarakan pada modul ini adalah uji kebebasan chi-
square, yaitu yang dapat pula dipakai untuk menguji hipotesis bahwa dua
sampel saling bebas. Misalkan ingin diteliti apakah pendapat penduduk
pemilih di Negara bagian Illionis mengenai perubahan pajak baru tidak
ada hubungannya dengan tingkat penghasilannya.
Perlu diingat bahwa yang mendasari keputusan mempunyai distribusi
yang hanya merupakan lampiran distribusi chi-square. Nilai X
2
hitung
tergantung pada frekuensi sel. Distribusi chi-square yang kontinyu terlihat
menghampiri distribusi terok diskrit X
2
amat dekat, asal banyakderajat
kebebasan lebih besar dari 1. Dalam tabel kemungkinan 2 x 2, yang hanya
mengandung derajat kebebasan satu, digunakan suatu koreksi yang
disebut koreksi kontinyuitas Yates. Rumus yang telah dikoreksi menjadi:
X (dikoreksi) =
(I
0
-e
i
.I-0,5)
e
i
Bila frekuensi sel harapan besar, hasil yang dikoreksi dan tidak dikoreksi
hamper sama. Bila frekuensi harapan antara 5 dan 10, koreksi Yates
sebaiknya dipakai. Untuk frekuensi harapan kurang dari 5. sebaiknya uji
tepat FisherIrwin yang dipakai.
Pembahasan mengenai uji ini dapat diperoleh dalam Basic Concepts of
Probability and Statistics oleh Hodges dan Lehnmann. Uji FisherIrwin
sesungguhnya dapat dihindari dengan memilih ukuran terok yang lebih
besar.
2.9. Uji Kehomogenan dan Uji Beberapa Proporsi
Sebagai pengganti pengujian kebebasan, di uji hipotesis bahwa proporsi
populasi di tiap baris adalah sama. Yakni diuji hipotesis bahwa untuk
menguji kehomogenan dapat pula dipakai untuk menguji hipotesis bahwa
k parameter binomial mempunyai nilai yang sama. Dengan demikian ini
merupakan perluasan uji dari pengujian yang membahas untuk
menentukan selisih dua proporsi menjadi selisih k proporsi. Jadi ingin
diuji k hipotesis nol.
H0: P1 = P2 = . = Pk
Lawan dari hipotesis tandingan H1, bahwa proporsi populasi tidak
semuanya sama. Yang sama dalam pengujian banyaknya peluang sukses
atau peluang yang gagal tergantung pada banyaknya terok yang diambil.
2.10. Uji Distribusi Normal Atau Uji Kenormalan
Dari uraian-uraian terdahulu, misalnya dalam uraian tentang berbagai
distribusi sampling, teori menaksir, pengujian hipotesis, telah kita lihat
betapa pentingnya untuk mengetahuimodel populasi yang dipelejari,
terutama model normal. Asumsi bahwa populasi berdistribusi normal,
asumsi normalitas, telah melancarkan teori dan metode sebegitu rupa
sehingga banyak persoalan yang dapat diselesaikan dengan lebih mudah
dan cepat. Karenanya, cukup mudah dimengerti kiranya bahwa asumsi
normalitas perlu dicek keberlakuannya agar langakah selanjutnya dapat
dipertanggung jawabkan. Jika ternyata asumsi yang diambil tidak benar
atau terlalu menyimpang, tidak hanya mengenai normalitas tetapi juga
pengamatan bersifat independen (sampel acak), tidak terdapat kesalahan
ketika mencatat hasil pengamatan, homogenitas tentang varians dan
sebagainya, bukan saja langkah-langkah penelitian tidak dapat
dipertanggungjawabkan tetapi juga ternyata salah. Mengenai kesalahan
yang mungkin terjadi terhadap hasil pengamatan, tidak ada uji statistik
yang tersedia, kecuali penelitian atau pengamatan harus dilakukan secara
teliti dan jujur. Soal keacakan mengenai sampel dapat diuji secara khusus
dan ini akan dibicarakan kemudian.
Pengertian ini timbul daari kenyataan bahwa tidak selalu asumsi-asumsi,
semua atau sebagian, dapat dipenuhi dengan tepat. Dalam beberapa hal,
penyimpangan wajar dari syarat-syarat yang telah ditentukan sering tidak
mengakibatkan bahaya yang hebat. Misalnya, sedikit terjadinya
penyimpangan dari normalitas dan atau dari sifat homogenitas varians,
biasanya hanya memberikan akibat buruk yang kecil terhadap hasil
pengujian dan kesimpulannya. Distribusi t atau distribusi student telah
diketahui tidak sensitif terhadap penyimpangan wajar dari normalitas
sehingga penggunaanya tidak dibatasi keras oleh asumsi normalitas. Sifat
demikian, ialah tidak sensitif terhadap penyimpangan wajar dari syarat-
syarat yang digariskan, dinamakan ajeg. Jika hal ini terjadi sehubungan
dengan pengujian hipotesis, maka diperoleh uji ajeg.
Sekarang marilah kita tinjau mengenai uji normalitas. Persamaan
distribusi normal dengan ratarata dan simpangan baku odapat dilihat
dalam modul 2. Jika sebuah sampel acak berukuran n telah diambil
dengan rata-rata = x dan simpangan baku = s, maka kurva normal yang
cocok atau sesuai dengan data tersebut ( untuk keperluan ini data harus
disusun dalam daftar distribusi frekuensi yang terdiri atas k buah kelas
interval) ialah:
2
s
x x
2
1
e
2 s
n |
|

\
|

t
= Y
Untuk keperluan pengujian, kita harus menghitung frekuensi teoritik Ei
dan mengetahui frekuensi nyata atau hasil pengamatan Oi. Frekuensi
nyata Oi jelas didapat dari sampel, masing-masing menyatakan frekuensi
dalam tiap kelas interval. Harga Ei, frekuensi teoritik, didapat dari hasil
kali antara n dengan peluang atau luas dibawah kurva normal untuk
interval yang bersangkutan.
Ei = n . p
Selanjutnya statistik X
2
dihitung dengan rumus:
, )
_
=

=
k
1 i i
2
i i 2
E
E O

Dan untuk menentukan kriteria pengujian digunakan distribusi chi-


squaredengan db=(k-3) dan taraf o.