Anda di halaman 1dari 13

2 Landasan teori

2.1 Definisi goodness of fit test


Goodness of fit test adalah suatu tes yang digunakan untuk membandingkan distribusi frekuensi
pengamatan dan pencocokan nilai yang diharapkan atau teori-teori distribusi. Tekniknya adalah
dengan menggunakan tipe goodness of fit test, yakni bahwa tes tersebut dapat digunakan untuk
menguji apakah terdapat perbedaan yang cukup signifikan antar banyaknya sampel yang diamati
dari objek atau jawaban yang masuk dalam masing-masing kategori dengan banyaknya yang
diharapkan berdasarkan hipotesis nol (H0).
Untuk dapat membandingkan sekelompok frekuensi yang diamati dengan kelompok frekuensi
yang diharapkan, tentunya kita harus dapat menyatakan frekuensi manakah yang kita harapkan itu.
Hipotesis nol (H0) menyatakan proporsi objek yang jatuh dalam masing-masing kategori didalam
populasi yang ditetapkan. Ini berarti, dari hipotesis nolnya kita dapat membuat deduksi apakah
frekuensi yang diamati cukup mendekati frekuensi yang diharapkan atau mempunyai
kemungkinan besar untuk terjadi dibawah H0.
Untuk masing-masing kategori, terdapat suatu peluang bahwa suatu hasil pengamatan yang dipilih
secara acak dari populasi yang dihipotesiskan akan masuk kedalam kategori tersebut. Apabila
hipotesis nolnya benar, maka kita dapat memperoleh frekuensi harapan (expected frequency) untuk
masing-masing kategori. Untuk hipotesis nol, sampel ditarik dari sebuah populasi yang mengikuti
suatu distribusi yang telah ditetapkan. Sedangkan untuk hipotesis tandingan, sampel bukan berasal
dari populasi dengan distribusi yang telah ditetapkan.
Pada uji statistik kita mengharapkan bahwa sampel-sampel acak yang ditarik dari populasipopulasi mencerminkan karakteristik populasi yang bersangkutan. Dengan kata lain bila kita telah
menarik sebuah sampel dari suatu populasi yang telah ditetapkan, tentu kita mengharapkan adanya
suatu kecocokan yang erat antar frekuensi-frekuensi teramati dengan frekuensi-frekuensi harapan
untuk setiap kategori yang ada. Dengan demikian, jika H 0 benar, maka akan ada kecocokan yang
erat antar frekuensi-frekuensi teramati dengan frekuensi-frekuensi harapan.
Untuk dapat membandingkan sekelompok frekuensi yang diamati dengan kelompok frekuensi
yang diharapkan, tentunya kita harus dapat menyatakan frekuensi manakah yang kita harapkan itu.
Hipotesis nol (H0) menyatakan proporsi objek yang jatuh dalam masing-masing kategori didalam
populasi yang ditetapkan. Ini berarti, dari hipotesis nolnya kita dapat membuat deduksi apakah
frekuensi yang diamati cukup mendekati frekuensi yang diharapkan atau mempunyai
kemungkinan besar untuk terjadi dibawah (H0).
Dalam goodness of fit test ada hal-hal yang harus diperhatikan adalah antara lain:
a)

Adanya frekuensi observasi atau frekuensi yang benar-benar terjadi dalam eksperimen dan
dilambangkan dengan O.

b) Adanya fekuensi yang diarapkan terjadi yang dilambangkan dengan E.


c)

Derajat bebas adalah k-1.

d) Nilai chi-square.
e)

Jumlah sampel yang digunakan harus mencukupi nilai harapan paling sedikt lima.

Untuk masing-masing kategori, terdapat suatu peluang bahwa suatu hasil pengamatan yang dipilih
secara acak dari populasi yang dihipotesiskan akan masuk kedalam kategori tersebut. Apabila
hipotesis nolnya benar, maka kita dapat memperoleh frekuensi harapan (expected frequency) untuk
masing-masing kategori. Untuk hipotesis nol, sampel ditarik dari sebuah populasi yang mengikuti

suatu distribusi yang telah ditetapkan. Sedangkan untuk hipotesis tandingan, sampel bukan berasal
dari populasi dengan distribusi yang telah ditetapkan.
Pada uji statistik kita mengharapkan bahwa sampel-sampel acak yang ditarik dari populasipopulasi mencerminkan karakteristik populasi yang bersangkutan. Dengan kata lain bila kita telah
menarik sebuah sampel dari suatu populasi yang telah ditetapkan, tentu kita mengharapkan adanya
suatu kecocokan yang erat antar frekuensi-frekuensi teramati dengan frekuensi-frekuensi harapan
untuk setiap kategori yang ada. Dengan demikian, jika H 0 benar, maka akan ada kecocokan yang
erat antar frekuensi-frekuensi teramati dengan frekuensi-frekuensi harapan.
2.2 Chi-square
Uji chi-square dibuat oleh Katl Pearson (1899) yang sering disebut juga dengan pearson chi
square yang bisa digunakan untuk uji kecocokan (goodness of fit test), uji kebebasan (test for
independence), pengujian homogenitas serta pengujian varians dan standar deviasi populasi
tunggal.
Uji chi-square adalah pengujian hipotesis mengenai perbandingan antara frekuensi observasi atau
aktual dengan frekuensi harapan atau ekspektasi. Frekuesi observasi adalah nilai yang didapat dari
hasil percobaan. Sedangkan frekuensi harapan adalah nilai yang dapat dihitung secara teoritis.
Beberapa hal yang perlu diketahui berkenan dengan distribusi chi-square adalah:
a)

Distribusi chi-square memiliki satu parameter yaitu derajat bebas (dn).

b) Nilai-nilai chi-square dimulai dari nol disebelah kiri sampai nilai-nilai positif tak terhingga
disebelah kanan.
c)

Probabilitas nilai chi-square dimulai dari sisi sebelah kanan.

d) Luas daerah dibawah kurva normal adalah 1. Nilai dari chi-square bisa dicari jika kita memiliki
informasi luas daerah disebelah kanan kurva serta derajat bebas. Derajat bebas adalah k-1
dimana k adalah jumlah kategori.
Uji chi-square disebut juga dengan kai kuadrat. Uji chi-squeare adalah salah satu uji statistik nonparametik (distibusi dimana besaranbesaran populasi tidak diketahui) yang cukup sering
digunakan dalam penelitian yang menggunaka dua variable, dimana skala data kedua variable
adalah nominal atau untuk menguji perbedaan dua atau lebih proporsi sampel. Uji chisquarediterapkan pada kasus dimana akan diuji apakah frekuensi yang akan di amati (data
observasi) untuk membuktikan atau ada perbedaan secara nyata atau tidak dengan frekuensi yang
diharapkan. Chi-square adalah teknik analisis yang digunakan untuk menentukan perbedaan
frekuensi observasi (Oi) dengan frekuensi ekspektasi atau frekuensi harapan (Ei) suatu kategori
tertentu yang dihasilkan. Uji ini dapat dilakukan pada data diskrit atau frekuensi.
Pengertian chi-quare atau chi kuadrat lainya adalah sebuah uji hipotesis tentang perbandingan
Antara frekuensi observasi dengan frekuensi harapan yang didasarkan oleh hipotesis tertentu pada
setiap kasus atau data yang ambil untuk diamati. Uji ini sangat bermanfaat dalam melakukan
analisis statistic jika kita tidak memiliki informasi tantang populasi atau jika asumsi-asumsi yang
dipersyaratkan untuk penggunaan statistic parametric tidak terpenuhi. Chi kuadrat biasanya di
dalam frekuensi observasi berlambangkan dengan frekuensi harapan yang didasarkan atas
hipotesis yang hanya tergantung pada suatu parameter, yaitu derajat kebebasan (df).
Chi kuadrat mempunyai masingmasing nilai derajat kebebasan, yaitu distribusi (kuadrat standard
normal) merupakan distribusi chi kuadrat dengan d.f. = 1, dan nilai variabel tidak bernilai
negative. Kegunaan dari chi square untuk menguji seberapa baik kesesuaian diantara frekuensi
yang teramati dengan frekuensi harapan yang didasarkan pada sebaran yang akan dihipotesiskan,

atau juga menguji perbedaan antara dua kelompok pada data dua kategorik untuk dapat menguji
signifikansi asosiasi dua kelompok pada data dua katagorik tersebut.
Uji chi-square merupakan uji non parametris yang paling banyak digunakan. Namun perlu
diketahui syarat-syarat uji ini adalah: frekuensi responden atau sampel yang digunakan besar,
sebab ada beberapa syarat di mana chi square dapat digunakan yaitu:
a)

Tidak ada cell dengan nilai frekuensi kenyataan atau disebut juga Actual Count (F0)
sebesar 0 (Nol).

b)

Apabila bentuk tabel kontingensi 2 X 2, maka tidak boleh ada 1 cell saja yang memiliki
frekuensi harapan atau disebut juga expected count (Fh) kurang dari 5.

c)

Apabila bentuk tabel lebih dari 2 x 2, misal 2 x 3, maka jumlah cell dengan frekuensi
harapan yang kurang dari 5 tidak boleh lebih dari 20%.

Nilai chi-square adalah nilai kuadrat karena itu nilai chi-square selalu positif. Bentuk distribusi
chi-square tergantung dari derajat bebas (Db)/degree of freedom. Pengertian pada uji chi square
sama dengan pengujian hipotesis yang lain, yaitu luas daerah penolakan Ho atau taraf nyata
pengujian.
Adapun kegunaan dari uji Chi-Square, adalah :
a)

Ada tidaknya asosiasi antara 2 variabel (Independent test).

b) Apakah suatu kelompok homogen atau tidak (Homogenity test).


c)

Uji kenormalan data dengan melihat distribusi data (Goodness of fit test).

d) Digunakan untuk menganalisis data yang berbentuk frekuensi.


e)

Digunakan untuk menentukan besar atau kecilnya korelasi dari variabel-variabel


dianalisis.

f)

Cocok digunakan untuk data kategorik, data diskrit atau data nominal.

yang

Ketentuan yang menyatakan ada tidaknya dalam pengambilan keputusan, adalah:


a)

Bila harga Chi Square (X 2) Tabel Chi Square Hipotesis Nol (H 0) ditolak & Hipotesis
Alternatif (Ha) diterima

b)

Bila harga Chi Square (X2) < Tabel Chi Square Hipotesis Nol (H0) diterima & Hipotesis
Alternatif (Ha) ditolak

2.2.1 Faktor-faktor penting dalam uji chi-square


Untuk menggunakan hipotesis chi-square kita harus mempunyai sampel ukuran yang cukup besar
untuk menjamin kesamaan antara teori distribusi yang benar dan distribusi sampling chi-square
akan ditaksir terlalu tinggi dan akan mengakibatkan terlalu banyak penolakan H 0.
Untuk menghindari terjadi kesimpulan yang tidak benar dari uji hipotesis chi-square, ikutilah
peraturan yang umum bahwa frekuensi yang diharapkan lebih kecil dari lima, yang terdapat di
dalam salah satu bagian tabel kemungkinan terlalu kecil untuk digunakan. Pada saat tabel
mengandung lebih banyak bagian dengan frekuensi yang diharapkan yaitu lima atau lebih. Tetapi
dengan demikian kita mengurangi besarnya kategori data dan akan mencapai atau memperoleh
lebih sedikit informasi dari data tabel kemungkinan.

Dalam pengujian chi-square untuk memutuskan apakah menerima atau menolak H0, yaitu
hipotesis antara dua variabel yang saling bebas. Dua variabel tersebut adalah:
a)

Letaknya terhadap metode-metode penggantian.

b) Daerah geografis.
Uji chi-square dapat juga digunakan untuk memutuskan apakah keterangan-keterangan distribusi
seperti binomial, poisson dan normal adaah distribusi yang tepat. Uji chi-square memungkinkan
kita untuk bertanya sejauh mana kita dapat melakukan asumsi yang mendasari keteranganketerangan distribusi sebekum kita menyimpulkan apakah dstribusi itu tidak terlalu panjang untuk
dipakai dan apakah ada signifikansi yang berbeda antara pengamatan distribusi frekuensi dan teori
distribusi. Dengan cara ini kita dapat kebaikan yang tepat. Dari distribusi ini dapat menentukan
apakah kita harus percaya bahwa pengamatan merupakan sampel penutup dari hipotesa mengenai
teori distribusi.
Berikut ini adalah beberapa perbedaan uji chi-square dan uji kolmogorov-smirnov:
a)

Uji chi-square dirancang untuk digunakan dengan data frekuensin, sedangkan uji kolmogorovsmirnov dirancang untuk digunakan dalam data kontiyu.

b) Uji kolmogorov-smirnov boleh digunakan baik dalam uji satu sisi maupun dua sisi. Uji chisquare tidak membedakan arah ketidaksesuaian yang terjadi antara data teramati dan data
harapan.
c)

Uji chi-square mempersyaratkan agar data dikelompokkan data dalam kategori, sementara uji
kolmogorov-smirnov tidak demikian. Dengan demikian uji kolmogorov-smirnov lebih efisien
dalam menggunakan data yang dikelompokkan.

d) Uji chi-square tepat bila digunakan dengan data nomiman serta bila distribusi yang
dipotesiskan ini adalah data diskrit.
e)

Uji chi-square dilengkapi dengan data suatu prosedur koreksi yang jelas apabila parameterparameter yang dikehendaki masih harus diduga dari data sampel.

2.2.2 Uji chi-square goodness of fit test


Uji chi-square goodness of fit test adalah suatu uji untuk menentukan apakah suatu populasi
memiliki distribusi teoritik tertentu. Uji ini didasarkan pada seberapa baik kesesuaian antara
frekuensi yang teramati dalam data, contoh dengan frekuensi harapan yang didasarkan pada
distribusi yang dihipotesiskan chi-square goodness of fit test antara frekuensi yang teramati dengan
frekuensi harapan didasarkan pada besaran:
2

2
hit

( OiE i )
Ei

(2.1)
Dimana: X2 adalah suatu nilai bagi peubah acak X2 yang distribusi penarikan sampelnya sangat
mendekati chi-square.
Oi adalah menyatakan frekuensi teramati (observasi).
Ei adalah menyatakan frekuensi harapan bagi sel ke satu (ekspektasi).
Bila frekuensi yang teramati sangat dekat dengan frekuensi harapannya, nilai X 2 akan kecil, hal ini
menunjukkan adanya kesesuaian yang baik. Bila frekuensi yang teramati berbeda cukup besar
tidak habis dari frekuensi harapannya, nilai X2 akan besar, sehingga kesesuaiannya akan buruk.

Kesesuaian yang buruk akan membawa penolakan H0, dengan demikian wilayah kritisnya akan
jatuh. Nilai kritis X2 diperoleh dari tabel maka wilayah kritisnya adalah X2 > X2.
Kriteria keputusan ini tidak digunakan bila ada frekuensi harapan yang kurang dari lima.
Pernyataan ini mengakibatkan berkurangnya derajat kebebasan. Besarnya derajat kebebasan yang
berkaitan dengan distribusi chi-square yang digunakan di sini tergantung pada dua faktor, yaitu:
a) Banyaknya sel dalam percobaan yang bersangkutan.
b) Banyaknya besaran yang diperoleh dari data pengamatan yang diperlukan dalam perhitungan
frekuensi harapan.
Rumus yang digunakan dalam uji chi-square goodness of fit test:
a)

Uji chi-square 1 sampel diskrit


Tabel 4.2.1Chi-square 1 sampel diskrit

Xi

Oi = fi

e . x
Pi=
x!

Ei =
n.Pi

x=

( Oi Ei )
E

b) Uji chi-square 1 sampel kontinyu


Tabel 4.2.2Chi-square 1 sampel kontinyu

Interval
LCB

UCB

Pi

Oi

Ei =
n.Pi

x=

( Oi Ei )

Dimana: K adalah jumlah kelas.


P adalah parameter dari distribusi yang diuji.
Oi adalah frekuensi observasi dari data ke-i.
Pi adalah probabilitas
Ei adalah frekuensi ekspektasi atau frekuensi harapan.
X2 adalah chi-square.
c)

Uji chi-square 2 sampel diskrit atau kontinyu


Tabel 4.2.3Chi-square 2 sampel diskrit atau kontinyu

N1
N2

nr
Kolo
m

Kelas ke-1

Kelas ke-2

...

Kelas ke-c

O11

O12

...

O1c

E11
2

(O11 E11) /E11


O21

E21

(O21 E21)2/E21
...
Or1

Er1
2

E12
2

...

E22

...

(O12 E12) /E12


O22

(O22 E22)2/E22
...
Or2

Er2
2

...
...
...

E1c
2

(O1c E1c) /E1c


O2c

E2c

(O2c E2c)2/E2c
...
Orc

Erc
2

(Or1 Er1) /Er1

(Or2 Er2) /Er2

...

(Orc Erc) /Erc

B1

B2

...

Bc

Baris
A1
A2
...
Ar
N

Untuk dapat membandingkan sekelompok frekuensi yang diamati dengan kelompok yang
diharapkan, tentunya kita harus dapat menyatakan frekuensi manakah yang diharapkan itu.
Hipotesis nol menyatakan proporsi objek yang jatuh ke dalam masing-masing kategori di dalam
populasi yang ditetapkan. Ini berarti dari hipotesis nolnya kita dapat membuat deduksi berapakah
frekuensi yang diharapkan. Teknik X2 menguji apakah frekuensi yang diamati mendekati frekuensi
yang diharapkan sehingga mempunyai kemungkinan besar untuk terjadi di bawah H0.
Pada distribusi sampling statistik chi-square dapat diketahui dengan menggunakan kurva. Dalam
hal ini kita menggunakan distribusi T, untuk menggambarkan distribusi chi-square yang
mempunyai derajat kebebasan yang berbeda. Jika harga derajat kebebasannya kecil maka kurva
akan semakin simetris mendekati kurva normal. Dengan itu kita mencari selisih antara yang
diamati dengan yang diharapkan, mengkuadratkan selisih-selisih tersebut lalu membaginya dengan
jumlah yang diharapkan lalu menjumlahkan hasil bagi tersebut.
Sering terjadi penelitian yang dijalankan untuk mengetahui banyaknya subjek, objek jawaban
respon yang terdapat dalam berbagai kategori misalnya sekelompok pasien diklasifikasikan
menurut tipe kecenderungan utama dalam hal jawaban Rorschach mereka dan penyelidik mungkin
membuat ramalan bahwa tipe-tipe tertentu akan lebih sering terdapat dibandingkan dengan tipetipe lainnya.
Ada beberapa persoalan yang dapat diselesaikan dengan cara mengambil manfaat dari distribusi
chi-square, diantaranya seperti:
a)

Menaksir simpangan baku.

b) Menguji homogenitas varians beberapa populasi.


c)

Menguji proporsi untuk data multinomial.

d) Menguji independen antara dua faktor.


e)

Menguji kesesuaian antara data hasil pengamatan dengan model distribusi, darimana data itu
diduga kembali.

f)

Menguji model distribusi berdasarkan hasil pengamatan.

2.3 Uji kolmogorov-smirnov goodness of fit test


Uji kolmogorov-smirnov adalah suatu uji non parametrik untuk perbedaan antar distribusidistribusi kumulatif, sebuah sampel uji menyangkut penyesuaian antar distribusi kumulatif yang
teliti dari nilai-nilai sampel dan fungsi distribusi kontinyu yang spesifik, jadi hal tersebut
merupakan suatu goodness of fit test.
Uji dua sampel menyangkut persesuaian antara dua distribusi yang diteliti yang menguji suatu
hipotesis apakah dua sampel bebas berasal dari distribusi kontinyu identik dan peka terhadap
perbedaan populasi dengan melihat pada lokasi dispersi atau skewness.
Uji sebuah sampel kolmogorov-smirnov secara umum lebih efisien dibandingkan dengan uji chisquare untuk goodness of fit test dari sampel dalam jumlah kecil dan dapat digunakan untuk
sampel yang sangat kecil, dimana didalam uji chi-square tidak dapat diterapkan. Namun harus
diingat bahwa uji chi-square dapat digunakan dalam hubungannya dengan distribusi diskrit,
mengingat uji kolmogorov-smirnov tidak dapat digunakan. Uji satu sampel didasarkan pada
perbedaan absolut maksimum antara nilai-nilai dari distribusi kumulatif sampel acak yang
berukuran n dan distribusi secara teoritis yang lebih spesifik.
Dalam pengujian satu sampel memperlihatkan perjanjian antar pengamatan distribusi kumulatif
dari nilai sampel dan menetapkan distribusi kontinyu, dengan demikian pengujian ini sangat baik.

Sedangkan pada pengujian dua sampel memperlihatkan perjanjian antara dua pengamatan
distribusi kumulatif, hipotesis dua sampel ini menyatakan apakah kedua sampel saling bebas dari
distribusi kontinyu yang sama.
Uji dua sampel kolmogorov-smirnov didasarkan pada perbedaan absolut maksimum antara nilainilai dari dua distribusi kumulatif yang teliti secara prinsip. Uji dua sampel sangat mirip dengan uji
satu sampel, nilai-nilai kritis yang diperlukan dapat diperoleh dari tabel-tabel khusus.
Uji sampel tunggal kolmogorov-smirnov dapat kita ringkaskan dengan langkah-langkah sebagai
berikut:
a)

Tetapkan fungsi kumulatif teoritis berdasarkan distribusi sampling teoritis.

b)

Tetapkan H0 yang akan diuji.

c)

Susunlah skor observasi berdasarkan ranking.

d)

Hitung proporsi masing-masing frekuensi untuk setiap interval.

e)

Hitung proporsi kumulatif frekuensi observasi dan observasi teoritis.

f)

Dengan rumus mencari deviasi maksimum maka dapat ditentukan besarnya deviasi mengamati
selisih maksimum dari suatu frekuensi kumulatif yang telah dihitung.

g)

Apabila sampel lebih besar dari 35, maka kriteria yang dipergunakan adalah sesuai rumus yang
diberikan pada bagian bawah tabel.

h)

Bandingkan besarnya angka yang diperoleh pada deviasi maksimum dengan angka dalam tabel.

i)

Kriteria pengambilan keputusan adalah apabila harga deviasi maksimum lebih kecil dari angka
yang didapat dalam tabel maka H0 diterima.
Tes satu sampel kolmogorov-smirnov adalah suatu goodness of fit test artinya yang diperlihatkan
adalah tingkat kesesuaian antara distribusi serangkaian harga sampel (skor yang observasi) dengan
suatu distribusi teoritis tertentu. Tes ini menetapkan apakah skor-skor dalam sampel dapat secara
masuk akal dianggap berasal dari suatu populasi dengan teoritis itu.
Singkatnya tes ini mencakup perhitungan distribusi frekuensi kumulatif yang akan terjadi di bawah
distribusi teoritisnya serta membandingkan distribusi frekuensi itu dengan distribusi frekuensi
kumulatif hasil observasi. Distribusi teoritis tersebut merupakan representatif dari apa yang
diharapkan di bawah H0. Tes ini menetapkan suatu titik dimana kedua distribusi itu diyakini
sebagai distribusi yang teoritis dan yang terobservasi memiliki perbedaan terbesar.
Dengan melihat distribusi sampling dapat kita ketahui apakah perbedaan yang besar itu mungkin
terjadi hanya karena kebetulan saja artinya distribusi sampling itu menunjukkan apakah perbedaan
besar yang teramati itu mungkin terjadi apabila observasi itu benar-benar suatu sampel dari
distribusi teoritis itu.
Misalkan f0(x) = Suatu fungsi distribusi frekuensi kumulatif yang sepenuhnya ditentukan yakni
distribusi kumulatif teoritis di bawah H0. Artinya harga n yang sembarangan besarnya, harga f 0(x)
adalah sembarangan proporsi kasus yang diharapkan mempunyai skor yang sama atau kurang dari
pada x.
Misalkan SN(x) = distribusi frekuensi kumulatif yang terobservasi dari suatu sampel random
dengan N buah observasi. Dimana x adalah sembarangan skor yang mungkin, S N(x) = k/N,
dimana k adalah banyaknya observasi yang sama atau kurang dari x.

Dibawah hipotesis nol bahwa sampel itu telah ditarik dari distribusi teoritis tertentu, maka
diharapkan bahwa untuk setiap harga x, S N(x) harus jelas mendekati f0(x) artinya di bawah nol kita
akan mengharapkan selisih antara SN(x) dan f0(x) adalah kecil dan ada dalam batas-batas kesalahan
random. Tes kolmogorov-smirnov memusatkan perhatian pada penyimpangan terbesar.
Harga f0(x) - SN(x) terbesar dinamakan deviasi maksimum.
Dmaks = f0(x) - SN(x)

(2.2)

Distribusi sampling D di bawah H0 diketahui tabel E pada lampiran memberikan harga-harga kritis
tertentu distribusi sampling itu perhatikanlah bahwa signifikan suatu harga D tertentu adalah
bergantung pada N.
Dalam perhitungan tes kolmogorov-smirnov dilakukan langkah-langkah sebagai berikut:
a)

Tetapkan fungsi kumulatif teoritis, yakni distribusi kumulatif yang diharapkan di bawah H 0.

b)

Aturlah skor-skor yang diobservasi dalam suatu distribusi kumulatif dengan memasangkan
interval SN(x) dengan interval f0(x) yang sebanding.

c)

Untuk tiap-tiap jenjang pada distribusi kumulatif, kurangilah f0(x) dengan SN(x).

d)

Dengan memakai rumus yang ada, carilah nilai D (deviasi maksimum).

e)

Lihatlah tabel E untuk menentukan harga kemungkinan dua sisi yang dikaitkan dengan munculnya
harga-harga sebesar harga observasi di bawah H0. Jika P sama atau kurang dari , maka H 0
ditolak.
Tes dua sampel kolmogorov-smirnov adalah suatu tes apakah dua sampel independen telah dicari
dari populasi yang sama (dari populasi yang memiliki distribusi yang sama). Tes dua sisi peka
terhadap segala jenis perbedaan dalam distribusi yang menjadi asal usul kedua sampel itu
perbedaan-perbedaan dalam lokasi (harga tengah) kemencengan (skewness), pemencaran dan lainlain.
Seperti tes satu sampel kolmogorov-smirnov tes dua sampel ini memperhatikan kesesuaian antara
dua sampel distribusi kumulatif tes satu sampel dan meperhatikan kesesuaian antara distribusi
suatu himpunan harga sampel dengan suatu distribusi teoritis tertentu, tes dua sampel ini
memperhatikan kesesuaian antara dua himpunan harga-harga sampel.
Jika kedua sampel itu pada kenyataannya memang telah ditarik dari distribusi yang sama, maka
distribusi kumulatif kedua sampel tadi dapat diharapkan cukup pendekatan satu dengan yang
lainnya karena keduanya menunjukkan deviasi random saja dari pada distribusi populasi itu. Jika
kedua distribusi populasi kumulatif kedua sampel itu jauh berbeda pada suatu titik manapun, ini
menunjukkan bahwa sampel-sampel berasal dari populasi yang berbeda. Dengan demikian suatu
deviasi yang cukup besar antara distribusi kumulatif kedua sampel tersebut adalah fakta untuk
menolak H0.
Uji kolmogorov-smirnov dapat kita ringkas dalam langkah-langkah sebagai berikut:
a)

Asumsi-asumsi

1)

Data untuk analisis terdiri dari uji dua sampel acak bebas berukuran m dan n.

2)

Data yang paling tidak diukur menggunakan skala ordinat.

b) Hipotesis-hipotesis
Pada dasarnya sama dengan hipotesis pada uji sampel kolmogorov-smirnov.

c)

Uji statistik
Uji statistik kolmogorov-smirnov dapat dilihat pada persamaan berikut:
D = f0 - fe

(2.3)

Dimana: f0 adalah frekuensi kumulati relatif observasi


fe adalah frekuensi kumulati relatif ekspektasi
d) Pengambilan keputusan.
2.4 Menguji proporsi data multinomial
Misalkan sebuah eksperimen menghasilkan perstiwa-peristiwa atau kategori A1, A2, .., Ak yang
saling terpisah masing-masing dengan peluang P1 = P(A1), ..P2 = P(A2), ..PK = P(AK).
Akan diuji pasangan hipotesis H 0: Pi = P0, I = 1,2, , K, dengan Pi, sebuah harga yang diketahui
Hi: Pi = Pi0. Di sini tentu saja Pi = pi0 = 1.
Pengujian yang ditempuh akan menggunakan data sebuah sampel acak berukuran n yang di
dalamnya ada O1 dari kategori satu (A1), O2 dari kategori dua (A2), , Ok dari kategori k (Ak).
Dengan harga Pi0 yang diberikan, kita dapat menghitung masing-masing frekuensi yang
diharapkan E1 = n.P10, E2 = n.P20, Ek = n.PK0, jelas bahwa O1+ O2+.+ Ok = E1+ E1+.+ Ek =
n. Harga-harga O1, O2, ., Ok merupakan nilai-nilai yang tampak sebagai hasil pengamatan,
sedangkan E1, E2, . Ek merupakan nilai-nilai yang diharapkan terjadi atau nilai-nilai teoritiks
Agar mudah diingat, adanya kategori Ai, hasil pengamatan Oi dan hasil yang diharapkan Ei,
sebaiknya disusun dalam daftar sebagai berikut:
Tabel 4.2.4Tabel Ei dan Oi
Kategori
Pengamatan
Diharapkan

A1
O1
E1

A2
O2
E2

......
......
......

Ak
Ok
Ek

Untuk menguji hipotesis di atas, digunakan statistik:


k

X =
2

i=1

( O i Ei )
Ei

Oi2
atau X =
n
i=1 Ei
k

(2.4)

Ternyata bahwa statistik di atas berdistribusi chi-square dengan dk = (k-1). Kriteria pengujian
adalah tolak H0 jika X2 > X2(1-)(k-1) dengan = taraf nyata untuk pengujian. Dalam hal lainnya,
maka H0 diterima.
Sebagai hal khusus dari data multinomial adalah data binomial yang didapat apabila banyak kelas
k=2. Jika dalam hal ini kedua kategori disebut kategori I dan kategori II dengan peluang terjadinya
kategori I dan II masing-masing (I - II), maka untuk sebuah sampel acak berukuran n diantaranya
didapat x buah kategori I. Kita lihat bahwa distribusi chi-kuadrat yang digunakan hanya
mempunyai derajat kebebasan satu ini mengakibatkan terlalu sering terjadi penolakan. H 0 yang
seharusnya diterima apabila rumus di atas digunakan. Selain daripada itu rumus di atas adalah
pengkontinuitasan data diskrit yang dengan sendirinya harus di adakan penyesuaian seperlunya.
Sebagai hal khusus dari data multinomial ialah data binomial yang didapat apabila banyak kategori
k = 2. Jika dalam hal ini kedua kategori disebut kategori I dan kategori II dengan peluang
terjadinya kategori I dan kategori II masing-masing dan (1-), maka untuk sebuah sampel acak
berukuran n diantaranya didapat x buah kategori I, didapat dibuat daftar sebagai berikut:
Tabel 4.2.5Tabel pengamatan peluang terjadinya kategori I dan kategori II
Kategori

II

Jumlah

Pengamatan

Diharapkan

n.

n-x
n(1)

N
N

Statistik yang digunakan untuk menguji hipotesis H0: = 0 melawan H1: 0 ialah:
2

X=

( nn . 0 )

n . 0 (1 0 )

(2.6)
dan tolak H0 jika X2 X2(1-)(1): sedangkan dalam hal lain H0 diterima.
Kita lihat bahwa distribusi chi-square yang digunakan hanya mempunyai satu derajat kebebasan.
Ini mengakibatkan terlalu sering terjadinya penolakan H 0 yang sebenarnya diterima apabila rumus
di atas digunakan. Khusus dalam hal ini, yakni dalam hal data binomial dimana digunakan
distribusi chi-kuadrat dengan dk = 1. Rumus di atas perlu diperbaiki dengan menggunakan koreksi
kontinuitas, yaitu harga mutlak 1x n. 0. I harus dikurangi dengan setengah. Jadi rumusnya yang
dipakai adalah:

(1 xn . 0 .11 /2)2
X=
n . 0 (1 0 )
2

(2.7)
2.5 Menguji kesamaan poisson
Misalkan ada k(k>2) buah distribusi poisson dengan parameter 1, 2, k. Akan diuji pasangan
hipotesis H0: 1 = 2 = . = k. H1 : paling sedikit 1 randa sama dengan tidak berlaku.
Dari setiap populasi diambil sebuah sampel acak, berukuran n 1 dari populasi ke-1, n2 dari populasi
ke-2 dan seterusnya berukuran nk dari populasi ke-k. Untuk tiap sampel dihitung banyak peristiwa
yang mengikuti distribusi poisson. Jika banyak peristiwa ini dinyatakan dengan x1 + x2 +..+ xn,
maka rata-rata x adalah:

x=

x 1 + x 2+ + x n
k

(2.8)
Statistik yang digunakan untuk menguji hipotesis Ho adalah:

X2 hit =

(Xi-X )
X

(2.9)
dan tolak H0 jika X2 X2(1-)(k-1). Dalam hal lain H0 diterima.
2.6 Banyak independen antar dua faktor
Banyak data hasil pengamatan yang dapat digolongkan ke dalam beberapa faktor, karakteristik
atau atribut dengan tiap faktor atau atribut terdiri dari beberapa klasifikasi, kategori, golongan atau
mungkin tingkatan. Berdasarkan hasil pengamatan terhadap fenomena demikian akan diselidiki
mengenai hubungan, asosiasi, kaitan antar faktor. Jika ternyata tidak terdapat kaitan antara faktorfaktor, biasa dikatakan bahwa faktor-faktor itu bersifat independen atau bebas, tepatnya bebas
statistik. Dengan kata lain akan dipelajari apakah terdapat atau tidak suatu kaitan diantara faktorfaktor itu.

Dalam bagian ini hanya akan dipelajari fenomena yang terdiri dari paling banyak dua faktor, selain
daripada itu disini akan dibahas juga ada tidaknya pengaruh mengenai beberapa taraf atau
tingkatan suatu faktor terhadap kejadian fenomena.
2.6.1 Asosiasi antara dua faktor dalam daftar kontingensi B K
Secara umum, untuk menguji independen antara dua faktor dapat dijelaskan sebagai berikut:
Misalkan sebuah sampel acak berukuran n telah diambil, dimana tiap pengamatan tunggal diduga
terjadi karena adanya dua macam faktor, ialah faktor I dan faktor II. Faktor I terbagi atas B taraf
atau tingkatan dan faktor II terbagi atas K taraf. Banyak pengamatan yang terjadi karena taraf ke-i
faktor ke-I (I = 1,2,.., B) dan taraf ke-j faktor ke-II (j = 1,2,..,K) akan menyatakan dengan O ij.
Hasilnya dapat dicatat dalam sebuah daftar kontingensi B x K.

Tabel 5.2.6Tabel Kontingensi B x K Untuk Hasil Pengamatan Terdiri Atas Dua


Faktor

(B TARAF)FAKTOR I

FAKTOR II
(K TARAF)
1
2

Jumlah

Jumlah
K
1
2

O11
O21

O12
O22

nB1
nO1

O1k
O2k

n10
N20

nB2

OBK

nB0

nO2

nOK

2.7 Uji kebebasan


Uji kebebasan yang dibicarakan pada modul ini adalah uji kebebasan chi-square, yaitu yang dapat
pula dipakai untuk menguji hipotesis bahwa dua sampel saling bebas. Misalkan ingin diteliti
apakah pandapat penduduk pemilih di negara bagian Illionis mengenai perubahan pajak baru tidak
ada hubungannya dengan tingkat penghasilannya.
Perlu diingat bahwa yang mendasari keputusan mempunyai distribusi yang hanya merupakan
lampiran distribusi chi-square. Nilai X2 hitung tergantung pada frekuensi sel dan karena itu
termasuk data diskrit. Ditribusi chi-square yang kontinyu terlihat menghampiri distribusi terok
diskrit X2 amat dekat, asal saja banyaknya derajat kebebasan lebih besar dari 1. Dalam tabel
kemungkinan 2 x 2, yang hanya mengandung derajat kebebasan satu, digunakan suatu koreksi
yang disebut koreksi kontinuitas Yates.
Bila frekuensi sel harapan besar, hasil yang dikoreksi dan tidak dikoreksi hamper sama. Bila
frekuensi harapan antara 5 dan 10, koreksi Yates sebaiknya dipakai. Untuk frekuensi harapan
kurang dari 5. Sebaiknya uji tepat FisherIrwin yang dipakai. Pembahasan mengenai uji ini dapat
diperoleh dalam Basic Concepts of Probability and Statistics oleh Hodges dan Lehnmann. Uji
FisherIrwin sesungguhnya dapat dihindari dengan memilih ukuran terok yang lebih besar.

2.8 Uji kehomogenan dan uji beberapa proporsi


Sebagai pengganti pengujian kebebasan, diuji hipotesis bahwa proporsi populasi ditiap baris
adalah sama. Yakni diuji hipotesis bahwa untuk menguji kehomogenan dapat pula dipakai untuk
menguji hipotesis bahwa k parameter binomial mempunyai nilai yang sama. Dengan demikian ini
merupakan perluasan uji dari pengujian yang membahas untuk menentukan selisih dua proporsi
menjadi selisih k proporsi. Jadi ingin diuji k hipotesis nol.
H0 : P1 = P2 = . = Pk
Lawan dari hipotesis tandingan H1, bahwa proporsi populasi tidak semuanya sama. Yang sama
dalam pengujian banyaknya peluang sukses atau peluang yang gagal tergantung pada banyaknya
terok yang diambil.
2.9 Uji distribusi normal atau uji kenormalan
Dari uraian-uraian terdahulu, misalnya dalam uraian tentang berbagai distribusi sampling, teori
menaksir, pengujian hipotesis, telah kita lihat betapa pentingnya untuk mengetahui model populasi
yang dipelajari, terutama model normal. Asumsi bahwa populasi berdistribusi normal, asumsi
normalitas, telah melancarkan teori dan metoda sebegitu rupa sehingga banyak persoalan yang
dapat diselesaikan dengan lebih mudah dan cepat. Karenanya, cukup mudah dimengerti kiranya
bahwa asumsi normalitas perlu dicek keberlakuannya agar langkah-langakah selanjutnya dapat
dipertanggungjawabkan.
Asumsi yang diambil tidak benar atau terlalu menyimpang, tidak hanya mengenai normalitas
tetapi juga pengamatan bersifat independen (sampel acak), tidak terdapat kesalahan ketika
mencatat hasil pengamatan, homogenitas tentang varians dan sebagainya, bukan saja langkahlangkah penelitian tidak dapat dipertanggungjawabkan tetapi juga ternyata salah.
Mengenai kesalahan yang mungkin terjadi terhadap hasil pengamatan, tidak ada uji statistik yang
tersedia, kecuali penelitian atau pengamatan harus dilakukan secara teliti dan jujur. Soal keacakan
mengenai sampel dapat diuji secara khusus dan ini akan dibicarakan kemudian.
Pengertian ini timbul dari kenyataan bahwa tidak selalu asumsi-asumsi, semua atau sebagian,
dapat dipenuhi dengan tepat. Dalam beberapa hal, penyimpangan wajar dari syarat-syarat yang
telah ditentukan sering tidak mengakibatkan bahaya yang hebat. Misalnya, sedikit terjadinya
penyimpangan dari normalitas dan atau dari sifat homogenitas varians, biasanya hanya
memberikan akibat buruk yang kecil terhadap hasil pengujian dan kesimpulannya.
Distribusi T atau distribusi student telah diketahui tidak sensitif terhadap penyimpangan wajar dari
normalitas sehingga penggunaanya tidak dibatasi keras oleh asumsi normalitas. Sifat demikian,
ialah tidak sensitif terhadap penyimpangan wajar dari syarat-syarat yang digariskan, dinamakan
ajeg. Jika hal ini terjadi sehubungan dengan pengujian hipotesis, maka diperoleh uji ajeg. Sekarang
marilah kita tinjau mengenai uji normalitas.
Persamaan distribusi normal dengan rata-rata dan simpangan baku dapat dilihat dalam modul 2.
Jika sebuah sampel acak berukuran n telah diambil dengan rata-rata = x dan simpangan baku = s.
Untuk keperluan pengujian, kita harus menghitung frekuensi teoritik E i dan mengetahui frekuensi
nyata atau hasil pengamatan Oi. Frekuensi nyata Oi jelas didapat dari sampel, masing-masing
menyatakan frekuensi dalam tiap kelas interval. Harga Ei, frekuensi teoritik, didapat dari hasil kali
antara n dengan peluang atau luas dibawah kurva normal untuk interval yang bersangkutan.
Ei = n . p
Selanjutnya statistik X2 dihitung dengan rumus:

(2.10)

2
hit

(Oi-Ei )
=
Ei

(2.11)
Dan untuk menentukan kriteria pengujian digunakan distribusi chi-kuadrat dengan dk=(k-3) dan
taraf .

Anda mungkin juga menyukai