Anda di halaman 1dari 6

UJI KEBAIKAN SUAI KHI KUADRAT

Tes ini diadaptasi untuk menguji apakah suatu sampel random berasal dari suatu distribusi
tertentu, dengan Ho: X~ F(x). bagilah ruang sampel menjadi c sel yaitu A1..Ac dan pj0=P[X
Aj] dimana X~F(x). lalu untuk random sampel yang berukuran n, misalkan Oj menotasikan
jumlah obsevasi ke j, di bawah H0 nilai ekpektasi ke j adalah ej=npj0. Hal ini kembali menjadi
bentuk multinomial, dan H0=X~F(x) ditolak pada tingkat signifikansi , jika
c

=
2

j=1

( o je j )
ej

> 21 ( c1)

Dalam beberapa kasus, ada beberapa kelompok sudah terbentuk dengan sendirinya. Namun,
disisi lain kelompok buatan dapat dibentuk. Sesuai persyaratan, sel-sel dapat digunakan
sebanyak mungkin untuk meningkatkan derajat bebas, selama ej 5 agar dapat memastikan
bahwa nilai perkiraan khi kudratnya akurat.

KASUS PARAMETER YANG TIDAK DIKETAHUI


Ketika menggunakan prosedur uji goodness of fit untuk membantu memilih model populasi yang
tepat, kita biasanya tertarik untuk menguji apakah apakah keluarga distribusinya sesuai, misalkan
Ho: X~Poi() atau Ho: X~ N(,

), dimana nilai parameter tidak diketahui, daripada menguji

hipotesis dengan parameter yang diketahui, seperti Ho: X~Poi(3). Oleh karena itu kita tidak
tertarik untuk menguji ketidaksesuaian yang dikarenakan kesalahan nilai parameter di titik
teretentu, tetapi kita lebih tertarik untuk menguji apakah model umum memiliki model yang
sesuai ketika nilai parameternya digunakan.
Misalkan kita ingin menguji H0: X~f(x;
diketahui. Untuk menghitung statistic

1 , .. , k

) dimana terdapat k parameter yang tidak

2 , nilai ekspektasi dibawah Ho harus diestimasi. Jika

data yang asli digabungkan menjadi beberapa sel makan densitas gabungan dari nilai observasi,

oj, adalah multinomial, dimana nilai yang benar tetapi tidak diketahui dari pjo= P[X
1 , .. , k

adalah fungsi dari


untuk mengestimasi

Aj ]

. Jika Maximum Likelihood Estimator (MLE) digunakan

1 , .. , k

(berdasarkan pengelompokan nilai data oj dalam distribusi

multinomial), lalu nilai batas stastistik

2 adalah khi kuadrat dengan derajat bebas c-1-k,

dimana c adalah banyaknya sel dan k adalah banyaknya parameter yang diestimasi, yang
ditunjukkan:

=
2

( o j e^ j )
e^ j

j=1

Dimana

e^ j

2 (c1k )

n ^p jo

Dalam banyak kasus, estimasi MLE yang berdasarkan model multinomial yang dikelompokkan
tidak sesuai untuk digunakan, dan dalam prakteknya biasa digunakan MLE yang berdasarkan
data yang tidak dikelompokkan atau data kelompok yang diperkirakan.
Jika MLE berdasarkan observasi perorangan yang digunakan, maka jumlah derajat bebasnya bisa
lebih besar dari c-1-k, tapi batasan distribusinya antara distribusi chi square dengan derajat
bebas c-1 dan c-1-k. Aturan dengan dengan derajat bebas c-1-k akan digunakan jika k parameter
diestimasi dengan cara ML. Pendekatan lebih konservatif dapat membatasi nilai p-value dari
pengujian dengan menggunakan derajat bebas c-1-k dan c-1 jika MLEnya tidak berdasarkan data
yang dikelompokkan.
Ingat bahwa bagaimana cara memilih sel tidak terlalu jelas ketika Ho tidak spesifik. Untuk H o
yang spesifik cara terbaiknya adalah dengan memilih sel-sel sehingga semua nilai e j kurang lebih
sama dengan 5. Hal ini membuat ej cukup besar untuk memastikan keakuratan perkiraan khi
kuadrat dan tetap memberikan jumlah derajat bebas yang mungkin paling besar. Tentu saja, jika

dengan distribusi diskret tidak mungkin tercapai. Jika Ho tidak spesifik, maka ej atau

e^ j

tidak

dapat dihitung sebelum mengambil sampel. Prosedur biasanya adalah memilih beberapa
pembagian sel yang alami, dan sel-sel yang berdekatan digabungkan untuk memperoleh nilai
e^ j

5. Di beberapa kasus data sudah dikelompokkan dengan sendirinya, dan tersedia dalam

bentuk sel-sel yang sudah terbagi-bagi. Memang, saalah satu keuntungan menerapkan uji
kebaikan suai khi kuadrat adalah uji ini sangat aplikatif untuk data berkelompok. Di sisi lain, jika
observasi tunggal, maka beberapa informasi mungkin akan hilang ketika data tersebut
dikelompokkan.

UJI KEBAIKAN SUAI LAINNYA


Beberapa uji kebaikan suai dibangun dalam hal fungsi empiris distribusi. Prinsip dasar untuk
melihat seberapa dekat kumulatif sampel yang diobservasi

sesuai dengan distribusi yang

dihipotesiskan. Uji EDF dipertimbangkan menjadi lebih kuat dibandingkan uji kebikan suai khi
kuadrat, karena mereka menggunakan langsung terhadap observasi tunggal. Tentu saja, uji ini
tidak berlaku untuk data yang dikelompokkan.
Misalakan x1:n,.,xn:n menotasikan sampel random yang terurut dengan ukuran n. maka EDF
atau CDF sampel dinotasikan dengan

^
F (x), dimana

^
F (xi;n) = i/n
Jika kita menginginkan untuk menguji hipotesis spesifik dengan lengkap, Ho: X~ F(x), maka
pendekatan umumnya adalah mengukur bagaimana kedekatan

^
F (xi;n) dengan F(xi;n). beberapa

modifikasi kecil sudah terbukti membantu, seperti menggunakan koreksi setengah titik dan
membandingkan nilai yang dihipotesiskan dengan (i-0.5)/n dibandingkan dengan i/n.,

Karena nilai U = F(X) ~ UNIF(0,1), uji untuk semua H o yang spesifik dapat dituliskan sama
dengan uji untuk keseragaman, dimana U i;n =F(Xi;n) didistribusikan sebagai variable uniform
yang terurut.

UJI CRAMER VON MISES UNTUK Ho YANG DITENTUKAN


Jika r observasi terkecil dari sampel berukuran n ada, maka statistik uji CVM bagi Ho: X ~ F(x) adalah
sebagai berikut

F( x i ;n )
CM =

i0,5
n

1
+
12n i=1
Distribusi CM dibawah Ho sama dengan distribusi

U
i0,5 2

i;
n
(
)
n
r
1
+
12n i=1
Dimana

U i ;n adalah variable uniform. Titik persentasi asimtotik bagi CM diperoleh oleh Pettit dan

Stephens (1976). Hasilnya akan cukup akurat dalam prakteknya bila sampelnya minimal 10 atau lebih.
Nilai perkiraan ukuran uji x bagi Ho: X~ F akan ditolak jika CM CM 1- dimana nilai kritis bagi CM1-
tersedia di Tabel 9 (Appendix C) untuk beberapa nilai x.

UJI CRAMER VON MISES, PARAMETER DIESTIMASI


Seperti yang dibahas di bagian sebelumnya, seringkali kita lebih tertarik dalam menguji apakah beberapa
distribusi dapat diterapkan ketimbang menguji Ho yang sudah ditentukan.. untuk menguji Ho: X ~ F(x;

), dimana tidak diketahui, kita menggunakan:

F( x i ;n )

CM =

i0,5
n

1
+
12n i=1
Dimana

^
^ menotasikan MLE bagi . Secara umum, distribusi CM

dapat ataupun tidak

bergantung pada parameter yang tidak diketahui. Bagaimanapun juga, kita mengetahui bahwa

^
) parameter location-scale, maka F(X;

1,

^
) dan F(Xi;n;

1,

) kuantitas pivot

dimana distribusinya tidak bergantung pada parameter. Jadi, sekurang-kurangnya dalam kasus parameter
location-scale,

^
CM

menyediakan statistic uji yang sesuai yang dimana nilai kritisnya dapat

ditentukan. Kita memiliki kekurangan dalam kasus dimana nilai kritisnya bergantung pada F yang diuji,
dimana pada kenyataannya nilai kritis yang sama bersifat aplikatif untuk menguji semua Ho yang
ditentukan. Beberapa nilai kritis yang asimtotik terdapat di beberapa literature bagi beberapa model
seperti eksponesial, normal, dan distribusi weibull.

UJI KOLMOGOROV SMIRNOV ATAU UJI KUIPER


Uji Kolmogorov smirnov (KS) didasari pada perbedaan CDF sampel dan CDF yang dihipotesiskan.
Untuk menguji Ho yang ditentukan, dimana Ho: X ~ F(x), maka:
D+ = maksimum (In F(xi;n))
D- = maksimum(F(xi;n) (i-1)/n)
D= maksimum (D+, D-)
V= D+ + DV adalah statistic uji Kaiper. Distribusi statistic ini tidak bergantung pada F. juga, dalam kasus CVW, jika
location-scale parameter diestimasi, maka distribusinya tidak akan bergantung pada parameter, tetapi
bergantung pada nilai F. Statistik KS memungkinkan bagi alternative satu arah, dan sudah dikembangkan
untuk masalah dua sampel.