Anda di halaman 1dari 6

Patrica Pungky Gabrela / 06211745000029 / Kelas C

Tugas ADK – Resume Materi 3.3

3.3 Uji Chi-Squared Lanjutan

Seperti uji signifikansi lainnya, uji independensi chi-squared memiliki kegunaan yang
terbatas. Nilai P-value yang kecil menunjukkan bukti asosiasi yang kuat namun hanya
memberikan sedikit informasi tentang sifat atau kekuatan asosiasi. Ahli statistik telah lama
memperingatkan tentang bahaya ketika hanya mengandalkan hasil uji chi-squared saja. Pada
bagian ini kita membahas cara untuk menindaklanjuti pengujian tersebut.

Tabel 3.2 Pendidikan dan Kepercayaan


Tingkat Pendidikan Kepercayaan Total
Fundamental Moderate Liberal
Di bawah SMA 178 138 108 424
(137.8) (161.5) (124.7)
(4.5) (-2.6) (-1.9)
SMA atau mahasiswa baru 570 648 442 1660
(539.5) (632.1) (488.4)
(2.6) (1.3) (-4.0)
Sarjana 138 252 252 642
(208.7) (244.5) (188.9)
(-6.8) (0.7) (6.3)
Total 886 1038 802 2726

3.3.1 Pearson dan Residual yang Terstandarisasi


Perbandingan sel demi sel yang diamati dan perkiraan frekuensi yang diharapkan
membantu menunjukkan sifat ketergantungannya. Di bawah H0, perbedaan yang lebih besar
(nij  ˆ ij ) cenderung terjadi pada sel dengan ij yang lebih besar. Untuk pengambilan sampel

Poisson, misalnya, standar deviasi dari nij dan karenanya (nij  ij ) adalah  ij ; standar

deviasi dari (nij  ˆ ij ) kurang dari nij  ij tetapi proporsional untuk  ij . Jadi, perbedaan

yang masih mentah ini tidak mencukupi. Residual Pearson didefinisikan untuk sel oleh

nij  ˆ ij
eij  (3.12)
ˆ ij
1/ 2
Patrica Pungky Gabrela / 06211745000029 / Kelas C

 e  X2.
2
Residual pearson berhubungan dengan statistik Pearson i j ij

Dibawah H0, {eij} adalah asimtotik normal dengan mean 0. Namun, pada bagian 14.3.2,
kami menunjukkan bahwa varians asimtotiknya kurang dari 1.0, dengan rata-rata [(I-1)(J-1)]/
(jumlah sel). Membandingkan residual Pearson ke titik persentase normal standard
memberikan indikasi bahwa sel memiliki lack of fit.

Residual Pearson yang terstandarisasi yang secara asimtotik normal standar merupakan
hasil dari membaginya dengan standar error-nya. Untuk H0: independen, ini

nij  ˆ ij
(3.13)
[ ˆ ij (1  pi  )(1  p j )]1 / 2

Residual Pearson terstandarisasi yang melebihi sekitar 2 atau 3 dalam nilai absolut
menunjukkan lack of fit dari H0 pada sel tersebut. Nilai yang lebih besar akan lebih relevan bila
df-nya lebih besar.

3.3.2 Pendidikan dan Peninjauan Agama Fundamental


Tabel 3.2 juga menunjukkan residual Pearson terstandarisasi untuk menguji
independensi. Misalnya, n11 = 178 dan ̂11 137.8. Proporsi marginal yang relevan adalah p1
= 424/2726 = 0.156 dan p 1 = 886/2726 = 0.325. Residual Pearson terstandarisasi (3.13) untuk
sel ini adalah

(178-137.8)/[(137.8)(1-0.516)(1-0.325)]1/2 = 4.5

Sel ini menunjukkan perbedaan yang jauh lebih besar antara n11 dan ̂11 daripada
ekspektasi bahwa variabelnya benar-benar independen. Tabel 3.2 menunjukkan residual positif
yang besar untuk subjek dengan tingkat pendidikan di bawah Sekolah Menengah Atas dan
pandangan fundamentalis dan untuk subjek dengan gelar sarjana dan pandangan liberal. Ini
berarti bahwa subjek yang signifikan lebih banyak berada pada kombinasi ini daripada yang
diprediksi oleh H0: independen. Pada saat yang sama, ada lebih sedikit subjek dengan tingkat
pendidikan dan pandangan fundamentalis yang tinggi dan dengan tingkat pendidikan dan
pandangan liberal yang rendah daripada yang diprediksikan.
Odds ratio menggambarkan trend ini. Tabel 2 x 2 dibangun dari baris pertama dan
terakhir dan kolom pertama dan terakhir dari Tabel 3.2 memiliki sampel odds ratio dari (178 x
252)/(108 x 138) =3.0. Bagi mereka dengan gelar sarjana, kemungkinan memilih liberal
Patrica Pungky Gabrela / 06211745000029 / Kelas C

daripada fundamentalis adalah 3,0 kali perkiraan peluang bagi mereka yang memiliki
pendidikan di bawah SMA.

3.3.3 Mempartisi Chi-Squared


Jika Z berdistribusi normal standar, maka Z2 berdistribusi chi-squared dengan df = 1.
Variabel random berdistribusi chi-squared dengan derajat bebas v menunjukkan
z12  z22  ...  zv2 , dimana Z1,…,Zv berdistribusi normal standar yang saling bebas. Jika variabel
random tersebut dipartisi, misalnya menjadi v bagian yang masing-masingnya memiliki df =
1, maka 12 dan  22 merupakan variabel random chi-squared yang saling bebas dan memiliki
df = v1 dan v2. Dengan mempartisi statistik ujinya, setiap bagian merepresentasikan aspek
tertentu dari efek yang berlaku dan.
Kita mulai dengan partisi uji independensi pada tabel 2 x J. Dengan mempartisi G 2 yang
memiliki df = (J-1) menjadi J-1 bagian. Komponen ke j adalah G 2 untuk tabel 2 x 2 dimana
kolom pertama adalah kombinasi dari kolom 1 melalui j pada tabel lengkap dan kolom kedua
adalah kolom j+1. Hal tersebut merupakan G 2 untuk uji independensi pada tabel 2 x J yang
setara dengan kombinasi dua kolom pertama, ditambah dengan statistik yang
mengkombinasikan dua kolom pertama dan kemudian membandingkannya dengan kolom
ketiga, dan seterusnya, tergantung kepada statistik yang mengkombinasikan J-1 kolom pertama
dengan kolom terakhir. Setiap komponen memiliki derajat bebas 1.
Namun, komponen statistik ini tidak bebas dan bukan merupakan penjumlahan G 2 untuk
keseluruhan tabel secara lengkap. Untuk tabel I x J, komponen chi-squared yang saling bebas
dihasilkan dengan membandingkan kolom 1 dan 2 lalu mengkombinasikannya dan
membandingkannya dengan kolom 3, begitu seterusnya. Setiap statistik J-1 memilki derajat
bebas I-1. Partisi yang lebih sempurna mengandung statistik sebanyak (I-1)(J-1) yang masing
masing memiliki derajat bebas 1. Berikut adalah salah satu bentuk partisi dapat diterapkan pada
(I-1)(J-1) dengan memisahkan tabel 2 x 2.

 n
a b
ab n
a i
aj

na i
aj nij (3.14)

dimana i=2,..,I dan j=2,…,J.


3.3.4 Contoh Asal dari Schizopherenia
Tabel 3.3 mengelompokkan sampel dari psychiatrist berdasarkan gagasan sekolah
mereka dan opini mereka terhadap asal Schizopherenia. Dimana G2 =23,04 dengan df = 4. Kita
Patrica Pungky Gabrela / 06211745000029 / Kelas C

partisi G2 kedalam empat komponen saling bebas yang ditampilkan dalam tabel 3.4. Untuk
subtabel awal perbandingan pandangan eclectic dan medical school pada asal schizophrenia
biogenic atau environmental dalam 2 kategori. Pada subtabel ini G2 = 0,29 dengan df = 1. Pada
Subtabel kedua perbandingan dua sekolah dengan menganggap bahwa proporsi berasal dari
kombinasi waktu asal, lebih dari biogenic atau environmental. Subtabel ini G2=1.36 dengan
df=1.

Tabel 3.3 Pengaruh Pandangan Sekolah Psychiatric Terhadap Asal Schizophrenia


Asal Schizophrnia
Pandangan Sekolah Psychiatric
Biogenic Environmental Combiantion
Eclectic 90 12 78
Medical 13 1 6
Psychoanalytic 19 13 50

Tabel 3.4 Kegunaan Subtabel Dalam Mempartisi Chi-Squared untuk Tabel 3.3
Bio Env Bio+Env Com Bio Env Bio+Env Com
Ecl 90 12 Ecl 102 78 Ecl+Med 103 13 Ecl+Med 116 84
Med 13 1 Med 14 6 Psy 19 13 Psy 32 50
Penjumlahan dua komponen persamaan G2 untuk uji independensi memberikan bukti
kecil perbedaan antara pandangan eclectic dan school medical pada anggapan asal
schizophrenia. Kemudian kita akan mengkombinasikan eclectic dan medical school dan
membandingkan mereka pada psychoanalytic school. Pada subtabel ketiga di Tabel 3.4
membandingkan mereka pada klasifikasi biogenic dan environmental, sehingga menghasilkan
G2=12,95 dengan df=1. Keempat subtabel membandingkan biogenetic atau environmental,
kombinasi untuk dipisahkan, memberikan G2=8,43 dengan df=1.

3.3.5 Aturan Partisi


Berikut adalah aturan yang diberikan oleh Goodman dan Lancaster untuk menentukan
jumlah komponen bebas dari chi-squared.
1. Jumlah derajat bebas dari sub tabel harus sama dengan jumlah derajat bebas
keseluruhan
2. Setiap kolom dalam sub tabel harus dihitung hanya sekali dan setiap sub tabel juga
dihitung hanya sekali
3. Masing masing jumlah marginal dari tabel lengkap harus merupakan marginal dari
hanya salah satu sub tabel.
Ketika jumlah derajat bebas pada sub tabel dapat dijumlahkan sementara G 2 tidak,
maka masing-masing komponen tidak independen. Sebagai tambahan, ketika tabel memiliki
Patrica Pungky Gabrela / 06211745000029 / Kelas C

jumlah yang kecil dalam uji chi-squared, maka lebih aman untuk menggunakan  2 dalam
menyelidiki sub tabel.

3.3.6 Batasan Uji Chi-squared


Uji independensi Chi-squared lebih digunakan untuk mengindikasikan adanya bukti
tentang tingkat suatu hubungan. Namun, uji Chi-squared juga memiliki keterbatasan dalam
jenis data yang digunakan. Contohnya, diperlukan jumlah sampel yang besar. Selain itu,

 ij  ni  n j / n yang digunakan dalam nilai G 2 dan  2 bergantung kepada total marginal.

Dengan demikian G 2 dan  2 tidak berubah nilainya dengan pengurutan sementara baris dan
kolom. Hal ini menyebabkan kita memperlakukan kedua klasifikasi tersebut sebagai nominal.
Jika salah satu variabel adalah ordinal, uji statistik yang lebih sesuai yaitu dengan
mempergunakan urutan tersebut (seperti pada bagian 3.4).

3.3.7 Mengapa Mempertimbangkan Kebebasan?


Struktur ideal apapun seperti independensi sangat jarang berlaku pada situasi manapun.
Dengan jumlah sampel yang besar seperti pada tabel 3.2, maka nilai P-value yang didapatkan
akan sangat kecil. Dengan memperhatikan hal tersebut, maka salah satu alasan untuk
memeriksa kebebasan dari distribusi bersama adalah untuk mendapatkan model yang
parsimoni. Jika model yang tersebut memperkirakan peluang sebenarnya dengan baik, maka
pendugaan berdasarkan model tersebut ˆ ij  ni  n j / n 2  dengan proporsi sampel

p ij  nij / n . Rumus Mean-Squared error (MSE) adalah.

MSE = Varians + (Bias)2

Rumus tersebut menjelaskan mengapa penduga yang saling bebas dapat mempunyai MSE yang
lebih kecil. Walaupun masih terdapat bias, mereka memiliki varians yang lebih kecil karena
pendugaan didasarkan oleh parameter yang lebih sedikit.
Berdasarkan tabel 3.5 diilustrasikan bahwa  ij   i   j 1   (i  2)( j  2) untuk  i  =

  j = 1/3. Disini -1 < δ < 1, dengan δ =0 menyatakan bahwa model adalah bebas. Hubungan
yang baik didapat ketika δ mendekati 0. Sehingga total nilai MSE untuk kedua penduga adalah.

MSE (  pij  ) =  E( p ij   ij )2 Var ( pij )


i j i j

 
   ij (1  ij ) / n  1    ij2  / n
i j  i j 
Patrica Pungky Gabrela / 06211745000029 / Kelas C

MSE (  ij  ) =  E(ˆ ij   ij )2
i j

Tabel 3.5 Peluang Sel untuk Perbandingan dari Penduga


(1+δ)/9 1/9 (1- δ)/9
1/9 1/9 1/9
(1- δ)/9 1/9 (1+δ)/9
1  8 4 
MSE({pij})=   
n  9 81 

1  4 4  4 2  2 2 2
MSE({ ˆij })=     1   2  3 
n  9 9n  81  n n n 