Anda di halaman 1dari 25

MODUL 2

TABEL KONTINGENSI RXC dan TABEL KONTINGENSI 2X2

Tabel kontingensi atau yang sering disebut tabulasi silang (cross tabulation atau
cross classification) adalah tabel yang berisi data jumlah atau frekuensi atau beberapa
klasifikasi (kategori). Cross tabulation yaitu suatu metode statistik yang menggambarkan
dua atau lebih variabel secara simultan dan hasilnya ditampilkan dalam bentuk tabel
yang merefleksikan distribusi bersama dua atau lebih variabel dengan jumlah kategori
yang terbatas (Agresti, 1990). Metode cross tabulation dapat menjawab hubungan antara
dua atau lebih variabel penelitian tetapi bukan hubungan sebab akibat. Semakin bertambah
jumlah variabel yang di tabulasikan maka semakin kompleks interpretasinya
Keuntungan Menggunakan Cross Tabulation
1. Mudah diinterpretasikan dan dimengerti oleh si pengambil keputusan yang tidak
mengerti statistik
2. Kejelasan informasi dapat mempermudah si pengambil keputusan untuk
melakukan sesuatu dengan benar
3. Dapat menginformasikan fenomena-fenomena yang ada secara lebih kompleks
daripada hanya menggunakan analisis variabel secara terpisah
Dua Variabel Cross Tabulation
1. Dapat disebut sebagai bivariate cross tabulation
2. Isi sel dari tabelnya dapat berupa count ataupun persentase kolom maupun baris
tergantung variabel mana yang menjadi variabel independennya
3. Jika variabel independennya pada kolom maka prosentasenya ke arah kolom
4. Apabila dua variabel tidak berposisi sebagai variabel independen maupun
dependen maka lebih baik menggunakan total prosentase.

Jika kedua variabel berskala diskret maka peneliti bisa membuat tabel
kontingensi untuk menguji apakah kedua variabel tsb independen. Tabel Kontingensi
RXC adalah sebagai berikut

2-4
Tabel 2.1 (a) Tabel Kontingensi rxc
(b) Peluang pada Tabel Kontingensi rxc

Lajur
Baris 1 2 .... c
1 n11 n12 ... n1c
2 n21 n22 .... n2c


r nr1 nr2 nrc
(a)

Lajur
Baris
B1 B2 .... Bc Total
A1 P11 P12 ... P1c P1.
A2 P21 P22 .... P2c P2.


Ar Pr1 Pr2 Prc P..=1
(b)

Tabel 2.1 sering disebut Tabel 2 Dimensi


nij = banyaknya individu yang termasuk dalam sel ke-i,j, (total pengamatan pada sel ke-
i,j, ) dengan i=1,2,...r dan j= 1, 2, ... c
Baris dan lajur mencerminkan 2 kejadian, misal :
baris = kebiasaan merokok,
lajur = penyakit jantung.
2.1 Uji Independensi
Uji independensi digunakan untuk mengetahui hubungan antara dua variabel
(Agresti, 1990). Setiap level atau kelas dari variabel variabel tersebut harus memenuhi
syarat sebagai berikut:
1. Homogen
Homogen adalah dalam setiap sel tersebut harus merupakan obyek yang sama.
Sehingga jika datanya heterogen tidak bisa dianalisis menggunakan tabel kontingensi.
2. Mutually Exclusive dan Mutually Exhaustive
Mutually exclusive (saling asing) adalah antara level satu dengan level yang lain harus
saling lepas (independen).

2-4
Mutually exhaustive merupakan dekomposisi secara lengkap sampai pada unit
terkecil. Sehingga jika mengklasifikasikan satu unsur, maka hanya dapat diklasifikasikan
dalam satu unit saja, atau dengan kata lain semua nilai harus masuk dalam klasifikasi
yang dilakukan.
3. Skala Nominal dan Skala Ordinal
Skala nominal adalah merupakan skala yang bersifat kategorikal atau klasifikasi,
skala tersebut dapat berfungsi untuk membedakan tetapi tidak merupakan hubungan
kuantitatif dan tingkatan. Jadi anggota dari kelas yang satu berbeda dengan anggota
dari kelas yang lainnya. Ciri ciri dari skala ini adalah posisi data setara dan tidak
bisa dilakukan operasi matematik. Contoh skala nominal yaitu laki-laki dan
perempuan, cacat dan tidak cacat, baik dan jelek, ya dan tidak. Skala ordinal adalah
merupakan skala yang bersifat kategorikal atau klasifikasi, skala ordinal ini
berfungsi membedakan dan berfungsi untuk menunjukkan adanya suatu urutan atau
tingkatan. Jadi skala menyatakan besaran yang berbeda atau membedakan urutan
bahwa yang satu lebih besar dari atau lebih kecil dari yang lainnya. Contoh dari
data ordinal yaitu (sangat memuaskan, memuaskan, biasa, tidak memuaskan, sangat
tidak memuaskan), (sangat setuju, setuju, biasa, tidak setuju, sangat tidak setuju),
(Sangat penting, penting, cukup, tidak penting, sangat tidak penting).
Hipotesis
H0 : Tidak ada hubungan antara dua variabel yang diamati
H1 : Ada hubungan antara dua variabel yang diamati
Uji statistik

X 2
n n O
ij Eij
2

i 1 j 1 Eij

Dimana :
Oij = Nilai observasi/pengamatan baris ke-i kolom ke-j
Eij = Nilai ekspektasi baris ke-i kolom ke-j

Tabel Kontingensi 2 x 2
Adalah kasus khusus dari Tabel kontingensi r x c. Jika terdapat 2 kejadian, yaitu
A dan B, dimana kejadian A terdiri dari A1 dan A2 serta kejadian B terdiri atas B1 dan B2.

2-4
Dengan demikian, setiap individu mungkin termasuk ke dalam salah satu dari 4
kategori:
A1B1
A1B2
A2B1
A2B2

2-4
Tabel 2.2 (a) Kejadian Populasi
(b) Kejadian Sampel
Individu A B Individu A B
1 A1 B1
1 A1 B1
2 A1 B2
2 A1 B2 3 A2 B1
3 A2 B1 4 A2 B1
4 A2 B1

N A1 B2
(a)

2-4

2-4
n A1 B2 (b)

Jika x dan y saling bebas maka P (x y) = P(x) P(y)


Jika x dan y tidak bebas maka P (x y) = P(x) P(y x)
Tabel Kontingensi 2x2 untuk Populasi dan Sampel adalah sebagai berikut
Tabel 2.3 (a) Tabel Kontingensi 2x2 untuk Populasi
(b) Tabel Kontingensi 2x2 untuk Sampel
Kejadian B1 B2 Total Kejadian B1 B2 Total
A1 N11 N12 N1. A1 n11 n12 n1.
A2 N21 N22 N2. A2 n21 n22 n2.
Total N.1 N.2 N.. Total n.1 n.2 n..
(a) (b)

Tabel kontingensi untuk populasi hampir tidak pernah diperoleh karena


dilakukan dengan mencacah semua anggota populasi. Sedangkan Tabel Kontingensi
untuk sampel dapat diperoleh. Tabel 2.3 (b) adalah rerpresentasi dari Tabel 2.3 (a) .
Tabel 2.3 (b) dapat digunakan untuk menarik kesimpulan tentang Tabel 2.3 (a). Jika
Tabel 2.3 (b) diperoleh, pertanyaan apa yang bisa dijawab? Tergantung pada bagaiman
cara memperoleh Tabel 2.3 (b).
Cara memperoleh Tabel 2.3 (b):
1. Mengambil sampel acak individu sebanyak n.. kemudian setiap individu
dikelaskan ke dalam 4 kategori tadi (fixed total).
2. Mengambil sampel acak sebanyak (n1. dan n2. ) atau (n.1 dan n.2 ) kemudian setiap
individu dikelaskan ke dalam kategori (B1/B2) atau (A1/A2) {fixed margin}.
Jika Tabel 2.3 (b) berasal dari cara 1, maka akan menjawab hubungan antara
kejadian A dan B, apakah A dan B bebas. Namun, jika Tabel 2.3 (b) berasal dari cara 2
menjawab perbedaan proporsi Bi pada kondisi A1 dan A2 , atau perbedaan proporsi Ai
pada kondisi B1 dan B2 (tergantung margin mana yang ditetapkan).
Pendekatan statistika keduanya persis sama. Perhatikan jika n.. ditetapkan, maka
pertanyaan selanjutnya apakah A dan B bebas?. Pertanyaan ini tidak dapat dijawab
dengan pasti jika kita tidak mengamati Tabel 2.3 (a). Jika A dan B bebas maka:
p11 = p1. x p.1
p12 = p1. x p.2

2-4
p21 = p2. x p.1 dan
p22 = p2. x p.2 , atau secara umum
Pij = pi. x p.j (2.3)
N ij N i. N . j
x , dengan catatan harus diketahui banyaknya populasi
N .. N .. N ..

Pij = pi. x p.j tidak dapat diperoleh jika Tabel 2.3 (a) tidak diperoleh.
nij ni . n. j
Pada Tabel 2.3 (b) : p ij , p i . , p . j
n.. n.. n..

Sehingga jika A dan B bebas maka seharusnya: p ij p i . x p . j . Untuk menilai


hampir sama perlu dilakukan pengujian, dengan Hipotesis:
H0: tidak ada hubungan antara A dan B (bebas) atau ( pij = pi. x p.j )
H1 : tada hubungan antara A dan B (bebas) atau ( pij pi. x p.j )
Jika H0 benar, maka isi sel (i,j) diharapkan
eij = n.. x p ij
i . xp
= n.. x p .j

ni . n. j ni. * n. j
= n.. x x =
n.. n.. n..

(2.4)
eij disebut frekuensi harapan.
Dasar pengujian adalah jika eij (harapan) tidak terlalu berbeda dengan nij
(kenyataan) maka H0 diterima, jika sebaliknya maka H0 ditolak. Perlu statistik uji untuk
menilai perbedaaan itu. Statistik uji yang dapat digunakan:
a. Pearson 2

I J



(nij m ij ) 2 n.. ( n11 n22 n12 n21 ) 2
=
2
= (2.5)
n1. n2. n.1n.2
mij
I 1 J 1
Sebaran dari Pearson 2 tidak pasti. Hanya saja bisa dibuktikan.
Jika n ij , maka 2 atau dapat disebut hit akan berdistribusi (1)
2 2

akan dihampiri oleh (1)


2
Jika nij sedang , maka hit
2

2-4
Jika nij kecil sekali, maka 2 hit ?? maka digunakan Uji Yates.

b. Yates (1934)
1
n.. (| n11 n22 n12 n 21 | n.. ) 2
hit =
2
2 berdistribusi 2 (1) (2.6)
n1. n2. n.1n.2

Jika ada sel (i,j) yang kecil, misal 5 maka 2 hit dan *2 hitung perlu dihindari
(karena hampirannya terlalu kasar).
c. Fisher
Fisher adalah Pengujian Eksak untuk menilai kebebasan ( H0: Pij = pi. x p.j ),
dengan cara sebagai berikut:
1. Mencari konfigurasi-konfigurasi tabel yang lebih ekstrim dari tabel yang kita
amati.
2. Menghitung nilai p dari tabel-tabel itu, sebut saja sebagai p1, p2, ......, pk.
n1. ! n 2. ! n.1 ! n.2 !
p= dimana n! = n(n-1)(n-2)...(1) (2.7)
n11 ! n12 ! n 21 ! n 22 ! n.. !

3. Nilai p dari tabel yang kita amati adalah penjumlahan nilai p1 p2 ... pk
nilai p dari tabel yang diamati

Seberapa jauh keeratan dari hubungan antara 2 kejadian (jika ada)?. Beberapa
ukuran yang dapat digunakan adalah sebagai berikut:
1. Yule
n11 n22 n12 n21
Q= untuk n , dengan Q berdistribusi Normal. (2.8)
n11 n22 n12 n21

Var (Q) =
1
4
1 Q2 n1
1

1

1

n12 n21 n22
(2.9)
11

Nilai Q berkisar antara -1 sampai 1 , jika Q = 0 maka tidak ada hubungan.


2. Nisbah Odds (Odds Ratio)
N 11 P
11 adalah odds dari A1 terhadap A2 pada kategori B1
N 21 P21

N 12 P12
adalah odds dari A1 terhadap A2 pada kategori B2
N 22 P22

2-4
P11 / P21 N 11 / N 12 N N

P12 / P22
= 11 22 , dengan 0 < <
N 12 / N 22 N 12 N 21

(2.10)
P11 P
jika = 1 maka 12
P21 P22

P12 P21 N * N 21
P11 = 12
P22 N 22 * N ....

N i .. N . j
Pij =Pi. x P.j = *
N .. N ..

N i1 N i 2 N 1j N2 j
= x (2.11)
N.. N ..

loge odds = loge , dengan - < <


Pertanyaan selanjutnya ialah:

1. Seberapa jauh sebaran 2 hit mendekati 2 (1) demikian pula *2 hit ?

2. Dapatkah kita menghindari penggunan 2 hit atau *2 hit dalam pengujian?



3. Bagaimana sebaran dari ?

Mungkinkah dilakukan simulasi? (untuk menjawab 3 hal di atas) dapat dilakukan


Bootstrap

2.2 Bootstrap (Efron, 1979)


1. Misalkan F adalah sebaran empirik dari segugus data D = {x1,x2,.......,xn}, F
memberikan bobot sama sebesar 1/n bagi masing-masing data xi.
2. Menggunakan bilangan acak (random numbers) untuk menarik contoh
berukuran n dari D dengan pemulihan, sehingga setiap pengamatan pada contoh
ini merupakan unsur dari D dan bersifat bebas satu sama lain.
3. Menghitung statistik yang diperlukan, misal * , dari contoh yang baru ini.
4. Mengulang langkah (2) dan (3) sebanyak N kali. Catat hasilnya sebagai *1 ,
*2 ,......., *n , pada sebaran normal p( - < + ) = 68%

2-4
Tabel 2.4 Tabel Kontingensi 2x2
B1 B2
A1 P11 P12 P1.
A2 P21 P22 P2.
P.1 P.2 P.. =1

P11 / P21 P11 P22


Nisbah odds = =
P12 / P22 P12 P21

Jika A dan B bebas, maka untuk setiap i dan j, Pij = P1. P.j
Sehingga P11 = P1. P.1 dan P12 = P1. P.2 , Jadi, jika A dan B bebas maka nisbah odds = 1

2.3 Risiko Nisbi (Relative Risk)


Adalah Perbandingan antara proporsi individu yang termasuk kategori A1, jika
diketahui termasuk kategori B1 dengan proporsi A1 jika diketahui termasuk kategori B2
atau perbandingan antara proporsi individu yang termasuk kategori B1 jika diketahui A1
dengan proporsi B1 jika diketahui A2
P1 1 P2 1
Risiko Nisbi = P atau P (2.12)
12 2 2


P
P
11 21
=
RN atau

P P2 2
12

(2.13)
Pada Tabel 2.4, peluang suatu individu termasuk ke dalam kategori A 1B1, A1B2,
A2B1 atau A2B2 masing-masing berturut-turut P11, P12, P21, P22. Secara Teoritis akan
mengikuti model multinomial.
Jika X = individu maka P(x A1B1 ) = P11
P(x A2 B2 ) = P22
nij = banyaknya individu yang termasuk dalam kategori AiBj
Maka nij Multinomial (n.. ; P11,P12,P21,P22)
nij
Peluang kita mengamati sebanyak nij individu pada kategori AiBj adalah Pij

2.4 Fungsi Kemungkinan (Likelihood)

2-4
n
L( ) = f(x; )
i 1

n
= P(Xi=x, )
i1

(2.14)
Untuk Tabel 2.4
L(Pij) = P11 n11
P12 n P21 n P22 n
12 21 22

=
j 1
i1
2 2
Pij nij

Jika fungsi L(Pij) atau ln L(Pij) dimaksimumkan terhadap Pij kita dapatkan penduga

nij
kemungkinan maksimum dari Pij. Pij =
n..

Kebebasan antara baris dengan lajur pada Tabel 2.4, dapat di uji pula (selain uji

n eij
2


2 ij
hit = ) dengan memanfaatkan fungsi kemungkinan.
eij

2-4
2.5 Uji Nisbah Kemungkinan (Likelihood Ratio Test)
Prinsip:
Untuk H0 dan H1 tertentu maksimum Fungsi Kemungkinan (FK) dalam 2
keadaan, yaitu dalam keadaan H0 benar dan dalam sembarang keadaan
(apakah H0 benar atau tidak)
Ambil nisbah dari 2 nilai maksimum tersebut, sebut sebagai (0< <1)

Besaran disebut nisbah kemungkinan dan -2 log


2
( db )

Jika -2 log ada di daerah penolakan maka H0 ditolak.


Db adalah selisih antara par bebas pada keadaan H0 benar dengan par bebas pada
keadaan umum (H0 benar atau salah)

P =
ni . n. j
Pada Tabel 2.4, Jika H0 benar maka Pij = Pi. .j , sehingga Fungsi
n..2
Kemungkinannya adalah
n11 n12 n21 n22

L( Pij H0 benar) = P 11

P12

P21

P 22

n11 n12 n21 n22


n n n1. n.2 n2. n.1 n2. n.2
= 1. 2.1
n2



n2

n2


n.. .. .. ..
(2.15)
Secara umum Fungsi Kemungkinan adalah sebagai berikut
n11 n12 n21 n22
1
FK : 2



n n
1. .1 n n1. n.2 n n2. n.1 n n2. n.2 n
11 12 21 22

n..
(2.16)
n11 n12 n21 n 22

L( Pij ) = P 11

P12

P21

P 22

n11 n12 n21 n 22
n n12 n 21 n22
= 11


n



n



n

n.. .. .. ..
n11 n12 n 21 n 22
1
=


n
11 n n12 n n21 n n2 2 n .
11 12 21 22

n..

2-4
Nisbah Kemungkinannya adalah sebagai berikut

L P ij H 0benar n1.n.1 n n1.n.2 n n2.n.1 n n2.n.2 n
11 12 21 22

n.. n11 n12 n21 n22


=
n ..n n n11 n 12 21 22
L( P ij )

n n
2 2
nij
i. .j
i 1 j 1
= (2.17)
n
2 2
n.. nij
n.. ij
i 1 j 1


-2 log = 2 ln nij ln eij
2 2 2 2
n n ij ij

i 1 j 1 i 1 j 1


= 2 nij ln nij nij ln eij
i j i j
nij
= 2 nij ln ~ 2(db)

i j eij
derajat bebas
db umum (3 bebas)
db H0 benar (2 bebas)
Sehingga db = 1
Statistik uji kemungkinan maksimum (G2)
G2 = -2 log ~ 2(1)
n
=2 n ij ln ij
e


i j ij

= 2 nij ln nij ni . ln ni . n. j ln n. j n.. ln n..
i j i j

(2.18)

2.6 Pemecahan Sumber-sumber Ketakbebasan


Jika pada Tabel kontingensi r x c (Tabel 2.1), didapatkan hasil bahwa antara baris
dan lajur tidak bebas, maka penyebabnya ada 2 kemungkinan, yakni:
1. Seluruhnya (sebagian besar) sel i , j
2. Satu atau dua sel i, j saja

2-4
oleh karena itu seringkali diperlukan pemecahan sumber-sumber ketakbebasan.
Prinsip : jika peubah acak x ~ 2(a) dan y~ 2(b) , x dan y bebas maka (x+y) ~ 2(a+b)
Tabel asal dapat dipecah menjadi beberapa sub tabel yang bebas satu sama lain.
Cara memecahnya tidak unik (bermacam-macam). Ada patokan yang bisa diikuti agar
subtabel-subtabel itu bebas, sebagai berikut:
1. Jika db dari tabel asal sebesar c maka banyaknya subtabel yang bisa dibuat tidak
mungkin lebih besar dari dari c.
2. Frekuensi pada setiap sel hanya ada pada satu sub tabel saja; artinya jika isi sel
(i,j) pada subtabel x maka nilai x ini tidak akan ditemui pada sub tabel yang lain
3. Setiap total marginal dari subtabel pasti muncul sebagai frekuensi sel pada
subtabel lainnya atau sebagai total marginal dari tabel asal.
Artinya setelah kita pecah, secara umum antara A dan B bebas, kecuali jika A1 dan
B1 dipertimbangkan. Dengan kata lain jika diketahui individu termasuk B2, B3 atau B4
maka kemungkinan bahwa individu ini juga termasuk ke dalam kategori A 2 atau A3
memiliki peluang yang sama. Tetapi jika diketahui suatu individu masuk kategori B 1
maka ia berpeluang besar untuk juga masuk ke dalam kategori A1

2.7 Ukuran Keeratan


1. Statistik b
Digunakan untuk membandingkan keadaan sebagai berikut: jika suatu individu
dipilih secara acak dari populasi dan kita diminta untuk menebak termasuk kategori B
(B1, B2, .....), manakah individu tersebut .
a. Tanpa keterangan tambahan, atau
b. Dengan keterangan mengenai kategori dari A.
Dari kedua hal tersebut, yang mana yang terbaik, tergantung apakah A dan B
saling bebas atau tidak. Jika A dan B bebas, maka tebakan kita sama saja kualitasnya
pada keadaan (a) atau (b). Jika A dan B tidak bebas maka tebakan kita kualitasnya akan
meningkat pada keadaan (b).
Statistik b mengukur seberapa besar peningkatan kualitas tebakan pada keadaan
(b).

2-4
n im n.m
b = 1 (2.19)
n.. n.m

dimana nim = maksimum nij pada baris ke i


n.m = maksimum n.j

2. Statistik a
Serupa dengan b , kecuali merupakan perbaikan kualitas tebakan terhadap kategori
A1, A2,..... jika kategori B nya (B1, B2,...) diketahui.

n mj n m.
a = j (2.20)
n.. n m.

dimana nmj = maksimum nij pada lajur ke j


nm. = maksimum ni.

Contoh :
1. Dalam suatu penelitian perusahaan, sejumlah data dikumpulkan untuk
menentukan apakah proporsi barang yang cacat (A) yang dhasilkan oleh
karyawan sama untuk giliran shift pagi, sore atau malam (B). data berikut
menggambarkan barang yang diproduksi yang cacat untuk shift pagi, sore atau
malam. Berikan kesimpulan anda. Tuliskan H0 dan H1 serta statistik ujinya
dengan Likelihood ratio (G2), gunakan 0.025.

Tabel 2.5 Hubungan Shift dan Proporsi Cacatan

shift pagi sore malam


cacat 45 55 70
tidak cacat 905 890 870

Penyelesaian:
H0 : Tidak ada hubungan antara proporsi barang yang cacat dengan shift
H1 : Ada hubungan antara proporsi barang yang cacat dengan shift
: 0.05

2-4
Shift Pagi Sore Malam
Cacat 46 (56.97) 55 (56.67) 70 (56.37) 170
Tidak cacat 905 (893.03) 890 (888.33) 870 (883.63) 2665
950 945 940

nij
G 2 2 ln
e
i j ij

45 55 870
2 45 ln 55 ln ... 870 ln
56.97 56.67 883.63
2 3.097

6.194
02.025( 2 ) 3.378

Kesimpulan: Karena G 0.025( 2 ) , maka terima H0 artinya tidak ada hubungan


2 2

antara proporsi barang yang cacat dengan shift. Dengan kata lain, proporsi
barang yang cacat yang dihasilkan karyawan adalah sama untuk giliran shift
pagi, sore, atau malam.

2. Tunjukkan bahwa jika odds ratio=1 maka hubungan antara dua kejadian tidak
nyata.
Misalkan Pada Tabel 2x2

B1 B2
A1 P11 P12 P1.
A2 P21 P22 P2.
P.1 P.2 P..

OR=1
P11 / P21
1
P12 / P22

P11 P
12
P21 P22

P12 P21
P11
P22

2-4
N12 N 21
x
N.. N.. N N
P11 12 21
N 22 N 22 N..
N..
(1)
Jika 1 , maka berlaku pula
N11 / N 21

N12 / N 22

N 11 / N 21
1
N 12 / N 22

N 12 N
11
N 22 N 21

N 12 N 21
N 22
N 11

(2)
Jika persamaan (2) disubtitusikan ke persamaan (1) maka diperoleh
N 12 N 21 N
P11 11
N 12 N 21 N ..
N ..
N 11
N 11 N ..

N .. N ..
N 11 N 11 N 12 N 21 N 22

N ..2
N 11 N 11 N 11 N 12 N 11 N 21 N 11 N 22

N ..2
N N N N
11 12 x 11 21
N .. N ..
N N
1. x . 1
N .. N ..
P11 P1. P.1
Jadi, jika odds ratio =1 maka hubungan antara dua kejadian tidak nyata (saling
bebas).

2-4
3. Apa beda statistik uji Pearson, Yates, dan Fisher untuk Tabel Kontingensi 2x2?
Penyelesaian:
Statistik Uji Pearson dan Yates sama-sama diturunkan dari konsep
probabilitas dan berdistribusi 2 . Namun statistik uji Yates lebih cepat

konvergen menuju (1) karena adanya koreksi terhadap statistik uji Pearson..
2

Sedangkan Fisher adalah uji eksak, sehingga langsung dapat diperoleh nilai P-
value untuk mengambil keputusan menerima atau menolak H0. Selain itu

statistik uji Fisher digunakan jika ada sel (i,j) yang frekuensinya kecil nij 5

2.8 Latihan Soal


1. Apa perbedaan dan persamaan antara statistik uji 2 dan G2?
2. Apa yang dimaksud dengan Risiko Nisbi? dan Apa bedanya dengan Odds Ratio?
3. Diberikan tabel kontingensi sebagai berikut:
Tabel 2.6 Hubungaan Penderita Kanker dan Pemakaian Pil KB
Mengidap Kanker
Pil KB
Ya Tidak Total
Ya 23 34 57
Tidak 35 132 167
Total 58 166 224

Apakah ada hubungan antara minum PIL KB dengan penyakit Kanker?


4. Diberikan tabel kontingensi sebagai berikut:
Tabel 2.7 Kebiasaan meminum aspirin dan gangguan jantung
Terkena Serangan Tidak Terkena
Pil (Tablet) Total
Jantung (B1) Serangan Jantung (B2)
Aspirin 104 10933 11037
Netral/Placeto 189 10845 11034
Total 293 21778 22071

Hitunglah Resiko Nisbi, Odds Ratio, kemudian interpretasikan hasilnya.

2-4
5. Diberikan Tabel Kontingensi sebagai berikut.
Tabel 2.8 Hubungan Variabel A dan B
B1 B2 B3 B4
A1 13 13 12 22
A2 4 24 28 34
A3 3 8 15 24

Lakukan pemecahan sumber-sumber penyebab ketakbebasan kemudian


interpretasikan hasilnya.

10. Seorang manager perusahaan ingin melihat apakah ada hubungan atau pengaruh
antara income dan kepuasan seorang karyawan perusahaannya. Kemudian ia
juga ingin tahu pula kategori mana yang menyebabkan berpengaruh. Gunakan
0.1
Tabel 2.9 Hubungan Income dan Tingkat Kepuasan
Income tidak puas biasa puas
x<6000 45 15 23
6000<x<15000 10 12 10
15.000<x<25.000 10 11 13
x>25000 22 15 46

11. Penelitian terhadap 12 perusahaan dengan fasilitas di suatu propinsi ternyata 10


melunasi pajak tepat waktu, sedangkan dari 15 perusahaan tanpa fasilitas,
terdapat 6 perusahaan yang tidak tepat waktu dalam melunasi pajaknya.
Tabel 2.10 Hubungan Income dan Tingkat Kepuasan
Pemberian Tepat Waktu
Fasilitas Ya Tidak
Dengan Fasilitas 10 2
Tanpa Fasilitas 9 6

Gunakan 0.05 , apakah ada hubungan antara pemberian fasilitas ke


perusahaan terhadap ketepatan dalam melunasi pajak.

2-4
Supplement

I. Tabel Kontingensi 2 x 2
Variabel katagorik yang hanya meliputi dua katagori dinamakan variabel biner,
misalnya terserangnya kanker paru-paru seperti pada ilustrasi tabel dibawah (terserang
atau tidak), hasil dari suatu tindakan (berhasil atau tidak) atau kebiasaan merokok
malam dan yang tidak memiliki kebiasaan merokok malam. Sehubungan dengan
variabel biner ini seringkali diperbandingkan antara beberapa kelompok individu; pada
ilustrasi tsb misalnya, ingin dibandingkan antara proporsi serangan kanker pada
kelompok yang memiliki kebiasaan merokok malam dan yang tidak memiliki kebiasaan
tersebut. Jika ada dua kelompok, distribusi nilai variabel biner ini dapat disajikan pada
suatu tabel kontingensi 2 x 2. Nilai variabel biner (Q=kanker paru-paru) dapat
dinyatakan sebagai 1 untuk nilai katagori yang satu, dan 2 untuk nilai katagori lainnya;
misalnya 1 untuk terserang kanker paru-paru dan 2 untuk tidak terserang, variabel biner
lainnya (P= kebiasaan merokok) 1 untuk kelompok yang memiliki kebiasaan merokok
malam dan 2 untuk kelompok yang tidak memiliki kebiasaan tersebut. Selanjutnya tabel
2x2 dapat disusun menjadi 4 sel seperti Tabel 1.
Tabel 1: Tabel 2 x 2 Secara Umum
Q
P Total
1 2
1 a = n11 b = n21 a + b = n1
2 c = n21 d = n22 c + d = n2
Total a + c = n1 b + d = n2 a+b+c+d=N

Untuk tabel kontingensi 2 x 2, statistik uji x2 (digunakan untuk menguji hipotesis bahwa
tidak ada keterkaitan antara terserang kanker paru-paru, variabel Q dengan kebiasaan
merokok malam hari, variabel P ) dapat dihitung dengan persamaan :
N (ad bc ) 2
2
(a c)(b d )(a b)(c d )

Hasil ini nantinya dibandingkan dengan tabel distribusi x2 jika nilai x2 hitung > x2 tabel
maka hipotesis ditolak artinya ada hubungan antara variabel Q (kanker paru-paru)
dengan variabel P (kebiasaan merokok)

2-4
Seandainya setelah diambil sampel sebanyak 56 orang dengan rincian yang merokok
malam 36 orang sisanya 20 orang tidak punya kebiasaan tsb sedangkan yang terserang
kanker ada 26 orang yang tidak kena kanker 30 orang, diperoleh data nilai frekuensi
sampel masing-masing sel adalah sbb :
Tabel 2 : Tabel Hubungan antara Terserang Kanker Paru-Paru dengan
Kebiasaan Merokok di Malam Hari

Q
P Total
1=terserang kanker paru2 2=tidak terserang kanker
1= kebiasaan
merokok malam a = n11=20 b = n21=16 36
hari
2=tidak biasa
merokok malam c = n21=6 d = n22=14 20
hari
Total 26 30 56

Nilai statistik uji untuk tabel kontingensi 2 x 2 pada ilustrasi pada tabel 2 dapat dihitung
dengan persamaan yang lebih sederhana :
N ( ad bc ) 2 56( 20 )(14 ) ( 16 )( 6 ) 2
2 3.376
( a c )( b d )( a b )( c d ) ( 26 )( 30 )( 36 )( 20 )

1.1 Nilai Q-Yule


Untuk tabel kontingensi 2 x 2, nilai Q menunjukkan kuatnya keterkaitan. Nilai Q ini
dikenal juga sebagai nilai Q-Yule, diajukan oleh Yule (1900; dalam Daniel,1990).
ad bc
Q
ad bc

Nilai Q-Yule merentang dari -1 sampai +1, dengan nol berarti antara kedua variabel
saling bebas. Nilai Q-Yule yang semakin dekat dengan -1 atau +1 menunjukkan
keterkaitan yang semakin kuat.
Contoh :
Nilai Q-Yule untuk tabel kontingensi 2 x 2 pada ilustrasi tabel 2 :
ad bc ( 20 )( 14 ) ( 16 )( 6 )
Q 0.489
ad bc ( 20 )( 14 ) ( 16 )( 6 )

2-4
1.2. Angka Odds
Untuk individu-individu yang berada pada baris i, menyatakan 1 i sebagai peluang

bahwa individu tersebut terkatagori 1, dan ( ( 1 i , 2 i ) ( 1 i ,1 1 i ) ) sebagai


distribusi peluang bersyarat variabel biner tersebut. Pembandingan antara kedua baris,
baris 1 dengan baris 2, dapat dinyatakan sebagai selisih katagori 1, 11 - .
12

Pembandingan proporsi katagori 2 adalah ekuivalen, yaitu


2 1 2 2 ( 1 11 ) ( 1 1 2 ) 11 1 2

Selisih proporsi ini nilainya akan berkisar antar -1 dan +1, bernilai 0 jika baris 1 dan
baris 2 identik. Variabel katagorik tersebut dikatakan bebas sehubungan dengan
pengelompokan menurut baris jika 11 1 2 = 0.
Rasio Odds. Odds adalah ukuran yang menunjukkan perbandingan peluang munculnya
suatu kejadian dengan peluang tidak munculnya kejadian tersebut. Odds suatu kejadian
A misalnya dihitung dengan membagi peluang kejadian A dengan peluang kejadian
bukan A.
P( A ) P( A )
( A )
P( A ) 1 P( A )

Untuk tabel kontingensi 2 x 2, Odds katagori 1 pada baris 1 dan baris 2 masing-masing
dihitung sebagai
11 11 1 2 1 2
1 dan 2
1 11 2 1 1 1 2 2 2

Apabila kedua katagori, baris dan kolom, berupa variabel acak, odds katagori 1 pada
baris 1 dan baris 2 masing-masing adalah

1 11 dan 2 21
12 22

Selanjutnya, rasio antara odds 1 dan odds 2 ,


1 11 12 11 22

2 21 22 2112

dinamakan rasio odds.

2-4
Nilai rasio odds berkisar antara 0 dan . Apabila katagori baris dan katagori kolom
saling bebas, maka nilai rasio odds adalah 1. Apabila nilai rasio odds lebih dari 1, 1<<
, berarti individu-individu pada baris pertama lebih besar kemungkinannya bernilai
katagori 1 daripada individu-individu pada baris kedua; yaitu 11 1 2 . Apabila rasio
odds kurang dari 1, 0<<1, berarti individu-individu pada baris pertama lebih kecil
kemungkinannya bernilai katagori 1 daripada individu-individu pada baris kedua; yaitu
11 1 2 . Rasio odds tidak berubah apabila baris dan kolom tabel kontingensi
dipertukarkan.
Semakin jauh nilai rasio odds, , dari angka 1 pada arah tertentu berarti
keterkaitan antara katagori baris dan kolom semakin kuat. Dua nilai rasio odds, 1 dan
2, menunjukkan tingkat keterkaitan yang sama apabila nilai yang satu merupakan
kebalikan dari nilai kedua, 1 = 1/2 ; 1=0.25 dan 2= 4.0 misalnya menunjukkan
tingkat keterkaitan yang sama. Jika urutan baris atau kolom dipertukarkan, nilai rasio
odds yang baru akan sama dengan seper nilai rasio odds yang lama. Jika diambil
logaritma dari rasio odds, ln (), logaritma rasio odds untuk 2 rasio odds yang memiliki
tingkat keterkaitan yang sama ini memiliki angka yang sama hanya berbeda tanda;
ln(0.25) = -1.39, ln(4) = 1.39, ln(1) = 0 menunjukkan kebebasan antara katagori baris
dan katagori kolom.
Untuk frekuensi sampel, statistik rasio odds dihitung sebagai n11n22 n12 n21 .
Rasio odds ini tidak berubah apabila kedua sel dalam baris dikalikan dengan suatu
bilangan tidak nol. Demikian pula apabila kedua sel dalam kolom dikalikan dengan
bilangan tak nol.
Hal ini menunjukkan sifat invarian atas perkalian, sehingga rasio odds sampel
tetap merupakan penduga bagi parameter meskipun sampel yang digunakan tidak
proporsional. Untuk persampelan retrospektif untuk keterkaitan antara aplikasi vaksin
dengan keterserangan penyakit misalnya, rasio odds tetap merupakan penduga bagi ,
meskipun misalnya untuk keperluan tersebut dipilih masing-masing 100 orang yang
mendapat serangan dan tidak mendapat serangan untuk kemudian diketetapkan
memakai atau tidak memakai vaksin, atau dipilih 150 pengamatan untuk yang terserang
dan 50 untuk yang tidak terserang. Selanjutnya, rasio odds sama baiknya, baik

2-4
persampelannya retrospektif, atau prospektif, yaitu dengan memiliki 100 yang
menggunakan vaksin dan 100 yang tidak menggunakan untuk kemudian diperiksa
apakah terserang atau tidak terserang, atau kros seksi, yaitu dengan memilih 200 orang
yang kemudian diperiksa apakah ia menggunakan vaksin dan apakah ia terserang
penyakit.
Contoh :
Untuk tabel kontingensi pada tabel 2, odds baris 1, odds baris 2, dan rasio odds baris 1
pada odds baris 2 masing-masing adalah :

n11 20 1.25
1
n12 16
n 21 6 0.43
2
n 22 14
1 n11 n 22 ( 20 )( 14 )
2.92
2 n 21n12 ( 6 )( 16 )

1 = 1.25 menunjukkan bahwa pada kelompok yang merokok malam hari, peluang

terserang kanker paru-paru adalah 1.25 kali peluang tidak terserang. 2 = 0.43
menunjukkan bahwa pada kelompok yang tidak merokok malam hari, peluang
terserang kanker paru-paru adalah 0.43 kali peluang tidak terserang.
Dengan nilai rasio odds 1 / 2 lebih dari 1, menunjukkan bahwa individu-individu
yang biasa merokok malam hari lebih besar kemungkinannya bernilai terserang kanker
paru-paru dari pada individu-individu yang tidak biasa merokok malam hari.
ln ln( 2.92 ) 1.072 .

2-4

Anda mungkin juga menyukai