Anda di halaman 1dari 43

Pendahuluan

Pada bab ini akan kita bahas yang secara


umum berkaitan dengan data berbentuk
kategori. Data sampel dapat berbentuk
kualitatif misalnya sehat -sakit , baik – buruk.
Data sampel dapat berbentuk kuantitatif,
contoh, informasi nilai ujian mahasiswa dalam
bentuk kategorik (76-100) nilai A (70- 760) B
dan seterusnya statistik inferensial untuk data
kategori biasanya dianalisis dengan
menggunakan uji khi kuadrat
Kita akan membahas prosedur penarikan
kesimpulan dari populasi dengan proporsi
tunggal sampai dengan melibatkan dua atau
lebih proporsi dalam populasi. Sebagai contoh
kita ingin membandingkan proporsi dari
pelanggan untuk produksi berbagai barang.
Berdasarkan data sampel kita dapat menarik
kesimpulan bahwa pelanggan lebih suka pada
barang tertentu daripada barang lainnya?
Kita akan membahas hbungan antara du variabel
yang hasilnya berbentuk kategori
Sebagai contoh apakah terdapat perbedaan
antara vaksin dengan plasebo, seorang profesor
ingin mengetahui apakah terdapat hubungan
antara merokok dengan kejadian kanker paru.
Metode untuk pembahasan kasus-kasus
semacam ini digunakan analisis kontingensi tabel
dua arah. Tujuan dari analisis kontingensi tabel
adalah untuk menentukan apakah dua variabel
dapat dipandang independen satu sama lain dan
karenanya tidak berhubungan .
Perhatikan contoh seorang analisis pemasaran ingin
menentukan bahwa proporsi pelanggan terhadap jasa
pelayanan rumah sakit yang berasal dari berbagai daerah
adalah sama. Jika beberapa daerah lebih banyak
pelanggan terhadap rumah sakit dari pada lainnya hal ini
dapat mempengaruhi strategi pemasarannya
A B C D E Total
13 7 12 8 10 50

Diketahui bahwa dari 50 data ada 13 dari daerah A dan


7 dari B hal ini menunjukkan bahwa lebih banyak
pelanggan yang berasal dari daerah A dari daerh B. ,
atau mungkin hal ini hanya disebabkan kebetulan saja ?
Dalam statistik terapan, disarankan membuat
grafik data sebelum dianalisis lebih lanjut, dgn
statistik inferensial. Total n= 50 asumsi distribusi
sama akan berimplikasi bahwa proporsi dari total
untuk sembarang jenis daerah akan sama dgn
setiap daerah dikarenakan sampling acak, jadi
untuk daerah tertentu kita menharapkan
mengamati 20% dari total pelanggan. Distribusi
binomial menentukan nilai harapan masing-
masing daerah berdistribusi sama
µ = np = (50)(0,2) = 10
A B C D E Total
Pengamatan 13 7 12 8 10 50
Harapan 10 10 10 10 10 50

Kita dapat memperoleh gambaran lebih


jelas dengan membuat grafik data sampel
Kita menbandingkan pengamatan dan nilai
harapan dari pelanggan untuk masing-masing
kelima daerah. Apakah anda menyakini adanya
perbedaan nilai justru disebabkan oleh sampling
acak atau bukan? Meskipun jumlah pengamatan A
dan C nampak lebih besar dari nilai harapan, dan
untuk B dan D nampak jumlah pengamatan lebih
rendah . Karena kita hanya mempertimbangankan
sampel berukuran n=50 yang relatif kecil
Distribusi populasi yang sama berarti
P1=P2=P3=P4=P5=0,2
Kita dapat menyatakan hipotesis nol
sebagai berikut H0= P1=P2=P3=P4=P5=0,2
Ha= Paling sedikit satu Pi berbeda dari yang
lainnya
Sekarang jika hipotesis nol benar, nilai nilai
harapan untuk setiap jenis daerah adalah
(50)(0,2)=10 karena proporsi sama dengan
0,2 berdasarkan hipotesis nol
Diharapkan bahwa statistik mempunyai nilai nol
apabila pengamatan dan nilai harapan sesuai
secara sempurna dan akan bernilai besar apabila
terjadinya. Karena itu besarnya nilai statistik yang
dihasilkan dan kecilnya nilai p-value menunjukkan.
Bahwa bukti sampel berkontradisksi dengan
hipotesis nol.
Marilah sekarang kita mengembangkan
statistiknya. Apabila Oi adalah jumlah pengamatan
yang terjadi untuk kategori ke i (jenis daerah) dan
misalkan Ei berpadanan dengan jumlah harapan
yang terjadi. Untuk kategori (lima jenis daerah),
statistik kebaikan suai diberikan oleh
2
k
(Oi  E i )

i 1 E 2

Teori statistik menunjukkan bahwa, jika setiap


nilai harapan yang terjadi Ei paling sedikit 5,
distribusi sampling statistik kebaikan suai diatas
dapat dihampiri dengan distribusi khi-kuadrat
dengan K-1 derajat bebas. Jika salah satu nilai
harapan kurang dari 5. Pemakai distribusi khi-
kuadrat harus dihindarkan.
Statistik kebaikan suai di atas mensyaratkan tiga langkah
berikut untuk menentukan nilai statistik :
Langka-langka untuk menghitung nilai statistik kebaikan
suai
1.Untuk setiap k kategori, kuadratkan selisih antara
frekuensi pengamatan dan nilai harapan (Oi-Ei)²
2.Bagi masing-masing selisih kuadrat dengan frekuensi
harapan untuk kategori itu .
OI  E I 
2

E
3. Jumlah ke k besaran dalam langkah dua
Statistik kebaikan suai diatas dinamakan pearson khi-
kuadrat statistik kebaikan-suai. Catatan bahwa karena ia
merupakan jumlah besaran kuadrat maka nilainya tidak
pernah negatif. Nilai sempurna antara pengamatan dan
harapan, maka statistik bernilai 0
Nilai statistik kebaikan suai adalah
13  102  7  102  12  102  7  102  10  102  2
10 10 10 10 10
Ternyata hipotesis nol tidak kontradiksi. Dari teori
statistika diketahui bahwa nilai harapan dari variabel acak
khi-kuadrat sama dengan nilai derajat bebasnya. Dalam
hal ini nilai harapananya adalah 4. tetapi nilai
pengamatan dari statistik khi-kuadrat
Nilai pengamatan dari statistik khi-kuadrat adalah 2,6 yang
menyatakan tidak ada dukungan untuk menolak hipotesis
nol. Marilah kita pertegas penalaran ini dengan
menentukan nilai p-value. Karena k-1 = 4 derajat bebas, p-
value diilustrasikan seperti pada gambar 12.2 di bawah ini
P-value = P(X24>2,6) =0,6268
Khi Kuadrat (X²) digunakan untuk menguji
hipotesis komparattif dua sampel bila
datanya nominal dan ukur sampel besar.
Tabel kontingensi 2 x 2
Variabel Variabel Total
1 2

1 a b a+b
2 c d c+d
a+c b+d a+b+c+d

Menguji hipotesis nol terhadap dua


variabel independen
Test hipotesis
N ad  bc 
2
2
X 
(a  b)(c  d )(a  c)  (b  d )
Mengetahui hipotesis nol pada independen uji
statistik distribusi khi – kuadrat dengan 1 derajat
kebebasan
Contoh kasus uji coba obat secara klinis efek
obat sulphinpyrazone untuk mencegah
kematian setelh terjadi infark myocardial
tertarik untuk melihat efek obat untuk
mengurangi angka kematian, dengan
menggunakan uji khi-kuadrat untuk melihat
perbedaan proporsi angka kematian dengan
pasien yang diberi placebo
Data hasil penelitian tabel 1.
Deaths Survivors Total
Sulphinpyrazone 41 692 733
placebo 60 682 742
101 1374 1475

147541.682  692.60
2
2
X   3,59
(101)(1374)(733)(1374)

X² = 3,59 df =1 test gagal menolak hipotesis nol


pada taraf significan 5%
Testing for Indepence in an r x c Contingency
table
The general r x c contingency table can be written

Variable 1 ........ c Total


Row variable 1 n1.1 ....... n1c n1
2 n2.1 ....... n2c n2
3 ...... ........ ....... .......
4 ....... ........ ........ .......
r nr1 ........ nrc n2
n.1 ........ n.2 N
Untuk mengetahui hipotesis nol baris x kolom
yang independen untuk menghitung nilai duga
atau harapan (nilai expectasi) Eij untuk sel i.
n.i .n. j
E ij 
N
Untuk test statistik khi kuadrat adalah
r c n  Eij 
X 2
  
i 1 i 1
ij

Eij

Hipotesis nol benar distribusi X² dengan derajat (r-1) (c-1)


Contoh kasus suatu penelitian ingin mengetahui
perbedaan klasifikasi setelah mendapat treatmen selama
3 bulan terhadap 538 paisen penyakit Hodgkin data di
sajikan sebagai berikut

Response
Histological
Total
Type Positif Parsial None
LP 74 18 12 104
NS 68 16 12 96
MC 154 54 58 266
LD 18 10 44 72
Total 314 98 126 538
Hipotesis yang diuji adalah
H0 = Tidak ada hubungan antara penggunaan seat
belt dan tingkat kecelakaan

Jenis Pengendalian/seat belt


Tingkat
kecelakaan Kadang 2 digunakan Tidak Σ
Tidak apa-apa 75 60 65 200
Minor 160 115 175 450
Mayor 100 65 135 300
Meninggal 15 10 25 50
  350 250 400 1000
PD1BS PD2BS PD3BS PD4BS

PD1B PD2B PD3B PD4B


H0 = PD1S = PD2S = PD3S = PD4S
PD1J PD2J PD3J PD4J
DESA A B C D Σ
BAIK SEKALI 60 70 50 40 220
BAIK 40 80 30 20 170
SEDANG 70 20 40 80 210
JELEK 10 15 50 100 175
  180 185 170 240 775
Taraf signifikansi yang digunakan Alfa (ά) 5%
Derajat Bebas = (R-1) (C-1)
= (4-1) (3-1)
=6
Maka X2h Tabel dengan ά 5% dengan Db 6 nilai tabel
12,5916
X2
Tingkat keeratan hubungan C 
n.t

C = nilai koefisien
X² = nilai khikuadrat
T = adalah bilangan terkecil dari (c-1) atau (r-1)
oleh Creamer ini dapat mencapai satu
Uji Pasti fisher
Kadang – kadang kita menpunyai data yang dapat
disederhanakan kedalam tabel kontingensi 2x2 tetapi
data ini berasal dari sampel yang berukuran kecil. Uji
kuadrat bukanlah metode yang sesuai untuk
menganalisis data semacam ini jika persayaratan
frekuensi minimun tidak terpenuhi. Jika sebagai
contoh n kurang dari 20 atau n antara 20 dan 40 dan
salah satu frekuensi harapannya kurang dari 5 uji
khikuadrat harus di hinadari tidak dipenuhi si
sarangkan oleh fisher. Dengan uji pasti fisher karena
kita menghitung peluang yang pasti dari pengamatan
atau hasil meskipun bersifat ekstrem.
Rumus dasar untuk pengujian fisher
( a  b)!( a  c )!(c  d )!(b  d )
p
a!b! c! d ! n!

Data hasil pengamatan

Kelompok Gelap Terang Jumlah


Birokrat 5 3 8
Akademis 2 5 7
7 8 15
Adanya kecendrungan para birokrat lebih
menyukai mobil berwarna gelap, dan Akademisi,
lebih menyukai warna terang dari 8 birakrat dan 7
orang Akademisi.
8!.7!.7!.8!
p  0,182751
5!.3!.2!.5!.15!

Bila taraf penerima alpa 5% (0,05) maka


ternyataan p hitung tersebut 0,182751
Lebih besar dari 0,05
Contoh data hasil pengamatan spectacle wearing
anda delinquency

Spectacle Juvenile Non delinquency Total


Delinquency
Yes 1 5 6
No 8 2 10
Total 9 7 16
Uji beda proporsi
Relative Risk & Odds Ratio

Sering dipakai dalam studi epidemiologi


untuk jelaskan
Apakah ada hubungan antara
• Variabel independen dengan variabel
dependen
• Ratio antara dua 2 proporsi
• RR Dipakai untuk penelitian prospektif atau
studi kohort.
• OR Dipakai untuk penelitian retrospekktif atau
kasus kontrol.
• Dasar : Penggunaan tabel kontingensi 2 x 2
Penyakit
F. Risko Jumlah
+ -
+ A B A+B
- C D C+D
Jumlah A+C B+D N

Rumus : P1 (proporsi risiko (+) terhadap penyakit


(+) )
A Prosporsi risiko (+) terhadap
p1 
A B penyakit (+)
C Prosporsi risiko (-) terhadap
p2 
CD penyakit (-)

Q1= (1-p1) p1 AD
RR  OR 
Q2= (1-p2) p2 BC
RR= Ukuran Yang Menunjukkan Berapa Kali (Lebih
Besar/Kecil) Risiko Untuk /Mengalami Penyakit
pada Populasi Terpapar Relatif Dibandingkan
Populasi Tidak Terpapar
OR = Istilah Yang Dipakai Untuk
Mennjukkan Rasio Antara 2 Nilai
Variabel
RR : dikaitan dengan exposure faktor risiko
tertentu & sekaligus dibandingkan
dengan kelompok non exposure
Nilai – nilai
RR < 1 : Faktor risiko yang menguntungkan
karena bersifat menghambat perkemb
penyakit (Faktor Protektif)

Contoh RR sebagai faktor protektif


Misal : RR minum ASI Eksklusif terhadap timbulnya
infeksi saluran nafas atas 0,25. artinya ASI
eksklusif menghambat mencegah timbulnya
penyakit tersebut sebesar dibandingkan dengan
yang tidak minum ASI eksklusif
RR = 1 : Bukan Faktor risiko (Netral) /tidak ada
pengaruhnya

Misal : RR ibu bekerja dgn kelahiran premature = 1


Artinya : tidak ada pengaruh antara bekerjanya ibu
dengan kelahiran anaknya yang premature

RR > 1 : Benar-benar sebagai faktor risiko untuk


timbulnya penyakit
Misal : RR otitis media akut terhadap menurunnya
pendengar >3
Artinya: Otitis merupakan faktor risiko amat kuat
terjadinya penurunan pedengaran
Catatan
Untuk rancangan penelitian cross sectional
besar RR (risiko relatif ) dicerminkan dengan
angka rasio prevalensi (RP)

RP : Angka yang mengambarkan prevalensi


dari suatu penyakit dalam populasi yang
berkaitan dengan faktor risiko yang
dipelajari
A C
RP  :
A B C  D
Tabel kontingensi 2x2 untuk penghitungan
pada studi cross sectional

Penyakit
+ -
Faktor
+

A B

risiko C D
-
A C A.D
RP  : 
A  B C  D B.C
1 1 1 1
SE Log .OR     
n n n n
1 1 1 1
L  log .OR  Z / 2    
n n n n
1 1 1 1
U  log .OR  Z / 2    
n n n n
Soal
Pada percobaan sejumlah 110 orang laki –laki
dgn hipertensi 35 menderita CHD (penyakit
jantung coroner) kebiasaan merokok. 25 orang
CHD tidak merokok 20 bukan CHD merokok 30
bukan CHD tidak merokok

Buat kesimpulannya
Alpha 5%
Tentukan nilai OR- RR serta buat kesimpulan
Data Hasil Pengamatan
Hypertensi
Faktor Risiko Total
CHD Non CHD
Merokok 35 20 55
Tidak merokok 25 30 55
60 50 110

H0 : tidak ada hubungan ( P1= P2)


Ha : ada hubungan (P1≠ P2)
Taraf sign (α) =5%
Daerah kritis penolakan
(X²tabel ≥ 3,841)
Rumus (tes statistik)
X² tabel > X² hitung menerima H0 (tidak
hubungan)
(p-value > α) H0 di tolak
2
2110.(35.30  20.25)
X   3,7
55.50.60.50

Kesimpulan tidak ada perbedaan bermakna antara


proporsi penderita yg punya kebiasaan merokok
dengan penderita hipertensi yang tidak punya
kebiasaan merokok menderita CHD

Anda mungkin juga menyukai