Materi 11 - 14
Materi 11 - 14
PERBEDAAN PROPORSI
Analisis Data
Univariat
Bivariat
Multivariat
Independen Dependen
Jenis Analisis Data
T-test
Kategori Chi – Square
Anova
T-test
Numerik Regresi
Anova
JENIS dan FUNGSI UJI KAI KUADRAT
(O E ) 2
X
2
E
Bermakna atau tidaknya, dapat dibandingkan dengan nilai pada tabel X2, pada nilai
alpha atau probabilitas tertentu dan derajat kebebasan (dk) atau degree of freedom yang
sesuai. Derajat kebebasan dapat dihitung dengan d k = (jumlah kolom-1) x (jumlah
baris-1).
Nilai E11 pada sel a = (a+b) x (a+c) / (total)
Nilai E21 pada sel c = (a+c) x (c+d) / (total)
Nilai E12 pada sel b = (a+b) x (b+d) / (total)
Nilai E22 pada sel d = (b+d) x (c+d) / (total)
Ya a b a+b
Tidak c d c+d
Total a+c b+d
APLIKASI UJI CHI SQUARE
X2 = 2.91
Lihat Tabel X2 (ada dua cara pengambilan keputusan)
Cara pertama: Menggambarkan area penolakan:
pada = 0.05 dan dk = (2-1)(2-1) = 1 X2 -tabel=
3.84
(gambarkan sebelah kiri 3.84 area ho gagal ditolak dan
sebelah kanan 3.84 area ho ditolak)
X2 hitung = 2.91 X2-hitung jatuh pada area gagal
tolak Ho gagal ditolak
Cara kedua: Menghitung nilai-P: Lihat tabel X2 :
dengan nilai X2 -hitung= 2.91
dan dk = (2-1)(2-1) = 1
nilai X2 p=3.841 (berada di 0.05 – 0.10) sehingga nilai p>
alpha 0.05 Ho gagal ditolak
Kesimpulan:
Tidak cukup bukti untuk menyimpulkan proporsi hipertensi penduduk kota
(Jakpus) tidak sama dengan penduduk desa (Cianjur) atau
dalam bahasa lain dapat disimpulkan proporsi kejadian hipertensi antara kota
dengan desa sama saja
Ho Gagal ditolak
Ho ditolak
2,91
3,84
Rumus menghitung X 2 tabel 2x2
•tabel kontingensi 2 x 2 (dua kolom dan 2 baris),
tersedia rumus untuk menghitung nilai X2 sebagai
berikut:
I II Total
A a b a+b
B c d c+d
N ( ad bc ) 2
2
( a c ) * (b d ) * ( a b ) * ( c d )
Contoh soal
Soal pada halaman sebelumnya, suatu survei dilakukan untuk melihat
apakah ada perbedaan proporsi hipertensi antara penduduk kota
(Jakarta Pusat) dengan desa (Kab. Cianjur). Sebanyak 410 penduduk
Jakpus dipilih dengan random, ada 62 orang (15.1%) yang hipertensi,
sedangkan dari 414 penduduk Cianjur yang dipilih dengan random, ada
46 orang (11.1%) yang hipertensi.
Pengetahuan
Umur
Meningkat Tidak meningkat
< 30 tahun 35 30
≥ 30 tahun 32 45
Pembilang
2. Cari df.
df1 = n1-1 dan df2 = n2-1
2. Lihat tabel F
3. Varian yang lebih besar sebagai pembilang
4. varian yang lebih kecil sebagai penyebut.
Contoh soal
Seorang pejabat Depkes berpendapat bahwa
rata-rata nikotin yang dikandung rokok jarum
lebih tinggi dibandingkan rokok wismilak. Untuk
membuktikan pendapatnya kemudian diteliti
dengan mengambil sampel secara random 10
batang rokok jarum dan 8 batang rokok
wismilak. Hasil pengolahan data melaporkan
bahwa; rata-rata kadar nikotin rokok jarum
adalah 23,1 mg dengan standar deviasi 1,5 mg.
Sedangkan pada rokok wismilak rata-rata kadar
nikotinnya 20,0 mg dengan standar deviasi 1,7
mg. Berdasarkan data tsb ujilah pendapat
pejabat Depkes tsb dengan menggunakan alpha
5 %.
Jawab:
Langkah pertama adalah melakukan pemeriksaan
homogenitas varian kedua data dengan
menggunakan uji F.
• Perhitungan Uji F :
• F = (1,7) 2/ (1,5) 2 = 1,28
• 9 0.100 …… …… … … 2.51 .. ..
• 0.050 ......F=1.28 .. 3.29 .. ..
• 0.025 ...... .. .. 4.20 .. ..
• 0.010 ........ .. .. 5.61 .. ..
• 0.005 ........ .. .. 6.88 .. ..
• 0.001 ........ .. .. 10.70 .. ..
Sp 2
n1 1 S 1 2 n 2 1 S 2 2
n1 n 2 2
• df = n1 + n2 -2
• Ket ;
• n1 atau n2 = jumlah sampel kelompok 1 atau 2
• S1 atau S2 = standar deviasi sampel kelompok 1 dan 2
Uji untuk Varian berbeda
2
S1 2
S2 2
n 1 n 2
df
S 2
2
S 2
2
1 n 2 n
1
2
n1 1 n 2 1
X1 X 2
T
S12 S 2 2
n n
1 2
Langkah selanjutnya adalah menguji perbedaan
mean kedua kelompok data tersebut dengan
menggunakan uji t untuk varian yang sama:
• Hipotesis :
• Ho : 1= 2 (mean
kadar nikotin jarum Sp2
1011,5 8 11,7
2 2
2,53
sama dengan mean
kadar nikotin
10 8 2
wismilak) Sp 1,59
• Ha : 1 >2 (mean
kadar nikotin jarum
lebih tinggi 23,1 20
dibandingkan t 4,1
wismilak) 1 1
• Dengan Ha seperti 1,59
diatas berarti ujinya 10 8
dengan one tail
(satu arah/satu sisi) df 10 8 2 16
• Perhitungan Uji t :
Kemudian dicari nilai p dengan menggunakan Tabel
distribusi t (lampiran tabel iv). Adapun cara
mencarinya adalah sbb:
• .10 .05 .025 .01 .005 -
• 1 … … … … …
nilai p
•
• 16 1.337 1.746 2.120 2.583 2.921 - .dst
• t=4,1
d
T
Sd d
n
Contoh soal
d
deviasi 18,6
1,86
n 10
( x x ) 2
SD _ d 0,598 0,60
n 1
1,86
t 9,80
0,60
10
1
ANOVA
Uji hipotesis perbedaan nilai rata-rata dari 2 atau lebih kelompok
independen
Contoh: Adakah perbedaan berat bayi lahir dari keluarga Sosek
tinggi dengan Sosek sedang dan Sosek rendah
Asumsi Uji Anova:
1. Subjek diambil secara random dari populasi
2. Varian antar kelompok homogen
3. Nilai di populasi berdistribusi normal
4. Kejadian error terdistribusi sec. normal dan independen
Ho: (Semua i adalah sama) 1 2 3
HA: (Tidak semua i sama) atau
Setidaknya salah satu dari i berbeda dengan lainnya
ANOVA
PROSEDUR UJI ANOVA:
1. Ho: (Semua adalah sama) 1 2 3
Ha: (Tidak semua adalah sama)
2. Tentukan tingkat kepercayaan (dengan tertentu)
3. Test Statistik: Uji-F-Anova
4. Area penolakan: Ho ditolak jika
F hitung > F tabel (; df1=k-1; df2=N-k) atau p-value <
5. Keputusan: Ho ditolak atau gagal ditolak
6. Kesimpulan: Ho gatol Ho: Semua sama.
Ho ditolak Ha: Tidak semua adalah sama/
minimal salah satu berbeda dengan lainnya
ANOVA
Sb 2
F
Sw 2
Sw
2 n1 1S 1 n 2 1S 2 ... n k 1S k
2 2 2
N k
n1 x1 X
n 2 x 2 X ... n k x k X
2 2 2
Sb
2
k 1
n1 x1 n 2 x 2 ... n k x k
X
N
Contoh 1 Aplikasi ANOVA
Lama tunggu (menit)
P.Dalam Bedah Kebidanan Total
10 5 8
9 8 7
7 8 8
9 5 7
10 7 6
9 6 9
8 6 8
9 8 9
8 6 10
7 6 5
n 10 10 10 30
mean 8,6 6,5 7,7 7,6
sd 1,1 1,2 1,5
x 86 65 77 228
x2 750 435 613 1798
Ho : Tidak ada perbedaan lama waktu tunggu di poli penyakit dalam,
bedah, dan kebidanan
Ha : Ada perbedaan lama waktu tunggu di poli penyakit dalam,
bedah, dan kebidanan
F =…
tabel
- = 0.05
- Numerator = k –1 = 3 – 1 = 2
- Denominator = N – k = 30 – 3 = 27 (dekat 30)
F tabel = 3.32
F hitung = 6,81
Keputusan: Ho ditolak karena F hitung > F tabel
Nilai-p = …
- F = 6,81 (berkisar 6,35 – 8,77)
- Nilai-p = (Berkisar 0,005 – 0,001)
- Nilai-p < alpha (5%) Ho ditolak
Simpulan: Ada perbedaan mean waktu tunggu
Contoh 2 Aplikasi ANOVA
xi x j
tij
1 1
2
Sw ( )
ni nj
df n k
Contoh 1 Aplikasi ANOVA
Contoh 1 Aplikasi ANOVA
t hit = 3.68 df = 27
P < 0,01 α* = 0,0167
P < α* Ho ditolak
t hit = 1,58 df = 27
P > 0,1 α* = 0,0167
P >α* Ho gagal ditolak
t hit = -2,11 df = 27
P > 0,2 α* = 0,0167
P >α* Ho gagal ditolak
Contoh 2 Aplikasi ANOVA
Contoh 2 Aplikasi ANOVA
t hit = 2,71 df = 19
0,005<P < 0,01 α* = 0,0167
P < α* Ho ditolak
t hit = 1,48 df = 19
P >0,05 α* = 0,0167
P >α* Ho gagal ditolak
t hit = -0,33 df = 19
P > 0,1 α* = 0,0167
P >α* Ho gagal ditolak
Suatu penelitian dilakukan untuk mengetahui hubungan kondisi
sosial ekonomi keluarga dengan berat badan bayi yang
dilahirkan. Penelitian dilakukan dengan menimbang berat badan
bayi (kg) pada 23 ibu yang baru melahirkan yang terbagi dalam
kelompok sosial ekonomi rendah, sedang, dan tinggi.
Adapun hasil nya sebagai berikut:
Sosek rendah : 2,4 3,0 2,1 3,0 3,4 2,3 2,3 2,5
Sosek sedang : 3,0 3,1 2,7 2,6 3,1 2,9 2,9
Sosek tinggi : 3,1 2,4 3,5 2,9 3,4 4,0 3,4 3,9
Pertanyaan :
a. Ujilah dengan alpha 5% apakah ada perbedaan berat badan
bayi di antara tingkat sosial ekonomi tersebut
b. Bila ada perbedaan , kelompok mana saja yang bebeda?
KORELASI – REGRESI
LINIER SEDERHANA
Analisis mengenai hubungan antara 2 variabel
membutuhkan data yang terdiri dari 2 kelompok hasil
observasi atau pengukuran.
1
KORELASI
Biostatistik Dasar-martya 2
Menilai hubungan 2 variabel numerik
Contoh:
1. Apakah ada hubungan antara umur
dengan tekanan darah sistolik
2. Apakah ada hubungan antara income
keluarga dengan IP mhs
3. Apakah ada hubungan antara umur
pasien dengan lama hari rawat
Biostatistik dasar 3
HUBUNGAN DUA VARIABEL KONTINU
Hubungan X dan Y searah (positif) linier
Bila nilai X naik, maka nilai Y juga naik dan bila nilai X turun, maka
nilai Y juga turun
Hubungan X dan Y berlawanan arah (negatif) linier
Bahwa arah hubungan antara variabel X dengan variabel Y adalah
berlawanan arah (negatif) dan linier. Dalam hal ini bila nilai X naik,
maka nilai Y juga turun
Hubungan X dan Y bentuk kuadrat
Menunjukkan hubungan antara variabel X dengan variabel Y yang
berbentuk kuadrat.
Tidak ada hubungan antara X dan Y
Menunjukkan pola yang tidak teratur, sehingga dikatakan tidak ada
hubungan antara variabel X dengan variabel Y
Biostatistik dasar 4
Diagram pencar dari variabel X dan Y
Y
Y
X
X
Hubungan X dan Y
Hubungan X dan Y berlawanan arah
searah positif linear (negatif) linier
Biostatistik dasar 5
Diagram pencar dari variabel X dan Y
Y Y
X X
Biostatistik dasar 6
KEKUATAN HUBUNGAN
Kekuatan hubungan tergambar pula pada diagram
tebar, yaitu bila tebaran titik-titik merapat
membentuk garis lurus.
Bila titik-titik menebar tepat pada satu garis lurus
(semua titik berada pada satu garis lurus), maka
kekuatan hubungan antara kedua variabel
tersebut sangat sempurna.
Kekuatan hubungan dapat dikuantifikasi melalui
suatu koefisien yang dikenal sebagai Koefisien
Korelasi (dari Pearson).
Biostatistik dasar 7
Ukuran Hubungan 2 Var
Pearson’s Correlation Coefficient ( r )
Kekuatan hubungan
Berkisar antara 0 dan 1
0= tidak ada hubungan linier antara Var x dg
VarY
1= hubungan kedua variabel linier sempurna
Yang sering berada antara 0 dan 1
Arah hubungan
Ditandai oleh + dan –
+ = Hubungan direct: korelasi positif yang
berarti semakin besar nilai X semakin besar
juga nilai Y
- = Hubungan terbalik ( inverse): korelasi
negatif berarti kenaikan variabel X diikuti
penurunan var Y atau sebaliknya
Y Y Y
r =1 r =1 r=0
X X X
Koesfisien korelasi Koesfisien korelasi Koesfisien korelasi
positif Sempurna negatif Sempurna
r=0
Biostatistik dasar 10
Y
Y
0< r <1
0< r <1
X
Koefisien Korelasi Negatif
X
Koefisien Korelasi Positif
Biostatistik dasar 11
Koefisien Korelasi Pearson (r)
Koefisien r akan berkisar antara 0 sampai 1.
Besaran koefisien ini menunjukkan kekuatan hubungan, yaitu
Bila r = 0, berarti tidak ada hubungan linier.
Bila r = 1 berarti hubungan linier sempurna.
makin mendekati angka 1, berarti semakin kuat
hubungannya, dan
mendekati angka 0 semakin lemah hubungannya.
Yang perlu diperhatikan adalah bila r kecil, tidak berarti
tidak ada hubungan antara kedua variabel, namun
mungkin hubungan berbentuk non-linier misalnya lengkung
parabolik, atau lengkung eksponensial.
Biostatistik dasar 12
Koefisien Korelasi Pearson (r)
xy
x y
r n
( x ) ( y )
2 2
x n y n
2 2
Biostatistik dasar 13
INTERPRETASI KOEF. KORELASI
Kekuatan hubungan:
r < 0.4 : Lemah
0.4< r <0.8 : Sedang
r > 0.8 : Kuat
Korelasi tidak selalu berarti hubungan sebab akibat
(causality)
Korelasi yang lemah tidak selalu berarti tidak adanya
hubungan
Korelasi yang kuat tidak selalu berarti adanya garis
lurus
Biostatistik dasar 14
KOEFISIEN DETERMINASI (r2)
Koefisien R-kuadrat (r2), dapat diartikan sebagai
besarnya proporsi variasi variabel Y yang dapat
dijelaskan oleh variabel X.
Apabila variasi Y dapat dijelaskan 100% oleh
variabel X, berarti X memang memegang peran
dalam perubahan nilai Y, atau dapat dikatakan
sebagai penentu variabel Y.
Dapat diperhatikan bahwa bila besar koefisien r = 1,
maka r2 = 100%. Ini berarti apabila terjadi perubahan
nilai X, maka nilai Y pasti akan berubah.
Biostatistik dasar 15
Subjek (X) Usia (Y) Lama hari rawat X.Y
1 20 5
2 30 6
3 25 5
4 35 7
5 40 8
(X) = 150 (X) = 31 (XY) = 970
(X2) = 4750 (Y2) = 199
( X ).( Y ) (150).(31)
( XY ) (970)
r n 5 0.97
X
2
Y
2
150
2
31
2
( X ) . ( Y ) (4750) . (199)
2 2
n n 5 5
Biostatistik dasar 16
Nilai r = 0,97 mempunyai hubungan yang
kuat antara variabelnya
Koefisien determinasi = (r2)=(0,97)2 =0,9409=
94,09% yang artinya variasi umur pasien
terhadap lamanya rawat sebesar 94,09% dan
sisanya 5,91% dijelaskan oleh faktor lain di
luar variabel
Biostatistik dasar 17
REGRESI LINEAR
Biostatistik Dasar-martya 18
Regresi
Garis regresi adalah garis lurus atau garis linier yang
merupakan garis taksiran atau perkiraan untuk mewakili pola
hubungan antara variabel X dengan variabel Y
Variabel X disebut variabel bebas
Variabel Y disebut variabel tak bebas
Variabel X sebagai prediktor (variabel yang dipakai untuk
memprediksi nilai Y)
Variabel Y sebagai diprediksi atau sebagai variabel terikat
Persamaan regresi yang paling baik adalah regresi yang
mempunyai total kuadrat kesalahan atau total kuadrat selisih
yang paling minimum
Biostatistik dasar 19
Regresi
Persamaan garis regresi
Yˆ a bX
y x
a b
n n
( x )( y )
( xy )
b n
( x ) 2
( x )
2
n
Biostatistik dasar 20
• Untuk memprediksi Metoda Least Square
(Persamaan garis dibuat sedemikian rupa sehingga
jumlah kuadrat dari selisih nilai observasi dengan
nilai pada garis adalah minimum)
Y adalah nilai Y yang diprediksi
a adalah intercept dan b adalah slope
a adalah perbedaan besarnya rata-rata variabel
Y ketika variabel X=0
b mengukur kemiringan garis, yaitu perkiraan
besarnya perubahan nilai variabel Y bila nilai X
berubah satu unit pengukuran
Biostatistik dasar 21
Subjek X Y X.Y
. X. X. 2 Y. Y. 2 XY.
. X. X. 2 Y. Y. 2 XY.
Biostatistik dasar 22
Hubungan antara usia terhadap lamanya hari rawat
Subjek (X) Usia (Y) Lama hari rawat X.Y
1 20 5
2 30 6
3 25 5
4 35 7
5 40 8