Anda di halaman 1dari 43

I

Pertemuan XIII

Nurlaila Susilowati SKM, MKes


TUJUAN PEMBELAJARAN
 Hasil Belajar
Peserta mampu memahami biostatistik inferensial

 Indikator Hasil Belajar  Mampu mempraktikkan :


 estimasi parameter;
 central limit theorma;
 chi square/kai kuadrat;
 anova;
 korelasi dan regresi.
Fungsi Estimasi Statistik Inferensial
 Kegiatan penelitian pada umumnya ditujukan kepada sampel
dan ingin diketahui keadaan di populasi berdasarkan keadaan di
sampel
 Salah satu tugas statistik inferensial  Membuat kesimpulan,
inferensi, estimasi, penaksiran, dan generalisasi terhadap
populasi berdasarkan analisis dari data sampel
 Teori estimasi bersama pengujian hipotesis merupakan dasar
statistik inferensial yang dilandasi oleh teori peluang
 Estimasi yang dibuat harus tidak bias, sehingga sampel harus
representatif  Memenuhi syarat: teknik pengambilan sampel
dan jumlah minimal sampel yang dipertanggungjawabkan
dengan interval kepercayaan
 Meskipun sampel sudah dipilih dengan baik, nilai statistik dari
sampel tidak akan sama persis dengan nilai di populasi. Untuk
mengetahui seberapa besar keyakinan  Estimasi dan selang
4
kepercayaan
Fungsi …. (Lanjutan)

 Estimator dan Estimit


 Estimator: Statistik sampel yang digunakan untuk menaksir
parameter populasi
Misal: X untuk menaksir , proporsi sampel (p) untuk menaksir
proporsi populasi (p)
 Estimit: Angka/nilai yang digunakan untuk menaksir parameter
populasi

 Kriteria estimator yang baik


 Tidak bias  Nilai hasil statistik sampel sama dengan parameter
populasi
 Efisien : Statistik sampel mempunyai kesalahan baku (SD) yang
lebih kecil . Misal: Menaksir  dengan X dan median. Kesalahan
baku X = 1,03 dan median = 1,64  X estimator yang lebih efisien
 Konsisten: Nilai statistik sampel akan lebih mendekati nilai
parameter populasi apabila besar sampel ditambah 
Estimator yang konsisten karena dapat meningkatkan ketepatan5
estimasi
Estimasi Titik dan Estimasi Selang (Interval Estimation)
 Inferensi statistik yang paling sederhana adalah estimasi titik 
Menghitung satu nilai statistik dari sampel untuk memperkirakan nilai
parameter yang ada pada populasi
 Titik estimasi: Salah satu cara (nilai tunggal) untuk mengadakan
estimasi terhadap parameter populasi yang tidak diketahui
 Titik estimasi yang dapat digunakan untuk estimasi parameter populasi
yaitu:
 rata-rata sampel terhadap rata-rata populasi
 proporsi sampel terhadap proporsi populasi
 jumlah variabel tertentu dalam sampel untuk menaksir jumlah
variabel tersebut dalam populasi
 Kelemahan dari estimasi titik adalah bahwa estimasi tersebut hampir
tidak mungkin 100% sama dengan nilai yang ada di populasi.
 Masalahnya seberapa besar keyakinan kita dan seberapa lebar yang
disebut "sekitar"?   tidak pernah diketahui secara pasti
 Masalah ini dapat diatasi dengan menggunakan estimasi selang
(interval estimation).
Estimasi selang ….(Lanjutan)
 Interval estimasi : Sekumpulan nilai statistik sampel dalam interval
tertentu yang digunakan untuk mengadakan estimasi terhadap
parameter populasi () dengan harapan nilai parameter populasi
terletak dalam interval tersebut .
 Estimasi terhadap nilai  didasarkan bahwa sampel2 dari populasi
akan berdistribusi normal sekitar  dengan simpangan baku rata-
rata hitung = Sx atau SE  SE = /n
 Estimasi selang menggunakan selang 2 angka (batas minimum dan
maksimum letak nilai ) , dan hanya berlaku pada tingkat
kepercayaan (confidence interval/CI) tertentu  Jarak dari batas
maksimum dan minimum ditentukan sebagai tingkat kepercayaan.
 Untuk mengetahui tingkat kepercayaan digunakan distribusi normal
yang menyatakan besarnya persentase terhadap seluruh luas kurva
(Distribusi “z”)
Tingkat Kepercayaan Nilai z (Z-skor)
90% 1,64
95% 1,96
99% 2,58 7
Estimasi selang ….(Lanjutan)

 Penaksiran letak  pada umumnya menggunakan taraf signifikansi


(peluang salah) 5% dan 1% (dikenal dengan ).
 Tingkat kepercayaan 95 % berarti 95% percaya bahwa nilai
parameter populasi terletak pada nilai rata2 dengan
penyimpangan ke kanan 1,96, dan ke kiri 1,96 (Daerah
penerimaan 95% dan kemungkinan penolakan/salah = 5%)
 Rumus umum
X – Z.SE    X + Z.SE

Atau
 Estimasi letak nilai  dengan taraf signifikansi 5% dan 1%

 = X  1,96 .SE
 = X  2,58 .SE

 Rumus tersebut hanya benar jika  diketahui


TEOREMA LIMIT PUSAT
(CENTRAL LIMIT THEOREMA/CLT)

 Bila dan satu populasi tertentu diambil sampel secara infinit


(tak terbatas) dengan cara acak dan dalam jumlah cukup,
maka sebaran nilai mean sampel akan selalu mengikuti
sebaran peluang normal, apa pun bentuk sebaran di
populasinya

 Bentuk sebaran sesuai dengan kurva normal ini merupakan


salah satu alasan penting penggunaan distribusi probabilitas
normal sering dipakai dalam statistik inferensial
9
STANDARD ERROR
 Dari sebaran mean sampel, dapat dihitung rata-rata mean sampel
yang sama dengan mean di populasi X x = 
 Simpangan baku dari mean sampel juga dapat dihitung, disebut:
Galat baku (Standard Error/SE)  S x = SE
 Bila variabel berskala numerik dan sampel diambil dengan cara
diacak sederhana, maka SE = /n
 Bila variabel berskala kategorik dan sampel diambil dengan cara
diacak sederhana, maka SE = p (1 –p) /n
 Simpang baku dari sebaran mean sampel tidak sama dengan
simpang baku variabel di populasi  SE dipengaruhi oleh n/sampel,
baik dalam jumlah besar mau pun cara pengambilannya
 SE digunakan untuk kepentingan induksi dari sampel ke populasi
 Bila ingin menghitung SE hanya dari satu sampel yang dimiliki, maka
nilai  dapat diganti dengan s karena mean s2 sama dengan 2
10
2
( )/
Dasar-dasar Uji Chi Square /Kai Kuadrat
 Uji t dan Anova terkadang tidak relevan digunakan pada
permasalahan kesehatan tertentu yang memerlukan pengujian
kemaknaan (biasanya berkaitan dengan data berskala interval) 
Dalam penelitian diperoleh juga data nominal berupa penghitungan
frekuensi pemunculan tertentu
 Penghitungan frekuensi pemunculan sering menunjukkan adanya
perbedaan jumlah (Mis: Jumlah calon mahasiswa yang memilih
jurusan Sastra Inggris dan Sastra Indonesia)  Apakah berbeda
secara signifikan ?
 Uji yang tepat untuk melihat perbedaan tersebut (analisis data
kategori)  Uji Chi Square (Kai Kuadrat; dengan simbol: 2 )
 Uji t dan F-tes dipergunakan untuk menguji perbedaan data berskala
interval, Chi Square untuk menguji perbedaan frekuensi data
bersakala nominal (data kategori)
 Uji Kai Kuadrat: Membandingkan frekuensi yang diamati (Observed =
O) dengan frekuensi yang diharapkan (Expected = E)
12
Ketentuan Pemakaian Chi Square (2 )
 Jumlah sampel harus cukup besar
 Pengamatan harus bersifat independen (unpaired)  Satu subjek
hanya satu kali digunakan dalam analisis
 Pengujian Chi Square hanya dapat digunakan pada data deskrit (data
frekuensi/kategori) atau data kontinyu yang telah dikelompokkan
menjadi kategori
 Jumlah frekuensi yang diharapkan harus sama dengan jumlah
frekuensi yang diamati
 Pada derajat kebebasan = 1 (tabel 2 X 2) tidak boleh ada nilai
ekspektasi yang sangat kecil  Bila nilai yang diharapkan (E) terletak
dalam satu sel terlalu kecil (<5) sebaiknya Chi Square tidak digunakan
(kecuali menggunakan koreksi Yates)
 Pada pengujian Chi Square dengan banyak kategori, bila terdapat
nilai E = <5, maka nilai-nilai E tersebut dapat digabungkan dengan
konsekuensi jumlah kategori dan informasi menjadi berkurang
Tipe Uji Chi Square

Uji Chi Square dapat dipergunakan untuk menentukan:

 ada tidaknya asosiasi antara dua variabel


(independency test)

 apakah suatu kelompok homogen (homogenitas antar


subkelompok = homogenity test)

 seberapa jauh suatu pengamatan sesuai dengan


parameter yang dispesifikasikan (goodness of fit)

14
Uji Independensi
 Di bidang kedokteran tidak jarang ditemukan 2 variabel yang
masing2 terdiri dari beberapa kategori (Tingkat beratnya penyakit
dengan tingkat kesembuhan).
 Untuk mengetahui ada/tidaknya hubungan di antara 2 variabel
tersebut dilakukan pengujian hipotesis dengan 2  Ho ditolak =
Kedua variabel ada hubungan (dependen); jika Ho gagal tolak
= Tidak ada hubungan (independen)
 Rumus Chi Square (Kai Kuadrat)
2 =  (O – E )2
E
2 = Chi Square (Kai Kuadrat)
O = Frekuensi observed (observasi)
E = Frekuensi expected (harapan)
Perbandingan antara frekuensi yang diobservasi dengan frekuensi
yang diharapkan , dalam penghitungan Chi Square ditunjukkan ke15
alam bentuk tabel
Uji ….(Lanjutan)
 Contoh
Seorang dokter RS menyatakan bahwa frekuensi anemia pada
Bumil di RS A = di RS B = di RS C. Pernyataan tersebut akan diuji
pada derajat kemaknaan 5% dengan mengambil sampel secara
independen Bumil yang datang masing2: RS A = 50, RS B = 40,
dan RS C = 60. Frekuensi anemia Bumil selama pengamatan: RS
A = 20, RS B = 25, dan RS C = 35.
 Penyelesaian
 Langkah 1 Untuk menghitung nilai E, buat tabel kontingensi 3 X 2
Rumah Sakit Anemia Tidak anemia Jumlah
1. RS A 20 (E1) 30 (E2) 50
2. RS B 25 (E3) 15 (E4) 40
3. RS C 35 (E5) 25 (E6) 60
Jumlah 80 70 150

Nilai expected setiap sel adalah Subtotal baris dikali 16


Subtotal kolom dibagi Total
Uji …. (Lanjutan)
 E1 = (50 x 80) / 150 = 26,6  E2 = (50 x 70) / 150 = 23,3
 E3 = (40 x 80) / 150 = 21,3  E4 = (40 x 70) / 150 = 19,3
 E5 = (60 x 80) / 150 = 32,0  E6 = (60 x 70) / 150 = 28,0
 Langkah 2 Menghitung nilai 2
O E (O – E) (O – E)2 (O – E)2/E Keterangan
20 26,6 -6,6 43,56 1,64 dk = (Jumlah baris – 1)
30 23,3 6,7 44,89 1,93 x (Jumlah kolom – 1)

25 21,3 3,7 13,69 0,64


15 19,3 - 4,3 18,49 0,96 dk = (B – 1)(K – 1)
35 32,0 3,0 9,00 0,28
25 28,0 - 3,0 9,00 0,32
- - - 2 5,77

 Langkah 3 Menguji hipotesis dengan 2


Ho : f1 = f2 = f3 Ha : f1  f2  f3  dk = (3 – 1)(2 – 1) = 2 (Lihat tabel 2)
2 dk =2, = 0,05 =5,991 2hitung = 5,77 < 5,991  Ho gagal tolak pada  0,05
Kesimpulan: Tidak terdapat perbedaan perbedaan frekuensi anemia pd 3 RS
Tabel Kontingensi 2 X 2 dan Uji 2
 Bila hasil pengamatan terdiri dari 2 variabel dan masing2 hanya terdiri dari
2 kategori , dapat dibuat tabel kontingensi 2 X 2
Variabel Variabel Dependen Jumlah
Independen
I II
I a b a+b
II c d c+d
a+c b+d N
 Nilai statistik 2 dapat dicari tanpa menghitng nilai E dengan rumus:
N x (ad – bc)2
2 = (a + c)(b + d)(a + b)(c + d)
 Contoh
Penelitian tentang efek obat influensa pada 2 klompok penderita influensa
Kelompok I diberi obat, kelompok 2 placebo. Setelah 3 hari dievaluasi dan
hasilnya: Kelompok 1= 7 orang sembuh dan 3 orang tidak; kelompok 2 = 4
orang sembuh dan 6 orang tidak. Pada  = 5%,lakukan uji kontingensi 2 X 2,
apakah obat tersebut mempunyai efek terhadap penyembuhan !
PENUGASAN INDIVIDUAL
 Uji Independensi
Seorang kepala RS melakukan penelitian untuk mengetahui hubungan
antara tingkat pendidikan dengan kelas ruang rawat inap. Untuk itu
diambil sampel sebanyak 200 penderita dengan hasil sebagai berikut.
1. Penderita pendidikan SD = 70 orang 20 orang memilih kelas
I; 40 orang memilih kelas 2; dan 10 orang memilih kelas 3
2. Penderita pendidikan SLTP=50 orang25 orang memilih kelas
I; 15 orang memilih kelas 2; dan 10 orang memilih kelas 3
3. Penderita pendidikan SLTA=40 orang15 orang memilih klas
I; 10 orang memilih kelas 2; dan 15 orang memilih kelas 3
4. Penderita pendidikan PT = 40 oran  20 orang memilih kelas
I; 5 orang memilih kelas 2; dan 15 orang memilih kelas 3
 Uji Kontingensi
Data dari suatu PT terdapat calon mahasiswa jurusan sastra
Inggris (Putri = 130, Putra = 56) dan calon mahasiswa jurusan
sastra Indonesia (Putri = 84, Putra = 44). Lakukan uji kontingensi
19
pada tingkat kepercayaan 95% dan berikan kesimpulan.
Analisis Varians Satu Arah
(One Way Analysis Of Variance = Anova)
 Prinsip uji Anova: Menelaah variabilitas data menjadi 2 sumber variasi
yaitu Variasi dalam kelompok (within) dan antar kelompok (between)
 Bila variasi within dan between sama (perbandingan kedua varian = 1)
mean2 yang dibandingkan tidak ada perbedaan  Bila hasil
perbandingan kedua varian > 1 , mean yang dibandingkan ada
perbedaan
 Beberapa asumsi yang harus dipenuhi pada uji Anova
 Varian homogen
 Sampel/kelompok independen
 Data berdistribusi normal
 Jenis data yang dihubungkan numerik (Mis: lama hari rawat) dan
kategori (untuk kategori yang lebih dari 2 kelompok, mis: kelas
perawatan)
Analisis .... (Lanjutan)

 Anova: pada hakikatnya merupakan teknik statistik yang


menganalisis variasi yang timbul akibat adanya perbedaan skor pada
beberapa kelompok sampel Terlihat pada adanya selisih / deviasi
rata2 hitung pada tiap kelompok sampel.
 Variabilitas rata2 hitung pada tiap kelompok tersusun dari simpangan
skor2 individual dengan rata2 hitungnya  X – X (Jika 3 kelompok:
X – X1; X – X2 ; X – X3 ). Hal tersebut disebut Simpangan Baku dalam
Kelompok atau Variasi dalam Kelompok(within)
 Variabilitas seluruh kelompok tersusun dari simpangan skor2
individual dengan rata2 hitung secara keseluruhan (Xt )  X – Xt
disebut Simpangan Total atau Variabilitas Total
 Terdapat pula variabilitas antara rata2 hitung tiap kelompok (X1, X2 ,
dan X3 ) dengan rata2 hitung total Xt)  X1 – Xt; X2 – Xt ; X3 – Xt
disebut Simpangan Baku antar Kelompok atau Variabilitas antar
Kelompok (between)
Analisis .... (Lanjutan)

 Penghitungan dalam Anova berkaitan dengan bilangan2 kuadrat


(Jumlah kuadrat dan rata2 hitung kuadrat)
 Rata2 hitung kuadrat = RK
 Jumlah kuadrat simpangan baku (X – X )2 (Jumlah kuadrat ) = JK
 Jumlah kuadrat dalam kelompok (Mean square within) = JKD/
MSW
 Jumlah kuadrat antar kelompok (Mean square between) = JKA/
MSB
 Jumlah kuadrat total (Sum of square total) = JKT/SST
 Untuk keperluan analisis istilah varians (dalam kelompok dan antar
kelompok) disebut Rata-rata Hitung Kuadrat:
 Rata-rata hitung kuadrat dalam kelompok (RKD)
 Rata-rata hitung kuadrat antar kelompok (RKA)
 Uji F  RKA/RKD
Analisis …. (Lanjutan)

Rumus Penghitungan
 Jumlah kuadrat total (Sum of square total) = JKT/SST
JKT adalah jumlah dari kuadrat selisih antara setiap nilai
pengamatan dengan mean keseluruhan (grand mean).

JKT = (X1 – Xt )2 + (X2 – Xt )2 + …. + (Xn – Xt )2


 Jumlah kuadrat dalam kelompok (JKD/MSW)
JKD adalah jumlah kuadrat selisih antara setiap nilai pengamatan
dengan mean kelompoknya
JKD = (Xn – Xn ) 2
 Jumlah kuadrat antar kelompok (JKA/MSB)
JKA adalah jumlah kuadrat selisih antara setiap mean kelompok
dengan mean keseluruhan, dengan memperhitungkan besar
pengamatan tiap kelompok.

JKA = n1 * (X1 – Xt )2 + n2 * (X2 – Xt )2 + …. + nn * (Xn – Xt )2


Analisis .... Rumus (Lanjutan)

 Penghitungan Rata-rata Hitung Kuadrat (RK)


 Rata-rata hitung kuadrat antar kelompok (RKA)
RKA = JKA/dba
dba (dk antar kelompok)= k – 1
 Rata-rata hitung kuadrat dalam kelompok (RKD)
RKD = JKD/dbd (dk dalam kelompok)
dbd = dbt – dba  dbt (dk total) = N – 1 atau N – k

 Penghitungan Nilai F

F = RKA/RKD
Uji ….(Lanjutan)

 Contoh uji Anova


Terdapat 3 cara pemeriksaan Hb. Setiap metode digunakan untuk
memeriksa 5 orang dengan data sebagai berikut.
Metode 1 : 10; 11; 13; 14,4; dan 15
Metode 2 : 9,8; 11,2; 13,4; 14,2; dan 15
Metode 3 : 11; 12,2; 13,6; 14,2; dan 14,4
Ingin diuji apakah rata-rata sampel tersebut berasal dari populasi
dengan rata-rata yang sama.
 Penyelesaian
 Langkah 1 : Membuat pernyataan hipotesis nol
Ho : μ1 = μ2 = μ3
Tidak ada perbedaan mean cara pemeriksaan Hb pada ketiga
metode
Ha : μ1  μ2  μ3
Ada perbedaan mean cara pemeriksaan Hb pada ketiga metode
 Langkah 2
Untuk menguji beda lebih dari dua mean, digunakan analisis
varians (Anova) satu arah.
Uji ….(Lanjutan)

 Langkah 3 : Penghitungan JKT, JKA, JKD, RKA, dan RKD


No Metode 1 Metode 2 Metode 3 Total
X1 X2 X3
10 9,8 11
11 11,2 12,2
13 13,4 13,6
14,4 14,2 14,2
15 15 14,4

X1= X2 = X3 = X =192,4


63,4 63,6 65,4

n1 = 5 X1 = n2 = 5 X2 = n3 = 5 X1 = N = 15
12,68 12,72 13,07 Xt = 12,83
Uji ….(Lanjutan)
 Menghitung Jumlah Kuadrat Total (JKT)
JKT = (X1 – Xt )2 + (X2 – Xt )2 + …. + (Xn – Xt )2
JKT = (10 – 12,83)2 + (11 – 12,83)2 + (13 – 12,83)2 + (14,4 – 12,83)2 + (15
– 12,83)2 + (9,8 – 12,83)2 + (11,2 – 12,83)2 + (13,4 – 12,83)2 + (14,2 –
12,83)2 + (15 – 12,83)2 + (11 – 12,83)2 + (12,2 – 12,83)2 + (13,6 – 12,83)2
+ (14,2 – 12,83)2 + (14,4 – 12,83)2
JKT = 45,99
 Menghitung Jumlah Kuadrat Dalam Kelompok (JKD)
JKD = (Xn – Xn )
JKD = (10 – 12,68)2 + (11 – 12,68)2 + (13 – 12,68)2 + (14,4 – 12,68)2 + (15
– 12,68)2 + (9,8 – 12,72)2 + (11,2 – 12,72)2 + (13,4 – 12,72)2 + (14,2 –
12,72)2 + (15 – 12,72)2 + (11 – 13,07)2 + (12,2 – 13,07)2 + (13,6 – 13,07)2
+ (14,2 – 13,07)2 + (14,4 – 13,07)2
JKD = 18,45 + 18,69+ 8,37 = 45,51
Uji …. (Lanjutan)

 Menghitung Jumlah Kuadrat Antar Kelompok (JKA)


JKA = n1 * (X1 – Xt )2 + n2 * (X2 – Xt )2 + …. + nn * (Xn – Xt )2
JKA = [5*(12,68-12,83)2 ] + [5*(12,72-12,83)2] + [5*(13,07-12,83)2]
JKA = 0,112 + 0,06 + 0,288 = 0,462
 RKA = JKA/dba = 0,462/(3 – 1 )= 0,462/2 = 0,231
 RKD = JKD/dbd = 45,51/12 = 3,79
 F = RKA/RKD = 0,231/3,79 = 0,0609
 Langkah 4 : Menguji varian dengan Uji F
 Fhitung = 0,0609; Ftabel ( = 0,05; dba/dbd = 2/12) = 3,88  Fhitung < Ftabel
 Jika nilai F = 0,0609 dilihat dari tabel dengan numerator = 2 dan
denumerator = 12, terletak di atas angka 2,81 pada area 0,100 
nilai p > 0,100
 Langkah 5 : Keputusan
Nilai Fhitung < Ftabel atau Nilai p uji F > 0,100 (> 0
Keputusan: Ho gagal ditolak (Kita 95% percaya bahwa ketiga cara
pengukuran Hb tersebut tidak berbeda)
PENUGASAN INDIVIDUAL
Suatu penelitian ingin mengetahui perbedaan kadar folat sel darah
pada tiga zat pembius (anestesi) yang berbeda. Data yang berhasil
dikumpulkan adalah sebagai berikut.
Kelompok I: 243, 251, 275, 291, 347, 354, 380, 392

Kelompok II: 206, 210, 226, 249, 255, 273, 285, 295, 309

Kelompok III: 241, 258, 270, 293, 328

Berdasarkan data dimaksud, coba buktikan apakah ada kadar folat


sel darah merah pada ketiga kelompok tersebut dengan alpha 5%.

(
Hubungan Dua Variabel Numerik
 Suatu penelitian pada umumnya ingin melihat adanya hubungan
antara dua variabel numerik, misal usia pasien dengan lama hari
rawat inap Dapat diantisipasi mereka yang cenderung dirawat
inap, dikaitkan dengan manajemen perawatan, dan efisiensi RS
 Pada pengujian hipotesis dengan 2 untuk uji independensi dapat
diketahui ada tidaknya hubungan antara 2 variabel atau lebih 
Tidak dapat diketahui bentuk dan eratnya hubungan
 Bentuk dan eratnya hubungan dapat diketahui melalui Analisis
Regresi dan Korelasi
 Analisis korelasi: Untuk mengetahui keeratan hubungan
 Analisis regresi: Untuk mengetahui bentuk hubungan
 Variabel dependen  Variabel yang akan diramal (satu variabel)
Variabel independenVariabel yang digunakan untuk meramal (> 1)
 Gambaran (pencar) tentang hubungan antara 2 variabel dapat
diketahui melalui titik2 koordinat yang terdapat pada diagram tebar
 Berupa garis lurus (linier) atau garis lengkung (kurva linier) 32
Hubungan … (Lanjutan)
 Kedua bentuk hubungan dapat berupa:
 Garis regresi positif (Perubahan pada variabel independen
diikuti oleh perubahan dengan arah yang sama pada
variabel dependen)
 Garis regresi negatif (Perubahan pada variabel independen
diikuti oleh variabel dependen dengan arah yang
berlawanan)
 Hubungan yang terjadi dapat dilihat dari sifat hubungan:
 hubungan langsung (perubahan pada variabel independen
secara langsung diikuti oleh perubahan pada variabel
dependen; misal: BB dan tinggi badan)
 hubungan tidak langsung (perubahan pada variabel
independen tidak secara langsung mengakibatkan
perubahan pada variabel dependen; misal: derajat
kesehatan masyarakat dengan banyaknya penduduk yang
memiliki mobil) 33
Analisis Korelasi
 Koefisien Korelasi Pearson Product Moment (r)
r = n (XY) – (X . Y)
 n X2 – (X )2   n Y2 – (Y )2 
 Empat Area Kekuatan Hubungan (Colton)
r = 0,00 – 0,25  Tidak ada hubungan /hubungan lemah
r = 0,26 – 0,50  Hubungan sedang
r = 0,51 – 0,75  Hubungan kuat
r = 0,76 – 1,00  Hubungan sangat kuat /sempurna
 Uji Hipotesis
 Langkah 1 = r  menjelaskan derajat hubungan linier 2 variabel
 Langkah 2  Uji hipotesis hubungan antara 2 variabel
 Membandingkan nilai r hitung dengan r tabel
 Uji t
t = r  n – 2 /1 – r2
dk = n – 2 34
n = Jumlah sampel
Analisis … (Lanjutan)
 Contoh Analisis Korelasi
Pasien Usia (X) Lama hari rawat (Y)
1 20 5
2 30 6
3 25 5
4 35 7
5 40 8
 Untuk pembuatan diagram tebar, tiap pengamatan (tiap pasien) digambar
sebagai satu titik  Proyeksi ke absis X, dan ke ordinat Y (Pasien usia 20 dan
lama hari rawat 5, satu titik dengan koordinat X1=20, Y1=5 P1 (20,5)
 Hitung korelasi dan interpretasikan (pola dan keeratan hubungan) serta
lakukan uji statistik !
Pasien Usia = X Lama hari rawat = Y XY X2 Y2
1. 20 5 100 400 25
2. 30 6 180 900 36
3. 25 5 125 625 25
4. 35 7 245 1225 49
5. 40 8 320 1600 64
Jumlah 150 31 970 4750 199
Analisis … (Lanjutan)

 Penyelesaian
 Gambarkan diagram tebar sesuai dengan data usia pasien dan lama
hari rawat
 Menghitung nilai koefisien korelasi Pearson (r)
r = n (XY) – (X . Y)
 n X2 – (X )2   n Y2 – (Y )2 
= 5 (970) – ( 150.31)
5 (4750) – (150)2   5 (199) – (31)2
r = 200 = 200 = 200 = 0,97
 1250 x 34 42500 206,15

 Interpretasi
Berdasarkan besaran nilai r tersebut, maka hubungan antara usia
pasien dengan lama hari rawat sangat kuat, berpola linier positif,
makin tinggi usia pasien, makin lama hari rawatnya
Analisis … (Lanjutan)

 Uji hipotesis/statistik
Ho : Variabel X = Variabel Y
Tidak ada hubungan antara usia pasien dengan lama hari rawat
Ha : Variabel X  Variabel Y
Ada hubungan antara usia pasien dengan lama hari rawat
 Menentukan jenis uji yang digunakan Membandingkan r dan uji t
 Menguji hipotesis dengan membandingkan nilai r
rhitung = 0,97; rtabel (= 0,05; df = 3) = 0,878  rhitung > rtabel
 Menguji hipotesis dengan Uji t
t = r  n – 2 /1 – r2 = 0,975 – 2 /1 – (0,97)2 = 0,97 50,76 = 6,91; dk = 3
t tabel (= 0,05; df = 3) = 3,182  t hitung = 6,91 > t tabel

 Keputusan
1. Membandingkan nilai r : Ho ditolak  Ada hubungan yang bermakna
antara usia pasien dengan lama hari rawat pada  = 0,05
2. Uji t : Ho ditolak  Ada hubungan yang bermakna antara usia pasien
dengan lama hari rawat pada  = 0,05 37
Koefisien Determinasi
 Koefisien determinasi dihitung dari koefisien korelasi Pearson (r)
dengan simbol R2 (R-Square/R-kuadrat)
 Koefisien R-kuadrat (R2) : Besarnya proporsi variasi variabel
dependen (Y) yang dapat dijelaskan oleh variabel independen (X)
 R2 menunjukkan seberapa jauh varabel independen dapat
memprediksi variabel dependen  Semakin besar nilai R2 ,
semakin baik/semakin tepat variabel independen (X)
memprediksi variabel dependen (Y)
 Apabila variasi Y dapat dijelaskan 100% oleh variabel X, berarti X
memang memegang peran dalam perubahan nilai Y, atau dapat
dikatakan sebagai penentu variabel Y.
Besar nilai koefisien determinasi antara 0 – 1 atau 0% – 100% 
Apabila terjadi perubahan nilai X, maka nilai Y pasti akan
berubah.
38
Regresi Linier Sederhana
 Selain koefisien determinasi, dari koefisien korelasi (r), dapat dianalisis
lebih lanjut bagaimana ketergantungan satu variabel terhadap variabel
yang lain  Dengan analisis regresi linier.
 Analisis regresi : Suatu model matematis yang dapat digunakan untuk
mengetahui bentuk hubungan antara dua atau lebih variabel
 Tujuan: Untuk membuat perkiraan nilai suatu variabel (variabel
dependen) melalui variabel lain (variabel independen) Analisis
dengan membuat garis rekaan yang linier pada diagram tebarnya.
Garis rekaan tersebut seakan merupakan penyusutan (regressed) titik2
pengamatan yang tertebar.
 Untuk melakukan prediksi digunakan persamaan garis (metode kuadrat
terkecil /Least square)  Dengan mengetahui persamaan garis regresi
linier tersebut, maka dapat dilihat bagaimana nilai satu variabel
tergantung terhadap variabel yang lain.
 Metode least square: Suatu metode pembuatan garis regresi dengan
cara meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati
dan Y yang diramalkan oleh garis regresi tersebut
 Garis linier secara matematis dapat dibuat persamaannya : Y = a + bx
Regresi … (Lanjutan))
 Y = Variabel tergantung (akibat)/dependen, sedangkan X = Variabel
bebas (prediktor)/independen  Harus ditetapkan mana yang
menjadi variabel dependen (Y), dan mana yang independen (X) serta
harus sesuai dengan tujuan analisis
 Variabel Y: variabel yang lebih sulit diukur dari persamaan garis
regresi linier, dapat dilakukan banyak hal (al: menduga satu nilai
variabel dependen berdasarkan nilai variabel bebasnya)
 Persamaan garis regresi linier untuk contoh kasus tersebut : Lama hari
rawat = a + b Usia pasien
 Garis regresi linier dapat digambarkan apabila koefisien a dan b di
persamaan tersebut diperoleh  dengan “metode kuadrat terkecil”
atau least square method
 Koefisien b (slope), dan a dapat dihitung dari rumus berikut .
b = n(ΣXY) – ( ΣX) (ΣY)
n(ΣX2) – (ΣX)2 a = Y – bX
40
Regresi … (Lanjutan)

 Contoh
Dari kasus korelasi, hitunglah persamaan garis regresi dan prediksikan
pasien yang berumur 40 tahun, berapa lama hari rawatnya ! Berapa
selisih lama hari rawat dengan pasien usia 30 tahun
 Penyelesaian
 Menghitung koefisien a dan b
b = n (ΣXY) – ( ΣX) (ΣY) = 5 (970) – (150)(31) = 4850 – 4650 = 200
n (ΣX2) – (ΣX)2 5 (4750) – 150)2 23750 – 22500 1250
b = 0,16
a = Y – bX  a = (31/5) – (0,16) (150/5) = 6,2 – 4,8 = 1,4
 Persamaan regresi: Lama hari rawat (Y) = 1,4 + 0,16 usia pasien (X)
(Nilai b = 0,16 diartikan bahwa bila pasien yang dirawat usianya
lebih tua 1 tahun , kemungkinan lama hari rawatnya akan lebih
lama 0,16 hari)
 Prediksi lama hari rawat pasien
 Usia 40 tahun = 1,4 + 0,16 (40) = 7,8 hari
 Usia 30 tahun = 1,4 + 0,16 (30) = 6,2 hari
41
Selisih lama hari rawat kedua pasien = 1,6 hari
PENUGASAN INDIVIDUAL
• Survei hubungan umur dengan denyut nadi penduduk dewasa di
daerah X didapatkan data sebagai berikut.
Umur : 20 25 27 29 26 27 28 36 50
Denyut nadi: 80 75 80 77 75 75 74 73 71
Hitunglah:
a. korelasi umur dengan denyut nadi
b. hitung persamaan garis regresi, dan bila ada seseorang berumur 30
tahun prediksikan denyut nadinya
• Seorang dokter Puskesmas ingin mengetahui hubungan antara jumlah
pengunjung dengan obat tetrasiklin yang digunakan, dan ingin
menguji. Dari sampel 6 hari kerja diperoleh data sebagai berikut.
a. Jumlah pengunjung: 60 50 70 40 60 70
b. Jumlah tetrasiklin: 150 140 205 130 165 210
Hitunglah:
a. korelasi jumlah pengunjung dengan jumlah tetrasiklin
b. lakukan uji statistik untuk membuktikan hubungan tersebut
b. hitung persamaan garis regresi, dan bila jumlah pengunjung 90
tahun prediksikan jumlah tetrasiklin yang dibutuhkan ! 42
Sampai Jumpa …

Anda mungkin juga menyukai