Disusun Oleh:
2018
Menghitung Korelasi dan Regresi Linear
A. Korelasi
Analisis kolerasi dapat digunakan untuk mengadakan uraian tentang derajat hubungan
linier antara satu variabel dengan variabel lain. (Budiarto, Eko. 2002. Hakaman 244)
Kolerasi adalah istilah statistik untuk menyatakan derajat hubungan liniear antar dua
variabel. Koefisien derajat hubungan kolerasi antara -1 sampai dengan 1. Dikatakan – 1
jika memilki hubungan kuat yang negarif. Sedangkan jika 1 memiliki hubungan yang kuat
positif. Jika nilai semakin mendekati nilai 0, maka hubungan tersebut semakin melemah.
Dan jika tepat dinilai 0 maka antara 2 variabelnya tidak ada hubungan sama sekali.
(Pramana, Setia. 2016. Halaman 101)
Korelasi berfungsi mengetahui derajat atau keeratan hubungan arah hubungan dua
variabel numerik seperti menentukan kuat lemahnya hubungan berat badan dan tekanan
darah dan positif negatifnya pola dua variabel yang dihubungkan.
Secara sederhana atau visual, hubungan dua variabel dapat dilihat dari diagram
perpotongan nilai data dari dua variabel (X dan Y), pada umumnya dalam grafik, variabel
independen (X) diletakkan pada garis horizontal, sedangkan variabel dependen (Y) pada
garis vertical. Dari diagram tebar (scatter chart), dapat diperoleh informasi tentang pola
hubungan dua variabel, X dengan Y. Selain memberi tentang pola hubungan dari kedua
variabel, diagram tebar dapat juga menggambarkan keeratan hubungan dari kedua variabel
tersebut. (Sabri, Luknis. 2006. Halaman 157)
Derajat keeratan hubungan atau kuat lemahnya hubungan dapat dilihat dari tebaran
datanya. Semakin rapat tebarannya, semakin kuat hubungannya dan sebaliknya semakin
melebar sebarannya, menunjukkan hubungannya semakin lemah. Untuk mengetahui lebih
tepat besar atau derajat hubungan dua variabel, digunakan koefisien kolerasi Pearson
Product-Moment yang disimbolkan dengan huruf “r”.
r= n (ΣXY) – ( ΣX ΣY)
√𝑛𝛴𝑥 2 -(ΣX)2] [nΣY2- (ΣY)2]
Nilai kolerasi (r) berkisar 0 s.d 1 atau bila dengan disertai arahnya nilainya antara -1
s.d + 1. (Sabri, Luknis.2006. Halaman 159)
r=0 tidak ada hubungan linear
r = -1 hubungan linear negatif sempurna
r = +1 hubungan linear positif sempurna
Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan positif terjadi
bila kenaikan satu variabel diikuti kenaikan variabel yang lain, misalnya semakin
bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya. Sementara
itu, hubungan negatif dapat terjadi bila kenaikan satu variabel diikuti penurunan variabel
lainnya, misalnya semakin bertambah umur (semain tua) semakin rendah kadar Hb-nya.
Uji Hipotesis
(Sabri, Luknis. 2006. Halaman 159-160)
Koefisien kolerasi yang telah dihasilkan merupakan langkah pertama untuk
menjelaskan derajat hubungan linier anatar satu variabel. Selanjutnya perlu dilakukan uji
hipotesis untuk mengetahui apakah hubungan anatar dua variabel terjadi secara signifikan
atau hanya karena faktor kebetulan dari random sample (by change). Uji hipotesis dapat
dilakukan dengan dua cara, yaitu pertama membandingkan nilai r hitung dengan r tabel,
kedua menggunakan pengujian dengan pendekatan distribusi t. Pada modul ini kita
gunakan pendekatan distribusi t, dengan formula sebagai berikut:
n−2
t= 𝑟=√ se = √∑ 𝑌 − 𝑎 ∑ 𝑌 − 𝑏 ∑ 𝑋𝑌
1 − r2
n-2
df = n-2
n = jumlah sampel
Koefisien Determinasi (R2)
(Grace, Korompis. 2015. Biostatistika Untuk Keperawatan. Halaman 160)
Ukuran yang penting dan sering digunakan dalam analisis regresi adalah koefisien
determinasi atau disimbolkan R2 (R square). Koefisien detrminasi dapat dihitung dengan
menguadratkan nilai r, atau dengan formula R2 = r2. Koefisien detrminasi berguna untuk
mengetahui besaran variasi variabel dependen (Y)yang dapat dijelaskan oleh variabel
independen (X). Dengan kata lain, R2 menunjukkan kemampuan variabel independen
dalam memprediksi variabel independen. Semakin besar nilai R square, semakin baik atau
semakin tepat variabel independen memprediksi variabel dependen. Besarnya nilai R
square 0 s.d 1 atau 0% s.d 100%.
Y = a + bx
+
Persamaan diatas merupakan model deterministic yang secara sempurna/ tepat dapat
digunakan hanya untuk peristiwa alam. Sebagai contoh hukum gravitasi bumi yang
ditemukan oleh Issac Newton merupakan contoh model deterministic. Variabel kecepatan
benda jatuh (variabel dependen) pada keadaan yang ideal adalah fungsi matematik
sempurna ( bebas dari kesalahan) dari variabel independen berat beda dan gaya gravitasi.
Contoh lain misalnya hubungan antar suhu Farenheit dengan suhu Celsius dapat
dibuat persamaan Y = 32 + 9/5X. Variabel suhu Farenheit (Y) dapat dihitung / diprediksi
secara sempurna / tepat (bebas kesalahan) bila suhu Celsius (X) diketahui.
Ketika berhadapan pada kondisi ilmu sosial, ada kemungkinan terjadi kesalahan atau
penyimpangan (tidak eksak) pada hubungan antar variabel, artinya untuk beberapa nilai X
yang sama kemungkinan diperoleh nilai Y yang berbeda. Misalnya, pada hubungan berat
badan dengan tekanan darah, tidak setiap orang yang berta badannya sama memiliki
tekanan darah yang sama. Karena hubungan X dan Y pada ilmu sosial atau kesehatan
masyarakat tidak eksak, persamaaan garis yang dibentuk menjadi:
Y = a + bx+ e
Y = Variabel Dependen
X = Variabel Independen
a = intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = slope, perkiraan besarnya perubahan nilai variabel Y bila nilai variabel Y bila nilai
variabel X berubah satu unit pengukuran
e = nilai kesalaha (error) yaitu selisih antara nilai Y individu yang teramati dengan nilai Y
yang sesungguhnya pada titik X tertentu
b = 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 a = Y - bX
𝑛 ∑ 𝑋2 − (∑ 𝑋𝑌) 2
Y = a + Bx + e
Kesalahan Standar Estimasi (Standard Error of Estimate / Se)
se = √∑ 𝑌 − 𝑎 ∑ 𝑌 − 𝑏 ∑ 𝑋𝑌
n-2
1. Menghitung Kolerasi
(Grace, Korompis. 2015. Biostatistika Untuk Keperawatan. Halaman 163-164)
Contoh perhitungan
Kasus kolerasi
Survey ingin mengetahui hubungan antara usia dan lama hari rawat di RS X tahun 2013.
Survey menggunakan sampel berjumlah 5 pasien dengan hasil sebagai berikut:
Umur 20 30 25 35 40 tahun
r = [5*970-(150)(31)]√ [5*4750-(150)2]
= [5*199-(31)2]
= 0,97
2. Interprestasi hasil perhitungan: hubungan umur dengan lama hari rawat menunjukkan
hubungan yang sangat kurang (r = 0,97) dan berpola liniear positif. Hal ini berarti
bahwa semakin tua umur pasien, semakin lama hari rawatnya.
Nilai b = 0,16: dapat diartikan bahwa bila pasien yangdirawat usianya lebih tua satu
tahun, kemungkinan lama-hari-rawatnya akan lebih lama 0,16 hari.
Pasien berusia 40 tahun dapat diperikirakan lama hari rawat nya dengan
menghitung dari persamaan regresi linear diatas, yaitu = 1,4 + 0,16 (40) = 7,8 hari.
Sementara itu, pasien pada usia 30 tahun = 1,4 + 0,16 (30) = 6,2 hari. Selisih lama
hari rawat pada kedua lebi lama adalah 1,6 hari.
DAFTAR PUSTAKA
Sabri, Luknis. 2006. Statistik Kesehatan. Depok: PT. Raja Grafindo Perdasa.
Budiarto, Eko. 2002. Biostatistika Untuk Kedokteran Dan Kesehatan Masyarakat. Jakarta:
EGC.
Pramana, Setia. 2016. Dasar-Dasar Statistik Dengan Software R Konsep dan Aplikasi.
Bogor: In Media.