Anda di halaman 1dari 9

Menghitung Korelasi dan Regresi Linear

Disusun Oleh:

Nama Kelompok : Azaria Fidella (1780100006)

Pebri Agtosan (178010000 )

Dosen Pembimbing : Wulan Anggraini, S.KM., M.KM.

Program Studi Kesehatan Masyarakat

Fakultas Ilmu Kesehatan

Universitas Muhammadiyah Bengkulu

2018
Menghitung Korelasi dan Regresi Linear

A. Korelasi
Analisis kolerasi dapat digunakan untuk mengadakan uraian tentang derajat hubungan
linier antara satu variabel dengan variabel lain. (Budiarto, Eko. 2002. Hakaman 244)
Kolerasi adalah istilah statistik untuk menyatakan derajat hubungan liniear antar dua
variabel. Koefisien derajat hubungan kolerasi antara -1 sampai dengan 1. Dikatakan – 1
jika memilki hubungan kuat yang negarif. Sedangkan jika 1 memiliki hubungan yang kuat
positif. Jika nilai semakin mendekati nilai 0, maka hubungan tersebut semakin melemah.
Dan jika tepat dinilai 0 maka antara 2 variabelnya tidak ada hubungan sama sekali.
(Pramana, Setia. 2016. Halaman 101)
Korelasi berfungsi mengetahui derajat atau keeratan hubungan arah hubungan dua
variabel numerik seperti menentukan kuat lemahnya hubungan berat badan dan tekanan
darah dan positif negatifnya pola dua variabel yang dihubungkan.
Secara sederhana atau visual, hubungan dua variabel dapat dilihat dari diagram
perpotongan nilai data dari dua variabel (X dan Y), pada umumnya dalam grafik, variabel
independen (X) diletakkan pada garis horizontal, sedangkan variabel dependen (Y) pada
garis vertical. Dari diagram tebar (scatter chart), dapat diperoleh informasi tentang pola
hubungan dua variabel, X dengan Y. Selain memberi tentang pola hubungan dari kedua
variabel, diagram tebar dapat juga menggambarkan keeratan hubungan dari kedua variabel
tersebut. (Sabri, Luknis. 2006. Halaman 157)
Derajat keeratan hubungan atau kuat lemahnya hubungan dapat dilihat dari tebaran
datanya. Semakin rapat tebarannya, semakin kuat hubungannya dan sebaliknya semakin
melebar sebarannya, menunjukkan hubungannya semakin lemah. Untuk mengetahui lebih
tepat besar atau derajat hubungan dua variabel, digunakan koefisien kolerasi Pearson
Product-Moment yang disimbolkan dengan huruf “r”.

(Sabri, Luknis. 2006. Halaman 158)

Koefisien kolerasi (r) dapat diperoleh dari formula sebagai berikut:

r= n (ΣXY) – ( ΣX ΣY)
√𝑛𝛴𝑥 2 -(ΣX)2] [nΣY2- (ΣY)2]
Nilai kolerasi (r) berkisar 0 s.d 1 atau bila dengan disertai arahnya nilainya antara -1
s.d + 1. (Sabri, Luknis.2006. Halaman 159)
r=0 tidak ada hubungan linear
r = -1 hubungan linear negatif sempurna
r = +1 hubungan linear positif sempurna

Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan positif terjadi
bila kenaikan satu variabel diikuti kenaikan variabel yang lain, misalnya semakin
bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya. Sementara
itu, hubungan negatif dapat terjadi bila kenaikan satu variabel diikuti penurunan variabel
lainnya, misalnya semakin bertambah umur (semain tua) semakin rendah kadar Hb-nya.

r = 0,00 – 0,25 tidak ada hubungan / hubungan lemah


r = 0,26 – 0,50 hubungan sedang
r = 0,51 – 0,75 hubungan kuat
r = 0,76 – 1,00 hubungan sangat kuat / sempurna

Uji Hipotesis
(Sabri, Luknis. 2006. Halaman 159-160)
Koefisien kolerasi yang telah dihasilkan merupakan langkah pertama untuk
menjelaskan derajat hubungan linier anatar satu variabel. Selanjutnya perlu dilakukan uji
hipotesis untuk mengetahui apakah hubungan anatar dua variabel terjadi secara signifikan
atau hanya karena faktor kebetulan dari random sample (by change). Uji hipotesis dapat
dilakukan dengan dua cara, yaitu pertama membandingkan nilai r hitung dengan r tabel,
kedua menggunakan pengujian dengan pendekatan distribusi t. Pada modul ini kita
gunakan pendekatan distribusi t, dengan formula sebagai berikut:

n−2
t= 𝑟=√ se = √∑ 𝑌 − 𝑎 ∑ 𝑌 − 𝑏 ∑ 𝑋𝑌
1 − r2
n-2
df = n-2
n = jumlah sampel
Koefisien Determinasi (R2)
(Grace, Korompis. 2015. Biostatistika Untuk Keperawatan. Halaman 160)
Ukuran yang penting dan sering digunakan dalam analisis regresi adalah koefisien
determinasi atau disimbolkan R2 (R square). Koefisien detrminasi dapat dihitung dengan
menguadratkan nilai r, atau dengan formula R2 = r2. Koefisien detrminasi berguna untuk
mengetahui besaran variasi variabel dependen (Y)yang dapat dijelaskan oleh variabel
independen (X). Dengan kata lain, R2 menunjukkan kemampuan variabel independen
dalam memprediksi variabel independen. Semakin besar nilai R square, semakin baik atau
semakin tepat variabel independen memprediksi variabel dependen. Besarnya nilai R
square 0 s.d 1 atau 0% s.d 100%.

B. Regresi Linear Sederhana


Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk
mengetahui bentuk hubungan antara dua atau lebih variabel. Tujuan analisis regresi adalah
untuk membuat perkiraan (prediksi) nilai suatu variabel (variabel dependen) melalui
variabel yang lain (variabel independen). (Sabri, Luknis. 2006. Halaman 160)
Sebagai contoh, kita ingin kita ingin menghubungkan dua variabel numeric berat
badan dan tekanan darah. Dalam kasus ini, berarti berat badan sebagai variabel independen
dan tekana darah sebagai dependen sehingga dengan regresi kita dapat memperkirakan
besarnya nilai tekanan darah bila diketahui data berat badan. (Sabri, luknis. 2006.
Halaman 160)
Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh dengan
berbagai cara/ metode. Salah satu cara yang sering digunakan oleh peneliti adalah dengan
menggunakan metode kuadrat terkecil (least kuadrat). Metode last square merupakan suatu
metode pembuatan garis regresi dengan cara meminimalkan jumlah kuadrat jarak antara
nilai Y yang teramati dan Y yang diramalkan oleh garis regresi itu. Secara sistematis
persamaan garis adalah sebagai berikut: (Sabri, Luknis. 2006. Halaman 160-161)

Y = a + bx
+
Persamaan diatas merupakan model deterministic yang secara sempurna/ tepat dapat
digunakan hanya untuk peristiwa alam. Sebagai contoh hukum gravitasi bumi yang
ditemukan oleh Issac Newton merupakan contoh model deterministic. Variabel kecepatan
benda jatuh (variabel dependen) pada keadaan yang ideal adalah fungsi matematik
sempurna ( bebas dari kesalahan) dari variabel independen berat beda dan gaya gravitasi.
Contoh lain misalnya hubungan antar suhu Farenheit dengan suhu Celsius dapat
dibuat persamaan Y = 32 + 9/5X. Variabel suhu Farenheit (Y) dapat dihitung / diprediksi
secara sempurna / tepat (bebas kesalahan) bila suhu Celsius (X) diketahui.
Ketika berhadapan pada kondisi ilmu sosial, ada kemungkinan terjadi kesalahan atau
penyimpangan (tidak eksak) pada hubungan antar variabel, artinya untuk beberapa nilai X
yang sama kemungkinan diperoleh nilai Y yang berbeda. Misalnya, pada hubungan berat
badan dengan tekanan darah, tidak setiap orang yang berta badannya sama memiliki
tekanan darah yang sama. Karena hubungan X dan Y pada ilmu sosial atau kesehatan
masyarakat tidak eksak, persamaaan garis yang dibentuk menjadi:

(Sabri, Luknis. 2006. Halaman 162)

Y = a + bx+ e

Y = Variabel Dependen
X = Variabel Independen
a = intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = slope, perkiraan besarnya perubahan nilai variabel Y bila nilai variabel Y bila nilai
variabel X berubah satu unit pengukuran
e = nilai kesalaha (error) yaitu selisih antara nilai Y individu yang teramati dengan nilai Y
yang sesungguhnya pada titik X tertentu

b = 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 a = Y - bX
𝑛 ∑ 𝑋2 − (∑ 𝑋𝑌) 2

Y = a + Bx + e
Kesalahan Standar Estimasi (Standard Error of Estimate / Se)

Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan


estimasi untuk menjelaskan nilai variabel dependen yang sesungguhnya. Semakin
kecil nilai Se, semakin tinggi ketepatan persamaan estimasi yang dihasilkan untuk
menjelaskan nilai variabel dependen yang sesungguhnya. Dan sebaliknya, semakin
rendah ketepatan persamaan estimasi yang yang dihasilkan untuk menjelaskan nilai
variabel dependen yang sesungguhnya. Untuk mengetahui besarnya Se dapat dihitung
melalui formula sebagai berikut:

se = √∑ 𝑌 − 𝑎 ∑ 𝑌 − 𝑏 ∑ 𝑋𝑌
n-2

C. Menghitung Korelasi dan Regresi Linear

1. Menghitung Kolerasi
(Grace, Korompis. 2015. Biostatistika Untuk Keperawatan. Halaman 163-164)

Contoh perhitungan

Kasus kolerasi

Survey ingin mengetahui hubungan antara usia dan lama hari rawat di RS X tahun 2013.
Survey menggunakan sampel berjumlah 5 pasien dengan hasil sebagai berikut:

Umur 20 30 25 35 40 tahun

Lama dirawat 5 6 5 7 8 hari

Hitung kolerasi dan interprestasikan!

Pasien Umur = X Lama hari XY X2 Y2


rawat = Y
1 20 5 100 400 25
2 30 6 180 900 36
3 25 5 125 625 25
4 35 7 245 1225 49
5 40 8 320 1600 64
5 150 31 970 4750 199
Jawaban :
1. Buatlah tabel kerja sebagai berikut:
Berdasarkan hasil tabel kerja tersebut, maka koefisien kolerasi r berdasarkan rumus
sebagai berikut:

r = [5*970-(150)(31)]√ [5*4750-(150)2]
= [5*199-(31)2]
= 0,97
2. Interprestasi hasil perhitungan: hubungan umur dengan lama hari rawat menunjukkan
hubungan yang sangat kurang (r = 0,97) dan berpola liniear positif. Hal ini berarti
bahwa semakin tua umur pasien, semakin lama hari rawatnya.

Kasus regresi linear sederhana


Berdasarkan soal pada kasus kolerasi tersebut, hitung persamaan garis regresi
dan prediksikan berapa lama hari rawat pasien yang berumur 40 tahun!
Jawaban:
a. Dengan menggunakan contoh data tersebut, dapat dihitung koefisien a dan b
seperti berikut:
b = [5*970-(150)(21)]√5*4750-(150)2] = 0,16
a = (31,5)-(0,16)(150/5) = 1,4
b. Persamaan regresi linear untuk contoh data dapat ditulis sebagai berikut:
Y= a+bx
Lama hari rawat = 1,4 + 0,16 usia pasienn
3. Nilai b = 0,16 dapat berarti bila pasien yang dirawat berusia lebih tua satu tahun,
kemungkinan lama hari rawatnya akan lebih lama 0,16 hari.
4. Karena pasien berusia 40 tahun, perkiraan lama hari rawatnya dapat dihitung dengan
persamaan regresi linear tersebut:
Lama hari rawat = 1,4 + 0,16 usia pasien
= 1,4 + 0,16 (40)
= 7,8 hari
Sementara itu, lama pasien berusia 30 tahun adalah 1,4 + 0,16 (30) = 6,2 hari.
Dengan demikian, selisih lama hari rawat pada kedua pasien adalah 1,6 hari.
2. Menghitung Regresi
(Grace, Korompis. 2015. Biostatistika Untuk Keperawatan. Halaman 164-165)

Kasus Regresi Liner Sederhana


Dari soal diatas coba hitung persamaan garis regresi dan prediksikan pasien
yang berumur 40 tahun berapa lama hari rawatnya!
Dengan demikian contoh data diatas, dapat dihitung koefisien a dan b seperti
berikut:
b = [5*970 – ((150) (30)/[5*4750-(150)2] = 0,16
a = (31/5) – (0,16)(150/5) = 1,4
Persamaan rergresi linear untuk contoh data dapat ditulis sebagai berikut:

Lama-har-rawat = 1,4 + 0,16 Usia-pasien

Nilai b = 0,16: dapat diartikan bahwa bila pasien yangdirawat usianya lebih tua satu
tahun, kemungkinan lama-hari-rawatnya akan lebih lama 0,16 hari.

Pasien berusia 40 tahun dapat diperikirakan lama hari rawat nya dengan
menghitung dari persamaan regresi linear diatas, yaitu = 1,4 + 0,16 (40) = 7,8 hari.
Sementara itu, pasien pada usia 30 tahun = 1,4 + 0,16 (30) = 6,2 hari. Selisih lama
hari rawat pada kedua lebi lama adalah 1,6 hari.
DAFTAR PUSTAKA

Sabri, Luknis. 2006. Statistik Kesehatan. Depok: PT. Raja Grafindo Perdasa.

Budiarto, Eko. 2002. Biostatistika Untuk Kedokteran Dan Kesehatan Masyarakat. Jakarta:
EGC.

Grace, Korompis. 2015. Biostatistika Untuk Keperawatan. Jakarta: EGC.

Pramana, Setia. 2016. Dasar-Dasar Statistik Dengan Software R Konsep dan Aplikasi.
Bogor: In Media.

Anda mungkin juga menyukai