Anda di halaman 1dari 6

BAB 12

UJI KORELASI DAN REGRESI LINIER

1. Konsep Dasar Uji Korelasi dan Regresi Linier


1.1 Uji Korelasi
Analisis uji statistik yang menghubungkan data numerik dengan data numerik
dikenal dengan Uji Korelasi atau Regresi Linier. Uji korelasi dapat digunakan untuk
mengetahui kekuatan atau keeratan hubungan serta arah hubungan antara dua variabel
numerik. Misalnya :
 seorang peneliti ingin menilai hubungan antara berat badan dengan tekanan
darah.
 seorang peneliti ingin menilai hubungan umur dengan kadar Hb
Secara visual hubungan antara dua variabel numerik dapat dilihat dari diagram
tebar/pencar (Scatter Plot). Diagram tebar merupakan grafik yang menunjukkan titik-titik
perpotongan nilai data dari dua variabel yaitu X dan Y. Pada diagram tebar sumbu X
merupakan variabel independent dan sumbu Y merupakan variabel dependen.
Berikut merupakan contoh diagram tebar :

Dari gambar diagram tebar diatas dapat diperoleh informasi tentang pola
hubungan antara dua variabel yaitu X (independent) dan Y (dependen). Selain pola
hubungan diagram tebar juga memperlihatkan gambaran keeratan hubungan dari kedua
variabel tersebut. Apabila polanya membentuk garis lurus maka dapat ditelusuri lebih
lanjut apakah linier positif atau negatif.
 Pola linier positif berarti makin tinggi nilai satu variabel maka tinggi pula nilai
variabel yang lain. Contoh, semakin bertambah berat badan seseorang maka
akan semakin tinggi tekanan darahnya.
 Pola linier negatif berarti makin tinggi nilai satu variabel maka makin rendah nilai
variabel yang lain, dan sebaliknya. Contoh, semakin bertambah umur seseorang
(tua) semakin rendah kadar Hb nya.

1.1.1 Kekuatan Hubungan


Kekuatan hubungan antara dua variabel numerik dapat diketahui dengan
menghitung nilai kofesien korelasi pearson yang dilambangkan dengan r. Koefisen r
akan berkisar antara 0 sampai 1, dimana 0 berarti tidak ada hubungan linier dan 1
berarti hubungan linier sempurna. Selain besaran koefisien korelasi r, dapat pula dilihat
pola dari hubungan antara dua variabel tersebut apakah berpola positif atau negatif.
Apabila nilai r kecil bukan berarti tidak ada hubungan antara kedua variabel, namun
mungkin hubungan berbentuk non-linier misalnya lengkung parabolic atau lengkung
eksponensial.

Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat dibagi dalam
empat area sebagai berikut :
r = 0,00 – 0,25  tidak ada hubungan / hubungan lemah
r = 0,26 – 0,50  hubungan sedang
r = 0,51 – 0,75  hubungan kuat
r = 0,76 – 1,00  hubungan sangat kuat / sempurna

Rumus koefisen korelasi (r) adalah sebagai berikut :


Contoh soal :
Seorang peneliti ingin melihat hubungan antara usia pasien dengan lama hari rawat
dengan n = 5 pasien. Berikut data usia dan lama hari rawat dari 5 pasien :

Dari data tersebut dapat kita hitung nilai korelasi r nya sebagai berikut :
r = [5 *970-(150)(31)]/[5*4750-(150)2][5*199-(31)2)= 0,97
Nilai r = 0,97 (linier positif) artinya  hubungan antara usia pasien dengan lama rawat
pasien sangat kuat, dimana semakin tinggi usia pasien (semakin tua) maka akan makin
lama hari rawatnya.

1.2 Regresi Linier Sederhana


Analisis regresi merupakan model matematis yang dapat digunakan untuk
mengetahui bentuk hubungan antara dua atau lebih variabel. Tujuan dari analisis regresi
adalah untuk membuat prediksi nilai suatu variabel (Y) melalui variabel lainnya (X).
Misalkan kita ingin melihat hubungan usia pasien dengan lama hari rawat pasien, maka
pada kasus ini usia pasien merupakan variabel independent (X) dan lama hari rawat
pasien adalah variabel dependen (Y).
Dari nilai koefisien korelasi r di atas kita bisa melakukan analisis lebih lanjut untuk
melihat ketergantungan satu variabel terhadap variabel lainnya. Misalnya, bagaimana
lama rawat pasien tergantung dari usia pasien. Analisi regresi linier dilakukan untuk
memprediksi hubungan kedua variabel diatas dengan menggunakan persamaan garis
dengan berbagai metode. Salah satu metode yang digunakan adalah menggunakan
“metode kuadrat terkecil” atau least square. Metode ini dilakukan dengan cara
meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan Y yang diramalkan
oleh garis regresi itu.
Garis linier secara matematis dapat dibuat dengan persamaan sebagai berikut:

Y = a + bX

Y = Variabel dependen
X = Variabel Independen
a= Intercept
b= Slope

Koefisen a (intercept) disebut sebagai nilai awal atau intercept yang dapat diartikan
sebagai besarnya nilai variabel Y, bila variabel X bernilai nol.
Berikut merupakan rumus menghitung koefisen a :

Koefisen b (slope) dapat diartikan sebagai besarnya


perubahan nilai variabel Y apabila nilai variabel X berubah sebesar satu unit (satuannya).
Berikut merupakan rumus menghitung koefisen b :

Dengan menggunakan contoh kasus data usia pasien dengan lama hari rawat maka dapat
dihitung nilai koefisien a dan b sebagai berikut :
b = [970 – ((150)(31)/5)] / [4750 – (150)2/5] = 0,16
a = (31/5) – (0,16)(150/5) = 1,4
Maka dapat dibuat persamaan regresi linier untuk contoh data diatas sebagai
berikut:
Lama hari rawat pasien = 1,4 + 0,16 Usia pasien
Berdasarkan persamaan diatas jika pasien berusia 40 tahun dapat diperkirakan lama
hari rawatnya adalah = 1,4 + 0,16*40 = 7,8 hari. Sedangkan pasien yang berumur 30
tahun =1,4 + 0,16*30 = 6,2 hari.

1.2.1 Koefisien Determinasi


Koefisien Determinasi yang dilambangkan dengan R-kuadrat (R 2) merupakan nilai
yang bisa menjelaskan berapa besar proporsi variabel Y yang dapat dijelaskan oleh
variabel X. Koefisien Determinasi (R2) dapat dihitung dengan mengkuadratkan nilai r.
besarnya nilai R2 berkisar antara 0-1 atau 0%-100%. Semakin besar nilai R 2 maka akan
semakin baik dan semakin tepat variabel X (independent) dapat memprediksi variabel Y
(dependen).

r 2 = R2

Contoh :
Diketahui nilai r = 1 maka R2 = 1 atau 100%. Artinya, variabel X 100% dapat memprediksi
variabel Y.
1.2.2 Kesalahan Standar Estimasi (Standard Error of Estimate / Se)
Kesalahan standar estimasi atau Se disebut juga sebagai kesalahan baku estimasi
selisih taksir standar. Suatu garis regresi dianggap tepat jika semua titik yang mewakili
nilai dalam diagram tebar mendekati garis regresi (linier). Pada kenyatannya, sedekat
apapun titik nilai terhadap garis regresi penyimpangan akan sangat mungkin terjadi.
Besarnya nilai Se menunjukkan ketapatan persamaan estimasi untuk menjelaskan nilai
variabel dependen yang sesungguhnya. Semakin kecil nilai Se maka semakin tinggi
ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel
dependen yang sesunggunya, dan sebaliknya.
Berikut merupakan rumus menghitung Standard Error of Estimate / Se :

Anda mungkin juga menyukai