Anda di halaman 1dari 22

Korelasi dan Regresi

Linear
 
Hadi Nugroho, SKM., M.Epid.
A. Pendahuluan
 Sering kali dalam suatu penelitian kita ingin mengetahui
hubungan antara dua variabel yang berjenis numerik, misalnya
hubungan berat badan denggan tekanan darah, hubungan umur
dengan kadar Hb, dsb.
 Dari hubungan antara dua variabel numerik dapat dihasilkan
dua jenis, yaitu derajat atau keeratan hubungan, digunakan
korelasi. Sementari itu bila ingin mengetahui bentuk hubungan
antara dua variabel digunakan analisis regresi linear.
B. Korelasi
 Disampinng berfungsi untuk mengetahui derajat atau keeratan
hubungan, korelasi juga berfungsi untuk mengetahui arah
hubungan dua variabel numerik, misalnya; apakah hubungan
berat badan dan tekanan darah mempunyai derajat hubungan
yang kuat atau lemah da apakah kedua variabel tersebut
berpola positif atau negatif.
 Pola hubungan ini secara sederhana dapat dilihat dari diagram
tebar/ pencar (scatter plot).
 Diagram tebar adalah grafik yang menunjukkan titik-titik
perpotongan nilai data dari dua variabel (X dan Y)
Linear Positif
Y-Values
10
9
8
7
6
Y-Values
5
4
3
2
1
0
0 5 10 15 20 25
Linear negatif
Y-Values
10
9
8
7
6
Y-Values
5
4
3
2
1
0
0 5 10 15 20 25
Tak ada hubungan
Y-Values
6

4
Y-Values
3

0
0 5 10 15 20 25
 Derajat keeratan hubungan (kuat lemahnya hubungan) dapat dilihat
dari tebaran datanya. Semakin rapat tebarannya, semakin kuat
hubungannya dan sebaliknya semakin melebar tebarannya
menunjukkan hubungannya semakin lemah.
 Untuk mengetahui lebih tepat besar /derajat hubungan dua variabel
digunakan Koefisien Korelasi Pearson Product Moment, dimana
koefisien korelasi disimbolkan dengan r (huruf r kecil)
 Rumus :
 Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya,
nilainya antara -1 s.d. +1
r= 0  tidak ada hubungan linear
r= -1  hubungan linear negatif sempurna
r= +1  hubungan linear positif sempurna
 Hubungan dua variabel dapat berpola positif maupun negatif.
 Hubungan positif terjadi bila kenaikan satu variabel diikuti
kenaikan variabel yang lain, misalnya semakin bertambah berat
badannya (semakin gemuk) semakin tinggi tekanan darahnya.
 Sementara itu, hubungan negatif dapat terjadi bila kenaikan satu
variabel diikuti penurunan variabel yang lain, misalnya; semakin
bertambah umur (semakin tua) semakin rendah kadar Hb-nya.
 menurut Colton, kekuatan hubungan dua variabel secara kualitatif
dapat dibagi dalam empat area, sebagai berikut:
1. r= 0,00 – 0,25  tidak ada hubungan/hubungan lemah
2. r= 0,26 – 0,50  hubungan sedang
3. r= 0,51 – 0,75  hubungan kuat
4. r= 0,76 – 1,00  hubungan sangat kuat/sempurna
 Uji Hipotesis
o Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk
menjelaskan derajat hubungan linier antara dua variabel. Langkah
selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah
hubungan antara dua variabel terjadi secara signifikan atau hanya karena
faktor kebetulan dari random sample (by chance).
o Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama
membandingkan nilai r hitung dengan r tabel, kedua menggunakan
pengujian dengan pendekatan distribusi t. (dalam slide ini yang digunakan
dengan pendekatan distribusi t)
o Rumus
• df= n – 2
• n= jumlah sampel
B. Regresi Linier Sederhana
 Seperti sudah diuraikan di depan bahwa analisis hubungan dua
variabel dapat digunakan untuk mengetahui bentuk hubungan dua
variabel, yaitu analisis regresi.
 Analisis regresi merupakan suatu model matematis yang dapat
digunakan untuk mengetahui bentuk hubungan antara dua atau
lebih variabel. Tujuan analisis ini adalah untuk membuat perkiraan
(prediksi) nilai suatu varibel (variabel dependen) melalui
variabel yang lain (variabel independen).
 Contoh: kita ingin menghubungan dua variabel numerik berat
badan dan tekanan darah. Dalam kasus ini berarti berat badan
sebagai variabel independen dan tekanan darah sebagai variabel
dependen sehingga dengan regresi kita dapat memperkirakan
besarnya nilai tekanan darah bila diketahui data berat badan.
 Untuk dapat melakukan prediksi digunakan persamaan garis yang dapat
diperoleh dengan berbagai cara/metode. Salah satu cara yang sering
digunakan oleh peneliti adalah dengan menggunakan metode kuadrat
terkecil (least square). Metode ini merupakan suatu metode pembuatan
garis regresi dengan cara meminimalkan jumlah kuadrat jarak antara nilai Y
yang teramati dan Y yang diramalkan oleh garis regresi itu.
 Rumus Matematika Persamaan Regresi Linear :
 Y= a + bx
 Persamaan diatas merupakan model deterministik yang secara
sempurna/tepat dapat digunakan hanya untuk peristiwa alam.
 Ketika dihadapkan pada kondisi ilmu sosial, ada kemungkinan terjadi
kesalahan atau penyimpangan (tidak eksak) pada hubungan antarvariabel,
artinya untuk beberapa nilai X yang sama kemungkinan diperoleh nilai Y
yang berbeda.
 Maka rumus yang digunakan adalah???
 Rumus matematika yang digunakan adalah:
 Y= a + bx + e
 Keterangan
o Y= variabel dependen
o x= variabel independen
o a= intercept, perbedaan besarnya rata-rata variabe Y ketika variabel x= 0
o b= slope, perkiraan besarnya perubahan nilai variabel Y bila nilai variabel
X berubah satu unit pengukuran
o e= nilai kesalahan (error) yaitu selisih antara nilai Y individual yang
teramati dengan nilai Y yang sesungguhnya pada titik x tertentu.
o b= a= - b
Kesalahan Standar Estimasi
(Standard Error of Estimate/Se)
 Besarnya kesalahan standar estimasi (Se) menunjukkan
ketepatan persamaan estimasi untuk menjelaskan nilai varibel
dependen yang sesungguhnya. Semakin kecil nilai Se, semakin
tinggi ketepatan persamaan estimasi yang dihasilkan untuk
menjeaskan nilai variabel dependen yang sesungguhnya. Dan
sebaliknya, semakin besar nilai Se, semakin rendah ketepatan
persamaan estimasi yang dihasilkan untuk menjelaskan nilai
variabel dependen yang sesungguhnya.
 Rumus: Se=
Koefisien Determinasi (R ) 2

 Ukuran yang pentin dan sering digunakan adalam analisis


regresi adalah koefisien determinasi atau disimbolkan dengan R2
(R square).
 Koefisien determinasi dapat dihitung dengan menguadratkan
nilai r, atau dengan formula R2 = r2 .
 R2 berguna untuk mengetahui seberapa besar variasi variabel
dependen (Y) dapat dijelaskan oleh variabel independen (X),
atau dengan kata lain, R2 menunjukkan seberapa jauh variabel
independen dapat memprediksi variabel dependen.
 Semakin besar nilai R2 semakin baik atau semakit tepat variabel
independen memprediksi variabel dependen. Besarnya nilai R2
antara 0 s.d. 1.
Contoh Kasus Penghitungan

Korelasi
Suatu survei ingin mengetahui hubungan antara usia dengan lama hari rawat di
RS X tahun 2008, survei dengan mengambil sampel 5 pasien dan hasilnya
sebagai berikut.:
o Umur : 20 30 25 35 40 (tahun)
o Lama dirawat : 5 6 5 7 8 (hari)
o Hitunglah korelasinya dan interpretasikan?!
Pasien Usia adalah
o Langkahnya (X) membuat
Lama Rawat XY dahulu
tabel kerja terlebih X2 Y2
(Y)
1 20 5 100 400 25
2 30 6 180 900 36
3 25 5 125 625 25
4 35 7 245 1225 49
5 40 8 320 1600 64
S 150 31 970 4750 199
 Berdasarkan tabel tersebut, maka dapat dihitung koefisien
korelasi r sbb:

o r= 0,97

o Interpretasi: hubungan umur dengan lama hari rawat menunjukkan


hubunganyang sangat kuat (0,97) dan berpola linear positif, artinya
semakin tinggi usia pasien, semakin lama hari rawatnya.
 Kasus Regresi Linear Sederhana
o Melanjutkan soal korelasi yang tadi, coba hitung persamaan garis regresi dan
prediksikan pasien yang berumur 40 tahun berapa lama hari rawatnya?
o Dengan memakai contoh data diatas, dapat dihitung koefisien a dan b sebagai
berikut:
o b=
o b=  0,16
o a= - b
o a= (31/5) – [0,16 * (150/5)  1,4
o Persamaannya  Y= a + bx
 lama hari rawat = 1,4 + 0,16*umur pasien (40)  7,8 hari
PR
 Survei hubungan umur dengan denyut nadi penduduk dewasa
di daerah X didapatkan data sebagai berikut:
 Umur : 20 25 27 29 26 27 28 36 50
 Nadi : 80 75 80 77 75 75 74 73 71

Berdasarkan data tersebut hitunglah:


1. Korelasi umur dengan denyut nadi
2. Hitung persamaan garis regresi, bila ada seseorang yang
berumur 30 tahun, prediksikan denyut nadinya.
Kelas A

Anda mungkin juga menyukai