Anda di halaman 1dari 17

Kuliah 7

Dr. Ir. Rahayu Astuti, M.Kes

UJI KORELASI PEARSON, KORELASI PARTIAL


DAN REGRESI LINIER SEDERHANA

1. KORELASI PEARSON

PENDAHULUAN

Dalam suatu penelitian kadang kita ingin mengetahui hubungan antara dua
variabel yang numerik atau continuous misalnya ingin mengetahui apakah ada
hubungan antara berat badan dengan tekanan darah sistole, apakah ada hubungan
antara umur dengan kadar Hb, apakah ada hubungan antara umur pasien dengan lama
hari rawat, apakah ada hubungan antara indeks masa tubuh (IMT) dengan kadar
kholesterol dan sebagainya.

Metode statistik yang paling umum digunakan untuk menggambarkan


hubungan antara dua variabel yang numerik atau kuantitative (X dan Y) adalah
korelasi linier dan regresi linier. Kapan kita menggunakan korelasi dan kapan kita
menggunakan regresi? Hal ini tergantung dari pertanyaan yang kita ajukan .

Misalnya hubungan antara berat badan sekelompok ibu hamil dengan berat
badan lahir bayinya. Jika pertanyaannya seberapa kuat/ erat hubungan antara berat
badan ibu dengan berat lahir bayi? Maka kita menggunakan koefisien korelasi untuk
mengukur kekuatan hubungan antara dua variable tersebut.

Sebaliknya jika kita bertanya apakah kita dapat memprediksi berat lahir bayi
jika berat badan ibu hamil diketahui? Maka kita menggunakan analisis regresi linier.

Korelasi Pearson digunakan untuk melihat dua variabel kuantitatif (interval,


rasio) dan berdistribusi normal. Sedangkan korelasi Spearman atau Kendall tau-b
mengukur hubungan antara dua variabel kualitatif atau kuantitatif yang tidak
berdistribusi normal.

Korelasi Pearson disamping dapat untuk mengetahui kekuatan/ keeratan


hubungan, juga dapat untuk mengetahui arah hubungan dua variabel numerik.
Misalnya apakah hubungan antara berat badan ibu dengan berat lahir bayi mempunyai
hubungan yang kuat atau lemah, juga apakah hubungan tersebut berpola positif atau
negatif.

Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari
diagram tebar/ pencar (scatter plot). Diagram tebar adalah grafik yang menunjukkan
titik-titik perpotongan nilai data dari dua variabel ( X dan Y ). Pada umumnya dalam
grafik, variabel independen (X) diletakkan pada garis horizontal sedangkan variabel
dependen (Y) pada garis vertikal.

1
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara dua
variabel X dan Y. Selain memberi informasi pola hubungan dari kedua variabel,
diagram tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel
tersebut.
. . . . ..
. . . .... . ...... .
. .. . . .. . . . . . .. . ..
. . . .... . . . . . .. . … . .
.. . . . . .. . .. .. . . ...
. ... .. .. . . . . ...
________________ __________________ __________________
linier positif linier negatif tidak ada hubungan inier

Derajat hubungan (kuat lemahnya hubungan) dapat dilihat dari tebaran datanya,
semakin rapat tebaran datanya semakin kuat hubungannya dan sebaliknya semakin
melebar tebarannya menunjukkan hubungannya semakin lemah.
Untuk mengetahui lebih tepat kekuatan hubungan digunakan Koefisien Korelasi
Pearson. Koefisien Korelasi disimbulkan dengan r (huruf r kecil)

Koefisien Korelasi Pearson’s


Disimbulkan dengan r , dapat diperoleh dari formula berikut :

( Σ XY ) ─ [( ΣX ) ( ΣY ) / n ]
r = —–—–—–—–—–—–—–—–—––—–—––—–—–
[( ΣX2 ) ─ ( ΣX )2 /n ] [( ΣY2 ) ─ ( ΣY )2 / n ]

atau

n ( ΣXY ) ─ ( ΣX ΣY )
r = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣY2 ─ (ΣY)2 ]

Dari nilai r kita dapat menentukan :


a. Kekuatan hubungan ( nilai 0 s/d 1 )
b. Arah hubungan ( + atau - )

Kisaran nilai r antara 0 s/d 1 :


0 : tidak ada hubungan linier
+ 1 : ada hubungan linier sempurna

Arah hubungan :
+ : korelasi positif : semakin besar nilai X semakin besar nilai Y
- : korelasi negatif : semakin besar nilai X semakin kecil nilai Y

Hubungan dua variabel dapat berpola positip atau negatip. Hubungan positip
terjadi bila kenaikan satu variabel diikuti kenaikan variabel lain ,misalnya semakin
bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya.
Sedangkan hubungan negatip dapat terjadi bila kenaikan satu variabel diikuti

2
penurunan variable yang lain, misalnya semakin bertambah umurnya (semakin tua)
semakin rendah kadar Hb nya.

Asumsi :
Koefisien Korelasi Pearson hanya valid jika asumsi berikut dipenuhi :
1. Untuk setiap nilai X, nilai Y terdistribusi secara normal
2. Untuk setiap nilai Y, nilai X terdistribusi secara normal
3. Perkalian antara X dan Y terdistribusi secara normal (bivariat normal distr.)
(Kleinbaum, DG.;Kupper, LL.; Muller, KE.; Nizam, 1998)

Uji hipotesis :
Uji hipotesis dilakukan untuk mengetahui apakah hubungan antara dua variabel
terjadi secara signifikan atau hanya karena faktor kebetulan dari random sampel (by
chance). Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama,
membandingkan nilai r hitung dengan r tabel; kedua, menggunakan pengujian dengan
pendekatan distribusi t.
Formula uji t :

n–2 r
t = r ──── atau t = ────────────
1 – r2 ( 1– r2 ) / ( n – 2 )

df = n – 2 n = jumlah sampel

Ho :  = 0 Ha :  ≠ 0

Uji statistik : uji t (rumus diatas)

Keputusan : Ho ditolak jika | t hitung | ≥ t ( tabel : /2, df = n-2 )

Jika keputusan Ho ditolak maka kesimpulannya koefisien korelasi populasi (  ) tidak


sama dengan nol dengan kata lain koefisien tersebut benar eksis/ada

Jika menggunakan program SPSS sudah langsung didapatkan nilai r dan nilai
signifikansinya ( p value). Pengambilan keputusan : Ho ditolak jika p value < 

Koefisien Determinasi ( r2 )
Melihat besarnya variasi variabel Y (dalam proporsi) yang dapat dijelaskan oleh
variabel X. Misalnya r = 0,8 , r2 = 0,64, artinya sebesar 64 % variasi nilai Y dapat
dijelaskan oleh variabel X .

Batasan Uji Korelasi Pearson:


- Hubungan kedua variabel linier (mendekati garis lurus)
- Kedua variabel berdistribusi normal. Bila salah satu variabel tidak normal
penggunaan Korelasi Pearson kurang tepat.
- Adanya ‘outlier’ mempengaruhi hubungan kedua variabel.
- Hubungan kedua variabel bukan hubungan sebab akibat.

3
Contoh:
Suatu studi ingin melihat hubungan antara variabel berat badan ibu dengan berat
badan bayi yang dilahirkannya. Kemudian diambil 10 sampel ibu hamil. Datanya
adalah sebagai berikut:
Ibu BB ibu (kg) BB bayi (gram)
1 49,4 3515
2 63,5 3742
3 68,0 3629
4 52,5 2880
5 54,4 3008
6 70,3 4068
7 50,8 3373
8 73,9 4124
9 65,8 3572
10 54,4 3359

Buat diagram tebar dengan cara :


- Klik graph, pilih legacy dialog , lalu pilih scatter/dot, klik simple scatter,
klik define
- Pada kotak y axis, isikan variable dependennya : BB bayi lahir
- Pada kotak x axis, isikan variable independennya : BB bumil
- Klik OK
Hasil Diagram tebar:

Diagram tebar
4200

4000

3800

3600

3400
berat badan bayi

3200

3000

2800
40 50 60 70 80

berat badan ibu

Dari gambar diatas terlihat ada kecenderungan, bila BB ibu hamil semakin meningkat
maka BB bayi lahir juga semakin meningkat dan berpola linier.

Uji hipotesis :
Ho :  = 0 (Tidak ada hubungan BB ibu hamil dengan BB bayi lahir)
Ha :  ≠ 0 (Ada hubungan BB ibu hamil dengan BB bayi lahir)

4
No X Y X2 Y2 XY
1 49,4 3515 2440.36 12355225 173641.0
2 63,5 3742 4032.25 14002564 237617.0
3 68,0 3629 4624.00 13169641 246772.0
4 52,5 2880 2724.84 8294400 150336.0
5 54,4 3008 2959.36 9048064 163635.2
6 70,3 4068 4942.09 16548624 285980.4
7 50,8 3373 2580.64 11377129 171348.4
8 73,9 4124 5461.21 17007376 304763.6
9 65,8 3572 4329.64 12759184 235037.6
10 54,4 3359 2959.36 11282881 182729.6
Jumlah 602,7 35270 37053,75 125845088 2151860,8

Dari data diatas dapat dihitung:


ΣXY = 2151860,8 ΣX = 602,7
ΣX2 = 37053,75 ΣY = 35270
ΣY2 = 125845088

n ( ΣXY ) ─ ( ΣX ΣY )
r = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣY2 ─ (ΣY)2 ]

10 (2151860,8) ─ [(602,7) (35270)]


r = —–—–—–—–—–—–—–—–—––—–—–—–—–—–—–—––—–– = 0,8045
[(10) (37053,75) ─ (602,7)2 ] [(10) (125845088) ─ (35270)2 ]

Interpretasi:
- besaran r mendekati angka 1 berarti semakin kuat hubungannya
- berpola linier positif, artinya semakin besar BB ibu semakin besar BB bayi

Pengambilan keputusan
a) Jika menggunakan tabel r
Nilai r hasil perhitungan = 0,8045
Nilai r dari tabel dengan df = 10 – 2 = 8,  = 0,05 two tail didapat 0,632
Keputusan : Karena r hitung > r tabel maka tolak Ho
Kesimpulannya: ada hubungan yang signifikan antara BB ibu hamil dengan BB
bayi lahir dengan r positif artinya semakin besar BB ibu hamil semakin besar pula
BB bayi lahir.

b) Jika menggunakan tabel t


n–2
t = r ────
1 – r2

10 – 2
t = 0,8045 ──────── = 3,83
1 – (0,8045)2

Keputusan : Ho ditolak jika | t hitung | ≥ t ( tabel : /2, df = n-2 )

Nilai t tabel dengan /2 = 0,05/2 = 0,025 , df = 10-2 = 8 diperoleh 2,306

5
Karena t hitung ( 3,83 ) > t tabel ( 2,306 ) maka tolak Ho

Kesimpulannya: ada hubungan yang signifikan antara BB ibu hamil dengan BB bayi
lahir, dengan r positif artinya semakin besar BB ibu hamil semakin besar pula BB
bayi lahir.

Jika digunakan program SPSS maka diperoleh:


1. Uji kenormalan:
One-Sample Kolmogorov-Smirnov Test

bb bayi
bb bumil (kg) (gram) IBUBAYI
N 10 10 10
Normal Parameters a,b Mean 60.270 3527.00 215186.1
Std. Deviation 9.000 401.08 54257.67
Most Extreme Absolute .243 .138 .225
Differences Positive .243 .102 .225
Negative -.140 -.138 -.143
Kolmogorov-Smirnov Z .768 .435 .712
Asymp. Sig. (2-tailed) .597 .991 .691
a. Test distribution is Normal.
b. Calculated from data.

Terlihat bahwa variabel bb ibu hamil dan bb bayi berdistribusi normal karena p-value
>  (0,05). Dimana p-value bb ibu hamil = 0,597 dan p-value bb bayi = 0,991

2. Uji Korelasi Pearson:


- klik analyze, pilih correlate, pilih bivariate
- masukkan ke kotak ‘variable’: variable bb bumil dan bb bayi
- pada ‘correlation coefficients’ pilih ‘Pearson’
- pada test of significance pilih : two tailed
- dan klik Flag significant correlations
- klik OK
Hasilnya :
Correlations

bb bayi
bb bumil (kg) (gram)
bb bumil (kg) Pearson Correlation 1.000 .805 **
Sig. (2-tailed) . .005
N 10 10
bb bayi (gram) Pearson Correlation .805 ** 1.000
Sig. (2-tailed) .005 .
N 10 10
**. Correlation is significant at the 0.01 level (2-tailed).

Terlihat hasil analisis korelasi diperoleh nilai r = 0,805

Artinya ada hubungan yang signifikan antara berat badan ibu hamil dengan berat
badan bayi lahir dengan nilai r = 0,805 dan p-value = 0,005.
Catatan:
Jika p-value <  (0,05)  tolak Ho sehingga terdapat hubungan yang signifikan

6
TABEL NILAI KRITIS r PEARSON

Tingkat signifikansi (one- tailed)


df =n-2 0,05 0,025 0,01 0,005
Tingkat signifikansi (two- tailed)
0,1 0,05 0,02 0,01

1 0.988 0.997 0.995 0.999


2 0.900 0.950 0.900 0.990
3 0.805 0.878 0.934 0.959
4 0.729 0.811 0.882 0.917
5 0.669 0.754 0.833 0.874
6 0.622 0.707 0.789 0.834
7 0.582 0.666 0.750 0.798
8 0.549 0.632 0.716 0.765
9 0.521 0.602 0.685 0.735
10 0.497 0.576 0.658 0.708

11 0.476 0.553 0.634 0.684


12 0.458 0.532 0.612 0.661
13 0.441 0.514 0.592 0.641
14 0.426 0.497 0.574 0.623
15 0.412 0.482 0.558 0.606
16 0.400 0.468 0.542 0.590
17 0.389 0.456 0.528 0.575
18 0.378 0.444 0.516 0.561
19 0.369 0.433 0.503 0.549
20 0.360 0.423 0.492 0.537

21 0.352 0.413 0.482 0.526


22 0.344 0.404 0.472 0.515
23 0.337 0.396 0.462 0.505
24 0.330 0.388 0.453 0.496
25 0.323 0.381 0.445 0.487
26 0.317 0.374 0.437 0.479
27 0.311 0.367 0.430 0.471
28 0.306 0.361 0.423 0.463
29 0.301 0.355 0.416 0.456
30 0.296 0.349 0.409 0.449

35 0.275 0.325 0.381 0.418


40 0.257 0.304 0.358 0.393
45 0.243 0.288 0.338 0.372
50 0.231 0.273 0.322 0.354
60 0.211 0.250 0.295 0.325
70 0.195 0.232 0.274 0.302
80 0.183 0.217 0.256 0.283
90 0.173 0.205 0.242 0.267
100 0.164 0.195 0.230 0.254

7
2. KORELASI PARSIAL
Pada korelasi linier tunggal hanya dicari hubungan dua variabel yaitu variabel
X dan Y dengan mengabaikan variabel lain. Jika hubungan antara variabel X dan
variabel Y ada variabel yang dikontrol, maka hubungan tersebut disebut korelasi
parsial. Kegunaan korelasi parsial adalah untuk menemukan korelasi murni antara dua
variabel terlepas dari pengaruh variabel lain.

Contohnya apabila ingin menganalisis hubungan antara dua variabel yang


diasumsikan bahwa hubungan tersebut dipengaruhi oleh variabel ketiga, maka dengan
menggunakan korelasi parsial kita dapat mengontrol pengaruh variabel ketiga yaitu
dengan menjadikan tetap (constant). Jika kita ingin meneliti hubungan antara asupan
energi (X) dengan status gizi balita (Y) dan variabel ketiga yang diperkirakan turut
berpengaruh yaitu pengetahuan gizi ibu (Z), maka variabel ketiga dibuat konstan,
dengan kata lain hubungan variabel X dan Y dikontrol dengan variabel Z.

X Y

Z
Rumus:
r xy  r xz r yz
rxyz = 
 ( 1 r2xz )  ( 1 r2yz )

Dimana :
rxyz : koefisien korelasi antara variabel X dan Y setelah dikontrol dengan variabel Z
Nilai koefisien korelasi r dari data sampel merupakan estimasi koefisien
korelasi pada populasinya yaitu  (rho), dapat dilakukan pengujian apakah nilai
koefisien korelasi tersebut pada populasinya sama dengan nol ( Ho :  = 0 ).
Untuk itu dilakukan uji t dengan rumus sebagai berikut:

r
t = ──────────────
( 1– r2 ) / ( n – k – 1 )

Degree of freedom ( df ) = n - k – 1
n : jumlah sampel dan k : jumlah variabel independen

8
Contoh: Terdapat data :
Nomor Pendidikan bapak (tahun) Jumlah anak (orang) Status gizi balita ( SD)
(X) (Z) (Y)
1 12 4 -1.00
2 6 9 -2.81
3 9 3 -1.93
4 6 6 -1.97
5 5 7 -2.18
6 6 6 -2.63
7 3 7 -2.82
8 6 6 -1.69
9 6 5 -1.61
10 12 4 .19

Pertanyaan :
Apakah ada hubungan antara pendidikan bapak dengan status gizi balitanya setelah
dikontrol dengan variabel jumlah anak dalam keluarga?

No X Y Z X2 Y2 Z2 XY XZ YZ
1 12 -1.00 4 144 1.00 16 -12.00 48 -4.00
2 6 -2.81 9 36 7.90 81 -16.86 54 -25.29
3 9 -1.93 3 81 3.72 9 -17.37 27 -5.79
4 6 -1.97 6 36 3.88 36 -11.82 36 -11.82
5 5 -2.18 7 25 4.75 49 -10.90 35 -15.26
6 6 -2.63 6 36 6.92 36 -15.78 36 -15.78
7 3 -2.82 7 9 7.95 49 -8.46 21 -19.74
8 6 -1.69 6 36 2.86 36 -10.14 36 -10.14
9 6 -1.61 5 36 2.59 25 -9.66 30 -8.05
10 12 .19 4 144 .04 16 2.28 48 .76
Jumlah 71 -18,45 57 583 41,61 353 -110,71 371 -115,11

a) ΣXY = -110,71 ΣX = 71
ΣX2 = 583 ΣY = -18,45
ΣY2 = 41,61

n ( ΣXY ) ─ ( ΣX ΣY )
r xy = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣY2 ─ (ΣY)2 ]

10 (-110,71) ─ [(71) (-18,45)] 202,85


r xy = —–—–—–—–—–—–—–—–—––—–—–—–—–—–—– = –—–—– = 0,83
[(10) (583) ─ (71)2 ] [(10) (41,61) ─ (-18,45)2 ] 244,39

b) ΣXZ = 371 ΣX = 71
ΣX2 = 583 ΣZ = 57
ΣZ2 = 353

9
n ( ΣXZ ) ─ ( ΣX ΣZ )
r xz = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣZ2 ─ (ΣZ)2 ]

10 (371) ─ [(71) (57)] -337


r xz = —–—–—–—–—–—–—–—–—––—–—–—–—– = –—–—– = -0,72
[(10) (583) ─ (71)2 ] [(10) (353) ─ (57)2 ] 470,86

c) ΣYZ = -115,11 ΣY = -18,45


ΣY2 = 41,61 ΣZ = 57
ΣZ2 = 353

n ( ΣYZ ) ─ ( ΣY ΣZ )
r yz = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣY2 ─ (ΣY)2 ] [ n ΣZ2 ─ (ΣZ)2 ]

10 (-115,11) ─ [(-18,45) (57)] -99,45


r yz = —–—–—–—–—–—–—–—–—––—–—–—–—––—– = –—–—– = -0,68
[(10) (41,61) ─ (-18,45)2 ] [(10) (353) ─ (57)2 ] 145,84

r xy : nilai korelasi antara pendidikan bapak dengan status gizi balita = 0,83
r xz : nilai korelasi antara pendidikan bapak dengan jumlah anak = - 0,72
r yz : nilai korelasi antara jumlah anak dengan status gizi = - 0,68
r xy  r xz r yz
rxyz = 
 ( 1 r2xz )  ( 1 r2yz )

0,83  ( - 0,72 ) ( - 0,68 ) 0,3404


rxyz =  =  = 0,669
 [1 (- 0,72 )2 ]  [1 (- 0,68 )2] 0,5087

Uji hipotesis :
Ho :  = 0
Ha :  ≠ 0

Untuk itu dilakukan uji t dengan rumus sebagai berikut:


r
t = ──────────────
( 1– r2 ) / ( n – k – 1 )

Degree of freedom ( df ) = n - k – 1

10
n : jumlah sampel
k : jumlah variabel independen

0,669
t = ────────────────── = 2,381
( 1– 0,6692 ) / ( 10 – 2 – 1 )

Keputusan : Ho ditolak jika | t hitung | ≥ t ( tabel : /2, df = n-k-1 )

Nilai t tabel dengan /2 = 0,05/2 = 0,025 , df = 7 diperoleh 2,365

Karena t hitung ( 2,381 ) > t tabel ( 2,365) maka tolak Ho

Kesimpulannya: ada hubungan yang signifikan antara pendidikan bapak dengan


status gizi balitanya , setelah dikontrol dengan variabel jumlah anak dalam keluarga

Jika digunakan program SPSS diperoleh hasil:


Correlations

DIDIK_BP JMLANAK STGZBAL


DIDIK_BP Pearson Correlation 1.000 -.716 * .830 **
Sig. (2-tailed) . .020 .003
N 10 10 10
JMLANAK Pearson Correlation -.716 * 1.000 -.682 *
Sig. (2-tailed) .020 . .030
N 10 10 10
STGZBAL Pearson Correlation .830 ** -.682 * 1.000
Sig. (2-tailed) .003 .030 .
N 10 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).

- - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S-

Controlling for.. JMLANAK

DIDIK_BP STGZBAL

DIDIK_BP 1.0000 .6696


( 0) ( 7)
P= . P= .048

STGZBAL .6696 1.0000


( 7) ( 0)
P= .048 P= .

(Coefficient / (D.F.) / 2-tailed Significance)

Catatan:
Hubungan antara pendidikan bapak dengan status gizi balitanya jika tanpa dikontrol
dengan jumlah anak diperoleh r = 0,830 ( p-value = 0,003)
Namun jika hubungan antara pendidikan bapak dengan status gizi balitanya dikontrol
dengan jumlah anak diperoleh r = 0,669 ( p-value = 0,048)

11
3. REGRESI LINIER SEDERHANA
Analisis regresi dapat digunakan untuk menggambarkan hubungan linier antara
dua variable numerik. Tujuan analisis regresi adalah untuk membuat perkiraan /
memprediksi nilai suatu variabel (variabel dependen) melalui variabel yang lain
(variabel independen).

Sebagai contoh dalam hubungan antara Pemberian Makanan Tambahan (PMT)


dalam satuan Kalori dengan pertambahan berat badan dalam satuan kg, ingin
diprediksi berapa besarnya pertambahan berat badan bila diketahui banyaknya Kalori
pada PMT.

Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh


dengan berbagai cara/ metode. Salah satu cara yang sering digunakan oleh peneliti
adalah dengan menggunakan metode kuadrat terkecil (least square).

Metode least square merupakan metode pembuatan garis regresi dengan cara
meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan nilai Y yang
diramalkan oleh garis regresi .

PERSAMAAN GARIS
Secara matematis model persamaan garis regresi sebagai berikut :
Ŷ = a+bX
Dimana :
Ŷ : nilai Y yang diprediksi
X : variabel independen = variabel bebas = prediktor
a : intercept = nilai Ŷ bila X=0
atau intercept/perpotongan garis regresi dengan sumbu Y
b : slope = kemiringan garis regresi = koefisien regresi
= nilai Y meningkat sebesar b unit untuk setiap kenaikan nilai X sebesar satu

Sedangkan a dan b diperoleh dengan persamaan sebagai berikut:

[Σ XY] ─ [( Σ X ) ( Σ Y ) / n]
b = —–—–—–—–—–—––—–—–
[Σ X2] ─ [(Σ X)2 / n ]

a = Y ─ bX

dimana Y = mean Y dan X = mean X

Perbedaan penting antara Ŷ (nilai prediksi) dimana semua akan jatuh pada
garis regresi sedangkan Y (nilai observasi) biasanya tidak semua jatuh pada pada garis
regresi. Konstanta a dan b adalah estimasi dari dua parameter pada persamaan regresi
yang sesungguhnya dimana dianggap pada lokasi garis.

12
Gambar 1 : Persamaan garis lurus
Y

Ŷ = a + bX

ΔY
–—–—–—–— ΔY
: ΔX : b = —–– = slope
: : ΔX
a= Y intercept :
: :
–—–—–—–—–—–—–—–—–—––
X X+ΔX

Pada gambar terlihat:

Konstanta a  titik dimana garis lurus/garis regresi berpotongan dengan sumbu y.


Sedangkan b  slope atau gradien dari garis.
Slope didefinisikan jumlah perubahan (ΔY)pada variabel dependen dibagi dengan
jumlah perubahan (ΔX)pada variabel independen. Slope disebut juga koefisien
regresi .

Contoh:
Suatu studi ingin melihat hubungan antara variabel berat badan ibu dengan berat
badan bayi yang dilahirkannya. Datanya sebagai berikut:

Ibu BB ibu (kg) BB bayi (gram)


1 49,4 3515
2 63,5 3742
3 68,0 3629
4 52,5 2880
5 54,4 3008
6 70,3 4068
7 50,8 3373
8 73,9 4124
9 65,8 3572
10 54,4 3359

Pada analisis korelasi diperoleh koefisien korelasi sebesar r = 0,805. Sehingga ada
hubungan yang kuat antara BB ibu hamil dengan BB lahir bayi dengan r berpola linier
positif artinya semakin besar BB ibu hamil semakin besar pula BB lahir bayi

Pada contoh diatas dapat dilihat bagaimana BB lahir bayi tergantung dari BB
ibu hamil. Untuk itu dapat dilakukan analisis regresi linier. Pada analisis ini dapat
diprediksi berapa BB lahir bayi jika diketahui BB ibu hamil.

Persamaan :
Ŷ = a + bX

BB lahir bayi = a + b BB ibu hamil

13
Pada soal diatas diperoleh:

ΣXY = 2151860,8 ΣX = 602,7 X = 60,27


ΣX2 = 37053,75 ΣY = 35270 Y = 3527
ΣY2 = 125845088

Sehingga:

[Σ XY] ─ [( Σ X ) ( Σ Y ) / n]
b = —–—–—–—–—–—––—–—–
[Σ X2] ─ [(Σ X)2 / n ]

[2151860,8] ─ [(602,7) (35270) / 10] 26137,9


b = —–—–—–—–—–—––—–—––—–—– = –—–—– = 35,853
[37053,75] ─ [(602,7)2 / 10 ] 729,021

a = Y ─ bX

a = 3527 ─ ( 35,853 ) ( 60,27 ) = 1366,139

Jadi persamaannya adalah : Ŷ = 1366,139 + 35,853 X

KOEFISIEN REGRESI

Yaitu dilihat slope dari garis regresi atau dilihat nilai b


Misalnya : b = 35,853 , artinya tiap kenaikan pada X sebesar 1 satuan X akan
meningkatkan Y sebesar 35,853 satu satuan Y.
Tiap kenaikan BB ibu hamil sebesar 1 kg maka meningkatkan BB lahir bayi sebesar
35,853 gram.

KOEFISIEN DETERMINASI ( R2 ) = R-Square


Koefisien determinasi mengukur proporsi varians Y yang dapat diterangkan oleh X.
r = 0,805 sehingga R2 = 0,648 = 64,8 %. Jadi variabel berat lahir bayi dapat
diterangkan oleh berat badan ibu hamil sebesar 64,8 %

Jadi jika diketahu BB ibu hamil 50 kg maka berat lahir bayi :

Ŷ = 1366,139 + 35,853X
= 1366,139 + 35,853 ( 50 ) = 3158,789 gram

Hasil analisis menggunakan program SPSS:

14
Correlations

bb bayi
bb bumil (kg) (gram)
bb bumil (kg) Pearson Correlation 1.000 .805 **
Sig. (2-tailed) . .005
N 10 10
bb bayi (gram) Pearson Correlation .805 ** 1.000
Sig. (2-tailed) .005 .
N 10 10
**. Correlation is significant at the 0.01 level (2-tailed).

Hasil analisis menggunakan korelasi Pearson diperoleh r = 0,805 dengan p-value =


0,005. Karena p-value <  (0,05) maka tolak Ho sehingga ada hubungan yang
bermakna antara berat badan ibu hamil dengan berat lahir bayi.
Coefficientsa

Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 1366.114 569.599 2.398 .043
bb bumil (kg) 35.853 9.357 .805 3.832 .005
a. Dependent Variable: bb bayi (gram)

Diperoleh nilai a = 1366,114


nilai b = 35,853
sehingga persamaan garis regresinya adalah: Ŷ = 1366,139 + 35,853 X

KETERBATASAN ANALISIS REGRESI LINIER


Analisis regresi linier sangat banyak kegunaannya. Namun dalam
menerapkannya perlu diperhatikan keterbatasannya. Hal ini untuk mencegah
penafsiran yang keliru, karena saat ini penghitungan analisis regresi linier tersebut
telah sedemikian mudahnya dilakukan oleh komputer.
Keterbatasannya adalah sebagai berikut:
1. Analisis regresi linier dihitung dengan asumsi khusus, sehingga asumsi ini
harus diteliti apakah dipenuhi atau tidak. Pemeriksaan asumsi ini memerlukan
perhitungan lebih lanjut yang tidak akan dijelaskan disini. Salah satu asumsi
adalah sebaran residu yang mengikuti sebaran Gauss. Dengan demikian
analisis regresi linier ini dilakukan dengan prosedur statistik parametric.
2. Penyimpulan hasil hendaknya memperhatikan rentang data yang diamati. Bila
akan melakukan ekstrapolasi atau proyeksi, diperlukan berbagai asumsi agar
linieritas garis dapat dipertahankan.
3. Hubungan yang digambarkan pada analisis regresi linier tidak dapat diartikan
sebagai hubungan kausal atau sebab akibat. Dapat diingat bahwa simpulan
hubungan sebab akibat harus didukung oleh beberapa hasil lain seperti yang
diutarakan oleh Bradford Hill (1971).

15
LATIHAN SOAL:

1. Pada data berikut:

Nomor PMT ( Kalori) Pertambahan BB ( kg )


1 200 1,5
2 200 1,1
3 300 1,6
4 300 1,9
5 400 1,7
6 400 2,3
7 500 2,5
8 500 2,4
9 600 2,7
10 600 2,5

Pertanyaan :
a). Buat diagram tebar untuk kasus diatas
b). Apakah ada hubungan antara Pemberian Makanan Tambahan (PMT) dengan
kenaikan berat badan (BB) pada balita?
c) Seberapa besar hubungan itu dan bagaimana arah hubungannya?

2. Pada data berikut:

Sampel Jumlah anggota Status gizi


keluarga (Z skor)
1 4 -1.00
2 9 -2.81
3 3 -1.93
4 6 -1.97
5 7 -2.18
6 6 -2.63
7 7 -2.82
8 6 -1.69
9 5 -1.61
10 4 .19

Pertanyaan :

a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung koefisien
korelasinya).
b). Apakah ada hubungan antara jumlah anggota keluarga dengan status gizi pada
balita?
c). Buatlah persamaan garis regresinya.

16
3. Seorang peneliti ingin mengetahui hubungan antara umur dengan tekanan darah
sistole. Datanya adalah sebagai berikut:

Sampel Umur Tekanan darah sistole


1 25 105
2 29 110
3 31 112
4 35 115
5 42 120
6 55 130
7 38 118
8 48 125
9 27 106
10 57 140
11 43 125
12 37 115

Pertanyaan :
a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung
koefisien korelasinya)
b). Apakah ada hubungan antara umur dengan tekanan darah sistole?
c). Buatlah persamaan garis regresinya.
d). Jika diketahui seseorang yang umurnya 45 tahun maka berapa prediksi
tekanan darah sistoliknya?

Daftar Pustaka

1. Budiarto. Biostatistika untuk kedokteran dan kesehatan masyarakat. EGC. Jakarta.


2002
2. Chandra, B. Pengantar Statistik Kesehatan. Penerbit Buku Kedokteran EGC.
Jakarta.1995.
3. Dawson B, Trapp RG. Basic and Clinical Biostatistics. Third Edition. McGraw-Hill
International Editions. Lange Medical Books, The McGraw-Hill Companies. 2001.
4. Kleinbaum, DG.;Kupper, LL.; Muller, KE.; Nizam. Applied Regression Analysis
and Other Multivariate Methods. 3rd.Ed.. Duxbury Press, California. 1998.
5. Kuzma. Basic Statistics for the Health Sciences. Mayfield Publishing Company.
1984
6. Norman and Streiner. Biostatistics : The Bare Essentials, Mosby. 1994.
7. Pagano, M dan K. Gaureau. Principles of Biostatistics. Belmont, Duxury
Press.1993.
8. Prasetyo, SB. Aplikasi Analisis Regresi Linier. Program Studi Magister Kesehatan
Masyarakat, FKM, UI. 2002.
9. Sabri dan Hastomo. Statistika kesehatan. PT Raja Grafindo Persada. Jakarta. 2006.
10. Sheskin, D.J. Handbook of Parametric and Nonparametric Statistical Prosedures.
Third Edition. Chapman & Hall/CRC. Florida. 2004.

17

Anda mungkin juga menyukai