1. KORELASI PEARSON
PENDAHULUAN
Dalam suatu penelitian kadang kita ingin mengetahui hubungan antara dua
variabel yang numerik atau continuous misalnya ingin mengetahui apakah ada
hubungan antara berat badan dengan tekanan darah sistole, apakah ada hubungan
antara umur dengan kadar Hb, apakah ada hubungan antara umur pasien dengan lama
hari rawat, apakah ada hubungan antara indeks masa tubuh (IMT) dengan kadar
kholesterol dan sebagainya.
Misalnya hubungan antara berat badan sekelompok ibu hamil dengan berat
badan lahir bayinya. Jika pertanyaannya seberapa kuat/ erat hubungan antara berat
badan ibu dengan berat lahir bayi? Maka kita menggunakan koefisien korelasi untuk
mengukur kekuatan hubungan antara dua variable tersebut.
Sebaliknya jika kita bertanya apakah kita dapat memprediksi berat lahir bayi
jika berat badan ibu hamil diketahui? Maka kita menggunakan analisis regresi linier.
Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari
diagram tebar/ pencar (scatter plot). Diagram tebar adalah grafik yang menunjukkan
titik-titik perpotongan nilai data dari dua variabel ( X dan Y ). Pada umumnya dalam
grafik, variabel independen (X) diletakkan pada garis horizontal sedangkan variabel
dependen (Y) pada garis vertikal.
1
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara dua
variabel X dan Y. Selain memberi informasi pola hubungan dari kedua variabel,
diagram tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel
tersebut.
. . . . ..
. . . .... . ...... .
. .. . . .. . . . . . .. . ..
. . . .... . . . . . .. . … . .
.. . . . . .. . .. .. . . ...
. ... .. .. . . . . ...
________________ __________________ __________________
linier positif linier negatif tidak ada hubungan inier
Derajat hubungan (kuat lemahnya hubungan) dapat dilihat dari tebaran datanya,
semakin rapat tebaran datanya semakin kuat hubungannya dan sebaliknya semakin
melebar tebarannya menunjukkan hubungannya semakin lemah.
Untuk mengetahui lebih tepat kekuatan hubungan digunakan Koefisien Korelasi
Pearson. Koefisien Korelasi disimbulkan dengan r (huruf r kecil)
( Σ XY ) ─ [( ΣX ) ( ΣY ) / n ]
r = —–—–—–—–—–—–—–—–—––—–—––—–—–
[( ΣX2 ) ─ ( ΣX )2 /n ] [( ΣY2 ) ─ ( ΣY )2 / n ]
atau
n ( ΣXY ) ─ ( ΣX ΣY )
r = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣY2 ─ (ΣY)2 ]
Arah hubungan :
+ : korelasi positif : semakin besar nilai X semakin besar nilai Y
- : korelasi negatif : semakin besar nilai X semakin kecil nilai Y
Hubungan dua variabel dapat berpola positip atau negatip. Hubungan positip
terjadi bila kenaikan satu variabel diikuti kenaikan variabel lain ,misalnya semakin
bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya.
Sedangkan hubungan negatip dapat terjadi bila kenaikan satu variabel diikuti
2
penurunan variable yang lain, misalnya semakin bertambah umurnya (semakin tua)
semakin rendah kadar Hb nya.
Asumsi :
Koefisien Korelasi Pearson hanya valid jika asumsi berikut dipenuhi :
1. Untuk setiap nilai X, nilai Y terdistribusi secara normal
2. Untuk setiap nilai Y, nilai X terdistribusi secara normal
3. Perkalian antara X dan Y terdistribusi secara normal (bivariat normal distr.)
(Kleinbaum, DG.;Kupper, LL.; Muller, KE.; Nizam, 1998)
Uji hipotesis :
Uji hipotesis dilakukan untuk mengetahui apakah hubungan antara dua variabel
terjadi secara signifikan atau hanya karena faktor kebetulan dari random sampel (by
chance). Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama,
membandingkan nilai r hitung dengan r tabel; kedua, menggunakan pengujian dengan
pendekatan distribusi t.
Formula uji t :
n–2 r
t = r ──── atau t = ────────────
1 – r2 ( 1– r2 ) / ( n – 2 )
df = n – 2 n = jumlah sampel
Ho : = 0 Ha : ≠ 0
Jika menggunakan program SPSS sudah langsung didapatkan nilai r dan nilai
signifikansinya ( p value). Pengambilan keputusan : Ho ditolak jika p value <
Koefisien Determinasi ( r2 )
Melihat besarnya variasi variabel Y (dalam proporsi) yang dapat dijelaskan oleh
variabel X. Misalnya r = 0,8 , r2 = 0,64, artinya sebesar 64 % variasi nilai Y dapat
dijelaskan oleh variabel X .
3
Contoh:
Suatu studi ingin melihat hubungan antara variabel berat badan ibu dengan berat
badan bayi yang dilahirkannya. Kemudian diambil 10 sampel ibu hamil. Datanya
adalah sebagai berikut:
Ibu BB ibu (kg) BB bayi (gram)
1 49,4 3515
2 63,5 3742
3 68,0 3629
4 52,5 2880
5 54,4 3008
6 70,3 4068
7 50,8 3373
8 73,9 4124
9 65,8 3572
10 54,4 3359
Diagram tebar
4200
4000
3800
3600
3400
berat badan bayi
3200
3000
2800
40 50 60 70 80
Dari gambar diatas terlihat ada kecenderungan, bila BB ibu hamil semakin meningkat
maka BB bayi lahir juga semakin meningkat dan berpola linier.
Uji hipotesis :
Ho : = 0 (Tidak ada hubungan BB ibu hamil dengan BB bayi lahir)
Ha : ≠ 0 (Ada hubungan BB ibu hamil dengan BB bayi lahir)
4
No X Y X2 Y2 XY
1 49,4 3515 2440.36 12355225 173641.0
2 63,5 3742 4032.25 14002564 237617.0
3 68,0 3629 4624.00 13169641 246772.0
4 52,5 2880 2724.84 8294400 150336.0
5 54,4 3008 2959.36 9048064 163635.2
6 70,3 4068 4942.09 16548624 285980.4
7 50,8 3373 2580.64 11377129 171348.4
8 73,9 4124 5461.21 17007376 304763.6
9 65,8 3572 4329.64 12759184 235037.6
10 54,4 3359 2959.36 11282881 182729.6
Jumlah 602,7 35270 37053,75 125845088 2151860,8
n ( ΣXY ) ─ ( ΣX ΣY )
r = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣY2 ─ (ΣY)2 ]
Interpretasi:
- besaran r mendekati angka 1 berarti semakin kuat hubungannya
- berpola linier positif, artinya semakin besar BB ibu semakin besar BB bayi
Pengambilan keputusan
a) Jika menggunakan tabel r
Nilai r hasil perhitungan = 0,8045
Nilai r dari tabel dengan df = 10 – 2 = 8, = 0,05 two tail didapat 0,632
Keputusan : Karena r hitung > r tabel maka tolak Ho
Kesimpulannya: ada hubungan yang signifikan antara BB ibu hamil dengan BB
bayi lahir dengan r positif artinya semakin besar BB ibu hamil semakin besar pula
BB bayi lahir.
10 – 2
t = 0,8045 ──────── = 3,83
1 – (0,8045)2
5
Karena t hitung ( 3,83 ) > t tabel ( 2,306 ) maka tolak Ho
Kesimpulannya: ada hubungan yang signifikan antara BB ibu hamil dengan BB bayi
lahir, dengan r positif artinya semakin besar BB ibu hamil semakin besar pula BB
bayi lahir.
bb bayi
bb bumil (kg) (gram) IBUBAYI
N 10 10 10
Normal Parameters a,b Mean 60.270 3527.00 215186.1
Std. Deviation 9.000 401.08 54257.67
Most Extreme Absolute .243 .138 .225
Differences Positive .243 .102 .225
Negative -.140 -.138 -.143
Kolmogorov-Smirnov Z .768 .435 .712
Asymp. Sig. (2-tailed) .597 .991 .691
a. Test distribution is Normal.
b. Calculated from data.
Terlihat bahwa variabel bb ibu hamil dan bb bayi berdistribusi normal karena p-value
> (0,05). Dimana p-value bb ibu hamil = 0,597 dan p-value bb bayi = 0,991
bb bayi
bb bumil (kg) (gram)
bb bumil (kg) Pearson Correlation 1.000 .805 **
Sig. (2-tailed) . .005
N 10 10
bb bayi (gram) Pearson Correlation .805 ** 1.000
Sig. (2-tailed) .005 .
N 10 10
**. Correlation is significant at the 0.01 level (2-tailed).
Artinya ada hubungan yang signifikan antara berat badan ibu hamil dengan berat
badan bayi lahir dengan nilai r = 0,805 dan p-value = 0,005.
Catatan:
Jika p-value < (0,05) tolak Ho sehingga terdapat hubungan yang signifikan
6
TABEL NILAI KRITIS r PEARSON
7
2. KORELASI PARSIAL
Pada korelasi linier tunggal hanya dicari hubungan dua variabel yaitu variabel
X dan Y dengan mengabaikan variabel lain. Jika hubungan antara variabel X dan
variabel Y ada variabel yang dikontrol, maka hubungan tersebut disebut korelasi
parsial. Kegunaan korelasi parsial adalah untuk menemukan korelasi murni antara dua
variabel terlepas dari pengaruh variabel lain.
X Y
Z
Rumus:
r xy r xz r yz
rxyz =
( 1 r2xz ) ( 1 r2yz )
Dimana :
rxyz : koefisien korelasi antara variabel X dan Y setelah dikontrol dengan variabel Z
Nilai koefisien korelasi r dari data sampel merupakan estimasi koefisien
korelasi pada populasinya yaitu (rho), dapat dilakukan pengujian apakah nilai
koefisien korelasi tersebut pada populasinya sama dengan nol ( Ho : = 0 ).
Untuk itu dilakukan uji t dengan rumus sebagai berikut:
r
t = ──────────────
( 1– r2 ) / ( n – k – 1 )
Degree of freedom ( df ) = n - k – 1
n : jumlah sampel dan k : jumlah variabel independen
8
Contoh: Terdapat data :
Nomor Pendidikan bapak (tahun) Jumlah anak (orang) Status gizi balita ( SD)
(X) (Z) (Y)
1 12 4 -1.00
2 6 9 -2.81
3 9 3 -1.93
4 6 6 -1.97
5 5 7 -2.18
6 6 6 -2.63
7 3 7 -2.82
8 6 6 -1.69
9 6 5 -1.61
10 12 4 .19
Pertanyaan :
Apakah ada hubungan antara pendidikan bapak dengan status gizi balitanya setelah
dikontrol dengan variabel jumlah anak dalam keluarga?
No X Y Z X2 Y2 Z2 XY XZ YZ
1 12 -1.00 4 144 1.00 16 -12.00 48 -4.00
2 6 -2.81 9 36 7.90 81 -16.86 54 -25.29
3 9 -1.93 3 81 3.72 9 -17.37 27 -5.79
4 6 -1.97 6 36 3.88 36 -11.82 36 -11.82
5 5 -2.18 7 25 4.75 49 -10.90 35 -15.26
6 6 -2.63 6 36 6.92 36 -15.78 36 -15.78
7 3 -2.82 7 9 7.95 49 -8.46 21 -19.74
8 6 -1.69 6 36 2.86 36 -10.14 36 -10.14
9 6 -1.61 5 36 2.59 25 -9.66 30 -8.05
10 12 .19 4 144 .04 16 2.28 48 .76
Jumlah 71 -18,45 57 583 41,61 353 -110,71 371 -115,11
a) ΣXY = -110,71 ΣX = 71
ΣX2 = 583 ΣY = -18,45
ΣY2 = 41,61
n ( ΣXY ) ─ ( ΣX ΣY )
r xy = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣY2 ─ (ΣY)2 ]
b) ΣXZ = 371 ΣX = 71
ΣX2 = 583 ΣZ = 57
ΣZ2 = 353
9
n ( ΣXZ ) ─ ( ΣX ΣZ )
r xz = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣX2 ─ (ΣX)2 ] [ n ΣZ2 ─ (ΣZ)2 ]
n ( ΣYZ ) ─ ( ΣY ΣZ )
r yz = —–—–—–—–—–—–—–—–—––—–—–
[ n ΣY2 ─ (ΣY)2 ] [ n ΣZ2 ─ (ΣZ)2 ]
r xy : nilai korelasi antara pendidikan bapak dengan status gizi balita = 0,83
r xz : nilai korelasi antara pendidikan bapak dengan jumlah anak = - 0,72
r yz : nilai korelasi antara jumlah anak dengan status gizi = - 0,68
r xy r xz r yz
rxyz =
( 1 r2xz ) ( 1 r2yz )
Uji hipotesis :
Ho : = 0
Ha : ≠ 0
Degree of freedom ( df ) = n - k – 1
10
n : jumlah sampel
k : jumlah variabel independen
0,669
t = ────────────────── = 2,381
( 1– 0,6692 ) / ( 10 – 2 – 1 )
- - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S-
DIDIK_BP STGZBAL
Catatan:
Hubungan antara pendidikan bapak dengan status gizi balitanya jika tanpa dikontrol
dengan jumlah anak diperoleh r = 0,830 ( p-value = 0,003)
Namun jika hubungan antara pendidikan bapak dengan status gizi balitanya dikontrol
dengan jumlah anak diperoleh r = 0,669 ( p-value = 0,048)
11
3. REGRESI LINIER SEDERHANA
Analisis regresi dapat digunakan untuk menggambarkan hubungan linier antara
dua variable numerik. Tujuan analisis regresi adalah untuk membuat perkiraan /
memprediksi nilai suatu variabel (variabel dependen) melalui variabel yang lain
(variabel independen).
Metode least square merupakan metode pembuatan garis regresi dengan cara
meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan nilai Y yang
diramalkan oleh garis regresi .
PERSAMAAN GARIS
Secara matematis model persamaan garis regresi sebagai berikut :
Ŷ = a+bX
Dimana :
Ŷ : nilai Y yang diprediksi
X : variabel independen = variabel bebas = prediktor
a : intercept = nilai Ŷ bila X=0
atau intercept/perpotongan garis regresi dengan sumbu Y
b : slope = kemiringan garis regresi = koefisien regresi
= nilai Y meningkat sebesar b unit untuk setiap kenaikan nilai X sebesar satu
[Σ XY] ─ [( Σ X ) ( Σ Y ) / n]
b = —–—–—–—–—–—––—–—–
[Σ X2] ─ [(Σ X)2 / n ]
a = Y ─ bX
Perbedaan penting antara Ŷ (nilai prediksi) dimana semua akan jatuh pada
garis regresi sedangkan Y (nilai observasi) biasanya tidak semua jatuh pada pada garis
regresi. Konstanta a dan b adalah estimasi dari dua parameter pada persamaan regresi
yang sesungguhnya dimana dianggap pada lokasi garis.
12
Gambar 1 : Persamaan garis lurus
Y
Ŷ = a + bX
ΔY
–—–—–—–— ΔY
: ΔX : b = —–– = slope
: : ΔX
a= Y intercept :
: :
–—–—–—–—–—–—–—–—–—––
X X+ΔX
Contoh:
Suatu studi ingin melihat hubungan antara variabel berat badan ibu dengan berat
badan bayi yang dilahirkannya. Datanya sebagai berikut:
Pada analisis korelasi diperoleh koefisien korelasi sebesar r = 0,805. Sehingga ada
hubungan yang kuat antara BB ibu hamil dengan BB lahir bayi dengan r berpola linier
positif artinya semakin besar BB ibu hamil semakin besar pula BB lahir bayi
Pada contoh diatas dapat dilihat bagaimana BB lahir bayi tergantung dari BB
ibu hamil. Untuk itu dapat dilakukan analisis regresi linier. Pada analisis ini dapat
diprediksi berapa BB lahir bayi jika diketahui BB ibu hamil.
Persamaan :
Ŷ = a + bX
13
Pada soal diatas diperoleh:
Sehingga:
[Σ XY] ─ [( Σ X ) ( Σ Y ) / n]
b = —–—–—–—–—–—––—–—–
[Σ X2] ─ [(Σ X)2 / n ]
a = Y ─ bX
KOEFISIEN REGRESI
Ŷ = 1366,139 + 35,853X
= 1366,139 + 35,853 ( 50 ) = 3158,789 gram
14
Correlations
bb bayi
bb bumil (kg) (gram)
bb bumil (kg) Pearson Correlation 1.000 .805 **
Sig. (2-tailed) . .005
N 10 10
bb bayi (gram) Pearson Correlation .805 ** 1.000
Sig. (2-tailed) .005 .
N 10 10
**. Correlation is significant at the 0.01 level (2-tailed).
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 1366.114 569.599 2.398 .043
bb bumil (kg) 35.853 9.357 .805 3.832 .005
a. Dependent Variable: bb bayi (gram)
15
LATIHAN SOAL:
Pertanyaan :
a). Buat diagram tebar untuk kasus diatas
b). Apakah ada hubungan antara Pemberian Makanan Tambahan (PMT) dengan
kenaikan berat badan (BB) pada balita?
c) Seberapa besar hubungan itu dan bagaimana arah hubungannya?
Pertanyaan :
a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung koefisien
korelasinya).
b). Apakah ada hubungan antara jumlah anggota keluarga dengan status gizi pada
balita?
c). Buatlah persamaan garis regresinya.
16
3. Seorang peneliti ingin mengetahui hubungan antara umur dengan tekanan darah
sistole. Datanya adalah sebagai berikut:
Pertanyaan :
a). Seberapa besar hubungan itu dan bagaimana arah hubungannya? (Hitung
koefisien korelasinya)
b). Apakah ada hubungan antara umur dengan tekanan darah sistole?
c). Buatlah persamaan garis regresinya.
d). Jika diketahui seseorang yang umurnya 45 tahun maka berapa prediksi
tekanan darah sistoliknya?
Daftar Pustaka
17