LINIER
REGRESI
• Dapat mengukur seberapa besar suatu variabel mempengaruhi
variabel lain
• Dapat menyatakan hubungan sebab akibat
• Dapat digunakan untuk melakukan estimasi nilai suatu variabel
berdasarkan variabel lain
Korelasi
Tujuan
• dapat menggunakan SPSS sebagai alat bantu
analisis korelasi pada berbagai penelitian
kesehatan
• dapat memberikan interpretasi berbagai
output analisis korelasi.
Indikasi
• Analisis korelasi dipakai untuk menganalisis
hubungan variabel X dan Y dimana variabel X dan
y berskala pengukuran interval atau ordinal.
Figure 13-4. Correlation between dietary fat intake and breast cancer by
country.
USA
250
Switzerland
Incidence Ratio per 100,000 Women
Canada
Fed. Repub.
200 Italy Of Germany
Israel UK Denmark
Sweden France
New Zealand
Australia
150 Norway
Finland
Yugoslavia Spain
100 Poland
Romania
Hong Kong Hungary
50
Japan
Prentice RL, Kakar F, Hursting S, et al: Aspects of Per Capita Supply of Fat Calories
the rationale for the Women’s Health Trial. J Natl
Ecological Study Example 1
Cigarette Smoking & Lung Cancer Mortality
40
/100 000 women
30
20
10
.00 .00 .00 .00 .00 .00 .00 .00 .00 .00
2 0 7 0 0 0 0 0 0 5 0 0
10 11 14 15 18 18 20 28
per capita consumption -grams
Uji korelasi terdiri dari tiga jenis
• Pearson Correlation
– Variabel X dan Y merupakan variabel numerik atau interval dan berdistribusi
normal (uji normalitas) dan memenuhi asumsi lainnya (linearitas dan
homoskedastisitas)
• Spearman rank Correlation
– Variabel X dan Y adalah variabel numerik akan tetapi data dari kedua atau salah
satu dari variabel tersebut tidak berdistribusi normal atau keduanya
merupakan variabel ordinal.
– Sumber data harus berasal dari subjek yang berbeda
– Misal pada soal no. 2 di atas, di mana Nilai Ujian Siswa kelas A antara Guru I
dan Guru II berasal dari subjek yang berbeda. Subjeknya yaitu guru, di mana
guru yang memberi nilai ada 2, yaitu guru I dan guru II. Selanjutnya pelajari
lebih lanjut tentang uji spearman rho.
• Kendall
– Variabel X dan Y berskala pengukuran ordinal.
– variabel yang berasal dari subjek yang sama, yaitu siswa yang sama.
Ilustrasi dalam permasalahan dalam memilih
jenis uji korelasi yang dimaksud di atas misalinya
penelitian dengan judul:
• Hubungan IQ dengan Nilai Ujian.
• Kesesuaian Nilai Ujian siswa kelas A oleh Guru
I dan Guru II.
• Hubungan Tingkat Pengetahuan (Baik, Cukup,
Kurang) dengan Tingkat Pemahaman (Baik,
Cukup, Kurang).
Cara Menilai Hubungan
Var X dan var Y
• Scatter Plot (diagram pencar)
– Scatter Plot variabel X dan Y adalah grafik
koordinat (X,Y) dari setiap sampel
– Arah dan kuat hubungan secara visual
• Koefisien korelasi
– Arah dan kuat hubungan secara kuantitatif
– Koefisien korelasi diberi simbul ‘r’ memiliki
rentang nilai absolutnya dari -1 sampai dengan 1
Scatter plot (diagram pencar)
14.00
17.50
12.00
15.00
10.00
12.50 8.00
Y
Y
6.00
10.00
4.00
7.50
2.00
0.00
5.00
r=1 r = -1
15.00
14.00
15.00
12.00 12.00
10.00
9.00 10.00
8.00
Y
Y
Y
6.00 6.00
5.00
4.00
3.00
2.00
0.00 0.00
0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
X X
X
r
XY X Y / n
X 2
X / n Y Y
2 2 2
/n
Uji Hipotesa Koefisien Korelasi &
Cara pengambilan kesimpulan
• Hipotesis statistik:
Ho: ρ = 0 (tidak ada hubungan)
Ha: ρ # 0 (ada hubungan)
• Ho diterima bila nilai p > 0,05
• Ho ditolak bila nilai p ≤ 0,05
Procedure Correlate
1. Merekam Data
Tabel 1. Karakteristik faktor risiko CHD di Rumah Sakit X
No. Age Chol BMI No. Age Chol BMI
1 56 292 31.85 16 56 329 20.30
2 48 339 31.06 17 44 349 25.96
3 60 303 30.17 18 29 419 25.40
4 59 269 27.94 19 45 278 26.08
5 58 312 21.43 20 44 354 28.62
6 64 185 32.44 21 34 317 22.67
7 59 303 24.96 22 40 334 24.66
8 47 304 33.05 23 34 345 31.47
9 47 334 23.02 24 39 330 39.54
10 28 328 27.12 25 45 347 25.10
11 54 363 28.46 26 41 339 22.05
12 38 399 26.63 27 57 353 28.59
13 35 321 25.90 28 57 220 25.84
14 64 244 30.83 29 38 385 26.83
15 34 314 24.55 30 45 240 32.73
Procedure Correlate (2)
• Uji Normalitas Data
–menu: Analyze, Nonparametric Test, 1-Sample K-S
–pilih variabel Age, Choles, dan BMI dan masukan ke kotak “Test
Variable List” .
–Pilih test normalitas. Conteng “Normal” pada kotak “Test
Distribution” seperti bagan berikut.
–OK
One-Sample Kolmogorov-Smirnov Test
X Y
IMT Tensi
X Y
Y = a + biXi +
Y = var. tergantung
Xi = var.bebas ke i
a = intercept
bi = koefisien regresi variabel bebas ke i
= residu (eror)
Koefesien regresi
Rerata perubahan nilai variabel Y setiap
terjadi penambahan satu unit nilai variabel
X
Contoh : b = 3
Berarti setiap penambahan satu unit nilai var X,
diperkirakan nilai Y akan bertambah 3 unit.
Cara menghitung nilai b
Koefisien regresi b dihitung dengan rumus :
XY X Y / n
b
X X / n
2 2
Intercept (a)
• Adalah besarnya nilai variabel Y bila nilai X = 0
a Y bX
Koefisien Determinasi R2
(Explanatory power)
Besar Pengaruh Variabel X Terhadap Y
Analisis Pengaruh
Koefisien Determinasi
Interpretasi
Misal : R2 = 0,80
Artinya 80% variasi nilai var Y ditentukan oleh
variasi nilai var X dan faktor lain memberi
pengaruh sebesar 20%
Persyaratan (Asumsi yg harus terpenuhi)
1. Homoskedastik:
– Data dari variabel outcome Y, untuk setiap nilai
variabel prediktor X, harus berdistribusi normal
dan memiliki varian yang sama (homogen) serta
memiliki nilai rerata yang terletak dalam satu garis
lurus atau disebut Homoskedastik.
2. Tidak terdapat multikolinearitas:
– Tidak terdapat korelasi yag kuat antar variabel
prediktor
Persyaratan (Asumsi yg harus terpenuhi) (2)
3. Tidak terdapat otokorelasi
– Tidak terdapat korelasi berseri antara variabel
prediktor.
– Umumnya kasus autokorelasi banyak terjadi pada
data time series
4. Linearitas:
– Terdapat hubungan linear dari semua variabel
prediktor Xi dengan variabel outcome Y.
HOMOSKEDASTIK:
Var X : fix atau random
Sub Y|Xi : normal, equal varian, mean satu garis
Y
X1
y|x1
X2
y|x2
X3
y|x3
Y = a + bX
X
Bagaimana mengetahui Homoskedasitas?
ANOVA
Sum of
Squares df Mean Square F Sig.
Regression 301,745 1 301,745 39,473 ,000
Residual 61,155 8 7,644
Total 362,900 9
The independent variable is X.
Metode seleksi variabel prediktor
1. Method Enter
2. Method Backward
3. Method Forward
4. Method Stepwise
Procedure SPSS
1. Buka file “DM.SAV”
2. Klik “Analyze”, “Regression”, “Linear”
3. Pilih variabel dependent dan pindahkan ke kotak “Dependent:”
4. Pilih variable prediktor dan pindahkan ke kotak “Indepedents:”
5. Memilih metode seleksi
• Metode seleksi variabel prediktor terdiri dari metode “Enter,
Stepwise, Remove, Backward, dan Forward”
6. Memilih statistik
• Klik kotak “Statistics” Klik “Estimate”, “Model fit”, “R square
change”, “Part and partial correlations”, “Collinearity
diagnostics”, dan “Durbin-Watson” dan klik kotak “Continue”
Penjelasan statistik regresi
• Estimates: untuk koefisen regresi (b)
• Model fit: untuk menguji apakah data fit dengan model
regresi linear
• R2 change: untuk menghitung R2 dari setiap variabel
prediktor yang ada dalam model
• Part and partial correlations: menghitung koefisien
korelasi bivariate dan partial
• Collinearity diagnostics: untuk menghitung VIF (uji asumsi
multicollinearity)
• Durbin-Watson: untuk menghitung statastik Durbin-
Watson (uji asumsi oto korelasi)
Procedure SPSS (2)
7. Memilih plot
• Membuat plot antara nilai standar dari prediksi (ZPRED)
dengan nilai studentized dari residu (SRESID)
asumsi homoskedastik terpenuhi atau tidak.
• Klik kotak “Plot”
• Pilih “ZPRED” dan masukkan ke kotak “Y” dan “SRESID”
dimasukkan ke kotak “X”,
• Klik “Continue” untuk kembali ke kotak “Linear Regression”
• Klik “OK”
LATIHAN 1
• Contoh : pertanyaan penelitian
• Bagaimana pengaruh umur dan sistolik
terhadap IMT
• Gunakan data latihan yang dikirimkan
Masukkan variabel terikat dan bebas pada kolom
Pada kolom statistic :
lakukan centang pada
komponen disamping
Pada kolom statistic :
lakukan centang pada
komponen disamping
Pada kolom statistic :
lakukan centang pada
komponen disamping
Pada kolom statistic :
lakukan centang pada
komponen disamping
OUTPUT