Anda di halaman 1dari 12

KORELASI

REGRESI LINEAR DAN LOGISTIK

OLEH

ZULAELA

PRODI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM


CLINICAL EPIDEMIOLOGY & BIOSTATISTICS UNIT (CE&BU), FAKULTAS KEDOKTERAN
UNIVERSITAS GADJAH MADA
Regresi Linear Sederhana

Analisis regresi merupakan metode analisis data yang memanfaatkan


hubungan antara dua variabel atau lebih (Berat Badan dengan Umur;
Berat Badan dengan Umur dan Asupan Gizi).
Y=variabel dependen, tak bebas, tergantung, respon, outcome.
X=variabel independen, bebas, tak tergantung, prediktor.

Tujuan
• Menyelidiki bentuk/pola hubungan antara Y dengan X.
• Mengestimasi/ menduga/ meramalkan mean atau rata-rata dari Y
populasi berdasarkan X yang diberikan.
Case Summariesa

berat badan umur


1 15.00 20.00
2 13.00 16.00
3 9.00 12.00
4 6.00 6.00
5 6.00 10.00
6 18.00 34.00
7 16.00 25.00
8 11.00 20.00
9 6.00 8.00
10 12.00 14.00
11 18.00 30.00
12 22.00 36.00
13 7.00 9.00
14 10.00 10.00
15 10.00 15.00
16 14.00 24.00
17 20.00 30.00
Total N 17 17
a. Limited to first 100 cases.

Scatter Plot
Coefficientsa
Model Unstandardized Coefficients Standardized t Sig.
Coefficients

B Std. Error Beta

(Constant) 3.025 .838 3.608 .003


1
Umur .507 .040 .956 12.652 .000

a. Dependent Variable: berat badan

Berat Badan = 3.025 + 0.507 Umur

Untuk seorang anak yang berumur 18 bulan, maka berat anak tersebut dapat
diprediksi sebesar 12.151 kg
Korelasi Linear

Analisis korelasi merupakan metode analisis data yang mengukur derajat


hubungan antara dua variabel random X dan Y melalui sebuah bilangan yang
disebut koefisien korelasi r.

n xy −  x  y
r=
[n x 2 − ( x) 2 ][n y 2 − ( y ) 2 ]

Kuadrat dari koefisien korelasi disebut koefisien determinasi yang


merepresentasikan besarnya proporsi variasi dalam variabel y yang dijelaskan
oleh variabel x dalam model. Dengan menggunakan pasangan data berat
badan dan umur anak balita, diperoleh nilai koefisien korelasi sebesar 0.956
dan koefisien determinasi sebesar 0.914
𝒓 ≈ +𝟏 derajat hubungan antar dua variabel random sangat
kuat dan korelasinya positif (salah satu variabel naik nilainya
variabel yang lain juga naik nilainya).

𝒓 ≈ −𝟏 derajat hubungan antar dua variabel random sangat


kuat tetapi korelasinya negatif (salah satu variabel naik
nilainya variabel yang lain turun nilainya).

𝒓 ≈ 𝟎 derajat hubungan antar dua variabel random sangat


lemah (tidak ada korelasi linear antar dua variabel).
Pearson Correlation
Correlations
Berat Badan Umur
Pearson Correlation 1 .956**
Berat Badan Sig. (2-tailed) .000
N 17 17
Pearson Correlation .956** 1
Umur Sig. (2-tailed) .000
N 17 17

**. Correlation is significant at the 0.01 level (2-tailed).

Spearman Correlation
Correlations
Berat Badan Umur

Correlation Coefficient 1.000 .957**


Berat Badan
Sig. (2-tailed) . .000
N 17 17
Spearman's rho
Correlation Coefficient .957** 1.000
Umur
Sig. (2-tailed) .000 .
N 17 17

**. Correlation is significant at the 0.01 level (2-tailed).


Bagaimana kalau data set seperti dalam tabel berikut?
ID AGRP AGE CHD ID AGRP AGE CHD ID AGRP AGE CHD

1 1 20 No 35 3 38 No 68 6 51 No
2 1 23 No 36 3 39 No 69 6 52 No
3 1 24 No 37 3 39 Yes 70 6 52 Yes
4 1 25 No 38 4 40 No 71 6 53 Yes
5 1 25 Yes 39 4 40 Yes 72 6 53 Yes
6 1 26 No 40 4 41 No 73 6 54 Yes
7 1 26 No 41 4 41 No 74 7 55 No
8 1 28 No 42 4 42 No 75 7 55 Yes
9 1 28 No 43 4 42 No 76 7 55 Yes
10 1 29 No 44 4 42 No 77 7 56 Yes
11 2 30 No 45 4 42 Yes 78 7 56 Yes
12 2 30 No 46 4 43 No 79 7 56 Yes
13 2 30 No 47 4 43 No 80 7 57 No
14 2 30 No 48 4 43 Yes 81 7 57 No
15 2 30 No 49 4 44 No 82 7 57 Yes
16 2 30 Yes 50 4 44 No 83 7 57 Yes
17 2 32 No 51 4 44 Yes 84 7 57 Yes
18 2 32 No 52 4 44 Yes 85 7 57 Yes
19 2 33 No 53 5 45 No 86 7 58 No
20 2 33 No 54 5 45 Yes 87 7 58 Yes
21 2 34 No 55 5 46 No 88 7 58 Yes
22 2 34 No 56 5 46 Yes 89 7 59 Yes
23 2 34 Yes 57 5 47 No 90 7 59 Yes
24 2 34 No 58 5 47 No 91 8 60 No
25 2 34 No 59 5 47 Yes 92 8 60 Yes
26 3 35 No 60 5 48 No 93 8 61 Yes
27 3 35 No 61 5 48 Yes 94 8 62 Yes
28 3 36 No 62 5 48 Yes 95 8 62 Yes
29 3 36 Yes 63 5 49 No 96 8 63 Yes
30 3 36 No 64 5 49 No 97 8 64 No
31 3 37 No 65 5 49 Yes 98 8 64 Yes
32 3 37 Yes 66 6 50 No 99 8 65 Yes
33 3 37 No 67 6 50 Yes 100 8 69 Yes
34 3 38 No
Regresi Logistik Sederhana

Regresi logistik digunakan untuk analisis dalam keadaan di mana


variabel dependen Y terdiri atas dua hasil yang mungkin: CHD/not
CHD. Variabel independen X: AGE

Scatter Plot
AGRP * CHD Crosstabulation
CHD
Yes
Mean
No (proportion) Total
1 Count 9 1 10
% within AGRP 90.0% 10.0% 100.0%
2 Count 13 2 15
% within AGRP 86.7% 13.3% 100.0%
3 Count 9 3 12
% within AGRP 75.0% 25.0% 100.0%
4 Count 10 5 15
AGE_GROUP % within AGRP 66.7% 33.3% 100.0%
5 Count 7 6 13
% within AGRP 53.8% 46.2% 100.0%
6 Count 3 5 8
% within AGRP 37.5% 62.5% 100.0%
7 Count 4 13 17
% within AGRP 23.5% 76.5% 100.0%
8 Count 2 8 10
% within AGRP 20.0% 80.0% 100.0%
Count 57 43 100
Total % within AGRP 57.0% 43.0% 100.0%
Scatter Plot
Variables in the Equation

B S.E. Wald df Sig. Exp(B) 95% C.I.for EXP(B)

Lower Upper

AGE .111 .024 21.254 1 .000 1.117 1.066 1.171


Step 1a
Constant -5.309 1.134 21.935 1 .000 .005

a. Variable(s) entered on step 1: AGE.

1
𝑃 𝑌 = 1 = 𝑃 𝐶𝐻𝐷 =
1 + 𝑒 −(−5.309 + 0.111 AGEሻ
Jika seseorang mempunyai umur berturut-turut 50 tahun, 60 tahun dan 70
tahun, maka resiko atau probabilitas terkena CHD sebesar 0.560, 0.794,
dan 0.921

Anda mungkin juga menyukai