dimana :
^
a = konstanta (nilai Y ketika harga X=0
b = nilai arah (koefisien regresi) ; bila b positif (+) arah regresi naik dan
bila b negatif (-) arah regresi turun.
X = variabel independent (predictor)
Nilai a dan b dapat ditentukan dengan rumus :
b=r
dimana : r
SY
SX
dan
a=Y b X
SX
2
n . X
n XY X . Y
b=
n . X2
Y . X 2 X . XY
a=
= a + bX
b satuan
1 satuan
a
X
(0,0)
dimana :
RJK reg(bIa)
RJK res
RJK reg(bIa)
(varians
rerata
jumlah
kuadrat
regresi
bIa
regresi bIa
RJK res
Kriteria pengujian :
o Terima Ho Jika Fhitung < Ftabel
o Tolak Ho jika Fhitung > Ftabel
Ftabel ditentukan dengan dari tabel distribusi F untuk tertentu dengan :
o dk pembilang = k
o dk penyebut
= n2
dk
JK
RJK
Total
Y2
Regresi a
JK reg(a)
RJK r eg (a)
Regresi b
JK reg(bIa)
RJK reg(bIa)
Fhitung
n-2
JK res
RJK res
Tuna Cocok
k-2
JK TC
RJK TC
Galat
n-k
JK g
RJK g
Sisa
RJK TC
RJK g
Contoh :
Dilakukan penelitian tentang pengaruh tentang frekuensi olahraga sit up terhadap
penurunan lingkar pinggang (cm), yang hasilnya adalah sebagai berikut :
X
(jumlah sit-up)
70
85
81
77
80
70
85
77
80
70
775
Y
(lingkar pinggang)
60
80
70
78
80
77
87
80
79
70
761
X
70
85
81
77
80
70
85
77
Y
60
80
70
78
80
77
87
80
X2
4,900
7,225
6,561
5,929
6,400
4,900
7,225
5,929
Y2
3,600
6,400
4,900
6,084
6,400
5,929
7,569
6,400
XY
4,200
6,800
5,670
6,006
6,400
5,390
7,395
6,160
9
10
Jumlah
80
70
775
79
70
761
6,400
4,900
60,369
6,241
4,900
58,423
6,320
4,900
59,241
2
n . X
Y . X 2 X . XY
a=
= 9.47
2
n . X
n XY X . Y
b=
10 x 59241775 x 761
10 x 60369775 2
= 0.8597
( Y )
1)
JK rega =
2)
JK reg(bIa)=b
( 761 )2
=57912.1
10
XY
X . Y
n
0.8597 x 59241
775 x 761
10
f.
JK rega 57912.1
=
=57912.1
1
1
1)
RJK r eg(a)=
2)
RJK reg(bIa)=
3)
RJK res =
JK reg(bI a) 226.53
=
=226.53
k
1
JK res 284.37
=
=35.55
n2 102
Fhitung =
RJK reg(bIa)
RJK res
226.53
=6.37
35.5
g. Menentukan F tabel :
o
Untuk = 0.05
Pengujian Hipotesis :
Ternyata F hitung > F tabel (5.32 < 6.37), sehingga Ho ditolak dan disimpulkan bahwa
terdapat pengaruh yang signifikan frekuensi olah raga sit up terhadap penurunan
berat badan.
j.
Persamaan regresi :
k. y = 9.47 + 0.8597 x
n y 2
x 2
n
n xy x y
r xy =
r xy =
10 x 59,241775 x 761
=0.67
=0
Ha :
>0
Ha :
<
d) Statistik Uji :
n2
t hitung = r 1r 2
e) Nilai kritis pada tabel t dengan v = n-2
f) Pengujian Hipotesis :
o Terima Ho jika thitung < ttabel
o Tolak Ho jika thitung > ttabel
Dengan menggunakan contoh soal yang sama seperti di atas maka :
n2
t hitung = r 1r 2
= 0.67 x
102
10.672
= 2.55
a) tentukan dahulu skor-skor sebagai berikut sebagai alat bantu sebelum melangkah
lebih lanjut, yaitu :
1)
X1
2
2
x
=
1 X 21
2)
X2
2
2
x
=
2 X 22
Y 2
3)
y 2= Y 2
Y
4)
( X 1 )
X 1 Y
x 1 y =
5)
( X 2 )
X 2 Y
x 2 y =
6)
b)
X2
( X 1 )
X 1 X 2
x 1 x 2=
x2
x1
x 1 x2
( x 2 y )
2
x1
x22
x 1 x2
2
()
( y )
b1=
c)
x1
x2
x 1 x2
( x 1 y )
x 21
x 22
x 1 x2
2
()
( y )
b2=
c) Menentukan konstanta regresi ganda = a
a=
Y b X 1
n
) ( )
b2
X2
n
Selain rumus dia atas, nilai koefisien b 1, b2, dan konstanta a dapat dicari dengan
rumus :
a) Y = an +b1X1+b2X1X2+..............+ bnXn
b) X1Y=aX1+b1X12+b2X1X2+..............+ bn X1Xn
c) X2Y=aX2+b1X1X2+b2X22+..............+ bn X2Xn
Untuk keperluan uji hipotesis maka diperlukan nilai-nilai sebagai berikut :
a) Hipotesis statistic :
o H0 : b1= b2=0: regresi ganda Y atas X1 dan X2 tidak berarti/tidak
nyata/tidak signifikan
o H1 : b1 b2 0
dkreg = k
dkres = n-k-1
dimana : k = jumlah variabel bebas
n = banyaknya pasang data (banyaknya sampel)
d) menentukan RJK (rerata jumlah kuadrat) sumber varian yaitu :
o
RJK reg =
JK reg
dk reg
RJK res =
JK res
dk res
Resp.
X1
X2
1
2
3
54
54
55
53
53
53
65
67
63
4
5
6
7
8
9
10
11
12
13
14
15
55
55
63
63
63
65
65
65
65
70
70
70
55
55
62
62
62
63
65
65
70
70
75
75
60
62
67
69
70
70
71
70
75
72
77
73
Resp.
X1
X2
X12
X22
Y2
X1Y
X2Y
X1X2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
54
54
55
55
55
63
63
63
65
65
65
65
70
70
70
932
53
53
53
55
55
62
62
62
63
65
65
70
70
75
75
938
65
67
63
60
62
67
69
70
70
71
70
75
72
77
73
1031
2916
2916
3025
3025
3025
3969
3969
3969
4225
4225
4225
4225
4900
4900
4900
58414
2809
2809
2809
3025
3025
3844
3844
3844
3969
4225
4225
4900
4900
5625
5625
59478
4225
4489
3969
3600
3844
4489
4761
4900
4900
5041
4900
5625
5184
5929
5329
71185
3510
3618
3465
3300
3410
4221
4347
4410
4550
4615
4550
4875
5040
5390
5110
64411
3445
3551
3339
3300
3410
4154
4278
4340
4410
4615
4550
5250
5040
5775
5475
64932
2862
2862
2915
3025
3025
3906
3906
3906
4095
4225
4225
4550
4900
5250
5250
58902
1)
X1
2
x 21= X 21
2)
X2
2
x 22= X 22
= 58414 -
(932)
15
= 505,73
= 59478 -
(938)2
15
= 821,73
= 71185 -
(1031)
15
Y 2
3)
y 2= Y 2
= 320,93
4)
( X 1 )
X 1 Y
x 1 y =
= 64411 -
( 932 ) (1031)
15
= 351.53
= 64932 -
( 938 ) (1031)
15
= 460,13
5)
( X 2 )
X 2 Y
x 2 y =
6)
X2
( X 1 )
X 1 X 2
x 1 x 2=
= 58902 -
( 932 ) (938)
15
= 620,93
1) b1 =
b1 =
x2
x1
x 1 x2
( x 2 y )
2
x1
x22
x 1 x2
2
()
( y )
3154,226
30019,448
= 0,11
x1
x2
x 1 x2
( x 1 y )
x 21
x 22
2) b2 =
x 1 x2
2
()
( y )
b2 =
3)
a=
Y b X 1
a=
1031
932
938
0,11
b 2
15
15
15
14426,022
30019,448
= 0,48
) ( )
b2
X2
n
( ) ( )
= 31,90
o JKTR =
y2
= 320,93
o JKReg = b1 x 1 y +b 2 x 2 y
RJK reg =
JK reg 259,53
=
d k reg
2
RJK res =
JK res 61,4
=
dk res
12
= 129,77
= 5,12
g) Menentukan nilai Ftabel : jika dengan = 0,05, maka untuk dk 1 = 2 dan dk2 = 12,
diperoleh Ftabel = 3,88
h) Kesimpulan : karena Fhitung > Ftabel , maka tolak Ho, dan dapat disimpulkan
bahwa terdapat pengaruh signifikan jumlah berenang dan jumlah sit-up secara
bersama-sama terhadap lingkar pinggang.
3. Regresi Logistik
Analisis regresi logistic adalah salah satu model yang digunakan untuk melakukan
analisis korelasi satu atau beberapa variable bebas dengan sebuah variable terikat
kategori yang bersifat dikotom/binary, dimana variable kategori dikotom adalah
variable yang mempunyai dua nilai variasi, misalnya sakit dan tidak sakit, bayi
BBLR dan Normal, merokok dan tidak merokok, dll.
Modul_Analisa_Regresi_STIKes Dr. Sismadi_by Didi Sutisna, Ir, MM
Perbedaan dengan rehresi linier terletak pada garis jenis variable bebasnya,
dimana regresi linier digunakan bila variable bebasnya numeric dan regresi logistic
digunakan pada data yang variable bebasnya berbentuk kategori yang dikotom.
Contohnya jika dilakukan penelitian untuk melihat hubungan antara variable
umur dengan kejadian penyakit jantung koroner dimana dilakukan pengamatan
terhadap 100 sampel, hasilnya adalah sbb :
ID
Umur
10
11
20
22
23
24
25
27
28
29
30
32
33
PJK
100
70
1
ID : no urut responden
PJK : variable kejadian penyakit jantung koroner, dimana kode 1 adalah responden
menderita sakit jantung dank kode 0 adalah responden tidak menderita jantung.
Data di atas jika kita plot kan kedalam diagram tebar (scatter plot) dimana umur
adalah sumbu X nya dan PJK adalah sumbu Y nya, maka pola hubungannya tidak
jelas terlihat karena akan membentuk 2 garis.
Untuk mempertajam analisis jika data tersebut kita kelompokan menjadi di
bawah ini :
Umur
Jumlah
20-29
30-34
35-39
40-44
45-49
50-54
55-59
60-69
Total
10
15
12
15
13
8
17
10
100
Jantung Koroner
Tidak
Ya
9
1
13
2
9
3
10
5
7
6
3
5
4
13
2
8
57
43
Proporsi Kejadian
PJK
0.10
0.13
0.25
0.33
0.46
0.63
0.76
0.80
0.43
Terlihat ada peningkatan proporsi kejadian jantung koroner pada kelompok umur
yang semakin tua.
PJK
14
12
10
8
6
4
2
0
PJK
Fungsi Logistik :
f ( Z )=
1
Z
1+ e
f(Z) merupakan fungsi peluang kejadian suatu penyakit berdasarkan factor resiko
tertentu, misalnya peluang kejadian jantung pada umur tertentu.
Nilai Z merupakan nilai indeks variable bebas yang bervariasi antara - sampai +
.
Jika nilai Z mendekati - , maka :
f ( Z )=
1
1+ eZ
=0
1
1+ eZ
=1
f ( Z )=
1
( + 1 X 1+ 2 X 2++ iXi )
1+ e
Variabel KAT
Pertanyaan :
a) Berapa peluang mereka yang kadar kotekolaminnya tinggi mempunyai resiko
untuk terjadi PJK
b) Berapa peluang mereka yang kadar kotekolaminnya rendah mempunyai resiko
untuk terjadi PJK
c) Bandingkan resiko terjadinya PJK antara mereka yang kadar KAT nya tinggi
dengan kadar KAT nya rendah.
Dengan model regresi logistic, maka model dari soal di atas adalah :
f ( Z )=
1
1+ eZ
1
1+eZ
1
( + 1 KAT )
1+e
1
(3,911+ 0,652. KAT)
1+e
1
(3,911+ 0,652.1)
1+e
kotelamin tinggi dalam darah mempunyai resiko untuk terjadinya PJK sebesar 4
%.
b) untuk besar resiko terjadinya PJK pada mereka yang kadar kotelaminnya rendah
adalah :
Karena kadar kotelamin paling rendah = 0, maka nilai KAT = 0, dan jika
masukan pada model di atas, maka :
P ( X )=
1
(3,911+ 0,652.0 )
1+e
kotelamin rendah dalam darah mempunyai resiko untuk terjadinya PJK sebesar
2 %.
c) besar resiko kedua kelompok tersebut di atas adalah sbb :
P 1( X) 0,037
=
=1,947=2
P 0( X ) 0,019
dalam darah mempunyai resiko terjadi PJK dua kali lebih tinggi dibandingkan
dengan mereka kadar kotelamin paling rendah.