Anda di halaman 1dari 41

Analisis Regresi dan Korelasi Linear

BAB III
ANALISIS REGRESI DAN KORELASI LINEAR

3.1 ANALISIS REGRESI

3.1.1 PENGANTAR

Istilah regresi berawal dari telaah Sir Francis Galton (1822-1911) yang membandingkan
tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton memperhatikan bahwa tinggi
badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur
(regressed) mendekati rerata populasi. Dengan kata lain, anak laki-laki dari ayah badannya tinggi
cenderung lebih pendek dari ayahnya, sedangkan anak laki-laki dari ayah yang badannya pendek
cenderung lebih tinggi dari ayahnya.
Beberapa contoh yang ada dalam kehidupan sehari-hari, seperti : (1) Berat badan dalam
taraf tertentu tergantung pada tinggi badannya; (2) Produktivitas kerja pada taraf tertentu
tergantung pada efisiensi dan efektivitas kerjanya; (3) Tekanan darah sistolik dalam taraf
tertentu tergantung pada Hemoglobin darah (Hb), Umur, riwayat penyakit dan lain sebagainya.
Dari gambaran di atas, dikatakan bahwa analisis regresi juga dapat digunakan untuk
peramalan. Hal ini dapat dilihat dari persamaan regresi (persamaan matematik) merupakan
persamaan yang memungkinkan untuk meramalkan y i (variabel tak bebas) berdasarkan satu
atau lebih variabel x i (variabel bebas).

3.1.2 JENIS DAN SIFAT HUBUNGAN FUNGSIONAL DALAM ANALISIS REGRESI

Sifat hubungan regresi adalah asimetris, artinya hubungan fungsional yang diperlihat-
i ), tidak sebaliknya.
kan adalah variabel bebas ( x i ) mempengaruhi variabel tak-bebas ( y
x i (variabel bebas) yi (variabel tak-bebas)

Hubungan fungsional antara satu variabel bebas dengan satu variabel tak-bebas disebut
analisis regresi tunggal (regresi linear sederhana), secara matematis dapat ditulis dengan :

y i bModel
0 bx i i
persamaan garis regresi sampel :

Yi Model
0 xi i
persamaan garis regresi populasi :

Sedangkan hubungan fungsional yang terdiri dari lebih satu variabel bebas dengan satu
iy b b x b x ...........
variabel tak-bebas disebut analisis regresi linear ganda (multiple regression linear), secara
0 dapat
matematis 1 1i ditulis
2 2i dengan : i
Model persamaan garis regresi sampel :

Yi Model
0 1persamaan
x1i 2 x2i garis
.......... . populasi
regresi i :

3.1.3 ANALISIS REGRESI LINEAR SEDERHANA

3.1.3.1. Kegunaan Analisis

Analisis regresi linear sederhana (tunggal) merupakan analisis parametrik yang


pengunaannya harus dilandasi oleh beberapa syarat, antara lain :
1. Data variabel yang dicari hubungan fungsionalnya cenderung berdistribusi normal.
2. Data variabel x i tidak harus acak, sedangkan data variabel y i harus acak.
1
Biostatistik Infernsial

3. Data variabel yang dihubungkan mempunyai pasangan sama dari subjek yang sama pula.
4. Data variabel yang dianalisis mempunyai ukuran skala interval atau rasio.

3.1.3.2 LANGKAH-LANGKAH ANALISIS REGRESI LINEAR SEDERHANA

Untuk membantu agar analisis regresi secara manual dapat dilakukan dengan efisien dapat
diikuti langkah-langkah berikut :
1. Menyiapkan tabel penolong.
Tabel 3.1. Tabel Penolong Komputasi Regresi Tunggal (Regresi Linear Sederhana).

No. xi yi xi2 y i2 xi . y i

(1) (2) (3) (4) (5) (6)

1. x1 y1 x12 y12 x1 .y1

2. x2 y2 x 22 y 22 x 2 .y 2
.. .. ..
.
n. xn yn x n2 y n2 xn . y n

n n n n n
xi
i 1
yi
i 1
x i2
i 1
y
i 1
2
i x i yi
i 1

2. Persamaan Regresi Linear Sederhana

Persamaan matematis dari regresi linear sederhana (regresi tunggal) untuk nilai parameter
Yi 0 xi i
populasi adalah :
........(3-1)
dimana :
Y : variabel tak bebas (variabel dependen atau variabel terpengaruh atau variabel
i
hasil, variabel kriteria, variabel resultante) yaitu variabel yang merefleksikan
pengaruh sesungguhnya dari sebuah variabel bebas.
0 : Koefisien regresi (lazim disebut intersep) adalah taksiran sesungguhnya
besarnya rerata variabel y i ketika nilai variabel x i = 0
: koefisien regresi adalah taksiran besarnya rerata perubahan sesungguhnya yang
dialami variabel y i untuk setiap unit perubahan x i
i
komponen kesalahan (error) yang mencerminkan perbedaan antara nilai y i
:
i yang sesungguhnya. Melalui metode
individual yang teramati dan nilai-nilai y
kuadrat terkecil, error atau residual dapat didefenisikan sebagai : i y i y i

Parameter 0 dan disebut koefisien regresi sesungguhnya. Dengan melambangkan nilai


parameter ini masing-masing sebagai b0 dan b maka kita dapat menduga y i oleh y i dari
model regresi sampelnya, yaitu :

yi b0 bxi .....(3-2)
i

dimana :
i
y : variabel tak bebas (data sampel yang diamati)
b0 : konstanta (intersep)

2
Analisis Regresi dan Korelasi Linear

b : koefesien regresi
i : error (residual = sisaan) i y i y i

Catatan : Koefisien arah regresi linear (b) juga dinyatakan sebagai perubahan rerata variabel
i untuk setiap variabel x i sebesar satu satuan. Maksudnya ialah jika b positif maka variabel
y
i akan mengalami kenaikan atau pertambahan, sebaliknya bila b negatif, maka variabel y
y i
akan mengalami penurunan atau pengurangan.
Koefesien regresi bo dan b dapat dihitung dengan rumus berikut :
Cara Pertama :

n
n
n

n x i y i x y i i

b
i 1 i 1 i 1 ......(3-3)
2
n
n

n x i2 x i
i 1 i 1

dimana : dan
......(3-4)

Cara kedua (subsitusi) :

n
n

n xi b0 y i
n
i 1
n i 1
n ..(3-5)
xi2 b xy
x
i 1
i
i 1

i 1
i i

Cara ketiga (matrik)
n
n x i
n
n
n

A n
i 1
n n x i
2
x x
i i

x x
i 1
i
i 1
i
2 i 1 i 1 i 1 ...(3-6)

dan

......(3-7)

3. Varians Regresi
Untuk menghitung varians regresi ini dapat dilakukan dengan dua cara, yaitu :
a). Cara Pertama

3
Biostatistik Infernsial

Cara pertama ini dilakukan dengan bantuan tabel 3.1.

2
n
2

n x 2
i x i ........(3-8)
Var ( S x ) S x2 i 1 i 1

n(n 1)
n
n

n yi2 y i
Var (S y ) S y2 i 1 ......(3-9)
i 1

n(n 1)
n 1 2 2 2
Var (S xy ) S xy2
n 2n

S y b S x S xy .......(3-10)
S xy2

S xy2
i1 S .
xi2
Var ( Sbo ) Sb2o bo Sb2o .......(3-11)
n(n 1) S x
2

S xy2
Var (Sb ) S 2
b Sb .........(3-12)
Sb2
(n 1)S 2
x

1 ( xo x ) 2
Var (S yo) S S xy 2
yo 1 S.(3-13)
yo S yo
2

n (n 1) S x2

b). Cara Kedua.


Cara kedua ini dapat dilakukan dengan menyiapkan tabel 2. berikut :
Tabel 3.2. Tabel Penolong Komputasi Regresi Tunggal (Regresi Linear Sederhana).

No. xi yi i
y y i y i ( y i y i ) 2 ( xi x ) 2
(1) (2) (3) (4) (5) (6) (7)
1. x1 y1 1
y y1 y 1 ( y1 y 1 ) 2
( x1 x ) 2
2. x2 y2 y 2 y 2 y 2 ( y 2 y 2 ) 2 ( x2 x ) 2
. .. .. ..
n. xn yn n
y y n y n ( y n y n ) 2
( xn x ) 2
n n n n n n

x
i 1
i y i 1
i y
i 1
i (y
i 1
i y i ) (y
i 1
i y ) 2 (x
i 1
i x )2

(y.......(3-14)
y ) i i
2

var (S xy ) S xy2 i 1

4 n2
Analisis Regresi dan Korelasi Linear


....(9-11) 1 x 2
Var (bo ) S b2o S xy2 n S bo Var (bo ) S bo .....(3-15)
2

n


i 1
( xi x ) 2

S xy2
Var (b) S 2
b n
S b Var (b) S b2
(x x)
i 1
i
2
......(3-16)

3. Estimasi bagi 0 dan

a). Jika b0 adalah koefisien arah regresi linear yang diperoleh dari hubungan fungsional
antara variabel bebas dan tak-bebas. Maka Interval Kepercayaan (1 )100% bagi
0 adalah :

dimana :
.......(3-17)

b). Jika b adalah koefisien arah regresi linear yang diperoleh dari hubungan fungsional
antara variabel bebas dan tak-bebas. Maka Interval Kepercayaan (1 )100% bagi
adalah :

dimana : ...(3-18)
.
o adalah variabel tak-bebas yang dipengaruhi oleh variable bebas xo yang
c). Jika y
o .
meng-gambarkan peramalan oleh xo terhadap y Maka Interval Kepercayaan
(1 )100% bagi Y adalah : o

dimana :
...(3-19)

4. Uji Hipotesis bagi 0 dan

a). Uji bagi 0


Statistik uji yang digunakan :
untuk maka :
...(3-20)

5
Biostatistik Infernsial

Statistik uji yang digunakan :


Ho : o 0
H1 : o 0 Terima Ho , jika : t C t H t C dimana : t C t ( / 2 );( n 2 )

Ho : o 0
H1 : o 0 Tolak Ho , jika : t H t C dimana : t C t ;( n 2 )

Ho : o 0
H1 : o 0 Tolak Ho , jika : t H t C dimana : t C t ;( n 2 )

b) Uji bagi

Statistik uji yang digunakan :

untuk maka :
........(3-21)

Statistik uji yang digunakan :


Ho : 0
H 1 : 0 Terima Ho , jika : t C t H t C dimana : t C t ( / 2 );( n 2 )
Ho : 0
H 1 : 0 Tolak Ho , jika : t H t C dimana : t C t ;( n 2 )
Ho : 0
H 1 : 0 Tolak Ho , jika : t H t C dimana : t C t ;( n 2 )

5. Analisis Varians Untuk Uji Kecocokan Model Regresi Linear dan Uji Kelinearan bagi
Regresi
a). Langkah-Langkah Perhitungan Uji Kecocokan Model Regresi Linear.
1). Pasangan Hipotesis
a. Hipotesis untuk uji kecocokan model regresi linear.

H 0' : Model regresi yang terbentuk adalah model regresi linear yang belum
sesuai (non fit) menggambarkan pengaruh satu (beberapa) variabel
independen terhadap variabel dependennya.
H 1' : Model regresi yang terbentuk adalah model regresi linear yang sesuai
(fit) menggambar-kan pengaruh satu (beberapa) variabel independen
terhadap variabel dependennya.
b. Hipotesis untuk uji kelinearan bagi regresi

H 0'' : Model (persamaan) garis regresi yang terbentuk menggambarkan


kurva garis yang linear.
H1'' : Model (persamaan) garis regresi yang terbentuk menggambarkan
kurva garis yang tidak linear.

2). Perhitungan.
a. Untuk uji kecocokan model regresi linear.

6
Analisis Regresi dan Korelasi Linear

Jumlah Kuadrat Regresi (JKR)


dengan dk = 1
.......(3-22)

Jumlah Kuadrat Total (JKT)


dengan dk = n-1

........(3-23)

Jumlah Kuadrat Galat (JKG)

dengan dk = n-2 .........(5-24)

b. Untuk uji kelinearan bagi regresi

Tabel 3.3. Sebaran data berdasarkan data observasi

Jenis data Jumlah data yang sejenis Jumlah y i berdasarkan data x i

x1 n1 yi
x2 n2 y 2
x3 n3 y 3
.
. .
xk nk yk

Dengan demikian dapat dihitung :


Jumlah Kuadrat Error (Pure error) JKE
dengan dk = n-k
..(5-25)

Jumlah Kuadrat Tuna Cocok (Lack of fit) JKTC


dengan dk = k-2 ......(5-26)

7
Biostatistik Infernsial

Tabel 4. Tabel Anova Untuk Uji Kecocokan Model dan Uji Kelinearan Regresi.

Sumber Jumlah derajat Rerata FHitung Ftabel


Variasi Kuadrat kebebasan Kuadrat
(JK) (dk) (RK)

JKR
Regresi JKR 1 RKR S R2
1 S R2 FCR F ;(1,( n 2 ))
JKG FHR
Galat JKG n-2 RKG S G2 S G2
n2
JKTC
Tuna KKTC k-2 RKTC S TC2

k 2 2
S TC
Cocok FCL F ;{( k 2 ),( n k )}
JKE FHL 2
Error JKE n-k RKE S E2 SE
nk
Total JKT n-1

3). Kriteria penolakan Ho (Daerah kritis)


a. Untuk uji kecocokan model regresi linear.
Tolak Ho, jika : FHR FCR FCR F ; (1, ( n 2 ))

b. Untuk uji kelinearan bagi regresi


Daerah Kritis : Tolak Ho, jika : FHL FCL FCL F ; (( k 2 ), ( n k ))

4). Kesimpulan :
a. Untuk uji kecocokan model regresi linear.
Tolak H 0 , artinya terdapat pengaruh fungsional yang linear dan
signifikans antara satu variabel bebas terhadap variabel tergantungnya.
Dengan perkataan lain bahwa model regresi yang terbentuk adalah model yang
paling sesuai (fit) menggambarkan satu variabel bebas berpengaruh terhadap
variabel tak bebasnya.
Sebaliknya terima H 0 , artinya tidak terdapat pengaruh fungsional yang
linear dan signifikans antara satu variabel bebas terhadap variabel
tergantungnya. Dengan perkataan lain bahwa model regresi yang terbentuk
adalah model yang belum sesuai (fit) menggambarkan satu variabel bebas
berpengaruh terhadap variabel tak bebasnya.

b. Untuk uji kelinearan bagi regresi

H 0 Terima, artinya model regresi (persamaan regresi) yang terbentuk merupa-


kan garis regresi yang linear.
Sebaliknya, H 0 ditolak, artinya model regresi (persamaan regresi) yang ter-
bentuk bukan merupakan garis regresi yang linear.

Contoh 4-1.
Seorang peniliti ingin mengetahui pengaruh berat bayi lahir (bbl) terhadap ukuran daya
bayi (udb). Untuk maksud tersebut ia mengumpulkan data sebayak 12 bayi dan ia mengukur ubd
dan bbl seperti tersaji dalam table 4.1. berikut :

8
Analisis Regresi dan Korelasi Linear

Tabel 4.1. Data berikut diperoleh dalam suatu penelitian mengenai pengaruh antara berat badan
lahir ( x i ) terhadap ukuran dada bayi waktu lahir ( y i ).

No. x i (bbl) y i (udb) xi2 y i2 xi . y i

(1) (2) (3) (4) (5) (6)

1. 2,15 29,50 4,6225 870,2500 63,4250


2. 2,15 26,30 4,6225 691,6900 56,5450
3. 4,00 32,20 16,0000 1036,8400 128,8000
4. 4,30 36,50 18.4900 1332,2500 156,9500
5. 3,25 27,20 10,5625 739,8400 88,4000
6. 2,15 27,70 4,6225 767,2900 59,5550
7. 2,15 28,30 4,6225 800,8900 60,8450
8. 3,25 30,30 10,5625 918,0900 98,4750
9. 4,30 28,70 18,4900 823,6900 123,4100
10. 4,00 30,30 16,0000 918,0900 121,2000
11. 3,25 25,50 10,5625 650,2500 82,8750
12. 4,00 37,00 16,0000 1369,0000 148,0000

38,95 359,50 135,1575 10918,1700 1188,4800

n n n
diperoleh : ni 12 ; x
i 1
i = 38,95 ; y i 1
i = 359,50 ; x
i 1
2
i = 135,1575 ;

n n

y i2 = 10917,17 ;
i 1
xi 1
i y i =1188,48
Pertanyaan :
1). Gambarkan scatter diagram !
2). Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
3). Jika Bobot badan bayi lahir ( xi ) = 5,80 Kg, ramalkan ukuran dada bayi ini waktu lahir ?
4). Tentukanlah :
a). S b2o dan S b ? o

2
b). S b dan S b ?
2
c). S y 0 dan S y 0 ?
5). Tentukan Estimasi bagi 0 dan ?
a). Interval Kepercayaan 95 % bagi 0 ?
b). Interval Kepercayaan 95 % bagi ?
c). Interval Kepercayaan 95 % bagi Y0 ?

6). Ujilah Hipotesis 0 dan !


a). H1 : 0 0
b). H1 : 0
c). H1 : Y0 0

7). Buktikan, apakah model regresi yang terbentuk adalah model regresi yang sesuai
menggambarkan pengaruh fungsional yang signifikan bobot bayi lahir (bbl) terhadap ukuran

9
Biostatistik Infernsial

dada pada waktu lahir dan juga selidiki apakah model regresi ini merupakan garis regresi
yang linear ? Gunakan = 0,05.

Jawab :

1). Gambar scatter diagram

Scatter Diagram antara Berat Badan Bayi dan Ukuran Dada Bayi pada saat lahir
38

36

34

32

30
Ukuran dada bayi

28

26

24
2,0 2,5 3,0 3,5 4,0 4,5

Berat badan lahir

2). Persamaan garis regresi linear sederhana dan gambar kurva regresi

n
n
n
n xi yi
x i yi

b i 1 i 1 i 1 12(1188,48) (38,95)(359,50)
2 = 2,474
n
n
12 (135,1575) (38,95) 2

n xi2 xi
i 1 i 1
n n

bo y b.x dimana : xi
38,95
= 3,246 dan
y i

359,50
= 29,958
x i 1
12 y i 1
12
n n
= 29,958 (2,474)(3,246) = 21,927
Jadi persamaan regresi yang terbentuk adalah : y i bo b.xi = 21,927 + 2,474. x i
Contoh model regresi yang dianalisis dengan paket program statistik komputer.

Coefficientsa

Standardi
zed
Unstandardized Coefficien
Coefficients ts 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 21,928 3,495 6,274 ,000 14,141 29,716
Berat badan lahir 2,474 1,041 ,601 2,376 ,039 ,153 4,794
a. Dependent Variable: Ukuran dada bayi

Cara kedua (subsitusi) :


n n

yi
i 1
n.b0 b. xi 12.b0 38,95.b 359,50 ...... (1) 38,95
i 1

10
Analisis Regresi dan Korelasi Linear

n n n

x y
i 1
i i b0 . xi b. xi2 38,95.b0 135,1575.b 1188,48 ....... (2) 12
i 1 i 1

11
Biostatistik Infernsial

atau : 467,4 b0 +1517,1025 b = 14002,525 . (1)


467,4b b0 +1621,89 b = 14261,76 ..(2)

- 104,7875.b = - 259,235 b = 2,474


(1) ....... 12.b0 38,95.( 2,474) 359,50 b0 = 21,928
Cara ketiga (matrik)

n
n

n xi b0 y i 12 38,95 b0 359,50
i 1
i 1
b 1188,48

n n n
38,95 135,1575
x xi2 b xi yi
i 1
i
i 1
i 1

n
n x i
12 38,95
A n
i 1
n 12135,1575 38,95 38,95 104,7875
38,95 135,1575
x x
i 1
i
i 1
2
i

n n

yi
i 1
x
i 1
i

n n 359,50 38,95
x y x
i 1
i i
i 1
2
i
1188,48 135,1575
dan

b0 21,928
A 104,7875
n
n y
i 1
i

n n 12 359,50
x x y
i 1
i
i 1
i i
38,95 1188,48
b 2,474
A 104,7875
Gambar kurva regresi hasil analisis program statistik komputer.
Ukuran dada bayi
38

36

34

32

30

28

26
Observed

24 Linear
2.0 2.5 3.0 3.5 4.0 4.5

Berat badan lahir

3). Peramalan ukuran dada bayi (udb) waktu lahir, jika berat badan waktu lahir (bbl) adalah
x i = 5,80 Kg.
12
Analisis Regresi dan Korelasi Linear

y i 21,927 + 2,474.( x i ) = 21,927 + 2,474.(5,80) = 36,276 cm.

4). Varians (ragam) bo dan b


Cara Pertama
2
n
n

n xi2 xi 12(135,1575) (38,95) 2
0,794
S x2 i 1 i 1
12(12 1)
n(n 1)
Sx S x2 0,794 0,891
2
n
n

n y 2
y 12(10918,1700) (359,50) 2
i 1
i
i 1
i
13,468
S y2 12(12 1)
n(n 1)
SY S y2 13,468 3,670

n 1 2 12 1
2
S xy
n2

S y b 2 S x2
12 2

13,468 ( 2,474) 2 (0,794) 9,469
S xy 2
S xy 9,469 3,077

n

S xy2
i 1
x
2
i
(9,469)(135,1575) 12,211 S b S b 12,211 3,494
2

S 2
bo o o

n(n 1) S x2 12(12 1)(0,794)

S xy2 9,469
S
2
b 1,084 S b S b2 1,084 1,041
( n 1) S 2
x (12 1)(0,794)

1 ( xo x ) 2 1 (5,80 3,246) 2
S y2o S xy 1 3,077 1 4,213
n (n 1) S x2 12 (12 1)0,749

S yo 4,213 2,053
Cara Kedua

No. xi yi i
y y i y i ( y i y i ) 2 ( xi x ) 2

(1) (2) (3) (4) (5) (6) (7)

01. 2,15 29,50 27,2471 2,2529 5,0756 1,2012


02. 2,15 26,30 27,2471 -0,9471 0,8970 1,2012
03. 4,00 32,20 31,8240 0,3760 0,1414 ,5685
04. 4,30 36,50 32,5662 3,9338 15,4748 1,1109
05. 3,25 27,20 29,9685 -2,7685 7,6646 ,0000
06. 2,15 27,70 27,2471 0,4529 0,2051 1,2012
07. 2,15 28,30 27,2471 1,0529 1,1086 1,2012
08. 3,25 30,30 29,9685 0,3315 0,1099 ,0000
09. 4,30 28,70 32,5662 -3,8662 14,9475 1,1109
10. 4,00 30,30 31,8240 -1,5240 2,3226 ,5685
11. 3,25 25,50 29,9685 -4,4685 19,9675 ,0000
12. 4,00 37,00 31,8240 5,1760 26,7910 ,5685

13
Biostatistik Infernsial

38,95 359,50 359,4983 0,0017 94,7055 8,7323


n n n n n n

xi 1
i y
i 1
i y
i 1
i (y
i 1
i y i ) (y
i 1
i y ) 2 (x
i 1
i x) 2

y y i
2
94,7055
i
= 9,471
S
2
xy
i 1
12 2
n2

2 1 (3,246) 2
2 1 x
Var (bo ) S b2o S xy n 9,471 12,217
n x x 2
12 8,7323
i 1
i

S bo Var (bo ) S b2o 12,217 3,495

S xy2 9,471
Var (b) S 2
1,085
b n
8,7323
x x
2
i
i 1

S b Var (b) S b2 1,085 1,042

5). Interval Kepercayaan 95 % bagi estimasi 0 dan

a). Interval Kepercayaan 95 % bagi 0 adalah :

o bo t C .S bo dimana : t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228


= 21,927 (2,228)(3,494) = 21,927 7,785

Jika kita ingin menduga koefisien regresi (intersep) sesungguhnya ( o ) dengan


menggunakan koefisien regresi sampel ( bo ) sebesar 21,927 maka kita boleh
membuat kekeliruan dalam penaksiran (galat pendugaan) tidak lebih dari 7,785.
Besaran 7,785 ini disebut dengan batas galat pendugaan.
atau : 14,142 < 0 < 29,712
artinya, kita yakin dengan tingkat kepercayaan paling sedikit 95 %, bahwa rerata
koefisien regresi sesungguhnya (intersep) ada dalam interval kepercayaan dengan
batas 14,142 sampai dengan 29,712.
b). Jika b adalah koefisien arah regresi linear yang diperoleh dari hubungan fungsional
antara variabel bebas dan tak-bebas. Maka Interval Kepercayaan (1-).100 % bagi
adalah :
b t C .S b dimana : t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228
= 2,474 (2,228)(1,041) = 2,474 2,319
Jika kita ingin menduga koefisien regresi sesungguhnya ( ) dengan mengguna-kan
koefisien regresi sampel ( b ) sebesar 2,474 maka kita boleh membuat kekeliruan
dalam penaksiran (galat pendugaan) tidak lebih dari 2,319. Besaran 2,319 ini disebut
dengan batas galat pendugaan.
atau : 0,155 < < 4,793

14
Analisis Regresi dan Korelasi Linear

artinya, kita yakin dengan tingkat kepercayaan paling sedikit 95 %, bahwa rerata
koefisien regresi sesungguhnya ada dalam interval kepercayaan dengan batas 0,155
sampai dengan 4,793.

c). Jika y
0 adalah ukuran data bayi yang dipengaruhi oleh bbl ( x0 ) yang menggambar-
o . Maka Interval Kepercayaan
kan peramalan oleh xo sebesar 5,80 kg terhadap y
(1 )100% bagi Y adalah :

o

Yo y 0 tC .S yo dimana : t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228

= 36,276 (2,228)(2,053) = 36,276 4,574


Jika kita ingin menduga model peramalan sesungguhnya ( Y0 ) dengan menggunakan
model pendugaan sampel ( y 0 ) sebesar 36,276 maka kita boleh membuat kekeliruan
dalam penaksiran (galat pendugaan) tidak lebih dari 4,574. Besaran 4,574 ini disebut
dengan batas galat pendugaan.

atau : 31,276 < Y0 < 40,850

artinya, kita yakin dengan tingkat kepercayaan paling sedikit 95 %, bahwa peramalan
ukuran dada bayi sesungguhnya ( Y0 ) oleh ukuran dada bayi sampel ( y 0 ) ada
dalam interval kepercayaan dengan batas 36,276 sampai dengan 40,850.

6). Uji Hipotesis bagi 0 dan

a). Uji hipotesis bagi 0

Ho : o 0
H1 : o 0
bo 21,927
Statisti uji : t H = = 6,276 Prob. = 0,00001
S bo 3,494
Titik kritis : t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228
Daerah kritis : Terima Ho, jika : t C t H t C
Ternyata : t H ( 6,276) t C ( 2,228) Ho ditolak.
{Prob. (=0,00001) < (=0,05)}
Kesimpulan : terbukti secara signifikas pada taraf nyata () 5 % bahwa ada
kontribusi koefisien regresi (intercept) atas terbentuknya kurva linear. Atau ada
hubungan fungsional regresi linear sederhana yang terbentuk.

c) Uji hipotesis bagi


Ho : 0
H1 : 0
b 2,474
Statisti uji : t H = = 2,377 Prob. = 0,021
S b 1,041
Titik kritis : t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228
Daerah kritis : Terima Ho, jika : t C t H t C
Ternyata : t H ( 2,377) t C ( 2,228) Ho ditolak. {Prob.(=0,021)< (=0,05)}

15
Biostatistik Infernsial

Kesimpulan : terbukti secara signifikans pada taraf nyata () 5 % bahwa ada


kontribusi koefisien regresi atas terbentuknya kurva linear, atau ada hubungan
fungsional regresi linear sederhana yang terbentuk.

7). Analisis Varians Untuk Uji Kecocokan Model Regresi Linear dan Uji Kelinearan bagi
Regresi

a. Hipotesis untuk uji kecocokan

H 0' : Model regresi yang terbentuk tidak sesuai (cocok) menjelaskan pengaruh bbl
terhadap udb.
H1' : Model regresi yang terbentuk sudah sesuai (cocok) menjelaskan pengaruh bbl
terhadap udb.
Dengan kriteria : Tolak Ho, jika : FHR FCR
b. Hipotesis untuk uji kelinearan

"
H 0
: Model regresi yang terbentuk merupakan hubungan fungsional yang

linear antara variabel bebas dan tak bebasnya. Dengan perkataan lain, garis
regresi yang terbentuk adalah garis yang linear.

H1" : Model regresi yang terbentuk merupakan hubungan fungsional yang

tidak linear antara variabel bebas dan tak bebasnya. Dengan perkataan lain,
garis regresi yang terbentuk adalah garis yang tidak linear.
Dengan kriteria : Tolak Ho, jika : FHL FCL
Perhitungan.

Tabel Anova Untuk Uji Kecocokan Model dan Uji Kelinearan Regresi.

Sumber Jumlah Derajat Rerata Kuadrat


FHitung Ftabel
Variasi Kuadrat kebebasan (RK)
(JK) (dk)
Regresi JKR = dk = 1 JKR
RKR S R2 53,45d )
53,45a) 1
5,64f) 4,96g)
Galat JKG= dk = 10 JKG
RKG SG2 9,47 e )
94,70c) n2
Tuna Cocok JKTC dk = 2
= 23,28i)
RKTC STC
2
11,64 k )
1,30m) 4,46n)
Error JKE = dk = 8
71,42h) RKE S 8,93
2
E
l)

Total JKT = dk = 11
148,15b)

Keterangan :
a. Untuk uji kecocokan
Jumlah Kuadrat Regresi (JKR)a)

16
Analisis Regresi dan Korelasi Linear

n
n


n
x i y i

JKR b x i y i i 1 i 1

i 1 n

(38,95)(359,50)
2,474 (1188,4800) = 53,45 dk = 1
12
Jumlah Kuadrat Total (JKT)b)
2
n

n
y i
(10918,1700)
(359,50) 2
= 148,15 dk = n-1 =
JKT y i2 i 1
12
i 1 n
121 = 11
Jumlah Kuadrat Galat (JKG)c)
JKG JKT JKR = 148,15 53,45 = 94,7 dengan dk = n - 2 = 12 2 = 10
JKR 53,45
RKR S R2 53,45d )
1 1
JKG 94,70
RKG SG2 9,47 e )
n2 10
RKR S R2 53,45
FHR 2 5,64 f )
RKG SG 9,47
FCR F ; (1, ( n 2 )) F0, 05;(1,10 ) 4,96 g )

Untuk Uji Kecocokan : Daerah Kritis : Tolak Ho, jika : FHR FCR

Ternyata : FHR ( 5,64) FCR ( 4,96) Ho ditolak.


Kesimpulan :
Hasil statistik uji menjelaskan bahwa pada taraf nyata ( ) 5 % model regresi yang
terbentuk sudah sesuai (cocok) menjelaskan pengaruh berat bayi lahir (bbl)
terhadap ukuran dada bayi (udb) pada waktu lahir, dengan model
y i 21,927 2,474.xi .

b. Untuk uji kelinearan

Junis data ni y i

2,15 4 29,50 + 26,30 +27,70 + 28,30 = 111,80


3,25 3 27,20 + 30,30 + 25,50 = 83,00
4,00 3 32,20 + 30,30 + 37,00 = 99,50
4,30 2 36,50 + 28,70 = 65,20

Jumlah Kuadrat Error (JKE)


n k
( y i ) 2
JKE y i2
i 1 j 1 nj

17
Biostatistik Infernsial

(111,80) 2 (83,00) 2 (99,50) 2 (65,20) 2


10918,1700
4 3 3 2
= 10918,1700 10846,75 = 71,42 dengan dk = n - k = 12 4 = 8

Jumlah Kuadrat Tuna Cocok (JKTC)


JKTC JKG JKE = 94,7 71,42 = 23,28 dengan dk = k - 2 = 4 2 = 2
2
RKR STC 11,64
FHL 2 1,30
RKG S E 8,93
FCL F ;{( k 2 ),( n k )} = F0, 05;( 2,8 ) = 4,46

Untuk Uji Kelinearan : Daerah Kritis : Tolak Ho, jika : FHL FCL

Ternyata : FHL (1,30) FCL ( 4,46) Ho diterima.


Kesimpulan :
Hasil statistik uji menjelaskan bahwa pada taraf nyata ( ) 5 % model regresi
yang Hasil statistik uji menjelaskan bahwa pada taraf nyata () 5 % diyakini
model regresi yang terbentuk merupakan hubungan fungsional yang linear
antara berat bayi lahir (bbl) dan ukuran dada bayi pada waktu lahir. Dengan
perkataan lain, garis regresi yang terbentuk ( y i 21,927 2,474.xi ) adalah
garis regresi yang linear

Contoh print out computer


Regression
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 53,444 1 53,444 5,643 ,039a
Residual 94,705 10 9,471
Total 148,149 11
a. Predictors: (Constant), Berat badan lahir
b. Dependent Variable: Ukuran dada bayi

3.2 ANALISIS KORELASI PEARSON PRODUCT MOMENT (PPM)

3.2.3 PENGERTIAN

Korelasi adalah istilah statistik yang menyatakan derajat hubungan linear antara dua
variabel atau lebih yang ditemukan oleh Karl Pearson pada awal tahun 1900, dan lebih terkenal
dengan sebutan Korelasi Pearson Product Moment (PPM). Dengan kata lain, korelasi adalah
suatu teknik analisis statistik yang dipakai untuk menghubungkan dua variabel atau lebih.
Hubungan antar variabel ini bersifat Simetris (dwi arah).

xi (variabel independen) yi (variabel dependen)

Dalam korelasi juga dikenal varaibel bebas ( x i ) dan variabel tak-bebas ( y i ). Variabel
x i dan y i ini terdiri dari berbagai jenis data, sehingga jenis korelasi yang dipakai ditentukan
oleh jenis-jenis data yang dihubungkan, seperti :

18
Analisis Regresi dan Korelasi Linear

Produc Moment Pearson : Kedua variabelnya berskala interval atau rasio


Order Rank Sperman : Kedua variabelnya berskala ordinal
Point Serial : Satu berskala dikotomi sebenarnya dan satu lagi berskala
interval
Biserial : Satu berskala dikotomi buatan dan satu lagi berskala interval
Kontingensi : Kedua variabelnya berskala nominal
Dalam analisis korelasi, hasil yang diperoleh merupakan koefisien korelasi dan
dinyatakan dalam lambang r. Koefisien korelasi dapat digunakan untuk menyatakan ada atau
tidak tidaknya hubungan yang signifikan antara variabel satu dengan variabel lainnya.
Untuk menyatakan besarnya sumbangan untuk variabel satu dengan variabel lainnya atau
merupakan petunjuk besarnya pengukuran yang sebenarnya dengan cara mengkuadratkan
koefisien korelasi (r2) yang disebut dengan koefisien determinan dan biasanya dinyatakan
dalam persentase.
Nilai r terbesar ialah +1 dan terkecil -1, sehingga dapat ditulis 1 r 1. Jika r =
+1 diberi makna hubungan kedua variabel adalah linear, positif sangat tinggi. Jika r = -1 diberi
makna hubungan kedua variabel adalah linear, negatif dan sangat tinggi, dan jika r = 0 diberi
makna tidak berkorelasi. Nilai r positif artinya data variabel satu dan variabel pasangannya
sama-sama cenderung naik atau sama-sama cenderung turun (searah), sedangkan nilai r negatif
artinya data variabel satu dan variabel pasangannya yang satu cenderung naik dan yang satunya
lagi cenderung turun atau sebaliknya (berlawanan arah).

3.2.4 ASUMSI AGAR ANALISIS KORELASI DAPAT DIGUNAKAN


a) Variabel yang dihubungkan mempunyai data yang berdistribusi normal.
b) Variabel yang dihubungkan mempunyai data linear.
c) Variabel yang dihubungkan mempunyai data yang dipilih secara acak (random).
d) Variabel yang dihubungkan mempunyai pasangan sama dari subjek yang sama pula
(variasi skor variabel yang dihubungkan harus sama)
e) Variabel yang dihubungkan mempunyai data interval atau rasio.

3.2.5 LANGKAH-LANGKAH ANALISIS KORELASI

a. Rumus Perhitungan Koefisien Korelasi Pearson Product Moment (dalam print out
komputer dijelaskan oleh multiple R).

n
n
n

n xi y i xi y i

rH i 1 i 1 i 1
..........(3-27)
n
n 2
n 2 n

2

n x xi n y i i
2
i y
i 1 i 1 i 1 i 1
atau dengan rumus berikut :

.......(3-28) S
H
x
r b.
y S
b. Koefisien korelasi determinan (dalam print out komputer dijelaskan oleh R Square)
Koefisien korelasi determinan menjelaskan besarnya proporsi variasi dalam variabel
respon yang dapat diterangkan oleh variabel-variabel prediktor (variabel bebas) dala
model.
......(3-29)
R (rH ) 2

c. Faktor koreksi koefisien korelasi determinan (dalam print out komputer dijelaskan oleh
Adjusted R Square)
19
Biostatistik Infernsial

Koefisien korelasi determinan R pada sampel cenderung memperkirakan dengan


terlalu optimistik kesesuaian model pada populasi. Pada hal tidak demikian. Jika
jumlah variabel prediktor lebih dari dua, maka jika ingin memperkirakan kuat
(derajat) hubungan variabel prediktor secara bersama terhadap variabel tak-bebas
yang menggambarkan kesesuaian model pada populasi sebaiknya dijelaskan oleh
Adjusted R Square, yaitu statistik yang mengoreksi R sehingga mencerminkan
kesesuaian model pada populasi yang cocok. Dalam hal ini Rkoreksi R .
...............(3-30)
k (1 R)
Rkoreksi R
dimana n: Rk
=1koefisien korelasi determinan
k = banyaknya variabel prediktor (bebas)
n = banyaknya pengamatan
d. Galat simpangan baku (dalam print out komputer dijelaskan oleh Standard error of the
2 2
estimate)
n
n
n y i y i y i y i
SE i 1 i 1
n(n 1) ........(3-31)

e. Estimasi bagi
Pada tingkat keyakinan (1-).100 % maka pendugaan terhadap koefisien korelasi
sesungguhnya ( ) adalah :

1 1
ln Z batas bawah ; batas atas .....(3-32)
2 1
1
1,1513
atau log
: Z batas bawah ; batas atas ........(3-33)
1

1 1 rH 1 rH
dimana : Z ( Z F Z C . Z ) Z F ln atau Z F 1,1513 log
2 1 rH 1 rH
1
Z C Z ( 0,5 / 2 ) dan Z
n3
f. Uji Hipotesa bagi
1). Dengan menggunakan Uji t
- Pasangan hipotesis
H0 : Tidak terdapat hubungan linear yang signifikan antara variabel
xi atau y i
H1 : Terdapat hubungan linear yang signifikan antara variabel xi atau y i
Atau
H0 : 0
H1 : 0
- Statistik uji yang digunakan :

20 r n2
tH
1 r2
Analisis Regresi dan Korelasi Linear

.......(3-34)

- Daerah kritis : Terima Ho, Jika : t C t H t C dimana : t C t ( / 2 );( n 2 )


- Kesimpulan :
- Ho diterima, artinya hasil uji statistik pada taraf nyata () yang ditentukan
menunjukkan bahwa tidak terdapat hubungan antara variabel bebas dan
variabel tak bebasnya.
- Ho ditolak, artinya hasil uji statistik pada taraf nyata () yang ditentukan
menunjukkan bahwa terdapat hubungan yang signifikans antara variabel
bebas dan variabel tak bebasnya.

2). Dengan menggunakan tabel r:


Daerah kritis : Tolak Ho, Jika : rH rC dimana : rC r( / 2 );( n 2 )

Contoh 5-2. Sumber data dari tabel 4.


Pertanyaan :
a) Hitunglah koefisien korelasi [ rH ], dan koefisien determinan [ R ] dan koefisien determinan
terkoreksi [ Rkoreksi ] serta jelaskan jelaskan maksud dari besaran tersebut ?
b) Hitunglah galat simpangan baku model regresi yang didapatkan ?
c) Buatlah pendugaan pada Interval Kepercayaan 95 % bagi (Koefisien korelasi
sesungguhnya) ?
d) Buktikan, apakah terdapat korelasi linear yang signifikan antara bobot badan bayi dan
ukuran dada bayi waktu lahir ! Gunakan = 0,05.
Jawab
a). Koefisien Korelasi Pearson Product Moment (dalam print out komputer dijelaskan oleh
multiple ( rH ).
n
n
n
n xi yi i yi
x
rH i 1 i1 i 1
n
n n 2 n
2 2

n xi xi n yi yi
2

i 1 i1 i 1 i 1
12(1188,4800) (38,95)(359,50)

12(135,1575) (38,95) 12(10918,1700) (359,50)
2 2
= 0,601

Sx 0,891
atau dengan rumus : rH b. ( 2,474). 0,601
Sy 3,670

b). Koefisien korelasi determinan (dalam print out komputer dijelaskan oleh R Square)

R (rH ) 2 (0,601) 2 0,3612


artinya, ada sebesar 36,12 % variasi ukuran dada bayi pada populasi dijelaskan oleh variasi
berat badan bayi pada waktu lahirnya.
c). Faktor koreksi koefisien korelasi determinan (Adjusted R Square)

21
Biostatistik Infernsial

1{1 (0,3612)
Rkoreksi R
k (1 R)
n k 1 0,3612 = 0,2973

12 11
dengan demikian, Rkoreksi ( 0,2973) R (0,3612)
Besaran Rkoreksi sebesar 0,2973 menjelaskan bahwa variasi ukuran dada bayi waktu lahir
pada populasi dijelaskan oleh variasi berat badan bayi pada waktu lahirnya tidak lebih dari
29,73 %.
Rkoreksi dapat digunakan, jika variabel prediktor (bebas) dalam analisis regresi lebih dari
satu, sedangkan untuk analisis regresi linear sederhana, kita cukup menjelaskan kuat
hubungan yang sesungguhnya antara variabel bebas (baik secara tunggal atau bersama-sama)
terhadap variabel tak bebasnya dengan nilai R 2 tanpa koreksi.

d). Galat simpangan baku (Standard error of the estimate)


2 2
n
n

n y i y i y y i 12(94,7055) (0,0017) 2
i 1 i 1
i
= 2,934
SE 12(12 1)
n(n 1)
Contoh model regresi yang dianalisis dengan paket program statistik komputer.
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,601a ,361 ,297 3,0774
a. Predictors: (Constant), Berat badan lahir

e). Estimasi bagi


Pada tingkat keyakinan 95 % pendugaan terhadap (koefisien korelasi sesungguhnya)
adalah :
1 1 rH 1 1 0,601
Z ( Z F Z C . Z ) Z F ln 2 ln 1 0,601 = 0,695
2 1 rH
Z C Z ( 0,5 / 2 ) Z 0 , 4750 = 1,96
1 1
Z 0,333
n3 12 3

Jadi : Z ( Z F Z C . Z ) 0,695 (1,96)(0,333) = 0,695 0,653


atau : -0,042 < Z < 1,348 batas bawah Z = -0,042 dan batas atas Z = 1,348

Jadi untuk batas bawah Z = 0,695 0,653 = 0,042

1 1 1
0,042 = ln 2( e 0, 042 ) = 2,085.(1- ) = 1+ = 0,351
2 1 1
dan untuk batas atas Z = 0,695 + 0,653 = 1,348

1 1 1
1,348 = ln 2( e1,348 ) = 7,699.(1- ) = 1+ = 0,770
2 1 1
22
Analisis Regresi dan Korelasi Linear

Jadi, interval estimasi pada tingkat keyakinan 95 % bagi adalah : 0,351 < < 0,770
Kesimpulan : kita percaya dengan tingkat keyakinan 95 % bahwa koefisien korelasi
sesungguhnya ( ) ada dalam cakupan interval : [ 0,351 ; 0,770 ].

f). Uji Hipotesis bagi

Dengan menggunakan Uji t


Ho : = 0
Ha : 0
Statistik uji yang digunakan :

r n2 (0,601) 12 2
tH = 2,378 Prob. = 0,021
1 r 2
1 (0,601) 2
t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228

Daerah kritis : Terima Ho, Jika : t C t H t C


Ternyata : t H ( 2,378) t C ( 2,228) Ho ditolak. {Prob.(= 0,021) < (= 0,05)}

Kesimpulan : pada taraf nyata () 5 % terdapat hubungan linear yang signifikan antara
bbl dan ukuran dada bayi waktu lahir.

Dengan menggunakan tabel r


Ho : = 0
Ha : 0

rH 0,601
rC r( );( n 2 ) r0 , 05;10 = 0,576

Daerah kritis : Tolak Ho, Jika : rH rC


Ternyata : rH ( 0,601) rC (0,576) Ho ditolak.
Kesimpulan : pada taraf nyata () 5 % terdapat hubungan linear yang signifikan antara
bbl dan ukuran dada bayi waktu lahir.

3.3 ANALISIS REGRESI LINEAR GANDA

Dalam analisis regresi linear sederhana hanya ada satu variabel bebas sebagai prediktor
terhadap satu variabel tak bebasnya. Seperti pada contoh sebelumnya, kita hanya melihat bahwa
ukuran dada bayi pada waktu lahir hanya dipengaruhi oleh berat badan bayi pada waktu lahir
tersebut, bagaimana misalnya perkembangan ukuran dada bayi tersebut tidak hanya dipengaruhi
oleh berat badan lahir saja, masih ada variabel lain, misalnya panjang bayi waktu lahir, usia
kehamilan ibu dan riwayat kesehatan selama kehamilan dan lain sebagainya.
Contoh lain, jika kita ingin melihat apakah pengaruh kecendrungan untuk berprestasi
cukup hanya oleh motivasi saja ? bagaimana dengan faktor lainnya, seperti tingkat pendidikan,
kecerdasan, kemampuan pengendalian emosional, pengalamanan dan lain sebagainya. Dalam
kasus ini variabel bebasnya lebih dari satu, dan untuk melihat secara bersamaan beberapa
variabel bebas ini terhadap variabel tak bebasnya, dapat dilakukan dengan analisis regresi linear
ganda.

3.3.1 Persamaan Regresi Linear Ganda

23
Biostatistik Infernsial

Persamaan regresi linear ganda (multiple regression analysis) dengan 2 variabel bebas
yi b0 b1x1i b2 x2i i
secara matematis dapat ditulis dengan :
.....(5-35)


dimana : y i : variabel tak bebas yang merupakan refleksi akibat pengaruh sesung-
guhnya dari satu atau beberapa variabel bebas.
b0 : koefisien regresi intersep yang merupakan taksiran yang sesungguhnya

besarnya rerata variabel y i ketika nilai variabel x i = 0
b1 dan b2 : koefisien regresi yang merupakan taksiran besarnya rerata variasi

sesung-guhnya yang dialami variabel y i untuk setiap unit variasi x i
x1i dan x2i : variabel bebas yang diperoleh sebagai variasi factual atas subjek/objek
yang diamati.
i : residual yang menggambarkan perbedaan antara nilai y i individual yang
i yang sesungguhnya. Melalui metode kuadrat
teramati dan nilai-nilai y
terkecil, error atau residual dapat didefenisikan sebagai : i y i y i

Salah satu cara yang dapat digunakan untuk memperoleh nilai koefisien regresi, b0 ,
b1 dan b2 (tiga variabel anu) yaitu dengan menggunakan tiga buah persamaan. Selanjutnya
dengan langkah-langkah subsitusi dan eliminasi ketiga nilai koefisien regresi dapat dihitung.
Bentuk persamaan yang dimaksud adalah :

y i b0 n b1 x1i b2 x 2 i
y x i 1i b0 x1i b1 x12i b2 x1i x2i ..(5-36)

y x i 2i b0 x 2i b1 x1i x 2i b2 x22i
atau dapat juga dilakukan dengan cara lain, yaitu dengan menentukan :

wi y i y y
y i
; z1i x1i x1 x1
x 1i
; z 2i x 2i x 2
n n

x2
x 2i

n
dengan demikian penyelesaiannya dapat dilakukan dengan :
b0 y b1 x1 b2 x 2

b1
z w z z z w z
2
2i i 1i 1i 2 i i 2i

z z z z
2
1i
2
2i 1i 2i
2 ...(3-37)

b2
z w z z z w z
2
1i i 2i 1i 2 i i 1i

z z z z
2
1i
2
2i 1i 2 i
2

atau dapat juga dilakukan dengan cara lain, yaitu dengan matriks :
n

x x 1i 2i b
0
y i

x 1i x x x 2
1i 1i 2i b1 yx i 1i ..(3-38)
b
x x x x 2 y x
2
2i 1i 2 i 2i i 2i

24
Analisis Regresi dan Korelasi Linear

dimana :

n x x n x 1i 2i 1i

det(A) =
x x x x x x
1i
2
1i 1i 2i 1i
2
1i

x x x x x x x
2i 1i 2i
2
2i 2i 1i 2i

y x x y x
i 1i 2i i 1i

det(A1) =
y x x x x y x x
i 1i
2
1i 1i 2i i 1i
2
1i

y x x x x y x x x
i 2i 1i 2i
2
2i i 2i 1i 2i

n y x n y i 2i i

det(A2) =
x y x x x x y x
1i i 1i 1i 2i 1i i 1i

x y x x x y x
2i i 2i
2
2i 2i i 2i

n x y n x 1i i 1i

det(A3) =
x x y x x x
1i
2
1i i 1i 1i
2
1i

x x x y x x x x
2i 1i 2i i 2i 2i 1i 2i
det A1 det A2 det A2
dengan demikian : b0 ; b1 ; b2
det A det A det A
Contoh 3-3 :
25
Biostatistik Infernsial

Seorang peneliti ingin mengetahui apakah ada pengaruh dua variabel bebas ( x1i dan
x 2i ), yaitu pendapatan keluarga (per seratus ribu) dan jumlah anggota keluarga (jiwa) terhadap
variabel tak bebasnya ( y i ), yaitu pengeluaran keluarga untuk pembiayan kesehatan keluarga
dalam sebulan (per sertus juta). Untuk maksud tersebut telah diambil sampel secara acak
sebanyak 13 kelurga, kemudian diukumpulkan data seperti disajikan dalam tabel berikut :

No. yi x1i x 2i x1i2 2


x 2i x1i x 2 i y i x1i yi x2i
1. 1.0 2.0 3 4.0 9 6.0 2.0 3.0
2. 1.5 5.0 2 25.0 4 10.0 7.5 3.0
3. 2.0 6.5 5 42.3 25 32.5 13.0 10.0
4. 2.1 4.0 5 16.0 25 20.0 8.4 10.5
5. 1.7 5.0 7 25.0 49 35.0 8.5 11.9
6. 1.0 4.0 5 16.0 25 20.0 4.0 5.0
7. 1.2 4.5 6 20.3 36 27.0 5.4 7.2
8. 1.3 5.0 4 25.0 16 20.0 6.5 5.2
9. 2.0 5.5 8 30.3 64 44.0 11.0 16.0
10. 2.1 6.0 3 36.0 9 18.0 12.6 6.3
11. 2.2 6.5 4 42.3 16 26.0 14.3 8.8
12. 1.8 6.0 5 36.0 25 30.0 10.8 9.0
13. 1.9 5.0 6 25.0 36 30.0 9.5 11.4
21.8 65.0 63 343.0 339.0 318.5 113.5 107.3

y i x 1i x 2i x 2
1i x 2
2i x 1i x 2i y i x1i y xi 2i

Untuk mendapat model regresi linear ganda yang terbentuk, dapat digunakan rumus
(5-36), yaitu dengan menggunakan tiga persamaan :

y i b0 n b1 x1i b2 x 2 i 21.8 = 13 b0 + 65.0 b1 + 63 b2


..(1)
y x i 1i b0 x1i b1 x12i b2 x1i x 2i 113.5 = 65 b0 + 343.0 b1 + 318.5 b2
(2)
y x i 2i b0 x 2i b1 x1i x 2i b2 x 22i 107.3 = 63 b0 + 318.5 b1 + 339.0 b2 ...
(3)
Selanjutnya, proses penghitungan dapat dilakukan dengan langkah-langkah berikiut :
(1) .. 21.8 = 13 b0 + 65 b1 + 63 b2 (x65) 1417 = 845 b0 + 4225 b1 + 4090
b2
(2) ...113.5 = 65 b0 + 343 b1 + 318.5 b2 (x13) 1475 = 845 b0 + 4495 b1 + 4140.5
b2
- 58 = - 234 b1 - 45.5 b2
(4)
(1) .... 21.8 = 13 b0 + 65 b1 + 63 b2 (x63) 1373.4 = 819 b0 + 4095 b1 + 3969
b2
(3) ... 107.3 = 63 b0 + 318.5 b1 + 339 b2 (x13) 1394.9 = 819 b0 + 4140.5 b1 + 4407
b2
- 21.5 = - 45.5 b1 - 438 b2 ..
(5)

26
Analisis Regresi dan Korelasi Linear

(4) - 58 b1 - 45.5 b2 (x45.5) - 2639 = - 10647 b1 - 2070.25 b2


= - 234
(5) - 21.5 = - 45.5 b1 - 438 b2 (x234) - 5031 = - 10647 b1 - 102492 b2
2392 = + 100421 b2 b2 =
0.024
(4) - 58 = - 234 b1 - 45.5 (0.024) b1 = 0.243
(1)... 21.8 = 13 b0 + 65 (0.243) + 63 (0.024) b0 = 0.346
Dengan demikian diperoleh model regresi linear ganda, yaitu :
y i 0.346 0.243 x1i 0.024 x 2 i
Contoh print out komputer
Bandingkan hasil perhitungan manual di atas dengan print out komputer berikut,
diperoleh : (constant) = b0 = 0.336 ; pendapatan keluarga (ratusan ribu)(x1i) = b1 = 0.245 dan
jumlah anggota keluarga (x2i) = b2 = 0.024.
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) .336 .455 .737 .478
Pendapatan keluarga
.245 .078 .698 3.137 .011 .980 1.021
(ratusan ribu Rp) (x1i)
Jumlah anggota
.024 .057 .092 .413 .689 .980 1.021
keluarga (x2i)
a. Dependent Variable: Pengeluaran keluarga untuk pembiayaan kesehatan (yi)

Cara lain juga dapat dilakukan, perhatikan rumus (5-37), dengan mendefenisikan :

wi y i y y
y i

21.8 =1.68 ; z x x
1i 1i 1 x1
x 1i

65.0 = 5.0
n 13 n 13

dan z 2i x 2i x 2 x2
x 2i

63
= 4.85 selanjut dapat disiapkan tabel berikut.
n 13

No wi z1i z 2i z1i2 2
z 2i z1i z 2 i wi z1i wi z 2i
1. -0.68 -3.0 -1.85 9.00 3.42 5.55 2.03 1.25
2. -0.18 0.0 -2.85 0.00 8.12 0.00 0.00 0.50
3. 0.32 1.5 0.15 2.25 0.02 0.32 0.48 0.05
4. 0.42 -1.0 0.15 1.00 0.02 -0.15 -0.42 0.06
5. 0.02 0.0 2.15 0.00 4.62 0.00 0.00 0.05
6. -0.68 -1.0 0.15 1.00 0.02 -0.15 0.68 -0.10
7. -0.48 -0.5 1.15 0.25 1.32 -0.58 0.24 -0.55
8. -0.38 0.0 -0.85 0.00 0.72 0.00 0.00 0.32
9. 0.32 0.5 3.15 0.25 9.92 1.58 0.16 1.02
10. 0.42 1.0 -1.85 1.00 3.42 -1.85 0.42 -0.78
11. 0.52 1.5 -0.85 2.25 0.72 -1.27 0.78 -0.44
12. 0.12 1.0 0.15 1.00 0.02 0.15 0.12 0.02
13. 0.22 0.0 1.15 0.00 1.32 0.00 0.00 0.26

0.00 0.00 -0.05 18.00 33.69 3.50 4.50 1.65

27
Biostatistik Infernsial

w i z 1i z 2i z 2
1i z 2
2i z 1i z 2i w z i 1i w z i 2i

Selanjutnya dengan bantuan tabel penolong di atas dapat dihitung :

b1
z w z z z w z 33.69 4.50 3.501.65
2
2i i 1i 1i 2 i i 2i

z z z z
2
1i
18.00 33.69 3.50
2
2i 1i 2 i
2 2 = 0.245

b2
z w z z z w z 18.001.65 3.50 4.50
2
1i i 2i 1i 2i i 1i
= 0,024
z z z z
2
1i
2
2i 18.00 33.69 3.50
1i 2i
2 2

dan b0 y b1 x1 b2 x 2 = 1,68 (0.245)(5.0) (0,024)(4.85) = 0.339


Sehingga diperoleh model regresi linear ganda, yaitu : y i 0.339 0.245 x1i 0.024 x 2 i

Cara lain juga dapat dilakukan, perhatikan rumus (5-38), dengan mendefenisikan :

13 65 63 b0 21,8
65 34 318,5 b 1 3,5

selanjutnya dapat dihitung dengan metode matriks :

63 318,5 3 9 b2 107,3

28
Analisis Regresi dan Korelasi Linear

13 65 63 13 65
det(A) 65 343 318,5 65 343
63 318,5 339 63 318,5
1511601 1304257,5 1304257,5 1361367 1318749,25 1432275 7722475

21,8 65 63 21,8 65
det(A1) 1 3,5 343 318,5 113,5 343
107,3 318,5 339 107,3 318,5
2534838,6 2221378,25 2277434,25 2318645,7 2211441,05 2500972,5 2591,85

13 21,8 63 13 21,8
det(A2) 65 1 3,5 318,5 65 1 3,5
63 107,3 339 63 107,3
500194,5 437427,9 439393,5 450481,5 444275,65 480363 1895,75

13 65 21,8 13 65
det(A3) 65 343 1 3,5 65 343
63 318,5 107,3 63 318,5
478450,7 464782,5 451314,5 471076,2 469946,75 453342,5 182,25

29
Biostatistik Infernsial

det A1 2591,75
dengan demikian : b0 0,336
det A 7724,75
det A2 1895,75
b1 0,245
det A 7724,75
det A2 182,25
b2 0,024
det A 7724,75
Sehingga diperoleh model regresi linear ganda, yaitu : y i 0.336 0.245 x1i 0.024 x2i

Demikian juga, untuk persamaan regresi linear ganda (multiple regression analysis)
dengan 3 variabel bebas yang secara matematis dapat ditulis dengan :
..(5-39)
y i b0 b1 x1i b2 x2i b3 x3i i
Juga dapat digunakan untuk memperoleh nilai koefisien regresi, b0 , b1 , b2 dan b3
(empat variabel anu) yaitu dengan menggunakan empat buah persamaan. Selanjutnya dengan
langkah-langkah subsitusi dan eliminasi ketiga nilai koefisien regresi dapat dihitung. Bentuk
persamaan yang dimaksud adalah :

y i b0 n b1 x1i b2 x 2 i b3 x3i
y x i 1i b0 x1i b1 x12i b2 x1i x 2i b3 x1i x3i (3-40)

y x i 2i b0 x 2i b1 x1i x 2i b2 x 22i b3 x 2i x3i


y x i 3i b0 x3i b1 x1i x3i b2 x 22i x3i b3 x32i
Dengan pendekatan yang sama, maka persamaan regresi linear ganda dengan empat,
lima variabel bebas dan seterusnya, besaran koefisien regresinya dapat dihitung.

5.3.2 Asumsi Klasik Regresi Ganda

Analisis regresi linear ganda adalah merupakan pengembangan dari analisis regresi linear
sederhana, oleh karena itu penggunaan analisis ini harus disertai dengan pemenuhan asumsi-
asumsi. Pelanggaran terhadap salah satu asumsi-asumsi yang disyaratkan pada penggunaan
regresi linear ganda tersebut akan mempengaruhi terhadap sifat-sifat atau ciri-ciri yang dimiliki
oleh pendugaan atau penaksir yang mendasari analisis regresi linear gandanya.

Asumsi yang dugunakan untuk uji regresi linear ganda harus memenuhi uji asumsi
klasik berikut :
1) Uji normalitas, untuk menguji apakah sebuah model regresi yang terdiri atas variable
bebas, tak-bebas atau kedua-duanya berditribusi normal atau tidak. Model regresi yang baik
adalah variabel bebas dan tak-bebasnya atau terutama variabel tak-bebasnya berditribusi
normal, atau secara matematis dapat dijelaskan dengan : i N (0, 2 ) artinya sisaan
menyebar mengikuti ditribusi normal dengan rerata 0 dan varians ( 2 )
Pada analisis statistic computer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi normalitas jika pola pada grafik Normal P-P Plot data menyebar disekitar garis
diagonal dan mengikuti arah garis diagonal.

30
Analisis Regresi dan Korelasi Linear

Langkah analisis computer : Analyze, Regression, Linear ., masukkan pada kotak


Dependent yi (pengeluaran KK untuk pembiayaan kesehatan), masukkan ke kotak
Independent(s) : x1i (pendapatan KK), dan x2 i (jumlah anggota keluarga), klik Plots ..,
masukkan ke kotak Yi : *SRESID dan Xi : *ZPRED, klik Normal Probability Plot, Continue,
Oke.

31
Biostatistik Infernsial

Print out :
N
o
r
m
a
l
D
e
p
n
d
e P -
t10..08V
a l
o
t
rib
lef
R
e
g
r
:P
n
g
es
i
o
lu
an
S
t
a
n
d
rn
K
ur
i
z
e
d
tk
P
e
m
bR
e
s
i
d
u
a
.K
e
s
h
al
tn
m
Pb
ro
C
0
.0
6
u
td
.0
4
c
p
E
e
x
.0
2
.0
.0O
b
s
e
r0v
.2 .4d
C
u
m
0P
ro
.6b
0
.81
.0
Grafik di atas terlihat bahwa titik-titik menyebar disekitar garis diagonal, serta
penyebarannya mengikuti arah garis diagonal, artinya model regresi linear ganda yang
terbentuk berdistribusi normal dan layak dipakai untuk memprediksi variabel tak-bebasnya
berdasarkan pengaruh variabel bebasnya.
2) Uji Heteroskedastisitas, adalah untuk melihat apakah terjadi ketidaksamaan varians dari
residual satu pengamatan ke pengamatan yang lain. Jika varians dari residual satu
pengamatan ke pengamatan yang lain, sama (tetap), artinya terdapat homoskedastisitas.
Sebaliknya, jika varians dari residual satu pengamatan ke pengamatan yang lain, tidak sama
(berbeda), artinya dalam model regresi yang terbentuk (timbul masalah) heterokedastisitas.
Model regresi linear ganda yng baik adalah tidak terjadi heterokedastisitas. Atau dapat
dinyatakan dengan : Var i i , sama untuk semua sisaan.
2

Pada analisis statistik komputer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi tidak heterokedastisitas dilakukan dengan melihat pola tertentu pada grafik
Scatterplot, dimana sumbu X dan Y yang telah diprediksi, dan sumbu X adalah residual
(Y prediksi Y sesungguhnya) yang telah di studentized.
Dasar pengambilan keputusan : jika ada pola tertentu, seperti titik-titik yang ada,
membentuk suatu pola tertentu yang teratur (bergelombang, melebar kemudian
menyempit), hal ini menunjukkan telah terjadi masalah heterokedastksitas. Sebaliknya jika
tidak pola yang jelas, serta titik-titik menyebar di atas dan di bawah angka o pada sumbu y,
hal ini menunjukkan bahwa pada model regresi linear ganda yang terbentuk ada
heterokedastisitas.

32
Analisis Regresi dan Korelasi Linear

S
c
a
t
er
p
l
o
t
Langkah analisis computer : Analyze, Regression, Linear ., masukkan pada kotak

D
ep
n
d
et
V
a
r
i
bl
e
:
P
ng
e
l
u
ar
n
K
ut
k
P
e
mb
.
K
e
sh
a
t
n
Dependent yi (pengeluaran KK untuk pembiayaan kesehatan), masukkan ke kotak
Independent(s) : x1i (pendapatan KK), dan x2 i (jumlah anggota keluarga), klik Plots ..,
masukkan ke kotak Yi : *SRESID dan Xi : *ZPRED, klik Normal Probability Plot, Continue,

3
Oke.
Ru
a
2
id
s
e
d
1
Sn
d
e
tu e
tizl
0
n
io
--1
R
rs
g
R
e
g
rs
io
n
S
-t1
a
n
d
rize
d
P
re
d
ic
te
d
V
a
lu
e
e
2-3-2 0 12
Gambar scatter plot di atas terlihat titik-titik menyebar secara acak, tidak membentuk pola
tertentu yang jelas, serta tersebar baik di bawah maupun di atas angka 0 pada sumbu Y. hal
ini berarti tidak terjadi heteroskedastistias pada model regresi, sehingga model regresi
liniar ganda ini layak dipakai untuk prediksi pengeluaran KK untuk pembiayaan kesehatan (
yi ) berdasarkan pengaruh variable independennya.
3) Uji Autokorelasi, menguji apakah dalam sebuah model regresi linear ganda ada korelasi
antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1
(sebelumnya). Jika terjadi korelasi, maka dinamakan ada masalah autokorelasi. Model
regresi yang baik adalah regresi yang bebas dari autokorelasi. Dengan perkataan lain, tidak

ada otokorelasi antara sisaan, berarti kovarian : i , j 0 dan i j

Catatan : Autokorelasi sering ditemukan pada regresi yang datanya time series, atau
berdasarkan waktu berkala, seperti bulanan, tahunan dan seterusnya.
Pada analisis statistik komputer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi tidak ada autokorelasi dengan patokan angka Durbin-Watson (D-W).
Angka D-W di bawah (-2) berarti ada autokorelasi positif.
Angka D-W diantara (-2) sampai dengan (+2) berarti tidak ada autokorelasi.
Angka D-W di atas (+2) berarti ada autokorelaso negatif.
Jika ada masalah autokorelasi, maka model regresi yang seharusnya signifikans, menjadi
tidak layak untuk dipakai.
Autokorelasi bisa di atasi dengan berbagai cara, antara lain :
Melakukan transformasi data, atau
Menambah data observasi
Langkah analisis computer : Analyze, Regression, Linear ., masukkan pada kotak
Dependent yi (pengeluaran KK untuk pembiayaan kesehatan), masukkan ke kotak
Independent(s) : x1i (pendapatan KK), dan x2 i (jumlah anggota keluarga), klik Statistics
.., klik Dubin-Watson pada bagian residuals, Continue, Oke.

33
Biostatistik Infernsial

Regression
Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 .717a .514 .417 .3286 1.524
a. Predictors: (Constant), Jumlah anggota keluarga, Pendapatan KK
b. Dependent Variable: Pengeluaran KK utk Pemb. Kesehatan

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 1.143 2 .572 5.295 .027a
Residual 1.080 10 .108
Total 2.223 12
a. Predictors: (Constant), Jumlah anggota keluarga, Pendapatan KK
b. Dependent Variable: Pengeluaran KK utk Pemb. Kesehatan

Hasil analisis di atas terlihat bahwa angka D-W sebesar 1,524 dan angka ini terletak
diantara -2 sampai dengan 2, artinya model regresi yang terbentuk tidak ada masalah
autokorelasi, dengan demikian model regresi yang signifikan ( p. = 0,027) dapat digunakan
sebagai model peramalan.

4) Uji Multikolinieritas, adalah uji terhadap model regresi linear ganda apakah ditemukan
adanya korelasi antar variabel independen. Jika terjdi korelasi, maka dinamakan terdapat
masalah multiko-linearitas. Model regresi yang baik adalah tidak terjadi korelasi antar
variabel independen.
Pada analisis statistik komputer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi tidak multikolinearitas jika :
Mempunyai nilai VIF (Variance Inflation Factor) di sekita angka 1.
Mempunyai nilai Tolerance mendekati 1.
Langkah analisis computer : Analyze, Regression, Linear ., masukkan pada kotak
Dependent yi (pengeluaran KK untuk pembiayaan kesehatan), masukkan ke kotak
Independent(s) : x1i (pendapatan KK), dan x2 i (jumlah anggota keluarga), klik Statistics
.., klik Collinearity diagnostics pada bagian residuals, Continue, Oke.

34
Analisis Regresi dan Korelasi Linear

Soal Latihan

04-01. Suatu penelitian dilakukan untuk memprediksi seberapa tinggi produktivitas kerja
pegawai bila kemampuan kerja ditingkatkan. Untuk maksud tersebut dikumpulkan data
secara random yang mewakili 12 pegawai, yaitu data tentang kemampuan kerja ( x i )
dan Nilai Produktivitas kerja ( y i ), sebagai berikut :

No. 1 2 3 4 5 6 7 8 9 10 11 12
yi 60 60 65 85 80 65 55 55 60 65 85 80
xi 70 60 60 68 77 60 55 50 64 67 67 72

Pertanyaan :
1.1. Gambarkan scatter diagram !
1.2. Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
1.3. Jika Kemampuan kerja ( x i ) = 6,50 Kg, ramalkan nilai produktivitas kerja pegawai
tersebut ?
1.4. Tentukanlah :
a). Sbo2 dan Sbo !
b). Sb2 dan Sb !
1.5. Tentukan Estimasi bagi o dan :
a). Interval Kepercayaan 90 % bagi o !
b). Interval Kepercayaan 90 % bagi !
1.6. Ujilah Hipotesis o dan :
a). Ha : o 0
b). Ha : 0
1.7. Buktikan, apakah model regresi yang terbentuk sudah sesuai menggambarkan
hubungan fungsional yang signifikan antara kemampuan kerja dengan produktivitas
kerja ? Juga buktikan bahwa garis regresi yang terbetuk sudah linear ? Gunakan =
0,10.
r
1.8. Tentukan Koefisien korelasi [ ] dan koefisien determinan [ R ] dan jelaskan
maksud dari besaran tersebut ?
1.9. Buktikan, apakah terdapat hubungan linear yang signifikan antara kemampuan kerja
dan ukuran produktivitas kerja ! Gunakan = 0,10.
1.10. Tentukan Interval Kepercayaan 90 % bagi !

Printout computer statististic


Regression

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .708a .501 .452 8.423
a. Predictors: (Constant), Kemampuan kerja (xi)

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 713.411 1 713.411 10.055 .010a
Residual 709.506 10 70.951
Total 1422.917 11
a. Predictors: (Constant), Kemampuan kerja (xi)
b. Dependent Variable: Produktivitas kerja (yi)

35
Biostatistik Infernsial

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -.493 21.710 -.023 .982
Kemampuan kerja (xi) 1.066 .336 .708 3.171 .010
a. Dependent Variable: Produktivitas kerja (yi)

04-02. Data berikut menggambarkan hubungan umur (tahun) dengan tekanan darah sistolis
(mmHg) dari 15 orang laki-laki dewasa :

No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 116 110 128 130 115 110 110 120 125 140 129 114 116 110 112
xi 29 30 32 29 30 30 32 43 40 48 48 40 30 35 35

dimana :
Variabel dependen ( y i ) : Tekanan darah sistolis (mmHg)
Variabel independen ( x i ) : Umur laki-laki dewasa (tahun)
2.1. Gambarkan scatter diagram !
2.2 Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
2.3. Jika Umur laki-laki dewasa tersebut ( x i ) = 75 tahun, ramalkan tekanan darah
sistolis pada orang tersebut ?
2.4. Tentukanlah :
a) Sbo2 dan Sbo !
b). Sb2 dan Sb !
2.5. Tentukan Estimasi bagi o dan :
a). Interval Kepercayaan 95 % bagi o !
b). Interval Kepercayaan 95 % bagi !
2.6. Ujilah Hipotesis o dan :
a). Ha : o 0
b). Ha : 0
2.7. Buktikan, apakah model regresi yang terbentuk cocok (sesuai) menggambarkan
hubungan fungsional yang linear antara umur laki-laki dewasa dengan tekanan darah
sistolisnya ? Juga buktikan apakah garis regresi yang terbentuk sudah linear ?
Gunakan = 0,05.
r
2.8. Tentukan Koefisien korelasi [ ] dan koefisien determinan [ R ] dan jelaskan
maksud dari besaran tersebut ?
2.9. Buktikan, apakah terdapat hubungan linear yang signifikan antara umur dan tekanan
darah sistolis ! Gunakan = 0,05.
2.10. Tentukan Interval Kepercayaan 95 % bagi !

Printout computer statististic


Regression
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .560a .314 .261 8.000
a. Predictors: (Constant), Umur (tahun) : (xi)

36
Analisis Regresi dan Korelasi Linear

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 380.002 1 380.002 5.938 .030a
Residual 831.998 13 64.000
Total 1212.000 14
a. Predictors: (Constant), Umur (tahun) : (xi)
b. Dependent Variable: Tekanan darah sistolik : (yi)

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 91.714 11.387 8.054 .000
Umur (tahun) : (xi) .771 .316 .560 2.437 .030
a. Dependent Variable: Tekanan darah sistolik : (yi)

04-03. Dari suatu penyelidikan terhadap 10 pria pekerja tambang dapat dikumpulkan data-data
sebagai berikut :

No. 1 2 3 4 5 6 7 8 9 10 11 12 13
yi 150 175 165 170 180 210 220 195 185 175 150 130 130
xi 10.6 13.1 10.6 11.6 10.6 13.1 11.6 12.8 12.8 9.8 10.6 11.5 14.0

dimana :
Variabel dependen ( y i ) : Tekanan darah sistolis (mmHg)
Variabel independen ( x i ) : Kadar Hb darah (gr %)
3.1. Gambarkan scatter diagram !
3.2. Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
3.3. Jika Hb darah pria pekerja tambang tersebut (X I) = 15.8 gr %, ramalkan tekanan darah
sistolis pada orang tersebut ?
3.4. Tentukanlah :
a) Sbo2 dan Sbo !
b). Sb2 dan Sb !
3.5. Tentukan Estimasi bagi o dan :
a). Interval Kepercayaan 95 % bagi o !
b). Interval Kepercayaan 95 % bagi !
3.6. Ujilah Hipotesis o dan :
a). Ha : o 0
b). Ha : 0
3.7. Buktikan, apakah model regresi yang terbentuk cocok (sesuai) menggambarkan
hubungan fungsional yang linear antara Hb darah pria pekerja tambang tersebut
dengan tekanan darah sistolisnya ? Juga buktikan apakah garis regresi yang terbentuk
sudah linear ? Gunakan = 0,05.
3.8. Tentukan Koefisien korelasi [r] dan koefisien determinan [R] dan jelaskan maksud dari
besaran ter-sebut ?
3.9. Buktikan, apakah terdapat hubungan linear yang signifikan antara Hb darah dan
tekanan darah sistolis ! Gunakan = 0,05.
3.10. Tentukan Interval Kepercayaan 95 % bagi !

37
Biostatistik Infernsial

Printout computer statististic


Regression
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .107a .012 -.078 28.560
a. Predictors: (Constant), Kadar Hb darah : (xi)

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 104.507 1 104.507 .128 .727a
Residual 8972.416 11 815.674
Total 9076.923 12
a. Predictors: (Constant), Kadar Hb darah : (xi)
b. Dependent Variable: Tekanan darah sistolik : (yi)

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 145.148 75.222 1.930 .080
Kadar Hb darah : (xi) 2.280 6.368 .107 .358 .727
a. Dependent Variable: Tekanan darah sistolik : (yi)

04-04. Data berikut dikumpulkan untuk menentukan persamaan regresi dalam hubungannya
antara ukuran dada bayi ( y i ); berat badan waktu lahir ( x1i ) dan panjang badan bayi (
x 2i )

No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 25.5 26.3 32.2 36.5 37.2 20.7 28.3 20.3 28.7 30.3 25.5 47.0 35.0 35.5 35.0
x1i 2.15 2.15 4.00 4.30 3.25 2.15 2.25 2.35 3.25 4.30 4.00 3.75 3.90 4.10 2.75
x 2i 30.0 35.0 45.0 37.5 32.2 35.6 40.5 41.0 51.0 50.0 45.5 37.5 40.5 50.0 47.5

Variabel dependen ( y i ) : ukuran dada bayi (cm)


Variabel independen ( x1i ) : berat badan waktu lahir (Kg)
Variabel independen ( x 2i ) : panjang badan bayi (bbl)

4.1. Dapatkan model persamaan regresi linear ganda dari kumpulan data di atas ?
Lakukan dengan metode subsitusi, metode pembobotan dan metode matriks !
4.2. Ramalkan, ukuran dada bayi, jika berat badan lahir = 5,15 dan panjang badan bayi =
60.5

Printout computer statististic


Regression
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .638a .406 .308 5.8610
a. Predictors: (Constant), Panjang badan bayi (pbb) ; x2i,
berat badan lahir (bbl) : (xi)

38
Analisis Regresi dan Korelasi Linear

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 282.332 2 141.166 4.109 .044a
Residual 412.222 12 34.352
Total 694.553 14
a. Predictors: (Constant), Panjang badan bayi (pbb) ; x2i, berat badan lahir (bbl) : (xi)
b. Dependent Variable: Ukuran dada bayi : (yi)

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 25.062 9.856 2.543 .026
berat badan
5.957 2.084 .729 2.859 .014
lahir (bbl) : (xi)
Panjang badan
-.326 .268 -.310 -1.215 .248
bayi (pbb) ; x2i
a. Dependent Variable: Ukuran dada bayi : (yi)

4.5. Data berikut dikumpulkan untuk menentukan persamaan regresi dalam hubungannya
antara pertumbuhan ( y i ) dengan berat badan ( x1i ) dan tinggi badan ( x 2i )

No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 1.5 2.0 1.6 2.1 2.0 1.7 2.0 2.1 1.6 1.8 2.2 2.1 1.7 2.1 1.9
x1i 40.0 43.4 35.4 34.5 31.7 35.6 35.6 38.2 29.0 22.0 26.8 30.5 25.7 35.5 26.5
x 2i 1.56 1.38 1.54 1.17 1.28 1.35 1.35 1.25 1.28 1.15 1.24 1.15 1.29 1.32 1.26

Variabel dependen ( y i ) : pertumbuhan (cm) --> selisih tinggi badan tahun sebelumnya
dengan tahun penelitian.
Variabel independen ( x1i ) : berat badan (Kg)
Variabel independen ( x 2i ) : tinggi badan (m)
5.1. Dapatkan model persamaan regresi linear ganda dari kumpulan data di atas ?
5.2. Ramalkan, pertumbuhan, jika berat badan = 55,5 Kg dan tinggi badan = 1.60 Kg

Printout computer statististic


Regression
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .762a .580 .510 .1576
a. Predictors: (Constant), Panjang badan bayi (pbb) ; x2i,
berat badan (bb) : (xi)

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression .411 2 .206 8.282 .005a
Residual .298 12 .025
Total .709 14
a. Predictors: (Constant), Panjang badan bayi (pbb) ; x2i, berat badan (bb) : (xi)
b. Dependent Variable: Pertumbuhan (cm) : (yi)

39
Biostatistik Infernsial

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3.455 .455 7.585 .000
berat badan (bb) : (xi) .022 .009 .574 2.479 .029
Panjang badan bayi
-1.745 .429 -.943 -4.069 .002
(pbb) ; x2i
a. Dependent Variable: Pertumbuhan (cm) : (yi)

4.6. Data berikut dikumpulkan untuk menentukan persamaan regresi dalam hubungannya
antara pertumbuhan ( y i ) dengan berat badan ( x1i ) dan tinggi badan ( x 2i )
No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 1.5 2.0 1.6 2.1 2.0 1.7 2.0 2.1 1.6 1.8 2.2 2.1 1.7 2.1 1.9
x1i 40.0 43.4 35.4 34.5 31.7 35.6 35.6 38.2 29.0 22.0 26.8 30.5 25.7 35.5 26.5
x 2i 1.56 1.38 1.54 1.17 1.28 1.35 1.35 1.25 1.28 1.15 1.24 1.15 1.29 1.32 1.26
x3i 12.0 9.5 8.0 9.5 9.0 11.0 11.0 9.0 10.0 9.0 8.0 9.0 9.0 9.0 8.0

Variabel dependen ( y i ) : pertumbuhan


Variabel independen ( x1i ) : berat badan (Kg)
Variabel independen ( x 2i ) : tinggi badan (m)
Variabel independen ( x3i ) : umur (tahun)
1.1. Dapatkan model persamaan regresi linear ganda dari kumpulan data di atas ?
1.2. Ramalkan, pertumbuhan, jika berat badan = 55,5 Kg, tinggi badan = 1.60 Kg dan
umur = 15 tahun.

Printout computer statististic


Regression
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .844a .712 .633 .1363
a. Predictors: (Constant), Umur (tahun) : x3i, Panjang
badan bayi (pbb) ; x2i, berat badan (bb) : (xi)

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression .505 3 .168 9.062 .003a
Residual .204 11 .019
Total .709 14
a. Predictors: (Constant), Umur (tahun) : x3i, Panjang badan bayi (pbb) ; x2i, berat
badan (bb) : (xi)
b. Dependent Variable: Pertumbuhan (cm) : (yi)

40
Analisis Regresi dan Korelasi Linear

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3.849 .431 8.924 .000
berat badan (bb) : (xi) .028 .008 .730 3.442 .006
Panjang badan bayi
-1.617 .375 -.874 -4.309 .001
(pbb) ; x2i
Umur (tahun) : x3i -.080 .036 -.417 -2.245 .046
a. Dependent Variable: Pertumbuhan (cm) : (yi)

41

Anda mungkin juga menyukai