BAB III
ANALISIS REGRESI DAN KORELASI LINEAR
3.1.1 PENGANTAR
Istilah regresi berawal dari telaah Sir Francis Galton (1822-1911) yang membandingkan
tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton memperhatikan bahwa tinggi
badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur
(regressed) mendekati rerata populasi. Dengan kata lain, anak laki-laki dari ayah badannya tinggi
cenderung lebih pendek dari ayahnya, sedangkan anak laki-laki dari ayah yang badannya pendek
cenderung lebih tinggi dari ayahnya.
Beberapa contoh yang ada dalam kehidupan sehari-hari, seperti : (1) Berat badan dalam
taraf tertentu tergantung pada tinggi badannya; (2) Produktivitas kerja pada taraf tertentu
tergantung pada efisiensi dan efektivitas kerjanya; (3) Tekanan darah sistolik dalam taraf
tertentu tergantung pada Hemoglobin darah (Hb), Umur, riwayat penyakit dan lain sebagainya.
Dari gambaran di atas, dikatakan bahwa analisis regresi juga dapat digunakan untuk
peramalan. Hal ini dapat dilihat dari persamaan regresi (persamaan matematik) merupakan
persamaan yang memungkinkan untuk meramalkan y i (variabel tak bebas) berdasarkan satu
atau lebih variabel x i (variabel bebas).
Sifat hubungan regresi adalah asimetris, artinya hubungan fungsional yang diperlihat-
i ), tidak sebaliknya.
kan adalah variabel bebas ( x i ) mempengaruhi variabel tak-bebas ( y
x i (variabel bebas) yi (variabel tak-bebas)
Hubungan fungsional antara satu variabel bebas dengan satu variabel tak-bebas disebut
analisis regresi tunggal (regresi linear sederhana), secara matematis dapat ditulis dengan :
y i bModel
0 bx i i
persamaan garis regresi sampel :
Yi Model
0 xi i
persamaan garis regresi populasi :
Sedangkan hubungan fungsional yang terdiri dari lebih satu variabel bebas dengan satu
iy b b x b x ...........
variabel tak-bebas disebut analisis regresi linear ganda (multiple regression linear), secara
0 dapat
matematis 1 1i ditulis
2 2i dengan : i
Model persamaan garis regresi sampel :
Yi Model
0 1persamaan
x1i 2 x2i garis
.......... . populasi
regresi i :
3. Data variabel yang dihubungkan mempunyai pasangan sama dari subjek yang sama pula.
4. Data variabel yang dianalisis mempunyai ukuran skala interval atau rasio.
Untuk membantu agar analisis regresi secara manual dapat dilakukan dengan efisien dapat
diikuti langkah-langkah berikut :
1. Menyiapkan tabel penolong.
Tabel 3.1. Tabel Penolong Komputasi Regresi Tunggal (Regresi Linear Sederhana).
No. xi yi xi2 y i2 xi . y i
2. x2 y2 x 22 y 22 x 2 .y 2
.. .. ..
.
n. xn yn x n2 y n2 xn . y n
n n n n n
xi
i 1
yi
i 1
x i2
i 1
y
i 1
2
i x i yi
i 1
Persamaan matematis dari regresi linear sederhana (regresi tunggal) untuk nilai parameter
Yi 0 xi i
populasi adalah :
........(3-1)
dimana :
Y : variabel tak bebas (variabel dependen atau variabel terpengaruh atau variabel
i
hasil, variabel kriteria, variabel resultante) yaitu variabel yang merefleksikan
pengaruh sesungguhnya dari sebuah variabel bebas.
0 : Koefisien regresi (lazim disebut intersep) adalah taksiran sesungguhnya
besarnya rerata variabel y i ketika nilai variabel x i = 0
: koefisien regresi adalah taksiran besarnya rerata perubahan sesungguhnya yang
dialami variabel y i untuk setiap unit perubahan x i
i
komponen kesalahan (error) yang mencerminkan perbedaan antara nilai y i
:
i yang sesungguhnya. Melalui metode
individual yang teramati dan nilai-nilai y
kuadrat terkecil, error atau residual dapat didefenisikan sebagai : i y i y i
yi b0 bxi .....(3-2)
i
dimana :
i
y : variabel tak bebas (data sampel yang diamati)
b0 : konstanta (intersep)
2
Analisis Regresi dan Korelasi Linear
b : koefesien regresi
i : error (residual = sisaan) i y i y i
Catatan : Koefisien arah regresi linear (b) juga dinyatakan sebagai perubahan rerata variabel
i untuk setiap variabel x i sebesar satu satuan. Maksudnya ialah jika b positif maka variabel
y
i akan mengalami kenaikan atau pertambahan, sebaliknya bila b negatif, maka variabel y
y i
akan mengalami penurunan atau pengurangan.
Koefesien regresi bo dan b dapat dihitung dengan rumus berikut :
Cara Pertama :
n
n
n
n x i y i x y i i
b
i 1 i 1 i 1 ......(3-3)
2
n
n
n x i2 x i
i 1 i 1
dimana : dan
......(3-4)
n
n
n xi b0 y i
n
i 1
n i 1
n ..(3-5)
xi2 b xy
x
i 1
i
i 1
i 1
i i
Cara ketiga (matrik)
n
n x i
n
n
n
A n
i 1
n n x i
2
x x
i i
x x
i 1
i
i 1
i
2 i 1 i 1 i 1 ...(3-6)
dan
......(3-7)
3. Varians Regresi
Untuk menghitung varians regresi ini dapat dilakukan dengan dua cara, yaitu :
a). Cara Pertama
3
Biostatistik Infernsial
2
n
2
n x 2
i x i ........(3-8)
Var ( S x ) S x2 i 1 i 1
n(n 1)
n
n
n yi2 y i
Var (S y ) S y2 i 1 ......(3-9)
i 1
n(n 1)
n 1 2 2 2
Var (S xy ) S xy2
n 2n
S y b S x S xy .......(3-10)
S xy2
S xy2
i1 S .
xi2
Var ( Sbo ) Sb2o bo Sb2o .......(3-11)
n(n 1) S x
2
S xy2
Var (Sb ) S 2
b Sb .........(3-12)
Sb2
(n 1)S 2
x
1 ( xo x ) 2
Var (S yo) S S xy 2
yo 1 S.(3-13)
yo S yo
2
n (n 1) S x2
No. xi yi i
y y i y i ( y i y i ) 2 ( xi x ) 2
(1) (2) (3) (4) (5) (6) (7)
1. x1 y1 1
y y1 y 1 ( y1 y 1 ) 2
( x1 x ) 2
2. x2 y2 y 2 y 2 y 2 ( y 2 y 2 ) 2 ( x2 x ) 2
. .. .. ..
n. xn yn n
y y n y n ( y n y n ) 2
( xn x ) 2
n n n n n n
x
i 1
i y i 1
i y
i 1
i (y
i 1
i y i ) (y
i 1
i y ) 2 (x
i 1
i x )2
(y.......(3-14)
y ) i i
2
var (S xy ) S xy2 i 1
4 n2
Analisis Regresi dan Korelasi Linear
....(9-11) 1 x 2
Var (bo ) S b2o S xy2 n S bo Var (bo ) S bo .....(3-15)
2
n
i 1
( xi x ) 2
S xy2
Var (b) S 2
b n
S b Var (b) S b2
(x x)
i 1
i
2
......(3-16)
a). Jika b0 adalah koefisien arah regresi linear yang diperoleh dari hubungan fungsional
antara variabel bebas dan tak-bebas. Maka Interval Kepercayaan (1 )100% bagi
0 adalah :
dimana :
.......(3-17)
b). Jika b adalah koefisien arah regresi linear yang diperoleh dari hubungan fungsional
antara variabel bebas dan tak-bebas. Maka Interval Kepercayaan (1 )100% bagi
adalah :
dimana : ...(3-18)
.
o adalah variabel tak-bebas yang dipengaruhi oleh variable bebas xo yang
c). Jika y
o .
meng-gambarkan peramalan oleh xo terhadap y Maka Interval Kepercayaan
(1 )100% bagi Y adalah : o
dimana :
...(3-19)
5
Biostatistik Infernsial
Ho : o 0
H1 : o 0 Tolak Ho , jika : t H t C dimana : t C t ;( n 2 )
Ho : o 0
H1 : o 0 Tolak Ho , jika : t H t C dimana : t C t ;( n 2 )
b) Uji bagi
untuk maka :
........(3-21)
5. Analisis Varians Untuk Uji Kecocokan Model Regresi Linear dan Uji Kelinearan bagi
Regresi
a). Langkah-Langkah Perhitungan Uji Kecocokan Model Regresi Linear.
1). Pasangan Hipotesis
a. Hipotesis untuk uji kecocokan model regresi linear.
H 0' : Model regresi yang terbentuk adalah model regresi linear yang belum
sesuai (non fit) menggambarkan pengaruh satu (beberapa) variabel
independen terhadap variabel dependennya.
H 1' : Model regresi yang terbentuk adalah model regresi linear yang sesuai
(fit) menggambar-kan pengaruh satu (beberapa) variabel independen
terhadap variabel dependennya.
b. Hipotesis untuk uji kelinearan bagi regresi
2). Perhitungan.
a. Untuk uji kecocokan model regresi linear.
6
Analisis Regresi dan Korelasi Linear
........(3-23)
x1 n1 yi
x2 n2 y 2
x3 n3 y 3
.
. .
xk nk yk
7
Biostatistik Infernsial
Tabel 4. Tabel Anova Untuk Uji Kecocokan Model dan Uji Kelinearan Regresi.
JKR
Regresi JKR 1 RKR S R2
1 S R2 FCR F ;(1,( n 2 ))
JKG FHR
Galat JKG n-2 RKG S G2 S G2
n2
JKTC
Tuna KKTC k-2 RKTC S TC2
k 2 2
S TC
Cocok FCL F ;{( k 2 ),( n k )}
JKE FHL 2
Error JKE n-k RKE S E2 SE
nk
Total JKT n-1
4). Kesimpulan :
a. Untuk uji kecocokan model regresi linear.
Tolak H 0 , artinya terdapat pengaruh fungsional yang linear dan
signifikans antara satu variabel bebas terhadap variabel tergantungnya.
Dengan perkataan lain bahwa model regresi yang terbentuk adalah model yang
paling sesuai (fit) menggambarkan satu variabel bebas berpengaruh terhadap
variabel tak bebasnya.
Sebaliknya terima H 0 , artinya tidak terdapat pengaruh fungsional yang
linear dan signifikans antara satu variabel bebas terhadap variabel
tergantungnya. Dengan perkataan lain bahwa model regresi yang terbentuk
adalah model yang belum sesuai (fit) menggambarkan satu variabel bebas
berpengaruh terhadap variabel tak bebasnya.
Contoh 4-1.
Seorang peniliti ingin mengetahui pengaruh berat bayi lahir (bbl) terhadap ukuran daya
bayi (udb). Untuk maksud tersebut ia mengumpulkan data sebayak 12 bayi dan ia mengukur ubd
dan bbl seperti tersaji dalam table 4.1. berikut :
8
Analisis Regresi dan Korelasi Linear
Tabel 4.1. Data berikut diperoleh dalam suatu penelitian mengenai pengaruh antara berat badan
lahir ( x i ) terhadap ukuran dada bayi waktu lahir ( y i ).
n n n
diperoleh : ni 12 ; x
i 1
i = 38,95 ; y i 1
i = 359,50 ; x
i 1
2
i = 135,1575 ;
n n
y i2 = 10917,17 ;
i 1
xi 1
i y i =1188,48
Pertanyaan :
1). Gambarkan scatter diagram !
2). Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
3). Jika Bobot badan bayi lahir ( xi ) = 5,80 Kg, ramalkan ukuran dada bayi ini waktu lahir ?
4). Tentukanlah :
a). S b2o dan S b ? o
2
b). S b dan S b ?
2
c). S y 0 dan S y 0 ?
5). Tentukan Estimasi bagi 0 dan ?
a). Interval Kepercayaan 95 % bagi 0 ?
b). Interval Kepercayaan 95 % bagi ?
c). Interval Kepercayaan 95 % bagi Y0 ?
7). Buktikan, apakah model regresi yang terbentuk adalah model regresi yang sesuai
menggambarkan pengaruh fungsional yang signifikan bobot bayi lahir (bbl) terhadap ukuran
9
Biostatistik Infernsial
dada pada waktu lahir dan juga selidiki apakah model regresi ini merupakan garis regresi
yang linear ? Gunakan = 0,05.
Jawab :
Scatter Diagram antara Berat Badan Bayi dan Ukuran Dada Bayi pada saat lahir
38
36
34
32
30
Ukuran dada bayi
28
26
24
2,0 2,5 3,0 3,5 4,0 4,5
2). Persamaan garis regresi linear sederhana dan gambar kurva regresi
n
n
n
n xi yi
x i yi
b i 1 i 1 i 1 12(1188,48) (38,95)(359,50)
2 = 2,474
n
n
12 (135,1575) (38,95) 2
n xi2 xi
i 1 i 1
n n
bo y b.x dimana : xi
38,95
= 3,246 dan
y i
359,50
= 29,958
x i 1
12 y i 1
12
n n
= 29,958 (2,474)(3,246) = 21,927
Jadi persamaan regresi yang terbentuk adalah : y i bo b.xi = 21,927 + 2,474. x i
Contoh model regresi yang dianalisis dengan paket program statistik komputer.
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 21,928 3,495 6,274 ,000 14,141 29,716
Berat badan lahir 2,474 1,041 ,601 2,376 ,039 ,153 4,794
a. Dependent Variable: Ukuran dada bayi
yi
i 1
n.b0 b. xi 12.b0 38,95.b 359,50 ...... (1) 38,95
i 1
10
Analisis Regresi dan Korelasi Linear
n n n
x y
i 1
i i b0 . xi b. xi2 38,95.b0 135,1575.b 1188,48 ....... (2) 12
i 1 i 1
11
Biostatistik Infernsial
n
n
n xi b0 y i 12 38,95 b0 359,50
i 1
i 1
b 1188,48
n n n
38,95 135,1575
x xi2 b xi yi
i 1
i
i 1
i 1
n
n x i
12 38,95
A n
i 1
n 12135,1575 38,95 38,95 104,7875
38,95 135,1575
x x
i 1
i
i 1
2
i
n n
yi
i 1
x
i 1
i
n n 359,50 38,95
x y x
i 1
i i
i 1
2
i
1188,48 135,1575
dan
b0 21,928
A 104,7875
n
n y
i 1
i
n n 12 359,50
x x y
i 1
i
i 1
i i
38,95 1188,48
b 2,474
A 104,7875
Gambar kurva regresi hasil analisis program statistik komputer.
Ukuran dada bayi
38
36
34
32
30
28
26
Observed
24 Linear
2.0 2.5 3.0 3.5 4.0 4.5
3). Peramalan ukuran dada bayi (udb) waktu lahir, jika berat badan waktu lahir (bbl) adalah
x i = 5,80 Kg.
12
Analisis Regresi dan Korelasi Linear
n 1 2 12 1
2
S xy
n2
S y b 2 S x2
12 2
13,468 ( 2,474) 2 (0,794) 9,469
S xy 2
S xy 9,469 3,077
n
S xy2
i 1
x
2
i
(9,469)(135,1575) 12,211 S b S b 12,211 3,494
2
S 2
bo o o
S xy2 9,469
S
2
b 1,084 S b S b2 1,084 1,041
( n 1) S 2
x (12 1)(0,794)
1 ( xo x ) 2 1 (5,80 3,246) 2
S y2o S xy 1 3,077 1 4,213
n (n 1) S x2 12 (12 1)0,749
S yo 4,213 2,053
Cara Kedua
No. xi yi i
y y i y i ( y i y i ) 2 ( xi x ) 2
13
Biostatistik Infernsial
xi 1
i y
i 1
i y
i 1
i (y
i 1
i y i ) (y
i 1
i y ) 2 (x
i 1
i x) 2
y y i
2
94,7055
i
= 9,471
S
2
xy
i 1
12 2
n2
2 1 (3,246) 2
2 1 x
Var (bo ) S b2o S xy n 9,471 12,217
n x x 2
12 8,7323
i 1
i
S xy2 9,471
Var (b) S 2
1,085
b n
8,7323
x x
2
i
i 1
14
Analisis Regresi dan Korelasi Linear
artinya, kita yakin dengan tingkat kepercayaan paling sedikit 95 %, bahwa rerata
koefisien regresi sesungguhnya ada dalam interval kepercayaan dengan batas 0,155
sampai dengan 4,793.
c). Jika y
0 adalah ukuran data bayi yang dipengaruhi oleh bbl ( x0 ) yang menggambar-
o . Maka Interval Kepercayaan
kan peramalan oleh xo sebesar 5,80 kg terhadap y
(1 )100% bagi Y adalah :
o
artinya, kita yakin dengan tingkat kepercayaan paling sedikit 95 %, bahwa peramalan
ukuran dada bayi sesungguhnya ( Y0 ) oleh ukuran dada bayi sampel ( y 0 ) ada
dalam interval kepercayaan dengan batas 36,276 sampai dengan 40,850.
Ho : o 0
H1 : o 0
bo 21,927
Statisti uji : t H = = 6,276 Prob. = 0,00001
S bo 3,494
Titik kritis : t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228
Daerah kritis : Terima Ho, jika : t C t H t C
Ternyata : t H ( 6,276) t C ( 2,228) Ho ditolak.
{Prob. (=0,00001) < (=0,05)}
Kesimpulan : terbukti secara signifikas pada taraf nyata () 5 % bahwa ada
kontribusi koefisien regresi (intercept) atas terbentuknya kurva linear. Atau ada
hubungan fungsional regresi linear sederhana yang terbentuk.
15
Biostatistik Infernsial
7). Analisis Varians Untuk Uji Kecocokan Model Regresi Linear dan Uji Kelinearan bagi
Regresi
H 0' : Model regresi yang terbentuk tidak sesuai (cocok) menjelaskan pengaruh bbl
terhadap udb.
H1' : Model regresi yang terbentuk sudah sesuai (cocok) menjelaskan pengaruh bbl
terhadap udb.
Dengan kriteria : Tolak Ho, jika : FHR FCR
b. Hipotesis untuk uji kelinearan
"
H 0
: Model regresi yang terbentuk merupakan hubungan fungsional yang
linear antara variabel bebas dan tak bebasnya. Dengan perkataan lain, garis
regresi yang terbentuk adalah garis yang linear.
tidak linear antara variabel bebas dan tak bebasnya. Dengan perkataan lain,
garis regresi yang terbentuk adalah garis yang tidak linear.
Dengan kriteria : Tolak Ho, jika : FHL FCL
Perhitungan.
Tabel Anova Untuk Uji Kecocokan Model dan Uji Kelinearan Regresi.
Total JKT = dk = 11
148,15b)
Keterangan :
a. Untuk uji kecocokan
Jumlah Kuadrat Regresi (JKR)a)
16
Analisis Regresi dan Korelasi Linear
n
n
n
x i y i
JKR b x i y i i 1 i 1
i 1 n
(38,95)(359,50)
2,474 (1188,4800) = 53,45 dk = 1
12
Jumlah Kuadrat Total (JKT)b)
2
n
n
y i
(10918,1700)
(359,50) 2
= 148,15 dk = n-1 =
JKT y i2 i 1
12
i 1 n
121 = 11
Jumlah Kuadrat Galat (JKG)c)
JKG JKT JKR = 148,15 53,45 = 94,7 dengan dk = n - 2 = 12 2 = 10
JKR 53,45
RKR S R2 53,45d )
1 1
JKG 94,70
RKG SG2 9,47 e )
n2 10
RKR S R2 53,45
FHR 2 5,64 f )
RKG SG 9,47
FCR F ; (1, ( n 2 )) F0, 05;(1,10 ) 4,96 g )
Untuk Uji Kecocokan : Daerah Kritis : Tolak Ho, jika : FHR FCR
Junis data ni y i
17
Biostatistik Infernsial
Untuk Uji Kelinearan : Daerah Kritis : Tolak Ho, jika : FHL FCL
Sum of
Model Squares df Mean Square F Sig.
1 Regression 53,444 1 53,444 5,643 ,039a
Residual 94,705 10 9,471
Total 148,149 11
a. Predictors: (Constant), Berat badan lahir
b. Dependent Variable: Ukuran dada bayi
3.2.3 PENGERTIAN
Korelasi adalah istilah statistik yang menyatakan derajat hubungan linear antara dua
variabel atau lebih yang ditemukan oleh Karl Pearson pada awal tahun 1900, dan lebih terkenal
dengan sebutan Korelasi Pearson Product Moment (PPM). Dengan kata lain, korelasi adalah
suatu teknik analisis statistik yang dipakai untuk menghubungkan dua variabel atau lebih.
Hubungan antar variabel ini bersifat Simetris (dwi arah).
Dalam korelasi juga dikenal varaibel bebas ( x i ) dan variabel tak-bebas ( y i ). Variabel
x i dan y i ini terdiri dari berbagai jenis data, sehingga jenis korelasi yang dipakai ditentukan
oleh jenis-jenis data yang dihubungkan, seperti :
18
Analisis Regresi dan Korelasi Linear
a. Rumus Perhitungan Koefisien Korelasi Pearson Product Moment (dalam print out
komputer dijelaskan oleh multiple R).
n
n
n
n xi y i xi y i
rH i 1 i 1 i 1
..........(3-27)
n
n 2
n 2 n
2
n x xi n y i i
2
i y
i 1 i 1 i 1 i 1
atau dengan rumus berikut :
.......(3-28) S
H
x
r b.
y S
b. Koefisien korelasi determinan (dalam print out komputer dijelaskan oleh R Square)
Koefisien korelasi determinan menjelaskan besarnya proporsi variasi dalam variabel
respon yang dapat diterangkan oleh variabel-variabel prediktor (variabel bebas) dala
model.
......(3-29)
R (rH ) 2
c. Faktor koreksi koefisien korelasi determinan (dalam print out komputer dijelaskan oleh
Adjusted R Square)
19
Biostatistik Infernsial
e. Estimasi bagi
Pada tingkat keyakinan (1-).100 % maka pendugaan terhadap koefisien korelasi
sesungguhnya ( ) adalah :
1 1
ln Z batas bawah ; batas atas .....(3-32)
2 1
1
1,1513
atau log
: Z batas bawah ; batas atas ........(3-33)
1
1 1 rH 1 rH
dimana : Z ( Z F Z C . Z ) Z F ln atau Z F 1,1513 log
2 1 rH 1 rH
1
Z C Z ( 0,5 / 2 ) dan Z
n3
f. Uji Hipotesa bagi
1). Dengan menggunakan Uji t
- Pasangan hipotesis
H0 : Tidak terdapat hubungan linear yang signifikan antara variabel
xi atau y i
H1 : Terdapat hubungan linear yang signifikan antara variabel xi atau y i
Atau
H0 : 0
H1 : 0
- Statistik uji yang digunakan :
20 r n2
tH
1 r2
Analisis Regresi dan Korelasi Linear
.......(3-34)
Sx 0,891
atau dengan rumus : rH b. ( 2,474). 0,601
Sy 3,670
b). Koefisien korelasi determinan (dalam print out komputer dijelaskan oleh R Square)
21
Biostatistik Infernsial
1{1 (0,3612)
Rkoreksi R
k (1 R)
n k 1 0,3612 = 0,2973
12 11
dengan demikian, Rkoreksi ( 0,2973) R (0,3612)
Besaran Rkoreksi sebesar 0,2973 menjelaskan bahwa variasi ukuran dada bayi waktu lahir
pada populasi dijelaskan oleh variasi berat badan bayi pada waktu lahirnya tidak lebih dari
29,73 %.
Rkoreksi dapat digunakan, jika variabel prediktor (bebas) dalam analisis regresi lebih dari
satu, sedangkan untuk analisis regresi linear sederhana, kita cukup menjelaskan kuat
hubungan yang sesungguhnya antara variabel bebas (baik secara tunggal atau bersama-sama)
terhadap variabel tak bebasnya dengan nilai R 2 tanpa koreksi.
1 1 1
0,042 = ln 2( e 0, 042 ) = 2,085.(1- ) = 1+ = 0,351
2 1 1
dan untuk batas atas Z = 0,695 + 0,653 = 1,348
1 1 1
1,348 = ln 2( e1,348 ) = 7,699.(1- ) = 1+ = 0,770
2 1 1
22
Analisis Regresi dan Korelasi Linear
Jadi, interval estimasi pada tingkat keyakinan 95 % bagi adalah : 0,351 < < 0,770
Kesimpulan : kita percaya dengan tingkat keyakinan 95 % bahwa koefisien korelasi
sesungguhnya ( ) ada dalam cakupan interval : [ 0,351 ; 0,770 ].
r n2 (0,601) 12 2
tH = 2,378 Prob. = 0,021
1 r 2
1 (0,601) 2
t C t ( / 2 );( n 2 ) = t 0 , 025;10 = 2,228
Kesimpulan : pada taraf nyata () 5 % terdapat hubungan linear yang signifikan antara
bbl dan ukuran dada bayi waktu lahir.
rH 0,601
rC r( );( n 2 ) r0 , 05;10 = 0,576
Dalam analisis regresi linear sederhana hanya ada satu variabel bebas sebagai prediktor
terhadap satu variabel tak bebasnya. Seperti pada contoh sebelumnya, kita hanya melihat bahwa
ukuran dada bayi pada waktu lahir hanya dipengaruhi oleh berat badan bayi pada waktu lahir
tersebut, bagaimana misalnya perkembangan ukuran dada bayi tersebut tidak hanya dipengaruhi
oleh berat badan lahir saja, masih ada variabel lain, misalnya panjang bayi waktu lahir, usia
kehamilan ibu dan riwayat kesehatan selama kehamilan dan lain sebagainya.
Contoh lain, jika kita ingin melihat apakah pengaruh kecendrungan untuk berprestasi
cukup hanya oleh motivasi saja ? bagaimana dengan faktor lainnya, seperti tingkat pendidikan,
kecerdasan, kemampuan pengendalian emosional, pengalamanan dan lain sebagainya. Dalam
kasus ini variabel bebasnya lebih dari satu, dan untuk melihat secara bersamaan beberapa
variabel bebas ini terhadap variabel tak bebasnya, dapat dilakukan dengan analisis regresi linear
ganda.
23
Biostatistik Infernsial
Persamaan regresi linear ganda (multiple regression analysis) dengan 2 variabel bebas
yi b0 b1x1i b2 x2i i
secara matematis dapat ditulis dengan :
.....(5-35)
dimana : y i : variabel tak bebas yang merupakan refleksi akibat pengaruh sesung-
guhnya dari satu atau beberapa variabel bebas.
b0 : koefisien regresi intersep yang merupakan taksiran yang sesungguhnya
besarnya rerata variabel y i ketika nilai variabel x i = 0
b1 dan b2 : koefisien regresi yang merupakan taksiran besarnya rerata variasi
sesung-guhnya yang dialami variabel y i untuk setiap unit variasi x i
x1i dan x2i : variabel bebas yang diperoleh sebagai variasi factual atas subjek/objek
yang diamati.
i : residual yang menggambarkan perbedaan antara nilai y i individual yang
i yang sesungguhnya. Melalui metode kuadrat
teramati dan nilai-nilai y
terkecil, error atau residual dapat didefenisikan sebagai : i y i y i
Salah satu cara yang dapat digunakan untuk memperoleh nilai koefisien regresi, b0 ,
b1 dan b2 (tiga variabel anu) yaitu dengan menggunakan tiga buah persamaan. Selanjutnya
dengan langkah-langkah subsitusi dan eliminasi ketiga nilai koefisien regresi dapat dihitung.
Bentuk persamaan yang dimaksud adalah :
y i b0 n b1 x1i b2 x 2 i
y x i 1i b0 x1i b1 x12i b2 x1i x2i ..(5-36)
y x i 2i b0 x 2i b1 x1i x 2i b2 x22i
atau dapat juga dilakukan dengan cara lain, yaitu dengan menentukan :
wi y i y y
y i
; z1i x1i x1 x1
x 1i
; z 2i x 2i x 2
n n
x2
x 2i
n
dengan demikian penyelesaiannya dapat dilakukan dengan :
b0 y b1 x1 b2 x 2
b1
z w z z z w z
2
2i i 1i 1i 2 i i 2i
z z z z
2
1i
2
2i 1i 2i
2 ...(3-37)
b2
z w z z z w z
2
1i i 2i 1i 2 i i 1i
z z z z
2
1i
2
2i 1i 2 i
2
atau dapat juga dilakukan dengan cara lain, yaitu dengan matriks :
n
x x 1i 2i b
0
y i
x 1i x x x 2
1i 1i 2i b1 yx i 1i ..(3-38)
b
x x x x 2 y x
2
2i 1i 2 i 2i i 2i
24
Analisis Regresi dan Korelasi Linear
dimana :
n x x n x 1i 2i 1i
det(A) =
x x x x x x
1i
2
1i 1i 2i 1i
2
1i
x x x x x x x
2i 1i 2i
2
2i 2i 1i 2i
y x x y x
i 1i 2i i 1i
det(A1) =
y x x x x y x x
i 1i
2
1i 1i 2i i 1i
2
1i
y x x x x y x x x
i 2i 1i 2i
2
2i i 2i 1i 2i
n y x n y i 2i i
det(A2) =
x y x x x x y x
1i i 1i 1i 2i 1i i 1i
x y x x x y x
2i i 2i
2
2i 2i i 2i
n x y n x 1i i 1i
det(A3) =
x x y x x x
1i
2
1i i 1i 1i
2
1i
x x x y x x x x
2i 1i 2i i 2i 2i 1i 2i
det A1 det A2 det A2
dengan demikian : b0 ; b1 ; b2
det A det A det A
Contoh 3-3 :
25
Biostatistik Infernsial
Seorang peneliti ingin mengetahui apakah ada pengaruh dua variabel bebas ( x1i dan
x 2i ), yaitu pendapatan keluarga (per seratus ribu) dan jumlah anggota keluarga (jiwa) terhadap
variabel tak bebasnya ( y i ), yaitu pengeluaran keluarga untuk pembiayan kesehatan keluarga
dalam sebulan (per sertus juta). Untuk maksud tersebut telah diambil sampel secara acak
sebanyak 13 kelurga, kemudian diukumpulkan data seperti disajikan dalam tabel berikut :
y i x 1i x 2i x 2
1i x 2
2i x 1i x 2i y i x1i y xi 2i
Untuk mendapat model regresi linear ganda yang terbentuk, dapat digunakan rumus
(5-36), yaitu dengan menggunakan tiga persamaan :
26
Analisis Regresi dan Korelasi Linear
Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) .336 .455 .737 .478
Pendapatan keluarga
.245 .078 .698 3.137 .011 .980 1.021
(ratusan ribu Rp) (x1i)
Jumlah anggota
.024 .057 .092 .413 .689 .980 1.021
keluarga (x2i)
a. Dependent Variable: Pengeluaran keluarga untuk pembiayaan kesehatan (yi)
Cara lain juga dapat dilakukan, perhatikan rumus (5-37), dengan mendefenisikan :
wi y i y y
y i
21.8 =1.68 ; z x x
1i 1i 1 x1
x 1i
65.0 = 5.0
n 13 n 13
dan z 2i x 2i x 2 x2
x 2i
63
= 4.85 selanjut dapat disiapkan tabel berikut.
n 13
No wi z1i z 2i z1i2 2
z 2i z1i z 2 i wi z1i wi z 2i
1. -0.68 -3.0 -1.85 9.00 3.42 5.55 2.03 1.25
2. -0.18 0.0 -2.85 0.00 8.12 0.00 0.00 0.50
3. 0.32 1.5 0.15 2.25 0.02 0.32 0.48 0.05
4. 0.42 -1.0 0.15 1.00 0.02 -0.15 -0.42 0.06
5. 0.02 0.0 2.15 0.00 4.62 0.00 0.00 0.05
6. -0.68 -1.0 0.15 1.00 0.02 -0.15 0.68 -0.10
7. -0.48 -0.5 1.15 0.25 1.32 -0.58 0.24 -0.55
8. -0.38 0.0 -0.85 0.00 0.72 0.00 0.00 0.32
9. 0.32 0.5 3.15 0.25 9.92 1.58 0.16 1.02
10. 0.42 1.0 -1.85 1.00 3.42 -1.85 0.42 -0.78
11. 0.52 1.5 -0.85 2.25 0.72 -1.27 0.78 -0.44
12. 0.12 1.0 0.15 1.00 0.02 0.15 0.12 0.02
13. 0.22 0.0 1.15 0.00 1.32 0.00 0.00 0.26
27
Biostatistik Infernsial
w i z 1i z 2i z 2
1i z 2
2i z 1i z 2i w z i 1i w z i 2i
b1
z w z z z w z 33.69 4.50 3.501.65
2
2i i 1i 1i 2 i i 2i
z z z z
2
1i
18.00 33.69 3.50
2
2i 1i 2 i
2 2 = 0.245
b2
z w z z z w z 18.001.65 3.50 4.50
2
1i i 2i 1i 2i i 1i
= 0,024
z z z z
2
1i
2
2i 18.00 33.69 3.50
1i 2i
2 2
Cara lain juga dapat dilakukan, perhatikan rumus (5-38), dengan mendefenisikan :
13 65 63 b0 21,8
65 34 318,5 b 1 3,5
selanjutnya dapat dihitung dengan metode matriks :
63 318,5 3 9 b2 107,3
28
Analisis Regresi dan Korelasi Linear
13 65 63 13 65
det(A) 65 343 318,5 65 343
63 318,5 339 63 318,5
1511601 1304257,5 1304257,5 1361367 1318749,25 1432275 7722475
21,8 65 63 21,8 65
det(A1) 1 3,5 343 318,5 113,5 343
107,3 318,5 339 107,3 318,5
2534838,6 2221378,25 2277434,25 2318645,7 2211441,05 2500972,5 2591,85
13 21,8 63 13 21,8
det(A2) 65 1 3,5 318,5 65 1 3,5
63 107,3 339 63 107,3
500194,5 437427,9 439393,5 450481,5 444275,65 480363 1895,75
13 65 21,8 13 65
det(A3) 65 343 1 3,5 65 343
63 318,5 107,3 63 318,5
478450,7 464782,5 451314,5 471076,2 469946,75 453342,5 182,25
29
Biostatistik Infernsial
det A1 2591,75
dengan demikian : b0 0,336
det A 7724,75
det A2 1895,75
b1 0,245
det A 7724,75
det A2 182,25
b2 0,024
det A 7724,75
Sehingga diperoleh model regresi linear ganda, yaitu : y i 0.336 0.245 x1i 0.024 x2i
Demikian juga, untuk persamaan regresi linear ganda (multiple regression analysis)
dengan 3 variabel bebas yang secara matematis dapat ditulis dengan :
..(5-39)
y i b0 b1 x1i b2 x2i b3 x3i i
Juga dapat digunakan untuk memperoleh nilai koefisien regresi, b0 , b1 , b2 dan b3
(empat variabel anu) yaitu dengan menggunakan empat buah persamaan. Selanjutnya dengan
langkah-langkah subsitusi dan eliminasi ketiga nilai koefisien regresi dapat dihitung. Bentuk
persamaan yang dimaksud adalah :
y i b0 n b1 x1i b2 x 2 i b3 x3i
y x i 1i b0 x1i b1 x12i b2 x1i x 2i b3 x1i x3i (3-40)
Analisis regresi linear ganda adalah merupakan pengembangan dari analisis regresi linear
sederhana, oleh karena itu penggunaan analisis ini harus disertai dengan pemenuhan asumsi-
asumsi. Pelanggaran terhadap salah satu asumsi-asumsi yang disyaratkan pada penggunaan
regresi linear ganda tersebut akan mempengaruhi terhadap sifat-sifat atau ciri-ciri yang dimiliki
oleh pendugaan atau penaksir yang mendasari analisis regresi linear gandanya.
Asumsi yang dugunakan untuk uji regresi linear ganda harus memenuhi uji asumsi
klasik berikut :
1) Uji normalitas, untuk menguji apakah sebuah model regresi yang terdiri atas variable
bebas, tak-bebas atau kedua-duanya berditribusi normal atau tidak. Model regresi yang baik
adalah variabel bebas dan tak-bebasnya atau terutama variabel tak-bebasnya berditribusi
normal, atau secara matematis dapat dijelaskan dengan : i N (0, 2 ) artinya sisaan
menyebar mengikuti ditribusi normal dengan rerata 0 dan varians ( 2 )
Pada analisis statistic computer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi normalitas jika pola pada grafik Normal P-P Plot data menyebar disekitar garis
diagonal dan mengikuti arah garis diagonal.
30
Analisis Regresi dan Korelasi Linear
31
Biostatistik Infernsial
Print out :
N
o
r
m
a
l
D
e
p
n
d
e P -
t10..08V
a l
o
t
rib
lef
R
e
g
r
:P
n
g
es
i
o
lu
an
S
t
a
n
d
rn
K
ur
i
z
e
d
tk
P
e
m
bR
e
s
i
d
u
a
.K
e
s
h
al
tn
m
Pb
ro
C
0
.0
6
u
td
.0
4
c
p
E
e
x
.0
2
.0
.0O
b
s
e
r0v
.2 .4d
C
u
m
0P
ro
.6b
0
.81
.0
Grafik di atas terlihat bahwa titik-titik menyebar disekitar garis diagonal, serta
penyebarannya mengikuti arah garis diagonal, artinya model regresi linear ganda yang
terbentuk berdistribusi normal dan layak dipakai untuk memprediksi variabel tak-bebasnya
berdasarkan pengaruh variabel bebasnya.
2) Uji Heteroskedastisitas, adalah untuk melihat apakah terjadi ketidaksamaan varians dari
residual satu pengamatan ke pengamatan yang lain. Jika varians dari residual satu
pengamatan ke pengamatan yang lain, sama (tetap), artinya terdapat homoskedastisitas.
Sebaliknya, jika varians dari residual satu pengamatan ke pengamatan yang lain, tidak sama
(berbeda), artinya dalam model regresi yang terbentuk (timbul masalah) heterokedastisitas.
Model regresi linear ganda yng baik adalah tidak terjadi heterokedastisitas. Atau dapat
dinyatakan dengan : Var i i , sama untuk semua sisaan.
2
Pada analisis statistik komputer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi tidak heterokedastisitas dilakukan dengan melihat pola tertentu pada grafik
Scatterplot, dimana sumbu X dan Y yang telah diprediksi, dan sumbu X adalah residual
(Y prediksi Y sesungguhnya) yang telah di studentized.
Dasar pengambilan keputusan : jika ada pola tertentu, seperti titik-titik yang ada,
membentuk suatu pola tertentu yang teratur (bergelombang, melebar kemudian
menyempit), hal ini menunjukkan telah terjadi masalah heterokedastksitas. Sebaliknya jika
tidak pola yang jelas, serta titik-titik menyebar di atas dan di bawah angka o pada sumbu y,
hal ini menunjukkan bahwa pada model regresi linear ganda yang terbentuk ada
heterokedastisitas.
32
Analisis Regresi dan Korelasi Linear
S
c
a
t
er
p
l
o
t
Langkah analisis computer : Analyze, Regression, Linear ., masukkan pada kotak
D
ep
n
d
et
V
a
r
i
bl
e
:
P
ng
e
l
u
ar
n
K
ut
k
P
e
mb
.
K
e
sh
a
t
n
Dependent yi (pengeluaran KK untuk pembiayaan kesehatan), masukkan ke kotak
Independent(s) : x1i (pendapatan KK), dan x2 i (jumlah anggota keluarga), klik Plots ..,
masukkan ke kotak Yi : *SRESID dan Xi : *ZPRED, klik Normal Probability Plot, Continue,
3
Oke.
Ru
a
2
id
s
e
d
1
Sn
d
e
tu e
tizl
0
n
io
--1
R
rs
g
R
e
g
rs
io
n
S
-t1
a
n
d
rize
d
P
re
d
ic
te
d
V
a
lu
e
e
2-3-2 0 12
Gambar scatter plot di atas terlihat titik-titik menyebar secara acak, tidak membentuk pola
tertentu yang jelas, serta tersebar baik di bawah maupun di atas angka 0 pada sumbu Y. hal
ini berarti tidak terjadi heteroskedastistias pada model regresi, sehingga model regresi
liniar ganda ini layak dipakai untuk prediksi pengeluaran KK untuk pembiayaan kesehatan (
yi ) berdasarkan pengaruh variable independennya.
3) Uji Autokorelasi, menguji apakah dalam sebuah model regresi linear ganda ada korelasi
antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1
(sebelumnya). Jika terjadi korelasi, maka dinamakan ada masalah autokorelasi. Model
regresi yang baik adalah regresi yang bebas dari autokorelasi. Dengan perkataan lain, tidak
ada otokorelasi antara sisaan, berarti kovarian : i , j 0 dan i j
Catatan : Autokorelasi sering ditemukan pada regresi yang datanya time series, atau
berdasarkan waktu berkala, seperti bulanan, tahunan dan seterusnya.
Pada analisis statistik komputer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi tidak ada autokorelasi dengan patokan angka Durbin-Watson (D-W).
Angka D-W di bawah (-2) berarti ada autokorelasi positif.
Angka D-W diantara (-2) sampai dengan (+2) berarti tidak ada autokorelasi.
Angka D-W di atas (+2) berarti ada autokorelaso negatif.
Jika ada masalah autokorelasi, maka model regresi yang seharusnya signifikans, menjadi
tidak layak untuk dipakai.
Autokorelasi bisa di atasi dengan berbagai cara, antara lain :
Melakukan transformasi data, atau
Menambah data observasi
Langkah analisis computer : Analyze, Regression, Linear ., masukkan pada kotak
Dependent yi (pengeluaran KK untuk pembiayaan kesehatan), masukkan ke kotak
Independent(s) : x1i (pendapatan KK), dan x2 i (jumlah anggota keluarga), klik Statistics
.., klik Dubin-Watson pada bagian residuals, Continue, Oke.
33
Biostatistik Infernsial
Regression
Model Summaryb
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 1.143 2 .572 5.295 .027a
Residual 1.080 10 .108
Total 2.223 12
a. Predictors: (Constant), Jumlah anggota keluarga, Pendapatan KK
b. Dependent Variable: Pengeluaran KK utk Pemb. Kesehatan
Hasil analisis di atas terlihat bahwa angka D-W sebesar 1,524 dan angka ini terletak
diantara -2 sampai dengan 2, artinya model regresi yang terbentuk tidak ada masalah
autokorelasi, dengan demikian model regresi yang signifikan ( p. = 0,027) dapat digunakan
sebagai model peramalan.
4) Uji Multikolinieritas, adalah uji terhadap model regresi linear ganda apakah ditemukan
adanya korelasi antar variabel independen. Jika terjdi korelasi, maka dinamakan terdapat
masalah multiko-linearitas. Model regresi yang baik adalah tidak terjadi korelasi antar
variabel independen.
Pada analisis statistik komputer (SPSS) model regresi linear ganda dikatakan memenuhi
asumsi tidak multikolinearitas jika :
Mempunyai nilai VIF (Variance Inflation Factor) di sekita angka 1.
Mempunyai nilai Tolerance mendekati 1.
Langkah analisis computer : Analyze, Regression, Linear ., masukkan pada kotak
Dependent yi (pengeluaran KK untuk pembiayaan kesehatan), masukkan ke kotak
Independent(s) : x1i (pendapatan KK), dan x2 i (jumlah anggota keluarga), klik Statistics
.., klik Collinearity diagnostics pada bagian residuals, Continue, Oke.
34
Analisis Regresi dan Korelasi Linear
Soal Latihan
04-01. Suatu penelitian dilakukan untuk memprediksi seberapa tinggi produktivitas kerja
pegawai bila kemampuan kerja ditingkatkan. Untuk maksud tersebut dikumpulkan data
secara random yang mewakili 12 pegawai, yaitu data tentang kemampuan kerja ( x i )
dan Nilai Produktivitas kerja ( y i ), sebagai berikut :
No. 1 2 3 4 5 6 7 8 9 10 11 12
yi 60 60 65 85 80 65 55 55 60 65 85 80
xi 70 60 60 68 77 60 55 50 64 67 67 72
Pertanyaan :
1.1. Gambarkan scatter diagram !
1.2. Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
1.3. Jika Kemampuan kerja ( x i ) = 6,50 Kg, ramalkan nilai produktivitas kerja pegawai
tersebut ?
1.4. Tentukanlah :
a). Sbo2 dan Sbo !
b). Sb2 dan Sb !
1.5. Tentukan Estimasi bagi o dan :
a). Interval Kepercayaan 90 % bagi o !
b). Interval Kepercayaan 90 % bagi !
1.6. Ujilah Hipotesis o dan :
a). Ha : o 0
b). Ha : 0
1.7. Buktikan, apakah model regresi yang terbentuk sudah sesuai menggambarkan
hubungan fungsional yang signifikan antara kemampuan kerja dengan produktivitas
kerja ? Juga buktikan bahwa garis regresi yang terbetuk sudah linear ? Gunakan =
0,10.
r
1.8. Tentukan Koefisien korelasi [ ] dan koefisien determinan [ R ] dan jelaskan
maksud dari besaran tersebut ?
1.9. Buktikan, apakah terdapat hubungan linear yang signifikan antara kemampuan kerja
dan ukuran produktivitas kerja ! Gunakan = 0,10.
1.10. Tentukan Interval Kepercayaan 90 % bagi !
Model Summary
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 713.411 1 713.411 10.055 .010a
Residual 709.506 10 70.951
Total 1422.917 11
a. Predictors: (Constant), Kemampuan kerja (xi)
b. Dependent Variable: Produktivitas kerja (yi)
35
Biostatistik Infernsial
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -.493 21.710 -.023 .982
Kemampuan kerja (xi) 1.066 .336 .708 3.171 .010
a. Dependent Variable: Produktivitas kerja (yi)
04-02. Data berikut menggambarkan hubungan umur (tahun) dengan tekanan darah sistolis
(mmHg) dari 15 orang laki-laki dewasa :
No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 116 110 128 130 115 110 110 120 125 140 129 114 116 110 112
xi 29 30 32 29 30 30 32 43 40 48 48 40 30 35 35
dimana :
Variabel dependen ( y i ) : Tekanan darah sistolis (mmHg)
Variabel independen ( x i ) : Umur laki-laki dewasa (tahun)
2.1. Gambarkan scatter diagram !
2.2 Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
2.3. Jika Umur laki-laki dewasa tersebut ( x i ) = 75 tahun, ramalkan tekanan darah
sistolis pada orang tersebut ?
2.4. Tentukanlah :
a) Sbo2 dan Sbo !
b). Sb2 dan Sb !
2.5. Tentukan Estimasi bagi o dan :
a). Interval Kepercayaan 95 % bagi o !
b). Interval Kepercayaan 95 % bagi !
2.6. Ujilah Hipotesis o dan :
a). Ha : o 0
b). Ha : 0
2.7. Buktikan, apakah model regresi yang terbentuk cocok (sesuai) menggambarkan
hubungan fungsional yang linear antara umur laki-laki dewasa dengan tekanan darah
sistolisnya ? Juga buktikan apakah garis regresi yang terbentuk sudah linear ?
Gunakan = 0,05.
r
2.8. Tentukan Koefisien korelasi [ ] dan koefisien determinan [ R ] dan jelaskan
maksud dari besaran tersebut ?
2.9. Buktikan, apakah terdapat hubungan linear yang signifikan antara umur dan tekanan
darah sistolis ! Gunakan = 0,05.
2.10. Tentukan Interval Kepercayaan 95 % bagi !
36
Analisis Regresi dan Korelasi Linear
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 380.002 1 380.002 5.938 .030a
Residual 831.998 13 64.000
Total 1212.000 14
a. Predictors: (Constant), Umur (tahun) : (xi)
b. Dependent Variable: Tekanan darah sistolik : (yi)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 91.714 11.387 8.054 .000
Umur (tahun) : (xi) .771 .316 .560 2.437 .030
a. Dependent Variable: Tekanan darah sistolik : (yi)
04-03. Dari suatu penyelidikan terhadap 10 pria pekerja tambang dapat dikumpulkan data-data
sebagai berikut :
No. 1 2 3 4 5 6 7 8 9 10 11 12 13
yi 150 175 165 170 180 210 220 195 185 175 150 130 130
xi 10.6 13.1 10.6 11.6 10.6 13.1 11.6 12.8 12.8 9.8 10.6 11.5 14.0
dimana :
Variabel dependen ( y i ) : Tekanan darah sistolis (mmHg)
Variabel independen ( x i ) : Kadar Hb darah (gr %)
3.1. Gambarkan scatter diagram !
3.2. Tentukan persamaan garis regresi linear sederhana dan gambarkan kurvanya
3.3. Jika Hb darah pria pekerja tambang tersebut (X I) = 15.8 gr %, ramalkan tekanan darah
sistolis pada orang tersebut ?
3.4. Tentukanlah :
a) Sbo2 dan Sbo !
b). Sb2 dan Sb !
3.5. Tentukan Estimasi bagi o dan :
a). Interval Kepercayaan 95 % bagi o !
b). Interval Kepercayaan 95 % bagi !
3.6. Ujilah Hipotesis o dan :
a). Ha : o 0
b). Ha : 0
3.7. Buktikan, apakah model regresi yang terbentuk cocok (sesuai) menggambarkan
hubungan fungsional yang linear antara Hb darah pria pekerja tambang tersebut
dengan tekanan darah sistolisnya ? Juga buktikan apakah garis regresi yang terbentuk
sudah linear ? Gunakan = 0,05.
3.8. Tentukan Koefisien korelasi [r] dan koefisien determinan [R] dan jelaskan maksud dari
besaran ter-sebut ?
3.9. Buktikan, apakah terdapat hubungan linear yang signifikan antara Hb darah dan
tekanan darah sistolis ! Gunakan = 0,05.
3.10. Tentukan Interval Kepercayaan 95 % bagi !
37
Biostatistik Infernsial
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 104.507 1 104.507 .128 .727a
Residual 8972.416 11 815.674
Total 9076.923 12
a. Predictors: (Constant), Kadar Hb darah : (xi)
b. Dependent Variable: Tekanan darah sistolik : (yi)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 145.148 75.222 1.930 .080
Kadar Hb darah : (xi) 2.280 6.368 .107 .358 .727
a. Dependent Variable: Tekanan darah sistolik : (yi)
04-04. Data berikut dikumpulkan untuk menentukan persamaan regresi dalam hubungannya
antara ukuran dada bayi ( y i ); berat badan waktu lahir ( x1i ) dan panjang badan bayi (
x 2i )
No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 25.5 26.3 32.2 36.5 37.2 20.7 28.3 20.3 28.7 30.3 25.5 47.0 35.0 35.5 35.0
x1i 2.15 2.15 4.00 4.30 3.25 2.15 2.25 2.35 3.25 4.30 4.00 3.75 3.90 4.10 2.75
x 2i 30.0 35.0 45.0 37.5 32.2 35.6 40.5 41.0 51.0 50.0 45.5 37.5 40.5 50.0 47.5
4.1. Dapatkan model persamaan regresi linear ganda dari kumpulan data di atas ?
Lakukan dengan metode subsitusi, metode pembobotan dan metode matriks !
4.2. Ramalkan, ukuran dada bayi, jika berat badan lahir = 5,15 dan panjang badan bayi =
60.5
38
Analisis Regresi dan Korelasi Linear
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 282.332 2 141.166 4.109 .044a
Residual 412.222 12 34.352
Total 694.553 14
a. Predictors: (Constant), Panjang badan bayi (pbb) ; x2i, berat badan lahir (bbl) : (xi)
b. Dependent Variable: Ukuran dada bayi : (yi)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 25.062 9.856 2.543 .026
berat badan
5.957 2.084 .729 2.859 .014
lahir (bbl) : (xi)
Panjang badan
-.326 .268 -.310 -1.215 .248
bayi (pbb) ; x2i
a. Dependent Variable: Ukuran dada bayi : (yi)
4.5. Data berikut dikumpulkan untuk menentukan persamaan regresi dalam hubungannya
antara pertumbuhan ( y i ) dengan berat badan ( x1i ) dan tinggi badan ( x 2i )
No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 1.5 2.0 1.6 2.1 2.0 1.7 2.0 2.1 1.6 1.8 2.2 2.1 1.7 2.1 1.9
x1i 40.0 43.4 35.4 34.5 31.7 35.6 35.6 38.2 29.0 22.0 26.8 30.5 25.7 35.5 26.5
x 2i 1.56 1.38 1.54 1.17 1.28 1.35 1.35 1.25 1.28 1.15 1.24 1.15 1.29 1.32 1.26
Variabel dependen ( y i ) : pertumbuhan (cm) --> selisih tinggi badan tahun sebelumnya
dengan tahun penelitian.
Variabel independen ( x1i ) : berat badan (Kg)
Variabel independen ( x 2i ) : tinggi badan (m)
5.1. Dapatkan model persamaan regresi linear ganda dari kumpulan data di atas ?
5.2. Ramalkan, pertumbuhan, jika berat badan = 55,5 Kg dan tinggi badan = 1.60 Kg
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression .411 2 .206 8.282 .005a
Residual .298 12 .025
Total .709 14
a. Predictors: (Constant), Panjang badan bayi (pbb) ; x2i, berat badan (bb) : (xi)
b. Dependent Variable: Pertumbuhan (cm) : (yi)
39
Biostatistik Infernsial
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3.455 .455 7.585 .000
berat badan (bb) : (xi) .022 .009 .574 2.479 .029
Panjang badan bayi
-1.745 .429 -.943 -4.069 .002
(pbb) ; x2i
a. Dependent Variable: Pertumbuhan (cm) : (yi)
4.6. Data berikut dikumpulkan untuk menentukan persamaan regresi dalam hubungannya
antara pertumbuhan ( y i ) dengan berat badan ( x1i ) dan tinggi badan ( x 2i )
No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi 1.5 2.0 1.6 2.1 2.0 1.7 2.0 2.1 1.6 1.8 2.2 2.1 1.7 2.1 1.9
x1i 40.0 43.4 35.4 34.5 31.7 35.6 35.6 38.2 29.0 22.0 26.8 30.5 25.7 35.5 26.5
x 2i 1.56 1.38 1.54 1.17 1.28 1.35 1.35 1.25 1.28 1.15 1.24 1.15 1.29 1.32 1.26
x3i 12.0 9.5 8.0 9.5 9.0 11.0 11.0 9.0 10.0 9.0 8.0 9.0 9.0 9.0 8.0
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression .505 3 .168 9.062 .003a
Residual .204 11 .019
Total .709 14
a. Predictors: (Constant), Umur (tahun) : x3i, Panjang badan bayi (pbb) ; x2i, berat
badan (bb) : (xi)
b. Dependent Variable: Pertumbuhan (cm) : (yi)
40
Analisis Regresi dan Korelasi Linear
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3.849 .431 8.924 .000
berat badan (bb) : (xi) .028 .008 .730 3.442 .006
Panjang badan bayi
-1.617 .375 -.874 -4.309 .001
(pbb) ; x2i
Umur (tahun) : x3i -.080 .036 -.417 -2.245 .046
a. Dependent Variable: Pertumbuhan (cm) : (yi)
41