i 1 i 1
Untuk mendapatkan α dan β, dimana n adalah jumlah titik data. Cara ini dikenal
sebagai metode kuadrat terkecil (method of least square), yang akan menghasilkan
persamaan berikut ini:
2 n
2 n
2 yi xi 1 0 atau 2 yi xi xi 0
i 1 i 1
Dari sini kita peroleh perkiraan kuadrat terkecil dari α dan β
n n
1 n ˆ n x y nxy x x y y
i i i i
ˆ yi xi y ˆx dan ̂ i 1
n
i 1
n
n i 1 n i 1
xi nx
2 2
ix x 2
i 1 i 1
E Y x ˆ ˆx
Garis regresi tersebut disebut sebagai regresi Y terhadap X dan hanya berlaku
dalam kisaran nilai x yang diamati. Dengan prosedur yang sama dapat dicari
regresi kuadrat terkecil X terhadap Y → E X y
Varians terhadap garis tersebut merupakan ukuran penyebaran yang dikehendaki
yaitu varians bersyarat (kondisional) → var Y x
1 n 1 n n
2
s 2
Y x yi yi '
2
yi y xi x
2 ˆ 2
n 2 i 1 n 2 i 1 i 1
2
Perhatikan bahwa, s 2Y x
n2
Koefisienˆ , ˆ dan s 2Y xmasing-masing taksiran dari nilai , dan var Y x
Selang (interval) keyakinan bisa juga ditetapkan dari data yang ada. Diasumsikan
Y merupakan distribusi normal terhadap garis regresi E X y untuk semua nilai
x, maka ˆ dan ˆ masing-masing memiliki distribusi-t. Dalam hal ini, nilai
regresinya E Y x ˆ ˆx juga akan memiliki distribusi-t
Pengaruh nyata dari regresi linier Y terhadap X dapat diukur dengan reduksi varians
asal Y, sY2, yang diperoleh dengan memperhitungkan kecenderungan umum pada X.
Reduksi ini dinyatakan dengan
2
s 1 n
r 2 1 2
Y x
dimana s y
2
i y y 2
sY n 1 i 1
Jika X dan Y memiliki distribusi normal, maka nilai tengah dan varians bersyarat Y
bila X = x adalah sebagai berikut:
Y
E Y x Y x X
X
var Y x Y 1 2
2
Contoh:
Data curah hujan dan aliran permukaan untuk 25 hujan lebat pada Sungai
Monocacy, dapat dilihat pada Tabel 1.
a. Gambarkan data aliran permukaan untuk curah hujan.
b. Tentukan dan gambarkan garis regresinya
c. Hitung varians dari aliran permukaan untuk curah hujan yang
diketahui.Asumsikan bahwa varians aliran permukaan adalah konstan
terhadap curah hujan.
d. Asumsikan bahwa aliran permukaan dan curah hujan adalah variat normal;
berapakan probabilitas bahwa aliran permukaan akan melampaui 2 inci
selama hujan lebat yang curah hujannya 4 inci?
3,5
1,5
0,5
sY x 0,274
0
-0,5
0 1 2 3 4 5 6
Curah Hujan, x,
in
Tabel Perhitungan
No
Curah hujan
xi (inci)
Aliran
y i (inci)
xi y i xi
2
y 'i ˆ ˆxi y i y i' y i y ii
2
x
53,89
2,16
25
1 1,11 0,52 0,58 1,23 0,343 0,177 0,0314
20,05
2 1,17 0,4 0,47 1,37 0,369 0,031 0,0010 y 0,80
3 1,79 0,97 1,74 3,20 0,639 0,331 0,1098 25
59,24 25(2,16)(0,8)
4 5,62 2,92 16,41 31,58 2,305 0,615 0,3786
ˆ
5 1,13 0,17 0,19 1,28 0,352 -0,182 0,0330 153,44 25(2,16) 2
6 1,54 0,19 0,29 2,37 0,530 -0,340 0,1155
7 3,19 0,76 2,42 10,18 1,248 -0,488 0,2378 ˆ 0,435
8 1,73 0,66 1,14 2,99 0,613 0,047 0,0023 ˆ 0,8 (0,435)(2.16)
9 2,09 0,78 1,63 4,37 0,769 0,011 0,0001
10 2,75 1,24 3,41 7,56 1,056 0,184 0,0338
b. Hasil analisis
11 1,20 0,39 0,47 1,44 0,382 0,008 0,0001
12 1,01 0,3 0,30 1,02 0,299 0,001 0,0000 regresi
E Y x 0,14 0,435x
13 1,64 0,7 1,15 2,69 0,573 0,127 0,0160
14 1,57 0,77 1,21 2,46 0,543 0,227 0,0516
15 1,54 0,59 0,91 2,37 0,530 0,060 0,0036
16 2,09 0,95 1,99 4,37 0,769 0,181 0,0327
17 3,54 1,02 3,61 12,53 1,400 -0,380 0,1443
18 1,17 0,39 0,46 1,37 0,369 0,021 0,0004
19 1,15 0,23 0,26 1,32 0,360 -0,130 0,0170
20 2,57 0,45 1,16 6,60 0,978 -0,528 0,2787
21 3,57 1,59 5,68 12,74 1,413 0,177 0,0313
22 5,11 1,74 8,89 26,11 2,083 -0,343 0,1175
23 1,52 0,56 0,85 2,31 0,521 0,039 0,0015
24 2,93 1,12 3,28 8,58 1,135 -0,015 0,0002
25 1,16 0,64 0,74 1,35 0,365 0,275 0,0758
2 1,6
PY 2 X 4 1 1 (1,46)
0,274
PY 2 X 4 1 0,9279 0.0721
1.2 Regresi dengan varians tidak konstan
Varians bersyarat terhadap garis regresi mungkin merupakan fungsi dari
variabel bebas; ini akan merupakan kasus yang dihadapi bila diagram sebar data
menunjukkan variasi yang signifikan dalam nilai-nilai variabel yang terkendali.
Variasi ini dapat dinyatakan sebagai
w y ˆ w x w wi yi xi wi yi wi xi
ˆ i i i i
dan ˆ i
w i w
i i i i i
w x
2
w x 2
dimana
1
wi 2 wi '
g 2 ( xi )
Taksiran yang tidak bias dari besaran σ2 adalah
s2
wi yi ˆ ˆxi 2
n2
sY2 x s 2 g 2 ( x) dan sY x s g ( x)
Contoh:
Penurunan maksimum dan diferensial maksimum dari 18 tangki penyimpanan di
Libya telah diamati; dan pengamatanya digambarkan pada grafik tersebut
2,5
2
Penurunan Differensial
maksimum, cm
1,5
0,5
0
0 1 2 3 4
Penurunan Maksimum, cm
Tabel Perhitungan
penurunan penurunan
Tangki
No
max. diff. max. w i w i x i wi y i wi y i x i wi x i
2
wi yi ˆ ˆxi
2
xi yi
1 0,3 0,2 11,11 3,33 2,22 0,67 1 0,0178
2 0,7 0,7 2,04 1,43 1,43 1 1 0,0816
3 0,8 0,5 1,56 1,25 0,78 0,62 1 0,0066
4 0,8 1,1 1,56 1,25 1,72 1,37 1 0,4465
5 0,9 0,3 1,23 1,11 0,37 0,33 1 0,1339
6 1 0,6 1 1 0,6 0,6 1 0,009
7 1,1 0,6 0,83 0,91 0,5 0,55 1 0,0212
8 1,4 1 0,51 0,71 0,51 0,71 1 0,001
9 1,5 1 0,44 0,67 0,44 0,66 1 0,0002
10 1,6 1 0,39 0,63 0,39 0,62 1 0,0028
11 1,6 1,3 0,39 0,63 0,51 0,81 1 0,018
12 2 1,5 0,25 0,5 0,38 0,75 1 0,006
13 2,4 1,3 0,17 0,42 0,22 0,53 1 0,0158
14 2,6 2,3 0,15 0,38 0,35 0,9 1 0,0479
15 2,9 1,9 0,12 0,34 0,23 0,66 1 0,0001
16 2,9 2,3 0,12 0,34 0,28 0,8 1 0,0164
17 3,7 1,7 0,07 0,27 0,12 0,44 1 0,0394
18 1,5 0,6 0,44 0,67 0,26 0,4 1 0,0776
(22,38)(12,42) (11,31)(15,84) 0,9418
ˆ 0,65 s2 0,0589
(22,38)(18) (15,84) 2 16
11,31 (0,65)(15,84) sY x 0,243x
ˆ 0,045
22,38
2 Regresi Linier Berganda
Asumsi yang mendasari analisis regresi berganda diberikan sebagai berikut:
1. Nilai purata Y merupakan fungsi linier dari x1, x2, …, xm; yaitu
E Y xi ,..., xm 0 1 x1 ... m xm
Dimana β1, β2, …,βm adalah konstanta-konstanta yang akan ditentukan
berdasarkan data pengamatan.
2. Varians bersyarat (conditional variance) Y untuk x1, x2, …, xm; yang diketahui
adalah konstan; yakni
var Y xi ,..., xm 2
Atau berbanding lurus terhadap fungsi yang diketahui x1, x2, …, xm; atau
var Y xi ,..., xm 2 g 2 ( xi ,..., xm )
E Y xi ,..., xm 1 x1 x1 ... m xm xm
Penjumlahan dari galat (kesalahan) kuadrat dari sejumlah n titik-titik dapat
menjadi
n n
yi yi ' yi 1 x1i x1 ... m xmi xm
2 2 2
i 1 i 1
Taksiran yang tidak bias dari varians bersyarat adalah
2
n
yi ˆ 1 x1i x1 ... m xmi xm
ˆ ˆ 2
sY2 x1 ,...,xm
n m 1 i 1
E Y x' x'
4. Analisis Korelasi
4.1 Penaksiran Koefisien Korelasi
Secara matematis, korelasi antara dua variabel acak X dan Y diukur dengan
koefisien korelasi (correlation coefficient), yaitu:
cov X , Y E X X Y Y
XY XY
Berdasarkan pada sehimpunan nilai pengamatan X dan Y, koefisien korelasi
dapat ditaksir dengan
n n
xi x yi y
1 1
xi yi nx. y
̂ i 1
i 1
n 1 s X sY n 1 s X sY
Contoh:
Data mengenai jumlah pukulan Ni dan kekuatan tekan qi dari tanah liat yang
sangat kaku, disajikan dalam Tabel 2. Berdasarkan data tersebut taksirlah
koefisien korelasinya
Tabel 2. Perhitungan
Jumlah Kuat
pukulan Tekan
Ni qi Ni2 qi2 Ni.qi
4 0,33 16 0,11 1,32
8 0,90 64 0,81 7,20 187
N 18,7
11 1,41 121 1,99 15,51 10
16 1,99 256 3,96 31,84 21,23
q 2,12
17 1,70 289 2,89 28,90 10
19 2,25 361 5,06 42,75 1
s N 4358 10(18,7) 2 95,65
2
21 2,60 441 6,76 54,60 9
25 2,71 625 7,34 67,75
32 3,33 1024 11,09 106,56 1
9
sq 56,09 10(2,12) 2 1,24
2
1
492,77 10(18,7)(2,12)
ˆ 9 0,98
95,65 1,24