Anda di halaman 1dari 18

10.

Analisa Regresi dan


Korelasi
Outline

Analisis regresi dan korelasi


1 Formulasi Dasar Regresi Linier
1.1 Regresi dengan varians konstan
1.2 Regresi dengan varians yang tidak konstan
2 Regresi Linier Berganda
3 Regresi Non-Linier
4 Analisis Korelasi
4.1 Penaksiran Koefisien Korelasi
1 Formulasi Dasar Regresi Linier
1.1 Regresi dengan varians konstan

y - Random variabel x dan y diplot ke


dalam grafik.
y' = α + βx - Nilai x dan y memiliki hubungan
karena, nilai y cenderung bertambah
jika nilai x bertambah
- Hubungan antara x dan y dapat
diwakili dengan garis lurus.
(xi,yi) yi  yi ' yi '    xi
- Garis lurus yang terbaik adalah garis
yang melewati titik-titik data dengan
kesalahan terkecil
yi  yi '
x
0
Garis dengan kesalahan total terkecil dapat diperoleh dengan membuat jumlah
kesalahan kuadratis menjadi minimum, yaitu
n n
    yi  yi '    yi    xi 
2 2 2

i 1 i 1

Untuk mendapatkan α dan β, dimana n adalah jumlah titik data. Cara ini dikenal
sebagai metode kuadrat terkecil (method of least square), yang akan menghasilkan
persamaan berikut ini:
2 n
2 n
  2 yi    xi  1  0 atau   2 yi    xi  xi   0
 i 1  i 1
Dari sini kita peroleh perkiraan kuadrat terkecil dari α dan β
n n

1 n ˆ n  x y  nxy  x  x  y  y 
i i i i
ˆ   yi   xi  y  ˆx dan ̂  i 1
n
 i 1
n
n i 1 n i 1
 xi  nx
2 2

 ix  x 2

i 1 i 1

Garis regresi kuadrat terkecil adalah

E Y x   ˆ  ˆx
Garis regresi tersebut disebut sebagai regresi Y terhadap X dan hanya berlaku
dalam kisaran nilai x yang diamati. Dengan prosedur yang sama dapat dicari
regresi kuadrat terkecil X terhadap Y → E X y 
Varians terhadap garis tersebut merupakan ukuran penyebaran yang dikehendaki
yaitu varians bersyarat (kondisional) → var Y x 

1 n 1 n n
2
s 2
Y x    yi  yi ' 
2
   yi  y     xi  x  
2 ˆ 2

n  2 i 1 n  2  i 1 i 1 

2
Perhatikan bahwa, s 2Y x 
n2
Koefisienˆ , ˆ dan s 2Y xmasing-masing taksiran dari nilai  ,  dan var Y x 

Selang (interval) keyakinan bisa juga ditetapkan dari data yang ada. Diasumsikan
Y merupakan distribusi normal terhadap garis regresi E X y  untuk semua nilai
x, maka ˆ dan ˆ masing-masing memiliki distribusi-t. Dalam hal ini, nilai
 
regresinya E Y x  ˆ  ˆx juga akan memiliki distribusi-t
Pengaruh nyata dari regresi linier Y terhadap X dapat diukur dengan reduksi varians
asal Y, sY2, yang diperoleh dengan memperhitungkan kecenderungan umum pada X.
Reduksi ini dinyatakan dengan
2
s 1 n
r 2  1 2
Y x
dimana s y
2
  i  y  y 2

sY n  1 i 1

Regresi dengan variat normal

Jika X dan Y memiliki distribusi normal, maka nilai tengah dan varians bersyarat Y
bila X = x adalah sebagai berikut:
Y
E Y x   Y   x   X 
X

var Y x    Y 1   2
2

Contoh:
Data curah hujan dan aliran permukaan untuk 25 hujan lebat pada Sungai
Monocacy, dapat dilihat pada Tabel 1.
a. Gambarkan data aliran permukaan untuk curah hujan.
b. Tentukan dan gambarkan garis regresinya
c. Hitung varians dari aliran permukaan untuk curah hujan yang
diketahui.Asumsikan bahwa varians aliran permukaan adalah konstan
terhadap curah hujan.
d. Asumsikan bahwa aliran permukaan dan curah hujan adalah variat normal;
berapakan probabilitas bahwa aliran permukaan akan melampaui 2 inci
selama hujan lebat yang curah hujannya 4 inci?

Tabel 1. Data curah hujan dan aliran permukaan


No Curah hujan Aliran No Curah hujan Aliran No Curah hujan Aliran
1 1,11 0,52 10 2,75 1,24 18 1,17 0,39
2 1,17 0,4 11 1,20 0,39 19 1,15 0,23
3 1,79 0,97 12 1,01 0,3 20 2,57 0,45
4 5,62 2,92 13 1,64 0,7 21 3,57 1,59
5 1,13 0,17 14 1,57 0,77 22 5,11 1,74
6 1,54 0,19 15 1,54 0,59 23 1,52 0,56
7 3,19 0,76 16 2,09 0,95 24 2,93 1,12
8 1,73 0,66 17 3,54 1,02 25 1,16 0,64
9 2,09 0,78
Penyelesaian:
a. Gambar datanya adalah sebagai berikut:

3,5

3 Y'= -0.14 + 0,435x


2,5
Aliran permukaan,y, in

1,5

0,5
sY x  0,274
0

-0,5
0 1 2 3 4 5 6
Curah Hujan, x,
in
Tabel Perhitungan

No
Curah hujan
xi (inci)
Aliran
y i (inci)
xi y i xi
2
y 'i  ˆ  ˆxi y i  y i' y i  y ii 
2
x
53,89
 2,16
25
1 1,11 0,52 0,58 1,23 0,343 0,177 0,0314
20,05
2 1,17 0,4 0,47 1,37 0,369 0,031 0,0010 y  0,80
3 1,79 0,97 1,74 3,20 0,639 0,331 0,1098 25
59,24  25(2,16)(0,8)
4 5,62 2,92 16,41 31,58 2,305 0,615 0,3786
ˆ 
5 1,13 0,17 0,19 1,28 0,352 -0,182 0,0330 153,44  25(2,16) 2
6 1,54 0,19 0,29 2,37 0,530 -0,340 0,1155
7 3,19 0,76 2,42 10,18 1,248 -0,488 0,2378 ˆ  0,435
8 1,73 0,66 1,14 2,99 0,613 0,047 0,0023 ˆ  0,8  (0,435)(2.16)
9 2,09 0,78 1,63 4,37 0,769 0,011 0,0001
10 2,75 1,24 3,41 7,56 1,056 0,184 0,0338
b. Hasil analisis
11 1,20 0,39 0,47 1,44 0,382 0,008 0,0001
12 1,01 0,3 0,30 1,02 0,299 0,001 0,0000 regresi
E Y x   0,14  0,435x
13 1,64 0,7 1,15 2,69 0,573 0,127 0,0160
14 1,57 0,77 1,21 2,46 0,543 0,227 0,0516
15 1,54 0,59 0,91 2,37 0,530 0,060 0,0036
16 2,09 0,95 1,99 4,37 0,769 0,181 0,0327
17 3,54 1,02 3,61 12,53 1,400 -0,380 0,1443
18 1,17 0,39 0,46 1,37 0,369 0,021 0,0004
19 1,15 0,23 0,26 1,32 0,360 -0,130 0,0170
20 2,57 0,45 1,16 6,60 0,978 -0,528 0,2787
21 3,57 1,59 5,68 12,74 1,413 0,177 0,0313
22 5,11 1,74 8,89 26,11 2,083 -0,343 0,1175
23 1,52 0,56 0,85 2,31 0,521 0,039 0,0015
24 2,93 1,12 3,28 8,58 1,135 -0,015 0,0002
25 1,16 0,64 0,74 1,35 0,365 0,275 0,0758

 53,89 20,05 59,24 153,42 2  1,7140


c. Untuk curah hujan yang diketahui, varians dari aliran permukaan adalah
2 1,714
s Yx 
2
  0,075 inci 2
n  2 25  2
sY x  0,075  0,274 inci
d. Jika curah hujan adaalh 4 inci, purata aliran menjadi

E Y X  4    0,14  0,435(4)  1,6 inci

Dengan demikian, distribusi normal untuk aliran permukaan Y dalam hujan


lebat ini adalah N(1,6; 0,274) inci. Jadi

 2  1,6 
PY  2 X  4  1     1  (1,46)
 0,274 
PY  2 X  4  1  0,9279  0.0721
1.2 Regresi dengan varians tidak konstan
Varians bersyarat terhadap garis regresi mungkin merupakan fungsi dari
variabel bebas; ini akan merupakan kasus yang dihadapi bila diagram sebar data
menunjukkan variasi yang signifikan dalam nilai-nilai variabel yang terkendali.
Variasi ini dapat dinyatakan sebagai

var Y x    2 g 2 ( x) g(x) = fungsi yang ditentukan sebelumnya.


σ = suatu konstanta yang tidak diketahui
Dalam menentukan persamaan regresi, adalah cukup wajar untuk memberikan
“bobot” yang lebih untuk titik-titik data dalam daerah yang variansnya kecil, dari
pada titik-titik dalam daerah yang variansnya besar. Untuk itu, kita memberikan
bobot yang berbanding terbalik dengan varians; atau
1 1
wi '   2 2
var Y x   g ( x)
n
   wi '  yi    xi 
2 2
Dengan demikian kesalahan kuadratnya:
i 1
Dimana taksiran kuadrat minimum α dan β menjadi

 w y  ˆ  w x w  wi yi xi    wi yi  wi xi 
ˆ  i i i i
dan ˆ  i
w i w 
 i i i  i i
w x
2
  w x 2

dimana
1
wi   2 wi ' 
g 2 ( xi )
Taksiran yang tidak bias dari besaran σ2 adalah

s2 

 wi yi  ˆ  ˆxi 2

n2

Dengan demikian taksiran varians bersyarat menjadi

sY2 x  s 2 g 2 ( x) dan sY x  s g ( x)
Contoh:
Penurunan maksimum dan diferensial maksimum dari 18 tangki penyimpanan di
Libya telah diamati; dan pengamatanya digambarkan pada grafik tersebut

2,5

2
Penurunan Differensial
maksimum, cm

1,5

0,5

0
0 1 2 3 4
Penurunan Maksimum, cm
Tabel Perhitungan
penurunan penurunan
Tangki
No
max. diff. max. w i w i x i wi y i wi y i x i wi x i
2

wi yi  ˆ  ˆxi 
2

xi yi
1 0,3 0,2 11,11 3,33 2,22 0,67 1 0,0178
2 0,7 0,7 2,04 1,43 1,43 1 1 0,0816
3 0,8 0,5 1,56 1,25 0,78 0,62 1 0,0066
4 0,8 1,1 1,56 1,25 1,72 1,37 1 0,4465
5 0,9 0,3 1,23 1,11 0,37 0,33 1 0,1339
6 1 0,6 1 1 0,6 0,6 1 0,009
7 1,1 0,6 0,83 0,91 0,5 0,55 1 0,0212
8 1,4 1 0,51 0,71 0,51 0,71 1 0,001
9 1,5 1 0,44 0,67 0,44 0,66 1 0,0002
10 1,6 1 0,39 0,63 0,39 0,62 1 0,0028
11 1,6 1,3 0,39 0,63 0,51 0,81 1 0,018
12 2 1,5 0,25 0,5 0,38 0,75 1 0,006
13 2,4 1,3 0,17 0,42 0,22 0,53 1 0,0158
14 2,6 2,3 0,15 0,38 0,35 0,9 1 0,0479
15 2,9 1,9 0,12 0,34 0,23 0,66 1 0,0001
16 2,9 2,3 0,12 0,34 0,28 0,8 1 0,0164
17 3,7 1,7 0,07 0,27 0,12 0,44 1 0,0394
18 1,5 0,6 0,44 0,67 0,26 0,4 1 0,0776
(22,38)(12,42)  (11,31)(15,84) 0,9418
ˆ   0,65 s2   0,0589
(22,38)(18)  (15,84) 2 16
11,31  (0,65)(15,84) sY x  0,243x
ˆ   0,045
22,38
2 Regresi Linier Berganda
Asumsi yang mendasari analisis regresi berganda diberikan sebagai berikut:
1. Nilai purata Y merupakan fungsi linier dari x1, x2, …, xm; yaitu
 
E Y xi ,..., xm  0  1 x1  ...   m xm
Dimana β1, β2, …,βm adalah konstanta-konstanta yang akan ditentukan
berdasarkan data pengamatan.

2. Varians bersyarat (conditional variance) Y untuk x1, x2, …, xm; yang diketahui
adalah konstan; yakni
 
var Y xi ,..., xm   2
Atau berbanding lurus terhadap fungsi yang diketahui x1, x2, …, xm; atau
 
var Y xi ,..., xm   2 g 2 ( xi ,..., xm )

Maka analisis regresinya

 
E Y xi ,..., xm    1 x1  x1   ...   m xm  xm 
Penjumlahan dari galat (kesalahan) kuadrat dari sejumlah n titik-titik dapat
menjadi
n n
    yi  yi '   yi    1 x1i  x1   ...   m xmi  xm 
2 2 2

i 1 i 1
Taksiran yang tidak bias dari varians bersyarat adalah
2
 
n
  yi  ˆ  1 x1i  x1   ...   m xmi  xm 
ˆ ˆ 2
sY2 x1 ,...,xm 
n  m  1 i 1

3. Regresi Non Linier


Regresi non linier umumnya didasarkan pada fungsi (nilai-purata) yang
diasumsikan nonlinier dengan koefisien-koefisien tak tertentu yang akan
dihitung dari data pengamatan. Tipe fungsi linier yang paling sederhana
untuk regresi dari Y atas X adalah:
E Y x     g (x)
Dengan mendefinisikan variabel baru x’ = g (x)

E Y x'    x'
4. Analisis Korelasi
4.1 Penaksiran Koefisien Korelasi
Secara matematis, korelasi antara dua variabel acak X dan Y diukur dengan
koefisien korelasi (correlation coefficient), yaitu:
cov X , Y  E X   X Y  Y 
 
 XY  XY
Berdasarkan pada sehimpunan nilai pengamatan X dan Y, koefisien korelasi
dapat ditaksir dengan
n n
xi  x  yi  y 
1  1 
xi yi  nx. y
̂  i 1
 i 1
n 1 s X sY n 1 s X sY

Contoh:
Data mengenai jumlah pukulan Ni dan kekuatan tekan qi dari tanah liat yang
sangat kaku, disajikan dalam Tabel 2. Berdasarkan data tersebut taksirlah
koefisien korelasinya
Tabel 2. Perhitungan
Jumlah Kuat
pukulan Tekan
Ni qi Ni2 qi2 Ni.qi
4 0,33 16 0,11 1,32
8 0,90 64 0,81 7,20 187
N  18,7
11 1,41 121 1,99 15,51 10
16 1,99 256 3,96 31,84 21,23
q  2,12
17 1,70 289 2,89 28,90 10
 
19 2,25 361 5,06 42,75 1
s N  4358  10(18,7) 2  95,65
2
21 2,60 441 6,76 54,60 9
25 2,71 625 7,34 67,75
32 3,33 1024 11,09 106,56 1
9

sq  56,09  10(2,12) 2  1,24
2

34 4,01 1156 16,08 136,34


187 21,23 4358 56,09 492,77

1
492,77  10(18,7)(2,12)
ˆ  9  0,98
95,65 1,24

Anda mungkin juga menyukai