Anda di halaman 1dari 30

■ Analisis Regresi & Korelasi 1

ANALISIS REGRESI

ANALISIS REGRESI SEDERHANA (SIMPLE REGRESSION ANALYSIS)


Dalam kenyataan sehari-hari sering ditemui hubungan antara dua variabel atau lebih. seperti
misalnya berat seseorang tergantung dari tingginya ; tekanan suatu gas tergantung pada temperatur
dan volumenya ; tekanan darah seseorang akan tergantung pada umurnya dan sebagainya. Dalam
hal ini variabel-variabel yang berhubungan akan dibedakan dalam bentuk variabel tergantung dan
variabel tidak tergantung (variabel bebas).
Sehingga dari contoh di atas, jika
x adalah tinggi badan seseorang dan
y adalah berat badannya,
maka :
y disebut variabel tergantung (dependent variable atau response variable) dan
x disebut variabel bebas (independent variable atau predictor variable atau deter-
minator variable)
Jika hanya terdapat satu variabel bebas, pembahasan mengenai hubungan variabelnya dibahas
dalam Analisis Regresi Sederhana (Simple Regression Analysis), tetapi jika terdapat lebih dari satu
variabel bebas akan dibahas dalam Analisis Regresi Ganda (Multiple Regression Analysis).

CURVE FITTING
Menentukan hubungan yang terjadi antara 2 variabel atau lebih dan menyatakannya bentuk
hubungannya dengan persamaan matematis.
Langkah-langkah curve fitting :
1. Mengumpulkan data-data yang berupa nilai-nilai dari variabel-variabel yang bersesuaian
misalnya :
y (berat badan) x (tinggi badan)
y1 x1
y2 x2
y3 x3
: :
yn xn

2. Plot pasangan titik-titik (x1, y1) ; (x2, y2) ; (x3, y3) ; ………… ; (xn, yn) pada sistem koordinat XY.
Hasil penggambaran titik-titik pada sistem koordinat ini disebut ‘scatter diagram’
3. Dekati ‘scatter diagram’ dengan suatu kurva, kurva yang dihasilkan disebut kurva pendekatan.
Persamaan dari kurva pendekatan :
- Jika kurvanya berupa garis lurus didekati dengan persamaan: ŷ = b0 + b1x
- Jika kurvanya berupa garis lengkung didekati dengan persamaan: ŷ = b0 + b1x + b2x2
- dan sebagainya.

y y y •
• • • •
• • • • •
• • • •
• • • • • •
• • • •
x x x

Didekati dengan Didekati dengan Tidak beraturan


kurva garis lurus kurva lengkung (tidak bisa didekati
(linier) (parabolis/kuadratis) dengan kurva)

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 2

PERSAMAAN REGRESI
Salah satu kegunaan dari curve fitting adalah untuk mengestimasikan nilai salah satu variabel
(dependent variable) berdasarkan nilai dari variabel yang lain (independent variable). Proses estimasi
ini disebut dengan Regresi.
Jika y diestimate dari nilai x dengan menggunakan suatu persamaan maka persamaan ŷ = f(x)
disebut dengan persamaan regresi y dari variabel bebas x.

METODA KUADRAT TERKECIL (ORDINARY LEAST SQUARES METHODS)


Salah satu cara untuk menentukan persamaan regresi adalah dengan metoda kuadrat terkecil.
y

(x6,y6)
(x3,y3) (x5,y5) e6
(x1,y1) e3 e5
e1 e2
(x2,y2) e4

(x4,y4)
x

Kurva yang paling mendekati (best fitting curve) titik-titik dalam scatter diagram adalah kurva dengan
D = e12 + e22 + ……………… + en2 minimum

a. METODA KUADRAT TERKECIL UNTUK GARIS LURUS.


Jika kurva pendekatannya adalah Garis Lurus, maka persamaan umum yang digunakan adalah
persamaan regresi linier :
ŷ = a + bx
y
yn
en
y1 y3 ŷ = a + bx
e3
e1
e2
y2

x1 x2 x3 ……….. xn x

e1 = (a + bx1) – y1 ; a dan b adalah konstanta yang akan ditentukan nilainya


e2 = (a + bx2) – y2
e3 = (a + bx3) – y3
:
en = (a + bxn) – yn
n
D= ∑ e i = (a + bx1 – y1)2 + (a + b x2 – y2)2 + ………………. + (a + b xn – yn)2
i=1

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 3

n
D= ∑ (a + bxi - yi )2
i =1
D D  2D  2D
D akan minimum jika : = 0 dan =0; > 0 dan >0
a b a 2 b 2
D  n n
• = ∑ (a + bxi - yi )2 = ∑ 2 (a + bxi - yi ) = 0
a a i =1 i =1
n n n
→ 2∑ (a + bxi - yi ) = 0 → na + b∑ xi - ∑ yi = 0
i =1 i =1 i =1
n n
na + b∑ x i = ∑ y i …………………………. (i)
i =1 i =1
 2D
• =n>0
a 2
n n
D 

b
=
b
∑ (a + bxi - yi )2 = ∑ 2 xi (a + bxi - yi ) = 0
i =1 i =1
n n n n
→ 2 ∑ x i (a + bxi - y i ) = 0 → a ∑ x i + b∑ x i 2 - ∑ x i y i = 0
i =1 i =1 i =1 i =1
n n n
a∑ x i + b∑ x i 2 = ∑ x i y i …………………………. (ii)
i =1 i =1 i =1
n
 2D

2
= >0 ∑ x i2
b i =1
Persamaan (i) dan (ii) disebut persamaan normal.
Persamaan normal untuk regresi linier di atas bisa juga dituliskan sebagai berikut :
 n  a  n 
 n  xi      yi 
 i =1    i=1 
   =  
 n n     n 
  xi  xi2      x i y i 
 i =1 i =1    i=1 
b
     
Nilai a dan b yang memberikan D minimum ditentukan dengan menyelesaikan persamaan
normal secara simultan, sebagai berikut :
n
n  xi 2
i =1 n  n
= n x i −   x i 
2
∆ =
 
n n i =1  i =1 
 xi  i
x 2

i =1 i =1
n n
 yi  xi
i =1 i =1 n n n n
∆a =
n n
=  yi  xi2 −  xi  xi yi
i =1 i =1 i =1 i =1
 xi yi  x i2
i =1 i =1
n
n  yi
i =1 n n n
∆b = = n xi yi −  xi  yi
n n i =1 i =1 i =1
 xi  xi yi
i =1 i =1

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 4

Sehingga :
n n n n
 x i2  y i −  x i  x i y i
a
a= = i =1 i =1 i =1 i =1
 n   n
2
n xi2 −   xi 
 
i =1  i=1 
n n n
n x i y i −  x i  y i
b i =1 i =1 i =1
b= =
 n n 
2
n xi −   xi 
2
 
i =1  i =1 

Nilai a dan b yang memberikan D minimum dimasukkan dalam persamaan regresi linier:
ŷ = a + b x

CONTOH 1 :
Diberikan data sampel yang berupa tinggi badan dari 12 orang ayah dan masing-masing anak
tertuanya :
No. x y
data (tinggi ayah dalam inch.) (tinggi anak dalam inch.)
1 65 68
2 63 66
3 67 68
4 64 65
5 68 69
6 62 66
7 70 68
8 66 65
9 68 71
10 67 67
11 69 68
12 71 70
a. Buat scatter diagram
b. Tentukan persamaan regresi garis lurus (linier) y dalam x
c. Tentukan persamaan regresi garis lurus (linier) x dalam y
Penyelesaian :
a.

x y Scatter Diagram
65 68
63 66
72
67 68
71
64 65
68 69 Scatter Diagram
70
62 66
y (tinggi anak)

69
70 68
68
66 65 72
67
68 71 70
67 67 68
66
69 68 66
65 64
71 70
64 60 65 70 75
62 64 66 68 70 72

x (tinggi ayah)

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 5

b. Persamaan garis regresi linier estimasi: ŷ = a + bx


x y x2 xy y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4761 4692 4624
71 70 5041 4970 4900
800 811 53418 54107 54849
∑x ∑y ∑x2 ∑xy ∑y2

n n n n
 x i2  y i −  x i  x i y i
53418(811) − 800(54107)
a = i =1 i =1 i =1 i =1
= = 35,8248 ≈ 35, 825
12(53418) − (800)2
2
n n 
n xi2 −   xi 
 
i =1  i=1 
n n n
n x i y i −  x i  y i
i =1 i =1 i =1 12(54107) − 800(811)
b= = = 0,476378 ≈ 0,476
12(53418) − (800)2
2
n   n
n xi2 −   xi 
 
i =1  i =1 
Jadi persamaan regresi linier y dalam x : ŷ = 35, 825 + 0,476x

Garis Regresi Linier: y = 35,825 + 0,476x

72

70
Tinggi Anak

68

66

64

62

60
60 62 64 66 68 70 72
Tinggi Ayah

c. Persamaan garis regresi linier : x̂ = b0 + b1y


n n n n
 y i2  x i −  y i  x i y i
54849(800) − 811(54107)
b0 = i =1 i =1 i =1 i =1
= = −3,37687 ≈ −3, 377
12(54849) − (811)2
2
n   n
n yi2 −   yi 
 
i =1  i=1 

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 6

n n n
n x i y i −  x i  y i
i =1 i =1 i =1 12(54107) − 811(800)
b1 = = = 1,036403 ≈ 1,036
12(54849) − (811)2
2
n n 
n yi −   yi 
2
 
i =1  i =1 
Jadi persamaan regresi linier x dalam y : x̂ = −3, 377 + 1,036 y

Garis Regresi Linier : x = - 3,377 + 1,036y

72
71
70
69
Tinggi Ayah

68
67
66
65
64
63
62
61
64 65 66 67 68 69 70 71 72
Tinggi Anak

b. METODA KUADRAT TERKECIL UNTUK KURVA PARABOLIS / KUADRATIS.


Jika kurva pendekatannya adalah Garis Lengkung, maka persamaan umum yang digunakan
adalah persamaan regresi kuadratis / parabolis :
ŷ = a + bx + cx2
Dengan metoda kuadrat terkecil, diperoleh persamaan normal berikut :
(i)  yi = na + b xi + c  xi2
i i i

(ii)  x i y i = a x i + b x i 2 + c  x i 3
i i i i

(iii)  xi2 yi = a xi2 + b xi3 + c  xi4


i i i i
Atau :
 n
  xi 

 y
 i

  x i2  a
 3
   
  xi  xi 2
 x i  b  =   xi yi 
    
 4    2 
  x i
2
 i
x 3
 i  c    i i 
x x y

Koefisien a, b dan c ditentukan dengan menyelesaikan persamaan normal secara simultan.

CONTOH 2 :
Dekati data dalam tabel berikut dengan persamaan regresi parabolis yang berbentuk
ŷ = a + bx + cx2
i 1 2 3 4 5 6 7 8
xi 1,2 1,8 3,1 4,9 5,7 7,1 8,6 9,8
yi 4,5 5,9 7,0 7,8 7,2 6,8 4,5 2,7

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 7

Penyelesaian :

1.20 4.50 1.44 Scatter Diagram


1.73 2.07 5.40 6.48
1.80 5.90 3.24 5.83 10.50 10.62 19.12
3.10 7.00 9.61 29.79 92.35 21.70 67.27
4.909.0 7.80 24.01 117.65 576.48 38.22 187.28
5.708.0
7.0 7.20 32.49 185.19 1055.60 41.04 233.93
7.106.0 6.80 50.41 357.91 2541.17 48.28 342.79
5.0
y 8.604.0 4.50 73.96 636.06 5470.08 38.70 332.82
9.803.0 2.70 96.04 941.19 9223.68 26.46 259.31
42.202.0 46.40 291.20 2275.35 18971.93 230.42 1448.99
1.0
0.0
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
x y x2 x3 x4 xy x2y
1.20 4.50 1.44 1.73 x
2.07 5.40 6.48
1.80 5.90 3.24 5.83 10.50 10.62 19.12
3.10 7.00 9.61 29.79 92.35 21.70 67.27
4.90 7.80 24.01 117.65 576.48 38.22 187.28
5.70 7.20 32.49 185.19 1055.60 41.04 233.93
7.10 6.80 50.41 357.91 2541.17 48.28 342.79
8.60 4.50 73.96 636.06 5470.08 38.70 332.82
9.80 2.70 96.04 941.19 9223.68 26.46 259.31
42.20 46.40 291.20 2275.35 18971.93 230.42 1448.99
n=8

Persamaan normal :
 8 42,2 291,2  a  46,4 
     
 42,2 291,2 2275,35  b  =  230,42 
     
 291,2 2275,35 18971,93 c   1448,99

8 42,2 291,2

∆ = 42,2 291,2 2275,35 = 222173,8


291,2 2275,35 18971,93
46,4 42,2 291,2

∆a = 230,42 291,2 2275,35 = 574938,3


1448,99 2275,35 18971,93
8 46,4 291,2

∆b = 42,2 230,42 2275,35 = 458771,6


291,2 1448,99 18971,93
8 42,2 46,4

∆c = 42,2 291,2 230,42 = -46877,75


291,2 2275,35 1448,99
a 574938,3
a= = = 2,587786 ≈ 2,588
 222173,8

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 8

b 458771,6
b= = = 2,064922 ≈ 2,065
 222173,8
c −46877,75
c= = = - 0,211
 222173,8
Jadi persamaan regresi kuadratis/parabolis y dalam x : ŷ = 2,588 + 2,065 x - 0,211 x2

9.00
8.00
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00

c. METODA KUADRAT TERKECIL UNTUK POLINOMIAL DERAJAD-n


Bentuk umum persamaan regresinya :
ŷ = a + b1 x + b2 x2 + b3 x3 + …………… + bn xn

Dengan metoda kuadrat terkecil diperoleh persamaan normal berikut :


(i)  yi = na + b1 xi + b2  xi2 + .......... .......... .... + bn  xin
i i i i

(ii)  xi yi = a xi + b1 xi + b2  xi + .......... .......... . + bn  xin +1


2 3

i i i i i

(iii)  xi 2
yi = a xi + b1 xi + b2  xi + .......... .......... . + bn  xin+ 2
2 3 4

i i i i i
:
(n)  xin yi = a xin + b1 xin+1 + b2  xin+ 2 + .......... .......... . + bn  xin+n
i i i i i
Atau :
 n
  xi  xi2 .........  xin   a    yi 
 b   
  xi  x i2  xi3 ..........  xin+1   1    xi yi 
 b   2 
 xin + 2   :  =   x i y i 
2
  x i2  x i3  x i 4 ..........  :   : 
 : : : :    : 
 : : : :  :
:  : 
 : : : :    : 
  x in  x in +1  x in + 2 ..........  xin + n   :   n 
 b
  n    xi yi 
Koefisien a, b1 ; b2 ; b3 …….bn ditentukan dengan menyelesaikan persamaan normal secara
simultan.

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 9

d. PERSAMAAN REGRESI NON-LINIER YANG BISA DIBAWA KE BENTUK LINIER


1. Persamaan Eksponensial
a. Persamaan regresi :
ŷ = a bx

Bisa dibawa ke bentuk linier menjadi : log ŷ = log (a bx) = log a + x log b
Atau : Y = A + Bx
dengan : Y = log ŷ → ŷ = log-1 Y
A = log a → a = log-1 A
B = log b → b = log-1 B

Catatan:
Bentuk dasar grafik y = a bx
y
y = a2-x y= a3-x y = a3x y = a2x

3a
2a

a
−1 0 1 x

b. Bentuk persamaan regresi eksponensial yang lain :


ŷ = a e bx → Model Natural Growth

Bisa dibawa ke bentuk linier menjadi : ln ŷ = ln (a e bx) = ln a + bx


Atau : Y = A + bx ; dengan : Y = ln ŷ
A = ln a

Catatan:
Bentuk dasar grafik y = a bx
y = a2-x y y = a2x
y = ae-x y = aex
2ae

ae

−1 0 1 x

CONTOH 3 :
Tabel berikut menyajikan hasil pengukuran tekanan udara (P dalam lb/inch2) dalam berbagai
volume (V dalam inch3) dari suatu gas tertentu. Berdasarkan prinsip termodinamika

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 10

hubungan antara P dengan V dinyatakan dalam bentuk P V  = C ; dengan γ dan C


merupakan konstanta yang harus ditentukan untuk kondisi yang ada.
a. Tentukan nilai γ dan C
b. Tentukan persamaan hubungan antara P dan V
c. Estimasikan atau prediksikan nilai P jika V = 100 inch3
V ( inch3 ) 54,3 61,8 72,4 88,7 118,6 194,0
P (lb/inch2) 61,2 49,5 37,6 28,4 19,2 10,1
Penyelesaian :
a. Persamaan : P V  = C → log (P V  ) = log C → log P + γ log V = log C
log P = log C - γ log V
Atau : Y = a + b X ; dengan : Y = log P
a = log C
b=-γ
X = log V
2
P V X = log V Y = log P X XY
54.30 61.20 1.7348 1.7868 3.0095 3.0997
61.80 49.50 1.7910 1.6946 3.2076 3.0350
72.40 37.60 1.8597 1.5752 3.4586 2.9294
88.70 28.40 1.9479 1.4533 3.7944 2.8310
118.60 19.20 2.0741 1.2833 4.3018 2.6617
194.00 10.10 2.2878 1.0043 5.2340 2.2977
11.6953 8.7975 23.0061 16.8544
∑x ∑y ∑x
2
∑xy
n n n n
 x i2  y i −  x i  x i y i
230061(87975) − 116953(168544)
a = i =1 i =1 i =1 i =1
2
= = 4,203354
n n  6(230061) − (116953)2
n xi2 −   xi 
 
i =1  i=1 
n n n
n x i y i −  x i  y i
i =1 i =1 i =1 6(168544) − 116953(87975)
b= 2
= = -1,4042
n 
n 6(230061) − (116953)2
n x i −  x i
 2
 
i =1  i =1 
Y = 4,20 – 1,4 X
a = log C → log C = 4,203354 → C = 15.971,81
b=-γ → - γ = -1,4042 → γ = 1,4042

b. Persamaan hubungan antara P dan V adalah : PV1,4042 = 15.971,81


c. Jika V = 100 inch3 ; maka : P = 15.971,81 (100)-1,4042 = 24,8287 lb/inch2

Grafik Eksponensial P dan V Grafik Linier Y dan X


P Y
130 1.8
120
110 1.6
100
90 1.4
80
70 1.2
60
50
@by:Femiana Gapsari 1.0
V 1.7 1.8 1.9 2.0 2.1 2.2
10 30 50 70
■ Analisis Regresi & Korelasi 11

2. Model Logistik
Persamaan regresi :
1
ŷ =
ab x
1 1 1
Dibawa ke bentuk linier : = ab x → log = log(abx) → log = log a + x log b
ŷ ŷ ŷ
1
Atau : Y = A + Bx ; dengan : Y = log

A = log a
B = log b

3. Fungsi Reciprocal (Hiperbola)


a. Persamaan regresi :
b
ŷ = a +
x
1
Dibawa ke bentuk linier : ŷ = a + bX ; dengan X =
x

b. Bentuk persamaan regresi hiperbola yang lain :


1
ŷ =
a + bx
1 1
Dibawa ke bentuk linier : = a + bx atau : Y = a + bx ; dengan Y =
ŷ ŷ

Catatan:
k y
Bentuk dasar grafik y =
x

−k k
y= y= ; k>0
x x

4. Fungsi Kuasa (Power Function) Atau Model Geometrik


Persamaan regresi :

ŷ = a x b

Dibawa ke bentuk linier : log ŷ = log a + b log x


Atau : Y=A+bX ; dengan : Y = ŷ
A = log a
X = log x

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 12

SOAL-SOAL LATIHAN :
1. Data berikut menyajikan pertumbuhan suatu koloni bakteri dalam suatu medium :
Waktu sejak Inokulasi Banyaknya bakteri
x (hari) y
3 115000
6 147000
9 239000
12 356000
15 579000
18 864000
a. Plot data dalam grafik (buat scatter diagram)
b. Fit data dengan kurva eksponensial ŷ = a b x
c. Gunakan hasilnya untuk memprediksi banyaknya bakteri pada akhir hari ke-20.

2. Data berikut merupakan hasil pengamatan mengenai permintaan suatu produk dan harga
satuannya pada 5 pasar yang berbeda.
Harga Perunit Permintaan
(Rp) (x 100 unit)
20 22
16 41
10 120
11 89
14 56
Fit data di atas dengan fungsi pangkat (power function) dan gunakan hasilnya untuk
mengestimate permintaan jika harga produknya adalah Rp 12,-

3. Struktur bangunan baru yang dibangun diatas tanah pada awalnya akan mengalami penurunan
sampai tanahnya stabil. Tinggi (kedalaman) penurunannya untuk setiap bulan dinyatakan dalam
rumus : y = 3 – 3 e-ax ; → y/3 = 1 – e-ax → 1 – y/3 = e-ax  ln (1 – y/3) = ln e-ax = - ax → Y = bx
dengan : x = umur bangunan (dalam bulan)
y = besarnya penurunan tanah (dalam cm)
Berdasarkan pengamatan diperoleh data sebagai berikut :
x (bulan) 2 4 6 12 18 24
y ( cm ) 1,07 1,88 2,26 2,78 2,97 2,99
Tentukan besarnya penurunan tanah setelah 3 tahun.

ax + b
4. a. Fit data berikut dengan kurva Gompertz yang berbentuk y = e e
x y
50 28
450 30
780 32
1200 36
4400 51
4800 58
5300 69
c. Fit data di atas dengan kurva eksponensial y = a b x
d. Gunakan hasil a dan b untuk mengestimasikan nilai y jika diberikan harga x = 3000.

5. Data berikut menunjukkan stopping distance sebuah mobil yang berjalan dengan kecepatan v.
Kecepatan (v mil/jam) 20 30 40 50 60 70
Stopping distance (d feet) 54 90 138 206 292 396
a. Buat scatter diagram
b. Fit data di atas dengan kurva parabolis.
c. Dengan hasil b. estimasikan nilai d, jika diketahui kecepatan v = 45 mil/jam dan v = 80
mil/jam.

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 13

VARIANCE DAN COVARIANCE SAMPEL DALAM PERSAMAAN REGRESI LINIER


Jika diberikan data sampel berupa pasangan (x i , yi) sebagai berikut :
x x1 x2 x3 ……………….. xn
y y1 y2 y3 ……………….. yn

maka variansi dan kovariansi sampel dari data x dan y adalah :

( xi )2
2
n n n 
n
 (xi − x )  xi n x i −   x i 
2 2 2
−  
n  i =1 
2
sx = i =1 = i=1 = i =1 = variansi x
n n n2

( yi )2
2
n n n  n
 i (y − y )  i
2
y n  y i
2 −   yi 

 
2

s y = i=1
2
= i=1
n
=
i =1  i =1  = variansi y
n n n2
n n
x y n n n
 (xi − x )(yi − y )  xiyi − ni i n xi yi −  xi  yi
s xy2 = i=1 = i=1 = i =1 i =1 i =1
2
= kovariansi x dan y
n n n

KOEFISIEN KORELASI UNTUK REGRESI LINIER


Koefisien korelasi linier ρ bisa diinterpretasikan sebagai ukuran seberapa jauh (baik) persamaan
regresi linier yang digunakan sesuai atau cocok dengan data populasinya. Jika datanya adalah data
sampel, maka koefisien korelasinya dinyatakan dengan notasi r. Besarnya ρ bisa diestimate dari r.
Besarnya koefisien korelasi r dari persamaan regresi linier ŷ = a + bx ; bisa dihitung dengan :
n n n
n x i y i −  x i  y i
i =1 i =1 i =1
s xy 2 n2
r= =
sxsy 2 2
n n  n n 
n x i −   x i 
2
n y i −   y i 
2
   
i =1  i =1  i =1  i =1 
n2 n2
n n n  n n n 
n xi yi −  xi  yi b n xi yi −  xi  y i 
r= i =1 i =1 i =1 atau r=  i =1 i =1 i =1 
2 2 2
n n  n n  n n 
n xi2 −   xi  n yi2 −   yi  n yi −   yi 
2
     
i =1  i=1  i =1  i =1  i =1  i =1 

r2 = koefisien determinasi
0 ≤ r2 ≤ 1 ; -1 ≤ r ≤ 1
r2 = 1 atau r = ± 1 → dikatakan bahwa x dan y mempunyai korelasi linier sempurna
r = 1 → dikatakan bahwa x dan y mempunyai korelasi linier sempurna
secara langsung → x naik/turun, y naik/turun
r = −1 → dikatakan bahwa x dan y mempunyai korelasi linier sempurna
secara tidak langsung (gradiennya negatif atau kurvanya
menurun) → x naik/turun, y turun/naik

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 14

y y

• •
• • • •
• • • •
• •

x x
Berkorelasi positif r > 0 Berkorelasi negatif r < 0

y y y

• • •
• • • •
• • • •
• • • •
• • • • •
• • •
x x x
r=1 r = −1 r=0
Berkorelasi sempurna Berkorelasi sempurna Tak berkorelasi
secara langsung secara tak langsung

Nilai r Keterangan
r=0 x dan y tidak berkorelasi
0 < r ≤ 0,5 hubungan x dan y lemah
0,5 < r ≤ 0,75 hubungan x dan y cukup kuat
0,75 < r ≤ 0,90 hubungan x dan y kuat
0,90 < r < 1 hubungan x dan y sangat kuat
r=1 x dan y berkorelasi sempurna
Koefisien determinasi r2 bisa diartikan sebagai sumbangan/kontribusi dari variabel x terhadap
bervariasinya (naik/turunnya) nilai variabel y.
Misalkan r = 0,9 atau r2 = 0,81 berarti 81% perubahan nilai y disebabkan oleh x, sedangkan 19%
sisanya disebabkan oleh faktor lain di luar/selain x.
Jika x dan y merupakan data metrik (kuantitatif, interval atau rasio), r disebut product moment
correlation atau pearson correlation coefficient atau simple correlation atau bivariate correlation atau
korelasi saja.

CONTOH 4 :
Dari data sampel pada contoh 1 :
No. 1 2 3 4 5 6 7 8 9 10 11 12
x (tinggi ayah) 65 63 67 64 68 62 70 66 68 67 69 71
y (tinggi anak) 68 66 68 65 69 66 68 65 71 67 68 70

diperoleh persamaan regresi estimasi : ŷ = 35, 825 + 0,476x


Untuk melihat seberapa jauh persamaan regresi linier tersebut bisa menggambarkan hubungan x dan
y dari data sampel, bisa dihitung koefisien korelasi sampelnya, sebagai berikut :
n n n
n xi yi −  xi  yi
i =1 i =1 i =1 12(54107) − 800(811)
r= = = 0,702652
n n 
2
n n 
2
12(53418) − (800)2 12(54849) − (811)2
n xi2 −   xi  n yi2 −   yi 
   
i =1  i=1  i =1  i =1 

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 15

Nilai r = 0,702652 = 70,27%; artinya kesesuaian persamaan regresi linier yang berbentuk ŷ = 35,825
+ 0,476x untuk menggambarkan hubungan x dan y dalam sampel adalah sebesar 70,27%.
Atau r2 = (0,702652)2 = 0,49 → artinya 49% perubahan nilai y disebabkan karena berubahnya nilai x
(dengan bentuk hubungan ŷ = 35,825 + 0,476x), 51% sisanya disebabkan oleh faktor lain.

KOEFISIEN KORELASI UNTUK REGRESI NON-LINIER


Untuk menentukan koefisien korelasi dari least square yang linier maupun non-linier bisa dilakukan
sebagai berikut :
Misalkan dipunyai data sampel berupa pasangan berurutan (xi , yi) ; i = 1, 2, 3, ……. , n.
Jika hubungan x dan y didekati dengan persamaan regresi estimasi ŷ est = f(x) , maka jumlah
kuadrat dari variasi-variasinya bisa dihitung sebagai berikut :
n n n
 (yi − y )2  (yi − ŷ est )  (ŷ est − y )
2 2
= +
i =1 i =1 i =1

variasi total variasi dari kesalahan variasi dari regresi


(JKT) (JKE) (JKR)

Dan koefisien determinasi dari persamaan regresi yang digunakan bisa dihitung dengan rumus :
n n
 (ŷ est − y )  (y − ŷ est )
2 2
Jumlah kuadrat regresi (JKR)
r 2 = i =1 = 1 − i =1 =
n n Jumlah kuadrat total (JKT)
 (yi − y )2  (yi − y )2
i =1 i =1

CONTOH 5 :
Diberikan data sebagai berikuit :
x 1,2 1,8 3,1 4,9 5,7 7,1 8,6 9,8
y 4,5 5,9 7,0 7,8 7,2 6,8 4,5 2,7
a. Fit dengan regresi linier dan parabola
b. Hitung koefisien korelasinya
c. Bandingkan nilai koefisien korelasi tersebut.

a.
x y x2 xy y2
1.20 4.50 1.44 5.40 20.25
1.80 5.90 3.24 10.62 34.81
3.10 7.00 9.61 21.70 49.00
4.90 7.80 24.01 38.22 60.84
5.70 7.20 32.49 41.04 51.84
7.10 6.80 50.41 48.28 46.24
8.60 4.50 73.96 38.70 20.25
9.80 2.70 96.04 26.46 7.29
42.20 46.40 291.20 230.42 290.52
Dari persamaan normal untuk regresi linier diperoleh :
n n n n
 x i2  y i −  x i  x i y i
291,2(46,4) − 42,2(230,42)
a = i =1 i =1 i =1 i =1
= = 6,9027553 ≈ 6,9
8(291,2) − (42,2)2
2
n n 
n xi2 −   xi 
 
i =1  i=1 

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 16

n n n
n x i y i −  x i  y i
i =1 i =1 i =1 8(230,42) − 42,2( 46,4)
b= = = - 0,2090531 ≈ - 0,209
8(291,2) − (42,2)2
2
n n 
n xi −   xi 
2
 
i =1  i =1 
Persamaan regresi linier ŷ = a + bx = 6,9 – 0,209 x

Persamaan regresi parabola, dari contoh 2 diperoleh : ŷ = 2,588 + 2,065 x - 0,211 x2

b. Koefisien korelasi linier ŷ = 6,9 – 0,209 x :


n n n
n xi yi −  xi  yi
i =1 i =1 i =1 8(230,42) − 42,2( 46,4)
r= = = - 0,37428
n n 
2
n n 
2
8(291,2) − (42,2)2 8(290,52) − (46,4)2
n xi2 −   xi  n yi2 −   yi 
   
i =1  i=1  i =1  i =1 

Koefisien korelasi parabola ŷ = 2,588 + 2,065 x - 0,211 x2

x y ŷ ( ŷ - y )2 (y - y )2
1.20 4.50 4.762 1.08 1.69
1.80 5.90 5.621 0.03 0.01
3.10 7.00 6.962 1.35 1.44
4.90 7.80 7.640 3.39 4.00
5.70 7.20 7.503 2.90 1.96
7.10 6.80 6.613 0.66 1.00
8.60 4.50 4.741 1.12 1.69
9.80 2.70 2.561 10.49 9.61
42.20 46.40 46.404 21.02 21.40 y = 5.80
n
 (ŷ est − y )
2
21,02
r2 = i =1 = = 0,982243 → r = 0,982243 = 0,991082
n 21,4
 (yi − y ) 2

i =1
c. Karena koefisien korelasi linier (r = −0,37428) sangat kecil dibandingkan dengan koefisien
korelasi parabola ( r = 0,991082), maka hubungan antara x dan y untuk data di atas lebih sesuai
jika didekati dengan persamaan kuadrat (parabolis) dibanding dengan persamaan linier.

9.00
8.00 Data Observasi
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
0.00 2.00 4.00 6.00 8.00 10.00

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 17

ASUMSI METODA OLS (ORDINARY LEAST SQUARE) UNTUK REGRESI LINIER


• Hubungan x (variabel independen) dan y (variabel dependen) adalah linier
• Variabel x bersifat nonstokastik (nonrandom), dan jika observasi dilakukan berulang-ulang, maka
untuk setiap nilai xi, nilai yij -nya berdistribusi Normal dengan variansi yang sama dan rata-ratanya
sama dengan ŷ i
• Rata-rata dari variabel gangguan/kesalahan ei = yi – ŷ i adalah 0
• Varian dari ei adalah sama (homoskedastisitas)
• Variabel gangguan/kesalahan ei berdistribusi Normal
y
yn
en ŷ = b0 + b1x
y3
e3
y1 e4
e1 y4
e2
y2

x1 x2 x3 x4 xn

E(ei│xi) = 0 ; i = 1, 2, 3, …… , n
Var(ei│xi) = σ2
ei ~ N(0, σ)

Asumsi-asumsi ini dikenal sebagai asumsi model regresi linier klasik (classical linear regression
model). Jika semua asumsi tadi dipenuhi, maka metoda OLS akan menghasilkan estimator b 1
(koefisien x) yang memenuhi kriteria BLUE (Best Linear Unbiased Estimator), yaitu:
1. Estimator b1 adalah linier terhadap variabel y
2. Estimator b1 merupakan estimator yang tidak bias (unbiased), yaitu nilai rata-rata atau
nilai harapan E(b1) sama dengan nilai b1 dari populasi yang sebenarnya. Jika misalnya
persamaan regresi dari populasi adalah Ŷ = β0 + β1x, maka E(b1 ) = β1
3. Estimator b1 mempunyai varian yang minimum (best), sehingga b1 merupakan estimator
yang efisien (tak bias dengan varian minimum) untuk β 1

UJI HIPOTESIS STATISTIK UNTUK KOEFISIEN REGRESI LINIER


Persamaan regresi linier ŷ = b0 + b1x diperoleh berdasarkan data sampel yang berupa pasangan
berurutan (xi, yi) dengan i = 1, 2, , 3, ……. , n.
Seringkali ingin diketahui apakah persamaan regresi tersebut juga mewakili populasi dari mana
sampel tersebut berasal atau bagaimana sebetulnya bentuk hubungan linier antara x dan y pada
populasinya.
Jika persamaan regresi linier dari populasinya dinyatakan dalam bentuk y = β0 + β1x, dan misalkan
ingin diuji hipotesis bahwa slope (β1) sama dengan suatu konstanta tertentu, katakan β 10, atau ingin
diuji apakah koefisien linier tersebut signifikan (β 1 ≠ 0), maka uji hipotesis statistiknya bisa
dirumuskan sebagai berikut:

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 18

1. Uji Hipotesis Statistik Koefisien Regresi Linier (slope):


a. ● H0 : β1 = β10
H1 : β1 ≠ β10
sx n
● Statistik uji: thitung = (b1 – β10) ~ berdistribusi t(n-2)
se
Dengan:
n n (∑ xi )2 n n 
∑ (xi - x )2 ∑ x i2 - n
( ∑ x i 2 -  ∑ x i  )2
 
► s x 2 = i =1 = i =1 =
i =1  i =1 
n n n2

(
n
)
n

(∑ yi )2
n
 ∑ y )
 n
2

∑ i y - y ∑ i
2
y
n
2
(n -y i -
 i 
2

► s y = i =1
2
= i =1 = i =1  i =1 
n n n2
n n
∑x ∑y n n n
∑ (x i - x )(y i - y ) ∑ xi yi - i i n∑ xiyi - ∑ xi ∑ yi
n
► s xy = i =1 = i =1 = i =1 i =1 i =1
2
n n 2
n
n n n n
 (yi - y est )2 ∑ y i 2 - a∑ y i - b∑ x i y i
► s e 2 = i =1 atau = i =1 i =1 i =1
(jika linier) atau
n-2 n-2
s xy
s y 2 (1 - r ) atau
n n
= = s y 2 (1 - )
n-2 n-2 sxsy
● Daerah kritis: thitung < - tα/2;(n-2) atau thitung > tα/2 ; (n-2)

α/2 1− α α/2

- tα/2 ; (n-2) tα/2 ; (n-2) t (n-2)

Daerah Penerimaan H0 : - t α/2;(n-2) ≤ thitung ≤ tα/2 ; (n-2)

b. ● H0 : β1 = β10
H1 : β1 < β10
sx n
● Statistik uji: thitung = (b1 – β10) ~ berdistribusi t(n-2)
se
● Daerah kritis:
thitung < − tα;(n-2)

α 1− α

− tα ; (n-2)

Daerah Penerimaan H0 − t α;(n-2) ≤ thitung :

c. ● H0 : β1 = β10
H1 : β1 > β10

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 19

sx n
● Statistik uji: thitung = (b1 – β10) ~ berdistribusi t(n-2)
se
● Daerah kritis:
thitung > tα ; (n-2)

1− α α

tα ; (n-2) t (n-2)

Daerah Penerimaan H0 : thitung ≤ tα ; (n-2)

CONTOH 6 :
Dari soal contoh 5, misalkan ingin diuji apakah persamaan regresi linier ŷ = 6,9 – 0,209x
signifikan, maka uji hipotesisnya adalah sebagai berikut:
• H0 : β1 = 0 (koefisien regresi x tidak signifikan)
H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
sx n
• Statistik Uji : thitung = (b – 0)
se
x y x2 xy y2
1.20 4.50 1.44 5.40 20.25
1.80 5.90 3.24 10.62 34.81
3.10 7.00 9.61 21.70 49.00
4.90 7.80 24.01 38.22 60.84
5.70 7.20 32.49 41.04 51.84
7.10 6.80 50.41 48.28 46.24
8.60 4.50 73.96 38.70 20.25
9.80 2.70 96.04 26.46 7.29
42.20 46.40 291.20 230.42 290.52
n (∑ xi )
2
(42,2)2
∑ xi 2
-
n 291,20 -
i =1 8
sx2 = = = 8,574375 → sx = 2,93
n 8
n n n
∑ y i2 - a∑ y i - b∑ x i y i
i =1 i =1 i =1 290,52 - 6,9(46,4) + 0,209(230,42)
se 2 = = = 3,086297
n-2 8−2
→ se = 1,76
sx n 2,93 8
thitung = (b1 – 0) = (−0,209 – 0) = − 0,985 ~ - t (0,025) ; 6 = −2,447
se 1,76
• Kesimpulan:
Karena thitung ≥ − t 0,025 ; 6 = −2,447 → H0 diterima, berarti koefisien regresi linier tidak signifikan.

2. Uji Hipotesis Statistik untuk Intercept Persamaan Regresi Linier:


a. ● H0 : β 0 = α0
H 1 : β 0 ≠ α0

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 20

sx n
● Statistik uji: thitung = (b0 – α0) ~ berdistribusi t(n-2)
2 2
se s x + x

● Daerah kritis: thitung < - tα/2;(n-2) atau thitung > tα/2 ; (n-2)

α/2 1− α α/2

- tα/2 ; (n-2) tα/2 ; (n-2) t (n-2)

Daerah Penerimaan H0 : - t α/2;(n-2) ≤ thitung ≤ tα/2 ; (n-2)

b. ● H 0 : β 0 = α0
H 1 : β 0 < α0
sx n
● Statistik uji: thitung = (b0 – α0) ~ berdistribusi t(n-2)
2
se s x - x 2

● Daerah kritis: thitung < − tα;(n-2)

α 1− α

− tα ; (n-2)

Daerah Penerimaan H0 :
− t α;(n-2) ≤ thitung

c. ● H 0 : β 0 = α0
H 1 : β 0 > α0
sx n
● Statistik uji: thitung = (b0 – α0) ~ berdistribusi t(n-2)
se s x 2 - x 2

● Daerah kritis: thitung > tα ; (n-2)

1− α α

tα ; (n-2) t (n-2)

Daerah Penerimaan H0 :
thitung ≤ tα ; (n-2)

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 21

UJI HIPOTESIS UNTUK KOEFISIEN REGRESI LINIER (DENGAN ANALISIS VARIANSI)


Misalkan dipunyai data sampel berupa pasangan berurutan (xi , yi) ; i = 1, 2, 3, ……. , n.
Jika hubungan x dan y didekati dengan persamaan regresi estimasi ŷ est = f(x) , maka :
n n n
 (yi − y )2  (yi − ŷ est )  (ŷ est − y )
2 2
= +
i =1 i =1 i =1

variasi total variasi dari kesalahan variasi dari regresi


(JKT) (JKE) (JKR)
n −1 n – p −1 p : derajad bebas

Untuk regresi linier ŷ = b0 + b1x ; jumlah kuadrat dari variasi bisa dihitung sebagai berikut :
2
 
  yi 
n n  
JKT = jumlah kuadrat total =  (yi − y )2 =  y i2 −  i 
i =1 i=1 n
n
 (yi − ŷ est )
2
JKE = jumlah kuadrat error/kesalahan =
i =1
n n n
=  y i2 − a  y i − b  xi y i → jika regresinya linier
i =1 i =1 i =1
n
 (ŷ est − y )
2
JKR = jumlah kuadrat regresi = = JKT − JKE
i =1
p = banyaknya koefisien regresi yang berkaitan dengan x
Untuk regresi linier : ŷ = b0 + b1x → p=1

Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi p JKR KTR = JKR /db KTR
- Error n–p−1 JKE KTE = JKE/db Fhitung =
KTE
- Total n–1 JKT

• H0 : β1 = 0 (koefisien regresi x tidak signifikan)


H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
KTR
• Statistik Uji : Fhitung = ~ Fα ; p ; (n-p-1) ; untuk regresi linier p = 1
KTE
• Daerah Kritis (Daerah Penolakan H0) : jika Fhitung > Fα ; p ; (n-p-1)

1–α α

Fα ; p ; (n-p-1) Fp ; (n-p-1)

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 22

CONTOH 7 :
Seperti soal contoh 5, misalkan ingin diuji apakah persamaan regresi linier ŷ = 6,9 – 0,209x
signifikan, maka uji hipotesisnya adalah sebagai berikut:
• H0 : β1 = 0 (koefisien regresi x tidak signifikan)
H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%

x y x2 xy y2
1.20 4.50 1.44 5.40 20.25
1.80 5.90 3.24 10.62 34.81
3.10 7.00 9.61 21.70 49.00
4.90 7.80 24.01 38.22 60.84
5.70 7.20 32.49 41.04 51.84
7.10 6.80 50.41 48.28 46.24
8.60 4.50 73.96 38.70 20.25
9.80 2.70 96.04 26.46 7.29
42.20 46.40 291.20 230.42 290.52

n
( ∑ y i )2
46,4 2
JKT = ∑ yi2 - i
n
= 290,52 -
8
= 21,4
i =1
n n n
JKE = ∑ yi2 - b0 ∑ yi - b1 ∑ xi yi = 290,52 – 6,9(46,4) – (-0,209)(230,42) = 18,52
i =1 i =1 i =1
JKR = JKT – JKE = 21,4 – 18,52 = 2,88

Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi 1 2,88 2,88
Fhitung = 0,933
- Error 8–2=6 18,52 3,087
- Total 8–1=7 21,4

• H0 : β = 0 (koefisien regresi x tidak signifikan)


H1 : β ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
• Statistik Uji : Fhitung = 0,933 < F0,05 ; 1 ; 6 = 5,99 → H0 diterima
• Kesimpulan: koefisien regresi linier tidak signifikan.

MENGHITUNG KOEFISIEN DETERMINASI DARI TABEL ANAVA


Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi
(db) (Sum square) (Mean square)
- Regresi p JKR KTR = JKR /db
- Error n–p−1 JKE KTE = JKE /db
- Total n–1 JKT
JKR JKR
Koefisien determinasi r2 = → Koefisien korelasi r =
JKT JKT
JKE
Standard error of estimate (kesalahan standar estimasi) = se = = KTE
n-2

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 23

INTERVAL KONFIDENSI (1 – α%) UNTUK KOEFISIEN REGRESI


Jika persamaan regresi sampel adalah y = b 0 + b1x dan persamaan regresi populasinya adalah Y =
β0 + β1x , maka:
• Interval konfidensi (1-α%) untuk β0 adalah
sx2 + x2
β0 = b0 ± tα/2 ; (n-2) se
ns x 2

s x 2 + nx 2 sx2 + x2
karena P [ (b0 − tα/2 ; (n-2) se ) < β0 < (b0 + tα/2 ; (n-2) se )] = 1 – α%
ns x 2 ns x 2

• Interval konfidensi (1-α%) untuk β1 adalah


se 1 KTE
β1 = b1 ± tα/2 ; (n-2) atau β1 = b1 ± tα/2 ; (n-2)
sx n sx n
se se
karena P [ (b1 − tα/2 ; (n-2) ) < β1 < (b1 + tα/2 ; (n-2) )] = 1 – α%
sx n sx n

CONTOH 8 :
Dari contoh 1, diperoleh persamaan regresi estimasi ŷ = 35, 825 + 0,476x
Tentukan interval konfidensi 95% untuk β0 dan β1

x y x2 xy y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4761 4692 4624
71 70 5041 4970 4900
800 811 53418 54107 54849
∑x ∑y ∑x2 ∑xy ∑y2

n (∑ xi )2
∑ x i2 - n
• i =1
sx2 = = 7,056 → sx = 2,656
n
n n n
∑ yi2 - b0 ∑ yi - b1∑ xi yi
i =1 i =1 i =1
• se 2 = = 3,999 → se = 1,999
n-2

• x=
 xi = 800
= 66,67
n 12

Interval konfidensi 95% untuk β0 :

sx2 + x2 7,056 + (66,67)2


β0 = b0 ± tα/2 ; (n-2) se = 35,825 ± 2,228(1,999) = 35,825 ± 32,2848
ns x 2 12(7,056)
Berarti 95% kita yakin bahwa β0 (konstanta persamaan regresi populasi) akan terletak antara
35,402 dan 68,1098

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 24

Interval konfidensi 95% untuk β1 :


se 1, ,999
β1 = b1 ± t0,025 ; (12-2) = 0,476 ± 2,228 = 0,476 ± 0,484
sx n 2,656 12
Berarti 95% kita yakin bahwa β1 (koefisien regresi populasi) akan terletak antara −0,008 dan 0,96

INTERVAL KONFIDENSI (1 – α%) UNTUK HARGA PREDIKSI


Jika persamaan regresi sampel adalah y = b 0 + b1x dan persamaan regresi populasinya adalah Y =
β0 + β1x , maka berdasarkan estimasi sampel untuk x = x0 → y0 = b0 + b1x0
Sehingga:
1 ( x 0 - x)2
Interval konfidensi (1-α%) untuk Y0 adalah Y0 = y0 ± tα/2 ; (n-2) se 1 + +
n sx2

1 ( x 0 - x)2 1 ( x 0 - x)2
karena P[(y0 − tα/2 ; (n-2) se 1 + + ) < Y0 < (y0 + tα/2 ; (n-2) s e 1 + + )] = 1 – α%
n sx2 n sx2

CONTOH 9 :
Dari contoh 1, diperoleh persamaan regresi estimasi ŷ = 35, 825 + 0,476x
Tentukan interval konfidensi 95% untuk Y0 jika x = 65

x y x2 xy y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4761 4692 4624
71 70 5041 4970 4900
800 811 53418 54107 54849
∑x ∑y ∑x
2
∑xy ∑y
2

n (∑ xi )2
∑ x i2 - n
• i =1
sx2 = = 7,056 → sx = 2,656
n
n n n
∑ yi2 - b0 ∑ yi - b1∑ xi yi
i =1 i =1 i =1
• se 2 = = 3,999 → se = 1,999
n-2

• x=
 xi = 800
= 66,67
n 12

Interval konfidensi 95% untuk Y0 jika x0 = 65 :


x0 = 65 → y0 = 35, 825 + 0,476(65) = 66,765

1 ( x 0 - x)2 1 (65 - 66,67)2


Y0 = y0 ± tα/2 ; (n-2) se 1 + + = 66,765 ± 2,228 . 1,999 1 + + = 66,765 ± 5,416
n sx2 12 7,056
Berarti 95% kita yakin bahwa Y0 akan terletak antara 61,349 dan 72,181

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 25

UJI HIPOTESIS STATISTIK UNTUK KOEFISIEN KORELASI


Uji Hipotesis Statistik untuk Koefisien Korelasi Linier:
a. ● H0 : ρ = 0 (dalam populasi sebenarnya x dan y tidak berkorelasi linier)
H1 : ρ ≠ 0 (dalam populasi sebenarnya x dan y berkorelasi linier)
r n-2
● Statistik uji: thitung = ~ berdistribusi t(n-2)
1- r 2

● Daerah kritis: thitung < - tα/2;(n-2) atau thitung > tα/2 ; (n-2)

α/2 1− α α/2

- tα/2 ; (n-2) tα/2 ; (n-2) t (n-2)

Daerah Penerimaan H0 : - t α/2;(n-2) ≤ thitung ≤ tα/2 ; (n-2)

b ● H0 : ρ = ρ 0
H1 : ρ ≠ ρ 0
1 1+ r 1 1 + ρ0
● Statistik uji: Z = ln [ ] ~ berdistribusi Normal dengan μZ = ln [ ]
2 1- r 2 1- ρ0
1
σZ =
n-3
Z - μZ
Transformasi ke Normal Standar: zhitung = ~ berdistribusi Normal standard N(0;1)
σZ
● Daerah kritis:

α/2 1− α α/2

- zα/2 zα/2 z

Daerah Penerimaan H0 : - z α/2 ≤ zhitung ≤ zα/2

c. ● H0 : ρ1 = ρ2 → (μZ1 = μZ2) → μZ1 − μZ2 = 0


H1 : ρ1 ≠ ρ2 → (μZ1 ≠ μZ2) → μZ1 − μZ2 ≠ 0

( Z1 - Z 2 ) - (μZ1 - μZ 2 ) ( Z1 - Z 2 ) - 0 Z -Z
● Statistik uji: z= = = 1 2
σ Z1 - Z 2 σ Z1 - Z 2 σ Z1 - Z 2

Z1 - Z 2
zhitung = ~ N(μ = 0; σ = 1)
σ Z1 - Z 2

1 1 + r1
Dengan: Z1 = ln [ ]
2 1- r1
1 1 + r2
Z2 = ln [ ]
2 1 - r2
1 1
σ Z1 - Z2 = +
n1 - 3 n2 - 3

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 26

● Daerah kritis: zhitung < - zα/2 atau zhitung > zα/2

α/2 1− α α/2

- zα/2 zα/2 z
Daerah Penerimaan H0 :
- z α/2 ≤ zhitung ≤ zα/2

CONTOH 10 :
Berdasarkan data dan hasil perhitungan koefisien korelasi dalam contoh 1, ujilah dengan α = 5%
apakah x dan y dalam populasi yang sebenarnya berkorelasi linier.

No. 1 2 3 4 5 6 7 8 9 10 11 12
x (tinggi ayah) 65 63 67 64 68 62 70 66 68 67 69 71
y (tinggi anak) 68 66 68 65 69 66 68 65 71 67 68 70

Koefisien korelasi sampel :


n n n
n x i y i −  x i  y i
i =1 i =1 i =1 12(54107) − 800(811)
r= = = 0,702652
n   n
2
n   n
2
12(53418) − (800)2 12(54849) − (811)2
n x i 2 −   x i  n y i 2 −   y i 
   
i =1  i =1  i =1  i =1 

Uji Hipotesis:
● H0 : ρ = 0 (dalam populasi sebenarnya x dan y tidak berkorelasi linier)
H1 : ρ ≠ 0 (dalam populasi sebenarnya x dan y berkorelasi linier)
r n-2 0,702652 12 - 2
● Statistik uji: thitung = = = 3,1228 ~ berdistribusi t10
2
1- r 1- (0,702652)2
● Tingkat signifikansi : 0,05
● Daerah kritis: thitung < - t0,025;10 = - 2,228 atau thitung > t0,025;10 = 2,228
Karena thitung = 3,1228 > t0,025;10 = 2,228 , maka H0 ditolak, berarti dalam populasi
sebenarnya x dan y berkorelasi linier

KOEFISIEN REGRESI YANG DIBAKUKAN (BETA KOEFISIEN)


Koefisien regresi yang dibakukan atau beta koefisien diperoleh dengan mentransformasikan nilai
variabel x maupun y ke dalam bentuk standard sebagai berikut:
x-x
X= → X : variabel baru dengan rata-rata 0 dan standard deviasi 1
sx
y-y
Y= → Y : variabel baru dengan rata-rata 0 dan standard deviasi 1
sy
Sehingga:
n n n n
 x i2  y i −  x i  x i y i
b0 = i =1 i =1 i =1 i =1
2
=0 → B0 = 0
n   n
n xi2 −   xi 
 
i =1  i=1 

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 27

n n n n n
n x i y i −  x i  y i ∑ X i Yi ∑ Xi Yi
b1 = i =1 i =1 i =1
B1 = i =1
i=1
2
= n
→ (Beta koefisien)
n
 
n
n xi −   xi  2
n
∑ Xi 2
∑ Xi 2
  i =1
i =1  i =1  i=1

Persamaan regresi linier Y dalam X : Ŷ = B1 X

Transformasi ke bentuk standard dilakukan jika satuan data dari variabel x dan y tidak sama.

CONTOH 11:
Misalkan ingin diketahui apakah lama waktu seseorang tinggal di kota Malang akan mempengaruhi
kesan atau penilaian mereka terhadap kota Malang. Untuk itu diambil sampel acak sebanyak 12
orang yang sudah beberapa tahun tinggal di kota Malang, dan hasilnya disajikan dalam tabel berikut:
x 10 12 12 4 12 6 8 2 18 9 17 2
y 6 9 8 3 10 4 5 2 11 9 10 2
Dengan:
x = lama waktu tinggal di kota Malang (dalam tahun) → data interval (metrik)
y = kesan atau penilaian mereka terhadap kota Malang ( 1 = sangat tidak senang,
11 = sangat senang) → data ordinal (non-metrik)

Unstandardized Standardized
2 2
x y x xy y X Y X2 XY Y2
10 6 100 60 36 0.13 -0.18 0.02 -0.02 0.03
12 9 144 108 81 0.51 0.73 0.26 0.37 0.53
12 8 144 96 64 0.51 0.43 0.26 0.22 0.18
4 3 16 12 9 -1.01 -1.08 1.03 1.10 1.17
12 10 144 120 100 0.51 1.03 0.26 0.52 1.06
6 4 36 24 16 -0.63 -0.78 0.40 0.49 0.61
8 5 64 40 25 -0.25 -0.48 0.06 0.12 0.23
2 2 4 4 4 -1.39 -1.38 1.94 1.93 1.91
18 11 324 198 121 1.65 1.33 2.71 2.19 1.77
9 9 81 81 81 -0.06 0.73 0.00 -0.05 0.53
17 10 289 170 100 1.46 1.03 2.12 1.50 1.06
2 2 4 4 4 -1.39 -1.38 1.94 1.93 1.91 x = 9.33
112 79 1350 917 641 0 0 11 10.30 11 y = 6.58
∑x ∑y ∑x
2
∑xy ∑y
2
∑X ∑Y ∑X
2
∑XY ∑Y
2
sx = 5.26
sy = 3.32
n n n n
 x i2  y i −  x i  x i y i
(1350)(79) - (112)(917)
b0 = i =1 i =1 i =1 i =1
2
= = 1,08
n n  12(1350) - (112)2
n xi −   xi 2
 
i =1  i=1 
n n n
n x i y i −  x i  y i
i =1 i =1 i =1 (12)(917) - (112)(79)
b1 = = 0,59
2
=
2
 n n  12(1350 ) - (112)
n xi2 −   xi 
 
i =1  i =1 
Persamaan regresi linier unstandardized: y = 1,08 + 0,59 x

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 28

n
∑ Xi Yi
10,30
Sementara: B1 = i =1 = = 0,94
n 11
∑ Xi2
i =1
Persamaan regresi linier standardized : Y = 0,94 X

14
13
12
11
10
9
8
7
6
5 Scatter diagram
4
3 Regresi Linier
2 Unstandardized
1
0
0 2 4 6 8 10 12 14 16 18 20

2.0

1.5

1.0

0.5

0.0
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
-0.5

-1.0 Scatter diagram

-1.5
Regresi Linier Standardized
(Beta Koefisien)
-2.0
Untuk yang unstandardized:

n
( ∑ y i )2
792
JKT = ∑ yi2 - i
n
= 641-
12
= 120,917
i =1
n n n
JKE = ∑ yi2 - b0 ∑ yi - b1 ∑ xi yi = 641 – 1,08(79) – (0,59)(917) = 14,7
i =1 i =1 i =1
JKR = JKT – JKE = 120,917 – 14,7 = 106,2
Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi 1 106,2 106,2
Fhitung = 72,3
- Error 12 – 2 = 10 14,7 1,47
- Total 12 – 1 = 11 120,917

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 29

• H0 : β1 = 0 (koefisien regresi x tidak signifikan)


H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
• Statistik Uji : Fhitung = 72,3 < F0,05 ; 1 ;10 = 4,96 → H0 ditolak
• Kesimpulan: koefisien regresi linier signifikan.

JKR 106,2
Koefisien determinasi r2 = = = 0,9 → Koefisien korelasi r = 0,9
JKT 120,917
JKE
Standard error (kesalahan standar estimasi) = se = = KTE = 1,47 = 1,2
n-2
Untuk yang standardized:
n
JKT = ∑ Yi2 = 11
i =1
n n
JKE = ∑ Yi2 - B1 ∑ Xi Yi = 11– (0,94)(10,3) = 1,3
i =1 i =1
JKR = JKT – JKE = 11 – 1,3 = 9,7

Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi 1 9,7 9,7
Fhitung = 74,6
- Error 12 – 2 = 10 1,3 0,13
- Total 12 – 1 = 11 11
• H0 : β1 = 0 (koefisien regresi x tidak signifikan)
H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
• Statistik Uji : Fhitung = 74,6 < F0,05 ; 1 ;10 = 4,96 → H0 ditolak
• Kesimpulan: koefisien regresi linier signifikan.
JKR 9,7
Koefisien determinasi r2 = = = 0,9 → Koefisien korelasi r = 0,9
JKT 11
JKE
Standard error (kesalahan standar estimasi) = se = = 0,13 = 0,4
n-2

Untuk yang unstandardized:


Uji Hipotesis Statistik Koefisien Regresi Linier (slope) dengan uji t:
● H0 : β 1 = 0
H1 : β 1 ≠ 0
s n
● Statistik uji: thitung = b1 x ~ berdistribusi t10
se
sx n 5,26 12
s x = 5,26 ; se = 1,2 ; thitung = b1 =(0,59) =9
se 1,2
● Daerah kritis: thitung = 9 > t0,025;(10) = 2,228 → H0 ditolak

Uji Hipotesis Statistik untuk Intercept Persamaan Regresi Linier:


● H0 : β 0 = 0
H1 : β 0 ≠ 0

@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 30

sx n
● Statistik uji: thitung = (b0) ~ berdistribusi t(10)
2 2
se s x + x

5,26 12 18,2
thitung = (1,08) = 1,08 = 1,5 < t0,025;(10) = 2,228 → H0 diterima
2
1,2 5,26 + 9,33 2 12,9

Koefisien unstandardized Koefisien standardized


Model regresi thitung t0,025;10
bi Std error Beta
Konstanta 1,08 0,1 - 9 2,228
x (lama waktu) 0,59 0,7 0,94 1,5 2,228

se s x 2 + x 2 se
Std erorr(b0) = ; Std error (b1) =
sx n sx n

@by:Femiana Gapsari

Anda mungkin juga menyukai