ANALISIS REGRESI
CURVE FITTING
Menentukan hubungan yang terjadi antara 2 variabel atau lebih dan menyatakannya bentuk
hubungannya dengan persamaan matematis.
Langkah-langkah curve fitting :
1. Mengumpulkan data-data yang berupa nilai-nilai dari variabel-variabel yang bersesuaian
misalnya :
y (berat badan) x (tinggi badan)
y1 x1
y2 x2
y3 x3
: :
yn xn
2. Plot pasangan titik-titik (x1, y1) ; (x2, y2) ; (x3, y3) ; ………… ; (xn, yn) pada sistem koordinat XY.
Hasil penggambaran titik-titik pada sistem koordinat ini disebut ‘scatter diagram’
3. Dekati ‘scatter diagram’ dengan suatu kurva, kurva yang dihasilkan disebut kurva pendekatan.
Persamaan dari kurva pendekatan :
- Jika kurvanya berupa garis lurus didekati dengan persamaan: ŷ = b0 + b1x
- Jika kurvanya berupa garis lengkung didekati dengan persamaan: ŷ = b0 + b1x + b2x2
- dan sebagainya.
y y y •
• • • •
• • • • •
• • • •
• • • • • •
• • • •
x x x
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 2
PERSAMAAN REGRESI
Salah satu kegunaan dari curve fitting adalah untuk mengestimasikan nilai salah satu variabel
(dependent variable) berdasarkan nilai dari variabel yang lain (independent variable). Proses estimasi
ini disebut dengan Regresi.
Jika y diestimate dari nilai x dengan menggunakan suatu persamaan maka persamaan ŷ = f(x)
disebut dengan persamaan regresi y dari variabel bebas x.
(x6,y6)
(x3,y3) (x5,y5) e6
(x1,y1) e3 e5
e1 e2
(x2,y2) e4
(x4,y4)
x
Kurva yang paling mendekati (best fitting curve) titik-titik dalam scatter diagram adalah kurva dengan
D = e12 + e22 + ……………… + en2 minimum
x1 x2 x3 ……….. xn x
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 3
n
D= ∑ (a + bxi - yi )2
i =1
D D 2D 2D
D akan minimum jika : = 0 dan =0; > 0 dan >0
a b a 2 b 2
D n n
• = ∑ (a + bxi - yi )2 = ∑ 2 (a + bxi - yi ) = 0
a a i =1 i =1
n n n
→ 2∑ (a + bxi - yi ) = 0 → na + b∑ xi - ∑ yi = 0
i =1 i =1 i =1
n n
na + b∑ x i = ∑ y i …………………………. (i)
i =1 i =1
2D
• =n>0
a 2
n n
D
•
b
=
b
∑ (a + bxi - yi )2 = ∑ 2 xi (a + bxi - yi ) = 0
i =1 i =1
n n n n
→ 2 ∑ x i (a + bxi - y i ) = 0 → a ∑ x i + b∑ x i 2 - ∑ x i y i = 0
i =1 i =1 i =1 i =1
n n n
a∑ x i + b∑ x i 2 = ∑ x i y i …………………………. (ii)
i =1 i =1 i =1
n
2D
•
2
= >0 ∑ x i2
b i =1
Persamaan (i) dan (ii) disebut persamaan normal.
Persamaan normal untuk regresi linier di atas bisa juga dituliskan sebagai berikut :
n a n
n xi yi
i =1 i=1
=
n n n
xi xi2 x i y i
i =1 i =1 i=1
b
Nilai a dan b yang memberikan D minimum ditentukan dengan menyelesaikan persamaan
normal secara simultan, sebagai berikut :
n
n xi 2
i =1 n n
= n x i − x i
2
∆ =
n n i =1 i =1
xi i
x 2
i =1 i =1
n n
yi xi
i =1 i =1 n n n n
∆a =
n n
= yi xi2 − xi xi yi
i =1 i =1 i =1 i =1
xi yi x i2
i =1 i =1
n
n yi
i =1 n n n
∆b = = n xi yi − xi yi
n n i =1 i =1 i =1
xi xi yi
i =1 i =1
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 4
Sehingga :
n n n n
x i2 y i − x i x i y i
a
a= = i =1 i =1 i =1 i =1
n n
2
n xi2 − xi
i =1 i=1
n n n
n x i y i − x i y i
b i =1 i =1 i =1
b= =
n n
2
n xi − xi
2
i =1 i =1
Nilai a dan b yang memberikan D minimum dimasukkan dalam persamaan regresi linier:
ŷ = a + b x
CONTOH 1 :
Diberikan data sampel yang berupa tinggi badan dari 12 orang ayah dan masing-masing anak
tertuanya :
No. x y
data (tinggi ayah dalam inch.) (tinggi anak dalam inch.)
1 65 68
2 63 66
3 67 68
4 64 65
5 68 69
6 62 66
7 70 68
8 66 65
9 68 71
10 67 67
11 69 68
12 71 70
a. Buat scatter diagram
b. Tentukan persamaan regresi garis lurus (linier) y dalam x
c. Tentukan persamaan regresi garis lurus (linier) x dalam y
Penyelesaian :
a.
x y Scatter Diagram
65 68
63 66
72
67 68
71
64 65
68 69 Scatter Diagram
70
62 66
y (tinggi anak)
69
70 68
68
66 65 72
67
68 71 70
67 67 68
66
69 68 66
65 64
71 70
64 60 65 70 75
62 64 66 68 70 72
x (tinggi ayah)
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 5
n n n n
x i2 y i − x i x i y i
53418(811) − 800(54107)
a = i =1 i =1 i =1 i =1
= = 35,8248 ≈ 35, 825
12(53418) − (800)2
2
n n
n xi2 − xi
i =1 i=1
n n n
n x i y i − x i y i
i =1 i =1 i =1 12(54107) − 800(811)
b= = = 0,476378 ≈ 0,476
12(53418) − (800)2
2
n n
n xi2 − xi
i =1 i =1
Jadi persamaan regresi linier y dalam x : ŷ = 35, 825 + 0,476x
72
70
Tinggi Anak
68
66
64
62
60
60 62 64 66 68 70 72
Tinggi Ayah
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 6
n n n
n x i y i − x i y i
i =1 i =1 i =1 12(54107) − 811(800)
b1 = = = 1,036403 ≈ 1,036
12(54849) − (811)2
2
n n
n yi − yi
2
i =1 i =1
Jadi persamaan regresi linier x dalam y : x̂ = −3, 377 + 1,036 y
72
71
70
69
Tinggi Ayah
68
67
66
65
64
63
62
61
64 65 66 67 68 69 70 71 72
Tinggi Anak
(ii) x i y i = a x i + b x i 2 + c x i 3
i i i i
CONTOH 2 :
Dekati data dalam tabel berikut dengan persamaan regresi parabolis yang berbentuk
ŷ = a + bx + cx2
i 1 2 3 4 5 6 7 8
xi 1,2 1,8 3,1 4,9 5,7 7,1 8,6 9,8
yi 4,5 5,9 7,0 7,8 7,2 6,8 4,5 2,7
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 7
Penyelesaian :
Persamaan normal :
8 42,2 291,2 a 46,4
42,2 291,2 2275,35 b = 230,42
291,2 2275,35 18971,93 c 1448,99
8 42,2 291,2
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 8
b 458771,6
b= = = 2,064922 ≈ 2,065
222173,8
c −46877,75
c= = = - 0,211
222173,8
Jadi persamaan regresi kuadratis/parabolis y dalam x : ŷ = 2,588 + 2,065 x - 0,211 x2
9.00
8.00
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00
i i i i i
(iii) xi 2
yi = a xi + b1 xi + b2 xi + .......... .......... . + bn xin+ 2
2 3 4
i i i i i
:
(n) xin yi = a xin + b1 xin+1 + b2 xin+ 2 + .......... .......... . + bn xin+n
i i i i i
Atau :
n
xi xi2 ......... xin a yi
b
xi x i2 xi3 .......... xin+1 1 xi yi
b 2
xin + 2 : = x i y i
2
x i2 x i3 x i 4 .......... : :
: : : : :
: : : : :
: :
: : : : :
x in x in +1 x in + 2 .......... xin + n : n
b
n xi yi
Koefisien a, b1 ; b2 ; b3 …….bn ditentukan dengan menyelesaikan persamaan normal secara
simultan.
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 9
Bisa dibawa ke bentuk linier menjadi : log ŷ = log (a bx) = log a + x log b
Atau : Y = A + Bx
dengan : Y = log ŷ → ŷ = log-1 Y
A = log a → a = log-1 A
B = log b → b = log-1 B
Catatan:
Bentuk dasar grafik y = a bx
y
y = a2-x y= a3-x y = a3x y = a2x
3a
2a
a
−1 0 1 x
Catatan:
Bentuk dasar grafik y = a bx
y = a2-x y y = a2x
y = ae-x y = aex
2ae
ae
−1 0 1 x
CONTOH 3 :
Tabel berikut menyajikan hasil pengukuran tekanan udara (P dalam lb/inch2) dalam berbagai
volume (V dalam inch3) dari suatu gas tertentu. Berdasarkan prinsip termodinamika
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 10
2. Model Logistik
Persamaan regresi :
1
ŷ =
ab x
1 1 1
Dibawa ke bentuk linier : = ab x → log = log(abx) → log = log a + x log b
ŷ ŷ ŷ
1
Atau : Y = A + Bx ; dengan : Y = log
ŷ
A = log a
B = log b
Catatan:
k y
Bentuk dasar grafik y =
x
−k k
y= y= ; k>0
x x
ŷ = a x b
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 12
SOAL-SOAL LATIHAN :
1. Data berikut menyajikan pertumbuhan suatu koloni bakteri dalam suatu medium :
Waktu sejak Inokulasi Banyaknya bakteri
x (hari) y
3 115000
6 147000
9 239000
12 356000
15 579000
18 864000
a. Plot data dalam grafik (buat scatter diagram)
b. Fit data dengan kurva eksponensial ŷ = a b x
c. Gunakan hasilnya untuk memprediksi banyaknya bakteri pada akhir hari ke-20.
2. Data berikut merupakan hasil pengamatan mengenai permintaan suatu produk dan harga
satuannya pada 5 pasar yang berbeda.
Harga Perunit Permintaan
(Rp) (x 100 unit)
20 22
16 41
10 120
11 89
14 56
Fit data di atas dengan fungsi pangkat (power function) dan gunakan hasilnya untuk
mengestimate permintaan jika harga produknya adalah Rp 12,-
3. Struktur bangunan baru yang dibangun diatas tanah pada awalnya akan mengalami penurunan
sampai tanahnya stabil. Tinggi (kedalaman) penurunannya untuk setiap bulan dinyatakan dalam
rumus : y = 3 – 3 e-ax ; → y/3 = 1 – e-ax → 1 – y/3 = e-ax ln (1 – y/3) = ln e-ax = - ax → Y = bx
dengan : x = umur bangunan (dalam bulan)
y = besarnya penurunan tanah (dalam cm)
Berdasarkan pengamatan diperoleh data sebagai berikut :
x (bulan) 2 4 6 12 18 24
y ( cm ) 1,07 1,88 2,26 2,78 2,97 2,99
Tentukan besarnya penurunan tanah setelah 3 tahun.
ax + b
4. a. Fit data berikut dengan kurva Gompertz yang berbentuk y = e e
x y
50 28
450 30
780 32
1200 36
4400 51
4800 58
5300 69
c. Fit data di atas dengan kurva eksponensial y = a b x
d. Gunakan hasil a dan b untuk mengestimasikan nilai y jika diberikan harga x = 3000.
5. Data berikut menunjukkan stopping distance sebuah mobil yang berjalan dengan kecepatan v.
Kecepatan (v mil/jam) 20 30 40 50 60 70
Stopping distance (d feet) 54 90 138 206 292 396
a. Buat scatter diagram
b. Fit data di atas dengan kurva parabolis.
c. Dengan hasil b. estimasikan nilai d, jika diketahui kecepatan v = 45 mil/jam dan v = 80
mil/jam.
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 13
( xi )2
2
n n n
n
(xi − x ) xi n x i − x i
2 2 2
−
n i =1
2
sx = i =1 = i=1 = i =1 = variansi x
n n n2
( yi )2
2
n n n n
i (y − y ) i
2
y n y i
2 − yi
−
2
s y = i=1
2
= i=1
n
=
i =1 i =1 = variansi y
n n n2
n n
x y n n n
(xi − x )(yi − y ) xiyi − ni i n xi yi − xi yi
s xy2 = i=1 = i=1 = i =1 i =1 i =1
2
= kovariansi x dan y
n n n
r2 = koefisien determinasi
0 ≤ r2 ≤ 1 ; -1 ≤ r ≤ 1
r2 = 1 atau r = ± 1 → dikatakan bahwa x dan y mempunyai korelasi linier sempurna
r = 1 → dikatakan bahwa x dan y mempunyai korelasi linier sempurna
secara langsung → x naik/turun, y naik/turun
r = −1 → dikatakan bahwa x dan y mempunyai korelasi linier sempurna
secara tidak langsung (gradiennya negatif atau kurvanya
menurun) → x naik/turun, y turun/naik
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 14
y y
• •
• • • •
• • • •
• •
x x
Berkorelasi positif r > 0 Berkorelasi negatif r < 0
y y y
•
• • •
• • • •
• • • •
• • • •
• • • • •
• • •
x x x
r=1 r = −1 r=0
Berkorelasi sempurna Berkorelasi sempurna Tak berkorelasi
secara langsung secara tak langsung
Nilai r Keterangan
r=0 x dan y tidak berkorelasi
0 < r ≤ 0,5 hubungan x dan y lemah
0,5 < r ≤ 0,75 hubungan x dan y cukup kuat
0,75 < r ≤ 0,90 hubungan x dan y kuat
0,90 < r < 1 hubungan x dan y sangat kuat
r=1 x dan y berkorelasi sempurna
Koefisien determinasi r2 bisa diartikan sebagai sumbangan/kontribusi dari variabel x terhadap
bervariasinya (naik/turunnya) nilai variabel y.
Misalkan r = 0,9 atau r2 = 0,81 berarti 81% perubahan nilai y disebabkan oleh x, sedangkan 19%
sisanya disebabkan oleh faktor lain di luar/selain x.
Jika x dan y merupakan data metrik (kuantitatif, interval atau rasio), r disebut product moment
correlation atau pearson correlation coefficient atau simple correlation atau bivariate correlation atau
korelasi saja.
CONTOH 4 :
Dari data sampel pada contoh 1 :
No. 1 2 3 4 5 6 7 8 9 10 11 12
x (tinggi ayah) 65 63 67 64 68 62 70 66 68 67 69 71
y (tinggi anak) 68 66 68 65 69 66 68 65 71 67 68 70
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 15
Nilai r = 0,702652 = 70,27%; artinya kesesuaian persamaan regresi linier yang berbentuk ŷ = 35,825
+ 0,476x untuk menggambarkan hubungan x dan y dalam sampel adalah sebesar 70,27%.
Atau r2 = (0,702652)2 = 0,49 → artinya 49% perubahan nilai y disebabkan karena berubahnya nilai x
(dengan bentuk hubungan ŷ = 35,825 + 0,476x), 51% sisanya disebabkan oleh faktor lain.
Dan koefisien determinasi dari persamaan regresi yang digunakan bisa dihitung dengan rumus :
n n
(ŷ est − y ) (y − ŷ est )
2 2
Jumlah kuadrat regresi (JKR)
r 2 = i =1 = 1 − i =1 =
n n Jumlah kuadrat total (JKT)
(yi − y )2 (yi − y )2
i =1 i =1
CONTOH 5 :
Diberikan data sebagai berikuit :
x 1,2 1,8 3,1 4,9 5,7 7,1 8,6 9,8
y 4,5 5,9 7,0 7,8 7,2 6,8 4,5 2,7
a. Fit dengan regresi linier dan parabola
b. Hitung koefisien korelasinya
c. Bandingkan nilai koefisien korelasi tersebut.
►
a.
x y x2 xy y2
1.20 4.50 1.44 5.40 20.25
1.80 5.90 3.24 10.62 34.81
3.10 7.00 9.61 21.70 49.00
4.90 7.80 24.01 38.22 60.84
5.70 7.20 32.49 41.04 51.84
7.10 6.80 50.41 48.28 46.24
8.60 4.50 73.96 38.70 20.25
9.80 2.70 96.04 26.46 7.29
42.20 46.40 291.20 230.42 290.52
Dari persamaan normal untuk regresi linier diperoleh :
n n n n
x i2 y i − x i x i y i
291,2(46,4) − 42,2(230,42)
a = i =1 i =1 i =1 i =1
= = 6,9027553 ≈ 6,9
8(291,2) − (42,2)2
2
n n
n xi2 − xi
i =1 i=1
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 16
n n n
n x i y i − x i y i
i =1 i =1 i =1 8(230,42) − 42,2( 46,4)
b= = = - 0,2090531 ≈ - 0,209
8(291,2) − (42,2)2
2
n n
n xi − xi
2
i =1 i =1
Persamaan regresi linier ŷ = a + bx = 6,9 – 0,209 x
x y ŷ ( ŷ - y )2 (y - y )2
1.20 4.50 4.762 1.08 1.69
1.80 5.90 5.621 0.03 0.01
3.10 7.00 6.962 1.35 1.44
4.90 7.80 7.640 3.39 4.00
5.70 7.20 7.503 2.90 1.96
7.10 6.80 6.613 0.66 1.00
8.60 4.50 4.741 1.12 1.69
9.80 2.70 2.561 10.49 9.61
42.20 46.40 46.404 21.02 21.40 y = 5.80
n
(ŷ est − y )
2
21,02
r2 = i =1 = = 0,982243 → r = 0,982243 = 0,991082
n 21,4
(yi − y ) 2
i =1
c. Karena koefisien korelasi linier (r = −0,37428) sangat kecil dibandingkan dengan koefisien
korelasi parabola ( r = 0,991082), maka hubungan antara x dan y untuk data di atas lebih sesuai
jika didekati dengan persamaan kuadrat (parabolis) dibanding dengan persamaan linier.
9.00
8.00 Data Observasi
7.00
6.00
5.00
4.00
3.00
2.00
1.00
0.00
0.00 2.00 4.00 6.00 8.00 10.00
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 17
x1 x2 x3 x4 xn
E(ei│xi) = 0 ; i = 1, 2, 3, …… , n
Var(ei│xi) = σ2
ei ~ N(0, σ)
Asumsi-asumsi ini dikenal sebagai asumsi model regresi linier klasik (classical linear regression
model). Jika semua asumsi tadi dipenuhi, maka metoda OLS akan menghasilkan estimator b 1
(koefisien x) yang memenuhi kriteria BLUE (Best Linear Unbiased Estimator), yaitu:
1. Estimator b1 adalah linier terhadap variabel y
2. Estimator b1 merupakan estimator yang tidak bias (unbiased), yaitu nilai rata-rata atau
nilai harapan E(b1) sama dengan nilai b1 dari populasi yang sebenarnya. Jika misalnya
persamaan regresi dari populasi adalah Ŷ = β0 + β1x, maka E(b1 ) = β1
3. Estimator b1 mempunyai varian yang minimum (best), sehingga b1 merupakan estimator
yang efisien (tak bias dengan varian minimum) untuk β 1
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 18
(
n
)
n
∑
(∑ yi )2
n
∑ y )
n
2
∑ i y - y ∑ i
2
y
n
2
(n -y i -
i
2
► s y = i =1
2
= i =1 = i =1 i =1
n n n2
n n
∑x ∑y n n n
∑ (x i - x )(y i - y ) ∑ xi yi - i i n∑ xiyi - ∑ xi ∑ yi
n
► s xy = i =1 = i =1 = i =1 i =1 i =1
2
n n 2
n
n n n n
(yi - y est )2 ∑ y i 2 - a∑ y i - b∑ x i y i
► s e 2 = i =1 atau = i =1 i =1 i =1
(jika linier) atau
n-2 n-2
s xy
s y 2 (1 - r ) atau
n n
= = s y 2 (1 - )
n-2 n-2 sxsy
● Daerah kritis: thitung < - tα/2;(n-2) atau thitung > tα/2 ; (n-2)
α/2 1− α α/2
b. ● H0 : β1 = β10
H1 : β1 < β10
sx n
● Statistik uji: thitung = (b1 – β10) ~ berdistribusi t(n-2)
se
● Daerah kritis:
thitung < − tα;(n-2)
α 1− α
− tα ; (n-2)
c. ● H0 : β1 = β10
H1 : β1 > β10
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 19
sx n
● Statistik uji: thitung = (b1 – β10) ~ berdistribusi t(n-2)
se
● Daerah kritis:
thitung > tα ; (n-2)
1− α α
tα ; (n-2) t (n-2)
CONTOH 6 :
Dari soal contoh 5, misalkan ingin diuji apakah persamaan regresi linier ŷ = 6,9 – 0,209x
signifikan, maka uji hipotesisnya adalah sebagai berikut:
• H0 : β1 = 0 (koefisien regresi x tidak signifikan)
H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
sx n
• Statistik Uji : thitung = (b – 0)
se
x y x2 xy y2
1.20 4.50 1.44 5.40 20.25
1.80 5.90 3.24 10.62 34.81
3.10 7.00 9.61 21.70 49.00
4.90 7.80 24.01 38.22 60.84
5.70 7.20 32.49 41.04 51.84
7.10 6.80 50.41 48.28 46.24
8.60 4.50 73.96 38.70 20.25
9.80 2.70 96.04 26.46 7.29
42.20 46.40 291.20 230.42 290.52
n (∑ xi )
2
(42,2)2
∑ xi 2
-
n 291,20 -
i =1 8
sx2 = = = 8,574375 → sx = 2,93
n 8
n n n
∑ y i2 - a∑ y i - b∑ x i y i
i =1 i =1 i =1 290,52 - 6,9(46,4) + 0,209(230,42)
se 2 = = = 3,086297
n-2 8−2
→ se = 1,76
sx n 2,93 8
thitung = (b1 – 0) = (−0,209 – 0) = − 0,985 ~ - t (0,025) ; 6 = −2,447
se 1,76
• Kesimpulan:
Karena thitung ≥ − t 0,025 ; 6 = −2,447 → H0 diterima, berarti koefisien regresi linier tidak signifikan.
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 20
sx n
● Statistik uji: thitung = (b0 – α0) ~ berdistribusi t(n-2)
2 2
se s x + x
● Daerah kritis: thitung < - tα/2;(n-2) atau thitung > tα/2 ; (n-2)
α/2 1− α α/2
b. ● H 0 : β 0 = α0
H 1 : β 0 < α0
sx n
● Statistik uji: thitung = (b0 – α0) ~ berdistribusi t(n-2)
2
se s x - x 2
α 1− α
− tα ; (n-2)
Daerah Penerimaan H0 :
− t α;(n-2) ≤ thitung
c. ● H 0 : β 0 = α0
H 1 : β 0 > α0
sx n
● Statistik uji: thitung = (b0 – α0) ~ berdistribusi t(n-2)
se s x 2 - x 2
1− α α
tα ; (n-2) t (n-2)
Daerah Penerimaan H0 :
thitung ≤ tα ; (n-2)
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 21
Untuk regresi linier ŷ = b0 + b1x ; jumlah kuadrat dari variasi bisa dihitung sebagai berikut :
2
yi
n n
JKT = jumlah kuadrat total = (yi − y )2 = y i2 − i
i =1 i=1 n
n
(yi − ŷ est )
2
JKE = jumlah kuadrat error/kesalahan =
i =1
n n n
= y i2 − a y i − b xi y i → jika regresinya linier
i =1 i =1 i =1
n
(ŷ est − y )
2
JKR = jumlah kuadrat regresi = = JKT − JKE
i =1
p = banyaknya koefisien regresi yang berkaitan dengan x
Untuk regresi linier : ŷ = b0 + b1x → p=1
Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi p JKR KTR = JKR /db KTR
- Error n–p−1 JKE KTE = JKE/db Fhitung =
KTE
- Total n–1 JKT
1–α α
Fα ; p ; (n-p-1) Fp ; (n-p-1)
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 22
CONTOH 7 :
Seperti soal contoh 5, misalkan ingin diuji apakah persamaan regresi linier ŷ = 6,9 – 0,209x
signifikan, maka uji hipotesisnya adalah sebagai berikut:
• H0 : β1 = 0 (koefisien regresi x tidak signifikan)
H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
•
x y x2 xy y2
1.20 4.50 1.44 5.40 20.25
1.80 5.90 3.24 10.62 34.81
3.10 7.00 9.61 21.70 49.00
4.90 7.80 24.01 38.22 60.84
5.70 7.20 32.49 41.04 51.84
7.10 6.80 50.41 48.28 46.24
8.60 4.50 73.96 38.70 20.25
9.80 2.70 96.04 26.46 7.29
42.20 46.40 291.20 230.42 290.52
n
( ∑ y i )2
46,4 2
JKT = ∑ yi2 - i
n
= 290,52 -
8
= 21,4
i =1
n n n
JKE = ∑ yi2 - b0 ∑ yi - b1 ∑ xi yi = 290,52 – 6,9(46,4) – (-0,209)(230,42) = 18,52
i =1 i =1 i =1
JKR = JKT – JKE = 21,4 – 18,52 = 2,88
Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi 1 2,88 2,88
Fhitung = 0,933
- Error 8–2=6 18,52 3,087
- Total 8–1=7 21,4
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 23
s x 2 + nx 2 sx2 + x2
karena P [ (b0 − tα/2 ; (n-2) se ) < β0 < (b0 + tα/2 ; (n-2) se )] = 1 – α%
ns x 2 ns x 2
CONTOH 8 :
Dari contoh 1, diperoleh persamaan regresi estimasi ŷ = 35, 825 + 0,476x
Tentukan interval konfidensi 95% untuk β0 dan β1
►
x y x2 xy y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4761 4692 4624
71 70 5041 4970 4900
800 811 53418 54107 54849
∑x ∑y ∑x2 ∑xy ∑y2
n (∑ xi )2
∑ x i2 - n
• i =1
sx2 = = 7,056 → sx = 2,656
n
n n n
∑ yi2 - b0 ∑ yi - b1∑ xi yi
i =1 i =1 i =1
• se 2 = = 3,999 → se = 1,999
n-2
• x=
xi = 800
= 66,67
n 12
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 24
1 ( x 0 - x)2 1 ( x 0 - x)2
karena P[(y0 − tα/2 ; (n-2) se 1 + + ) < Y0 < (y0 + tα/2 ; (n-2) s e 1 + + )] = 1 – α%
n sx2 n sx2
CONTOH 9 :
Dari contoh 1, diperoleh persamaan regresi estimasi ŷ = 35, 825 + 0,476x
Tentukan interval konfidensi 95% untuk Y0 jika x = 65
►
x y x2 xy y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4761 4692 4624
71 70 5041 4970 4900
800 811 53418 54107 54849
∑x ∑y ∑x
2
∑xy ∑y
2
n (∑ xi )2
∑ x i2 - n
• i =1
sx2 = = 7,056 → sx = 2,656
n
n n n
∑ yi2 - b0 ∑ yi - b1∑ xi yi
i =1 i =1 i =1
• se 2 = = 3,999 → se = 1,999
n-2
• x=
xi = 800
= 66,67
n 12
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 25
● Daerah kritis: thitung < - tα/2;(n-2) atau thitung > tα/2 ; (n-2)
α/2 1− α α/2
b ● H0 : ρ = ρ 0
H1 : ρ ≠ ρ 0
1 1+ r 1 1 + ρ0
● Statistik uji: Z = ln [ ] ~ berdistribusi Normal dengan μZ = ln [ ]
2 1- r 2 1- ρ0
1
σZ =
n-3
Z - μZ
Transformasi ke Normal Standar: zhitung = ~ berdistribusi Normal standard N(0;1)
σZ
● Daerah kritis:
α/2 1− α α/2
- zα/2 zα/2 z
( Z1 - Z 2 ) - (μZ1 - μZ 2 ) ( Z1 - Z 2 ) - 0 Z -Z
● Statistik uji: z= = = 1 2
σ Z1 - Z 2 σ Z1 - Z 2 σ Z1 - Z 2
Z1 - Z 2
zhitung = ~ N(μ = 0; σ = 1)
σ Z1 - Z 2
1 1 + r1
Dengan: Z1 = ln [ ]
2 1- r1
1 1 + r2
Z2 = ln [ ]
2 1 - r2
1 1
σ Z1 - Z2 = +
n1 - 3 n2 - 3
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 26
α/2 1− α α/2
- zα/2 zα/2 z
Daerah Penerimaan H0 :
- z α/2 ≤ zhitung ≤ zα/2
CONTOH 10 :
Berdasarkan data dan hasil perhitungan koefisien korelasi dalam contoh 1, ujilah dengan α = 5%
apakah x dan y dalam populasi yang sebenarnya berkorelasi linier.
►
No. 1 2 3 4 5 6 7 8 9 10 11 12
x (tinggi ayah) 65 63 67 64 68 62 70 66 68 67 69 71
y (tinggi anak) 68 66 68 65 69 66 68 65 71 67 68 70
Uji Hipotesis:
● H0 : ρ = 0 (dalam populasi sebenarnya x dan y tidak berkorelasi linier)
H1 : ρ ≠ 0 (dalam populasi sebenarnya x dan y berkorelasi linier)
r n-2 0,702652 12 - 2
● Statistik uji: thitung = = = 3,1228 ~ berdistribusi t10
2
1- r 1- (0,702652)2
● Tingkat signifikansi : 0,05
● Daerah kritis: thitung < - t0,025;10 = - 2,228 atau thitung > t0,025;10 = 2,228
Karena thitung = 3,1228 > t0,025;10 = 2,228 , maka H0 ditolak, berarti dalam populasi
sebenarnya x dan y berkorelasi linier
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 27
n n n n n
n x i y i − x i y i ∑ X i Yi ∑ Xi Yi
b1 = i =1 i =1 i =1
B1 = i =1
i=1
2
= n
→ (Beta koefisien)
n
n
n xi − xi 2
n
∑ Xi 2
∑ Xi 2
i =1
i =1 i =1 i=1
Transformasi ke bentuk standard dilakukan jika satuan data dari variabel x dan y tidak sama.
CONTOH 11:
Misalkan ingin diketahui apakah lama waktu seseorang tinggal di kota Malang akan mempengaruhi
kesan atau penilaian mereka terhadap kota Malang. Untuk itu diambil sampel acak sebanyak 12
orang yang sudah beberapa tahun tinggal di kota Malang, dan hasilnya disajikan dalam tabel berikut:
x 10 12 12 4 12 6 8 2 18 9 17 2
y 6 9 8 3 10 4 5 2 11 9 10 2
Dengan:
x = lama waktu tinggal di kota Malang (dalam tahun) → data interval (metrik)
y = kesan atau penilaian mereka terhadap kota Malang ( 1 = sangat tidak senang,
11 = sangat senang) → data ordinal (non-metrik)
►
Unstandardized Standardized
2 2
x y x xy y X Y X2 XY Y2
10 6 100 60 36 0.13 -0.18 0.02 -0.02 0.03
12 9 144 108 81 0.51 0.73 0.26 0.37 0.53
12 8 144 96 64 0.51 0.43 0.26 0.22 0.18
4 3 16 12 9 -1.01 -1.08 1.03 1.10 1.17
12 10 144 120 100 0.51 1.03 0.26 0.52 1.06
6 4 36 24 16 -0.63 -0.78 0.40 0.49 0.61
8 5 64 40 25 -0.25 -0.48 0.06 0.12 0.23
2 2 4 4 4 -1.39 -1.38 1.94 1.93 1.91
18 11 324 198 121 1.65 1.33 2.71 2.19 1.77
9 9 81 81 81 -0.06 0.73 0.00 -0.05 0.53
17 10 289 170 100 1.46 1.03 2.12 1.50 1.06
2 2 4 4 4 -1.39 -1.38 1.94 1.93 1.91 x = 9.33
112 79 1350 917 641 0 0 11 10.30 11 y = 6.58
∑x ∑y ∑x
2
∑xy ∑y
2
∑X ∑Y ∑X
2
∑XY ∑Y
2
sx = 5.26
sy = 3.32
n n n n
x i2 y i − x i x i y i
(1350)(79) - (112)(917)
b0 = i =1 i =1 i =1 i =1
2
= = 1,08
n n 12(1350) - (112)2
n xi − xi 2
i =1 i=1
n n n
n x i y i − x i y i
i =1 i =1 i =1 (12)(917) - (112)(79)
b1 = = 0,59
2
=
2
n n 12(1350 ) - (112)
n xi2 − xi
i =1 i =1
Persamaan regresi linier unstandardized: y = 1,08 + 0,59 x
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 28
n
∑ Xi Yi
10,30
Sementara: B1 = i =1 = = 0,94
n 11
∑ Xi2
i =1
Persamaan regresi linier standardized : Y = 0,94 X
14
13
12
11
10
9
8
7
6
5 Scatter diagram
4
3 Regresi Linier
2 Unstandardized
1
0
0 2 4 6 8 10 12 14 16 18 20
2.0
1.5
1.0
0.5
0.0
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
-0.5
-1.5
Regresi Linier Standardized
(Beta Koefisien)
-2.0
Untuk yang unstandardized:
n
( ∑ y i )2
792
JKT = ∑ yi2 - i
n
= 641-
12
= 120,917
i =1
n n n
JKE = ∑ yi2 - b0 ∑ yi - b1 ∑ xi yi = 641 – 1,08(79) – (0,59)(917) = 14,7
i =1 i =1 i =1
JKR = JKT – JKE = 120,917 – 14,7 = 106,2
Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi 1 106,2 106,2
Fhitung = 72,3
- Error 12 – 2 = 10 14,7 1,47
- Total 12 – 1 = 11 120,917
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 29
JKR 106,2
Koefisien determinasi r2 = = = 0,9 → Koefisien korelasi r = 0,9
JKT 120,917
JKE
Standard error (kesalahan standar estimasi) = se = = KTE = 1,47 = 1,2
n-2
Untuk yang standardized:
n
JKT = ∑ Yi2 = 11
i =1
n n
JKE = ∑ Yi2 - B1 ∑ Xi Yi = 11– (0,94)(10,3) = 1,3
i =1 i =1
JKR = JKT – JKE = 11 – 1,3 = 9,7
Tabel ANAVA
Derajad bebas Jml kuadrat Kuadrat tengah
Sumber Variasi F hitung
(db) (Sum square) (Mean square)
- Regresi 1 9,7 9,7
Fhitung = 74,6
- Error 12 – 2 = 10 1,3 0,13
- Total 12 – 1 = 11 11
• H0 : β1 = 0 (koefisien regresi x tidak signifikan)
H1 : β1 ≠ 0 (koefisien regresi x signifikan)
• Tingkat signifikansi uji : α = 5%
• Statistik Uji : Fhitung = 74,6 < F0,05 ; 1 ;10 = 4,96 → H0 ditolak
• Kesimpulan: koefisien regresi linier signifikan.
JKR 9,7
Koefisien determinasi r2 = = = 0,9 → Koefisien korelasi r = 0,9
JKT 11
JKE
Standard error (kesalahan standar estimasi) = se = = 0,13 = 0,4
n-2
@by:Femiana Gapsari
■ Analisis Regresi & Korelasi 30
sx n
● Statistik uji: thitung = (b0) ~ berdistribusi t(10)
2 2
se s x + x
5,26 12 18,2
thitung = (1,08) = 1,08 = 1,5 < t0,025;(10) = 2,228 → H0 diterima
2
1,2 5,26 + 9,33 2 12,9
se s x 2 + x 2 se
Std erorr(b0) = ; Std error (b1) =
sx n sx n
@by:Femiana Gapsari