Anda di halaman 1dari 21

REGRESI

LINIER SEDERHANA



Dr. Ir. H. Tjiptogoro Dinarjo, MM




PROGRAM PASCASARJANA
UNIVERSITAS ISLAM AS-SYAFIIYAH
2011
1
Least Squares Method.
Populasi Mahasiswa dan penjualan perkuartal untuk 10 restoran

Restorant
i
Populasi Mahasiswa
Xi
Penjualan per Kuartal
Yi
1
2
3
4
5
6
7
8
9
10
2
6
8
8
12
16
20
20
22
26
58
105
88
118
117
137
157
169
149
202
2
Perhitungan

i
= b
0
+ b
1
X
Y
i
= perhitungan perolehan penjualan kuartalan restoran ke i.
b
0
= bilangan konstanta (intercept) regresi garis hasil perhitungan.
b
1
= sudut (slope) garis regresi hasil perhitungan.
X
i
= jumlah mahasiswa untuk restoran ke i

Rumus penting.
Least Square Criterion: min (Y
i

i
)
2
Slope b
1
= { (X
i
X ) (Y
i
- Y)}/(X
i
-X )
2

Intercept b
0
= Y b
1
X
X = (x
i
)/n
Y= ( Y
i
)/n
Note:
Y
i
: Nilai pengamatan dari dependent variable untuk ke i pengamatan.

i
: Nilai perhitungan dari dependent variable untuk ke i pengamatan.
Y : Nilai mean dari dependent variable
X
i
: Nilai dari independent variable untuk ke i pengamatan.
X : Nilai mean dari independent variable untuk ke i pengamatan.
n : Total angka pengamatan.


3
Jumlah sampel 10 restoran atau n = 10
X = (x
i
)/n = 140/ 10 = 14
Y= (Y
i
)/n = 1300/10 =130











b
1
= { (X
i
X ) (Y
i
- Y)}/(X
i
-X )
2

= 2840/568 = 5
b
0
= Y b
1
X = 130 5x14 = 60

Maka persamaan regresi :

= 60 + 5X
Dengan persamaan ini dapat memperkirakan berapa penjualan yang dapat
terjadi sesuai dengan jumlah Mahasiswa yang ditentukan jumlahnya. Jika
jumlah Mahasiswa misalkan 16000 orang maka penjualan diperkirakan akan
mencapai

= 60 + 5x16 = 140





Restoran
i
X
i
Y
i
X
i
- X

Y
i
- Y (X
i
- X ) (Y
i
- Y )

(X
i
- X )
2
1
2
3
4
5
6
7
8
9
10
2
6
8
8
12
16
20
20
22
26
140
x
i


58
105
88
118
117
137
157
169
149
202
1300
Y
i

-12
-8
-6
-6
-2
2
6
6
8
12
-72
-25
-42
-12
-13
7
27
39
19
72
864
200
252
72
26
14
162
234
152
864
2840
(X
i
- X ) (Y
i
- Y )

144
64
36
36
4
4
36
36
64
144
568
(X
i
- X )
2

4
Welcome to Minitab, press F1 for help.

Regression Analysis: Quarterly versus Student

The regression equation is
Quarterly = 60,0 + 5,00 Student


Predictor Coef SE Coef T P
Constant 60,000 9,226 6,50 0,000
Student 5,0000 0,5803 8,62 0,000


S = 13,8293 R-Sq = 90,3% R-Sq(adj) = 89,1%


Analysis of Variance

Source DF SS MS F P
Regression 1 14200 14200 74,25 0,000
Residual Error 8 1530 191
Total 9 15730

5
6
7
Latihan Soal
Seorang Manager mengumpulkan data pengalaman dan kemampuan menjual
dari10 orang Sales dengan data sebagai berikut:














1. Gambarkan scatter diagram dengan pengalaman sebagai variabel bebas.
2. Hitung persamaan regresinya dapat menggunakan prediksi penjualan
berdasarkan pengalaman tenaga sales.
3. Berapa prediksi kemampuan penjualan dari tenaga sales dengan pengalaman 9
tahun?

Tenaga Sales Pengalaman
(Th)
Hasil Penjualan
Rp 000.000,-
1
2
3
4
5
6
7
8
9
10
1
3
4
4
6
8
10
10
11
13
80
97
92
102
103
111
119
123
117
136
8
9
10
Regression Analysis: Annual sales versus Pengalaman

The regression equation is
Annual sales = 80,0 + 4,00 Pengalaman


Predictor Coef SE Coef T P
Constant 80,000 3,075 26,01 0,000
Pengalaman 4,0000 0,3868 10,34 0,000


S = 4,60977 R-Sq = 93,0% R-Sq(adj) = 92,2%


Analysis of Variance

Source DF SS MS F P
Regression 1 2272,0 2272,0 106,92 0,000
Residual Error 8 170,0 21,3
Total 9 2442,0

11
Coeffisient Determination.
Koefisien determinasi adalah alat ukur the goodness of fit atas estimasi persamaan
regresi.
1. Sum Of Squares Due to Error (SSE)
SSE = (Y
i

i
)
2

SSE adalah mengukur kesalahan penggunaan estimasi persamaan regresi untuk
menghitung nilai variabel terikat dari sampel. Contoh x
1
= 2 dan Y
1
= 58, dengan
menggunakan persamaan regresi kita peroleh
1
= 60 + 5x(2) = 70. Error atau kesalahan
perhitungan Y
1

1
= 58 70 = -12. kesalahan kuadratis menjadi (-12)
2
= 144. SSE =
1530 sebagai ukuran kesalahan estimasi dg menggunakan persamaan regresi

= 60 +
5X untuk memprediksi penjualan. SSE= jumlah kuadratis perbedaan nilai data penjualan
restoran ke i terhadap nilai persamaan garis ke i.

Restorant
i
Xi: Populasi
Mahasiswa
(1000)
Y
i
:Penjualan
Perkuartal
Rp 0.000.000
Prediksi
Penjualan

i
= 60 + 5X
i

Error (Kesalahan)
Y
i

i

Kesalahan
(Error)
Kuadratis
1
2
3
4
5
6
7
8
9
10
2
6
8
8
12
16
20
20
22
26
58
105
88
118
117
137
157
169
149
202
70
90
100
100
120
140
160
160
170
190
-12
15
-12
18
-3
-3
-3
9
-21
12
144
225
144
324
9
9
9
81
441
144
SSE = 1530
12
2. Total Sum Of Squares (SST)
SST = (Y
i
)
2

SST adalah menggunakan nilai rata-rata (mean) hasil penjualan kuartalan
untuk 10 sampel: = Y
i
/n

= 1300/10 = 130 dan angka ini yaitu = 130
untuk menghitung jumlah kuadratis deviasi yang terjadi pada sampel atau
disebut SST. SST= jumlah kuadratis nilai perbedaan data penjualan
restoran ke i terhadap rata-rata penjualan 10 restoran.









3. Sum Of Square Due To Regression (SSR)
SSR = (
i
)
2

Hubungan SST, SSR dan SSE: SST = SSR + SSE
Restorant
i
X
i
= Populasi
Mahasiswa
(000)
Y
i
= Penjualan
Perkuartal
(0.000.000)
Deviation
Y
i

Kuadrat Deviasi
(Y
i
)
2

1
2
3
4
5
6
7
8
9
10
2
6
8
8
12
16
20
20
22
26
58
105
88
118
117
137
157
169
149
202
-72
-25
-42
-12
-13
7
27
39
19
72
5.184
625
1.764
144
169
49
729
1.521
361
5.184
SST= 15.730
13
100
50
25
200
125
75
2 4 6 8 10 12 14 16 18 20 22 24 26
Y
X
Y
10
-

10
-
Y
10
-
Populasi Mahasiswa (000)
P
e
n
j
u
a
l
a
n

K
u
a
r
t
a
l
a
n

(
R
p
0
.
0
0
0
.
0
0
0
,
-
)


Y = = 130
DEVIASI TENTANG GARIS REGRESI ESTIMASI DAN GARIS Y =
14
4. Koefisien Determinasi.
r
2
= SSR/SST
dari data contoh restoran
r
2
= SSR/SST = 14.200/15.730 = 0,9027
Dengan kata lain 90,27% variabilitas penjualan dapat dijelaskan terdapat
hubungan linier antara jumlah populasi mahasiswa dengan penjualan
dengan menggunakan persamaan regresai = 60 + 5X.

5. Test Signifikan.
a. Mean Square Error (Estimate of
2
)
s
2
= MSE = SSE/ n-2
n 2 = degrees of freedom.
SSE pada kasus restoran SSE = 1530
s
2
= MSE = SSE/ n-2 = 1530/(10-2) = 191,25
Standard error of estimate = s = MSE = 191,25 = 13,829


15
b. t test
Estimate Standard Deviastion of b
1
S
b1
= S/(X
i
- X )
2
S = 13,829
(X
i
- X )
2
= 568
S
b1
= 13,829/568 = 0,5803
b
1
= 5
t = b
1
/ s
b1
= 5/ 0,5803 = 8,62
t tabel dengan degrees of freedom n 2 = 10 2 = 8, dengan tingkat signifikan
= 0,01 maka diperoleh t = 3,355 dengan luas area diatas ekor = 0,01/2 =
0,005. Karena test menggunakan distribusi normal 2 ekor maka p value dengan
t = 8,62 harus memiliki luas p kurang dari 2(0,005) = 0,01. Dari hasil
perhitungan MINITAB p-value = 0.000. Karena p-value < = 0,01 maka H
0

ditolak dan disimpulkan
1
tidak sama dengan 0 pada persamaan regresi Y =
0

+
1
X +
Kesimpulan: t Test untuk signifikan pada regresi linier sederhana
H
0
:
1 =
0
Ha :
1
0
Test Statistik t = b
1
/S
b1

Aturan Penolakan:
p-value approach: Tolak H
0
bila p- value
Critical value approach: Tolak H
0
bila t -t
/2
atau bila t t
/2

Dimana t
/2
berdasarkan t distribusi dengan n 2 degrees of freedom
16
c. Confidence Interval untuk
1
Bentuk confidence interval untuk
1
sebagai berikut:


b
1
t
/2
S
b1

b
1
adalah angka koefisien faktor hasil perhitungan
sedangkan t
/2
S
b1
adalah margin kesalahan
Koefisien confidence dihubungkan dengan interval 1 , dan t
/2
adalah nilai t
yang dihasilkan pada daerah /2 pada ekor distribusi t dengan degree of
freedom n 2.
Contoh: nilat t yang terkait dengan = 0,01 dengan degree of freedom n 2 =
10 2 = 8. dari tabel t
0,005
= 3,355. Dengan demikian 99% confidence interval
atas perhitungan
1
adalah:
b
1
t
/2
S
b1
= 5 3,355(0,5803) = 5 1,95
= 3,05 atau 6,95
Kesimpulan: Hipotesis H
0
:
1
= 0
H
a
:
1
0
Dengan menggunakan t test unutuk test signifikan dengan interval tingkat
kepercayaan 99% diperoleh interval
1
dengan nilai antara 3,05 sd 6,95, hal ini
berarti
1
= 0 tidak dalam interval tersebut maka H
0
ditolak
17
d. F test.
Pada regresi dengan satu variabel bebas F test hasilnya sama dengan t test,
bila t test mengindikasikan 1 0 dan hubungan signifikan maka Ftest akan
menghasilkan kesimpulan yang sama. Tetapi pada variabel bebas lebih dari
satu hanya F test yang menghasilkan hasil test secara keseluruhan terdapat
hubungan yang signifikan.
Mean square due to regression atau disebut juga mean square regression
disingkat MSR
MSR = SSR/ Regression degree of freedom.
Regression degree of freedom adalah sama dengan jumlah variabel
bebas. Mengingat regresi sederhana jumlah variabel bebas 1, maka
MSR = SSR/1 = SSR
F = MSR/MSE
Pada kasus restoran maka F = 14.200/191,25 = 74,25
Lihat tabel F.
Cara mencari tabel F tsb:
Lihat kolom Denominator Degrees of Freedom kebawah adalah
angka n 2, dimana n adalah jumlaf sampel.
Lihat kolom Area Upper Tail kebawah adalah angka luas area diatas
ekor yang mencerminkan angka dari
Pada angka degree of freedom n 2 lihat kekanan pada angka
kemudian lihat angka numerator degree of freedom yang sama
dengan banyaknya variabel bebas, untuk regresi linier atau sederhana
dengan variabel bebas 1 maka lihat pada angka 1 disitu tertera 11,26
inilah nilai F = 11,26
18
Kesimpulan F test.
F Test untuk test signifikan regresi linier sederhana
Hipotesis H
0
:
1
= 0
H
a
:
1
0
Test statistik
f = MSR/MSE
Aturan penolakan:
p-value approach: Tolak H
0
bila p-value
Critical value approach: Tolak H
o
bila F F

Dengan catatan:
F sama dengan F distribusi dimana degree of freedom sama dengan 1
pada kolom numerator.
Dan n 2 pada kolom denominator
Tabel ANOVA Untuk Regresi Linier Sederhana


Source of
Variance
Sum of Squares Degree of
Freedom
Mean Square F P-value
Regression SSR 1 MSR = SSR/1 F = MSR/MSE p-value
Error SSE n - 2 MSE = SSE/ (n 2)
Total SST n - 1
Source of
Variance
Sum of Squares Degree of
Freedom
Mean Square F P-value
Regression SSR 1 MSR = SSR/1 F = MSR/MSE p-value
Error SSE n - 2 MSE = SSE/ (n 2)
Total SST n - 1
19
Soal latihan no 1.
Berikut ini data mengenai berat badan dan tinggi badan dari 5 orang
perenang.







a. Buat scatter diagram dengan tinggi badan sebagai variabel bebas.
b. Apakah scatter diagram tersebut mengindikasikan adanya hubungan
tinggi badan seseorang dengan berat badannya?
c. Coba buat perkiraan garis lurus yang mencerminkan adanya
hubungan tinggi badan dengan berat badan perenang tsb.
d. Buat persamaan regresi dengan menghitung nilai b
0
dan b
1
.
e. Jika perenang tinggi 63 inchies berapa perkiraan berat badan yang
bersangkutan.

Sampel Tinggi
(inchies)
Berat Badan
(pounds)
1
2
3
4
5
68
64
62
65
66
132
108
102
115
128
20
Soal latihan No 2
Dari hasil survey terhadap Guru Pengajar Matematika pada 10 Kelas III IPA SMU
unggulan di Kota A diperoleh data (fiktif) sebagai berikut.














a. Buat scatter diagram dengan pengalaman sebagai variabel bebas.
b. Buat bentuk persamaan regresi yang dapat digunakan memprediksi
hubungan pengalaman mengajar Guru matematika dengan prestasi
belajar matematika untuk murid SMU untuk menghasilkan nilai diatas 7
c. Menggunakan persamaan regresi tersebut untuk memprediksi % pelajar
/klas bernilai diatas 7 untuk pelajaran matematika dengan Guru yang
berpengalaman mengajar matematika selama 5 th


Guru
(Sampel)
Pengalaman Mengajar
Matematika
(Th)
% Pelajar/ Kelas Bernilai
Ujian
Diatas 7

1
2
3
4
5
6
7
8
9
10
1
3
4
4
6
8
10
10
11
13
30
30
40
35
40
45
60
70
60
70
21

Anda mungkin juga menyukai