Anda di halaman 1dari 70

Agung Priyo Utomo (STIS Jakarta) 1

ANALISIS REGRESI
(REGRESSION ANALYSIS)
Oleh:
Agung Priyo Utomo, S.Si., MT.(agung@stis.ac.id)
Sekolah Tinggi Ilmu Statistik (STIS)
Agung Priyo Utomo (STIS Jakarta) 2
HUBUNGAN ANTAR VARIABEL
HUBUNGAN
ANTAR VARIABEL
HUB. FUNGSIONAL/
MATEMATIS, y = f(x)
HUB. SECARA
STATISTIK, y = f(x) + c
MODEL LINIER MODEL NON LINIER
INTRINSIK NON INTRINSIK MODEL REGRESI
MODEL EXP. DESIGN
DLL
Transformasi
Agung Priyo Utomo (STIS Jakarta) 3
REGRESI DAN KORELASI
(Keduanya mempelajari hubungan antar variabel)
REGRESI
Mempelajari bentuk hubungan antar variabel melalui
suatu persamaan (RLS, RLB, Regresi non Linear).
Hubungan bisa berupa hubungan sebab akibat.
Dapat mengukur seberapa besar suatu variabel
mempengaruhi variabel lain
Dapat digunakan untuk melakukan peramalan nilai
suatu variabel berdasarkan variabel lain

Agung Priyo Utomo (STIS Jakarta) 4
REGRESI DAN KORELASI
(Keduanya mempelajari hubungan antar variabel)
KORELASI
Mempelajari keeratan hubungan antar 2 variabel
kuantitatif yang bisa dilihat dari besarnya angka, bukan
tandanya
Dapat mengetahui arah hubungan yang terjadi
(berbanding lurus jika tandanya positif, dan berbanding
terbalik jika tandanya negatif)
Nilainya berkisar -1 sampai dengan 1
Tidak bisa menyatakan hubungan sebab akibat
Agung Priyo Utomo (STIS Jakarta) 5
Contoh:
(1) # kematian karena kekeringan di musim panas
# soft drink yang dikonsumsi di musin panas
High positive correlation
Apakah soft drink menyebabkan kematian?
(2) Gaji guru dan jumlah $ yang diperoleh dalam
penjualan minuman keras.
High positive correlation
Apakah guru membelanjakan uangnya untuk
membeli minuman keras?
Korelasi yang tinggi tidak selalu berarti bahwa
suatu variabel menyebabkan/mempengaruhi
variabel yang lain
Agung Priyo Utomo (STIS Jakarta) 6
DEPENDENT AND INDEPENDENT
VARIABLE
Dependent Variable/Variabel Tak Bebas (Y): Variabel
yang nilainya ditentukan oleh variabel lain.
Diasumsikan bersifat random/stochastic
Independent Variable/Variabel Bebas (X): Variabel
yang nilainya ditentukan secara bebas (variabel yang
diduga mempengaruhi variabel tak bebas).
Diasumsikan bersifat fixed/non stochastic.

Syarat :
Y: Berjenis data kuantitatif
X: Berjenis data kuantitatif atau kualitatif/kategorik
Agung Priyo Utomo (STIS Jakarta) 7
JENIS DATA UNTUK Y
Data Observasi
diperoleh tanpa melakukan kontrol thd var. X
tdk kuat menyatakan cause-effect relationships

Data Eksperimen
diperoleh dengan melakukan kontrol thd var. X
dapat menyatakan cause-effect relationships
Agung Priyo Utomo (STIS Jakarta) 8
Examples
Effect of Car Age on its Price (to what degree can Car
Age predict Its Price)
Effect of Woman Age on Her Fertility (to what degree
can Woman Age predict Her Fertility level)
Effect of A Person Height on His/Her Weight (to what
degree can A Person Height predict His/Her Weight)
Effect of Household Income to Their Consumption
Expenditure (to what degree can Household Income
predict Their Consumption Expenditure)
Effect of Dow Jones Performance on Darts performance
(to what degree can Dow Jones predict Dart
performance)
Agung Priyo Utomo (STIS Jakarta) 9
KONSEP DASAR
Pada suatu nilai X tertentu akan
tdp banyak kemungkinan nilai-nilai
Y (Y akan terdistribusi mengikuti
suatu fungsi peluang tertentu
Distribusi Normal) dengan Nilai
rata-rata E(Y) dan Nilai varians o
2

tertentu
Nilai rata-rata E(Y) diasumsikan
berubah secara sistematik
mengikuti perubahan nilai X, yg
digambarkan dalam bentuk garis
linier
Nilai varians o
2
pada setiap nilai X
akan sama

Agung Priyo Utomo (STIS Jakarta) 10
PROSEDUR DALAM ANALISIS
REGRESI
1. Identifikasi dan pembentukan model
2. Pendugaan parameter model
3. Pengujian keberartian parameter
4. Penilaian ketepatan model (goodness of fit) dan
pemeriksaan asumsi
Agung Priyo Utomo (STIS Jakarta) 11
Relationship can be
represented by line of best fit
IDENTIFIKASI MODEL
Contoh Ploting Data Car Age vs Price
Scatter plot
(diagram pencar)

Berguna utk
mengidentifikasi model
hubungan antara variabel X
dan Y.
Bila pencaran titik-titik
pada plot ini menunjukkan
adanya suatu
kecenderungan (trend) yang
linier, maka model regresi
linier layak digunakan.
0
20
40
60
80
100
120
140
160
180
0 1 2 3 4 5 6 7 8
X
Y
Agung Priyo Utomo (STIS Jakarta) 12
KETERANGAN
Ternyata titik-titik (plotting data) tersebut terlihat
mengelompok di sekitar garis lurus
Pada scatter plot tersebut, sebenarnya bisa ditarik
beberapa garis yang dekat terhadap titik-titik tersebut
Tujuan kita di sini adalah
1. Mencari garis yang paling tepat
2. Melakukan Peramalan
3. Ingin mengetahui hubungan yang terjadi (seberapa
besar pengaruh usia keendaraan terhadap harga
jualnya)
Agung Priyo Utomo (STIS Jakarta) 13
Beberapa Contoh Model Regresi Linear
First-Order Model with One Predictor Variable

Second-Order Model with One Predictor Variable

Second-Order Model with Two Predictor Variables with
Interaction


etc.
y x x x x x x = + + + + + + | | | | | | c
0 1 1 2 2 3 1
2
4 2
2
5 1 2
y x x x x x x = + + + + + + | | | | | | c
0 1 1 2 2 3 1
2
4 2
2
5 1 2
y x x = + + + | | | c
0 1 1 2 1
2
y x x = + + + | | | c
0 1 1 2 1
2
y x = + + | | c
0 1 1
y x = + + | | c
0 1 1
Agung Priyo Utomo (STIS Jakarta) 14
Model Regresi Linear Sederhana
Y
i
= |
0
+ |
1
X
i
+ c
i
(i = 1, 2, , n)
dimana :
Y
i
merupakan nilai dari variabel dependent pada
observasi ke-i
|
0
dan |
1
merupakan parameter model
c
i
merupakan komponen error
(pengaruh variabel bebas lain selain variabel X)
X
i
adalah nilai variabel bebas X pada observasi ke-i
n adalah banyaknya data observasi (sampel)

Note: |
0
dan |
1
disebut juga koefisien regresi, |
0

merupakan intercept dan |1 merupakan slope
(gradien garis) yang menyatakan perubahan
nilai Y untuk setiap kenaikan satu satuan X
Agung Priyo Utomo (STIS Jakarta) 15
Beberapa Asumsi
Y
i
(Variabel Tak Bebas/Dependent Variable)
merupakan random variable/bersifat stochastic
Xi (Variabel bebas/Independent Variable) bersifat
fixed/non stochastic (bukan merupakan random
variable)
E(c
i
)

= 0
E(c
i
c
j
) = E(
i
2
) = o
2
untuk i = j (Homoscedastic)
E(c
i
c
j
) = 0 untuk i = j (Non autocorrelation)

Agung Priyo Utomo (STIS Jakarta) 16
Beberapa Asumsi (Lanjutan)
c
i
merupakan random variable yang terdistribusi
secara bebas dan indentik mengikuti distribusi normal
dengan rata-rata 0 dan varian o
2
atau biasa dituliskan
sebagai
c
i
~ N
ID
(0, o
2
)
iid
BAGAIMANA JIKA ADA ASUMSI YANG TIDAK
TERPENUHI? BAGAIMANA MENDETEKSINYA?
BAGAIMANA MENGUJI? BAGAIMANA ALTERNATIF
SOLUSINYA?
Sifat penting dari Y
i
= |
0
+ |
1
X
i
+ c
i

Nilai Y berisi penjumlahan 2 komponen, yaitu suku konstan (|
0
+
|
1
X
i
) dan suku random (c
i
)
Karena E(c
i
)=0, maka E(Y
i
) = |
0
+ |
1
X
i
Nilai observasi Y akan berada di sekitar garis regresi (bisa dibawah
atau diatas garis), simpangan ini yang disebut dengan error
Suku c
i
diasumsikan memiliki varian yg konstan, yaitu o
2
, sehingga
Var(Y
i
) juga konstan (o
2
).
Suku c
i
diasumsikan tidak saling berkorelasi dg c
j
, shg Y
i
jg tdk
saling berkorelasi Y
j
.
Yi berasal dari suatu distribusi peluang dengan rata-rata |
0
+ |
1
X
i

dan varian o
2
.
Agung Priyo Utomo (STIS Jakarta) 17
Agung Priyo Utomo (STIS Jakarta) 18
PENDUGAAN/ESTIMASI PARAMETER
METODE ESTIMASI
PADA REGRESI LINIER
MAXIMUM LIKELIHOOD
METHOD
LEAST SQUARES
METHOD
Ordinary Least
Squares (OLS)
Generalized Least
Squares (GLS)
Agung Priyo Utomo (STIS Jakarta) 19
Least Squares Criterion
Prinsipnya: Min
Pada model regresi linear sederhana dengan asumsi
yang telah diberlakukan, maka dipakai Metode OLS
untuk mengestimasi parameter model
Estimasi Parameter



Prediksi/estimasi untuk Y jika nilai X diketahui

c
i
2
i
x

1 0
| = |


= = |
i
2
i
i
i i
xx
xy
1
) x x (
) y y )( x x (
S
S

i 1 0 i
x

Y

| + | =
Agung Priyo Utomo (STIS Jakarta) 20
CONTOH: REED AUTO SALES
Sebagai bagian dari kampanyenya, Reed Auto
menggunakan media televisi untuk iklan selama akhir
pekan yang lalu. Berikut adalah data dari 5 sampel
penjualan.

Banyaknya iklan TV Jumlah Mobil Terjual
1 14
3 24
2 18
1 17
3 27
Agung Priyo Utomo (STIS Jakarta) 21
Kemiringan Persamaan Regresi Estimasi
b
1
= 220 - (10)(100)/5 = 5
24 - (10)
2
/5
Intercept Persamaan Regresi Estimasi
b
0
= 20 - 5(2) = 10
Estimasi Persamaan Regresi
y = 10 + 5x
Interpretasi: Jika banyaknya iklan bertambah 1 kali,
maka dapat meningkatkan banyak penjualan mobil
sebanyak 5.
^
CONTOH: REED AUTO SALES
Agung Priyo Utomo (STIS Jakarta) 22
Scatter Diagram
y = 5x + 10
0
5
10
15
20
25
30
0 1 2 3 4
Banyaknya Iklan TV
J
u
m
l
a
h

M
o
b
i
l

T
e
r
j
u
a
l

CONTOH: REED AUTO SALES
Agung Priyo Utomo (STIS Jakarta) 23
Example: Relationship between Car Age
(X) and its Price (Y)
0
20
40
60
80
100
120
140
160
180
0 1 2 3 4 5 6 7 8
X
Y
Agung Priyo Utomo (STIS Jakarta) 24
Prosedur Penghitungan untuk Estimasi
Parameter
Agung Priyo Utomo (STIS Jakarta) 25
2026 $ by decreases price the age in increase year single a For
decreases. price the increases age the As
X 26 . 20 47 . 195 Y

: uation gressionEq Re
47 . 195 )) 58 )( 26 . 20 ( 975 (
10
1
) X b Y (
n
1
b
26 . 20
182 . 20
909 . 408
S
S
b
909 . 408 10 / ) 975 )( 58 ( 4732 n / Y) )( X ( XY S
182 . 20 10 / (58) - 326 n / ) X ( X S
326 X and 4732 XY 975, Y , 58 X
1 0
XX
XY
1
XY
2 2
XX
2
2
=
= = =
=

= =
= = =
= = =
= = = =




Agung Priyo Utomo (STIS Jakarta) 26
Regression line and data points for
Car Age and Price Data
Agung Priyo Utomo (STIS Jakarta) 27
Sifat-sifat Estimator Least Squares
Jika semua asumsi yang diberlakukan terhadap model
regresi terpenuhi, maka menurut suatu teorema (Gauss
Markov theorem) estimator tersebut akan bersifat
BLUE (Best Linear Unbiased Estimator).
Best = Terbaik, mempunyai varian yang minimum
Linear = Linear dalam Variabel Random Y
Unbiased = Tak bias
Artinya estimator tersebut akan unbiased, linier dan
mempunyai varian yang minimum diantara semua
estimator unbiased & linier yang lain.
Agung Priyo Utomo (STIS Jakarta) 28
Age
(yrs)
Price
($100s)
Estimated
Mean
Response
Residual
Squared
Residual
X
i
Y
i

i
Y


i i i
Y

Y e =

2
i i
2
i
) Y

Y ( e =

5 85 94 -9 84
4 103 114 -11 131
6 70 74 -4 15
5 82 94 -12 148
5 89 94 -5 27
5 98 94 4 15
6 66 74 -8 63
6 95 74 21 445
2 169 155 14 197
7 70 54 16 267
7 48 54 -6 32
58 975 975 0 1424


Residual
Agung Priyo Utomo (STIS Jakarta) 29
Inferensi dalam Analisis Regresi
Model Regresi Linear Sederhana
Y
i
= |
0
+ |
1
X
i
+ c
i
Dimana c
i
merupakan random variabel yang
terdistribusi N
ID
(0,o
2
)
Contoh:
Sebuah Perusahaan, Westwood Company, sedang
meneliti tentang hubungan antara jumlah sparepart
yang diproduksi (X) dengan jumlah jam kerja yang
diperlukan (Y) dari 10 proses produksi terakhir.
(Data ada di buku Neter and Wasserman, halaman 40)

Agung Priyo Utomo (STIS Jakarta) 30
INFERENSI TENTANG MODEL
Confidence Interval dan Uji Hipotesis
Confidence Interval (1-o)100% untuk |
1



Pada contoh Westwood Company, diperoleh
n = 10
SSE = 60 MSE = 7.5



Sehingga CI 95 % untuk |
1
adalah
P(1.89 |1 2.11) = 95 %
% 100 ) 1 ( ) )

(
) 2 , 1 ( 1 1 1 ) 2 , 1 ( 1 1
2 2
o = | + | s | s | |

o o
n n
t s t s P
0 . 2

1
= |
0 . 10

0
= |
0 . 2 = X
28400
2
=
i
X
3400 ) (
2
=

X X
i
13660 ) (
2
=

Y Y
i
Agung Priyo Utomo (STIS Jakarta) 31
Uji Hipotesis Tentang |
1
a. H
0
: |
1
= 0 b. H
0
: |
1
0 c.
H
0
: |
1
0
H
1
: |
1
0 H
1
: |
1
> 0 H
1
: |
1
< 0


Statistik Uji:



Keputusan pada tingkat sign. o : Tolak H
0
jika
a. b. c.
Kesimpulan :
Jika H
0
ditolak, maka dengan tingkat kepercayaan (1- o)
100 %, terdapat hubungan yang linier antara variabel X
dan variabel Y (terdapat pengaruh yg signifikan dari
variabel X thd variabel Y)
)

1
1
*
|
|
=
s
t
| | | * |
) 2 , 1 (
2

>
n
t t
o
) 2 , 1 (
*
o
>
n
t t
) 2 , 1 (
*

<
n
t t
o
INFERENSI TENTANG MODEL
Confidence Interval dan Uji Hipotesis
Agung Priyo Utomo (STIS Jakarta) 32
Pada contoh Westwood Co., diperoleh t* = 42.58
t
(0.975,8)
= 2.306 dan t
(0.95,8)
= 1.860

Keputusan?
Kesimpulan?
INFERENSI TENTANG MODEL
Confidence Interval dan Uji Hipotesis
Statistik Uji-t setara dengan Statistik Uji-F
Agung Priyo Utomo (STIS Jakarta) 33
PENDEKATAN ANOVA DALAM
ANALISIS REGRESI
Y Y Y Y Y Y
i i i i
+ =

Dasar: Partisi dari Sum Squares Total (SST) dan
derajat bebas


SST SSE SSR
Total Sum of Squares Error SS Regression SS
df n 1 n 2 1
Rumus untuk penghitungan


+ =
2 2
2
)

( )

( ) ( Y Y Y Y Y Y
i i i i
n
Y
Y SST
i
i

=
2
2
) (
|
|
.
|

\
|
| =


n
Xi
X SSR
i
2
2 2
1
) (

Agung Priyo Utomo (STIS Jakarta) 34


ILUSTRASI GEOMETRIS
PARTISI JUMLAH KUADRAT
Y
i
Y

Y
i
i i
Y Y

Y Y
i

Agung Priyo Utomo (STIS Jakarta) 35


PENDEKATAN ANOVA DALAM
ANALISIS REGRESI
Mean Squares (MS): SS dibagi dengan derajat bebasnya


Tabel ANOVA untuk Regresi Linear Sederhana

2 1
= = =
n
SSE
MSE dan SSR
SSR
MSR
Source of
Variation
SS df MS E{MS} F*
Regression 1 MSR
Error n2 MSE
Total n1


2
)

( Y Y
i


2
)

(
i i
Y Y


2
) ( Y Y
i

| + o
2 2
1
2
) ( X X
i
2
o
MSE
MSR
Agung Priyo Utomo (STIS Jakarta) 36
PENDEKATAN ANOVA DALAM
ANALISIS REGRESI
5 . 7
8
60
13600
1
13600
= = = = MSE dan MSR
Anova tersebut dapat digunakan untuk menguji
H
0
: |
1
= 0 vs H
1
: |
1
0

Tabel ANOVA untuk Kasus Westwood Company
Pada Westwood Co., diperoleh SSR = 13600 dan SSE =
60, sehingga
Agung Priyo Utomo (STIS Jakarta) 37
Tabel ANOVA untuk Kasus Westwood Company






Keputusan: Tolak H
0
jika F* > F
(1-o;1, n-2)
Dari tabel F, diperoleh F
(0.95;1, 8)
= 5,32
Kesimpulan?
Source of
Variation
SS df MS F*
Regression 13600 1 13600
1813
Error 60 8 7.5
Total 13660 9
PENDEKATAN ANOVA DALAM
ANALISIS REGRESI
Agung Priyo Utomo (STIS Jakarta) 38
Koefisien Determinasi (R
2
)
Mengukur proporsi keragaman total dari nilai
observasi Y di sekitar rataannya yang dapat
diterangkan oleh garis regresinya atau variabel bebas
yg digunakan.


Nilainya: 0 R
2
1, makin mendekati 1 berarti model
regresi yg digunakan makin tepat/baik

SST
SSE
SST
SSR
R = = 1
2
PENILAIAN KETEPATAN MODEL
(GOODNESS OF FIT)
Agung Priyo Utomo (STIS Jakarta) 39
PERAMALAN NILAI RATA-RATA Y (
Y|X
) PADA
X=X
0
E(y) =
y|x
= |
0
+ |
1
x
y = b
0
+ b
1
x
Var(y) = var[y+b
1
(x-x)]




Confidence Interval (1-o)100% untuk rata-rata y pada
x=x
0
adalah
^
^
_ _

+ =
] x [
) x x (
n
) y

var(
n
) x (
2
2
2
2
2
o o
% 100 ) 1 ( ] s . t y

s . t y

[ P
y
2 n ,
x x | y y
2 n ,
2
0
2
o
o o
= + < <

=

+ = =
] x [
s
) x x (
n
s
s ) y

var( . est
n
) x (
2
2
2
2
2
y 2
Agung Priyo Utomo (STIS Jakarta) 40
PERAMALAN NILAI INDIVIDU Y (Y
i
) PADA X=X
0
y
i
= |
0
+ |
1
x
i
+ c
i
Berdasarkan n pengamatan, maka
y
i
= b
0
+ b
1
x
i
+ c
i
= y
i
+ c
i





Confidence Interval (1-o)100% untuk rata-rata y pada
x=x
0
adalah
^
2
n
) x (
2
2
2
2
i
] x [
) x x (
n
) y var(
2
o
o o
+

+ =

% 100 ) 1 ( ] s . t y

y s . t y

[ P
i
2
0 i
2
y
2 n ,
i x x | i y
2 n ,
i
o
o o
= + < <

=

2
n
) x (
2
i
2
2
i
2
2
y i
s
] x [
s
) x x (
n
s
s ) y var( . est
2
i
i
+

+ = =

Agung Priyo Utomo (STIS Jakarta) 41


KOEFISIEN KORELASI
Linear Correlation Coefficient
suatu ukuran yang menyatakan erat tidaknya hubungan
linier yang ada antara variable X dan Y,
nilai korelasi dirumuskan sebagai



Nilai koefisien korelasi berkisar -1 sampai 1 (-1 r 1)
tanda positif atau negatif dari R sesuai dengan tanda
positif atau negatif pada parameter |
1



= =
2 2
2
) ( ) (
) )( (
y y x x
y y x x
R r
i i
i i
Agung Priyo Utomo (STIS Jakarta) 42
Various degrees of linear correlation
Agung Priyo Utomo (STIS Jakarta) 43
Various degrees of linear correlation
Agung Priyo Utomo (STIS Jakarta) 44
CONTOH: REED AUTO SALES
KOEFISIEN DETERMINASI
R
2
= SSR/SST = 100/114 = 0,8772

Artinya:
Hubungan regresi sangat kuat karena 88% variasi mobil
yang terjual dapat dijelaskan oleh banyaknya iklan TV.

KOEFISIEN KORELASI
9366 , 0 8772 , 0 r
xy
+ = + =
Agung Priyo Utomo (STIS Jakarta) 45
KESETARAAN UJI KOEFISIEN REGRESI
DAN KOEFISIEN KORELASI
r
XY
= r
YX




Hipotesis
H
0
:
1
= 0 setara dengan H
0
: = 0
H
1
:
1
= 0 H
1
: = 0

Tolak H
0
berarti ada hubungan linier antara variabel X
dan Y
(
(
(

= = |
(
(
(

= = |

i
2
i
i
2
i
x
y
1
i
2
i
i
2
i
x
y
1
) x x (
) y y (
S
S
;
) x x (
) y y (
r
S
S
r

Agung Priyo Utomo (STIS Jakarta) 46


KESETARAAN UJI KOEFISIEN REGRESI
DAN KOEFISIEN KORELASI (L)
Statistik Uji:






Tolak H
0
jika
2 n
2 2
hitung
t ~
r 1
2 n r
2 n
r 1
0 r
t

=
2 n ;
2
hitung
t t

o
>
Agung Priyo Utomo (STIS Jakarta) 47
Example: linear correlation coefficient for Car Age and
Price Data
Agung Priyo Utomo (STIS Jakarta) 48
Model Summary
.924
a
.853 .837 12.577
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predictors: (Constant), Car Age (years)
a.
SPSS Printout for one Predictor
Variables Enter ed/Removed
b
Car Age
(years)
a
. Enter
Model
1
Variables
Entered
Variables
Removed Method
All requested variables entered.
a.
Dependent Variable: Price ($)
b.













R
2
, Percentage of Variance
Agung Priyo Utomo (STIS Jakarta) 49
Coefficients
a
195.468 15.240 12.826 .000
-20.261 2.800 -.924 -7.237 .000
(Constant)
Car Age (years)
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Price ($)
a.
ANOVA
b
8285.014 1 8285.014 52.380 .000
a
1423.532 9 158.170
9708.545 10
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), Car Age (years)
a.
Dependent Variable: Price ($)
b.
Intercept
Slope
Is regression Significant?
Error of
prediction
Agung Priyo Utomo (STIS Jakarta) 50
MODEL REGRESI LINIER BERGANDA
Model Regresi Linier Berganda
y
i
= |
0
+ |
1
x
i1
+ |
2
x
i2
+ + |
p
x
ip
+ c
i
Persamaan Regresi Linier Berganda
E(y
i
) = |
0
+ |
1
x
i1
+ |
2
x
i2
+ + |
p
x
ip

Estimasi Persamaan Regresi Linier Berganda
y
i
= b
0
+ b
1
x
i1
+ b
2
x
i2
+ + b
p
x
ip
dimana
y
i
= variabel tak bebas (response/dependent variable)
x
i
= variabel bebas (predictor/independent variable) ke-i
c
i
= suku sisaan (error/residual)
|
i
= koefisien regresi dari variabel bebas ke-i
^
Agung Priyo Utomo (STIS Jakarta) 51
METODE KUADRAT TERKECIL
Kriteria Kuadrat Terkecil
Prinsip: Meminimalkan jumlah kuadrat error


Pencarian estimasi koefisien regresi dapat diperoleh
melalui aljabar matriks, namun dalam kuliah ini akan
menggunakan hasil penghitungan menggunakan
komputer
b
i
menyatakan estimasi perubahan y yang disebabkan
oleh berubahnya nilai x
i
sebesar satu satuan, dengan
asumsi variabel bebas yang lain konstan


2
i i
) y

y ( min
Agung Priyo Utomo (STIS Jakarta) 52
SURVEI GAJI PROGRAMER
Perusahaan perangkat lunak mengumpulkan data dengan
jumlah sampel 20 programer komputer. Suatu anggapan
dibuat bahwa analisis regresi dapat digunakan untuk
menghitung/mengetahui apakah gaji dipengaruhi oleh
pengalaman kerja (tahun) dan skor kecerdasan para
programer.
Pengalaman, skor kecerdasan, dan gaji ($1000s) dari 20
sampel programer komputer terdapat pada slide
berikutnya.
Agung Priyo Utomo (STIS Jakarta) 53
Pengalaman Skor Gaji Pengalaman Skor Gaji
4 78 24 9 88 38
7 100 43 2 73 26.6
1 86 23.7 10 75 36.2
5 82 34.3 5 81 31.6
8 86 35.8 6 74 29
10 84 38 8 87 34
0 75 22.2 4 79 30.1
1 80 23.1 6 94 33.9
6 83 30 3 70 28.2
6 91 33 3 89 30
SURVEI GAJI PROGRAMER
Agung Priyo Utomo (STIS Jakarta) 54
SPSS Computer Output
Persamaan regresinya adalah
Gaji = 3,17 + 1,40 pengalaman + 0,251 skor

Var. Bebas Coef Stdev t-ratio p
Konstanta 3,174 6,156 0,52 0,613
Pengalaman 1,4039 0,1986 7,07 0,000
Skor 0,25089 0,07735 3,24 0,005

s = 2,419 R-sq = 83,4% R-sq(adj) = 81,5%
SURVEI GAJI PROGRAMER
Agung Priyo Utomo (STIS Jakarta) 55
SPSS Computer Output

Analysis of Variance

SOURCE DF SS MS F P
Regression 2 500,33 250,16 42,76 0,000
Error 17 99,46 5,85
Total 19 599,79
SURVEI GAJI PROGRAMER
Agung Priyo Utomo (STIS Jakarta) 56
PEMERIKSAAN ASUMSI:
Linieritas,
Plot antara nilai-nilai
residual (e
i
) dengan nilai-
nilai X
i ,
Jika pencaran
titik yang terbentuk
tersebar secara acak di
sekitar nol, maka asumsi
linieritas terpenuhi.
Umur Mobil (tahun)
8 7 6 5 4 3 2 1
U
n
s
t
a
n
d
a
r
d
i
z
e
d

R
e
s
i
d
u
a
l
30
20
10
0
-10
-20
Agung Priyo Utomo (STIS Jakarta) 57
PEMERIKSAAN ASUMSI:
Normalitas,
Plot antara residual
yang diurutkan e
(i)

dengan nilai harapannya
E(e
(i)
) (Normal
Probability Plot)
Jika pencaran titik-titik
nya membentuk atau
mendekati suatu garis
linier maka asumsi
kenormalan terpenuhi.
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: Harga Jual Mobil ($00s)
Observed Cum Prob
1.00 .75 .50 .25 0.00
E
x
p
e
c
t
e
d

C
u
m

P
r
o
b
1.00
.75
.50
.25
0.00
Agung Priyo Utomo (STIS Jakarta) 58
PEMERIKSAAN ASUMSI:
Homoskedastisitas,
Sama halnya seperti pada
linieritas jika plot antara e
i

dengan X
i
menunjukkan
pola yang acak, atau plot
antara e
i
dengan Y
i

menunjukkan pola acak,
maka asumsi kesamaan
varians (homoskedastisitas)
terpenuhi
Unstandardized Predicted Value
160 140 120 100 80 60 40
U
n
s
t
a
n
d
a
r
d
i
z
e
d

R
e
s
i
d
u
a
l
30
20
10
0
-10
-20
^
Agung Priyo Utomo (STIS Jakarta) 59
PEMERIKSAAN ASUMSI:
Independensi/Autokorelasi,
sering terjadi terutama jika data yang digunakan
untuk analisis regresi merupakan data time series.
Autokorelasi dapat menimbulkan masalah serius
terutama pada nilai penduga dari varians sample
(MSE).
Pemeriksaan dengan membuat plot antara e
t
(residual pada waktu ke t) dengan waktu (t), atau
dengan statistik Durbin Watson
Agung Priyo Utomo (STIS Jakarta) 60
PEMERIKSAAN ASUMSI:
Multikollinieritas,
adalah korelasi antar variabel bebas pada model regresi
berganda
Pemeriksaan awal dengan mencari nilai korelasi antar peubah
bebas atau dengan melihat nilai VIF (Variance Inflaction Factor).
Nilai VIF yang besar (>10) mengindikasikan adanya
multikollinieritas (Neter & Wasserman).
Jika variabel bebas berkorelasi kuat (misal, |r| > 0,7), maka
tidak dapat diketahui efek variabel bebas tertentu terhadap
variabel tak bebas secara terpisah.
Jika estimasi persamaan regresi digunakan hanya untuk
keperluan prediksi, maka multikolinearitas umumnya bukan
masalah serius.

Agung Priyo Utomo (STIS Jakarta) 61
PEMILIHAN MODEL REGRESI
TERBAIK
1. Backward Elimination
Tahap pertama akan memasukkan semua variable
bebas X, kemudian secara bertahap akan
mengeluarkan satu-persatu X yang tidak potensial.
Prosedur seleksi akan terhenti bila dikeluarkannya
suatu variable bebas tidak lagi secara significant
mereduksi SSE atau menambah nilai R
2
.
Agung Priyo Utomo (STIS Jakarta) 62
PEMILIHAN MODEL REGRESI
TERBAIK
2. Forward Elimination,
Metoda ini bekerja berkebalikan dari metoda
backward dan dimulai dengan memasukkan variabel
bebas yang memiliki korelasi paling erat dengan
variabel tak bebasnya (variabel yang paling
potensial untuk memiliki hubungan linier dengan Y ).
Kemudian secara bertahap memasukkan variabel
bebas yang petensial berikutnya. Prosedur seleksi
akan terhenti sampai tidak ada lagi variabel bebas
yang potensial
Agung Priyo Utomo (STIS Jakarta) 63
PEMILIHAN MODEL REGRESI
TERBAIK
3. Stepwise Elimination
Metoda stepwise memiliki prosedur yang hampir sama
dengan metoda forward, hanya saja bila suatu
variabel bebas telah masuk pada satu tahapan, dapat
saja pada tahapan berikutnya variabel tersebut
dikeluarkan karena menjadi tidak potensial lagi
dibandingkan dengan variabel yang masuk model
setelahnya.

Agung Priyo Utomo (STIS Jakarta) 64
Regresi dengan Variabel Bebas
Kualitatif/Kategorik
Variabel Kualitatif/Kategorik sebagai variabel bebas
Jenjang Pendidikan: SD, SLTP, SLTA, SLTA+
Jenis kelamin: Laki-laki, Perempuan
Status daerah: Kota, Desa
Status bekerja: Bekerja, Tidak Bekerja
Agung Priyo Utomo (STIS Jakarta) 65
Regresi dengan Variabel Bebas
Kualitatif/Kategorik
Dibuat Indicator variable/Dummy variabel yaitu
mengkuantitatifkan data kualitatif, dengan kode 0
atau 1
Bila satu variabel bebas memiliki k kategori, maka
akan dibuat sebanyak (k-1) variabel indikator, yg
masing2 bernilai 0 atau 1
Selanjutnya pendugaan dan pengujian parameter
ekivalen dengan regresi berganda
Agung Priyo Utomo (STIS Jakarta) 66
Regresi dengan Variabel Bebas
Kualitatif/Kategorik
Coefficients
a
402,376 629,562 ,639 ,532
140,655 20,041 ,743 7,018 ,000
23,478 8,042 ,318 2,919 ,010
93,870 112,731 ,086 ,833 ,417
(Constant)
Pengal aman Kerj a
(Tahun)
Skor Uj i an
Dummy Jeni s Kel ami n
Model
1
B Std. Error
Unstandardi zed
Coeffi ci ents
Beta
Standardi zed
Coeffi ci ents
t Si g.
Dependent Vari abl e: Gaj i Programer (000 Rp)
a.
d = 1, untuk Laki-laki
0, untuk Perempuan
Est. y
i
= 402,376+140,655X
i1
+23,478X
i2
+93,87d
Agung Priyo Utomo (STIS Jakarta) 67
Regresi dengan Variabel Bebas
Kualitatif/Kategorik
Est. y
i
= 402,376+140,655X
i1
+23,478X
i2
+93,87d
Interpretasi:
140,655 ketika pengalaman kerja bertambah 1 tahun
maka gaji akan bertambah sebesar Rp 140.655,- dengan
asumsi skor ujian dan jenis kelamin sama.
23,478 ketika skor ujian bertambah 1 point, maka gaji
akan bertambah sebesar Rp 23.478,- dengan asumsi
pengalaman kerja dan jenis kelamin sama
93,87 secara rata-rata pegawai berjenis kelamin laki-laki
memiliki gaji Rp 93.870,- lebih besar dibandingkan pegawai
perempuan (selisih rata-rata gaji pegawai laki-laki dan
perempuan gaji laki-laki lebih besar)
Agung Priyo Utomo (STIS Jakarta) 68
Regresi dengan Variabel Bebas
Kualitatif/Kategorik
Est. y
i
= 402,376+140,655X
i1
+23,478X
i2
+93,87d
Interpretasi:
Laki-laki:
Est. y
i
= 402,376+140,655X
i1
+23,478X
i2
+93,87.(1)
Est. y
i
= (402,376+93,87)+140,655X
i1
+23,478X
i2

Perempuan:
Est. y
i
= 402,376+140,655X
i1
+23,478X
i2
+93,87.(0)
Est. y
i
= 402,376+140,655X
i1
+23,478X
i2

93,87 secara rata-rata pegawai berjenis kelamin laki-laki
memiliki gaji Rp 93.870,- lebih besar dibandingkan pegawai
perempuan (selisih antara gaji pegawai laki-laki dibandingkan
dengan perempuan adalah sebesar Rp 93.870,- laki-laki lebih
besar)
Agung Priyo Utomo (STIS Jakarta) 69
Regresi dengan Variabel Bebas
Kualitatif/Kategorik
Y = gaji (000rp), X1 = pengalaman kerja, X2 = skor ujian, X3 = jenis
kelamin (L & P), X4 = tingkat pendidikan (SMA, Sarjana, Pascasarjana)
d
1
= 1, L
0, P
d
21
= 1, sarjana d
22
= 1, Pascasarjana
0, lainnya (SMA) 0, lainnya (SMA)
Coefficients
a
587,639 641,663 ,916 ,375
114,047 26,930 ,602 4,235 ,001
20,668 8,213 ,280 2,516 ,025
57,699 131,972 ,053 ,437 ,669
240,612 176,646 ,215 1,362 ,195
306,909 220,655 ,267 1,391 ,186
(Constant)
Pengal aman Kerj a
(Tahun)
Skor Uj i an
Dummy Jeni s Kel ami n
Sarj ana
Pasca Sarj ana
Model
1
B Std. Error
Unstandardi zed
Coeffi ci ents
Beta
Standardi zed
Coeffi ci ents
t Si g.
Dependent Vari abl e: Gaj i Programer (000 Rp)
a.
Agung Priyo Utomo (STIS Jakarta) 70
Regresi dengan Variabel Bebas
Kualitatif/Kategorik dan Suku Interaksi
Est. y
i
= 2258+149,4X
i1
+34,771d+26,383X
i1
d
Laki-laki:
Est. y
i
= 2258+149,4X
i1
+34,771.(1)+26,383X
i1

= (2258+34,771)+(149,4+26,383)X
i1
Perempuan:
Est. y
i
= 2258+149,4X
i1
+34,771.(0)+26,383X
i1
.(0)
= 2258+149,4X
i1

Coefficients
a
2258,000 177,065 12,752 ,000
149,400 29,929 ,789 4,992 ,000
34,771 282,220 ,032 ,123 ,903
26,383 47,380 ,157 ,557 ,585
(Constant)
Pengal aman Kerj a
(Tahun)
Dummy Jeni s Kel ami n
x1d
Model
1
B Std. Error
Unstandardi zed
Coeffi ci ents
Beta
Standardi zed
Coeffi ci ents
t Si g.
Dependent Vari abl e: Gaj i Programer (000 Rp)
a.

Anda mungkin juga menyukai