Anda di halaman 1dari 37

Analisis Regresi 1

Pokok Bahasan :

Diagnosa Model Melalui Pemeriksaan


Sisaan dan Identifikasi Pengamatan
Berpengaruh
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Sisaan
Sisaan adalah menyimpangnya nilai amatan yi
terhadap dugaan nilai harapannya

)
)
)
E [Y | x i ] E [Y | x i ] = yi = b 0 + b1x i

Sisaan untuk suatu amatan ke-i:


Sisaan baku ri

(
yi y i ) ei
=
=

Kurang tepat sebab


ragam (ei) = s2 (1-hii)
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

s( yi y i )

)
ei = yi yi

Bisa digunakan untuk


memeriksa kebenaran
i
menyebar N(0,1)

1 + ( xi x )2
ei
, hii = nn
ri =
2
s (1 hii )
(
)
x

x
k
k =1

Contoh: menghitung sisaan


Berikut adalah 1 set (25 pengamatan) data berpasangan x1i dan yi
yang didapat dari sebuah percobaan. Dari data ini ingin diketahui
model matematika hubungan antara x1 dan Y.
i

10

11

12

13

10.98

11.13

12.51

8.4

9.27

8.73

6.36

8.5

7.82

9.14

8.24

12.19

11.88

X1

20

20

23

20

21

22

11

23

21

20

20

21

21

14

15

16

17

18

19

20

21

22

23

24

25

9.57

10.94

9.58

10

8.11

6.83

8.88

7.7

8.47

8.86

10.4

11.08

19

23

20

22

22

11

23

20

21

20

20

22

Y
X1

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Contoh: menghitung sisaan


(lanjutan)
Dari tebaran x1 terhadap Y digunakan
persamaan garis regresi linier sederhana
ordo satu :
Y = + x +

Scatterplot of Y vs X1
13
12
11

10
Y

Dengan Minitab didapatkan dugaan


persamaannya : Y = 3.56 + 0.290 X1

9
8
7
6
10

12

14

16

18
X1

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

20

22

24

Untuk setiap amatan dihitung nilai


dugaannya, kemudian hitung sisaannya

Contoh: menghitung sisaan


(lanjutan)
Y duga = 3.56 + 0.290 X1

sisaan ke i = amatan ke-i dugaan pd titik x ke-i

10

11

12

13

10.98

11.13

12.51

8.40

9.27

8.73

6.36

8.50

7.82

9.14

8.24

12.19

11.88

y_duga

9.35

9.35

10.22

9.35

9.64

9.93

6.75

10.22

9.64

9.35

9.35

9.64

9.64

sisaan

1.63

1.78

2.29

-0.95

-0.37

-1.20

-0.39

-1.72

-1.82

-0.21

-1.11

2.55

2.24

14

15

16

17

18

19

20

21

22

23

24

25

9.57

10.94

9.58

10.09

8.11

6.83

8.88

7.68

8.47

8.86

10.36

11.08

y_duga

9.06

10.22

9.35

9.93

9.93

6.75

10.22

9.35

9.64

9.35

9.35

9.93

sisaan

0.51

0.72

0.23

0.16

-1.82

0.08

-1.34

-1.67

-1.17

-0.49

1.01

1.15

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Informasi-informasi yang Didapat


Melalui Sisaan

Bisa melihat pola sebaran peubah acak Y


Melalui sisaan, kita dapat mengetahui apakah asumsi-asumsi
yang disyaratkan pada pendugaan dengan MKT dipenuhi atau
tidak
Melalui sisaan, kita juga dapat menguji parameter regresi,
sehingga kita perlu mengetahui sebaran sisaan
Melalui sisaan, kita juga bisa melihat apakah model yang kita pilih
pas atau tidak
Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan
merupakan pencilan atau bukan
Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan
merupakan pengamatan berpengaruh atau bukan

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pemeriksaan Pola Sebaran


Peubah Respon Y
MODEL REGRESI
Acaknya Y disebabkan
karena acaknya eror

Y = 0 + 1x +

E [ Y | xi ]
Acak

Bentuk sebaran Y =
bentuk sebaran eror
Memeriksa bentuk
sebaran Y = memeriksa
bentuk sebaran eror
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Fix

Acak

Plot Sisaan untuk:


Pemeriksaan Bentuk Sebaran
Tebaran sisaan
dan histogram
di samping
untuk melihat :
BENTUK
SEBARAN
SISAAN, simetri
atau tidak

H is to g r a m S is a a n
Norm al
4

Frekuensi

-3

-2

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

-1

0
S is a a n

HASIL
DIAGNOSA :
Sebaran
sisaan agak
menjulur ke
kanan

Plot Sisaan untuk:


Pemeriksaan Sebaran Normal
Plot sisaan terhadap peluang
Normal untuk :

Probability Plot of Sisaan


Normal - 95% CI
99

Mencocokkan apakah sebaran


sisaan merupakan sebaran
Normal atau tidak. Ya jika pola
tebaran membentuk garis lurus

95

Peluang normal

90
80
70
60
50
40
30

Hasil Diagnosa :
bisa dianggap lurus
menyebar Normal

20
10
5

-4

-3

-2

-1

0
1
Sisaan

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk:


Melihat Ketidakpasan Model
Plot SISAAN vs Y duga
Plot sisaan vs y_duga

40
30
20

sisaan

10
0
-10
-20

-30
-40
0

50

100
y_duga

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

150

200

Plot sisaan terhadap


y_duga masih berpola
(kuadratik)
Sisaan masih
mengandung
komponen kuadratik
Model belum pas
model harus ditambah
dg komponen kuadratik

Plot Sisaan untuk :


Pemeriksaan Asumsi MKT
Plot SISAAN vs Y duga
Pada tebaran sisaan terhadap nilai
dugaan Y dapat dilihat :
- Sisaan di sekitar nilai nol / tidak
nilai harapan
- Lebar pita sisaan sama atau tidak
untuk semua nilai dugaan
kehomogenan ragam
- Tebaran berpola atau tidak
ketidakpasan model
sisaan bebas atau tidak

Plot Sisaan vs y_duga


3

sisaan

-1

-2
7.0

7.5

8.0

8.5
y_duga

9.0

9.5

Kondisi Gauss-Markov

10.0

10.5

1. E[ i ] = 0

terpenuhi

2. E[ i ] = 2 tidak ter penuhi


2

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

3. E[ i j ] = 0, i j terpenuhi

Pola Tebaran Sisaan

terhadap Y
i
Pola tebaran sisaan memenuhi asumsi MKT:
berpusat di NOL, lebar pita sama, tidak berpola
Pola tebaran sisaan yang tidak memenuhi asumsi MKT:
Ragam tidak homogen (perlu analisis kuadrat terkecil terboboti; atau transformasi
thdp Y)
Penyimpangan terhadap persamaan
regresi bersifat sistematis; atau karena
tdk disertakannya 0 kedalam model
Model tidak pas (perlu suku-suku lain
dalam model atau transformasi thdp Y)
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Transformasi untuk :
Menghomogenkan Ragam
Transformasi terhadap peubah respon Y
Anggap : 2 = a b
1
Y
1
b = 3 Y* =
Y
b = 2 Y* = ln Y

jika b = 4 Y* =

b = 1 Y* = Y

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Setelah respon Y ditransformasi,


lakukan analisis regresi seperti biasa,
sisaan harus diperiksa lagi, jika masih
belum memenuhi asumsi, model
diubah, kemungkinan ada suku
nonlinier yg belum masuk model,
atau lakukan pendugaan dg MKT
terboboti.

Contoh Transformasi untuk


Menghomogenkan Ragam
Plot Sisaan vs Y duga data asli

Plot Sisaan vs

Y data transformasi Y*=

Residuals Versus theFittedValues

Residuals Versus the FittedValues

(response is Y)

(response is akar Y)
1,0

10

0,5

Residual

Residual

0,0

-0,5

-5
-1,0
-10
-1,5
5

10

15
FittedValue

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

20

25

2,5

3,0

3,5
4,0
Fitted Value

4,5

5,0

Plot Sisaan untuk:


Pemeriksaan Kebebasan Sisaan
Plot sisaan terhadap urutan
untuk :

Scatterplot of RESI1 vs urutan


2

Memeriksa apakah sisaan


bebas satu dengan lainnya
atau tidak. Bebas jika tdk
membentuk pola.

RESI1

-1

-2
0

6
urutan

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

10

12

Hasil Diagnosa :
Tebaran tidak membentuk
pola
Sisaan saling bebas

Pola Tebaran Sisaan


terhadap Urutan Waktu
Pengaruh waktu jangka panjang tidak
mempengaruhi data.

Pola tebaran sisaan yang menginformasikan bahwa pengaruh


waktu belum diperhitungkan
Ragam tidak homogen (perlu analisis kuadrat
terkecil terboboti)
Suatu suku linier dalam waktu harus
ditambahkan ke dalam model
Suku linier dan kuadratik dalam waktu perlu
ditambahkan ke dalam model

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk:


Pemeriksaan Pengaruh Waktu
Plot sisaan terhadap urutan
waktu yg jaraknya sama.

Scatterplot of RESI1 vs urutan


2

Perhatikan :
lebar pita sama/tidak
berpola/tidak

RESI1

Hasil Diagnosa :

-1

-2
0

6
urutan

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

10

12

Lebar pita sama homogen


Tebaran tidak membentuk pola
tidak perlu ditambahkan pengaruh waktu ke dalam model

Sisaan Terstandardkan
(Sisaan Terbakukan)
SISAAN TERBAKUKAN : ri

(
yi y i ) ei
=
=
s( yi y i )

Bisa digunakan untuk


memeriksa kebenaran
i menyebar N(0,1)

Sisaan akan memiliki


ragam yg relatif besar
jika xi di sekitar x

Pd sebaran Normal Baku peluang nilai ri


terletak antara -1,96 s.d 1,96 adalah
95%. | ri|>2 patut dicurigai

ragam(ei)= s2, kurang tepat


ragam(ei) = s2 (1- hii)

1 + ( x i x )2
ei
, hii = n
ri =
2
(
)

x
x
s (1 hii )
k
ei = sisaan amatan ke-i
n = banyaknya pengamatan
s2 = dugaan bagi ragam Yi KTsisaan
hii = unsur diagonal ke-i matriks H = X(XX)-1X

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Sisaan Terstandarkan (Sisaan Baku)


(lanjutan)
Plot Sisaan ei vs Dugaan Y

Plot Sisaan Baku ri vs Dugaan Y

Residuals Versus the Fitted Values

Scatterplot of SRES1 vs FITS1

(response is ln(y))
2

1,0

1
0,5

SRES1

Residual

0
0,0

-1
-2

-0,5

-3
-1,0
-4
1,0

1,2

1,4

1,6

1,8
2,0
Fitted Value

2,2

2,4

2,6

2,8

1,0

1,2

1,4

1,6

1,8
2,0
FITS1

2,2

2,4

Pola tebaran plot sisaan ei dan ri tidak berbeda.

2,6

pemeriksaan sisaan thdp pola tebaran, keduanya dapat digunakan


Itasia & Y Angraini Dep. Statistika FMIPA-IPB

2,8

Nilai PRESS
PRESS = Prediction Sum of Squares, adalah prosedur
yang merupakan kombinasi dari: semua kemungkinan regresi, analisis sisaan, dan teknik validasi.
Digunakan untuk mengukur validitas model.
PRESS = ( yi y i , i )

= (ei,-i )

yi

ei R2PRED=1 PRESS
=
2
1 h
( yi y)
i =1
ii
n

: nilai respon pada x=xi (data lengkap)


y i , i : nilai ramalan y pd x=xi yg diramal
melalui dugaan persamaan regresi
dari data tanpa amatan ke-i
Model valid jika memiliki PRESS yg kecil
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

R2pred adalah statistik lainnya yg berhub dg PRESS.


Model valid jika R2pred besar.

Nilai PRESS
PROSEDUR PRESS

(lanjutan)

Mis. k adalah banyaknya peubah dalam suatu persamaan regresi,


n adalah banyaknya amatan
Langkah-langkahnya:
1. Sisihkan amatan ke-1, amatan ke-1 tidak digunakan, data tinggal n-1.
2. Dugalah semua kemungkinan model regresi thdp n-1 data tersebut. (jika
k=1 banyaknya kemungkinan model hanya 1)
3. Ramal y1 dengan model yang didapat pd no.2. (lakukan untuk semua
kemungkinan model hanya 1 jika k=1)

4. Hitung perbedaan y1 yg disisihkan tadi dengan hasil no.3. y1 y1k


5. Ulangi langkah 1-4 dengan menyisihkan amatan ke-2, ke-3,...., ke-n.
Didapat
y 2 y 2 k , y3 y 3k , ..., y n y nk
n

6. Untuk setiap model regresi yang mungkin hitung : PRESS= ( yi yik )


i =1

7. Pilih model yang relatif memiliki nilai PRESS terkecil, dan melibatkan
peubah penjelas sedikit.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Nilai PRESS (lanjutan)


Contoh Proses PRESS, untuk n=11 dan k=1
Dugaan Garis Regresi dg Data
tanpa amatan ke-i

ramalan Yi
tnp amatan
ke-i

ei,-i

i,-i

7,46

10

Y tnp 1 = 3,01 + 0,505 X tnp 1

8,06

-0,6

0,36

6,77

Y tnp 2 = 3,05 + 0,497 X tnp 2

7,026

-0,256

0,06553

12,74

13

Y tnp 3 = 4,01 + 0,345 X tnp 3

8,495

4,245

18,02003

7,11

Y tnp 4 = 3,04 + 0,500 X tnp 4

7,54

-0,43

0,18490

7,81

11

Y tnp 5 = 2,95 + 0,514 X tnp 5

8,604

-0,794

0,63043

8,84

14

Y tnp 6 = 2,46 + 0,577 X tnp 6

10,538

-1,698

2,88320

6,08

Y tnp 7 = 2,97 + 0,502 X tnp 7

5,982

0,098

0,00960

5,39

Y tnp 8 = 2,72 + 0,526 X tnp 8

4,824

0,566

0,32035

8,15

12

Y tnp 9 = 2,84 + 0,528 X tnp 9

9,176

-1,026

1,05267

6,42

Y tnp 10 = 3,03 + 0,498 X tnp10

6,516

-0,096

0,00921

5,73

Y tnp 11 = 2,88 + 0,511 X tnp11

5,435

0,295

0,08703

kuadrat

Total = PRESS =
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

23,6229

Nilai PRESS
(lanjutan)
Output Minitab untuk data contoh tsb Hasil PRESS melalui proses
The regression equation is
Y = 3,00 + 0,500 X
Predictor
Constant
X

Coef
SE Coef
3,002
1,124
0,4997 0,1179

T
2,67
4,24

P
0,026
0,002

S = 1,23631 R-Sq = 66,6% R-Sq(adj) = 62,9%


PRESS = 23,6210 R-Sq(pred) = 42,70%
Analysis of Variance
Source
DF
SS
Regression
1 27,470
Residual Error 9 13,756
Total
10 41,226

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

MS
F
P
27,470 17,97 0,002
1,528

= hasil Minitab
Untuk k=1 hanya ada 1 model
Amatan ke-3 memberikan
simpangan ramalan terbesar
Amatan ke-3 dapat dipandang
sebagai amatan berpengaruh
Dugaan parameter regresi
tanpa amatan ke-3 sangat
berbeda dg lainnya dugaan
yg ini relatif yg benar/baik

Keluarkan amatan ke-3 dari analisis.


Cek nilai PRESS-nya. Cek nilai R2nya

Nilai PRESS
Output Minitab data lengkap
The regression equation is
Y = 3,00 + 0,500 X
Predictor
Constant
X

(lanjutan)

Output Minitab data tanpa amatan ke-3


The regression equation is
Y tnp 3 = 4,01 + 0,345 X tnp 3

Coef
SE Coef
3,002 1,124
0,4997 0,1179

T
P
2,67 0,026
4,24 0,002

Predictor
Coef
SE Coef
T
Constant 4,00619 0,00221 1811,78
X tnp 3
0,345334 0,000237 1454,74

P
0,000
0,000

S = 1,23631 R-Sq = 66,6%

S = 0,00308655 R-Sq = 100,0

PRESS = 23,6210 R-Sq(pred) = 42,70%

PRESS = 0,000174853 R-Sq(pred) = 100,00%

Analysis of Variance
Source
DF
SS
Regression
1 27,470
Residual Error 9 13,756
Total
10 41,226

Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 20,161 20,161 2116264,34 0,000
Residual Error 15
0,000 0,000
Total
16 20,161

MS
F
P
27,470 17,97 0,002
1,528

Menyisihkan amatan ke-3 mempengaruhi dugaan parameter, menurunkan nilai PRESS


Dari sisi model, persamaan tanpa amatan ke-3 yg terbaik.
R-Sq(pred)=100,00% model sangat valid PELUANG salah memprediksi = 0
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Nilai PRESS

(lanjutan)

Dugaan garis regresi dg data lengkap Dugaan garis regresi tanpa amatan ke-3
PRESS = 23,6210

R-Sq(pred) = 42,70%

PRESS = 0,000174853

R-Sq(pred) = 100,0%

Fitted Line Plot

Fitted Line Plot

Y = 3,002 +0,4997 X

Y tnp 3 = 4,006 + 0,3453 X tnp 3

13

12
11

Y tnp 3

10
Y

9
8

6
5
4

5
5,0

7,5

10,0
X

12,5

15,0

5,0

7,5

10,0
X tnp 3

12,5

Semakin kecil nilai PRESS-nya model semakin valid semakin baik untuk
memprediksi. Setiap 1 model regresi thdp 1 set data memiliki 1 nilai PRESS
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

15,0

Pencilan
Pencilan adalah pengamatan yang nilai mutlak sisaannya jauh lebih besar daripada sisaan-sisaan lainnya

Bisa jadi terletak pada tiga atau empat simpangan


baku atau lebih jauh lagi dari rata-rata sisaannya.

Keberadaan pencilan harus diperiksa dengan


seksama, apakah pencilan itu merupakan kesalahan
dalam pencatatan amatan atau pencilan tersebut
muncul dari kombinasi keadaan yang tidak biasa
yang mungkin saja sangat penting dan perlu
diselidiki lebih jauh.

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pencilan
(lanjutan)
Plot antara Sisaan ei vs dugaan Yi

Plot antara Sisaan ri vs dugaan Yi

Scatterplot of Sisaan baku-2 vs dugaan-Y2

Scatterplot of sisaan2 vs dugaan-Y2

2
sisaan2

Sisaan baku-2

-1

-1
5

8
dugaan-Y2

10

8
dugaan-Y2

Dugaan persamaan regresi Y = 3.00 + 0.500 X dgn R-Sq = 66.6%


Pola tebaran sisaan thdp ei dan ri sama
Ada sisaan yang nilainya sangat besar potensi sebagai pencilan
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

10

Pencilan
(lanjutan)

MENDETEKSI PENCILAN

Hitung nilai
dengan

ei
ri =
s (1 hii )

hii =

1
n

( x i x )2
n

(xk x )
i =1

Jika nilai |ri|>2, amatan tsb


dapat dikatakan sebagai
pencilan
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Yi

Xi

ri

7.46

10 -0.46018

6.77

8 -0.19633

12.74

13

2.99999

7.11

9 -0.33085

7.81

11 -0.59695

8.84

14 -1.13497

6.08

0.07042

5.39

0.3807

8.15

12 -0.75518

6.42

7 -0.06974

5.73

0.21188

Pencilan (lanjutan)
DATA LENGKAP

DATA TANPA PENCILAN


Scatterplot of Y tnp pclan vs X tnp pclan
13

12

12

11

11

10

10

Y tnp pclan

Y-3

Scatterplot of Y-3 vs X-3


13

9
8

9
8

6
5

5
5,0

7,5

10,0

12,5

15,0

5,0

7,5

X-3

Coef
3.002
0.4997

S = 1.23631

SE Coef
1.124
0.1179

12,5

Y = 4.01 + 0.345 X

Y = 3.00 + 0.500 X
Predictor
Constant
X

10,0
X tnp pclan

T
P
2.67 0.026
4.24 0.002

R-Sq = 66.6%

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Predictor
Constant
X

Coef
4.00565
0.345390

S = 0.00308168

SE Coef
0.00292
0.000321

P
0.000
0.000

R-Sq = 100.0%

15,0

Pencilan (lanjutan)
Plot sisaan baku (ri) vs dugaan Y
Data Lengkap

Data Tanpa Pencilan

Scatterplot of sisaan2 vs dugaan-Y2

Scatterplot of s baku tnp pcl vs dugaan tnppcl


2.0

3
1.5
1.0
s baku tnp pcl

sisaan2

0.5
0.0
-0.5

-1.0
-1
-1.5
5

dugaan-Y2

Tebaran berpola, karena (1) ada


pencilan, atau (2) model tidak pas

10

7
dugaan tnppcl

Tebaran tidak berpola, menyebar di sekitar nilai nol, lebar pita relatif sama

Mengeluarkan data pencilan dari analisis:


mampu memperbaiki pola tebaran sisaan yang tadinya berpola (garis lurus)
harus dilakukan dengan kehati-hatian yang tinggi.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Amatan Berpengaruh
AMATAN BERPENGARUH :
berkaitan dengan besarnya perubahan yang terjadi pada
dugaan parameter regresi jika pengamatan tersebut disisihkan
X1

1,2 1,2 1,2 1,3 1,3 1,3 1,4 1,4 1,4 1,5 1,5 1,5 1,6 1,6 1,6

4,0

Y1 2,11 1,39 0,78 2,02 2,46 3,67 2,56 1,74 1,88 5,15 2,41 2,00 3,56 3,09 0,78 4,29 3,33 3,10 15,00

Unusual Observations

Scatterplot of Y1 vs X1
16
14

Obs X1
Y1
Fit
10 1,40 5,147 2,895
15 1,50 0,776 3,345
19 4,00 15,000 14,576

12

Y1

10
8
6

SE Fit
0,244
0,243
1,009

Residual
2,252
-2,569
0,424

St Resid
2,19 R
-2,50 R
1,34 X

4
2
0
1,0

1,5

2,0

2,5
X1

3,0

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

3,5

4,0

R denotes an observation with a large standardized residual.


X denotes an observation whose X value gives it large
influence.

Amatan Berpengaruh
(lanjutan)
OUTPUT MINITAB
The regression equation is

Y1 = - 3,39 + 4,49 X1
S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1%
Analysis of Variance
Source
DF
SS
Regression
1
150,10
Residual Error 17
19,01
Total
18 169,11
Unusual Observations
Obs X1
Y1
Fit
10
1,40 5,147 2,895
15
1,50 0,776 3,345
19
4,00 15,000 14,576

MS
150,10
1,12

SE Fit
0,244
0,243
1,009

F
P
134,22 0,000

Residual
2,252
-2,569
0,424

St Resid
2,19 R
-2,50 R
1,34 X

R denotes an observation with a large standardized residual.


X denotes an observation whose X value gives it large influence.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Hasil analisis regresi dari


data tersebut menunjukkan
bahwa ada 3 amatan yg
aneh, yaitu amatan ke
10,15, dan 19. Amatan 10
dan 15 berpotensi sebagai
pencilan. Amatan 19
berpotensi sebagai amatan
berpengaruh
Bandingkan dg data tanpa
amatan 19. Apakah
perubahan dugaan parameter regresi cukup nyata?

Amatan Berpengaruh
(lanjutan)

Penyisihan pengamatan berpengaruh mengubah


secara berarti dugaan persamaan regresi
Analisis Regresi thdp Data Lengkap

An Regresi thdp Data Tanpa Amatan 19

The regression equation is

The regression equation is

Y1 = - 3,39 + 4,49 X1

Y1 = - 1,26 + 2,88 X1

S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1%

S = 1,03065 R-Sq = 25,4% R-Sq(adj) = 20,8%

Analysis of Variance
Source
DF
SS
Regression
1 150,10
Residual Error 17 19,01
Total
18 169,11

Analysis of Variance
Source
DF
SS
Regression
1
5,797
Residual Error 16 16,996
Total
17 22,793

MS
150,10
1,12

F
P
134,22 0,000

Unusual Observations
Obs X1
Y1
Fit
SE Fit Resid St Resid
10 1,40 5,147 2,895 0,244 2,252 2,19 R
15 1,50 0,776 3,345 0,243 -2,569 -2,50 R
19 4,00 15,000 14,576 1,009 0,424 1,34 X
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

MS
F
P
5,797 5,46 0,033
1,062

Unusual Observations
Obs
X1
Y1
Fit SE Fit Resid St Resid
10 1,40 5,147 2,764 0,256 2,383
2,39 R
15 1,50 0,776 3,052 0,318 -2,276 -2,32 R

Amatan Berpengaruh
(lanjutan)
Dugaan Garis Regresi Data Lengkap

Dugaan Grs Regresi Data Tnp Amatan 19

Fitted Line Plot

Fitted Line Plot

Y1 = - 3,394 + 4,493 X1

Y1 tnp amatan 19 = - 1,265 + 2,878 X1 tnp amatan 19


16

14

14

12

12

Y1 tnp amatan 19

16

Y1

10
8
6
4

10
8
6
4

0
1,0

1,5

2,0

2,5
X1

3,0

3,5

4,0

1,0

1,5

2,0
2,5
X1 tnp amatan 19

3,0

3,5

Penyisihan AMATAN BERPENGARUH menyebabkan perubahan dugaan kemiringan


garis. BERBAHAYA, apabila pemanfaatan hasil analisis regresi bertumpu pada
pemaknaan parameter
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

4,0

Amatan Berpengaruh
(lanjutan)

Statistik Uji untuk Mendeteksi Amatan Berpengaruh


Pengaruh titik data ke-i diukur dengan jarak :

ei
Di =
1
2
(
)
1

s
h
ii

hii 1

1 hii p

Keterangan:
s2 = dugaan bagi ragam Yi = KTsisaan
hii = unsur diagonal ke-i matriks H = X(XX)-1X
Nilai Di dibandingkan dengan F (p,n-p; 1-). Dengan n = banyaknya
pengamatan dan p = banyaknya parameter
Di > F (p,n-p;1-). menandakan bahwa amatan ke-i berpengaruh.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB

X (i)

Y (i)

e (i)

r (i)

D (i)

2,11

1,01

1,00

0,30

1,39

0,30

0,29

0,09

0,78

-0,32

-0,32

-0,09

1,2

2,02

0,02

0,02

0,01

1,2

2,46

0,46

0,45

0,11

1,2

3,67

1,68

1,64

0,45

1,3

2,56

0,11

0,11

0,03

1,3

1,74

-0,71

-0,69

-0,17

1,3

1,88

-0,56

-0,55

-0,13

1,4

5,15

2,25

2,19

0,59

1,4

2,41

-0,49

-0,47

-0,11

1,4

2,00

-0,90

-0,87

-0,21

1,5

3,56

0,21

0,21

0,05

1,5

3,09

-0,26

-0,25

-0,06

1,5

0,78

-2,57

-2,50

-0,72

1,6

4,29

0,50

0,49

0,11

1,6

3,33

-0,47

-0,45

-0,11

1,6

3,10

-0,70

-0,68

-0,16

15,00

0,42

1,34

4,40

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Amatan Berpengaruh
CONTOH PENGGUNAAN Di

(lanjutan)

Dugaan persamaan regresi DATA LENGKAP


: Y1 = - 3,39 + 4,49 X1
Banyaknya parameter = 2 p = 2
Banyaknya pengamatan = 19 n = 19
Pengamatan ke -19 memiliki nilai D19 = 4,40
Dengan = 5%
Nilai tabel F(p,n-p; 1-) = F (2,17; 0,95) = 3,59
D19 > F (2,17; 0,95)
Dengan = 5%, amatan ke 19 (terakhir)
merupakan amatan berpengaruh.

Amatan Berpengaruh
(lanjutan)

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Anda mungkin juga menyukai