Anda di halaman 1dari 11

Pencilan

“Pencilan adalah pengamatan yang nilai mutlak sisaan-


nya jauh lebih besar daripada sisaan-sisaan lainnya”

 Bisa jadi terletak pada tiga atau empat simpangan baku


atau lebih jauh lagi dari rata-rata sisaannya.

 Keberadaan pencilan harus diperiksa dengan seksama,


apakah pencilan itu merupakan kesalahan dalam pencatatan
amatan atau pencilan tersebut muncul dari kombinasi
keadaan yang tidak biasa yang mungkin saja sangat penting
dan perlu diselidiki lebih jauh.

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


Pencilan
(lanjutan)

Plot antara Sisaan ei vs dugaan Yi Plot antara Sisaan ri vs dugaan Yi


Scatterplot of Sisaan baku-2 vs dugaan-Y2 Scatterplot of sisaan2 vs dugaan-Y2

3
3

2
2
Sisaan baku-2

sisaan2
1
1

0 0

-1 -1

5 6 7 8 9 10 5 6 7 8 9 10
dugaan-Y2 dugaan-Y2

• Dugaan persamaan regresi Y = 3.00 + 0.500 X dgn R-Sq = 66.6%


• Pola tebaran sisaan thdp ei dan ri sama
• Ada sisaan yang nilainya sangat besar  potensi sebagai pencilan

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


Pencilan
(lanjutan)

MENDETEKSI PENCILAN Yi Xi ri
7.46 10 -0.46018
ei
• Hitung nilai ri  6.77 8 -0.19633

s 1  hii  12.74 13 2.99999


7.11 9 -0.33085
 x i  x 2 7.81 11 -0.59695
dengan hii  1
n  n 8.84 14 -1.13497
 xk  x  2
6.08 6 0.07042
i 1
5.39 4 0.3807
• Jika nilai |ri|>2, amatan tsb 8.15 12 -0.75518

dapat dikatakan sebagai 6.42 7 -0.06974

pencilan 5.73 5 0.21188

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


Pencilan (lanjutan)
DATA LENGKAP DATA TANPA PENCILAN
Scatterplot of Y-3 vs X-3 Scatterplot of Y tnp pclan vs X tnp pclan
13 13

12 12

11 11

10 10

Y tnp pclan
Y-3

9 9

8 8

7 7

6 6

5 5
5,0 7,5 10,0 12,5 15,0 5,0 7,5 10,0 12,5 15,0
X-3 X tnp pclan

Y = 3.00 + 0.500 X Y = 4.01 + 0.345 X


Predictor Coef SE Coef T P Predictor Coef SE Coef P
Constant 3.002 1.124 2.67 0.026 Constant 4.00565 0.00292 0.000
X 0.4997 0.1179 4.24 0.002 X 0.345390 0.000321 0.000

S = 1.23631 R-Sq = 66.6% S = 0.00308168 R-Sq = 100.0%


Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Pencilan (lanjutan)
Plot sisaan baku (ri) vs dugaan Y
Data Lengkap Data Tanpa Pencilan
Scatterplot of sisaan2 vs dugaan-Y2 Scatterplot of s baku tnp pcl vs dugaan tnppcl
2.0
3
1.5

2 1.0

s baku tnp pcl


0.5
sisaan2

1
0.0

0 -0.5

-1.0
-1
-1.5
5 6 7 8 9 10 5 6 7 8 9
dugaan-Y2 dugaan tnppcl

Tebaran berpola, karena (1) ada Tebaran tidak berpola, menyebar di se-
pencilan, atau (2) model tidak pas kitar nilai nol, lebar pita relatif sama
Mengeluarkan data pencilan dari analisis:
• mampu memperbaiki pola tebaran sisaan yang tadinya berpola (garis lurus)
• harus dilakukan dengan kehati-hatian yang tinggi.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Amatan Berpengaruh

AMATAN BERPENGARUH :
berkaitan dengan besarnya perubahan yang terjadi pada
dugaan parameter regresi jika pengamatan tersebut disisihkan
X1 1 1 1 1,2 1,2 1,2 1,3 1,3 1,3 1,4 1,4 1,4 1,5 1,5 1,5 1,6 1,6 1,6 4,0
Y1 2,11 1,39 0,78 2,02 2,46 3,67 2,56 1,74 1,88 5,15 2,41 2,00 3,56 3,09 0,78 4,29 3,33 3,10 15,00

Unusual Observations
Scatterplot of Y1 vs X1
16

14

12 Obs X1 Y1 Fit SE Fit Residual St Resid


10 10 1,40 5,147 2,895 0,244 2,252 2,19 R
8 15 1,50 0,776 3,345 0,243 -2,569 -2,50 R
Y1

6 19 4,00 15,000 14,576 1,009 0,424 1,34 X


4

2 R denotes an observation with a large standardized residual.


0 X denotes an observation whose X value gives it large
1,0 1,5 2,0 2,5 3,0 3,5 4,0
X1 influence.

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


Amatan Berpengaruh
(lanjutan)
OUTPUT MINITAB
The regression equation is
Hasil analisis regresi dari
Y1 = - 3,39 + 4,49 X1 data tersebut menunjukkan
S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1% bahwa ada 3 amatan yg
aneh, yaitu amatan ke
Analysis of Variance
Source DF SS MS F P
10,15, dan 19. Amatan 10
Regression 1 150,10 150,10 134,22 0,000 dan 15 berpotensi sebagai
Residual Error 17 19,01 1,12 pencilan. Amatan 19
Total 18 169,11 berpotensi sebagai amatan
Unusual Observations berpengaruh
Obs X1 Y1 Fit SE Fit Residual St Resid
10 1,40 5,147 2,895 0,244 2,252 2,19 R
15 1,50 0,776 3,345 0,243 -2,569 -2,50 R Bandingkan dg data tanpa
19 4,00 15,000 14,576 1,009 0,424 1,34 X amatan 19. Apakah
R denotes an observation with a large standardized residual. perubahan dugaan para-
X denotes an observation whose X value gives it large influence. meter regresi cukup nyata?

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


Amatan Berpengaruh
(lanjutan)
Penyisihan “pengamatan berpengaruh” mengubah
secara berarti dugaan persamaan regresi
Analisis Regresi thdp Data Lengkap An Regresi thdp Data Tanpa Amatan 19
The regression equation is The regression equation is
Y1 = - 3,39 + 4,49 X1 Y1 = - 1,26 + 2,88 X1
S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1% S = 1,03065 R-Sq = 25,4% R-Sq(adj) = 20,8%

Analysis of Variance Analysis of Variance


Source DF SS MS F P Source DF SS MS F P
Regression 1 150,10 150,10 134,22 0,000 Regression 1 5,797 5,797 5,46 0,033
Residual Error 17 19,01 1,12 Residual Error 16 16,996 1,062
Total 18 169,11 Total 17 22,793

Unusual Observations Unusual Observations


Obs X1 Y1 Fit SE Fit Resid St Resid Obs X1 Y1 Fit SE Fit Resid St Resid
10 1,40 5,147 2,895 0,244 2,252 2,19 R 10 1,40 5,147 2,764 0,256 2,383 2,39 R
15 1,50 0,776 3,345 0,243 -2,569 -2,50 R 15 1,50 0,776 3,052 0,318 -2,276 -2,32 R
19 4,00 15,000 14,576 1,009 0,424 1,34 X

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


Amatan Berpengaruh
(lanjutan)

Dugaan Garis Regresi Data Lengkap Dugaan Grs Regresi Data Tnp Amatan 19

Fitted Line Plot Fitted Line Plot


Y1 = - 3,394 + 4,493 X1 Y1 tnp amatan 19 = - 1,265 + 2,878 X1 tnp amatan 19
16 16

14 14

12 12

Y1 tnp amatan 19
10
10
8
Y1

8
6
6
4
4
2
2
0
1,0 1,5 2,0 2,5 3,0 3,5 4,0 1,0 1,5 2,0 2,5 3,0 3,5 4,0
X1 X1 tnp amatan 19

Penyisihan AMATAN BERPENGARUH menyebabkan perubahan dugaan kemiringan


garis.  BERBAHAYA. Apabila pemanfaatan hasil analisis regresi bertumpu pada
pemaknaan parameter

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


Amatan Berpengaruh
(lanjutan)

Statistik Uji untuk Mendeteksi Amatan Berpengaruh


Pengaruh titik data ke-i diukur dengan jarak :
2 2
 ei   hii  1
Di   1   
 s 1  h ii  2
 1  hii  p
Keterangan:
s2 = dugaan bagi ragam Yi = KTsisaan
hii = unsur diagonal ke-i matriks H = X(X’X)-1X’
Nilai Di dibandingkan dengan F (p,n-p; 1-α). Dengan n = banyaknya
pengamatan dan p = banyaknya parameter
Di > F (p,n-p;1-α). menandakan bahwa amatan ke-i berpengaruh.

Itasia & Y Angraini Dep. Statistika FMIPA-IPB


X (i)

1
Y (i)

2,11
e (i)

1,01
r (i)

1,00
D (i)

0,30
Amatan Berpengaruh
1 1,39 0,30 0,29 0,09 (lanjutan)
1 0,78 -0,32 -0,32 -0,09 CONTOH PENGGUNAAN Di
1,2 2,02 0,02 0,02 0,01
1,2 2,46 0,46 0,45 0,11 Dugaan persamaan regresi DATA LENGKAP
1,2 3,67 1,68 1,64 0,45 : Y1 = - 3,39 + 4,49 X1
1,3 2,56 0,11 0,11 0,03
1,3 1,74 -0,71 -0,69 -0,17 Banyaknya parameter = 2  p = 2
1,3 1,88 -0,56 -0,55 -0,13 Banyaknya pengamatan = 19  n = 19
1,4 5,15 2,25 2,19 0,59
1,4 2,41 -0,49 -0,47 -0,11 Pengamatan ke -19 memiliki nilai D19 = 4,40
1,4 2,00 -0,90 -0,87 -0,21
1,5 3,56 0,21 0,21 0,05 Dengan α = 5%
1,5 3,09 -0,26 -0,25 -0,06 Nilai tabel F(p,n-p; 1-α) = F (2,17; 0,95) = 3,59
1,5 0,78 -2,57 -2,50 -0,72
1,6 4,29 0,50 0,49 0,11 D19 > F (2,17; 0,95)
1,6 3,33 -0,47 -0,45 -0,11
1,6 3,10 -0,70 -0,68 -0,16 Dengan α = 5%, amatan ke 19 (terakhir)
4 15,00 0,42 1,34 4,40 merupakan amatan berpengaruh.

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Anda mungkin juga menyukai