Pokok Bahasan:
Pendahuluan
Penduga Metode
Kuadrat Terkecil
Sensitif
Pencilan
Salah satu solusi
Regresi
Kekar
Definisi Pencilan
Pencilan adalah pengamatan yang nilai mutlak
sisaan-nya jauh lebih besar daripada sisaansisaan lainnya
Bisa jadi terletak pada tiga atau empat
simpangan baku atau lebih jauh lagi dari ratarata sisaannya.
Pendeteksian Pencilan
1. Standardized Residual
ei
s 1 hii
dengan
Keterangan:
2 ei = yi i
s = Standar Deviasi Sisaan
hii
1
n
xi x 2
n
xk x 2
i 1
2. Leverages dengan
hii 2 p / n
Penduga-M
(e ) ( y
i 1
i 1
x i ' b)
Lanjutan
Adapun sifat dari fungsi objektif
adalah:
(e) 0
(0) = 0
(e) = (-e)
(ei) (ei) untuk ei ei
Lanjutan
Penduga M
i 1
i 1
Dapat
ditulis
misalka
n
i 1
Persamaan ini
hanya dapat
diselesaikan
dengan IRLS
(Iterative
Reweight Least
Square)
Algoritma IRLS
1
(0)
dengan MKT
Pemilihan penduga awal
2
( j)
( j 1)
W ( j 1) diag wi( j 1)
X tW ( j 1)Y
Huber
2 / 2
Fungsi Objektif H ( )
2
c c / 2
untuk c
untuk c
( )
dengan fungsi pengaruh
untuk c
c
H ( )
untuk c
c
untuk c
Fungsi Penimbang
1
c/ | |
wH ( )
untuk c
untuk c
0.5
-3c
3c
Lanjutan
Bisquare/Tukey
1 (1
6
c
PBW ( )
c2
Fungsi Objektif
dengan
1 (1
( )
c
Fungsi Penimbang
w( )
untuk c
untuk c
untuk c
untuk c
1 (1
untuk c
untuk c
-1
-0.5
0.5
w()
-1
-0.5
0.5
Penerapan Teori
Gambar disamping
adalah tebaran data
dari populasi yang
persamaan garis
regresinya adalah
y 3 2x
y=3.91+1.76x
sedangkan model populasi kita adalah
R-Sq = 57.0%
R-Sq(adj) = 56.1%
Analysis of Variance
y 3 2x
Bias yang dihasilkan dari model ini
adalah
Bias(0)=0.91
Bias(1)=0.24
R2 =57%
R2(adj)=56.1
%
Source
DF
SS
MS
F
P
Regression
1 308.56 308.56 63.61 0.000
Residual Error 48 232.82 4.85
Total
49 541.38
Unusual Observations
Obs
X
Y
Fit SE Fit Residual St Resid
1 1.00 16.000 5.666 0.539 10.334
4.84R
29 3.00 15.000 9.179 0.311
5.821
2.67R
34 4.00 5.000 10.935 0.381 -5.935
-2.74R
Plot Sisaan..
Plot : Residual vs Order of the
Data
y 3 2x
R2 =71.7%
Parameter Estimates
Model Information
Data Set
WORK.DATA
Dependent Variable
y
Number of Independent Variables
1
Number of Observations
50
Method
M
Estimation
Observation
Type
Proportion
Outlier
0.0800
Cutof
3.0000
Goodness-of-Fit
Statistic
Value
R-Square
0.7170
AICR
67.2285
BICR
71.9790
Deviance
60.1347
Kesimpulan
Contoh
PENERAPAN
TEORI
Diketahui data ramalan
tanaman padi sawah
populasi Sulawesi
Tenggara
2
NO
TAHU
N
LUAS TANAMAN
AKHIR
AGUSTUS
(HA)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
21354
25069
20912
20020
13552
4353
4727
1820
2552
2389
2171
2118
3514
5553
6551
9819
10141
10023
11587
15936
14053
13761
17548
17710
LUAS PANEN
SEPTEMBERDESEMBER (HA)
9492
17345
9620
1934
7147
3666
2452
3103
3612
3394
2975
2745
2571
5384
6981
10834
12787
12549
12691
18264
15541
15904
26408
20819
Model
R-Sq
R-Sq (adj)
y = 2545 + 0.657 x
4199
54.00%
y = 2353 + 0.684 x
3854
58.2%
56.3%
y = 2266 + 0.700 x
3716
60.3%
58.5%
y = 2220 + 0.709 x
3659
61.3%
59.6%
y = 2196 + 0.714 x
3634
61.9%
60.1%
y = 2184 + 0.717 x
3623
62.1%
60.4%
y = 2177 + 0.719 x
3618
62.3%
60.6%
y = 2174 + 0.720 x
3616
62.3%
60.6%
y = 2172 + 0.720 x
3615
62.4%
60.7%
10
y = 2171 + 0.720 x
3614
62.4%
60.7%
11
y = 2171 + 0.720 x
3614
62.4%
60.7%
12
y = 2170 + 0.721 x
3614
13
y = 2170 + 0.721 x
3614
62.4%
62.4%
51.90%
60.7%
60.7%