Modul Analisis Regresi PDF

Anda mungkin juga menyukai

Anda di halaman 1dari 61

ANALISIS REGRESI

Analisis regresi adalah analisis statistika yang bertujuan untuk


memodelkan hubungan antara variabel independent dengan variabel
dependent. Istilah regresi pertamakali dikenalkan oleh Francis Galton (1886)
melalui artikelnya yang berjudul Regression Towards Mediocrity In Hereditary
Stature, di dalam artikel ini Galton mengkaji hubungan antara tinggi badan
anak dengan tinggi badan orang tua. Dari hasil kajian ini diperoleh informasi
adanya hubungan antara tinggi badan anak dengan tinggi orang-tuanya.
Model yang menggambarkan hubungan antara variabel independent (X)
dengan variabel dependent (Y) adalah :
Y= f(X,) + 


1
Hubungan antara variabel independent dengan variabel dependent
dikatakan linear jika dapat dinyatakan dalam model :
Y = 
X1 + X2 +…+pXp + 

Dalam catatan matriks, model regresi linear dapat ditulis dalam :
Y =X


atau
Y1  
 1 X 11 ... X p1 0   1 
   

1 X 21 ... X 2 p  
1  2 

Y2  
 
  
...  
 ... ... ... ...  ... 
  
 

Yn  1 X n1 X np 

p  n 

Nilai  dapat ditaksir dengan menggunakan metode kuadrat terkecil


dengan cara :
ˆ( X ' X ) 1 ( X ' Y )

ˆ

ˆ
0
n

x 1 ... x p 

y 
 
ˆ
2 
( X ' X ) 
x1 x 2
1 ... x x
1 p
( X 'Y )  x1 y 
...   ...   ... 
     
ˆ

 p x p[

 x x1 p x 2p 
 
x p y 

Pengujian terhadap 
dapat dilakukan dengan dua cara yaitu pengujian
secara serentak dan pengujian secara individu.
Pengujian secera serentak
Hipotesis :
H0 : 

H1 : 


2
Statistik Uji
Sumber df Sum of MS F
Variasi Squares
Regresi p (YˆY ) 2
(YˆY ) 2
/p MS . Re gresi
MS . Re sidual
Residual n-p-1 (Y Yˆ) 2
(Y Yˆ) /(n p 1)
2

Total n-1 (Y Y ) 2

Tolak Ho jika F>F,p,n-p-1


Pengujian secara individu
Hipotesis
H0 : I = 0
H1 : I 0
Statistik uji

ˆ
t  i
s ˆ
i

Tolak H0 jika |t|>tn-p-1

Kegiatan Praktikum
Tentukan model yang menggambarkan hubungan antara harapan hidup
perempuan (Y) dengan pendapatan per-kapita dan kepadatan penduduk yang
dinyatakan dalam :
Y = 

ln(gdp_cap) + 
ln(density) + 
Penyelesaian :
a. Melakukan transformasi ln(gdp_cap) dan ln(density) dengan cara : [klik
transform+ compute]

3
4
b. Melakukan analisis regresi ;[klik+analyze+regression+linear]

dan hasilnya adalah :

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .840a .706 .700 5.788
a. Predictors: (Constant), ln_gdp, ln_dens

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 8519.080 2 4259.540 127.141 .000a
Residual 3551.268 106 33.503
Total 12070.349 108
a. Predictors: (Constant), ln_gdp, ln_dens
b. Dependent Variable: Average female life expectancy

5
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 17.981 3.501 5.136 .000
ln_dens .904 .388 .123 2.332 .022
ln_gdp 6.150 .390 .831 15.766 .000
a. Dependent Variable: Average female life expectancy

Seluruh nilai sig.<5% sehingga harapan hidup perempuan dipengaruhi (Y)


oleh kepadatan penduduk dan pendapatan per-kapita yang dinyatakan dalam
model :
Y= 17.981 +0.904 ln(density) +6.150 ln(gdp_cap)

6
PEMILIHAN MODEL TERBAIK

Salah satu tujuan di dalam analisis regresi adalah untuk mendapatkan


model terbaik yang menjelaskan hubungan antara variabel independent
dengan variabel dependent, model terbaik adalah model yang seluruh
koefisien regresinya berarti (significant) dan mempunyai kriteria model terbaik
optimum. Beberapa kriteria model terbaik adalah :

Nomor Kriteria Formula Optimum


1 SSE (Y Yˆ) 2 Minimum

2 MSE (Y Yˆ) /(n p 1)


2 Minimum

3 R2 (YˆY ) 2

100%
Maksimum

(Y Y ) 2

4 Adjusted (n 1) Maksimum


1 [1 R 2 ]
R2 (n p )

5 Cp Mallow SSE Minimum


(n 2 p )
MSE
6 AIC ln(SSE/n) +2p/n Minimum
7 SBC ln(SSE/n)+p/n ln(n) Minimum

7
Untuk memperoleh model terbaik, ada beberapa metode yang biasa
digunakan yaitu :

Metode Penjelasan
Backward Mulai dengan model lengkap, kemudian variabel independent
yang ada dievaluasi, jika ada yang tidak significant dikeluarkan
yang paling tidak significant, dilakukan terus menerus sampai
tidak ada lagi variabel independent yang tidak significant
Forward Variabel independent yang pertama kali masuk ke dalam model
adalah variabel yang mempunyai korelasi tertinggi dan
significant dengan variabel dependent, variabel yang masuk
kedua adalah variabel yang korelasinya dengan variabel
dependent adalah tertinggi kedua dan masih significant,
dilakukan terus menerus sampai tidak ada lagi variabel
independent yang significant
StepSwise Gabungan antara metode forward dan backward, variabel yang
pertama kali masuk adalah variabel yang korelasinya tertinggi
dan significant dengan variabel dependent, variabel yang masuk
kedua adalah variabel yang korelasi parsialnya tertinggi dan
masih significant, setelah variabel tertentu masuk ke dalam
model maka variabel lain yang ada di dalam model dievaluasi,
jika ada variabel yang tidak significant maka variabel tersebut
dikeluarkan
Best subset Metode ini tersedia di dalam program paket MINITAB. Metode
regression ini menyajikan k buah model terbaik untuk model dengan
1,
2,…,
pvar
iabelindependent.

8
Kegiatan Praktikum
Tentukan model terbaik yang menggambarkan hubungan antara harapan
hidup perempuan (lifeexpf) dengan pendapatan perkapita (gdp_cap),
persenta-se penduduk yang tinggal dikota (urban), persentase penduduk yang
dapat membaca (literacy), banyaknya kematian per 1000 penduduk (death_rt).
rata-rata banyaknya anak (fertility), konsumsi makanan per-hari (calories)
dengan menggunakan metode stepwise dan best subset regression.
Penyelesaian :
Dengan bantuan SPSS permasalahan di atas dapat diselesaikan
dengan cara : [klik analyze+regression+linear]

atau melalui syntax :


REGRESSION
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT lifeexpf
/METHOD=STEPWISE gdp_cap calories literacy urban death_rt .
dan hasilnya adalah :

9
ANOVA

Sum of
Model Squares df Mean Square F Sig.
1 Regression 7229.894 1 7229.894 222.690 .000
Residual 2337.565 72 32.466
Total 9567.459 73
2 Regression 8206.309 2 4103.154 214.028 .000
Residual 1361.150 71 19.171
Total 9567.459 73
3 Regression 8906.744 3 2968.915 314.544 .000
Residual 660.716 70 9.439
Total 9567.459 73
4 Regression 9017.788 4 2254.447 282.999 .000
Residual 549.672 69 7.966
Total 9567.459 73

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .869a .756 .752 5.698
2 .926b .858 .854 4.378
3 .965c .931 .928 3.072
4 .971d .943 .939 2.822
a. Predictors: (Constant), People who read (%)
b. Predictors: (Constant), People who read (%), Death
rate per 1000 people
c. Predictors: (Constant), People who read (%), Death
rate per 1000 people, Gross domestic product / capita
d. Predictors: (Constant), People who read (%), Death
rate per 1000 people, Gross domestic product / capita,
Daily calorie intake

10
Coefficients a

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 36.226 2.275 15.924 .000
People who read (%) .430 .029 .869 14.923 .000
2 (Constant) 53.279 2.961 17.995 .000
People who read (%) .330 .026 .667 12.606 .000
Death rate per 1000
-.966 .135 -.378 -7.137 .000
people
3 (Constant) 62.740 2.350 26.699 .000
People who read (%) .192 .024 .389 7.890 .000
Death rate per 1000
-1.211 .099 -.474 -12.214 .000
people
Gross domestic
.001 .000 .363 8.614 .000
product / capita
4 (Constant) 54.214 3.143 17.252 .000
People who read (%) .172 .023 .347 7.456 .000
Death rate per 1000
-1.136 .093 -.444 -12.178 .000
people
Gross domestic
.000 .000 .252 5.170 .000
product / capita
Daily calorie intake .004 .001 .186 3.734 .000
a. Dependent Variable: Average female life expectancy

Sehingga model terbaiknya adalah :


lifeexpf = 54.214 +0.172 literacy –1.136 death_rt + 0.000 gdp_cap +0.004
calori dengan R2= 0.943
Dengan menggunakan best subset regression :[klik stat+regression+best
subset]

11
diperoleh hasil :
Response is LIFEEXPF

L C D
I G A E
T D L A
U E P O T
R R _ R H
B A C I _
A C A E R
Vars R-Sq R-Sq(adj) C-p S N Y P S T

1 75.6 75.2 225.8 5.6979 X


1 60.2 59.6 412.2 7.2752 X
1 59.8 59.3 416.2 7.3055 X
2 86.9 86.6 90.3 4.1981 X X
2 85.8 85.4 103.5 4.3686 X X
2 83.7 83.3 128.9 4.6816 X X
3 93.1 92.8 17.5 3.0711 X X X
3 92.1 91.7 30.1 3.2935 X X X
3 89.6 89.2 59.8 3.7688 X X X
4 94.3 93.9 5.5 2.8207 X X X X
4 93.5 93.1 15.1 3.0095 X X X X
4 92.5 92.1 26.2 3.2150 X X X X
5 94.4 94.0 6.0 2.8112 X X X X X

Dengan menggunakan criteria Cp-Mallows dan MSE terkecil diperoleh


model terbaik yang mengandung variabel literacy, gdp_cap, calories dan
death_rt, hasil ini sama dengan metode stepwise

12
DUMMY VARIABLE

Dalam beberapa kasus tertentu, penggunaan analisis regresi melibatkan


adanya variabel independent yang berskala nominal ataupun ordinal. Untuk
mengatasi hal ini dipergunakan dummy variable. Sebagai contoh penggunaan
dummy variable adalah penentuan model terbaik yang menggambarkan
hubungan antara harapan hidup perempuan dengan pendapan perkapita dan
region (Asia dan Afrika).
Model yang menggambarkan hubungan antar variabel tersebut dapat
dinyatakan dalam persamaan regresi :
lifeexpf = 

ln(gdp_cap) + 
 untuk region Asia
lifeexpf = 

 ln(gdp_cap) + 
  untuk region Afrika
Dua persamaan regresi di atas dapat dijadikan satu persamaan regresi
dengan cara menyisipkan sebuah dummy variable (D) yang bernilai 0 untuk
region Asia dan 1 untuk region Afrika :
lifeexpf = 

ln(gdp_cap) + D + 
D*ln(gdp_cap) + 

Nilai  menggambarkan perbedaaan intercept antara region Asia dan
Afrika, sedangkan nilai 
menggambarkan perbedaan slope antara region Asia
dan Afrika.
Jika region yang dilibatkan lebih dari dua, misalkan region Asia, Afrika
dan Amerika Latin maka persamaan regresinya menjadi :
lifeexpf=ln(gdp_cap)+D1+D1*ln(gdp_cap)+D1+D1*ln(gdp_cap)+

dengan aturan pemberian nilai dummy variabel adalah :
region D1 D2 Persamaan regresi
Asia 0 0 ln(gdp_cap)+

Afrika 0 1 


+ 
ln(gdp_cap)+
Amerika Latin 1 0 


+ 
ln(gdp_cap)+

13
Secara umum banyaknya dummy variable yang dibutuhkan adalah
banyaknya region-1.
Kegiatan Praktikum :
Tentukan model yang menggambarkan hubungan antara harapan hidup
perempuan dan pendapatan perkapita di region Asia, Afrika dan Amerika Latin
Penyelesaian :
Pembangkitan nilai D1 dan D2 :[klik transform+compute]

14
Lakukan dengan cara yang sama untuk membangkitkan variabel D2(
bernilai 0 untuk region Asia, Amerika Latin dan bernilai 1 untuk region Afrika).
Pembangkitan nilai D1*ln(gdp_cap) dan D2*ln(gdp_cap)

15
Analisis regresi :[klik analyze+regression+linear]

dan hasilnya adalah :

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 27.034 6.116 4.420 .000
ln_gdp 5.643 .834 .720 6.767 .000
D1 22.860 14.130 .975 1.618 .112
d2 -4.190 10.402 -.184 -.403 .689
d1_lngdp -2.986 1.761 -1.049 -1.696 .097
d2_lngdp -.720 1.547 -.205 -.465 .644
a. Dependent Variable: Average female life expectancy

Masih ada koefisien regresi yang tidak significant, setelah digunakan


metode backward diperoleh hasil sebagai berikut :

16
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 27.034 6.116 4.420 .000
ln_gdp 5.643 .834 .720 6.767 .000
D1 22.860 14.130 .975 1.618 .112
d2 -4.190 10.402 -.184 -.403 .689
d1_lngdp -2.986 1.761 -1.049 -1.696 .097
d2_lngdp -.720 1.547 -.205 -.465 .644
2 (Constant) 25.585 4.904 5.217 .000
ln_gdp 5.836 .677 .745 8.619 .000
D1 24.308 13.545 1.037 1.795 .079
d1_lngdp -3.179 1.680 -1.117 -1.892 .065
d2_lngdp -1.333 .284 -.379 -4.695 .000
3 (Constant) 28.771 4.674 6.156 .000
ln_gdp 5.412 .649 .691 8.341 .000
d1_lngdp -.197 .255 -.069 -.773 .443
d2_lngdp -1.397 .288 -.398 -4.851 .000
4 (Constant) 29.562 4.542 6.508 .000
ln_gdp 5.202 .587 .664 8.860 .000
d2_lngdp -1.308 .263 -.373 -4.972 .000
a. Dependent Variable: Average female life expectancy

Model terbaik yang menggambarkan hubungan antara harapan hidup


perempuan dan pendapatan per-kapita adalah :
lifeexpf = 29.562 + 5.202 ln(gdp_cap) -1.308 D2*ln(gdp_cap)
atau
region D1 D2 Persamaan regresi
Asia 0 0 lifeexpf = 29.562 + 5.202 ln(gdp_cap)
Afrika 0 1 lifeexpf = 29.562 + 3.894 ln(gdp_cap)
Amerika Latin 1 0 lifeexpf = 29.562 + 5.202 ln(gdp_cap)

17
INFLUENTIAL OBSERVATIONS

Influential observations adalah titik pengamatan yang keberadaannya


mempunyai pengaruh terhadap persamaan regresi, sebagai contoh seperti
yang tetera pada gambar di atas, titik (13.12.74) adalah influential observation,
persamaan regresi kalau titik ini diikutkan adalah :
The regression equation is Y3 = 3.00 + 0.500 X R2 = 66.6%
sedangkan kalau titik ini tidak diikutkan, diperoleh persamaan regresi :
The regression equation is Y3 = 4.01 + 0.345 X R2 = 100.0 %

18
Untuk mendeteksi adanya influential observation dapat dipergunakan
beberapa statistik berikut :

No Statistik Formula influential Penjelasan


1 DFFIT Difference fit


i Yˆ p Perbedaan nilai Y
(i )
2
stdev(Yˆ) i
n taksiran dengan
atau tanpa peng-
amatan ke-i
2 DFBETAS Difference Betas
b j b j ( i ) 2 Perbedaan nilai

stdev(b j ) n koefisien regresi
dengan atau tanpa
pengamatan ke-i
3 Cook’
sDi
stance Perbedaan vector
(bi b)' ( X ' X )(b( i ) b) F0.50, p.n p koefisien regresi
pMSE dengan atau tanpa
pengamatan ke-i
4 COVRATIO cov( ) Covariance ratio
cov( (i ) Nisbah dterminan
matriks covariance
koefisien regresi
dengan atau tanpa
pengamatan ke-i

19
Kegiatan Praktikum :
Tentukan Negara di Asia yang keberadaanya mempengaruhi hubungan
antara harapan hidup perempuan dengan pedapatan per-kapita dengan
menggunakan kriteria DFFIT
Penyelesaian
Memilih Negara di region Asia : [klik Data+Select Cases]

Analisis regresi : [klik analyze + regression +linear]

klik save

20
dan hasilnya adalah :

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 27.034 6.350 4.257 .001
ln_gdp 5.643 .866 .860 6.517 .000
a. Dependent Variable: Average female life expectancy

Model Summaryb

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .860a .739 .722 5.744
a. Predictors: (Constant), ln_gdp
b. Dependent Variable: Average female life expectancy

21
Negara yang merupakan influential observation adalah Negara yang nilai

p
DFFIT 2 atau DFFIT 0.69 , Negara tersebut adalah Negara
n
Afganistan, Cina, Kamboja dan Vietnam

22
ASUMSI DALAM ANALISIS REGRESI

Model linear yang menggambarkan hubungan antara variabel


independent dan variabel dependent adalah :
Y = 
X1 + X2 +…+pXp + 
Asumsi yang diperlukan untuk model ini adalah :
~N(0. 2 )
a. 

i)=  untuk semua i


2
b. var(

c. cov(
I,
j) = 0 untuk ij
d. antar X saling independent
Asumsi-asumsi di atas kadang-kadang tidak dipenuhi, untuk mendeteksi
dan mengatasi adanya masalah pelanggaran asumsi di atas dapat dilakukan :
No. Masalah Deteksi Solusi
1 Residual tak normal probability plot Tranformasi variabel
berdistribusi Uj
ikenor
mal
an:KS,
… Regresi bootstrap
normal
2 Hetroscedastivity Plot e dengan yˆ Transformasi variabel

i)  Weighted Least Squares


2
var( Uji Glesjer, White
Uji Golfeld-Quandt
3 Autocorrelation Plot e dengan yˆ Regresi beda, Regresi ratio
cov( j) 
I, 0 Uji Durbin Watson memasukkan trend
untuk ij ACF plot Cochrane Orcutt, Hildreth-
Lu,Durbin, Prais-Winsten
4 Multicollinearity r(Xi,Xj) tinggi, VIF>10 stepwise
X ' X 0 Principal component reg.
Ridge regression
R2 tinggi tetapi tidak
ada yang significant

23
REGRESI BOOTSTRAPP

Asumsi yang utama di dalam analisi regresi adalah asumsi kenormalan


residual. Asumsi ini dibutuhkan terkait dengan penggunaan statistik uji F dan t.
Jika asumsi kenormalan ini tidak dipenuhi maka kesimpulan dari hasil
pengujian dengan statistik uji F dan t menjadi tidak valid Untuk menguji
asumsi kenormalan ini dapat dipergunakan uji Kolmogorov-Smirnov,
Anderson-Darling, Shapiro-Wilk, dan Goodness-of-fit 
jika hasil pengujian
kenormalan menyimpulkan asumsi ini tak terpenuhi maka salah satu solusi
adalah dengan menerapkan metode regresi bootstrap.
Algoritma dari metode regresi bootstrap adalah :
1. mulai
2. Tentukan nilai taksiran dari model Y=X 
dengan metode kuadrat
terkecil, hasil taksirannya adalah ̂j,ols dan nilai taksirannya adalah
Yˆi ,ols

3. Tentukan nilai e1, e2,…,en, ei Yi Yˆ


4. B=1000
5. i=0
6. i=i+1
7. Melakukan resampling with resampling sebanyak n dari ei hasil
resamplingnya adalah e(i)
8. Menentukan nilai Yi Yˆi ,ols e( i )

9. Menduga besarnya ̂j pada resampling ke-i yaitu j ,i dari dan data Yi
dengan Xji dengan metode kuadrat terkecil
10.Jika i<B pergi ke 6
11. Tentukan nilai taksiran koefisien regresi dari metode bootstrapp
sebagai rata-rata nilai koefisien regresi hasil resampling sebanyak B
kali
12. Tentukan confidence interval koefisien regresi melalui nilai persentil
13. Selesai

24
Kegiatan Praktikum :
Tentukan model yang menggambarkan hubungan antara harapan hidup
perempuan dengan pendapatan perkapita serta ujilah asumsi kenormalan
residual dengan uji Kolmogorov-Smirnov.
Penyelesaian :
Dengan bantuan MINITAB permaslahan ini dapat diselesaikan dengan
cara
Tranformasi variabel
MTB > let c27=loge(lifeexpf)
MTB>namec27=’
l
n_gdp’
Regresi [klk stat+regression+regression]

klik storage

25
dan hasilnya adalah :
The regression equation is
LIFEEXPF = 21.7 + 6.15 ln_gdp
Predictor Coef SE Coef T P
Constant 21.670 3.187 6.80 0.000
ln_gdp 6.1538 0.3981 15.46 0.000
S = 5.907 R-Sq = 69.1% R-Sq(adj) = 68.8%
Analysis of Variance
Source DF SS MS F P
Regression 1 8336.9 8336.9 238.93 0.000
Residual Error 107 3733.4 34.9
Total 108 12070.3
Pengujian asumsi kenormalan [klik stat+basic statistics+normality test]

26
Dengan menggunakan metode kuadrat terkecil diperoleh hasil
kenormalan residual tidak terpenuhi, sehiingga sebagai alternatif digunakan
metode regresi bootstrapp yang dinyatakan dalam macro MINITAB :
macro
regb y x
mconstant n i b low_b0 up_b0 low_b1 up_b1
mcolumn x y yy yhat e ee b0 b1 beta b0_boot b1_boot
let n=count(y)
let b=1000
regr y 1 x;
resid e;
fits yhat.
do i=1:b
sample n e ee;
replacement.
let yy=yhat+ee
regr yy 1 x;
coef beta.
let b0(i)=beta(1)
let b1(i)=beta(2)
enddo
histo b0
histo b1
let b0_boot=mean(b0)
let b1_boot=mean(b1)
sort b1 b1
sort b0 b0
let low_b0=b0(25)
let up_b0=b0(975)
let low_b1=b1(25)
let up_b1=b1(975)
print b0_boot low_b0 up_b0
print b1_boot low_b1 up_b1
endmacro

Untuk menjalankan macro di atas dapat dilakukan dengan cara :


MTB>%r
egb.
txt‘
l
if
eex
pf’‘
l
n_gdp’
dan hasilnya adalah :

27
b0 b1

low_b0 14.7859 low_b1 5.40552


up_b0 27.6859 up_b1 6.96901

b0_boot b1_boot
21.5513 6.16731

Confidence interval yang diperoleh untuk  dan 


semuanya tidak
melalui titik 0, sehingga dapat disimpulkan dua koefisien regresi ini significant
pada . Dan model yang diperoleh adalah :
lifeexpf = 21.5513 + 6.16731 ln(gdp_cap)

28
HETEROSCEDASTICITY

Heteroscedasticity adalah sifat residual yang mempunyai varians yang


tidak homogen, atau :
var(i ) i2 2i

Untuk memeriksa sifat ini dapat dipergunakan scatter-plot antara residual


yang sudah dibakukan dengan nilai yˆ, jika scatter plot membentuk gambar
seperti pola sebelah kiri berikut maka varians residual masih dianggap konstan
dan jika membentuk pola seperi sebelah kanan maka varians residual
cenderung tidak homogen.

Selain dengan menggunakan scatter-plot seperti di atas, keberadaan


hetrocedasticity juga dapat diuji dengan menggunakan uji Glejser dengan cara
meregresikan kuadrad atau harga mutlak residual dengan variabel
independent, jika ada variabel independent yang significant maka varians
residual cenderung tidak homogen, untuk mengatasi hal ini biasanya dilakukan
transformasi dengan cara membagi seluruh nilai variabel dengan variabel yang
significant, atau :

29
Jika e k .x1 . maka dilakukan transformasi sebagai berikut :

y 1 x x x
0 1 1 2 2 3 3 ... atau
x1 x1 x1 x1 x1

y * 1 0 x1* 2 x 2* 3 x3* ...

Koefisien regresi dari model ini kemudian ditaksir dengan menggunakan


metode kuadrat terkecil sehingga diperoleh :
y * b1 b0 x1* b2 x 2* b3 x3* ...

Kemudian model ini dikembalikan ke variabel asal dengan


menggandakan ruas kiri dan ruas kanan dengan x1 sehingga diperoleh :
y b1 b0 x1 b2 x 2 b3 x3 ...

Secara umum masalah heterocedasticity dapat diatasi dengan


mengguna-kan metode weighted least-squares yaitu :
ˆ( X ' 1 X ) 1 X1Y dan  adalah matriks diagonal dengan unsur

diagonal adalah i
Selain dengan menggunakan uji Glejser, uji adanya heteroscedasticity
dapat diuji dengan koefisien korelasi Spearman antara residual dengan
variabel independent, jika korelasi ini significant maka cenderung terjadi kasus
hetroscedasticity.
Koefisien korelasi Spearman dihitung dengan cara :
6D 2
r 1  2 dan D adalah selisih rank antar dua variabel.
n(n 1)

30
Kegiatan Praktikum :
Dengan menggunakan uji Glejser, periksalah adanya kasus
heteroscedasticity untuk data berikut :
Year Saving Income
1 264 8777
2 105 9210
3 90 9954
4 131 10508
5 122 10979
6 107 11912
7 406 12747
8 503 13499
9 431 14269
10 588 15522
11 898 16730
12 950 17663
13 779 18575
14 819 19635
15 1222 21163
16 1702 22880
17 1578 24127
18 1654 25604
19 1400 26500
20 1829 27670
21 2200 28300
22 2017 27430
23 2105 29560
24 1600 28150
25 2250 32100
26 2420 32500
27 2570 35250
28 1720 33500
29 1900 36000
30 2100 36200
31 2300 38200

31
Penyelesaian :
Dengan bantuan MINITAB permasalahan di atas, dapat diselesaikan
dengan cara :
MTB > regr 'saving' 1 'income';
SUBC> fits c11;
SUBC> resid c12.

dan hasilnya adalah :

The regression equation is


saving = - 648 + 0.0847 income

Predictor Coef SE Coef T P


Constant -648.1 118.2 -5.49 0.000
income 0.084665 0.004882 17.34 0.000

S = 247.6 R-Sq = 91.2% R-Sq(adj) = 90.9%

Untuk melakukan uji Glejser, dilakukan perintah :


MTB > let c13=abs(c12)
MTB > name c13='abs_res'
MTB > regr 'abs_res' 1 'income'
The regression equation is
abs_res = - 7.7 + 0.00935 income

Predictor Coef SE Coef T P


Constant -7.69 47.73 -0.16 0.873
income 0.009346 0.001972 4.74 0.000

S = 100.0 R-Sq = 43.6% R-Sq(adj) = 41.7%

Dari hasil uji Glejser ini, diperoleh informasi adanya hubungan antara
variabel harga mutlak residual dengan variabel income sehingga terjadi kasus
heteroscedasticity. Karena nilai harga mutlak residual sebanding dengan nilai
income maka selanjutnya dilakukan analisis regresi untuk model :
saving/income = 

 
income)+
Dengan bantuan MINITAB analisis regresi untuk model di atas dapat
dilakukan dengan cara :

32
MTB > let c4=saving/income
MTB > let c5=1/income
MTB > name c4='y*' c5='x*'
MTB > regr 'y*' 1 'x*';
SUBC> resid c21.

dan hasilnya adalah :


The regression equation is
y* = 0.0881 - 723 x*

Predictor Coef SE Coef T P


Constant 0.088139 0.004372 20.16 0.000
x* -722.50 72.36 -9.98 0.000

S = 0.01051 R-Sq = 77.5% R-Sq(adj) = 76.7%

Pengujian adanya heteroscedasticity dengan uji Glejser


MTB > let c22=abs(c21)
MTB > name c22='absres'
MTB > regr 'absres' 1 'income'

Hasil pengujian Glejser


The regression equation is
absres = 0.00793 +0.000000 income

Predictor Coef SE Coef T P


Constant 0.007931 0.002608 3.04 0.005
income 0.00000003 0.00000011 0.31 0.760
S = 0.005465 R-Sq = 0.3% R-Sq(adj) = 0.0%

NIlai p untuk variabel income >5% sehingga tidak ada hubungan antara
harga mutlak residual dengan income atau varians residual cenderung sudah
homogen.
Sedangkan asumsi kenormalan residual dapat diuji dengan cara :
MTB > %NormPlot C21;
SUBC> Kstest.

Dan hasil uji kenormalan dengan menggunakan uji Kolmogorov Smirnov


adalah :

33
Dari hasil pengujian Komogorov Smirnov, diperoleh hasil p-value>5%
sehingga dapat diputuskan residual sudah berdistribusi normal
Model yang menggambarkan hubungan antara saving dengan income
setelah dilakukan transfromasi adalah :
y* = 0.0881 - 723 x* atau :

saving/income= 0.0881 -723 (1/income)

setelah ruas kiri dan kanan digandakan dengan income maka diperoleh :

saving=-723 +0.0881 income

34
MULTICOLLINEARITY

Multicollinearity
Adanya hubungan linear antar variabel independent
Multicollinearity dapat dideteksi dengan :
a. Variance Inflation Factor (VIF) yang tinggi, biasanya>10
b. korelasi antar variabel independent yang tinggi
c. X ' X 0

d. R2 tinggi tetapi tidak ada variabel independent yang significant


e. Koefisien korelasi dan koefisien regresi berbeda tanda
Multicollinearity dapat diatasi dengan :
a. Mengeluarkan salah satu variabel independent yang berkorelasi tinggi
dengan variabel independent yang lain. Pengeluaran variabel ini dapat
dilakukan secara manual ataupun otomatis melalui metode stepwise.
ˆ( X ' X kI ) 1 X ' Y , 0<k<1
b. Ridge Regression. 
c. Principal Component Regression, tahapan dari metode ini adalah :
x x
- Melakukan pembakuan data : z 
s
- Membangkitkan variabel baru yang saling independent
w1 = a11z1 + a12z2 +… +a1pzp
w2 = a21z1 + a22z2 +… + a2pzp

wp = ap1z1 + ap2z2 +… +appzp
atau
wi =a’
ix, nilai a’
I adalah eigen-vector dari eigen-value ke-i dari

matriks korelasi antar variabel independent


- Melakukan regresi y dengan w dan menyatakan model regresi y
dengan w ke dalam model y dengan x

35
Kegiatan Praktikum
1. Periksa adanya kasus multicollinearity pada pemodelan harapan hidup
perempuan dengan pendapatan perkapita, persentase penduduk yang
tinggal di kota, persentase perempuan yang dapat membaca, persentase
laki-laki yang dapat membaca di region Amerika Latin (region=6).
2. JIka ada kasus multicollinearity, atasi dengan beberapa metode untuk
mengatasi multicollinearity.

Penyelesaian
a. Memilih data dari region Amerika Latin klik data+select cases+if

b. Memeriksa adanya kasus multicollinearity dengan menentukan matriks


korelasi antar variabel independent :klik analyze+correlate+bivariate

36
Correlations

Gross People Males


Average domestic living in Females who
female life product / cities who read read
expectancy capita (%) (%) (%)
Average female life
1 .550** .500* .833** .756**
expectancy
Gross domestic product / .550** 1 .285 .617** .581**
capita
People living in cities (%) .500* .285 1 .578** .542*
Females who read (%) .833** .617** .578** 1 .956**
Males who read (%) .756** .581** .542* .956** 1
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

Korelasi antar variabel independent cukup tinggi dan significant


segingga ada kecenderungan terjadi kasus multicollinearity.

c. Memeriksa adanya kasus multicollinearity dengan VIF:klik


analyze+regression+linear

klik statistics

37
Coefficientsa

Unstandardized Collinearity
Coefficients Statistics
B Std. Error t Sig. VIF
(Constant) 45.921 8.483 5.413 .000
Gross domestic product
.000 .001 .320 .753 1.640
/ capita
People living in cities
.011 .068 .159 .875 1.525
(%)
Males who read (%) -.273 .274 -.997 .334 11.573
Females who read (%) .594 .238 2.498 .024 13.289
a. Dependent Variable: Average female life expectancy

Ada variabel independent yang nilai VIF>10 dan tanda koefisien regresi
untuk males who read negatif sedangkan koefisien korelasinya positif
sehingga memang ada kasus multicollinearity.

d. Mengatasi multicollinearity dengan metode stepwise : klik analyze +


regression + linear + method stepwise
Coefficientsa

Unstandardized Collinearity
Coefficients Statistics
Model B Std. Error t Sig. VIF
1 (Constant) 39.013 5.077 7.684 .000
Females who read (%) .406 .062 6.557 .000 1.000
a. Dependent Variable: Average female life expectancy

38
e. Mengatasi multicollinearity dengan ridge regression : klik file + new +
syntax

klik Run +All


R-SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF K
K RSQ GDP_CAP URBAN LIT_FEMA LIT_MALE
______ ______ ________ ________ ________ ________
.00000 .71418 .054792 .026292 1.216924 -.453266
.05000 .69610 .094060 .064195 .727695 -.027707
.10000 .68316 .108722 .079079 .576309 .089996
.15000 .67496 .116972 .087904 .499551 .141542
.20000 .66894 .122256 .093883 .451628 .168551
.25000 .66400 .125810 .098171 .418018 .183994
.30000 .65966 .128228 .101326 .392635 .193180
.35000 .65564 .129847 .103668 .372467 .198665
.40000 .65182 .130880 .105402 .355839 .201821
.45000 .64811 .131470 .106666 .341745 .203441
.50000 .64445 .131719 .107560 .329540 .204016
.55000 .64083 .131700 .108158 .318790 .203861
.60000 .63722 .131470 .108517 .309190 .203186
.65000 .63360 .131071 .108681 .300520 .202137
.70000 .62999 .130537 .108683 .292617 .200817
.75000 .62637 .129895 .108551 .285355 .199298
.80000 .62273 .129165 .108309 .278639 .197636
.85000 .61909 .128365 .107975 .272392 .195871
.90000 .61544 .127509 .107564 .266551 .194033
.95000 .61179 .126608 .107088 .261068 .192146
1.0000 .60813 .125671 .106558 .255901 .190227

Besarnya k dipilih sedemikian hingga nilai koefisien regresinya


dianggap sudah tidak berubah lagi, besarnya k yang memenuhi

39
kriteria ini adalah k=0.35, pemilihan k ini juga dapat ditentukan
berdasarkan gambar berikut :

40
f. Mengatasi multicollinearity dengan principal component regression

1. Menentukan skor komponen (w1, w2,


…)

MTB > PCA 'GDP_CAP' 'URBAN' 'LIT_MALE' 'LIT_FEMA';


SUBC> Coefficients c41-c44;
SUBC> Scores c51-c54.

Eigenanalysis of the Correlation Matrix

Eigenvalue 2.8278 0.7163 0.4141 0.0419


Proportion 0.707 0.179 0.104 0.010
Cumulative 0.707 0.886 0.990 1.000

Variable PC1 PC2 PC3 PC4


GDP_CAP -0.435 0.655 -0.616 0.049
URBAN -0.414 -0.755 -0.506 0.046
LIT_MALE -0.560 0.028 0.478 0.676
LIT_FEMA -0.571 0.022 0.368 -0.734

2. Meregresikan y dengan w

Hanya w1 yang eigen-value-nya >1 sehingga regresinya hanya


dengan w1
MTB > regr 'lifeexpf' 1 'w1'
The regression equation is
LIFEEXPF = 71.8 - 3.51 w1
Predictor Coef SE Coef T P
Constant 71.7619 0.9930 72.26 0.000
w1 -3.5140 0.6051 -5.81 0.000

3. Menyatakan model regresi ke dalam variabel asal

y = 71.8 -3.51 w1
y = 71.8 –3.51(-0.435 z1 -0.414 z2 -0.560 z3 -0.571 z4
y = 71.8 + 1.53 z1 + 1.45 z2 + 1.97 z3 + 2.00 z4
x x1 x x 2 x x3 x x 4
y 71.8 1.53 1 1.45 2 1.97 3 2 4
s x1 s x2 s x3 s x4

41
AUTOCORRELATION

Autocorrelation
Adanya hubungan antar residual atau residual bersifat tidak saling
independent, kasus ini sering dijumpai pada data time series.

Autocorrelation dapat dideteksi dengan :


a. Statistik uji Durbin-Watson :
n

(e i ei 1 ) 2
d i 2 n

e
i
1
2
i

2
b. ACF plot, ada nilai r(et,et-k) melampaui batas 0  maka residual
n
tidak saling independent
c. Statistik uji Ljung-Box
k r j2
Q n(n 2) tolak Ho : residual saling independent jika Q>k
j
1 n j

Adanya residual yang saling dependent dapat diatasi dengan :


a. Regresi beda
yt y t 1 0 1 ( xt xt 1 ) t

b. Regresi Nisbah
yt x
0 1 t t
y t 1 xt 1

c. yt . y t 1 0 1 ( xt .xt 1 ) t

42
Kegiatan Praktikum
tahun export gdp
1970 102 255
1971 105 261
1972 105 261
1973 105 260
1974 104 257
1975 104 257
1976 106 261
1977 106 260
1978 105 257
1979 106 259
1980 106 259
1981 106 258
1982 106 257
1983 106 257
1984 108 261
1985 108 261
1986 109 262
1987 110 264
1988 113 271
1989 113 271
1990 112 268
1991 114 271
1992 113 269
1993 112 266
1994 114 270
1995 113 267
1996 117 276
1997 117 276
1998 117 276
1999 117 275

Tentukan model yang menggambarkan hubungan antara gdp dengan export


dan periksa apakah residual sudah saling independent.

43
Penyelesaian
a. Penentuan model regresi dan pemeriksaan asumsi independent
residual
MTB>r
egr‘
gdp’1‘
expor
t’
;
SUBC > resid c5.
The regression equation is
gdp = 110 + 1.41 export

Predictor Coef SE Coef T P


Constant 110.354 6.839 16.14 0.000
export 1.40664 0.06251 22.50 0.000

S = 1.549 R-Sq = 94.8% R-Sq(adj) = 94.6%


MTB > %acf c5

Nilai autokorelasi residual keluar dari batas pada lag ke-1 sehingga
residual tidak saling independent.

44
b. Mengatasi autocorrelation dengan regresi beda
MTB > diff 'export' c7
MTB > diff 'gdp' c8
MTB > name c7 'dif_xprt' c8 'diff_gdp'
MTB > regr c8 1 c7;
SUBC> resid c9.
The regression equation is
diff_gdp = - 0.488 + 2.28 dif_xprt

29 cases used 1 cases contain missing values

Predictor Coef SE Coef T P


Constant -0.48789 0.09875 -4.94 0.000
dif_xprt 2.27658 0.06924 32.88 0.000

S = 0.4956 R-Sq = 97.6% R-Sq(adj) = 97.5%

MTB > %acf c9

residual sudah saling independent, dan modelnya adalah :


( gdp t gdpt 1 ) 0.488 2.28(exp ort t exp ort t 1 )

45
Mengatasi autocorrelation dengan regresi nisbah

MTB > let c11=c2/lag(c2)


MTB > let c12=c3/lag(c3)
MTB > regr c12 1 c11;
SUBC> resid c13.

The regression equation is


C12 = 0.0563 + 0.942 C11

29 cases used 1 cases contain missing values

Predictor Coef SE Coef T P


Constant 0.05627 0.02957 1.90 0.068
C11 0.94186 0.02942 32.01 0.000

S = 0.001930 R-Sq = 97.4% R-Sq(adj) = 97.3%

MTB > %acf c13

residual sudah saling independent, dan modelnya adalah

gdp t exp ort t


0.0563 0.942
gdp t 1 exp ort t 1

46
ROBUST REGRESSION

Metode pendugaan parameter yang paling sering dipergunakan di dalam


analisis regresi adalah metode kuadrat terkecil (least squares), metode ini
mempunyai kelemahan jika diterapkan pada data yang mengandung
pengamatan berpengaruh (inflentual observation), persamaan regresi yang
dihasilkan oleh metode kuadrat terkecil cenderung mudah berubah-ubah
dengan adanya pengamatan berpengaruh.

Untik mengatasi kelemahan metode kuadrat terkecil ini dapat dilakukan


dengan dua cara yaitu :
a. Mengeluarkan titik yang berpengaruh yang dapat dideteksi dengan
dffit, cook distance, dfbetas, setelah itu tetap menggunakan metode
kuadrat terkecil
b. Tetap menggunakan seluruh data, tetapi dengan memberikan bobot
yang kecil untuk pengamatan yang berpengaruh, metode ini dikenal
dengan nama metode regresi robust.

47
Metode pendugaan parameter di dalam analisis regresi robust
a. Least Absolute Deviation (LAD), metode ini bekerja dengan
n
meminimukan harga mutlak residual atau meminimumkan e
i
1
i

b. Least Trimmed Squares, metode ini bekerja dengan cara


meminimumkan jumlah kuadrat q buah residual terkecil atau
q
meminimumkan e
i
1
2
i , besarnya q n / 2

c. Least Median Squares (LMS), metode ini bekerja dengan cara


meminimumkan median kuadrat residual atau meminimumkan
median( ei2 )

d. M estimate, metode ini dikenalkan oleh Huber dengan cara


meminimumkan jumlah fungsi dari residual atau meminimumkan
n

f (e ) , jika
i
1
i f (ei ) ei2 maka metode ini sama dengan OLS dan jika

f (ei ) ei maka metode ini sama dengan LAD. Peminimuman dari
n

f (e )
i
1
i biasanya dilakukan dengan cara iteratively reweighted least

squares (IRLS) atau :


n n
f ( ei )
min f (ei ) ekuivalen dengan min wi ei2 dengan wi 
i
1 i
1 ei2
n n
untuk metode LAD :min ei
i
1
ekuivalen dengan min w e
i
1
2
i i

1
dengan wi  , penentuan wi dapat juga ditentukan dengan cara :
ei

wi 1 untuk ei median( ei ) dan

median( ei )
wi  untuk ei median( ei )
ei

48
Implementasi metode LAD dapat dinyatakan dalam macro berikut :
macro
lad y x
mconstant i n s iterasi delta
mcolumn y x w error b_old b_new
let n=count(y)
let iterasi=0
let delta=10
regr y 1 x;
resid error;
coef b_old.
let error=abs(error)
let s=median(error)
while delta>0.000001 and iterasi<100
let iterasi=iterasi+1
do i=1:n
if error(i)<s
let w(i)=1
else
let w(i)=s/error(i)
endif
enddo
regr y 1 x;
weight w;
resid error;
coef b_new.
let delta=sum(abs(b_old-b_new))
let error=abs(error)
let s=median(error)
let b_old=b_new
endwhile
endmacro

49
Kegiatan Praktikum
Dari data Anscombe berikut, tentukan model regresi robust dengan
metode LAD dan bandingkan hasilnya dengan metode OLS setelah
pengamatan berpengaruhnya dikeluarkan.
Nomor X Y
1 10 7.46
2 8 6.77
3 13 12.74
4 9 7.11
5 11 7.81
6 14 8.84
7 6 6.08
8 4 5.39
9 12 8.15
10 7 6.42
11 5 5.73

Penyelesaian
Dengan menggunakan MINITAB diperoleh hasil sebagai berikut :
MTB >%lad.txt c2 c1
The regression equation is
Y = 4.01 + 0.345 X
Predictor Coef SE Coef T P
Constant 4.00533 0.03445 116.26 0.000
X 0.345467 0.003783 91.31 0.000
S = 0.03554 R-Sq = 99.9% R-Sq(adj) = 99.9%
Analysis of Variance
Source DF SS MS F P
Regression 1 10.533 10.533 8338.16 0.000
Residual Error 9 0.011 0.001
Total 10 10.545
Unusual Observations
Obs X Y Fit SE Fit Residual St Resid
3 13.0 12.7400 8.4964 0.0207 4.2436 2.99R

50
Setelah kasus ke-3 dihilangkan, diperoleh persamaan regresi berikut :
MTB>l
etc2(
3)=’
*’
MTB > regr c2 1 c1
MTB > regr y 1 x

The regression equation is


Y = 4.01 + 0.345 X
10 cases used 1 cases contain missing values
Predictor Coef SE Coef T P
Constant 4.00565 0.00292 1369.81 0.000
X 0.345390 0.000321 1077.35 0.000
S = 0.003082 R-Sq = 100.0% R-Sq(adj) = 100.0%

Setelah kasus ke-3 dihilangkan ternyata persamaan regresi dari OLS dan
LAD adalah hampir sama

51
NONLINEAR REGRESSION

Berdasarkan kelinearan antar parameter di dalam model regresi, maka


model regresi dapat diklasifikasikan menjadi dua macam yaitu linear dan non-
linear. Model regresi dikatakan linear jika dapat dinyatakan dalam model :

y 0 1 x 1 2 x 2 3 x 3 ... k x k 


JIka model regresi tidak dapat dinyatakan ke dalam model di atas maka
model yang diperoleh adalah model regresi non-linear, secara umum model
regresi non-linear dapat dinyatakan dalam persamaan :

y  f ( x , ) 
NIlai 
dapat diduga dengan dengan cara meminimukan jumlah kuadrat
residual, jumlah kuadrat ini dapat diminimukan jika turunan pertama terhadap

sama dengan nol atau :
n 2

SSE 
y i f ( x i , ) 
i 1

SSE n
f ( x , )
 y i f ( xi , ) i 0
 i 1  
Hasil turunan pertama terhadap 
sama dengan nol membentuk suatu
sistem persamaan non-linear yang tidak dapat diselesaikan secara langsung
tetapi dapat didekati secara iteratif dengan menggunakan metode numerik,
salah satu metode numerik yang dapat menyelesaikan hal ini adalah metode
Gauss-Newton. Metode Gauss-Newton ini bekerja dengan menggunakan
SSE
pendekatan deret Taylor dari fungsi sampai suku kedua. Nilai dugaan


pada iterasi ke i+1 adalah :

ˆ 
 ˆ( '  ) 1  ' e
i 1 i i i i i

52
dan

f ( x1 , ) f ( x1 , ) f ( x1 , ) 
  ...
0 1 k 
 
f ( x 2 , ) f ( x 2 , ) f ( x 2 , ) 
...
 0 1 k 
 ... 
 
f ( x n , ) f ( x n , ) f ( x n , ) 
...

  0 1 k  
Iterasi ini dihentikan jika nilai

ˆ 
 ˆ atau 
ˆ  ˆ 0.0000
i 1 i i 1 i

Levenberg-Marquardt menyempurnakan metode Gauss-Newton dengan


memasukkan konstanta  (nilai awal 
yang besarnya berubah-ubah
mengikuti perubahan SSE. Nilai 
akan diperkecil sepersepuluh kali dan iterasi
diteruskan jika SSE turun serta nilai 
akan meningkat sepuluh kali dan
kembali ke iterasi awal jika SSE meningkat. Formula Levenberg-Marquardt
adalah :

ˆ 
 ˆ( '  diag '  ) 1  ' e
i 1 i i i i i i i

53
Kegiatan Praktikum
Tahun Penduduk Banyaknya penduduk pada interval tahun 1980
1980 100 sampai dengan tahun 2000 diduga mempunyai pola
1981 105
pertumbuhan eksponensial yang dapat dinyatakan
1982 110
1983 115 dalam model :
1984 124
1985 130 y 0 e 1t 
1986 135
Tentukan nilai dugaan untuk 
dan 
1987 142
1988 149
1989 155
1990 165
1991 172
1992 182
1993 194
1994 203
1995 212
1996 223
1997 234
1998 246
1999 258
2000 271

Penyelesaian

Model y  0 e 1 t  adalah model non linear, berbeda dengan

model y 0 e 1t e e yang dapat dilinearkan dengan transformasi

logaritma, untuk menduga besarnya koefisien regresi digunakan metode


Gauss-Newton dengan formula berikut :

ˆ 
 ˆ( '  ) 1  ' e
i 1 i i i i i

54
ˆ 100 (Nilai y pada tahun dasar) dan untuk
Dengan nilai awal untuk 0

ˆ0.05 (nilai pertumbuhan relatif dari dua nilai y awal :100 ke 105).
1

f f
Sedangkan nilai matriks 
dapat ditentukan dari dan
 0 
1 yaitu :


f 
0e 1t

f
e 1t
0
f
0 te1t
1
sehingga matriks menjadi :

e 1t1 0 t.e 1t1 


1t 2 
e 0t.e 1t 2 

... ... 
1t n 

e 0t.e 1t n 

dan matriks ’
adalah :

 n 21ti n

e  2i ti
0tie 
' n i 1 i
n
1

 t e2iti 2 2 2i ti 



i
1
0i 
i1
0 ti e

55
Untuk menyelesaikan kaus ini dengan metode Gauss-Newton, dapat
dilakukan dengan bantuan Macro MINITAB berikut :
macro
nonlin yy xx b0 b1
mconstant b0 b1 bb0 bb1 iterasi delta
mcolumn yy xx x1 x2 b yhat error
mmatrix x xt xtx xtxinv xte e yyhat h b_old b_new
#
# nilai awal
#
let b(1)=b0
let b(2)=b1
copy b b_old
let yhat=b0*expo(b1*xx)
let error=yy-yhat
copy error e
let x1=expo(b1*xx)
let x2=b0*xx*expo(b1*xx)
copy x1 x2 x
let delta=10
let iterasi=0
#
# iterasi gauss-newton
#
while delta>0.000001 and iterasi<100
let iterasi=iterasi+1
transpose x xt
multiply xt x xtx
invert xtx xtxinv
multiply xt e xte
multiply xtxinv xte h
add b_old h b_new
copy b_new b
let bb0=b(1)
let bb1=b(2)
let delta=abs(b0-bb0)+abs(b1-bb1)
let b0=bb0
let b1=bb1
copy b_new b_old
let yhat=b0*expo(b1*xx)
let error=yy-yhat
copy error e
let x1=expo(b1*xx)
let x2=b0*xx*expo(b1*xx)
copy x1 x2 x
endwhile
print b0 b1
endmacro
Untuk menjalankan macro MINITAB di atas dapat dilakukan dengan
perintah :

56
MTB > set c1
DATA> 0:20
DATA> end
MTB > set c2
DATA> 100 105 110 115 124 130 135 142 149 155
DATA> 165 172 182 194 203 212 223 234 246 258
DATA> 271
DATA> end
MTB > %nonlin.txt c2 c1 100 0.05
b0 100.150
b1 0.0499193

Sehingga model pertumbuhan eksponensial banyaknya penduduk dari


tahun 1980 sampai dengan tahun 2000 adalah :

y t 100 . 150 e 0 . 0499 t


Dengan bantuan SPSS pemodelan regresi nonlinear untuk banyaknya
penduduk dapat dilakukan dengan : klik analyze+regression+nonlinear

klik parameters

57
Iteration Residual SS B0 B1
1 22.83350008 100.000000 .050000000
1.1 22.58470063 100.149827 .049919149
2 22.58470063 100.149827 .049919149
2.1 22.58469961 100.149728 .049919293
3 22.58469961 100.149728 .049919293
3.1 22.58469961 100.149729 .049919293
Nilai koefisien regresi dan SSE sudah tidak berubah lagi sehingga iterasi
berhenti.
Nonlinear Regression Summary Statistics Dependent Variable Y
Source DF Sum of Squares Mean Square

Regression 2 681946.41530 340973.20765


Residual 19 22.58470 1.18867
Uncorrected Total 21 681969.00000
(Corrected Total) 20 56224.95238
R squared = 1 - Residual SS / Corrected SS = .99960
Asymptotic 95 %
Asymptotic Confidence Interval
Parameter Estimate Std. Error Lower Upper
B0 100.14972863 .350807378 99.415480345 100.88397691
B1 .049919293 .000241815 .049413169 .050425416

Confidence interval untuk koefisien regresi tidak ada yang melalui titik nol
sehingga dapat dikatakan koefisien regresi yang diperoleh significant pada


Latihan
1. Rasio elektrifikasi (Persentase rumah tangga yang berlangganan PLN)
selama 20 tahun di suatu daerah adalah sebagai berikut :
57.44 64.57 71.09 76.85 81.76 85.81 89.09 91.68 93.70
95.26 96.44 97.34 98.02 98.52 98.90 99.18 99.39 99.55
99.67 99.75

Tentukan model yang menggambarkan hubungan antara rasio


elektrifikasi dengan waktu
2. Tentukan model terbaik yang menggambarkan hubungan antara harapan
hidup perempuan (y), persentase penduduk yang tinggal di perkotaan (x1),
harapan hidup laki-laki (x2) dan pendapatan perkapita(x3) yang dinyatakan
dalam model :

y 0 x11 x22 x33 

58
Penyelesaian
Persentase penduduk yang berlangganan PLN tidak mungkin lebih dari
100 %, dan akan mendekati 100 % untuk t yang sangat besar, salah satu
model yang memenuhi sifat-sifat ini adalah :

100
yt  
1  0 e t
Dengan bantuan SPSS

Nonlinear Regression Summary Statistics Dependent Variable Y


Source DF Sum of Squares Mean Square
Regression 2 164053.29912 82026.64956
Residual 18 1.799245E-04 9.995807E-06
Uncorrected Total 20 164053.29930
(Corrected Total) 19 3129.70530
R squared = 1 - Residual SS / Corrected SS = 1.00000
Asymptotic 95 %
Asymptotic Confidence Interval
Parameter Estimate Std. Error Lower Upper

B0 .740850358 .000067112 .740709362 .740991355


B1 .299981460 .000027927 .299922787 .300040132

59

Pemodelan y  0 x1
1
x22 x33 dengan bantuan SPSS dapat
dilakukan dengan cara :

Nonlinear Regression Summary Statistics


Dependent Variable LIFEEXPF
Source DF Sum of Squares Mean Square
Regression 4 542255.95702 135563.98926
Residual 104 368.04298 3.53887
Uncorrected Total 108 542624.00000
(Corrected Total) 107 12023.07407
R squared = 1 - Residual SS / Corrected SS = .96939
Asymptotic 95 %
Asymptotic Confidence Interval
Parameter Estimate Std. Error Lower Upper
B0 1.266804442 .150462507 .968431646 1.565177239
B1 .010369463 .007318355 -.004143109 .024882036
B2 .934838552 .033915777 .867582293 1.002094811
B3 .009008014 .003101373 .002857875 .015158153

Confidence interval untuk  memuat titik nol, sehingga koefisien ini


tidak significant sehingga analisis regresi nonlinear perlu dilanjutkan dengan
tanpa memasukkan variabel persentase penduduk yang tinggal diperkotaan.

60
Nonlinear Regression Summary Statistics
Dependent Variable LIFEEXPF

Source DF Sum of Squares Mean Square

Regression 3 548174.04067 182724.68022


Residual 106 378.95933 3.57509
Uncorrected Total 109 548553.00000

(Corrected Total) 108 12070.34862

R squared = 1 - Residual SS / Corrected SS = .96860

Asymptotic 95 %
Asymptotic Confidence Interval
Parameter Estimate Std. Error Lower Upper

B0 1.208565153 .138090655 .934786998 1.482343308


B2 .953133843 .031327433 .891024160 1.015243525
B3 .010483637 .002967936 .004599416 .016367859

61

Anda mungkin juga menyukai