Anda di halaman 1dari 8

Edisi Juli 2012 Volume VI No.

1-2 ISSN 1979-8911

MODEL REGRESI LINIER BERGANDA


MENGGUNAKAN PENAKSIR PARAMETER REGRESI
ROBUST M-ESTIMATOR
(Studi Kasus: Produksi Padi di Provinsi Jawa Barat Tahun 2009)

Rini Cahyandari, Nurul Hisani


Jurusan Matematika Fakultas Sains dan Teknologi
Universitas Islam Negeri Sunan Gunung Djati Bandung
Jl. AH. Nasution 105 Cibiru Bandung – 40614
e-mail: rcahyandari@yahoo.com

Abstrak
The least squares method is one method of parameter estimation in regression models.
This method produces an unbiased estimator with consideration the assumptions are
linearity, non-multicollinearity, non-autocorrelation, homoscedastic, and normally
distributed error fulfilled. When the assumptions are not fulfilled, such as error distribution
is not normal due to the existence of outliers, an estimation obtained are not exact.An
alternative method that can overcome the problem of outliers is robust regression method
using M-estimator (Iteratively Reweighted Least Squares). M-estimator is an iterative
method using weighting function Huber and Tukey bisquare to estimate the parameters or
coefficients in the regression model. The best model obtained by M-estimator robust
method using Huber and Tukey bisquare is determined by the value R2adjusted and standard
error values.
Keywords : Outliers, M-estimator robust regression method

1. Pendahuluan berpengaruh besar terhadap koefisien


regresi. Ketika terdapat pencilan
Analisis regresi merupakan analisis yang (outlier) dalam data, maka dengan
mempelajari bagaimana membentuk menggunakan estimasi metode kuadrat
sebuah hubungan fungsional dari data terkecil, hasil estimasi parameternya
untuk dapat menjelaskan atau tidak akan memberikan informasi yang
meramalkan suatu fenomena alami atas tepat bagi data yang ada, karena akan
dasar fenomena yang lain. Analisis mengakibatkan nilai error menjadi besar
regresi memiliki peranan yang penting (tidak normal). Sehingga telah
dalam berbagai bidang ilmu pengetahuan. dikembangkan analisis regresi robust
Kebanyakan analisis regresi bergantung sebagai perbaikan untuk estimasi kuadrat
pada metode kuadrat terkecil untuk terkecil dalam model regresi linier
mengestimasi parameter-parameternya berganda karena adanya suatu pencilan
dalam model regresi. Tetapi metode ini (outlier). Pada makalah ini, akan
biasanya dibentuk dengan beberapa ditentukan suatu model regresi linier
asumsi, seperti linearitas, tidak ada berganda dengan nilai estimasi parameter
autokorelasi, tidak terjadi yang diperoleh dengan metode regresi
multikolinearitas, homoskedastisitas, dan robust M-estimator (Iteratively
error berdistribusi normal. Reweighted Least Squares) menggunakan
fungsi pembobot Huber dan Tukey
Pencilan (outlier) adalah pengamatan bisquare. Sebagai studi kasus dipilih data
yang jauh dari pusat data yang mungkin produksi padi di Provinsi Jawa Barat

85
Edisi Juli 2012 Volume VI No. 1-2 ISSN 1979-8911

tahun 2009 yang dipengaruhi oleh luas


⎡ ⎤
panen (X1) dan luas irigasi teknis (X2).
⎢ ⎥
.⎥
=⎢ ,
Permasalahan dalam makalah ini ⎢ .⎥
dibatasi, diantaranya: ⎢ .⎥
1. Metode regresi robust yang ⎣ ⎦
digunakan adalah M-estimator 1 …
⎡ ⎤ ⎡ ⎤
2. Model yang digunakan adalah model 1 …
⎢ ⎥ ⎢ ⎥
regresi linier berganda . . . .
3. Beberapa asumsi seperti linearitas, =⎢ ⎥, = ⎢ . ⎥,
⎢ . . . ⎥ ⎢ ⎥
non multikolinearitas, non ⎢ . . . ⎥ ⎢. ⎥
autokorelasi dan homoskedastisitas, ⎣ 1 … ⎦ ⎣ ⎦
tetap terpenuhi
⎡ ⎤
⎢ .⎥
=⎢ ⎥
.⎥

2. Model Regresi Linier Berganda ⎢ .⎥
Model regresi yang menghubungkan dua ⎣ ⎦
atau lebih variabel bebas ( ) dengan satu
dengan menurunkan jumlah kuadrat error
variabel terikat ( ) disebut regresi linier
berganda, dan dinyatakan dalam model secara parsial terhadap , , … , sama
sebagai berikut: dengan nol sehingga diperoleh estimator
kuadrat terkecil dari sebagai berikut:
= + + + … + =( )
+ , = 1, 2, … , (4)
(1)
Karena populasi jarang diamati secara 3. Pencilan (Outlier)
langsung, maka digunakan persamaan
Dalam suatu data seringkali ditemukan
regresi linier sampel sebagai estimasi
berbagai hal yang menyebabkan tidak
persamaan regresi linier populasi.
terpenuhinya asumsi klasik regresi.
Misalkan estimasi parameter untuk
Ketika asumsi ada yang tidak terpenuhi,
, , . . . , pada persamaan (1) maka penggunaan metode kuadrat
adalah , , . . . , dan ( = − terkecil akan memberikan kesimpulan
) merupakan error atau residual, maka yang kurang baik atau nilai estimasi
model sampel untuk persamaan (1) bersifat bias dan interpretasi hasil yang
adalah sebagai berikut: diberikan menjadi tidak valid. Salah satu
penyebab tidak terpenuhinya asumsi
= + + + ⋯+ + klasik regresi adalah adanya pencilan
= 1, 2, … , (outlier) pada pengamatan yang
(2) menyebabkan distribusi error tidak
Model regresi linier berganda di atas normal.
dapat dinyatakan dalam bentuk matriks
Pencilan (outlier) adalah pengamatan
sebagai berikut:
yang jauh dari pusat data yang mungkin
( ) = ( ( )) (( ) )+ ( )
berpengaruh besar terhadap koefisien
(3) regresi atau pengamatan yang
menyimpang dari sekumpulan
pengamatan yang lain. Pencilan (outlier)

86
Edisi Juli 2012 Volume VI No. 1-2 ISSN 1979-8911

dapat muncul karena kesalahan dalam Metode regresi robust adalah metode
memasukkan data, kesalahan untuk mengestimasi koefisien regresi
pengukuran, analisis, atau kesalahan- yang tidak peka terhadap adanya
kesalahan lain. Keberadaan dari pencilan penyimpangan asumsi yang
(outlier) akan menyebabkan kesulitan mendasarinya. M-estimatormerupakan
dalam analisis data, sehingga perlu untuk metode regresi robust yang sering
dihindari. Permasalahan yang muncul digunakan. M-estimatordipandang
akibat adanya pencilan (outlier) antara dengan baik untuk mengestimasi
lain sebagai berikut: parameter yang disebabkan oleh pencilan
(outlier).Pada prinsipnya, M-estimator
1. Error yang besar dari model yang merupakan estimasi yang
terbentuk ( ) ≠ 0. meminimumkan jumlah fungsi error :
2. Variansi dari data akan menjadi lebih
besar. ( )
3. Taksiran interval akan memiliki
rentang yang lebih besar.
= − (5)
Pencilan (outlier) ini dapat diketahui
secara visual atau eksak dengan
melakukan diagnosis error atau residual Fungsi dipilih sebagai representasi
dari model regresi yang terbentuk. Secara fungsi pembobot dari error. Untuk
eksak, pencilan (outlier) dapat dideteksi memperoleh suatu versi skala invariant
melalui perhitungan metode diagnosis dari estimator ini dilakukan dengan
error seperti Studentized Residual, nilai menyelesaikan persamaan:
DFFITS dan Cook’s Distance. Adapun
ketentuan dalam pengambilan keputusan
ada atau tidak adanya pengamatan
pencilan (outlier) adalah sebagai berikut: −∑
=
⎧ > ⎫
⎪ ⎪, … ,
DFFITS > 2 , merupakan nilai estimator
Jika dari , , … , (dengan: )
Pencilan
⎨ ⎬
⎪ > ⎪
( ∗)
⎩ ⎭
Ket: n = jumlah =

estimasi untuk σ adalah:

pengamatan (sampel) ; p = jumlah


parameter =
0.6745
{| − ( ,…, )|}
=
0.6745

Dengan meminimumkan persamaan (6),


4. Metode Regresi Robust M-
turunan parsial pertama dari terhadap
estimator
sama dengan nol, yaitu:

87
Edisi Juli 2012 Volume VI No. 1-2 ISSN 1979-8911

−∑
|e ∗ | ≤ c
e∗
= 0, Tukey bisquare w(e ∗ ) = 1− |e ∗ | >
c c = 4.685
= 0, 1, … , (9)
0
Dengan = , mendefinisikan
( ∗)
( ∗) = ∗ diperoleh:
5. Tahapan Analisis Data
− = 0,
Pada makalah ini terdapat enam tahapan
analisis data, yaitu:
1. Menentukan nilai estimasi parameter
= 0, 1, … , (10)
menggunakan metode kuadrat
Dalam notasi matriks, persamaan (10) terkecil.
dapat dituliskan menjadi: 2. Uji asumsi klasik regresi yaitu uji
= asusmsi linearitas, normalitas, non
multikolinearitas, non autokorelasi
(11) dan homoskedastisitas, untuk
mengetahui adanya penyimpangan
adalah matriks diagonal n x n dari asumsi klasik regresi atau tidak.
bobot dengan elemen-elemen diagonal 3. Jika terdapat penyimpangan asumsi
normalitas, lakukan pendeteksian
, , , , … , , . adalah
pengamatan pencilan (outlier)
matriks variabel bebas berukuran
dengan nilai Studentized Residual,
( + 1) dan Y adalah matriks nilai DFFITS dan Cook’s Distance.
variabel terikat berukuran( 1). 4. Menentukan nilai estimasi parameter
Sehingga estimator regresi robust dengan menggunakan metode regresi robust
M-estimator (IRLS) untuk adalah: M-estimator. Langkah-langkah dalam
=( ) ( ) tahap ini adalah:
1) Mengestimasi parameter atau
(12) koefisien regresi b menggunakan
metode kuadrat terkecil, sehingga
Fungsi pembobot untuk metode M-
di dapatkan , dan , = −
estimator dengan fungsi Huber dan
Tukey bisquare adalah sebagai berikut: , , ( = 1, 2, … , ).
2) Menentukan dan pembobot
( ∗)
awal sesuai dengan fungsi
Huber dan Tukey bisquare.
Metode Fungsi Pembobot Interval3) Disusun matriks pembobot berupa
matriks diagonal W dengan
elemen w , , w , , … , w , .
| ∗|
1 e ≤ c4) Dihitung estimator koefisien
| ∗|
Huber w(e ∗ ) = c e > regresi yaitu, =
|e | ∗ c = 1.345 ( ) ( ) .
5) Dengan menggunakan
b dihitung pula

− , ,

88
Edisi Juli 2012 Volume VI No. 1-2 ISSN 1979-8911

6) Langkah 2 sampai 5 diulang


sampai didapatkan ∑ , atau Sebagai studi kasus dipilih data produksi
b konvergen, yaitu padi di Provinsi Jawa Barat tahun 2009 di
perubahan antara ∑ | |dan setiap kota atau kabupaten (Badan Pusat
∑ | | atau perubahan Statistik). Persamaan yang digunakan
b dalam kasus ini adalah:
( ) dan b
lebih kecil dari 0.1%.
5. Lakukan pengujian signifikansi Y
parameter dengan menggunakan uji =β +β X +β X
statistik t dan uji statistik F untuk + ε
mengetahui tingkat keberartian atau dimana,
signifikansi masing-masing parameter Y = jumlah produksi padi (ton)
baik secara parsial maupun X1 = jumlah luas panen (hektar)
keseluruhan terhadap model regresi X2 = jumlah luas irigasi teknik (hektar)
yang diperoleh. i = unit coss section, yaitu kabupaten
6. Menentukan model terbaik antara atau kota di Provinsi Jawa Barat
fungsi Huber dan fungsi Tukey
bisquare berdasarkan nilai R2adjusted  Hasil estimasi parameter metode
yang terbesar dan nilai standard error kuadrat terkecil (Ordinary Least
yang terkecil. Squares) dengan menggunakan
software R.2.14.1 fasilitas R-
Commander adalah sebagai berikut:
6. Studi Kasus

>Model.OLS<-lm(Jumlah.Produksi.Padi ~ Luas.Panen + Luas.Irigasi.Teknis,


data=ProduksiPadi2009)
> summary(Model.OLS)
Call:
lm(formula = Jumlah.Produksi.Padi ~ Luas.Panen + Luas.Irigasi.Teknis,data =
ProduksiPadi2009)

Residuals:
Min 1Q Median 3Q Max
-60762 -3300 -1541 4201 54546

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1570.5832 6466.6317 0.243 0.8103
Luas.Panen 5.6805 0.0971 58.503 <2e-16 ***
Luas.Irigasi.Teknis 0.5443 0.2855 1.907 0.0691
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 21240 on 23 degrees of freedom
Multiple R-squared: 0.9973, Adjusted R-squared: 0.9969
F-statistic: 4251 on 3 and 23 DF, p-value: < 2.2e-16

89
Edisi Juli 2012 Volume VI No. 1-2 ISSN 1979-8911

Berdasarkan hasil estimasi parameter luas  Hasil estimasi parameter metode


panen dan luas irigasi teknis di atas, regresi M-estimator fungsi Huber
maka model regresi linier yang dapat dengan menggunakan software
dibentuk adalah sebagai berikut: R.2.14.1 fasilitas R-Commander
adalah sebagai berikut:
= 1570.5832 + 5.6805 X1i + 0.5443
X2i (14)

>library(MASS)
>model.huber<-
rlm(Jumlah.Produksi.Padi~Luas.Panen+Luas.Irigasi.Teknis,data=ProduksiPadi2009)
>summary(model.huber)

Call: rlm(formula=Jumlah.Produksi.Padi~Luas.Panen+Luas.Irigasi.Teknis,data =
ProduksiPadi2009)

Residuals:
Min 1Q Median 3Q Max
-67291.4 -4365.2 401.4 3872.2 51726.6

Coefficients:
Value Std. Error t value
(Intercept) -439.1787 2818.4734 -0.1558
Luas.Panen 5.7641 0.0423 136.2004
Luas.Irigasi.Teknis 0.2761 0.1244 2.2194

Residual standard error: 3370 on 23 degrees of freedom

Berdasarkan hasil estimasi parameter luas  Hasil estimasi parameter metode


panen dan luas irigasi teknis di atas, regresi M-estimator fungsi Tukey
maka model regresi linier dengan bisquaredengan menggunakan
menggunakan M-estimator fungsi Huber software R.2.14.1 fasilitas R-
yang dapat dibentuk adalah sebagai Commander adalah sebagai berikut
berikut:
= -439.1787 + 5.7641 X1i + 0.2761
X2i
(15)
 : data=ProduksiPadi2009,psi=psi.bisqu
are)
>library(MASS) >summary(model.bisquare,cor=F)
>model.bisquare<-
rlm(Jumlah.Produksi.Padi~Luas.Pane
n+Luas.Irigasi.Teknis, Call:rlm(formula=Jumlah.Produksi.P
adi~Luas.Panen+Luas.Irigasi.Teknis,

90
Edisi Juli 2012 Volume VI No. 1-2 ISSN 1979-8911

data=ProduksiPadi2009, psi = = 110.6351 + 5.8074 X1i + 0.1114


psi.bisquare) X2i
Residuals: (16)
Min 1Q Median
3Q Max
-71932.4 -2291.7 -261.5
Model dari masing masing metode telah
2078.4 49072.9
diperoleh, yaitu model hasil dari metode
kuadrat terkecil (14), model hasil
Coefficients:
dari metode M-estimator dengan fungsi
Value Std.Error
pembobot Huber (15), dan model hasil
t value
dari metode M-estimator dengan fungsi
(Intercept) 110.6351
pembobot Tukey bisquare (16).
1398.9123 0.0791
Selanjutnya dari ketiga model regresi
Luas.Panen
linier tersebut akan ditentukan model
5.8074 0.0210
regresi linier terbaik untuk kasus jumlah
276.4723
produksi padi di Provinsi Jawa Barat
Luas.Irigasi.Teknis
tahun 2009. Kriteria yang dapat
0.1114 0.0618
digunakan untuk menentukan model
1.8039
regresi terbaik, yaitu dengan
menggunakan nilai standarderror (se)
Residual standard error: 5976 on 23
dan nilai R2adjusted. Model terbaik
degrees of freedom
memiliki nilai standarderror (se) terkecil
dan R2adjusted terbesar. Dengan
menggunakan software R.2.14.1 fasilitas
Berdasarkan hasil estimasi parameter luas R-GUI dan R-Commander diperoleh
panen dan luas irigasi teknis di atas, hasil output nilai untuk standarderror(se)
maka model regresi linier dengan dan nilai R2adjusted pada masing-masing
menggunakan M-estimator fungsi Tukey metode adalah sebagai berikut:
bisquare yang dapat dibentuk adalah
sebagai berikut:
Metode Variabel Nilai Standard Error R2adjusted
Intersep 1570.5832
OLS X1 5.6805 21241.24 0.9969
X2 0.5443
Intersep -439.1787
M-estimator X1 5.7641 3370 0.9970

(Huber) X2 0.2761
Intersep 110.6351
M-estimator X1 5.8074 5976 0.9967
(Tukey bisquares) X2 0.1114
Tabel 1: Perbandingan Nilai Standard Error dan R2adjusted

91
Edisi Juli 2012 Volume VI No. 1-2 ISSN 1979-8911

Dari tabel 1 di atas dapat dilihat bahwa = 5.7641 X1i + 0.2761 X2i
nilai standarderrorfungsi Huber lebih
kecil dari nilai standard error fungsi yang artinya: setiap peningkatan 1% luas
Tukey bisquare yang berarti bahwa panen akan meningkatkan jumlah
variansi yang dapat dijelaskan oleh model produksi padi sebesar 5.7641%, dan
hasil metode M-estimator setiap peningkatan 1% luas irigasi teknis
dengan fungsi Huber lebih kecil akan meningkatkan jumlah produksi padi
dibanding model hasil M-estimator sebesar 0.2761%.
dengan fungsi Tukey bisquare. Dan nilai
R2adjusted fungsi Huber lebih besar dari
R2adjusted fungsi Tukey bisquare, dengan Daftar Pustaka
R2adjusted = 0.9970 = 99.70%
menunjukkan bahwa variansi total Y
sebesar 99.70% dapat dijelaskan oleh [1] Badan Pusat Statistika. 2010.
luas panen (X1) dan luas irigasi teknis Jabar Dalam Angka 2010.
(X2) pada model produksi padi di
[2] Chen, Colin. 2002. Robust
Provinsi Jawa Barat tahun 2009.
Regression and Outlier Detection
with the ROBUSTREG
Dengan demikian, metode yang paling Procedure. Paper 265-267. SAS
baik dalam mengestimasi parameter atau Institute: Cary, NC
koefisien regresi terhadap faktor-faktor [3] Fox, John. 2002. Robuts
yang mempengaruhi jumlah produksi Regression Appendix to An R and
padi di Provinsi Jawa Barat tahun 2009 S-PLUS Companion to Applied
adalah metode regresi robust dengan M- Regression.
estimator menggunakan fungsi [4] Gujarati, Damodar N. 2004. Basic
pembobot Huberyang menghasilkan Econometrics. The McGraw Hill-
model regresi linier setelah dilakukan uji Companies.
– t dan uji F adalah sebagai berikut:
[5] Hisani, Nurul. 2012. Model
= 5.7641 X1i + 0.2761 X2i Regresi Linier Berganda
(17) Menggunakan Penaksir Parameter
Regresi Robust M-estimator
(Iteratively Reweihgted Least
7. Kesimpulan Squares) Melalui Software R
(Studi Kasus: Produksi Padi di
Model produksi padi di Provinsi Jawa
Provinsi Jawa Barat Tahun 2009).
Barat tahun 2009 yang paling baik adalah
Bandung: Skirpsi S1 Matematika
model dengan menggunakan metode
UIN SGD.
regresi robust M-estimator atau
Iteratively Reweighted Least Squares [6] J. Rousseeuw, Peter and M. Leroy
dengan menggunakan fungsi pembobot Annick. 1987. Robust Regression
Huberkarena memiliki nilai and Outlier Detection. Canada:
standarderror (se) yang lebih kecil John Wiley & Sons Inc.
dan nilai R2adjusted yang lebih besar. [7] Norman R. Draper, Harry Smith.
Dengan model regresi linier berganda 1998. Applied Regression
untuk produksi padi di Provinsi Jawa Analysis. USA: John Wiley &
Barat tahun 2009 sebagai berikut: Sons Inc.

92

Anda mungkin juga menyukai