Anda di halaman 1dari 9

Prosiding Seminar Nasional Matematika, Universitas Udayana, 6 November 2014

ESTIMASI KURVA REGRESI


SEMIPARAMETRIK SPLINE UNTUK DATA
LONGITUDINAL
Bobby Poerwanto 1 dan I Nyoman Budiantara 2
1
Mahasiswa Magister Statistika, FMIPA, ITS, Surabaya
Email: 1 bobbybp89@gmail.com
2
Jurusan Statistika, FMIPA ITS, Surabaya
Email: 2 i_nyoman_b@statistika.its.ac.id

Abstrak

Secara umum analisis regresi bertujuan untuk menyelidiki apakah terdapat hubungan
antara variabel respon dengan variabel prediktor. Pola hubungan antara variabel
respon dan variabel prediktor tidak diketahui polanya sehingga digunakan
pendekatan nonparametrik sedangkan semiparametrik terdapat variabel prediktor yang
merupakan komponen parametrik dan variabel prediktor lainnya merupakan
komponen nonparametrik. Spline merupakan salah satu pendekatan semiparametrik
yang sering digunakan dan memiliki kemampuan yang sangat baik menangani
karakter data yang bersifat smooth serta data yang perilakunya berubah-ubah pada sub-
sub interval tertentu [1]. Secara teoretis pendekatan spline tidak hanya mampu
mengestimasi kurva regresi nonparametrik untuk data cross section, tetapi juga
dapat dikembangkan untuk data longitudinal yang merupakan data pengamatan
berulang-ulang pada suatu unit percobaan. Model regresi semiparametrik untuk data
longitudinal yang diberikan oleh persamaan

yij kj xkij f r trij ij


q R

k 1 r 1

i 1, 2, , n ; j 1, 2,
, p dan f r trij dihampiri oleh fungsi spline

f r trij ars trijs u trij K ru


m U
m

s 1 u 1

Selanjutnya estimasi parameter ij dan f r trij diperoleh dari optimasi weighted


least square
2

f t
p R n q
min N w y x
1


B f
ij ij
kj kij r rij
,
i 1 j 1 k 1 r 1
Penyelesaian optimasi ini memberikan :
m U
a t s t K
q
m
y x
ij k 1
kj kij s 1
rs rij
u 1
u rij ru


' 1
11 , , pn , a11 , , arm ,1 , ,U X k WX k X k WY
' '

Kata kunci : Data Longitudinal, Spline, Regresi Semiparametrik, Weighted Least


Square
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)

1. Pendahuluan
Analisis regresi adalah sebuah metode dalam statistika yang digunakan untuk
mengetahui pola hubungan antara variabel prediktor dan variabel respon dan dapat juga
digunakan untuk forecasting (meramal). Disamping konsep ini kita juga dapat membuat
scatter plot untuk mengetahui model dari regresi ini. Berdasarkan scatter plot para
statistikawan mencocokkan bentuk pola data dengan berbagai macam kurva yang sudah
dikenal dalam matematik seperti linear, kuadratik, kubik, eksponensial dan yang
lainnya. Pola data tersebut didekati dengan regresi parametrik (Gujarati, [5]). Dalam
prakteknya, tidak semua data mengikuti pola tertentu sehingga regresi parametrik yang
apabila dipaksakan untuk digunakan akan memberikan kesimpulan yang menyesatkan
(Samsodin, [8]). Regresi nonparametrik adalah pendekatan model yang mengasumsikan
pola kurva tidak diketahui dan termuat di dalam suatu fungsi tertentu, seperti ruang
Sobolev [ ] , ruang fungsi-fungsi kontinu , ruang Hilbert, ruang entropi
dan yang lainnya (Budiantara, [1]). Oleh karna itu dengan menggunakan pendekatan ini
model yang didapatkan akan lebih baik karna data diharapkan mencari sendiri bentuk
estimasi modelnya tanpa dipengaruhi subyektifitas oleh peneliti dan juga pendekatan ini
sangat fleksibel (Eubank, [4]). Di dalam pendekatan regresi nonparametrik terdapat
beberapa metode yang mendapatkan perhatian dan sering digunakan oleh para peneliti
antara lain kernel, spline , deret Fourier, dan Wavelet. Beberapa pendekatan ini khususnya
spline telah banyak digunakan dalam berbagai bidang ilmu, seperti bidang kedokteran,
Pharmacology, ekonomi dan lainnya (Zaky, [9]). Spline merupakan salah satu dari
pendekatan regresi nonparametrik yang mempunyai interpretasi statistik dan interpretasi
visual sangat khusus dan dangat baik (Eubank, [4]) disamping itu spline mampu
menangani karakter data yang bersifat mulus (smooth) (Lestari, dkk [6]). Spline juga
memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-
ubah pada sub-sub interval tertentu (Budiantara, [2]). Estimator spline dan spline
parsial secara teoritis dan praktis tidak hanya mampu menangani data cross section,
tetapi dapat digeneralisasikan untuk data longitudinal. Salah satu kelebihan data
longitudinal dibdandingkan data cross section adalah lebih andal dalam mencari
jawaban tentang dinamika perubahan (Nurdini, [7]).
Model semiparametrik, dalam beberapa literatur disebut juga dengan model linea r
parsial (partial linear model, partially linear model, partly linear model, partial spline
model), memuat dua komponen sekaligus, yaitu komponen parametrik dan
nonparametrik. Model ini lebih fleksibel daripara model linear karena keberadaan dua
komponen ini akan mengakomodasi hubungan antara respon dengan prediktor yang
bersifat linear, dan hubungan antar respon dengan prediktor yang bersifat nonlinear (Engle
[3]).
Dalam penelitian ini akan dikaji bentuk estimator kurva regresi semiparametrik
spline untuk data longitudinal dengan menggunakan metode Weighted Least Square
(WLS). metode weighted least square (WLS) mendefinisikan estimasi parameter
sebagai suatu nilai yang meminimumkan jumlah kuadrat antara pengamatan dan model
yang disebut jumlah kuadrat error yang didefinisikan sebagai:
TW ( y X )T W ( y X )
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)

2. Metode Penelitian
Estimasi kurva regresi semiparametrik spline untuk data longitudinal mempunyai
langkah-langkah sebagai berikut:
a. Diberikan model regresi semiparametrik spline truncated
yij kj xkij f r trij ij i 1, 2,
q R
, n ; j 1, 2, ,p
k 1 r 1

b. Mendekati komponen nonparametrik f r (trij ) dengan fungsi spline

f r trij ars trijs u trij K ru


m U
m

s 1 u 1

c. Menyatakan bentuk model regresi semiparametrik untuk data longitudinal



q
R m U
m
y x a t t K
s

ij
k 1
kj kij
r 1 s 1
rs rij
u 1
u rij ru ij
d. Menganalisis fungsi sehingga diperoleh estimasi parameter dengan cara
menyelesaikan optimasi weighted least square
2
p q

f t
n R
min N w y 1
x

B f
ij ij
kj kij r rij
,
i 1 j 1 k 1 r 1
e. Memperoleh estimasi spline dalam model regresi semiparametrik berikut:

q
R m U
m
yij kj xkij ars trij u trij K ru


s

r 1 s 1

k 1 u 1


' 1
11 , , pn , a11 , , arm , 1 , , U X k WX k X k WY
' '

3. Hasil dan Pembahasan

Model regresi semiparametrik spline untuk data longitudinal diberikan sebagai


berikut:

q
R m U
m
y x a t t K
s

, i 1, 2,..., n; j 1, 2,..., p
ij
k 1

kj kij r 1 s 1 rs rij u 1 u rij ru ij
Model ini memuat n subjek dengan subjek ke i sebanyak p pengamatan dan dapat
diuraikan sebagai berikut
q R
m U
m
Untuk i 1 dan j 1 : y11 k1 xk11 ars tr11
s
u tr11 Kru 11

k 1 r 1 s 1 u 1
s

q R
m U
m
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)
i 1 dan j n : y1 p kp xk 1p ars tr 1p u tr 1p Kru 1p


k 1 r 1 s 1 u 1
q R
m U

i 2 dan j 1 : y21 k1 xk 21 ars trs21 u tr 21 Kru 21
m

k 1 r 1 s 1 u 1
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)

m

q R U
i 2 dan j n : y2q kp xk 2 p ars trs2p u tr 2p Kru
m
2p

k 1 r 1 s 1 u 1

q R
m U

i n dan j 1 : yn1 k1 xkn1 ars trn1 u trn 1 Kru n 1
s m

k 1 r 1 s 1 u 1

R
t
q m U
m
i n dan j p : y x a t s K
np kp knp rs
r 1 s 1
rnp
k 1 u 1
u rnp ru
np

Selanjutnya mendekati f r (trij ) dengan fungsi spline berorde m dan dan knot

K11 , K12 ,..., K1U , K21 , K 22 , K2U ,..., K R1 , K R 2 , K RU yaitu:

f r trij ars trijs u trij K ru


m U m

s 1 u 1

Dengan 11 , 12 ,...,1m , 21 , 22 ,..., Rm ,1 ,2 ,...,U adalah parameter-parameter yang

belum diketahui serta truncated function trij K ru didefinisikan sebagai


m

t rij K ru
m trij K ru , trij K ru


0 , trij K ru

Berdasarkan penjabaran di atas, persamaan-persamaan tersebut dapat disajikan dalam


bentuk matriks berikut :
y1 X 1 K 0 B1 e1
0
y
2 0 X 2 K 0 B2 e2
0


yp 0 0 X p K Bp e p

Dimana vektor responnya


y j yij ynj , j 1, 2,..., p
'
y2 j

Vector prediktornya
x t K11 t K 1U t K R1 t
m m m m
K RU
m m
x t
q1 j 11 j
t11 j 11 j 11 j
t R1 j t R1 j R1 j R1 j
111


t K11 t K 1U t K R 1 t
m m m m
K RU
m m
x t
q2 j 12 j
t12 j 12 j 12 j
t Rnj t Rnj Rnj R2 j
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)
x121
X [K ]
j


x t K11 t t K R 1 t
m m
K 1U
m m
K RU
m m
1 n1
xqnj t1 nj t1 nj 1 nj 1 nj
t Rnj t Rnj Rnj Rnj
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)

Vektor parameternya yaitu;


'
B j B1 j , B2 j ,..., Bnj , j 1, 2,..., p

dimana

'
Bij 1 j ,... q1 , a11 ,..., a1m , 1,..., U , a 21,..., a 2 m , 1,..., U ,..., a R1,..., a Rm, 1, ..., U

i 1, 2,..., n; j 1, 2,..., p
Dan Vektor errornya

'
e j 1 j , 2 j ,..., nj

Dengan demikian model regresi nonparametrik multivariabel spline untuk data


longitudinal dapat dinyatakan dalam notasi matriks sebagai berikut
Y X[K ]B e
Selanjutnya dengan menggunakan matriks pembobot W, estimasi B pada
persamaan di atas dapat diperoleh dengan menyelesaikan optimasi WLS

min Y X[K ]B W Y X[K ]B
B, f
'

Dengan matriks W yaitu
1
2 0 0
1

0
1
0 22
W

0

0 1
0
2p

Penyelesaian optimasi di atas dilakukan dengan penjabaran sebagai berikut

Y X[K ]B W Y X[K ]B Y WY 2X [K ]B WY X [K ]B WX[K ]B


' ' ' ' ' '

Misalkan,
Q Y' WY 2X'[K ]B' WY X'[K ]B'WX[K ]B , maka
Q
' 2X [K ]WY 2X [K ]WX[K ]B
' '

B
Nilai minimum dari Q diperoleh dari
Q
0
B'
Selanjutnya diperoleh
2X'[K ]WY 2X'[K ]WX[K ]B 0
X'[K ]WY X' [ K ]WX '[ K ]B 0
X'[K ]WX[K ]B X'[K ]WY
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)

Akhirnya diperoleh

B X' [K ]WX[K ]
1
X'[K ]WY
Berdasarkan estimasi B pada persamaan diatas, maka diperoleh :
Y X[K ]B

1
X[K ] X' [K ]WX[K ] X'[K ]WY
A[K ]Y
Dimana,

1
A[K ] X[K ] X' [K ]WX[K ] X'[K ]W
Terlihat bahwa estimator ini tergantung pada nilai knot, pemilihan titik knot optimal
bisa dilakukan dengan berbagai metode, salah satunya adalah Generalized Cross
Validation (GCV).
N 1Y ' I A(K , K ,..., K ) W I A(K , K ,..., K ) Y
'

GCV (K ru ) r1 r2 rU r1 r2 rU

N trace I A(K r1 , K r 2 ,..., K rU )


1 2

4. Kesimpulan

Berdasarkan analisis dan penjabaran rumus untuk mengestimasi kurva regresi


semiparametrik spline untuk data longitudinal, maka diketahui bahwa

1
B X' [K ]WX[K ] X'[K ]WY
adalah estimator yang didapatkan dengan optimasi WLS untuk kurva regresinya dengan
pemilihan titik knot dengan menggunakan GCV.

5. Ucapan Terima Kasih

Ucapan terima kasih yang sebesar-besarnya kami berikan untuk DIKTI karna
telah memberikan beasiswa calon dosen BPPDN sehingga kami dapat melanjutkan studi
magister di Institut Teknologi Sepuluh November

Daftar Pustaka

[1] Budiantara, I.N., (2000), Metode U, GML, CV dan GCV Dalam Regresi
Nonparametrik Spline, Majalah Ilmiah Himpunan Matematika Indonesia
(MIHMI), 6, 285-290
[2] Budiantara, I.N. (2007), Pendugaan Model Fertilitas Wanita di Indonesia dengan
Menggunakan Regresi Spline, Laporan Akhir Pelaksanaan Penelitian Studi Kajian
Wanita Tahun Anggaran 2007, LPPM, Intitut Teknologi Sepuluh Nopember,
Surabaya
[3] Engle, R.F., Granger, C.W.J., Rice, J., Weiss, A., 1986. Semiparametrik estimates
of the relation between weather and electricity sales. J. Amer. Statist. Assoc. 81
(394), 310320
Bobby Poerwanto, I Nyoman Budiantara (Estimasi Kurva Regresi Semiparametrik Spline Untuk Data Longitudinal)

[4] Eubank, R.L. 1988, Nonparametrik Regression and Spline Smoothing, New York,
Marcel Dekker
[5] Gujarati, D., (2004), Basic Econometrics, 4th Edition, McGraHill. Co, New York
[6] Lestari, B., Budiantara, I N., Sunaryo, S., Mashuri, M., 2012. Response
Nonparametric Regression Model in Case of Heteroscedasticity of Variance.
Journal of Mathematics and Statistics (JMS). 8(3), 377-384
[7] Nurdini, Alis., 2006. Cross-Sectional Vs Longitudinal : Pilihan Rancangan Waktu
Dalam Penelitian Perumahan Permukiman. Dimensi teknik arsitektur ,34, 52-58
[8] Samsodin, M. (2012), Regresi Spline Polynomial Truncated Multirespon untuk
Pemodelan Indikator Kemiskinan di Provinsi Jawa Timur, Tesis, Institut
Tekhnologi Sepuluh Nopember, Surabaya
[9] Zaki, Ahmad. (2007). Pengujian Hipotesis dalam Model Spline pada Regresi
Nonparametrik. Tesis. Jurusan Statistika Fakultas Matematika dan Ilmu
Pengetahuan Alam Institut Teknologi Sepuluh Nopember.

Anda mungkin juga menyukai