Si 2 ,
1,2
Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Surabaya
Jalan Ketintang, Surabaya
email : mark_elsha@yahoo.com1, hery_trisutanto@gmail.com 2
= ( )+
Regresi nonparametrik bentuk kurva regresi (1) yaitu
diasumsikan tidak diketahui sehingga dapat (1)
digunakan pada pendekatan regresi yang sesuai Fungsi f yang belum diketahui bentuknya
untuk pola data yang tidak diketahui bentuknya, akan diduga dengan model regresi nonparametrik
atau tidak terdapat informasi masa lalu tentang pola spline. Untuk tujuan tersebut kita akan
data (Budiantara,2001b). Kurva regresi hanya mendefinisikan fungsi spline order r dengan titik
diasumsikan mulus (smooth) dalam arti termuat di knot yaitu ξ1, ξ2, ..., ξk pada sebarang fungsi f(x)
dalam suatu ruang fungsi tertentu. Model regresi yang disajikan sebagai berikut :
nonparametrik yang sering mendapat perhatian dari
para peneliti adalah Kernel, Spline, Deret Fourier
dan Wavelets. Diantara model=model regresi
nonparametrik di atas, Spline merupakan model
regresi yang mempunyai interpretasi Statistik dan
1
@6J (BNM − BO)
M /Q
)
HIJ8K6L =
( )= + . + .( ). ( @6J (BJ − BN)
M /(? − Q − 1)
)
−ξ )
Apabila maka
ditolak artinya paling sedikit ada satu J yang
memiliki pengaruh signifikan terhadap
(2) variabel respon.
-. +" # "/" *
Dengan Uji parameter model regresi secara
; ≥ξ
= {! −ξ "
individu bertujuan untuk mengetahui seberapa
( −ξ )
; <ξ
jauh variabel prediktor secara individual
0
(3) dalam menerangkan variasi variabel respon.
Hipotesis dari pengujian secara individu
adalah
, , ), … , , ), , … ,
Dimana :
H0 : βj = 0; artinya variabel prediktor tidak
dan adalah
berpengaruh terhadap variabel
himpunan koefisien atau konstanta real, peubah
respon
C
untuk mendapatkan titik knot optimal adalah Statistik uji
)
DWJ8K6L =
dengan metode Generalized Cross Validation atau
=C>( ))
GCV (Budiantara, 2000) dimana kriteria GCV dapat
,-.(/ , /) , … , / ) = 73 (9 3 4 5
012( , ,…, )
didefinisikan sebagai berikut :
{6 8 :( 3 , 4 ,…, 5 ))}
4
V ditolak apabila XDIJ8K6L X > D(Y,6
(2.19) (6)
)
<=>(/ , /) , … , / ) = ? @0 AB −
4
Dengan yang
F(/ , /) , … , / ) =
dan matrik Pengujian asumsi residual erat kaitannya
Nilai titik knot yang optimal diperoleh dari nilai kriteria terbaik tetapi melanggar asumsi residual
GCV yang minimum. tidak disarankan untuk dipakai untuk
menggambarkan pola hubungan antara variabel
#!*+"%# "!#","(% " % %& ' prediktor dan variabel respon. Untuk itu pengujian
) -%"( %# #!*+"%# *& " residual yang digunakan :
" *%) 0. +" &%)"'% " *%)
Untuk mengetahui signifikansi dari variabel Uji Normalitas bertujuan untuk
prediktor maka dilakukan pengujian parameter mengetahui apakah residual berdistribusi
secara serempak maupun secara individu. normal. Statistik uji yang digunakan adalah
Kolmogorov Smirnov. Hipotesis yang
%. +" #'%(
V
digunakan adalah sebagai berikut.
V
Uji parameter dengan model regresi secara
: Residual berdistribusi normal
serentak dilakukan secara bersamaan terhadap
: Residual tidak berdistribusi
model dengan hipotesis dari pengujian adalah :
normal
H6 ( )
H1 : paling sedikit ada satu βj ≠ 0 ; (7)
2
apabila nilai D lebih kecil dari D tabel yang wanita yang tidak pernah sekolah atau
artinya residual berdistribusi normal. tidak tamat SD/MI, persentase persalinan
yang menggunakan tenaga non medis,
1 &%'"%# % " persentase wanita yang berumah tangga di
Kematian bayi adalah kematian yang terjadi bawah umur 17 tahun, persentase bayi
antara saat setelah bayi lahir sampai bayi belum yang tidak di beri ASI.
berumur tepat satu tahun. Banyak faktor yang 2. Membuat scater plot antara jumlah
dikaitkan dengan kematian bayi.Secara garis besar, kematian bayi dengan masing – masing
dari sisi penyebabnya, kematian bayi ada dua variabel prediktor yang dijadikan deteksi
macam yaitu endogen dan eksogen. awal pola hubungan antara variabel respon
Kematian bayi endogen atau yang umum terhadap variabel prediktor.
disebut dengan kematian neonatal adalah kematian 3. Memodelkan jumlah kematian bayi dengan
bayi yang terjadi pada bulan pertama setelah menggunakan spline linear dengan satu
dilahirkan, dan umumnya disebabkan oleh faktor – titik knot.
faktor yang dibawa anak sejak lahir, yang diperoleh 4. Memilih titik knot optimal berdasarkan
dari orang tuanya pada saat konsepsi atau didapat nilai GCV minimal.
selama bulan kehamilan. 5. Memodelkan jumlah kematian bayi dengan
Kematian bayi eksogen atau kematian post variabel – variabel prediktornya dengan
neo – natal adalah kematian bayi yang terjadi regresi spline dengan knot optimal.
setelah usia satu bulan sampai menjelang usia satu 6. Melakukan pengujian signifikansi
tahun yang disebabkan oleh faktor – faktor dari luar parameter dan pengujian asumsi residual
atau pengaruh lingkungan luar seperti keadaan terbaik pada regresi spline.
sosial ekonomi, jumlah sarana medis, penolong 7. Menginterpretasikan hasil analisis dan
pertama pada kelahiran, jumlah air bersih dan mengambil kesimpulan.
sebagainya.
2
Data yang digunakan dalam penelitian ini Hasil estimasi parameter model regresi
adalah data sekunder yang diperoleh dari hasil spline linear dengan satu variabel prediktor
Susenas 2011 oleh Badan Pusat Statistika (BPS, menggunakan metode weighted least square adalah
B` = ( ` ) +
kabupaten di Jawa Timur.
, a = 1, 2, 3, … , ? ( ` ) didekati
2 model regresi nonparametrik
Dalam penelitian ini terdapat satu variabel ` kurva regresi
2. Jumlah sarana medis ( ), Kemudian diberikan suatu basis untuk ruang Spline
( ) ), {1, ` , `) , … , 6̀ , ( ` − / )6 , … , ( ` − / )6
3. Persentase bayi berat badan lahir rendah berorde n (Budiantara,2001) dengan bentuk:
0 , </
kunjungan kehamilan ( ),
5. Persentase ibu yang tidak melakukan
Untuk setiap fungsi f dalam ruang Spline dapat
( ).
6
6. Persentase bayi yang tidak di beri ASI dinyatakan menjadi :
1 ( )= e ` + e 6( ` − / )6
Untuk dapat memodelkan data Kematian
Dengan e , j = 0,1,...,n,n+1,...,n+m merupakan
Bayi dengan regresi nonparametrik spline maka (8)
akan dilakukan beberapa tahap sebagai berikut :
3
6
` = B` − e − e 6( ` − / )6
penelitian.
` Tabel 1 .Deskripsi Faktor = Faktor yang
Berpengaruh Terhadap Jumlah Kematian Bayi
Untuk setiap a = 1,2,...,n
Jika persamaan di atas dinyatakan dalam bentuk Variabel Mean Min Maks Varians
= B − ( , /)e
matriks, maka diperoleh : y 160,50 23,00 465,00 11890,42
x1 6,11 0,00 48,00 75,77
f !e" = .
Selanjutnya dapat dibentuk suatu fungsi :
g
x2 3,66 1,27 23,24 11,85
Dengan e = Ae , e , … , e , e , … , e E ,
g
x3 9,41 0,00 49,78 162,66
( , /)
px(n+m+1), diberikan oleh : Dari Tabel 1 diketahui bahwa jumlah
6 (
1 ⋯ − / )6 ⋯ ( − / )6
kematian bayi terbesar berada di daerah Surabaya
( ) − /) ) 6 ⋯ ( ) − / ) 6
= h1 ) ⋯ )
sebanyak 465 kasus sedangkan jumlah kematian
6
j
⋮ ⋮ ⋯ ⋮ ⋮ ⋯ ⋮
bayi terkecil berada di daerah Mojokerto dan
e
Dan varians atau keragaman yang cukup besar antara
⋮
kabupaten/kota yaitu 75,77 sehingga menunjukkan
l ⋯ p
6
le p
e=l 6 p
dengan keragaman data sebesar 11,85, sedangkan
le6 p
⋯
adalah dukun paling besar berada di kabupaten
k n o
Sampang sebesar 49,78 persen artinya dari 100
<u?
berikut : mean 11,23 dan persentase bayi yang tidak diberi
)A . E
g
e v w6
ASI eksklusif memiliki keragaman atau varians
<u?
yang kecil 8,04.
= e v w6 ) x!B
− e Eg . !B − e"y
Dengan menggunakan derivatif parsial dapat
zA g . E
diselesaikan dengan cara :
= 0 − 2 g. B + 2 g. e =0
ze
e = ( g. ) g
. B
( , B) = ( g . ) g
. B
Estimator kurva regresi f(x) diberikan oleh :
= ( , B)B
4
Dari tabel 2 terlihat bahwa nilai GCV
B= + + )( − / ) +
sebagai berikut : 5 β9 = -0.3107
)
+ ( ) − /) ) +
β10 = -6.6709
+ {( − / ) + |
+ }( − / ) + ~ + (
Dari tabel 3 diperoleh nilai – nilai estimasi
−/ )
model regresi spline terbaik dengan satu titik knot
dimana telat diperoleh titik knot optimal dengan
Dengan beberapa kali percobaan dalam GCV minimum pada tabel 2 sehingga dapat
membentuk model spline linier dengan 1 knot dibentuk model persamaan regresi spline terbaik
B = 110,8963 + 9,1741
diperoleh titik knot yang optimum berdasarkan dengan satu titik knot sebagai berikut :
+ 16,3098( − 12,00)
GCV minimum. Beberapa titik=titik knot dan GCV
+ 6,4942 )
minimum yang terbentuk disajikan dalam Tabel 4.2
+ 13,5420( ) − 4,48)
Tabel 2 Nilai GCV minimum model spline linear satu
+ 87,0579
titik knot
− 0,0764( − 22,22)
− 0,6556
No x1 x2 x3 x4 x5 GCV
− 0,1164( − 10,27)
1 2,00 1,31 8,87 10,27 4,53 1,02
− 0,3107 − 6,6709(
2 2,00 2,99 8,87 13,57 7,86 1,07
− 4,53)
3 2,00 2,99 22,22 10,27 3,08 1,09
Dari model tersebut didapatkan nilai w)
4 2,00 4,48 22,22 10,27 7,86 1,03
5 12,00 1,31 0,61 13,57 7,86 1,13 sebesar 85,00 persen yang berarti keenam variabel
6 12,00 1,31 8,87 10,27 3,08 1,14 prediktor mampu menjelaskan sebesar 85,00 persen
7 12,00 2,99 7,32 13,57 7,86 1,01 terhadap jumlah kematian bayi di Jawa Timur tahun
2011. Selanjutnya akan diuji apakah residual dari
8 12,00 2,99 8,87 10,27 3,08 1,15
model tersebut berdistribusi normal dan apakah
9 12,00 4,48 22,22 10,27 4,53 1,00 parameter=parameter model signifikan.
10 17,00 2,99 8,87 13,57 3,08 1,04
5
3 H0 ditolak apabila |thit| >t((α/2),(n=m)). Dengan
taraf signifikansi α = 5%, maka diperoleh nilai
ttabel = 2.05, untuk mengetahui parameter yang
signifikan terlihat pada tabel 4.5
4 #!*+"%# "!#","(% " % %& '
Tabel 5. Uji individu estimasi parameter spline
) -%"( linear satu titik knot
Terdapat dua tahap pengujian parameter Estimasi t
regresi, yaitu pengujian secara simultan (uji Xi Parameter hitung Keputusan
serentak) dan secara parsial. Uji β0 =
simultan merupakan pengujian parameter model
Intercept 110.8963 6,0597 Signifikan
regresi secara bersamaan.Sedangkan uji parsial
adalah pengujian parameter model regresi secara 1 β1 = 9.1741 2,0985 Signifikan
satu persatu. Tidak
β2 = 16.3098 1,7849 Signifikan
%. +" #'%(
Untuk mengetahui pengaruh parameter Tidak
secara serentak 2 β3 = 6.4942 1,6353 Signifikan
terhadap model maka dilakukan uji simultan Tidak
dengan hipotesis: β4 = 13.5420 1,6771 Signifikan
H0 : β1 = β2 = … = β10 = 0 3 β5 = 87.0579 2,1432 Signifikan
H1 : paling sedikit ada satu βj ≠ 0 ; β6 = -0.0764 2,5116 Signifikan
j=1,2,…,10 Tidak
4 β7 = -0.6556 1,7602 Signifikan
Tabel 4. Analisis varians model spline β8 = -0.1164 2,9210 Signifikan
Tidak
F F 5 β9 = -0.3107 1,5025 Signifikan
Sumber Derajat Jumlah Rataan Hitung Tabel β10 = -
Variansi Bebas Kuadrat Kuadrat 6.6709 2,2755 Signifikan
Regresi 10 17,8468 4,4982 4,1001 2,143
Residual 27 26,1485 7,263 Dengan menggunakan tingkat signifikansi
Total 37 sebesar 5 persen didapatkan parameter=parameter
yang signifikan yaitu β0, β1, β5, β6, β8, dan β10. Dari
Pada Tabel 4 dapat dilihat bahwa nilai Tabel 5 didapatkan kesimpulan bahwa faktor=faktor
− 0,0764( − 22,22)
− 0,1164( − 10,27)
-. +" # "/" *
Untuk mengetahui parameter mana saja
− 6,6709( − 4,53)
yang berpengaruh terhadap model spline
dilakukan uji individu dengan hipotesis
sebagai berikut :
H0 : βj = 0; artinya variabel prediktor tidak 5 #!*+"%# *& " " *%)
berpengaruh terhadap variabel Pengujian asumsi residual erat kaitannya
respon dengan kelayakan model regresi.Suatu model
H1 : βj ≠ 0 ; j=1,2,…,10 ; artinya variabel regresi dengan parameter signifikan dan memenuhi
kriteria terbaik tetapi melanggar asumsi residual
prediktor berpengaruh tidak disarankan untuk dipakai untuk
terhadap variabel respon menggambarkan pola hubungan antara variabel
6
prediktor dan variabel respon. Uji Asumsi Residual 85,00 % dan nilai GCV minimal 1,00 dengan faktor
yang digunakan adalah – faktor yang berpengaruh pada jumlah kematian
V
Smirnov dengan hipotesis :
V
: Residual berdistribusi normal
: Residual tidak berdistribusi [1] Agung, Ngurah IG.1988.Garis+Patah
normal Paritas.Yogyakarta: Pusat Penelitian
terima V
sebesar 0,08913. Karena Pvalue > α maka 87687623.pdf).diakses tanggal 27 Juli 2011.
artinya model spline telah [3] Budiantara, I.N, Dewi, Riana Kurnia. Faktor+
memenuhi asumsi normal. Faktor yang Mempengaruhi Angka Gizi Buruk
Di Jawa Timur dengan Pendekatan Regresi
Setelah model spline linear dengan satu NonparametrikSpline.(online:http://ejurnal.its.
titik knot telah memenuhi uji signifikasi parameter ac.id/index.php/sains_seni/article/download/19
dan uji asumsi residual maka hasil estimasi 68/323.pdf). Diakses tanggal 7 Desember
parameter model spline linear dengan satu titik knot 2012.
− 0,0764( − 22,22)
Regresi Spline Multivariabel untuk Pemodelan
− 0,1164( − 10,27)
Kematian Penderita Demam Berdarah
− 6,6709( − 4,53)
Dengue (DBD) di Jawa Timur.(online:
http://ejurnal.its.ac.id/index.php/sains_seni/arti
− 0,0764( − 22,22)
26 November 2010.
− 0,1164( − 10,27)
[10] Wahba,Grace.1990 Spline Models for
− 6,6709( − 4,53)
ObservationalData Philadelphia.Pennsylvania.
[11] Wegman, J Edward dkk.Spline in
Model regresi nonparametrik spline diatas Statistics.Journal of the American Statistical
merupakan model yang terbaik dimana nilai R2 = Assosiation : America.