Anda di halaman 1dari 19

PENCOCOKAN MODEL ADITIF TERGENERALISIR SEMIPARAMETRIK MENGGUNAKAN PENDEKATAN ESTIMATOR SPLINE

ARTIKEL ILMIAH

Artikel Ilmiah Ini Diambil Dari Sebagian Skripsi Untuk Memenuhi Persyaratan Penyelesaian Program Sarjana Sains Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember

Oleh : EKA WIDI HANDAYANI NIM 011810101124

JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS JEMBER 2006

PENGESAHAN

Artikel ini diterima oleh Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember pada : Hari : Tanggal : Tempat : Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember

Dosen Pembimbing,

Ketua (Dosen Pembimbing Utama)

Sekretaris (Dosen Pembimbing Anggota)

Drs. I Made Tirta, M.Sc., Ph.D. NIP 131 474 500

Drs. Budi Lestari, PGD.Sc., M.Si. NIP 131 945 800

PENCOCOKAN MODEL ADITIF TERGENERALISIR SEMIPARAMETRIK MENGGUNAKAN PENDEKATAN ESTIMATOR SPLINE


Fitting of Generalized Additive Semiparametric Models Using Spline Estimator Approach Eka Widi Handayani1, I Made Tirta2, Budi Lestari2 Mahasiswa Jurusan Matematika FMIPA Universitas Jember 2 Staf Pengajar Jurusan Matematika FMIPA Universitas Jember
1

ABSTRACT Generalized Additive Semiparametric Model is an analysis model by using both parametric and nonparametric approaches. The parametric component is determinated by scatterplot smoother and determinant coefficient, R 2 , i.e., by large value of determinant coefficient R 2 means that we can use a linear model (parametric model) approach. In this paper, we investigate the estimate model by using spline estimator which is applied to the evaporation data. The result showed that moisturizer and wind speed give a significant influence to the evaporation. Key Words: Generalized Additive Semiparametric Model, Scatterplot Smoother, Determinant Coefficient, Spline ABSTRAK Model aditif tergeneralisir semiparametrik merupakan model analisis dengan menggunakan pendekatan parametrik dan nonparametrik. Penentuan komponen parametrik dan nonparametrik dilakukan dengan menggunakan scatterplot smoother dan koefisien determinasi R 2 , dengan koefisien determinasi R 2 yang besar menunjukkan model yang lebih cocok jika didekati dengan menggunakan pendekatan linier (parametrik). Tulisan ini bertujuan untuk mengetahui bentuk estimasi model menggunakan estimator spline dan aplikasinya pada data evaporasi. Dari hasil penelitiam diperoleh bahwa kelembaban dan kecepatan angin memberikan pengaruh yang signifikan terhadap evaporasi. Kata Kunci: Model Aditif Tergeneralisir Semiparametrik, Scatterplot Smoother, Koefisien Determinasi, Spline

PENDAHULUAN Kondisi data riil di lapangan yang sangat kompleks mendorong munculnya berbagai macam model baru yang lebih fleksibel seperti model aditif tergeneralisir (Generalized Additive Model) yang digunakan untuk mengidentifikasi dan mengelompokkan fungsi nonlinier. Model ini diasumsikan berdistribusi keluarga eksponensial dan memiliki fungsi link. Hastie (1990) menyebutkan bahwa metode penghalusan dan algoritma yang digunakan dalam pencocokan model ini terdiri dari penghalus diagram pencar (scatterplot smoother), algoritma backfitting, dan algoritma local scoring. Adapun metode penghalusan yang dapat memberikan suatu hasil analisis numerik yang lebih baik menurut Hastie (1990) adalah penghalus spline. Oleh karena itu dalam tulisan ini metode penghalusan yang digunakan adalah metode penghalusan spline (smoothing spline method) dan permasalahan yang dibahas dalam penelitian ini yakni mengetahui bentuk estimasi dan penghalus spline serta aplikasinya pada data evaporasi (penguapan). TINJAUAN PUSTAKA Model linier paling sederhana menurut Ratih (2000) adalah model regresi linier sederhana yang hanya melibatkan satu variabel respon dan satu variabel prediktor. Model linier diformulasikan sebagai berikut:
= +
p

j =1

j +e

(1)

dengan adalah variabel respon; sebagai variabel prediktor; 1, 2 , ..., p

, merupakan koefisien linier; dan e adalah galat (error). Model ini 1 , ..., p
kemudian digeneralisir menjadi model linier tergeneralisir (Generalized Linear Model) untuk memenuhi suatu kondisi ketika variabel respon tidak berdistribusi normal tetapi masih saling bebas. Sehingga menurut Tirta (2003), komponen-komponen penting dalam model linier tergeneralisir yaitu prediktor linier; distribusi keluarga eksponensial dan fungsi hubungan yang differensiabel.

Model aditif (Additive Model), menurut Hastie dan Tibshirani (1990), merupakan generalisasi atau bentuk pengembangan dari model linier pada persamaan (1). Sama dengan model linier, model aditif juga diasumsikan berdistribusi normal dengan fungsi yang tidak harus linier. Prediktor pada model aditif disebut dengan prediktor aditif. Model aditif dapat ditulis sebagai berikut:
= + f j ( j ) + e
p j =1

(2) dengan f 1 , f 2 , ..., f p adalah fungsi dari prediktor; dan e adalah galat. Menurut Bashet dan Bishop (2005), model aditif disebut sebagai model nonparametrik jika koefisien linier dalam persamaan (1) digantikan oleh penghalus 1, 2 , ..., p
s1 , s 2 , ..., s p . Sehingga model aditif juga dapat dituliskan dalam bentuk persamaan

sebagai berikut:
( ) = s0 + s j ( j )
j =1 p

(3) dengan s j ( j ) , untuk j =1, 2, ..., p , sebagai fungsi licin (smooth function). Model
+ ( ) +e . aditif dapat dikombinasikan sebagai model semiparametrik =

Model aditif dapat digunakan untuk menganalisis hampir semua jenis data, tetapi terdapat beberapa macam persoalan yang tidak tepat jika diselesaikan dengan menggunakan model aditif seperti pada persamaan (2). Misalnya, distribusi normal tidak tepat untuk data diskrit yang didapat dari hasil pencacahan, sehingga diperlukan model baru dengan bentuk distribusi yang lebih luas dan fleksibel yakni model aditif tergeneralisir yang menggeneralisir model aditif ke dalam bentuk distribusi keluarga eksponensial selain distribusi normal. Model aditif tergeneralisir juga memuat komponen acak, komponen tetap yakni prediktor aditif dan fungsi link yang menghubungkan komponen acak dengan prediktor aditif tersebut. Model ini mirip dengan model linier tergeneralisir, kecuali jika fungsi licinnya digunakan untuk menggantikan parameter regresinya. Salah satu aspek yang unik dari model aditif

tergeneralisir adalah fungsi nonparametrik yang diestimasi menggunakan penghalus diagram pencar yang merupakan pondasi dari algoritma model aditif tergeneralisir. Berikut diberikan contoh penghalus diagram pencar dalam bentuk sederhana (Gambar 1) yang mengindikasikan bagaimana penghalus diagram pencar digunakan untuk menggambarkan estimasi pada model aditif tergeneralisir.

Gambar 1: Ilustrasi Penghalus Spline. Gambar kiri menunjukkan diagram pencar samaran dari plot variabel respon terhadap variabel prediktor X. Gambar kanan, penghalus diagram pencar telah ditambahkan untuk menggambarkan kecenderungan ( trend) variabel respon terhadap variabel prediktor X (Sumber: Hastie dan Tibshirani, 2004).

Hastie dan Tibshirani (1990), membahas berbagai macam penghalus diagram pencar. Salah satu dari penghalus diagram pencar tersebut adalah penghalus spline yang merupakan solusi dari:

(4)

i= 1

( yi f ( xi )) 2 + ( f " ( x)) 2 dx = S ( x)
a

dengan adalah parameter penghalus dalam interval 0 < < 1 . Nilai besar akan menghasilkan kurva yang mulus, sedangkan kecil akan menghasilkan gambar kurva yang kasar. Suku pertama pada persamaan (4) digunakan untuk mengukur kerapatan data, sedangkan suku kedua memperlihatkan kurva suatu fungsi. Salah satu penghalus spline adalah spline kubik dengan titik perubahan yang terjadi di dalam suatu kurva

disebut dengan titik knots. Model spline kubik dapat dituliskan sebagai berikut (Budiantara dan Subanar, 1997):
S ( x) = 0 j j + i ( t i ) 3 +
j =0 i =1 3 k

(5)

3 ( t ) , jika ti 0 3 i dengan, ( t ) = i+ , jika ti < 0 0


Dalam model aditif tergeneralisir terdapat dua algoritma perulangan terpisah yang digunakan yaitu algoritma backfitting (innerloop) dan algoritma local scoring (outerloop). Algoritma backfitting merupakan algoritma perulangan yang digunakan untuk mengestimasi model aditif dengan menggunakan beberapa tipe regresi penghalus, Algoritma ini dimulai dengan memberikan fungsi inisial s 0 , s1 , ..., s p . Masingmasing iterasi berputar melalui residu parsial dan mengestimasi komponen-komponen fungsi licin ke dalam residu parsialnya sampai komponen dari fungsi licin tidak berubah atau sudah memenuhi kriteria kekonvergenan. Dengan cara yang sama, estimasi bentuk aditif s1 , s 2 ,... , s p pada persamaan (3) diselesaikan dengan mengganti regresi linier terbobot dalam regresi variabel dependen biasa dengan algoritma backfitting terbobot untuk mengestimasi model aditif terbobot yang dikenal dengan algoritma local scoring. Algoritma ini dimulai dengan mengestimasi fungsi inisial s 0 , s1 , ..., s p dan selama masing-masing iterasi, variabel dependen biasa dan bobot dihitung, kemudian fungsi licin diestimasi dengan menggunakan algoritma backfitting terbobot hingga memenuhi kriteria kekonvergenan. Dalam pemilihan parameter penghalus terdapat beberapa metode yang digunakan yakni validasi silang (Cross Validation) sebagai berikut: CV ( ) = (6) 1 n 1 ( yi ( xi )) 2 n i =1

1 ( xi ) menyatakan kecocokan pada saat xi (Hastie dan Tibshirani, 1990). dengan

Karena memerlukan waktu yang lama untuk menghitung jumlah aii maka Wahba (1990) memperkenalkan generalisir dari validasi silang yakni validasi silang tergeneralisir (Generalized Cross Validation) dan didefinisikan sebagai berikut:
n

GCV ( ) =
(7)

( y
i =1

( xi )) 2

(n tr ( A( )))2

Dalam GCV tidak terdapat elemen diagonal aii seperti pada formula validasi silang, dan diganti dengan tr ( A()) / n . Selain itu juga digunakan statistik AIC (Akaike Information Criterion) yang diformulasikan sebagai berikut: AIC = (8) nilai perhitungan statistik AIC yang lebih kecil menunjukkan formulasi model yang lebih bagus. Model semiparametrik merupakan model gabungan antara model parametrik dengan nonparametrik. Misal diberikan suatu model = f ( ) + e , model ini disebut sebagai model parametrik jika fungsi f jelas atau diketahui. Model parametrik ini didasarkan pada asumsi-asumsi yang mengikuti suatu bentuk distribusi tertentu. Sebaliknya, jika fungsi f tidak didasarkan pada suatu bentuk distribusi tertentu dengan hubungan fungsi yang juga tidak diketahui, linier atau tidak, maka model ini disebut sebagai model nonparametrik. Sehingga model semiparametrik dapat ditulis sebagai berikut (Hastie dan Tibshirani, 1990):
( , t ) = + j j + (t ) + e
j =1 p

1 n ) + 2tr ( A()) D( yi ; n n i =1

(9) METODE PENELITIAN Ada dua macam sumber data yang digunakan dalam penelitian ini yakni data simulasi yang dibangkitkan melalui program R dan data riil yang merupakan data

sekunder mengenai agroklimatologi (evaporasi, kelembaban, dan kecepatan angin) dari sub proyek Pekalen, Sampean, bulan November 2004. Data riil ini diperoleh dari Kantor Pengairan Kabupaten Jember dengan komponen sebagai berikut: a. data evaporasi sebagai variabel responnya ( ); b. data kecepatan angin ( dan kelembaban ( sebagai variabel 1 ) 2 ) prediktornya. Dalam analisis data, proses pertama yang dilakukan adalah menyusun data sampel observasi. Data tersebut dijadikan sebagai input program yang kemudian akan dijalankan dalam paket R. Secara umum langkah-langkah penyusunan data tersebut yakni melakukan identifikasi data dan melakukan analisis data dengan prosedur GAM. Sebelum menganalisis data riil, terlebih dahulu dilakukan analisis data simulasi yang dibangkitkan melalui program paket R dengan langkah-langkah sebagai berikut: a. membangkitkan variabel prediktor 1, 2 , ..., n ; b. membangkitkan nilai estimasi untuk komponen parametrik; c. membangkitkan fungsi licin untuk komponen nonparametrik; d. membangkitkan nilai galat; e. membangkitkan nilai variabel respon ; f. melihat ukuran letak data; g. melihat sebaran distribusi data simulasi; h. melihat dan memeriksa kelinieran data simulasi; i. menganalisis model menggunakan prosedur dalam GAM. Sedangkan langkah-langkah untuk menganalisis data riil yakni: a. memasukkan data pengamatan dalam paket R; b. melihat ukuran letak data dan sebaran data; c. melakukan identifikasi data pengamatan, melihat komponen parametrik dan nonparametrik data dengan melihat kelinieran melalui scatterplot data; d. menganalisis data riil menggunakan prosedur GAM; e. melihat sebaran data riil; f. melakukan uji hipotesis, hipotesis ditolak ketika nilai-P kurang dari = 0,05 ;

g. mengambil keputusan dan kesimpulan. HASIL DAN PEMBAHASAN Data simulasi yang dibangkitkan melalui program paket R digunakan untuk menguji teori-teori dan asumsi-asumsi yang ada dalam penelitian ini. Setelah asumsiasumsi yang ada terpenuhi selanjutnya teori-teori tersebut diterapkan dalam analisis data riil. Ada dua macam variabel prediktor dalam analisis data simulasi, yakni variabel
prediktor dan dimodelkan secara parametrik 1 2 . Variabel prediktor 1

sedangkan variabel prediktor 2 dimodelkan secara nonparametrik. Jumlah sampel pengamatan yang dibangkitkan dalam penelitian ini ada 30 sampel (n=30) dengan simpangan baku =2 . Untuk menunjukkan adanya korelasi atau hubungan antara variabel prediktor dengan variabel respon pada data simulasi digunakan perintah scatterplot matrix sebagai berikut:
scatterplot.matrix(~y+x1+x2,reg.line=lm,smooth=TRUE,diagonal='hi stogram')

Perintah scatterplot matrix di atas memberikan hasil seperti pada Gambar 2 berikut ini.
0.0 0.2 0.4 0.6 0.8 16 Frequency 12

0.0

Frequency

x 0.4

x0

0.8

Frequency

x1

10 12 14 16

0.0

0.2

0.4 x

0.6

0.8

1.0

Gambar 2 Scatterplot Matrix Data Simulasi

Pada Gambar 2, diagonal gambar menunjukkan histogram data sedangkan luar diagonal menunjukkan scatterplot dari data simulasi. Dalam scatterplot matrix tersebut, hubungan antara variabel prediktor 1 dengan variabel respon lebih cocok jika digunakan pendekatan linier karena data menyebar lurus mengikuti garis regresinya, sedangkan hubungan antara variabel prediktor 2 dengan variabel respon lebih

0.0

0.4

0.8

cocok jika digunakan pendekatan nonlinier. Hasil tersebut menunjukkan bahwa dalam analisis selanjutnya variabel prediktor 1 dimodelkan sebagai komponen parametrik dan variabel prediktor
2

sebagai komponen nonparametrik yang diestimasi

menggunakan penghalus spline. Pada data simulasi akan digunakan perbandingan dari beberapa titik knots guna mencari model spline optimal. Tabel 1 berikut menyajikan ringkasan statistik nilai GCV dengan berbagai titik knots untuk memperoleh model spline optimal.
Tabel 1 Nilai GCV Untuk Berbagai Titik Knots Pada Data Simulasi Model Pendekatan Nilai GCV Spline dengan knots 0,3 4,5450 Spline dengan knots 0,7 4,3344 Spline dengan knots 0,8 4,3298 Spline dengan knots 0,3 dan 0,7 4,7078 Spline dengan knots 0,3 dan 0,8 4,7078 Spline dengan knots 0,7 dan 0,8 4,7144 Spline dengan knots 0,3; 0,7 dan 0,8 5,1444 Catatan: Hasil diperoleh dengan menggunakan program R Nilai R 2 0,357 0,387 0,388 0,362 0,362 0,361 0,333

Dari bermacam-macam model pendekatan spline yang diberikan pada Tabel 1 didapat model spline optimal dengan titik knots 0,8 (cetak tebal) karena memiliki nilai GCV minimum yakni sebesar 4,3298. Ringkasan statistik model spline optimal dengan titik knots 0,8 untuk komponen parametrik 1 dan nonparametrik 2 disajikan pada Tabel 2 berikut ini.
Tabel 2 Ringkasan Statistik Model Spline Optimal Untuk Komponen Parametrik dan Nonparametrik

Parameter

Estimasi 7,99 0,94 -0,34 -4,23

Standar Kesalahan 1,81 1,48 4,24 3,89

Nilai t 4,42 0,63 -0,08 -1,09

Nilai-P 0,02x10-2 *** 0,53 0,94 0,29

0 0
11
21
22

23

6,40 2,86

3,27 2,41

1,96 1,19

0,06 0,25

24

Catatan: 1. hasil diperoleh dengan menggunakan program R (umum); 2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus); . signifikan pada 10%, *** signifikan pada 0,1%.

Ringkasan analisis pada Tabel 2 memberikan model spline kubik dengan titik knots optimal 0,8 sebagai berikut:
3 = 00 1 2 + 11 1 + 21 2 + 22 2 2 + 23 2 + 24 ( 2 t ) + 3 3 = 7,99 + 0,94 1 0,34 2 4,23 2 2 + 6,40 2 + 2,86 ( 2 0,8) + 3

3 ( 0 , 8 ) , 2 0,8 3 2 dengan, ( 0,8) = 2 + , 2 < 0,8 0


Model spline kubik tersebut memiliki nilai koefisien determinasi R 2 sebesar sebesar 38,8% yang berarti bahwa variabel prediktor 1 dan 2 mampu menjelaskan 38,8% dari variabel respon . Berikut diberikan Gambar 3 yang menunjukkan gambar penghalus spline untuk data simulasi.
4 bs(x2, knots = 0.8) 0.2 0.4 x1 0.6 0.8 1.0 partial for x1 2 4 -4 0.0 -2 0 2 6

-4

-2

0.2

0.4 x2

0.6

0.8

Gambar 3 Penghalus Spline Dengan Titik Knots Optimal Pada Data Simulasi

Ringkasan Analisis Variansi untuk model spline kubik optimal dengan titik knots optimal 0,8 diberikan pada Tabel 3 berikut ini.
Tabel 3 ANOVA Untuk Model Spline Pada Data Simulasi

Sumber

Derajat

Jumlah

Rata-rata

Nilai F

Nilai-P

10

Variasi
1 2

Residual Total

bebas 1 4 24 29

kuadrat 19,69 61,22 83,13 164,04

jumlah kuadrat 19,69 15,31 3,46

5,68 4,42

0,03 0,01

* **

Catatan: 1. hasil diperoleh dengan menggunakan program R (umum); 2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus); * signifikan pada 5%, ** signifikan pada 1%. Dari Tabel 3, nilai-P untuk variabel prediktor 1 sebesar 0,03 dan 2 sebesar 0,01.

Nilai-P kedua variabel prediktor dan kurang dari tingkat signifikansi 1 2

(=0,05) sehingga
Data riil

H 0 ditolak. Jadi dapat disimpulkan bahwa variabel prediktor

1 dan 2 memberikan pengaruh yang signifikan terhadap variabel respon .

dalam

penelitian

ini

merupakan

data

sekunder

mengenai

agroklimatologi (evaporasi, kecepatan angin dan kelembaban) dari Sub Proyek Pekalen Sampean, bulan November 2004. Dalam penelitian ini, diduga bahwa kecepatan angin dan kelembaban memberikan pengaruh pada tingkat evaporasi. Menurut Bayong (1999), agroklimatologi merupakan terapan dari ilmu klimatologi yang merupakan suatu ilmu yang mencari gambaran dan penjelasan mengenai iklim. Dalam penelitian ini model yang digunakan adalah model semiparametrik yang merupakan suatu model gabungan antara model parametrik dan model nonparametrik, sehingga sebelum dilakukan analisis model harus dilakukan eksplorasi data terlebih dahulu guna mengetahui hubungan kelinieran atau adanya korelasi antar variabel yang dilakukan dengan menggunakan scatterplot smoother. Perintah scatterplot matrix pada paket R adalah sebagai berikut:
scatterplot.matrix(~kec.angin+kelembaban+evp,reg.line=lm, smooth=TRUE, diagonal = 'histogram', data=cuaca)

Perintah scatterplot matrix di atas memberikan hasil seperti pada Gambar 4 berikut ini:
83
ev aporasi

84

85

86

87

88

Frequency

87

kelembaban

83

85

Frequency

Frequency

20

30

40 x

50

60

70

11

20

40

60

kec.angin

Gambar 4 Scatterplot Matrix Data Evaporasi Pada Gambar 4, diagonal gambar menunjukkan histogram dari data sedangkan di luar diagonal menunjukkan gambar scatterplot dari masing-masing variabel prediktor dengan variabel responnya. Pada Gambar 4 ditunjukkan bahwa scatterplot antara evaporasi dengan kecepatan angin menunjukkan hubungan yang lebih cocok jika digunakan pendekatan linier, sedangkan scatterplot antara evaporasi dengan kelembaban lebih cocok jika digunakan pendekatan nonlinier. Sehingga dapat disimpulkan bahwa kecepatan angin dimodelkan secara parametrik dan kelembaban secara nonparametrik yang akan diestimasi menggunakan penghalus spline. Selain itu, sebagai perbandingan untuk menentukan komponen parametrik dan nonparametrik dapat juga digunakan perbandingan nilai koefisien determinasi

R 2 , dengan nilai

R2

lebih besar

menunjukkan variabel prediktor lebih linier yang kemudian dimodelkan secara parametrik dan demikian sebaliknya. Hasil analisis menunjukkan bahwa nilai koefisien determinasi R 2 untuk variabel prediktor kecepatan angin adalah sebesar 0,567; sedangkan untuk kelembaban adalah sebesar 0,37. Oleh karena itu format model untuk data riil yakni:
gam.1<-gam(evp~s(kelembaban)+ kec.angin).

Untuk mempermudah dalam menentukan model spline optimal maka digunakan titik knots yang juga dipilih dengan menggunakan metode GCV. Tabel 4 berikut menyajikan ringkasan statistik nilai GCV dari data evaporasi dengan menggunakan berbagai model pendekatan spline dari titik knots ekstrem berbeda untuk memperoleh model spline optimal.
Tabel 4 Nilai GCV Model Spline Untuk Berbagai Titik Knots Pada Data Evaporasi

Model Pendekatan Spline dengan knots 82,5 Spline dengan knots 84,7 Spline dengan knots 86,7 Spline dengan knots 87,5

Nilai GCV 1,11380 1,19720 1,12280 0,99664

Nilai R 2 0,684 0,674 0,694 0,729

12

Spline dengan knots 82,5 dan 84,7 Spline dengan knots 82,5 dan 86,7 Spline dengan knots 82,5 dan 87,5 Spline dengan knots 84,7 dan 86,7 Spline dengan knots 84,7 dan 87,5
Lanjutan Tabel 4

1,19720 1,12280 0,99664 1,19110 1,05400 0,97296 0,97296

0,674 0,694 0,729 0,689 0,725 0,746 0,746

Spline dengan knots 86,7 dan 87,5 Spline dengan knots 82,5; 86,7 dan 87,5
Catatan: Hasil diperoleh dengan menggunakan program R

Dari Tabel 4 didapat model spline optimal (cetak tebal) untuk titik knots 82,5; 86,7 dan 87,5 dengan nilai GCV minimum yakni sebesar 0,97296. Ringkasan statistik untuk model spline kubik dengan titik knots optimal dapat dilihat pada Tabel 5 berikut ini.
Tabel 5 Ringkasan Statistik Model S pline Optimal Untuk Data Kecepatan Angin dan Kelembaban

Parameter 00

11 21 22 23 24
25 26

Estimasi 1,73 0,07 0,93 3,48 -0,61 0,85 -3,94 1,02

Standar Kesalahan 0,55 0,02 0,46 1,45 1,73 1,37 1,34 0,78

Nilai t 3,14 3,65 2,02 2,41 -0,35 0,62 -2,95 1,30

Nilai-P 0,46x10-2 ** 0,13x10-2 ** 0,06 . 0,02 * 0,73 0,54 0,01 ** 0,21

Catatan: 1. hasil diperoleh dengan menggunakan program R (umum); 2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus); . signifikan pada 10%, * signifikan pada 5%, ** signifikan pada 1%.

Hasil ringkasan analisis pada Tabel 5 memberikan model spline kubik dengan titik-titik knots optimal 82,5; 86,7 dan 87,5 sebagai berikut:
3 = 00 1 2 + 111 + 212 + 22 2 2 + 23 2 + 24 ( 2 t1 ) + + 25 ( 2 t 2 ) + + 26 ( 2 t3 ) + 3 3 3 3 = 1,73 + 0,07 1 + 0,93 2 + 3,48 2 2 0,61 2 + 0,85 ( 2 82,5) + 3,94 ( 2 86,7 ) + 3 3

+ 1,02 ( 2 87,5) +
3

13

3 ( 82 , 5 ) , 2 82,5 3 2 dengan, ( 82,5) = 2 + 0 , 2 < 82,5


3 ( 86 , 7 ) , 2 86,7 3 2 ( 2 86,7) + = , 2 < 86,7 0 3 ( 87 , 5 ) , 2 87,5 3 2 ( 2 87,5) + = , 2 < 87,5 0
berikut ini.
partial for kec.angin 3 bs(kelembaban, knots = c(82.5, 86.7, 87.5))

dan,

Gambar penghalus spline dengan titik knots optimal dapat dilihat pada Gambar 5

-1

20

30

40

50

60

70

-5

-2

-3

-1 0 1 2

83

84

85

86

87

88

kec.angin

kelembaban

(a)

(b)

Gambar 5 Penghalus Spline dengan Titik Knots Optimal Pada Data Evaporasi

Model spline kubik dengan titik knots optimal yang diberikan pada Gambar 5 memberikan nilai koefisien determinasi R 2 sebesar 0,746 atau sebesar 74,6%, hal ini menunjukkan bahwa variabel kelembaban dan kecepatan angin mampu menjelaskan 74,6% tingkat evaporasi pada Sub Proyek Pekalen Sampean. Dengan demikian dapat dinyatakan bahwa perubahan pola data evaporasi pada tiga titik knots yakni 82,5; 86,7 dan 87,5 cukup signifikan. Dari Gambar 5 (b) terlihat bahwa model spline optimal

14

mengestimasi tingkat evaporasi yang naik sampai pada tingkat kelembaban 82,5% dan 86,7%, kemudian menurun hingga pada tingkat kelembaban lebih dari 87,5%, model spline optimal mengestimasi kembali kenaikan tingkat evaporasi. Ringkasan Analisis Variansi model spline kubik optimal dengan titik knots optimal dapat dilihat dalam Tabel 6 berikut ini.
Tabel 6 ANOVA Untuk Model Spline Optimal Pada Data Evaporasi

Sumber Derajat Variasi bebas Kecepatan 1 angin Kelembaban 5 Residual 23 Total 29

Jumlah kuadrat 49,58 18,52 17,16 85,26

Rata-rata jumlah kuadrat 49,58 3,70 0,75

Nilai F 66,46 4,97

Nilai-P 3,09e-08 0,31x10-2 *** **

Catatan: 1. hasil diperoleh dengan menggunakan program R (umum); 2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus); ** signifikan pada 1%, *** signifikan pada 0,1%.

Ringkasan Analisis Variansi model spline kubik pada Tabel 4.6 diperoleh nilai-P untuk variabel kecepatan angin adalah sebesar 3,09e-08 dan kelembaban sebesar 0,31x10-2. Nilai-P kedua komponen tersebut kurang dari tingkat signifikansi (=0,05) sehingga H 0 ditolak. Jadi dapat disimpulkan bahwa kecepatan angin dan kelembaban memberikan pengaruh yang signifikan terhadap tingkat evaporasi. KESIMPULAN Kesimpulan yang dapat diperoleh dari penelitian ini yakni estimasi model aditif tergeneralisir semiparametrik dengan penghalus spline adalah sebagai berikut:
j = 00 + 111 + 2 j 2 + 2i ( 2 ti )3 +. j =1 i =1 3 k

dengan t adalah titik knots optimal yang diperoleh melalui nilai GCV minimum. Model semiparametrik merupakan suatu model gabungan antara model dengan pendekatan parametrik (linier) dan nonparametrik. Eksplorasi komponen parametrik dan nonparametrik dilakukan dengan menggunakan scatterplot smoother dan koefisien

15

determinasi R2, dengan nilai koefisien determinasi R2 yang lebih besar menunjukkan model yang lebih cocok jika digunakan pendekatan parametrik dan sebaliknya. Hasil analisis pada data evaporasi menunjukkan bahwa model aditif tergeneralisir semiparametrik memberikan model sebagai
3

berikut:
3,94 ( 2 86,7 ) +
3

3 = 1,73 + 0,07 1 + 0,93 2 + 3,48 2 2 0,61 2 + 0,85 ( 2 82,5 ) +

+1,02 ( 2 87,5) +
3

dengan tiga titik knots optimal yakni 82,5; 86,7 dan 87,5 dan koefisien determinasi R 2 sebesar 74,6%. Dengan demikian dapat disimpulkan bahwa kecepatan angin dan tingkat kelembaban 82,5%; 86,7% dan 87,5% mampu menjelaskan 74,6% tingkat evaporasi pada Sub Proyek Pekalen Sampean. DAFTAR PUSTAKA Basset, P. A. dan Bishop, G. 2005. http://www.bioss.sari.ac/. [3 Agustus 2005] Bayong, T. 1999. Klimatologi Umum. Bandung: ITB Budiantara, I. N dan Subanar. 1997. Regresi Spline dan Permasalahannya, Majalah Berkala Penelitian Pasca Sarjana, Jilid 10. Yogyakarta: UGM Hastie, T. 1990. Generalized Additive Models. Bab 7 dari Statistical Models in S eds J. M. Chambers dan T. Hastie, Wadsworth & Brooks/Cole. Hastie, T dan Tibshirani, R. 1990. Generalized Additive Models. London: Chapman and Hall. Hastie, T dan Tibshirani, R. 2004. GAM: Generalized Additive Models. http://wwwstat.stanford.edu/. [29 Agustus 2005]. Ratih, R. 2000. Inferensi Pada Model-Model Linier Tergeneralisasi, Majalah Matematika Dan Statistika, Volume 1. FMIPA, Universitas Jember. Tirta, I. M. 2003. Model Statistika Linier. Jurusan Matematika, FMIPA, Universitas Jember. Wahba, G. 1990. Spline Models For Observational Data. Philadelphia: Society for Industrial And Applied Mathematics. Generalized Additive Models.

16

17

Anda mungkin juga menyukai