Anda di halaman 1dari 5

7/20/2010

Latar Belakang
Kebutuhan informasi ramalan
iklim
Dampak negatif yang disebabkan oleh
faktor iklim

Pemodelan Curah Hujan Bulanan Di Kabupaten


Ngawi dengan Metode Regresi Pohon Berdasarkan
Indikator ENSO

seperti: banjir, kekeringan, tanah longsor dll.

Membuat model dengan akurasi


yang tinggi
Metode Regresi Pohon

Oleh:
Dessy Budiyanti
1308 100 512
Dosen Pembimbing
Dr. Sutikno S.Si, M.Si

Metode pohon keputusan dengan


beberapa kelebihan
Indikator Enso merupakan variabel
prediktor

Manfaat Penelitian
Perumusan Masalah
Bagaimana memodelkan curah hujan dengan metode regresi
pohon di Kabupaten Ngawi serta hasil prakiraan curah hujan
bulanan menurut indikator ENSO dan DMI.

1. Manfaat penelitian ini diharapkan terhadap pengguna (BMKG):


Membantu untuk mendapatkan model ramalan yang mempunyai akurasi
yang tinggi untuk mengurangi dampak negatif yang ditimbulkan oleh faktor
iklim

2. Manfaat di bidang keilmuan:


Memberikan wawasan keilmuan tentang regresi pohon dalam penerapan di
bidang klimatologi.

Tujuan
1. Menyusun model curah hujan dengan metode regresi pohon di
Kabupaten Ngawi.
2. Mengetahui kinerja hasil model regresi pohon, dengan kriteria
pemilihan model terbaik menggunakan RMSEp dan R-square

Batasan Masalah
Penelitian ini menggunakan data curah hujan bulanan di beberapa pos hujan
Kabupaten Ngawi tahun 1989-2008 yang diperoleh dari BMKG Karangploso
Malang. Indikator ENSO yang dipakai yaitu suhu permukaan laut (SST) terdiri
dari Nino 1.2, Nino 3, Nino 3.4 dan Nino 4, SLP (tekanan permukaan laut)
di Darwin, SLP di Tahiti dan indeks osilasi selatan (SOI) Tahiti-Darwin dan
DMI (dipole index osilation)

Penelitian sebelumnya
Firth L, Hazelton M.L,
dan Campbell E.P
(2005)

Mayasari (2003)

Memprediksi awal dari musim hujan di lima


pertanian di barat daya Australia Barat.
Pemodelan curah hujan bulanan dengan metode
regresi berstruktur pohon berdasarkan indikator
ENSO

Pemodelan Iklim di Indonesia


BMKG

Metode lain

Tiga metode untuk meramal iklim yaitu ARIMA,


tranformasi wavelet, dan Adaptive Neuro-Fuzzy
Inference Systems (ANFIS)
Kalman Filter (Estiningtyas et al., 2005), Adaptive
Splines Theshold Autoregression: ASTAR (Sutikno,
2002; Sutikno et al., 2005), ARIMA, ASTAR, dan fungsi
transfer multi input (Suhartono et al, 2009).

Classification and Regression Trees (CART)


CART merupakan metodologi statistika nonparametrik yang
dikembangkan berdasarkan kaidah pohon keputusan, baik untuk peubah
respon kategorik maupun kontinu. Pohon keputusan dibentuk dengan
menggunakan algoritma penyekatan secara biner (binary recursive
partitioning). Kelebihan menggunakan metode CART adalah
1. Variabel respon dapat berupa data kategorik maupun kontinyu
2. Dapat melakukan eksplorasi pada struktur data yang kompleks dengan
banyak kategori.
3. Bersifat nonparametrik sehingga tidak ada asumsi yang harus dipenuhi
oleh variabel prediktor dan variabel respon.
4. Hasil dugaan berbentuk sederhana dan dapat menduga data baru secara
efisien.
5. Kemudahan dalam interpretasi hasil.

7/20/2010

Tahapan CART

Simpul t dapat menjadi simpul terminal jika :


1. Pada simpul t tidak terdapat penurunan keheterogenan yang berarti

Pembentukan pohon

sehingga tidak akan dipilah lagi.

Pemberhentian pembentukan pohon


Pemangkasan pohon
Pemilahan pohon optimal

Pembentukan Regresi Pohon


Pemilahan pemilah yaitu :

Xj kontinu : n-1 pemilahan


Xj kategori nominal : 2L-1 pemilahan
Xj kategori ordinal : L-1 pemilahan
Pemilahan tiap variabel oleh pemilah s pada simpul t dievaluasi berdasarkan
goodness of split yaitu:

2. Hanya terdapat satu pengamatan pada tiap simpul anak atau adanya

batasan minimum dan menurut Breiman et al,1993, pengembangan pohon


berhenti apabila pada simpul terdapat n < 5, namun ada juga yang
membatasi pengembangan pohon apabila pada simpul terdapat n < 10.
3. Pohon berhenti berkembang dengan adanya batasan jumlah level atau
tingkat kedalaman pohon maksimal.

Pemberhentian Pembentukan Pohon


Proses pembentukan pohon dilakukan sampai tidak mungkin lagi untuk
dilanjutkan. Proses tersebut berhenti pada saat :
Terdapat hanya satu pengamatan dalam tiap simpul anak atau adanya minimum
n, Semua pengamatan dalam tiap simpul anak mempunyai variabel prediktor
homogen sehingga tidak mungkin terjadi pemilahan, Adanya batasan jumlah
level atau tingkat kedalaman (depth) dalam pohon maksimal (maximal tree).

Pemangkasan Regresi Pohon


Pemangkasan adalah suatu penilaian ukuran sebuah pohon tanpa mengorbankan
kebaikan ketepatan melalui pengurangan simpul pohon yang pada akhirnya
diperoleh ukuran pohon yang layak dan berdasarkan cost complexity minimum

Penetuan Ukuran Pohon Yang Layak


Pemilihan pohon regresi optimal adalah dengan test sample estimate Rts(T) atau
cross validation estimate Rcv(T)
test sample estimate :

Menurut Tjasyono 1997 pengaruh El-Nino kuat pada daerah yang dipengaruhi
oleh sistem moonson, lemah pada daerah dengan sistem equatorial dan tidak jelas
pada daerah dengan sistem lokal.
Menurut Zifwen 1999 indikator indeks ENSO yang sering digunakan antara lain
tekanan permukaan laut atau SLP (Sea Level Preasure) Darwin (Australia),
tekanan permukaan laut Tahiti (Pasifik Selatan), suhu permukaan laut atau SST
(Sea Surface Temperature) Nino 1.2, Nino 3, Nino 4 dan Nino 3.4 yang
merupakan wilayah pengukuran suhu permukaan laut yang berada diantara pulau
Sulawesi dan Irian Jaya. Indikator indeks ENSO tersebut merupakan faktor-faktor
yang mempengaruhi iklim.

cross validation estimate dengan V-fold

Sumber Data
Data yang digunakan dalam penelitian ini adalah data curah hujan bulanan
Kabupaten Ngawi yang diperoleh dari BMKG Karangploso Malang . Data
curah hujan bulanan meliputi 18 pos hujan yang akan dibagi kedalam 2 zona
musim, dengan periode tahun 1989-2008.

Variabel Penelitian

Diagram Alir Analisis Data


Data Curah hujan
bulanan
Data SOI, SLP, SST dan
DMI

Melakukan eksplorasi data untuk mengidentifikasi pola


(trend) variabel prediktor SOI, SST dan SLP
Membagi data menjadi dua: data learning yang
digunakan sebanyak 228 data, data testing data testing
yang digunakan sebanyak 12 data

Variabel Respon

Curah hujan bulanan dengan satuan mm (milimeter) di setiap ZOM


Variabel Prediktor
X1

Southern Oscillation Index (SOI) Tahiti-Darwin

X2

Tekanan permukaan laut di Tahiti (SLP) dengan satuan mb (milibar)

X3

Tekanan permukaan laut di Darwin (SLP) dengan satuan mb (milibar)

X4

Suhu permukaan laut Nino 1.2 dengan satuan 0C

X5

Suhu permukaan laut Nino 3 dengan satuan 0C

X6

Suhu permukaan laut Nino 4 dengan satuan 0C

X7

Suhu permukaan laut Nino 3.4 dengan satuan 0C

X8

DMI (dipole mode index)

Regresi Pohon

Model Optimal

Menyusun model menggunakan regresi pohon:


Pembentukan regresi pohon dengan pemilahan pemilah
dan penentuan simpul terminal
Pemberhentian pembentukan pohon regresi
Pemangkasan regresi pohon
Pemilihan regresi pohon terbaik dengan sampel uji atau
validasi silang

Validasi model dengan kriteria RMSEp dan R-square

7/20/2010

SOI

Darwin

Tahiti

500

Deskripsi curah hujan di Kabupaten Ngawi


Rataan
168.18
159.53
-0.417
0.526
0.110
-0.071
0.021
0.226
0.095
-0.0155

Min

Maks

-8

626

133.28

526

1.815
1.113
1.063
1.163
0.890
0.698
0.883
1.064

-6.70
-2.90
-3.80
-2.16
-1.78
-1.60
-1.98
-2.81

-4

-3

Nino 12

-3

Nino 3

Nino 4
500
250
0

-3

-2.0

0.5

Nino 34

3.0

-1

DMI

500

4.40
3.90
2.70
4.13
3.68
1.47
2.80
3.37

Scatterplot Y dan X pada ZOM 2

250
0
-2

-2

SOI

Darwin

Tahiti

400

Scatterplot Y dan X pada ZOM 1.

200
0
-8

-4

-3

Nino 12

Curah Hujan

Curah hujan ZOM 1


(mm)
Curah hujan ZOM 2
(mm)
SOI Tahiti-Darwin
SLP (mb)
SLP (mb)
Nino 1.2 (0)
Nino 3 (0)
Nino 4 (0)
Nino 3.4 (0)
DMI (0)

Simpangan
baku
151.65

Curah Hujan

Variabel

250

-3

Nino 3

Nino 4
400
200
0

-3

-2.0

0.5

Nino 34

3.0

-1

DMI

400
200
0
-2

DMI

Nino 3.4

Nino 3.4

Nino 4

Nino 4

Nino 3

Nino 3

Nino 1.2

Nino 1.2

Tahiti

Tahiti

Darwin

Darwin

SOI

SOI

Curah hujan
ZOM 2

Curah hujan
ZOM 1

Curah
hujan
ZOM 2

0.903
0.000
0.042
0.528
-0.080
0.229
-0.010
0.878
0.044
0.509
-0.060
0.367
-0.122*
0.066
-0.087
0.191
-0.192*
0.000

0.078
0.243
-0.109*
0.102
0.017
0.794
0.066
0.323
-0.037
0.578
-0.147*
0.026
-0.085
0.202
-0.171*
0.010

-0.811
0.000
0.796
0.000
-0.418
0.000
-0.615
0.000
-0.652
0.000
-0.702
0.000
-0.381
0.000

-0.292
0.000
0.438
0.000
0.575
0.000
0.538
0.000
0.621
0.000
0.416
0.000

-2

400
350
300
250
200
150
100
50
0

Z OM 1
Z OM 2

Ja

-0.231
0.000
-0.414
0.000
-0.513
0.000
-0.510
0.000
-0.196
0.000

Pola curah hujan bulanan

Rata-rata curah hujan

Korelasi antar variabel respon dan variabel prediktor

nu

ar

Fe

ua

br

ri
M

il
et
ar Ap r

ei

Ju

ni

Ju

li
A

st

gu

us
Se

r
r
r
r
be
be
b e ob e
e m k t pe m se m
O
e
pt
o
D
N

B ulan
0.816
0.000
0.319
0.000
0.605
0.000
0.333
0.000

0.665
0.000
0.925
0.000
0.459
0.000

0.864
0.000
0.328
0.000

Pohon Regresi Maksimal

Gambar Tipologi pohon regresi maksimal pada ZOM 1

-0.442
0.000

Pemangkasan Pohon Regresi Maksimal

Plot antara relative cost dengan jumlah node pada ZOM 1

Pemangkasan dilakukan untuk mendapatkan ukuran pohon yang layak dengan


menggunakan ukuran relative cost minimum. Pohon regresi optimal yang terbentuk
dari pemangkasan pohon regresi maksimal pada ZOM 1 memiliki nilai mimimal
relative cost sebesar 1 dengan biaya kesalahan sebesar 1 0.045 atau sebesar 0.995
sampai dengan 1.045 dan nilai penduga pengganti (resubstition relative cost)
sebesar 0.819.
Gambar Tipologi pohon regresi maksimal pada ZOM 2.

7/20/2010

Pembentukan Pohon
Pohon Regresi Optimal
No d e 1
DMI <= 0 .6 3 5
S TD = 1 5 2 .8 3 5
A v g = 1 6 9 .5 7 9
N = 228

Plot antara relative cost dengan jumlah node pada ZOM 2

Pohon regresi optimal yang terbentuk dari pemangkasan pohon regresi


maksimal pada ZOM 2 memiliki nilai mimimal relative cost sebesar 0.988
dengan biaya kesalahan sebesar 0.988 0.063 atau sebesar 1.051 sampai
dengan 0.925 dan nilai penduga pengganti (resubstition relative cost) sebesar
0.748.

No d e 2
TA HITI <= - 1 .2 5 0
S TD = 1 5 3 .3 7 2
A v g = 1 9 1 .6 0 5
N = 177
Te r min a l
No d e 1
S TD = 1 5 4 .5 0 9
A v g = 3 2 7 .9 4 1
N = 17

Pemilah utama

Te r min a l
No d e 4
S TD = 1 2 3 .5 3 5
A v g = 9 3 .1 3 7
N = 51

No d e 3
S O I <= - 0 .9 0 0
S TD = 1 4 5 .9 4 9
A v g = 1 7 7 .1 1 9
N = 160
Te r min a l
No d e 2
S TD = 1 2 3 .5 8 2
A v g = 1 1 5 .7 9 5
N = 44

Te r min a l
No d e 3
S TD = 1 4 7 .0 3 9
A v g = 2 0 0 .3 7 9
N = 116

Pohon regresi optimum


pada ZOM 1 memiliki 4
simpul terminal dan 2
simpul dalam, dengan
kedalaman sebesar 4
tingkatan.

Gambar tipologi pohon regresi optimum ZOM 1

Node 1
SOI <= -3.550
STD = 133.488
Avg = 160.553
N = 228

Plot antara curah hujan aktual dan curah hujan prediksi


menurut ZOM

Pemilah utama

Terminal
Node 1
STD = 90.751
Avg = 370.000
N= 8

Node 2
SOI <= 1.150
STD = 128.508
Avg = 152.936
N = 220
Node 3
DMI <= 1.455
STD = 129.462
Avg = 134.642
N = 176
Node 4
NINO_12 <= -1.035
STD = 129.954
Avg = 145.968
N = 157
Terminal
Node 2
STD = 107.116
Avg = 75.379
N = 29

Terminal
Node 5
STD = 94.001
Avg = 226.114
N = 44

Terminal
Node 4
STD = 76.727
Avg = 41.053
N = 19

ZOM 1
Pohon regresi optimum
pada ZOM 2 memiliki
5 simpul terminal dan 3
simpul dalam, dengan
kedalaman sebesar 5
tingkatan.

Terminal
Node 3
STD = 129.345
Avg = 161.961
N = 128

Gambar tipologi pohon regresi optimum ZOM 2

ZOM 2

Perbandingan antara ZOM 1 dan ZOM 2


Data testing
ZOM

R square

ZOM 1

0.575

83.288

ZOM 2

0.218

130.538

RMSEP

Kesimpulan
Model pohon regresi optimal yang diperoleh pada ZOM 1 menghasilkan biaya
kesalahan terkecil (cross validated relative cost) sebesar 1 0.045 dengan nilai
resubstition relative cost sebesar 0,819 dan complexity sebesar 181837.656. Pohon
regresi optimum pada ZOM 1 memiliki 4 simpul terminal dan 3 simpul dalam,
dengan kedalaman sebesar 4 tingkatan. Variabel pemilah utamanya adalah DMI
kemudian terdapat juga variabel lainnya yang berpengaruh pada pembentukkan
pohon regresi yaitu variabel tekanan permukaan laut di Tahiti dan SOI TahitiDarwin.
Model pohon regresi optimal yang diperoleh pada ZOM 2 menghasilkan biaya
kesalahan terkecil (cross validated relative cost) sebesar 0.988 0.063 dengan
nilai resubstition relative cost sebesar 0.748 dan complexity sebesar 102846.492.
Pohon regresi optimum pada ZOM 2 memiliki 5 simpul terminal dan 3 simpul
dalam, dengan kedalaman sebesar 5 tingkatan. Variabel pemilah utamanya adalah
SOI Tahiti-Darwin kemudian terdapat juga variabel lainnya yang berpengaruh
pada pembentukkan pohon regresi yaitu variabel DMI dan suhu permukaan laut
Nino 12.

7/20/2010

Hasil yang diperoleh dari validasi model dengan menggunakn data testing pada
ZOM 1 nilai R square yang dihasilkan sebesar 0.575 dan nilai RMSE prediksinya
sebesar 83.288. Sedangkan untuk ZOM 2 nilai R square yang dihasilkan sebesar
0.218 dan nilai RMSE prediksinya sebesar 130.538.

Saran
Dalam penelitian ini masih banyak permasalahan yang belum dikaji secara
mendalam, oleh karena itu hasil ini dapat dibandingkan dengan metode lainnya.
Varibel prediktor dapat ditambahkan sehubungan dengan pengaruh curah hujan di
Kabupaten Ngawi.

DAFTAR PUSTAKA
Author (a), (2009), El-Nino Southern Oscillation (ENSO). http://kadarsah wordpress.com (tanggal akses : 6 Februari 2009)
Author (b), (2009), El-Nino Southern Oscillation (ENSO). http://bmg.go.id (tanggal akses : 6 Februari 2009)
Author (c), (2009), El-Nino Southern Oscillation (ENSO). http://www.e-dukasi.net (tanggal akses : 6 Februari 2009)
Author (d), (2009), Indikator indeks El-Nino Southern Oscillation (ENSO).
http://esminfo.prenhall.com/science/geoanimations/animations/26_NinoNina.html (tanggal akses : 6 Februari 2009)
Author (e), (2009), Indikator indeks El-Nino Southern Oscillation (ENSO). http://en.wikipedia.org/wiki/El_Nin%C3%Blo
(tanggal akses : 6 Februari 2009)
Breiman L., Friedman J.H., Olshen R.A., & Stone C.J. (1993). Classification And Regression Tress. New York, NY: Chapman And
Hall.
Estikaningrum, L. F. (2003). Penerapan metode klasifikasi berstruktur pohon biner pada prakiraan sifat curah hujan berdasarkan
indikator indeks ENSO (El-Nino Southern Oscillation) (Tugas akhir tidak dipublikasikan). Institut Teknologi Sepuluh
Nopember, Surabaya.
Firth, L., Hazelton. M. L., & Campbell, E. P. (2005). Predicting the Onset of Australian Winter Rainfall by Nonlinear
Classification. Journal of Climate (18), 772-781.
Komalasari, Wieta B. (2007). Metode Pohon Regresi Untuk ekploratori Data Dengan Peubah Yang Banyak Dan Kompleks. Jurnal
Informatika Pertanian, 16, 967-980.
Lewis, Roger J. (2000). An Introduction to Classification and Regression Tree (CART) Analysis. Presented at the 2000 Anual
Meeting Of Society For Academy Emergency Medice in San Francisco, California.
http://www.saem.org/download/lewis.pdf
Mayasari, S. D. (2003). Pemodelan curah hujan bulanan dengan metode regresi berstruktur pohon berdasarkan indikator indeks
ENSO (El-Nino Southern Oscillation) (Tugas akhir tidak dipublikasikan). Institut Teknologi Sepuluh Nopember, Surabaya.
Setyorini, U. E. (2005). Analisis variabel-variabel yang mempengaruhi IPK wisudawan ITS dengan metode regresi pohon (studi
kasus penerima program DUE-LIKE BATCH I) (Tugas akhir tidak dipublikasikan). Institut Teknologi Sepuluh Nopember,
Surabaya.
Usayana, I. G. N. B. (2006). Analisis variabel-variabel yang mempengaruhi besar emisi gas buang kendaraan berbahan bakar
bensin berdasarkan indikator karbon monoksida (CO) dengan metode regresi pohon (Tugas akhir tidak dipublikasikan).
Institut Teknologi Sepuluh Nopember, Surabaya.

Anda mungkin juga menyukai