Anda di halaman 1dari 7

JURNAL SAINS DAN SENI ITS Vol. 11, No.

2 (2021), 2337-3520 (2301-928X Print) D82

Peramalan Curah Hujan di Stasiun Juanda


Menggunakan Metode ARIMA Box-Jenkins
dan Radial Basis Function Neural Network
Ocktalia Trisnawati dan Mike Prastuti
Departemen Statistika Bisnis, Institut Teknologi Sepuluh Nopember (ITS)
e-mail: mike_p@statistika.its.ac.id
Abstrak—Curah hujan yang tinggi tak hanya menyebabkan akan dilakukan pendaratan di bandara terdekat atau kembali
penundaan penerbangan, namun juga membuat pesawat pada bandara pemberangkatan. Keberadaan awan di
terlambat mendarat karena menunggu cuaca sedikit lebih baik atsmosfer pada musim hujan akan memberikan goncangan
agar dapat dilakukan pendaratan dengan aman. Curah hujan
pada pesawat terbang yang disebut dengan turbulenci.
juga mempengaruhi pendaratan dan lepas landas pesawat,
telebih lagi jika sering terjadi hujan maka akan membuat Badan Meteorologi Klimatologi dan Geofisika (BMKG)
landasan pacu pesawat menjadi licin dan mengurangi jarak Juanda mempunyai tugas melaksanakan fungsi BMKG di
pandang pengelihatan Dalam upaya untuk menghindari adanya bidang Meteorologi khususnya untuk menunjang
kecelakaan pesawat, maka pada penelitian ini dilakukan keselamatan transportasi udara. Selain itu, BMKG
peramalan terhadap curah hujan di Stasiun BMKG Juanda menyediakan informasi cuaca harian untuk beberapa kota di
menggunakan metode ARIMA Box-Jenkins dan Radial Basis
Jawa Timur.
Function Neural Network (RBFNN). Tujuan dari penelitian ini
adalah untuk mendapatkan model terbaik dan hasil peramalan Dalam upaya untuk menghindari adanya kecelakaan
curah hujan di Stasiun BMKG Juanda. Data yang digunakan pesawat, pemilihan metode yang tepat untuk menentukan
adalah data sekunder yang diperoleh dari BMKG Juanda kondisi cuaca seperti curah hujan adalah kegiatan yang akhir-
Surabaya dari Januari 2019 hingga April 2021. Hasil penelitian akhir ini sering dilakukan oleh beberapa peneliti atmosfer
ini menujukkan bahwa nilai MSE model RBFNN dengan 12 atau cuaca. Hal ini dikarenakan banyaknya tuntutan dari
neuron input, 3 neuron lapisan tersembunyi, dan 1 neuron output
berbagai pihak yang menginginkan informasi mengenai
lebih kecil daripada model ARIMA ([1,9,12,35,55,58]1,1),
sehingga dapat disimpulkan bahwa metode RBFNN merupakan kondisi atmosfer yang lebih cepat, akurat, dan terperinci.
metode terbaik yang digunakan untuk meramalkan curah Bahkan beberapa pihak lain menuntut tersedianya prediksi
hujan di Stasiun Juanda. atau bahkan ramalan mengenai kondisi atmosfer dengan
rentang waktu yang cukup pendek seperti waktu harian, jam,
Kata Kunci—ARIMA Box-Jenkins, Curah Hujan, Juanda, bahkan dalam waktu menit.
Peramalan, RBFNN.
Metode ARIMA mengasumsikan data yang digunakan
berhubungan secara linier yang sangat baik ketepatan
I. PENDAHULUAN akurasinya jika digunakan untuk peramalan jangka pendek,

C UACA merupakan suatu kondisi udara di suatu tempat sedangkan kurang akurat untuk peramalan jangka panjang.
pada waktu yang relatif singkat, yang dinyatakan dengan RBFNN merupakan salah satu metode pada jaringan saraf
nilai berbagai parameter seperti suhu, tekanan udara, tiruan yang terdiri dari lapisan input, lapisan tersembunyi,
kecepatan angin, kelembaban udara, dan berbagai fenomena dan lapisan output. RBFNN memiliki ciri khas yaitu memiliki
atmosfer lainnya. Cuaca merupakan aspek penting dalam satu lapisan tersembunyi dan mengeluarkan nilai berupa
aktivitas penerbangan. persamaan linier pada lapisan output yang membuat proses
Keselamatan merupakan prioritas utama dalam sarana kerja RBFNN lebih cepat daripada jaringan saraf tiruan
transprotasi khususnya bidang penerbangan. Keselamatan lainnya. Beberapa penelitian sebelumnya menggunakan
penerbangan berkaitan dengan banyak faktor diantaranya ada metode ARIMA dalam meramalkan data curah hujan, dimana
faktor manusia, faktor kondisi dan jenis pesawat terbang, hasil peramalan memiliki nilai error yang cukup besar. Hal
fasilitas dan sarana bandar udara, fasilitas dan sarana ini dikarenakan data curah hujan memiliki pola non-linier
telekomunikasi, dan faktor cuaca. Kemungkinan penyebab yang tidak dapat ditangkap oleh model ARIMA. Untuk
kecelakaan pesawat terbang 30% antara lain karena faktor mengetahui pendugaan peramalan terbaik, maka peramalan
cuaca, sedangkan 70% dari faktor manusia. curah hujan di Stasiun Juanda akan dibandingkan dengan
Dalam dunia penerbangan, terdapat cuaca ekstrem yang metode ARIMA dan RBFNN.
mempunyai potensi membahayakan seperti curah hujan
tinggi yang disertai angin kencang, gelombang gunung, dan II. TINJAUAN PUSTAKA
turbulence didalam awan. Curah hujan tinggi mempengaruhi
A. ARIMA Box-Jenkins
pendaratan dan lepas landas pesawat, telebih lagi jika sering
terjadi hujan di bandara akan membuat landasan pacu Metode time series adalah suatu metode peramalan untuk
menjadi licin dan mengurangi jarak pandang pengelihatan. masa depan yang dilakukan berdasarkan nilai atau data masa
Hal ini bisa menyebabkan penundaan penerbangan atau lalu dari suatu variabel dan kesalahan (error) masa lalu.
pesawat terlambat mendarat, karena pesawat menunggu Tujuan dari metode peramalan time series ini adalah untuk
cuaca sedikit lebih baik sehingga dapat dilakukan pendaratan menemukan pola data time series (runtun waktu) dan
dengan aman. Apabila cuaca tak kunjung membaik, maka mengekstrapolasikan pola tersebut ke masa depan [1].
JURNAL SAINS DAN SENI ITS Vol. 11, No. 2 (2021), 2337-3520 (2301-928X Print) D83

Tabel 1. Tabel 3.
Nilai λ dan transformasinya Variabel penelitian
Nilai λ Transformasi Tahun Bulan Tanggal Curah Hujan (mm)
1 1 Z1
-1,0 Januari
Zt 2 Z2
: : :

-0,5
1 2019 1 Z32
2 Z33
Zt Desember
: :
0,0 ln Zt 31 Z365
: : : :
0,5 Zt 1 Z732
Januari
1,0 Zt (Tidak perlu ditransformasi) 2 Z733
: : :
2021
1 Z822
Tabel 2.
Struktur ACF dan PACF pada model ARIMA April : :
30 Z851
Model ACF PACF
Turun Terpotong
Autoregressive (p) Tabel 4.
eksponensial setelah lag-p
Statistika deskriptif data curah hujan di Stasiun Juanda
Terpotong Turun
Moving Average (q) Tahun Mean Variance Minimum Maximum
setelah lag-q eksponensial
Autoregressive Moving Turun Turun 2019 5.439 227.651 0 156.600
Average (p,q) eksponensial eksponensial 2020 8.666 314.553 0 127.700
2021* 12.510 316.710 0 89.800

Lower CL Upper CL
Lambda
12 (using 95.0% confidence)
Estimate -0.92

10 Lower CL -1.00
Upper CL -0.83

Rounded Value -1.00


8
StDev

2
Limit

0
Gambar 1. Arsitektur RBFNN. -5 -4 -3 -2 -1 0 1 2
Lambda

B. Stasioneritas Time Series Gambar 2. Plot Box-Cox data curah hujan di Stasiun Juanda.
Stasioneritas time series adalah asumsi yang mendasari
memuat nilai λ=1, sebaliknya dikatakan tidak stasioner dalam
bahwa proses suatu deret pengamatan tidak berubah seiring
varians apabila batas bawah dan batas atas tidak memuat
dengan adanya perubahan waktu. Dengan kata lain, data time
angka 1 [3].
series dapat dikatakan stasioner adalah relatif berfluktuasi
konstan disekitar mean [2]. C. ACF dan PACF
Seringkali time series tidak stasioner dalam mean akibat Autocorretaltion Function (ACF) digunakan untuk
adanya pola seiring dengan perubahan waktu. Suatu deret menujukkan hubungan linear antara Zt dan Zt+k. Suatu proses
yang nonstasioner dapat direduksi menjadi deret yang stationer {Zt} mempunyai nilai E(Zt)=μ dan Var(Zt) = E(Zt-
stasioner melalui differencing menggunakan operator shift μ)2=σ2, dimana nilai mean dan varians tersebut adalah
mundur (backward shift) yang dinotasikan Δd atau dapat konstan [2]. Persamaan dari kovarians antara Zt dan Zt+k
ditulis (1-B)d dengan ditunjukkan dalam Persamaan 3 sebagai berikut:
𝛥𝛥𝑍𝑍𝑡𝑡 = 𝑍𝑍𝑡𝑡 – 𝑍𝑍𝑡𝑡−1 (1) 𝛾𝛾𝑘𝑘 = 𝐶𝐶𝐶𝐶𝐶𝐶(𝑍𝑍𝑡𝑡 , 𝑍𝑍𝑡𝑡+𝑘𝑘 ) = 𝐸𝐸(𝑍𝑍𝑡𝑡 − 𝜇𝜇)(𝑍𝑍𝑡𝑡+𝑘𝑘 − 𝜇𝜇) (3)
Ketika data tidak stasioner dalam varians, dilakukan dan korelasi antara Zt dan Zt+k ditunjukkan dalam
transformasi untuk menstabilkan varians atau membuat Persamaan 4 sebagai berikut:
varians menjadi homogen. Salah satu tranformasi yang bisa 𝐶𝐶𝐶𝐶𝐶𝐶(𝑍𝑍𝑡𝑡 ,𝑍𝑍𝑡𝑡+𝑘𝑘 ) 𝛾𝛾𝑘𝑘
digunakan adalah Power Transformation. Secara umum, 𝜌𝜌𝑘𝑘 = = (4)
�𝑉𝑉𝑉𝑉𝑉𝑉 (𝑍𝑍𝑡𝑡 )�𝑉𝑉𝑉𝑉𝑉𝑉 (𝑍𝑍𝑡𝑡+𝑘𝑘 ) 𝛾𝛾0
Power Transformation diberikan sebagai berikut.
dimana γ k adalah fungsi autokovarian dan ρ k adalah
⎧ Z tλ − 1 fungsi autokorelasi antara Zt dengan Zt+k dari proses yang
⎪ ; λ≠0
T(Zt ) = λ (2) sama dan hanya terpisah oleh lag waktu ke-k.
⎨ Partial Autocorrelation Function (PACF) digunakan

⎩ ln Z t ;λ = 0 untuk mengukur tingkat keeratan hubungan antara pasangan
Tabel 1 adalah nilai λ yang sering digunakan dan bentuk data Zt dengan Zt+k setelah pengaruh variabel Zt+1, Zt+2, Zt+k-1
transformasinya. Data dikatakan stasioner dalam varians terhadap Zt+k dihilangkan [2]. PACF antara Zt dan Zt+k
apabila batas bawah dan batas atas dari transformasi Box-Cox bernilai sama dengan autokorelasi antara ( Z t − Zˆ t ) dan
JURNAL SAINS DAN SENI ITS Vol. 11, No. 2 (2021), 2337-3520 (2301-928X Print) D84

Lower C L Upper C L
2.0 Lambda 1.0
(using 95.0% confidence)
0.8
Estimate 0.92

Lower C L 0.83 0.6


1.5 Upper C L 1.00
0.4

Autocorrelation
Rounded Value 1.00
0.2
StDev

1.0 0.0

-0.2

-0.4
0.5
-0.6

Limit -0.8

-1.0
0.0
-2 -1 0 1 2 3 4 5 1 10 20 30 40 50 60 70 80 90 100
Lambda Lag

Gambar 3. Plot box-cox setelah transformsi. Gambar 6. Plot ACF data curah hujan setelah di Differencing 1.

160
1.0

140 0.8

0.6
120

Partial Autocorrelation
0.4
100
Curah Hujan

0.2
80
0.0
60 -0.2

40 -0.4

-0.6
20
-0.8
0
-1.0
Day 01 01 01 01 01 01 01
1 10 20 30 40 50 60 70 80 90 100
Month Jan May Sep Jan May Sep Jan
Lag
Year 2019 2020 2021

Gambar 4. Time series plot data curah hujan di Stasiun Juanda. Gambar 7. Plot PACF data curah hujan setelah di Differencing 1.

(a) (b)
1.0 1.0 1.0
0.88142
0.87851
0.84320 0.86495
0.84078
0.84873
0.79971
0.79512
0.75881
0.74375 0.77836
0.77825
0.74545
0.74003
0.72707
0.71772
0.71697
0.71279
0.70363
0.70481
0.69004
0.69043
0.69979 0.73481
0.72240
0.72600
0.71636
0.71624
0.70066
0.69085
0.69889
0.69393
0.68227
0.68303
0.67198
0.67193
0.66183
0.66277
0.64968
0.64897
0.65926
0.64734
0.64424
0.63467
0.64176
0.62988
0.62371
0.8 0.5 0.5
0.60638
0.61829

0.6
0.0 0.0
0.4
Autocorrelation

0.2 -0.5 -0.5


-0.64769
-0.66089
-0.65762
-0.65363
-0.66033
-0.67460
-0.68865
-0.68251
-0.71547
-0.70561
-0.70529
-0.70597
-0.72429
-0.72336
-0.71924
-0.74174
-0.74133
-0.73537
-0.75263
-0.74569
-0.78103 -0.72130
-0.72046
-0.74340
-0.73903
-0.74089
-0.75148
-0.75072
-0.78024
-0.79349
-0.82260
-0.83685
-0.83778
-0.83853
-0.86172 -0.80877
-0.82702
-0.85502
-0.85725
-0.87179 -0.87179
0.0 -1.0 -0.95869 -1.0
-0.91159
-0.96139
(c)
-0.2 1.0
0.86876
0.83969
0.82655
0.80690
0.80279
0.79253
0.77071
0.76327
0.74545
0.73307
0.73309
0.72298
0.72656
0.71766
0.71187
0.69358
0.69595
0.68718
0.69289
0.68176
-0.4 0.66364
0.67108
0.66444
0.64952
0.64759
0.64637
0.63553
0.63876
0.63492
0.61916
0.62685
0.61868
0.5
-0.6
0.0
-0.8

-1.0 -0.5
-0.71042
-0.71603
-0.70785
-0.72072
-0.73092
-0.73147
-0.73646
-0.74051
-0.74101
-0.74345
-0.76780
-0.76791
-0.77911
-0.81148
-0.81373
-0.82391
-0.82339
-0.82276
-0.83784
1 10 20 30 40 50 60 70 80 90 100 -0.87179
-1.0 -0.96139
Lag
Gambar 8. Boxplot residual. (a) ARIMA ([1,12,35,58],1,[1,50]), (b)
Gambar 5. Plot ACF data curah hujan. ARIMA ([1,9,12,35,55,58],1,1), (c) ARIMA (1,1,1).

( Z t + k − Zˆ t + k ) , sehingga fungsi autokorelasi parsial dapat dengan hipotesis sebagai berikut [4].
dihitung dengan rumus sebagai berikut: Hipotesis Model AR:
𝐻𝐻0 : 𝜙𝜙𝑝𝑝 = 0 (parameter AR tidak signifikan terhadap model)
� 𝑘𝑘+1 −∑𝑘𝑘
𝜌𝜌 � 𝑘𝑘+1−𝑗𝑗
𝑗𝑗=1 𝜙𝜙𝑘𝑘𝑘𝑘 𝜌𝜌
𝜙𝜙𝑘𝑘+1,𝑘𝑘+1 = (5) 𝐻𝐻1 : 𝜙𝜙𝑝𝑝 ≠ 0 (parameter AR signifikan terhadap model)
1−∑𝑘𝑘 � 𝑗𝑗
𝑗𝑗=1 𝜙𝜙𝑘𝑘𝑘𝑘 𝜌𝜌 Statistik uji untuk model AR ditunjukkan pada Persamaan 6
berikut:
dengan φˆk +1,k +1 = φˆkj − φˆk +1,k +1φˆk ,k +1− j dan j = 1,2, …, k.
� 𝑝𝑝
𝜙𝜙
𝑡𝑡ℎ𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = � 𝑝𝑝 ) (6)
D. Model ARIMA 𝑠𝑠𝑠𝑠(𝜙𝜙

Identifikasi model ARIMA dilakukan setelah data Hipotesis Model MA:


stationer dengan melihat pola ACF dan PACF. Pendugaan 𝐻𝐻0 : 𝜃𝜃𝑞𝑞 = 0 (parameter MA tidak signifikan terhadap model)
model dilakukan dengan memperhatikal hal-hal yang tertera 𝐻𝐻1 : 𝜃𝜃𝑞𝑞 ≠ 0 (parameter MA signifikan terhadap model)
dalam Tabel 2. Statistik uji untuk model MA ditunjukkan pada Persamaan 7
berikut:
E. Pengujian Signifikansi Parameter
�𝑝𝑝
𝜃𝜃
Pengujian signifikansi parameter dilakukan untuk 𝑡𝑡ℎ𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = (7)
�𝑝𝑝 )
𝑠𝑠𝑠𝑠(𝜃𝜃
mengetahui apakah hasil penaksiran parameter model
ARIMA signifikan atau tidak, sehingga dapat diketahui dengan daerah penolakan adalah tolak H0 jika t hitung > t α
2,n− p
apakah tiap variabel yang digunakan berpengaruh pada Zt.
pengujian hipotesis dilakukan dengan menggunakan uji-t atau tolak H0 jika Pvalue < α dengan α adalah taraf
JURNAL SAINS DAN SENI ITS Vol. 11, No. 2 (2021), 2337-3520 (2301-928X Print) D85

Tabel 5. Zt-1
Pemilihan model ARIMA terbaik
Zt-2
No Model ARIMA MSE
1 ARIMA ([1,12,35,58],1,[1,50]) 39.828 Zt-9
2 ARIMA ([1,9,12,35,55,58],1,1) 16.902
3 ARIMA (1,1,1) 20.191 Zt-10
Intercept

Zt-12
Tabel 6. H1
Uji linearitas Zt-13 Zt
Fhitung F0,05;2;848 Pvalue
H2
20,212 3,006 0,000 Zt-35

Zt-36 H3
Tabel 7.
Penentuan jaringan optimum Zt-55
MSE
Banyak Kelompok Zt-56
Training Testing
2 85473.982 9546.458 Zt-58
3 85462.214 9538.503
4 85510.244 9544.602 Zt-59
5 85484.277 9540.051
6 85499.508 9544.391 Gambar 9. Arsitektur jaringan RBFNN.

Tabel 8.
14
Perbandingan kebaikan model ARIMA dan RBFNN
Model MSE 13
ARIMA ([1,9,12,35,55,58],1,1) 16.902
RBFNN 5.270 12

Ramalan
Tabel 9. 11
Ramalan curah hujan di Stasiun Juanda Periode 852-865
Periode Nilai Ramalan Periode Nilai Ramalan 10

852 10.732 859 13.388


9
853 13.265 860 13.403
854 13.330 861 7.981
8
855 8.809 862 9.611
856 13.193 863 9.523 852 853 854 855 856 857 858 859 860 861 862 863 864 865
Index
857 13.431 864 11.950
858 13.303 865 13.041 Gambar 10. Time series plot nilai ramalan model RBFNN.

signifikansi, p adalah banyaknya parameter AR, q adalah Statistik uji yang digunakan adalah sebagai berikut:
banyaknya parameter MA, se( βˆ ) adalah standar error dari 𝐷𝐷 = 𝑚𝑚𝑚𝑚𝑚𝑚|𝐹𝐹(𝑥𝑥) − 𝐹𝐹0 (𝑥𝑥)| (9)
nilai taksiran φ atau θ. keterangan:
F(x) = nilai peluang kumulatif residual
F. Cek Diagnosa Residual
F0(x) = nilai peluang kumulatif distribusi normal
White noise merupakan asumsi dimana gangguan pada H0 akan ditolak jika nilai D > D(1−α ),n atau tolak H0 jika
residual telah dihilangkan. Jika residual model telah
memenuhi asumsi white noise, berarti residual tersebut saling Pvalue < α , dimana n sebagai derajat bebasnya.
independen dan identik. Pemeriksaan asumsi residual white G. Pemilihan Model Terbaik
noise dilakukan dengan Uji Ljung-Box dengan hipotesis
sebagai berikut [2]. Pemilihan model terbaik dilakukan dengan
membandingkan nilai Mean Square Error (MSE). Nilai MSE
𝐻𝐻0 : 𝜌𝜌1 = 𝜌𝜌2 = ⋯ = 𝜌𝜌𝐾𝐾 = 0
digunakan untuk mengukur ketepatan nilai dugaan model
H 1 : minimal ada satu ρ j ≠ 0 , dengan j=1,2, …, K yang dinyatakan dalam rata-rata kuadrat kesalahan [2].
Statistik uji yang digunakan sebagai berikut: Perhitungan nilai MSE dilakukan dengan rumus sebagai
𝑄𝑄 = 𝑛𝑛(𝑛𝑛 + 2) ∑𝐾𝐾 −1 2
(8) berikut:
𝑘𝑘=1(𝑛𝑛 − 𝑘𝑘) 𝜌𝜌
�𝑘𝑘
1 2
keterangan: 𝑀𝑀𝑀𝑀𝑀𝑀 = ∑𝑛𝑛𝑡𝑡=1�𝑍𝑍𝑡𝑡 − 𝑍𝑍̂𝑡𝑡 � (10)
𝑛𝑛
n = banyaknya pengamatan
ρ̂ k = autokorelasi lag ke-k H. Uji Linearitas
K = jumlah lag maksimum Uji linearitas dapat dilakukan dengan Uji Terasvitra. Uji
H0 akan ditolak jika Q > χ α2 ,( K − m ) atau tolak H0 jika Pvalue < α . Terasvitra merupakan pengujian linearitas tipe LM
Selanjutnya akan dilakukan pemeriksaan diagnostik (Lagrange Multiplier). Prosedur pengujian linieritas dengan
dengan pengujian asumsi residual berdistribusi normal Uji Terasvitra adalah sebagai berikut:
dengan Uji Kolmogorov-Smirnov dengan hipotesis sebagai 1) Regresikan Zt pada 1 dan Zt-k, k=1,2,…,p. Sehingga
berikut: diperoleh model linear
H 0 : Fn ( x) = F0 ( x) 𝑍𝑍𝑡𝑡 = 𝑓𝑓𝑡𝑡 − 𝑒𝑒̂𝑡𝑡 (11)
H 1 : Fn ( x) ≠ F0 ( x)
JURNAL SAINS DAN SENI ITS Vol. 11, No. 2 (2021), 2337-3520 (2301-928X Print) D86

2) Meregresikan êt pada 1, Zt-1, Zt-2,…, Zt-p dan kemudian metode ARIMA Box-Jenkins, berikut adalah langkah-
langkah yang akan dilakukan:
menghitung jumlah kuadrat nilai residual SSR1 = ∑ vˆt2 .
1) Membuat time series plot pada data in-sampel untuk
3) Menghitung nilai statistik uji sebagai berikut: melakukan identifikasi pola time series pada data curah
(𝑆𝑆𝑆𝑆𝑆𝑆0 −𝑆𝑆𝑆𝑆𝑆𝑆1 )/𝑚𝑚 hujan
𝐹𝐹ℎ𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = (12) 2) Melakukan identifikasi stasioneritas data, yaitu stasioner
𝑆𝑆𝑆𝑆𝑆𝑆1 /(𝑛𝑛−𝑝𝑝−1−𝑚𝑚)
terhadap varian dan stasioner terhadap mean. Jika tidak
Keterangan: stasioner terhadap varian maka akan dilakukan
p = prekdiktor awal transformasi Box-Cox, dan jika tidak stasioner terhadap
m = prediktor tambahan (m=2) mean akan dilakukan differencing
n = jumlah pengamatan 3) Membuat plot ACF dan PACF untuk melihat pola data
v̂t = residual ke-t 4) Identifikasi dan pendugaan model ARIMA berdasarkan
SSR = Sum Square Residual pada plot ACF dan PACF.
5) Estimasi parameter dan pengujian signifikansi parameter
I. Radial Basis Function Neural Network 6) Pengujian asumsi residual white noise dan berdistribusi
Radial Basis Function Neural Network (RBFNN) normal pada model yang terbentuk
memiliki 3 layer, yaitu input layer, hidden layer, dan output 7) Mendapatkan model peramalan terbaik menggunakan
layer [5]. Arsitektur jaringan RBFNN dijelaskan pada kriteria MSE.
Gambar 1. Output di rumuskan sebagai berikut: Melakukan peramalan curah hujan menggunakan metode
RBFNN, berikut adalah langkah-langkah yang akan
𝑦𝑦� = ∑𝑚𝑚
𝑗𝑗=1 𝑤𝑤𝑗𝑗 ℎ𝑗𝑗 (𝑥𝑥) + 𝑤𝑤0 (13) dilakukan:
fungsi aktivasi dengan RBFNN dinyatakan sebagai berikut: 1) Menentukan variabel input dengan melihat plot PACF
2
dari data training. Variabel input ditentukan oleh lag-lag
ℎ𝑗𝑗 (𝑥𝑥) = exp �− ∑𝑘𝑘𝑖𝑖=1 �
�𝑥𝑥𝑖𝑖 −𝑐𝑐𝑗𝑗 �
�� (14) yang nilai PACF-nya signifikan
2𝜎𝜎𝑗𝑗2 2) Menentukan nilai pusat dengan menggunakan metode
klaster k-means dan menghitung nilai varian dari hasil
dimana, pengelompokan
1 3) Menentukan jaringan yang optimum dengan jaringan
2
𝜎𝜎𝑗𝑗 = � ∑𝑃𝑃𝑝𝑝=1 𝜎𝜎𝑗𝑗𝑗𝑗 yang memiliki nilai MSE terekecil
𝑃𝑃
Terakhir yaitu memilih model peramalan terbaik
wj = parameter pada node ke-j berdasarkan model ARIMA dan RBFNN menggunakan nilai
MSE.
hj = fungsi aktivasi pada node ke-j
cj = vektor center pada node ke-j
IV. ANALISIS DAN PEMBAHASAN
σj = standar deviasi pada node ke-j A. Statistika Deskriptif Data Curah Hujan di Stasiun
x = vektor input Juanda
Data yang digunakan merupakan data harian yang
III. METODOLOGI PENELITIAN kemudian akan dilakukan pre-processing data dengan
imputasi terhadap data kosong, dari 851 data ada sekitar 52
A. Sumber Data
data yang kosong dan penambahan nilai 1 pada semua data
Data yang digunakan dalam penelitian ini adalah data agar tidak ada data yang bernilai nol. Berdasarkan data curah
sekunder yang diperoleh dari BMKG Juanda Surabaya hujan di Stasiun Juanda diperoleh hasil statistika deskriptif
www.dataonline.bmkg.go.ig dengan unit penelitian curah yang dijelaskan pada Tabel 4.
hujan harian mulai Januari 2019 hingga April 2021 sebanyak Tabel 4 menjelaskan bahwa Tahun 2019 curah hujan
851 data. Data curah hujan ini akan dibagi menjadi dua, yaitu maksimum sebanyak 156.600 mm (03 Februari) dengan
data in-sample dan data out-sample. Data in-sample dimulai keragaman data sebesar 227.651. Tahun 2020 curah hujan
dari Januari 2019 hingga Desember 2020 (731 data) dan data maksimum sebanyak 127.700 mm (01 Februari) dengan
out-sample dimulai dari Januari 2021 hingga April 2021 (120 keragaman data sebesar 314.553. Tahun 2021 curah hujan
data). maksimum sebanyak 89.800 mm (08 Januari) dengan
B. Variabel Penelitian keragaman data sebesar 316.710. Pada Tahun 2019 tidak
hujan terjadi 252 hari dari 365 hari, Tahun 2020 tidak hujan
Variabel yang digunakan pada penelitian ini akan
terjadi 168 hari dari 366 hari, dan tahun 2021 tidak hujan
ditampilkan pada Tabel 3.
terjadi 27 hari dari 120 hari.
C. Langkah Analisis
B. Pemodelan Data Curah Hujan di Stasiun Juanda
Langkah-langkah yang digunakan dalam menganalisis Menggunakan ARIMA Box-Jenkins
data, yaitu langkah analisis dengan metode ARIMA Box-
Tahap awal pendugaan model ARIMA adalah memeriksa
Jenkins dan metode RBFNN akan dijelaskan sebagai berikut:
stasioneritas data terhadap varians dan mean karena model
melakukan pre-processing data curah hujan di Stasiun
ARIMA mengasumsikan bahwa data yang digunakan
Juanda, mendapatkan karakteristik data curah hujan di
stasioner dalam varians dan mean. Lebih jelasnya akan
Stasiun BMKG Juanda menggunakan statistika deskriptif.
dilakukan estimasi parameter menggunakan box-cox (λ)
Selanjutnya melakukan peramalan curah hujan menggunakan
JURNAL SAINS DAN SENI ITS Vol. 11, No. 2 (2021), 2337-3520 (2301-928X Print) D87

dapat dilihat pada Gambar 2.


−0,081 𝑍𝑍𝑡𝑡−55 + 0,081 𝑍𝑍𝑡𝑡−56 + 0,122 𝑍𝑍𝑡𝑡−58 − 0,122 𝑍𝑍𝑡𝑡−59
Gambar 2 menjelaskan hasil plot box-cox data curah hujan
di Stasiun Juanda memiliki nilai λ tidak sama dengan 1, serta
+ 𝑎𝑎𝑡𝑡 − 0,878 𝑎𝑎𝑡𝑡−1 (15)
batas atas dan batas bawah tidak melewati nilai 1 sehingga
dapat disimpulkan data curah hujan di Stasiun Juanda belum
C. Pengujian Linearitas
stasioner dalam varians. Nilai λ yang diperoleh sebesar -1,00
1 Uji linearitas digunakan untuk mengatahui apakah data
sehingga data akan di transformasi dengan 𝑇𝑇(𝑍𝑍𝑡𝑡 ) = . Hasil
𝑍𝑍𝑡𝑡 terdapat pola linear atau non-linear. Hasil uji terasvirta data
transformasi box-cox dapat dilihat pada Gambar 3. curah hujan di Stasiun Juanda dapat dilihat pada Tabel 6.
Gambar 3 menujukkan hasil plot box-cox data curah hujan Tabel 6 menujukkan hasil uji terasvirta data curah hujan di
di Stasiun Juanda setelah transformasi diketahui nilai Stasiun Juanda didapatkan nilai Fhitung sebesar 20,212 lebih
rounded value (λ) sebesar 1, serta batas atas dan batas bawah besar dari F0,05;2;848 sebesar 3,006 dan diperkuat dengan Pvalue
telah melewati nilai 1 sehingga dapat disimpulkan bahwa data (0,000) lebih kecil dari α (0,05) maka diputuskan tolak H0
telah stasioner dalam varians. yang artinya data curah hujan di Stasiun Juanda berpola non-
Selanjutnya akan dilakukan pemeriksaan stasioneritas linear.
dalam mean yang dapat dilihat dari time series plot dan Plot
ACF. Time series plot data curah hujan di Stasiun Juanda D. Pemodelan Curah Hujan di Stasiun Juanda
dapat dilihat pada Gambar 4. Menggunakan RBFNN
Gambar 4 menujukkan time series plot data curah hujan di Langkah pertama untuk membentuk model adalah
Stasiun Juanda tidak stasioner dalam mean, yang terlihat dari menentukan matrik input yang terdiri dari variabel-variabel
fluktuasi data tidak stabil, tetapi akan dilakukan pengecekan input. Variabel input ditentukan oleh nilai partial
melalui plot ACF agar lebih jelas. Plot ACF dapat dilihat pada autokorelasi yang signifikan. Pada pemilihan model terbaik
Gambar 5. ARIMA didapatkan nilai partial autokorelasi ada 12 lag yang
Gambar 5 menujukkan bahwa pada plot ACF turun lambat signifikan, berarti ada 12 variabel input dalam model
sehingga dapat dikatakan data curah hujan di Stasiun Juanda RBFNN. Variabel input yang akan digunakan, yaitu Zt-1, Zt-2,
belum stasioner dalam mean. Data yang tidak stasioner dalam Zt-9, Zt-10, Zt-12, Zt-13, Zt-35, Zt-35, Zt-55, Zt-56, Zt-58, dan Zt-59.
mean perlu dilakukan differencing (d=1) agar stasioner dalam Dalam penelitian ini terdapat 12 buah neuron pada lapisan
mean. Plot ACF dan PACF hasil differencing data dapat input, karena banyak variabel input sama dengan banyaknya
dilihat pada Gambar 6 dan Gambar 7 neuron.
Berdasarkan Gambar 6 dapat diketahui bahwa plot ACF Penentuan jaringan optimum ditentukan oleh variabel
cut off pada lag ke-1 sehingga dapat disimpulkan data sudah input yang kemudian akan dikelompokkan dengan metode k-
stasioner dalam mean. Setelah data sudah stasioner dalam means cluster. Dari semua kelompok yang dicobakan, akan
varians dan mean, maka langkah selanjutnya adalah dipilih satu kelompok terbaik dengan melihat kriteria
mengidentifikasi orde model ARIMA. kebaikan model, yaitu dengan MSE (Mean Square Error)
Berdasarkan plot ACF dan PACF pada Gambar 6 dan terkecil. Hasil penentuan jaringan optimum dapat dilihat pada
Gambar 7 didapatkan 33 dugaan model ARIMA yang Tabel 7
selanjutnya akan dilakukan pengujian signifikansi parameter Tabel 7 menujukkan hasil penentuan jaringan optimum
dan diperoleh 15 model yang signifikan. Dari 15 model yang yang terpilih adalah 3 kelompok karena memiliki nilai MSE
signifikan didapatkan 3 model yang memenuhi residual white terkecil. Sehingga model RBFNN yang digunakan dapat
noise tetapi tidak berdistribusi normal, yaitu ARIMA dibentuk dengan arsitektur 12 neuron pada lapisan input, 3
([1,12,35,58],1, [1,50]), ARIMA ([1,9,12,35,55,58] ,1,1), dan neuron pada lapisan tersembunyi, dan 1 neuron pada lapisan
ARIMA (1,1,1) Oleh karena itu, akan dilakukan cek outlier output. Arsitektur jaringan RBFNN dapat dilihat pada
untuk melihat penyebab residual tidak berdistribusi normal. Gambar 9.
Hasil cek outlier dapat dilihat pada Gambar 8 Pembobot yang digunakan pada jaringan RBFNN untuk
Gambar 8 menujukkan bahwa boxplot residual dari ketiga curah hujan di Stasiun Juanda adalah sebagai berikut:
model memiliki banyak data yang outlier, hal ini 0.032 3.924 10.903
menyebabkan residual tidak berdistribusi normal. 0.055 3.759 10.948
Pemilihan model ARIMA terbaik menggunakan kriteria ⎛0.028 3.780 10.739⎞
MSE dengan melihat nilai MSE terkecil yang diperoleh dari ⎜0.013 4.152 10.574⎟
⎜ ⎟
data out-sample. Hasil dari pemilihan model ARIMA terbaik ⎜0.020 1.106 11.166⎟
dapat dilihat pada Tabel 5. 𝑐𝑐 = ⎜0.029 0.445 11.255⎟
Tabel 5 menujukkan hasil pemilihan model terbaik ⎜0.034 0.495 11.446⎟
berdasarkan kriteria kebaikan model yang digunakan, yaitu ⎜0.038 0.997 11.258⎟
MSE. Model ARIMA ([1,9,12,35,55,58],1,1) menghasilkan ⎜0.059 0.549 11.227⎟
⎜0.022 1.380 11.108⎟
nilai MSE terkecil.
0.042 1.401 11.067
Persamaan matematis yang dibangun oleh model ARIMA ⎝0.060 0.820 11.205⎠
([1,9,12,35,55,58],1,1) dapat dilihat pada persamaan berikut:
𝑍𝑍𝑡𝑡 = 1,146 𝑍𝑍𝑡𝑡−1 − 0,146 𝑍𝑍𝑡𝑡−2 − 0,074 𝑍𝑍𝑡𝑡−9 + 0,074 𝑍𝑍𝑡𝑡−10 �(0.337 8.560 28.583)

+0,084 𝑍𝑍𝑡𝑡−12 − 0,084 𝑍𝑍𝑡𝑡−13 + 0,082 𝑍𝑍𝑡𝑡−35 − 0,082 𝑍𝑍𝑡𝑡−36 𝑤𝑤0 = 13.435, 𝑤𝑤1 = −1.497, 𝑤𝑤2 = −10,746, 𝑤𝑤3 = −12.352
JURNAL SAINS DAN SENI ITS Vol. 11, No. 2 (2021), 2337-3520 (2301-928X Print) D88

Berdasarkan arsitektur jaringan RBFNN curah hujan di periode ke-861 sebesar 7.981 mm.
Stasiun Juanda pada Gambar 9, maka model yang terbentuk
seperti pada persamaan (15).
V. KESIMPULAN
𝑍𝑍̂𝑡𝑡 = 13.435 − 1.497 ℎ1 (𝑥𝑥) − 10.746 ℎ2 (𝑥𝑥) − Berdasarkan hasil analisis dan pembahasan peramalan
12.352 ℎ3 (𝑥𝑥) (16) curah hujan di Stasiun Juanda dapat ditarik kesimpulan
sebagai berikut: Model ARIMA terbaik untuk meramalkan
dengan nilai h j (x) sebagai berikut:
curah hujan di Stasiun Juanda adalah ARIMA
2
�𝑥𝑥1 − 𝑐𝑐1𝑗𝑗 �
2
�𝑥𝑥2 − 𝑐𝑐2𝑗𝑗 �
2
�𝑥𝑥12 − 𝑐𝑐12𝑗𝑗 �
([1,9,12,35,55,58],1,1). Model Radial Basis Function
ℎ𝑗𝑗 (𝑥𝑥) = exp �− �
2𝜎𝜎𝑗𝑗2
+
2𝜎𝜎𝑗𝑗2
+ ⋯+
2𝜎𝜎𝑗𝑗2
�� (RBFNN) yang optimum adalah model dengan 12 neuron
pada input, 3 neuron pada lapisan tersembunyi, dan 1 neuron
pada lapisan output.
E. Perbandingan Model ARIMA dan RBFNN
Berdasarkan perbandingan kebaikan model dengan nilai
Untuk membandingkan nilai ramalan model ARIMA dan MSE pada model ARIMA dan RBFNN, dapat disimpulkan
RBFNN yang telah didapatkan, akan digunakan MSE sebagai bahwa model RBFNN lebih baik dalam meramalkan curah
kriteria kebaikan model. Nilai MSE model ARIMA dan hujan di Stasiun Juanda karena memiliki nilai MSE lebih
RBFNN dapat dilihat pada Tabel 8. kecil dibandingkan model ARIMA.
Tabel 8 menunjukkan bahwa model ARIMA memiliki Peramalan curah hujan periode 852 hingga 865 memiliki
nilai MSE sebesar 16,902 sedangkan model RBFNN pola data yang bergerak fluktuatif. Curah hujan tertinggi
memiliki nilai MSE sebesar 5,270. Berdasarkan hasil tersebut berada pada periode ke-857 sebesar 13.841 mm dan curah
diketahui Model RBFNN memiliki nilai MSE lebih kecil hujan terendah berada pada periode ke-861 sebesar 7.981
daripada model ARIMA, sehingga dapat disimpulkan bahwa mm.
model RBFNN lebih baik untuk meramalkan curah hujan di
Stasiun Juanda.
DAFTAR PUSTAKA
F. Peramalan Curah Hujan di Stasiun Juanda [1] S. Makridakis, S. C. Wheelwright, and V. E. McGee, Metode dan
Model terbaik yang digunakan untuk peramalan curah Aplikasi Peramalan. Jakarta: Erlangga, 1999.
hujan di Stasiun Juanda adalah model RBFNN. Hasil [2] W. Wei, Time Series Analysis Univariate and Multivariate. London:
Pearson education, 2006.
peramalan untuk periode 852 hingga 865 dapat dilihat pada [3] J. . Cryer and K. Chen, Time Series Analysis With Applications in R,
Tabel 9. 2nd ed. New York: Springer, 2008.
Gambar 10 menjelasakan nilai ramalan yang dihasilkan [4] B. Bowerman, Forecasting and Time Series : An Applied Approach,
3rd ed. California: Duxbury Press, 1993.
model RBFNN periode 852 hingga 865, pola data bergerak [5] L. V Fausett, Fundamentals of Neural Networks (Architectures,
fluktuatif. Curah hujan tertinggi berada pada periode ke-857 Algorithms, and Applications). Mumbai: Pearson education, 2006.
sebesar 13.841 mm dan curah hujan terendah berada pada

Anda mungkin juga menyukai