ABSTRACT
Stochastic models are models to generate new data series based on historical data and have
similar statistical parameter with statistic historical data. Methods of forecasting are developed
base on statistic and mathematic science. The historical data are observed data or sample data.
The limited data is become main constrain for extrapolation of data. The mean error of
generated data should be lower than 5%, its mean data of generated have the validation rate
on 95 %. Three samples location for study are Catchment of Bengawan Solo in Bojonegoro,
Catchment of Serang in Kedungombo - Grobogan and Catchment of Citarum in Cirata -
Bandung. The synthetic data and then is used to calculate the statistic parameter. Error of
generated data is measured with relative error. The relative error is result of divided and
subtract statistic parameter of generated data and the statistic parameter of historical data
longest and statistic parameter of generated data. The result of data length analysis is relative
error and historical length of the data. The analyzed result indicate that historical data are
studied have representative historical data about 30 years length of data.
Keywords : stochastic, historical data,synthetics data, representative data length and relative
error.
1
Magister Teknik Sipil FT. Universitas Diponegoro
Jl. Hayam Wuruk Semarang
2
Jurusan Teknik Sipil FT. Universitas Diponegoro
Jl. Prof. Soedarto, SH Tembalang Semarang
Informasi yang didapat dari data pendek harus diaplikasikan pada model stokastik
amat sedikit, sehingga sering diperlukan yang memenuhi persyaratan secara teknis
pembangkitan data (data generation). dan statistik. Pengumpulan data harus
Filosofi pembangkitan data adalah membuat dipakai tiga atau lebih lokasi penelitian yang
rangkaian data baru berdasarkan data tersebar. Dipilih lokasi DPS yang luasnya
historis yang umumnya pendek untuk lebih dari 100 km2 dan tersebar, yaitu DPS
mendapatkan data yang lebih panjang. Bengawan Solo di stasiun hidrometri
Bojonegoro (Jawa Timur), DPS Serang di
Sebagian besar fenomena hidrologi
stasiun hidrometri waduk Kedungombo
dikatagorikan sebagai proses stokastik,
(Jawa Tengah) dan DPS Citarum di stasiun
dengan disertai kondisi yang terdapat
hidrometri waduk Cirata (Jawa Barat). Pada
ketidakpastian pada prosesnya. Sehingga
data sintetik hasil pembangkitan kemudian
untuk memperoleh data baru diperlukan
dilakukan uji dan analisis statistik guna
penelitian tentang stokastik yang berkaitan
menentukan panjang data historis yang
dengan data historis yang representatif
representatif.
untuk pembangkitan. Data historis tersebut
bahwa r1 benar-benar bukan nol adalah bila penggunaan tabel angka acak dengan
nilainya berada di luar rentang untuk batas distribusi dikenal sebagai Metode Monte
konviden 95% (Salas et. al., 1980). Carlo (Raudkivi, 1979). Pada umumnya
model stokastik berdasarkan model
Model Hidrologi Autoregresif (Markov Chain). Untuk data
bulanan atau selang waktu yang lebih
Hidrologi adalah ilmu yang membahas pendek, distribusi datanya dianggap makin
tentang air yang ada di bumi, yaitu menjauhi normal (Gauss) dan lebih
kejadian, sirkulasi dan penyebaran, sifat- mendekati distribusi Gamma (Pearson).
sifat fisis dan kimiawi serta reaksinya Beberapa teknik untuk merubah deret data
terhadap lingkungan, termasuk agar mendekati normal telah banyak
hubungannya dengan kehidupan. Hidrologi dipakai. Pengubahan ini dikenal sebagai
teknik mencakup bidang yang berhubungan pemutihan (prewhitening). Distribusi normal
langsung dengan perencanaan, dapat digunakan untuk data tahunan dan
perancangan, dan pelaksanaan proyek- bulanan (Mediana, 1988).
proyek teknik bagi pengaturan dan
pemanfaatan air (Linsley et.al., 1982). Model Stokastik
Model hidrologi secara umum dapat
Model stokastik menurut Soemarto (1987)
dijabarkan sebagai sebuah sajian sederhana
adalah model hidrologi dengan basis
(simple representation) dari sebuah sistem
matematik yang menghasilkan suatu urutan
hidrologi yang kompleks (Sri Harto dan
nilai yang merupakan hasil dari proses acak
Sudjarwadi, 1989). Sedangkan menurut Eko
dengan cara memasukkan probabilitas.
Wahyuni (1999) adalah suatu model yang
Simulasi model ini akan memberikan data
dapat mensimulasi berbagai proses hidrologi
sintetik dengan nilai tengah ( mean), tingkat
yang terjadi pada suatu daerah tangkapan
keragaman (variance), kesalahan standar
dengan menggambarkan proses fisis yang
(standart deviation) yang tetap terpelihara.
sesungguhnya dari siklus hidrologi, atau
Sedangkan model stokastik menurut Eko
menirukan peristiwa hidrologi yang terjadi.
Wahyuni (2001) adalah model hidrologi
Penentuan parameter hidrologi yang terkait yang selalu berkisar dengan waktu,
dengan pembuatan model dapat dilakukan mewakili suatu urutan peristiwa dan selalu
dengan menentukan tujuan model tersebut dipengaruhi oleh peristiwa sebelumnya.
dibuat. Model stokastik mempunyai
keterkaitan dengan parameter berpengaruh - Model Markov
berupa musim, distribusi debit, sistem
Metode paling sederhana dan banyak
daerah aliran sungai yang akan dipakai
dipakai untuk membangkitkan data hidrologi
sebagai model dan autokorelasi data itu
adalah model Autoregresif atau disebut juga
sendiri.
rantai Markov menurut nama ahli
Di dalam penyelesaian masalah-masalah matematika A.A. Markov (1856-1922).
hidrologi stokastik diperlukan suatu model Model tersebut dapat ditulis sebagai berikut:
stokastik. Menurut Mediana (1988), model
stokastik sangat diperlukan dalam (yt- = 1 (yt-1- )+ 2 (yt-2- )+…………
hubungannya dengan ketersediaan data + k (yt-k- )+ t ............................... (1)
yang terbatas.
di mana:
Pembangkitan Data = rata-rata dari populasi, yang
Pembangkitan data debit sintetik pertama diperkirakan sama dengan rata-
kali dilakukan oleh Sudler tahun 1927 rata per sampel
(Kottegoda, 1980), dan dilengkapi dengan
Uji kecocokan data atau distribusi digunakan data tertentu dibagi besaran parameter hasil
cara Uji Chi Kuadrat. Distribusi yang dipilih pembangkitan data historis populasi.
dan dianggap tidak cocok apabila harga X2
Sri Harto (1986) menunjukkan adanya
melewati harga X2 kritik.
hubungan antara panjang data yang
Kesalahan Relatif dan Panjang Data tersedia dengan kesalahan yang terjadi.
Semakin pendek data historis yang
Kesalahan relatif adalah prosentase selisih digunakan, maka semakin besar kesalahan
besaran parameter statistik hasil relatif yang terjadi. Menurut Warsini (1987)
pembangkitan data historis populasi dan suatu analisis hidrologi dengan data historis
besaran parameter statistik hasil kurang dari 20 tahun akan memberikan
pembangkitan data historis dengan panjang kesalahan relatif lebih besar dari 3 %.
5-1 5-2 5-3 5-4 5-5 5-6 5-7 5-8 5-9 5-10 5-11 5-12
GAMBAR 3.1. SKENARIO ANALISIS PANJANG DATA HISTORIS UNTUK SERI SIMULASI MODEL STOKASTIK
Gambar 2. Skenario Analisis panjang Data Historis untuk Seri Simulasi Model Stokastik
Model Markov n 1
f 1 xi xi 1
- Prosedur Model Markov i 1
n 1
1. Debit rata-rata tahunan dari data
aliran historis dihitung dengan: f 2 xi
q
i 1
μ= i /n n
2. Deviasi standar tahunan dihitung f 3 xi
i 2 ;
dengan:
(q 1 n1 2
2 n 1
σ= μ)
f4 x ( x )
i / (n-1) 2
tahap-tahap berikut:
n
1 n H0 : 1 = 2 (tidak ada perbedaan
f 5 x12 ( xi ) 2 nyata)
i2 n 1 i2 H1 : 1 2 (ada perbedaan nyata)
Nilai autokorelasi lag 1 (r1) adalah :
2. Statistik penguji berdistribusi F
1 dihitung dengan:
f1 ( f 2 f3 )
n 1 n1 .S1 2 .(n 2 1)
r1 F
f 4 f5 n 2 .S 2 2 .(n1 1)
4. Debit pembangkitan dihitung dengan:
3. Derajat kebebasan (DK) dihitung
qi = μ + ρ (qi-1– μ ) + ti (1- ρ 2)
dengan:
x1 x 2 - Identifikasi Model
t 0.5 Indentifikasi jenis model ditentukan dengan
1 1 menghitung autokorelasi dan autokorelasi
n1 n 2 parsial. Langkah-langkah menghitung
autokorelasi adalah sebagai berikut :
3. Derajat kebebasan dihitung dengan: 1. Menghitung Covarian (COV) dengan
DK = n1 + n2 –2 rumus :
4. Daerah kritik dua sisi, yaitu – tcr(k;) X t X X t 1 X
COV X t , X t 1
dan tcr(k;) dengan derajat N
kebebasan DK dan tingkat 2. Menghitung Auto Correlation (AC)
kepercayaan , diperoleh dari tabel dengan rumus :
distribusi –t, yaitu: tcr(98;0,025) = COV X t , X t 1
Rt COR X t , X t 1
1,960 STD X t STD X t 1
5. H0 : 1 = 2 diterima karena – COV X t , X t 1
tcr< t < tcr VAR X t VAR X t 1
Penyelesaian persamaan dengan Matriks: Untuk mengetahui nilai koefisien regresi dan
persamaan regresi dipakai perintah Display
a11 x1 a12 x2 a13 x3 ........ a1n xn b1
R square dan Display Equation pada Option.
a 21 x1 a 22 x 2 a 23 x3 ........ a 2 n x n b2 Pada model Markov untuk panjang data –
kesalahan relatif langsung (untuk nilai
a n1 x1 a n 2 x 2 a n3 x3 ........ a nn x n bn tengah) diperoleh persamaan y = - 6,3473
T
Ln (x) + 25,196 dengan R2 = 0,60 dan
DeterminanA= A ;AdjoinA=CT;A-1 = C untuk panjang data – kesalahan relatif
A langsung (untuk deviasi standar) diperoleh
2. Memplotkan Partial Auto Correlation persamaan y = - 25,447 Ln (x) + 94,241
(PAC) ke dalam Correlogram untuk dengan R2 = 0,46. Angka 0,60 dan 0,46 ini
mengidentifikasi model Auto menunjukkan bahwa tingkat hubungan ke
Regresive atau ARIMA (p,0,0) atau dua variabel panjang data dan kesalahan
Auto Regressive Moving Average relatif langsung tersebut tidak terlalu kuat
ARIMA(p,0,q). (yang baik sekitar 0,70), hal itu disebabkan
pada seri-seri 5 tahunan mempunyai variasi
yang besar.
MULAI
PENGUMPULAN DATA
DATA KARAKTERISTIK DPS STASIONERITAS
KONSISTENSI
DATA HISTORIS HOMOGENITAS
MASUKAN MODEL TIPE DISTRIBUSI
HIDROLOGI, SERI 5,10,20,30,40,(50,60,70)
PERAMALAN MODEL
PEMODELAN STOKASTIK
TAHUNAN BULANAN
VALIDASI MODEL
APLIKASI
APLIKASI APLIKASI APLIKASI
MODEL
PARAMETER STOKASTIK PARAMETER STOKASTIK PARAMETER STOKASTIK
SELESAI
Gambar
GAMBAR 3.2.3.BAGAN
BaganALIR:
Alir Kajian Panjang Data Historis yang Representatif pada Model Stokastik
KAJIAN PANJANG DATA HISTORIS YANG REPRESENTATIF PADA MODEL STOKASTIK
Rekapitulasi hasil analisis model Markov, dan panjang data yang representatif
Thomas-Fiering dan Box-Jenkins berkaitan ditampilkan pada Tabel di bawah ini.
dengan parameter statistik, kesalahan relatif
45
40
HUBUNGAN KESALAHAN RELATIF NILAI TENGAH
35
DAN PANJANG DATA DPS SERANG
45 25
40 20 y = -8,2981Ln(x) + 33,502
KESALAHAN RELATIF (%)
35
15
30
y = -9,6064Ln(x) + 37,041 10
25
20 5
15 0
10 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70
PANJANG DATA (Th)
5
Markov Thomas-Fiering Box-Jenkins Nilai Tengah
0
0 5 10 15 20 25 30 35 40 45
PANJANG DATA (Th) Gambar 6. Grafik Hubungan Kesalahan Relatif
Markov Thomas-Fiering Box-Jenkins Nilai Tengah
Nilai Tengah dan
HUBUNGAN Panjang
KESALAHAN Data
RELATIF DPS
DEVIASI Citarum
STANDAR
DAN PANJANG DATA DPS CITARUM
GambarHUBUNGAN
4. Grafik Hubungan
KESALAHAN Kesalahan Relatif
RELATIF DEVIASI 50
Nilai STANDAR
Tengah DANdan Panjang
PANJANG DATA DPSData
SERANGDPS Serang
45
0,00 0,00 0,00 0,00
50 40
45
35
40
KESALAHAN RELATIF (%)
30
35
30 y = -17.305Ln(x) + 67.38 25
y = -17.305Ln(x) + 67.38
25 20
20
15
15
10
10
5 5
0 0
0 5 10 15 20 25 30 35 40 45 0 10 20 30 40 50 60 70
PANJANG DATA (Th)
PANJANG DATA (Th)
Markov Thomas-Fiering Box-Jenkins
Markov Thomas-Fiering Box-Jenkins
40
40