ABSTRAK
Penaksiran parameter dilakukan dengan tujuan untuk menentukan parameter yang
sesuai untuk model ARIMA. Dalam praktik, proses menemukan nilai penaksiran
parameter memerlukan waktu yang lama dan sangat rumit. Supaya lebih praktis dalam
menemukan nilai-nilai yang mendekati nilai optimal maka perlu digunakan metode
optimasi. Salah satu metode yang dapat digunakan untuk menyelesaikan permasalahan
tersebut yaitu dengan menggunakan pendekatan Algoritma Genetika. Dalam tugas akhir
ini, hasil dari penaksiran parameter model ARIMA berdasarkan Algoritma Genetika
akan dibandingkan dengan hasil metode penaksiran parameter lain seperti metode
Conditional Least Square pada data dua mingguan dari permintaan Arc Tube daya
listrik rendah.dari hasil kedua metode penaksiran parameter model ARIMA dihasilkan
nilai MSE dan SSE yang besarnya sama. Nilai taksiran parameter dengan metode
Conditional Least Square sebesar -0.5505 dan nilai taksiran parameter dengan
Algoritma Genetika sebesar -0.55688.
Kata Kunci : Conditional Least Square, Algoritma Genetika, MSE.
1. Pendahuluan
Model ARIMA adalah model yang dapat digunakan untuk analisis data time series dan
peramalan data. Model ARIMA terdiri dari tiga langkah dasar, yaitu tahap identifikasi, tahap
penaksiran dan pengujian, dan tahap penerapan (Makridakis, Wheelwright, dan McGee, 1999).
Penaksiran parameter dilakukan dengan tujuan untuk menentukan parameter yang sesuai untuk
model ARIMA. Dalam praktik, menemukan nilai penaksiran parameter memerlukan waktu yang
lama dan sangat rumit. Supaya lebih praktis dalam menemukan nilai-nilai yang mendekati nilai
optimal maka perlu digunakan metode optimasi. Salah satu metode yang dapat digunakan untuk
menyelesaikan permasalahan tersebut yaitu dengan menggunakan pendekatan Algoritma Genetika.
Algoritma Genetika memiliki keunggulan-keunggulan dibandingkan dengan metode-metode
yang lain, antara lain sangat cocok digunakan untuk memecahkan masalah global optimum, mudah
diubah atau fleksibel untuk diimplementasikan pada berbagai masalah, dan ruang solusi lebih luas
(Sivanandam dan Deepa, 2008). Namun, Algoritma Genetika juga memiliki kekurangan antara lain
secara pokok disebabkan oleh kurangnya keragaman, karena semua operator genetis, antara lain
seleksi, persilangan, dan mutasi dikenakan pada semua populasi, sebagian besar individu akan
cenderung menjadi sama (Budiman, 2003).
Penelitian terdahulu yang berkaitan dengan Algoritma Genetika antara lain Fariza (2003)
melakukan penelitian tentang Hybrid Algoritma Genetika untuk peramalan data time series dan hasil
yang didapatkan yaitu peramalan hybrid GA-SA lebih mendekati nilai aktual dan menghasilkan
kinerja yang lebih baik dibandingkan dengan ARIMA untuk data time series stasioner, non stasioner
dan musiman. Rohman (2009) meneliti tentang identifikasi model ARIMA dengan menggunakan
Algoritma Genetika Dalam Tugas Akhir ini, akan didapatkan taksiran parameter model ARIMA yang
sesuai pada dua mingguan dari permintaan Arc Tube daya listrik rendah. Diharapkan penggunaan
Algoritma Genetika dapat mengatasi kelemahan metode penaksiran perameter lain dalam usaha
pencarian solusi yang global optimum.
1
2.1 Model ARMA dan model ARIMA
Suatu perluasan yang dapat diperoleh dari model AR dan MA adalah model campuran yang
berbentuk
Zt 1Z t 1 pZt p at 1at 1 q at q
(2.1)
yang dinamakan model ARMA(p,q). Model ini biasanya ditulis dengan
1 1
B 2
B ...
2
p
B
p
Zt 1 1
B 2
B ...
2
q
B
q
at (2.2)
Model ini merupakan penggabungan antara model AR(p) dan MA(q) serta proses differencing
orde d pada data time series. Secara umum bentuk model ARIMA(p,d,q) adalah :
Z t
d
p
B 1 B δ0 θ q B at (2.3)
n 2
S( , , )
t 1
a t ( , , , Z init , a init , Z ) (2.6)
~ ~ ~ ~ ~ ~ ~
ˆ a2 S ( , , ) / db (2.7)
dengan Z init , a init merupakan nilai inisialisasi awal dan db= (n-p)-(p+q+1) = n-(2p+q+1). S ( , , )
~ ~ ~ ~
merupakan suatu fungsi nonlinear dengan parameter yang tidak diketahui sehingga diperlukan suatu
iterasi nonlinear untuk mendapatkan parameternya. Digunakan iterasi Levenberg-Marquardt
untuk meminimumkan nilai S( , , ) sehingga diperoleh nilai estimasi parameter.
~ ~
2
Menurut Gen dan Cheng (2000), metode seleksi yang paling dikenal adalah seleksi Roulette
Wheel. Ide dasar seleksi adalah untuk menentukan probabilitas seleksi atau probabilitas kelangsungan
hidup pada setiap kromosom proporsional dengan nilai fitnessnya. Anggota populasi yang memiliki
fitness tinggi akan bertahan hidup dan dapat bereproduksi, anggota populasi yang memiliki fitness
rendah akan mati.
Setelah dilakukan seleksi maka yang dilakukan selanjutnya yaitu mengoperasikan kromosom
dengan Crossover dan mutasi. Crossover adalah operator Algoritma Genetika yang utama karena
beroperasi pada dua kromosom pada suatu waktu dan membentuk offspring dengan
mengkombinasikan dua bentuk kromosom. Cara sederhana untuk memperoleh crossover adalah
dengan memilih suatu titik yang dipisahkan secara random dan kemudian membentuk offspring
dengan cara mengkombinasikan segmen dari satu induk ke sebelah kiri dari titik yang dipisahkan
dengan segmen dari induk yang lain ke sebelah kanan dari titik yang dipisahkan. Keanekaragaman
individu dalam populasi telah dihasilkan dengan menggunakan proses seleksi dan pindah silang.
Dengan kedua operator genetik tersebut dapat terjadi hilangnya struktur gen tertentu sehingga tidak
bisa diperoleh kembali informasi yang terkandung didalamnya. Operator mutasi diperkenalkan
sebagai cara untuk mengembalikan informasi yang hilang tersebut. Melalui mutasi, individu baru
dapat diciptakan dengan melakukan pengubahan terhadap satu atau lebih nilai gen pada individu yang
sama.
Pembentukan populasi baru dengan crossover dan mutasi ada kemungkinan kromosom yang
paling baik hilang. Oleh karena itu, untuk menjaga agar individu bernilai fitness tertinggi tersebut
tidak hilang selama evolusi, maka perlu dibuat satu atau beberapa kopinya(elitism)
3. Metodologi
Data yang dipakai dalam penelitian ini adalah data simulasi dan data dua mingguan dari
permintaan Arc Tube daya listrik rendah. Data dua mingguan dari permintaan Arc Tube daya listrik
rendah dianalisis untuk memperoleh penaksiran parameter dengan metode Conditional least square
dan penaksiran parameter mengunakan Algoritma Genetika. Data mulai dari Januari 2000 sampai
Desember 2005 dengan jumlah 141.
Langkah langkah analisis penelitian adalah sebagai berikut :
1. Mengidentifikasi model ARIMA
2. Menaksir parameter dengan metode Conditional Least Square dan Algoritma Genetika
3. Membandingkan hasil penaksiran parameter
4. Hasil dan Pembahasan
Pada bab ini dilakukan analisis metode Conditinal Least Square, dan Algoritma Genetika
untuk menaksir parameter model ARIMA dari data dua mingguan dari permintaan Arc Tube daya
listrik rendah. Pada metode Algoritma Genetika dilakukan dengan data simulasi terlebih dahulu untuk
mengetahui ketepatan iterasi parameter model ARIMA.
20 00 00 1.0
0.8
0.6
15 00 00
0.4
A ut o c o r r e la t io n
0.2
da ta
10 00 00 0.0
-0.2
-0.4
5 00 00
-0.6
-0.8
-1.0
0
1 14 28 42 56 70 84 98 112 1 26 14 0 1 10 20 30 40 50 60 70 80 90 1 00 1 10 1 20 130 14 0
Ind e x La g
Gambar 1 Plot time series data asli Gambar 2 Plot ACF data data asli
3
Gambar 1 menunjukkan bahwa data cenderung tidak stasioner terhadap mean dan varians. Untuk
mengetahui kestasioneran data lebih teliti dapat dilihat dari plot ACF dan transformasi Box-Cox.
Sedangkan Gambar 2 menunjukkan pola turun lambat sehingga data tidak stasioner terhadap mean.
Untuk mengetahui apakah data telah stasioner terhadap varians dapat dilihat dari nilai lamda dari box-
cox.
B o x -C o x P lot o f da ta T ime S e r ie s P lo t o f diff
L o w er C L U p p er C L
L am b d a
16 00 00
(u sin g 95.0% c o n fid en c e) 10 00 00
E stim ate 0.80
14 00 00
L o w er C L 0.57
5 00 00
U p p er C L 1.06
12 00 00
Ro u n d ed V alu e 1.00
10 00 00 0
S t De v
d iff
8 00 00
-5 00 00
6 00 00
-10 00 00
4 00 00
Lim it
2 00 00 -15 00 00
-2 -1 0 1 2 3 4 5
1 14 28 42 56 70 84 98 112 12 6 14 0
La mb d a
Ind e x
Gambar 3 Box-Cox plot data asli Gambar 4 Plot time series data yang sudah stasioner
Dari Gambar 3 di atas nilai lamdanya adalah 1 sehingga dapat disimpulkan bahwa data sudah
stasioner terhadap varians sehingga data tidak perlu ditransformasi. Karena data tidak stasioner
terhadap mean, maka perlu dilakukan differencing agar data stasioner terhadap mean. Gambar 4
menunjukkan bahwa data sudah stasioner dalam varians dan mean. Langkah selanjutnya adalah
membuat plot ACF dan PACF yang digunakan untuk menentukan dugaan model sementara.
A uto c or r e la tio n F unc tio n fo r diff P a r tia l A uto c o r r e la tio n F unc tio n fo r diff
(w ith 5% s ignifica nce lim its fo r the a uto co r r e la tio ns ) (w ith 5 % s ignifica nce lim its fo r the pa r tia l a uto co r r e la tio ns )
1.0 1.0
0.8 0.8
0.6 0.6
Pa r t ia l A ut o c o r r e la t io n
0.4 0.4
A ut o c o r r e la t io n
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 5 10 15 20 25 30 35 1 5 10 15 20 25 30 35
La g La g
Gambar 5 Plot ACF data yang sudah stasioner Gambar 6 Plot PACF data yang sudah stasioner
Berdasarkan Gambar 5 dapat ditunjukkan bahwa plot ACF cut off setelah lag pertama dan keluar
pada lag kedua sedangkan gambar 6 plot PACF cut off setelah lag pertama sehingga dugaan model
sementara adalah ARIMA (1,1,0), ARIMA (0,1,1), ARIMA (1,1,1), ARIMA (2,1,0), ARIMA (0,1,2)
dan ARIMA (2,1,2).
4
Berdasarkan Tabel 1 diatas diperoleh nilai BIC terkecil pada ARMA(1,0) sehingga dugaan model
sementara yang terbaik berdasarkan MINIC adalah ARIMA(1,1,0). Model ARIMA(1,1,0) juga
merupakan salah satu dugaan model sementara hasil identifikasi dengan Correlogram.
Dari tabel 2 dapat dilihat bahwa hasil rata-rata penaksiran parameter model dan nilai MSE dari
Minitab dan program fitarima.m mendekati sama sehingga program fitarima.m dapat digunakan
sebagai penaksiran parameter metode Conditional Least Square.
Dari Tabel 3 diatas dapat dilihat bahwa nilai parameter AR(1) sebesar -0.5505, nilai MSE sebesar
1156000000 dan nilai SSE sebesar 161840000000
5
H0 ditolak jika t t 0 .005 ;141 dengan nilai t0.005;141 yaitu sebesar 2,576.
Dari Tabel 4 diatas dapat dikatakan bahwa taksiran parameter signifikan karena nilai |t-hitung|
> t0.005;141 Langkah selanjutnya adalah pengujian asumsi residual.
lag 12 24 36 48
white-
ARIMA λ2 90.353 139.713 159.426 166.055 noise
(1,1,0)
DF 11 23 35 47
Tabel 5 menunjukkan bahwa model white-noise karena nilai p_value > α dengan α sebesar 1%.
Selanjutnya adalah uji asumsi distribusi normal pada residual dengan hipotesis sebagai berikut :
H0 : F x F0 x
H1 : F x F0 x .
Statistik uji yang digunakan dalam pengujian hipotesis ini adalah sebagai berikut D = sup
S x F0 x
Nilai D adalah jarak vertikal terjauh antara F 0(x) dan S(x) dengan
S x : fungsi peluang kumulatif yang dihitung dari data sampel
F0 x : fungsi distribusi yang dihipotesiskan (normal)
F x : fungsi distribusi yang belum diketahui.
Hipotesis nol ditolak jika D D 0 . 99 ;141 , atau nilai p-value < α.
P r o ba bility P lo t o f r e s idua l
No r m a l
99.9
M ean - 87.00
S tD ev 33999
99
N 141
KS 0.073
95 P - V alu e 0.063
90
80
70
Pe r c e nt
60
50
40
30
20
10
5
0.1
-1 00 00 0 -50 00 0 0 500 00 1 00 00 0
C1 4
6
Dari Gambar 7 dapat diketahui bahwa nilai p-value sebesar 0.063 berarti gagal tolak H 0 karena
p-value > α dengan α=1% sehingga residual berdistribusi normal.
Model ARIMA(1,1,0) menjadi model terbaik untuk data permintaan Arc Tube daya listrik
rendah. Modelnya adalah sebagai berikut (1 - B)z t z
1 t -1
at
zt zt 1
- 0 . 5505 z t - 1 at
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik
ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.5505 kali permintaan Arc Tube
pada waktu t-1 ditambah kesalahan pada saat ke-t.
Dari tabel 6 dapat dilihat bahwa hasil rata-rata taksiran parameter model dan nilai MSE dari
Algoritma Genetika mendekati sama dengan nilai parameter simulasi sehingga program Algoritma
Genetika dapat untuk mencari taksiran parameter data asli.
4.5.2 Kromosom
Pada Algoritma Genetika untuk penaksiran parameter model ARIMA terdiri dari dua jenis
kromosom. Kromosom jenis satu berupa bilangan biner yang didapatkan secara acak yang
merepresentasikan model ARMA(p,q), sedangkan kromosom jenis dua berupa bilangan real yang
merupakan kumpulan nilai parameter model ARIMA dan didapatkan dari mengkonversikan
kromosom jenis satu kedalam bilangan real. Contohnya : model ARMA(2,1) direpresentasikan
dengan (1 1 0 0 1 0 1 1 0 0) (0 1 0 0 1) atau
1 1 0 0 1 0 1 1 0 0 0 1 0 0 1
sebagai kromosom jenis satu, kemudian dikonversikan kedalam bilangan real sehingga kromosom
berubah menjadi
0.5569 -0.2475 -0.4331
Perubahan kromosom dari bilangan biner menjadi bilangan real disebut sebagai kromosom jenis dua.
4.5.3 Penaksiran Parameter model ARIMA dengan Algoritma Genetika
Penaksiran parameter model ARIMA dengan algoritma Genetika dilakukan dengan ukuran
populasi atau jumlah kromosom sebanyak 10, 20, 40, dan 100. Dalam Algoritma Genetika memiliki
7
suatu ukuran kebaikan atau nilai fitness yaitu dalam hal ini adalah nilai SSE (Sum Square Error),
Nilai fitness yang tinggi menandakan nilai SSE yang kecil.
Iterasi pada kromosom dalam suatu populasi akan dilakukan berdasarkan nilai fitness,
kromosom yang memiliki nilai fitness tinggi akan selamat dan mampu bertahan pada generasi
selanjutnya sedangkan kromosom yang memiliki nilai fitness rendah akan mati dan tereliminasi pada
generasi selanjutnya. Iterasi akan berhenti apabila nilai fitness sudah konvergen. Hasil penaksiran
parameter model ARIMA dengan mengunakan Algoritma Genetika sebagai berikut
Dari Tabel 7 dapat dilihat bahwa nilai MSE, SSE dan parameter untuk semua jumlah
kromosom mempunyai nilai yang sama. Nilai MSE tersebut merupakan nilai MSE terbaik dengan
nilai sebesar 1156000000, nilai SSE sebesar 161840000000 serta nilai parameter sebesar -0.55688.
ARIMA
AR 1 -0.55688 0.084514711 -6.5891487 signifikan
(1,1,0)
Dari Tabel 8 diatas dapat dikatakan bahwa taksiran parameter signifikan karena nilai |t-hitung|
> t0.005;141 Langkah selanjutnya adalah pengujian asumsi residual.
H0 ditolak jika nilai p-value > α. Hasil Uji Ljung-Box adalah sebagai berikut :
8
Tabel 9 Pengujian asumsi white-noise
model Ljung - Box keterangan
lag 12 24 36 48
2
ARIMA λ 90.8313 139.563 159.152 166.253 white-noise
(1,1,0)
DF 11 23 35 47
P_Value 1.0000 1.0000 1.0000 1.0000
Tabel 9 menunjukkan bahwa model white-noise karena nilai p_value > α dengan α sebesar 1%.
Selanjutnya adalah uji asumsi distribusi normal pada residual dengan hipotesis sebagai berikut :
H0 : F x F0 x
H1 : F x F0 x .
Statistik uji yang digunakan dalam pengujian hipotesis ini adalah sebagai berikut D = sup
S x F0 x
Nilai D adalah jarak vertikal terjauh antara F 0(x) dan S(x) dengan
S x : fungsi peluang kumulatif yang dihitung dari data sampel
F0 x : fungsi distribusi yang dihipotesiskan (normal)
F x : fungsi distribusi yang belum diketahui.
Hipotesis nol ditolak jika D D 0 . 99 ;141 , atau nilai p-value < α.
P r o ba bility P lo t o f r e s idua l
No r m a l
99.9
M ean - 87.99
S tD ev 34000
99
N 141
KS 0.076
95 P - V alu e 0.048
90
80
70
Pe r c e nt
60
50
40
30
20
10
5
0.1
-1 00 00 0 -50 00 0 0 500 00 1 00 00 0
C1 2
Dari Gambar 8 dapat diketahui bahwa nilai p-value sebesar 0.048 berarti tolak H 0 karena p-
value < α dengan α=1% sehingga residual tidak berdistribusi normal. Residual tidak berdistribusi
normal dapat terjadi karena adanya beberapa penyabab, salah satunya yaitu adanya data outlier
sehingga perlu dilakukan deteksi outlier.
Model ARIMA(1,1,0) menjadi model terbaik untuk data permintaan Arc Tube daya listrik
rendah. Modelnya adalah sebagai berikut (1 - B)z t z
1 t -1
at
zt zt 1
- 0 . 55688 z t - 1 at
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik
ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.55688 kali permintaan Arc
Tube pada waktu t-1 ditambah kesalahan pada saat ke-t.
5. Kesimpulan dan saran
5.1. Kesimpulan
Berdasarkan pembahasan yang telah diperoleh pada bab sebelumnya, dapat diambil kesimpulan
sebagai berikut:
1. Hasil penaksiran parameter model ARIMA dengan mengunakan Conditional Least Square adalah
(1 - B)z t 1
z t -1 at
zt zt 1
- 0 . 5505 z t - 1 at
9
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya
listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.5505 kali
permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. Dengan MSE sebesar
1156000000 dan SSE sebesar 161840000000.
2. Hasil penaksiran parameter model ARIMA dengan mengunakan Algoritma Genetika adalah :
(1 - B)z t 1
z t -1 at
zt zt 1
- 0 . 55688 z t - 1 at
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya
listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.55688 kali
permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. Dengan MSE sebesar
1156000000 dan SSE sebesar 161840000000.
3. Dari hasil kedua metode penaksiran parameter model ARIMA tersebut dihasilkan nilai MSE dan
SSE yang besarnya sama
5.2. Saran
Berdasarkan pembahasan yang telah diperoleh pada bab sebelumnya, dapat diambil suatu saran
sebagai berikut:
1. Pada penelitian ini penaksiran parameter model ARIMA dengan Algoritma Genetika hanya
berdasarkan kriteria SSE saja. Untuk selanjutnya diharapkan bisa dikembangkan berdasarkan
kriteria MSE, signifikansi parameter, dan asumsi distribusi Normal.
2. Pada penelitian ini hanya digunakan data ARIMA non musiman. Untuk selanjutnya diharapkan
bisa dikembangkan untuk model ARIMA yang musiman.
DAFTAR PUSTAKA
Budiman, A., 2003. Optimisasi Daya Reaktif Menggunakan Algoritma Genetik Pseudo-Paralel.
Jurnal teknik elektro dan komputer emitor Vol. 3, No. 1, Maret 2003
Fariza, A., 2003. Hybrid Algoritma Genetika Simulated Annealing untuk Peramalan Data time Series.
Tugas akhir yang dipublikasikan.
Gen, M., dan Cheng, R., 2000. Genetic Algorithms and Engineering Optimization. Canada : John
Wiley & Son Inc.
Makridakis, S., Wheelwright, S.C., dan McGee, V.E., 1999. Jilid 1 Edisi Kedua, Terjemahan Ir. Hari
Suminto. Metode dan Aplikasi Peramalan. Jakarta : Bina Rupa Aksara.
Rohman, M.N., 2009. Identifikasi Model Arima Box-Jenkins Mengunakan Algoritma Genetika. Tugas
Akhir S1 Statistika ITS Surabaya (tidak dipublikasikan).
Sanjoyo. 2006. Aplikasi Algoritma Genetika.
Sivanandam, S.N.,dan Deepa, S.N., 2008. Introduction to Genetic Algorithms. Berlin Heidelberg New
York : Springer.
10