Anda di halaman 1dari 29

5

BAB II
TINJAUAN PUSTAKA
Pada bagian ini diuraikan beberapa kajian pustaka yang
mendukung penyelesaian permasalahan dalam penelitian.
Terdapat beberapa hal yang akan dibahas pada bab ini, yaitu
model ARIMA Ensembel, ARIMA, ANN Ensembel, dan single
ANN serta penjelasan mengenai inflasi.
2.1 Autoregressive Integrated Moving Average Ensembel
(ARIMA Ensembel)
Penggabungan hasil ramalan dari beberapa model ARIMA
dapat disebut sebagai ARIMA ensembel. Pembentukan ARIMA
ensembel terdiri dari dua langkah. Pertama, menciptakan anggota
ensembel dari beberapa model ARIMA selanjutnya
menggabungkan hasil ramalan anggota ensembel dari ARIMA
yang terbentuk dengan menggunakan averaging dan stacking.
Untuk menciptakan anggota ensembel pada model ARIMA dapat
menggunakan perubahan lag-lag yang signifikan. Arsitektur
ARIMA ensembel dapat dilihat melalui Gambar 2.1.

ARIMA1

Peramalan1

ARIMA2

Peramalan2
Averaging
atau Stacking

ARIMAk

Peramalank

Step 1
Pembuatan Anggota
Ensembel

Step 2
Penggabungan Anggota
Ensembel

Gambar 2.1 Arsitektur ARIMA Ensembel

Peramalan
ARIMA
Ensembel

6
Gambar 2.1 menunjukkan bahwa peramalan dari ARIMA
ensembel didapatkan dari gabungan peramalan k model ARIMA.
Untuk mendapatkan model ARIMA pada anggota ensembel dapat
dilihat melalui bagian ARIMA dan prosedur Box-Jenkins.
2.2 Autoregressive Integrated Moving Average (ARIMA)
Lebih dari setengah abad model autoregressive integrated
moving average (ARIMA) telah mendominasi peramalan time
series. Pada model ARIMA (p,d,q), nilai yang akan datang dari
suatu variabel diasumsikan sebagai fungsi linier dari beberapa
pengamatan di masa lalu dan random error (Khashei, Bijari dan
Ardali, 2009). Model ARIMA(p,d,q) secara umum, yaitu (Wei,
2006):
(2.1)
p B 1 B d Z t 0 q B at
dimana

p B 1 1 B B p

q B 1 1 B q B q .

dan

Untuk parameter 0 mempunyai peran yang berbeda saat


d=0 dan d>0. Ketika d=0 memiliki proses yang stasioner dan nilai
0 merupakan mean proses dimana 0 1 1 p .
Sedangkan ketika d>0 diasumsikan 0 0 , karena untuk t yang
besar nilai 0 memaksa series mengikuti pola deterministik dan
jika menggunakan asumsi 0 0 menyebabkan model memiliki
trend stokastik.

2.3 Prosedur Box-Jenkins


Pembuatan model ARIMA dapat dilakukan dengan
menggunakan tiga prosedur menurut Box dan Jenkins (1976)
yaitu identifikasi model, estimasi model dan cek diagnosa.
Prosedur identifikasi model merupakan proses untuk
mendapatkan informasi pada series kemudian dari series tersebut
dapat menentukan order ARIMA yang sesuai. Prosedur estimasi
model merupakan suatu cara yang efisien untuk menguji

7
parameter dari model yang sesuai. Sedangkan prosedur cek
diagnosa merupakan pengecekan fitted model dalam
hubungannya dengan data pada tahap ini akan diperoleh
gambaran apakah model yang diduga telah cukup (adequacy)
(Box dan Jenkins, 1976). Prosedur Box-Jenkins untuk model
ARIMA dapat dijelaskan sebagai berikut.
1.

Model Identifikasi
Model
identifikasi
merupakan
metodologi
dalam
mengidentifikasi perlunya suatu transformasi seperti transformasi
untuk stasioner dalam varians, transformasi differencing,
keputusan untuk memasukkan parameter 0 ketika d 0 dan
penentuan order p dan q pada ARIMA (Wei, 2006). Model
identifikasi yang meliputi proses pengecekan stasioneritas, ACF
dan PACF serta penentuan order ARIMA dapat dijelaskan sebagai
berikut.
a.

Stasioneritas
Banyak aplikasi time series di berbagai bidang yang
mempunyai proses nonstasioner, khususnya di bidang ekonomi
dan bisnis. Proses nonstasioner dapat terjadi pada banyak hal,
misalnya time series yang mempunyai nonconstant mean t ,
nonconstant varians 2t , atau pun terjadi kedua-duanya. Proses
nonstasioner dapat menjadi stasioner jika dilakukan differencing
secara tepat. Dengan kata lain, jika suatu series Z t nonstasioner
namun pada differencing ke- d

1 B Z
d

untuk integer

d 1 menjadi stasioner. Misalnya jika differencing ke- d pada

series akan diikuti proses white noise maka dapat ditulis seperti
(Wei, 2006).
(2.2)
1 B d Z a
t

Differencing hanya dapat digunakan untuk menstasionerkan


time series yang homogen. Pada kenyataannya tidak semua time
series homogen karena nonstasioner tidak disebabkan oleh
dependensi waktu dalam rata-rata namun dapat disebabkan oleh

8
dependensi waktu dalam varians dan autokovarians. Untuk
mengatasi hal tersebut diperlukan transformasi untuk
menstabilkan varians dengan transformasi Box-Cox seperti (Wei,
2006).

Z t 1
(2.3)

dimana merupakan parameter transformasi.


Proses stasioner Z t mempunyai beberapa syarat yaitu
sebagai berikut (Wei, 2006).
(2.4)
E Zt
T Zt

Var Z t E Z t 2 2
0 Var ( Z t ) , 0 1
| k | 0 | k | 1

k k dan k k untuk semua k


dimana kovarian antara Z t dan Z t k adalah

k Cov Zt , Zt k E Zt Zt k

dan korelasi antara Z t dan Z t k adalah

Cov Z t , Z t k

Var Z t Var Z t k

k
0

(2.5)
(2.6)
(2.7)
(2.8)
(2.9)

(2.10)

b. Aucorrelation
Function
(ACF)
dan
Partial
Autocorrelation Function (PACF)
Misalnya terdapat pengamatan time series Z1 , Z 2 , Z n
maka sampel ACF didefinisikan sebagai (Wei, 2006)

k tn1k Z t Z Z t k Z
k
, k 0,1, 2,
2
n
0
Z Z
t 1

(2.11)

9
Ada beberapa pola sampel ACF dalam tahap identifikasi.
Pertama, sampel ACF untuk nonseasonal time series dapat cut off.
Dikatakan cut off pada lag k pada sampel ACF jika k saat lag k
secara statistik bernilai besar dan ekuivalen dengan menolak H 0
saat ACF pada lag k sama dengan 0 dimana statistik ujinya adalah

t k k dengan daerah penolakan tolak H0 jika nilai absolute


s k

t k lebih besar dari 2 (Bowerman, OConnel dan Koehler, 2005).

1 2

s k

jika k 1
2

k 1 2
j 1 j

(2.12)

jika k 2, 3,

Kedua, sampel ACF dikatakan dies down jika tidak cut off tetapi
menurun dengan kondisi steady fashion, yang meliputi
(Bowerman et al., 2005).
i. Pola eksponensial
ii. Pola sinus
iii. Pola yang didominasi salah satu dari pola (i) dan (ii) atau
kombinasi dari pola (i) dan (ii)
Sedangkan fungsi dari sampel PACF, yaitu

k 1

1 jika k 1

k k 1, j k j

kk

j 1
k 1

1 k 1, j j

jika k 2, 3,

j 1

(2.13)

10
Sampel PACF juga mempunyai uji apakah terdapat spike pada lag
1
kk
k dengan statistik uji tkk s
dimana skk 1 (Bowerman
kk

et al., 2005)
c.

Penentuan Order ARIMA


Pada tahap identifikasi order ARIMA tidak ada formulasi
yang tepat untuk menyelesaikan permasalahan sehingga
penyelesaian didapatkan dari metode grafik. Untuk
mengidentifikasi order dari ARIMA (p,d,q) dapat dilihat dari
grafik ACF (autocorrelation function) dan PACF (partial
autocorrelation function). Pendugaan yang pertama kali
dilakukan adalah pendugaan order d dengan melihat apakah
grafik ACF turun secara cepat atau tidak. Jika grafik ACF tidak
turun secara cepat mengindikasikan proses nonstasioner pada Z t

namun terdapat kemungkinan akan stasioner saat ( 1 B Z t atau


pada difference order yang lebih tinggi (Box dan Jenkins, 1976).
Setelah menduga order d maka pendugaan order p dan q pada
ARIMA dapat melihat karakteristik dari grafik sampel ACF dan
sampel PACF seperti pada Tabel 2.1.
Tabel 2.1 Petunjuk Pemilihan Operator Nonmusiman
Pola Sampel ACF dan PACF
Sampel ACF mempunyai spikes pada
lag 1, 2,q dan cut off setelah lag q
serta pada sampel PACF dies down

Operator nonmusiman
Model nonmusiman moving
average
order
q:

Sampel ACF dies down dan sampel


PACF mempunyai spikes pada lag 1, 2,
p dan cut off setelah lag p

Model
autoregressive

Sampel ACF mempunyai spikes pada


lag 1, 2,q dan cut off setelah lag q
serta pada sampel PACF mempunyai
spikes pada lag 1, 2,p dan cut off
setelah lag p

q B atau p B

q B 1 1B 2 B 2 q B q

nonmusiman
order
p:

p B 1 1B 2 B 2 p B p

11
Sampel ACF dan sampel PACF tidak
mempunyai lag yang signifikan
Sampel ACF dies down, sampel PACF
dies down

Model tidak mempunyai operator


nonmusiman
Model nonmusiman q B dan
p B

Sumber: Bowerman et al.,2005

2.3.2 Estimasi Model


Setelah melakukan pendugaan model ARIMA khususnya
untuk nilai p, d dan q maka langkah selanjutnya adalah estimasi
parameter dari model. Ada beberapa metode dalam mengestimasi
parameter model seperti metode moment, least square dan full
maximum likelihood (Cryer dan Chan, 2008). Metode estimasi
parameter yang digunakan dalam penelitian ini adalah
conditional least square. Langkah estimasi parameter dengan
conditional least square dengan menggunakan model AR (1)
dapat dijelaskan sebagai berikut.
Misalkan AR(1) mempunyai model sebagai berikut.
(2.14)
Z Z e
t 1

Persamaan 2.15 dapat dilihat sebagai regresi yang mempunyai


prediktor Z t 1 dan respon Z t sehingga estimasi least square
didapatkan dari meminimumkan turunan sum of squares dari
persamaan 2.15
(2.15)
Z Z
t

t 1

Karena pengamatan dari Z t adalah Z1 , Z 2 , , Z n sehingga


sum of square dari Z t hanya dari t 2 sampai t n sehingga
didapatkan persamaan 2.16
n

S c , Z t Z t 1
t 2

(2.16)

Persamaan 2.16 sering disebut fungsi conditional sum of square.


Estimasi nilai dan didapatkan dari meminimumkan nilai
S c , sehingga diperoleh

12
n
S c
2 Z t Z t 1 1 0
t 2

n
1
n

t
t

n 11 t 2
t 2

(2.17)
(2.18)

Untuk n yang mempunyai nilai cukup besar

1 n
1 n
Zt
Z t 1 Z
n 1 t 2
n 1t 2

(2.19)

Penyelesaian dari persamaan 2.19 akan diperoleh

1
(2.20)
Z Z Z
1
Untuk mendapatkan estimasi dari didapatkan dari persamaan
2.22

n
S c , Z
2 Z t Z Z t 1 Z Z t 1 Z 0

t 2

Z t Z Z t 1 Z
n

t 2

Z t 1 Z
n

(2.21)

(2.22)

t 2

Berkaitan dengan estimasi titik pada masing-masing


parameter pada model Box-Jenkins maka diperlukan suatu uji
statistik untuk menentukan apakah parameter tersebut signifikan
atau tidak. Misal, merupakan suatu parameter pada model
Box-Jenkins, merupakan estimasi titik dari dan s
merupakan standard error dari estimasi titik , maka uji t yang
berkaitan dengan dihitung melalui persamaan 2.23
(Bowerman et al., 2005)
H 0 : 0

13
H1 : 0

Statitik uji t

(2.23)
Daerah penolakan Tolak H 0 jika t t 2,nn p , dimana n
banyaknya pengamatan, np banyaknya parameter yang ditaksir.
2.3.3 Cek Diagnosa
Pada tahap cek diagnosa bertujuan untuk melihat
kesesuaian model dan jika model tidak sesuai maka diperlukan
modifikasi sehingga didapatkan model yang sesuai. Pengecekan
model didekati dengan analisis residual dari fitted model (Cryer
dan Chan, 2008). Pengecekan pertama pada residual dilakukan
pada grafik residual. Jika model sesuai (adequate) maka nilai
residual akan berada di sekitar nilai nol. Selain itu residual harus
independen dan berdistribusi normal. Pengecekan residual yang
independen dapat dilihat sebagai berikut (Wei, 2006)
H0 : 1 2 K 0
H1 : minimal ada satu k 0 dengan k= 1, 2, , K
Statistik Uji :

Q n n 2 n k 1 k2
k 1

(2.24)
Keterangan:
n
: jumlah residual
k
: taksiran ACF residual pada lag ke-k
Statistik uji Q dapat didekati dengan distribusi 2K m dimana
m p q , p dan q merupakan order ARIMA(p,d,q) sehingga
daerah penolakan H0 adalah Q yang lebih besar dari 2K p q .
Sedangkan pengujian normalitas dapat menggunakan uji

14
normalitas Kolmogorov-Smirnov dengan pengujian sebagai
berikut.
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Statistik Uji :

D sup S x F0 x

(2.25)
dimana S x merupakan fungsi peluang kumulatif yang dihitung
dari sampel sedangkan F0 x merupakan fungsi peluang
kumulatif distribusi normal. Daerah penolakan Tolak H 0 jika
statistik uji D lebih besar dari kuantil 1 pada Tabel A.17
(Daniel, 1989) atau p-value < .
2.3.4 Analisis Outlier
Outlier adalah jenis pengamatan yang terjadi karena
perubahan jangka pendek pada suatu proses (Chan dan Chan,
2008) . Pada kasus time series, outlier dapat dibedakan menjadi
Additive Outlier (AO), Innovative Outlier (IO), Level Shift (LS)
dan Transitory Change (TC). Additive outlier berpengaruh hanya
pada pengamatan ke-T. Innovative Outlier memberikan pengaruh
pada pengamatan ke-T, (T+1),... . Begitu juga Level Shift dan
Transitory Change memberikan pengaruh pada pengamatan ke-T,
(T+1), . Model dengan outlier secara umum dituliskan sebagai
berikut (Wei, 2006).
k
T B
Z t j v j B I j j
at
B
j 1

(2.26)

T
I j = variabel yang menunjukkan adanya outlier pada waktu kej

Tj
v j B =1 untuk AO

v j B

B
untuk IO
B

15
v j B
v j B

1
1 B untuk LS
1

1 B

;0 1 untuk TC

Salah satu cara penanganan outlier adalah dengan memasukkan


pengamatan outlier ke dalam model. Cara mendeteksi outlier
dilakukan secara iteratif melalui empat tahap (Wei, 2006).
1. Tahap pertama adalah dengan memodelkan data time series
dengan asumsi tidak ada outlier, sehingga diperoleh model
residual sebagai berikut
B
et B Z t
Zt
(2.27)
B
2. Tahap kedua adalah menghitung i ,t dengan t = 1,2, , n dan
i = AO, IO, LS dan TC menggunakan model taksiran. T i,

i ,t
i ,t
(2.28)

var i ,t
Nilai-nilai tersebut kemudian dipilih yang paling besar dan
disebut T . Jika dengan T i ,t C dengan C adalah
konstanta positif antara 3 dan 4, maka outlier yang ada pada
waktu ke- T adalah outlier dengan jenis i. Model baru yang
diperoleh adalah sebagai berikut
~

Z t Z t v I t T
(2.29)
Residual yang terbentuk sebagai berikut

e~ e v B I T
t

(2.29)

3. Tahap ketiga adalah menghitung i ,t berdasarkan residual


yang telah diperbarui pada tahap kedua dan diulang secara
terus menerus hingga semua outlier teridentifikasi.
4. Tahap keempat dilakukan setelah diidentifikasi k-outlier pada
waktu ke-T1, T2..,.., Tk dengan efek sebesar 1 , 2 , , k .
Model yang diperoleh adalah sebagai berikut .

16

T j B a

Z t j v j B I j
j 1

(2.30)

2.3.5 Peramalan
Berdasarkan ketersediaan data series masa lalu
Z 1 , Z 2 , , Z t 1 , Z t dapat diramalkan nilai Z t l yang akan
terjadi pada l periode di masa datang. t disebut forecast origin
dan l lead time untuk peramalan dan hasil peramalannya adalah
Z t l . Peramalan dengan meminimumkan mean square error
dirumuskan sebagai Z l E Z | Z , Z , , Z (Cryer dan
t l

Chan, 2008).
Langkah peramalan dengan menggunakan AR(1) dapat
dijelaskan sebagai berikut.
Misal AR(1) mempunyai model
(2.31)
Z t Z t 1 et
maka peramalan dengan 1 periode ke depan didapatkan dari
mensubtitusi t dengan t 1 yang dirumuskan
(2.32)
Z t 1 Z t et 1
Dengan menggunakan series masa lalu Z1 , Z 2 , , Z t 1 , Z t
maka ekspektasi dari persamaan 2.32 diperoleh
Z 1 E Z | Z , Z , , Z E e | Z , Z , , Z
t

dengan

t 1

(2.33)
et 1
dan karena
terhadap Z1 , Z 2 , , Z t maka

E Z t | Z 1 , Z 2 , , Z t Z t

independen

E et 1 | Z1 , Z 2 , , Z t E et 1 0 sehingga persamaan 2.33

dapat ditulis sebagai

Z t 1 Z t

(2.34)

Untuk peramalan l lead time ke depan, t dapat diubah menjadi


t l pada persamaan 2.31 sehingga didapatkan
Z t l Z t l 1 untuk l 1
(2.35)

17
Karena E Z t l | Z1 , Z 2 , , Z t Z t l 1 dan untuk l 1 ,
et l independen terhadap Z1 , Z 2 , , Z t .
Berdasarkan persamaan 2.35 menunjukkan peramalan
berapa pun nilai l dapat dibangun dari peramalan dengan lead
time yang lebih pendek yang diawali dengan inisial peramalan
Z t 1 yang dihitung melalui persamaan 2.35. Peramalan Z t 2
diperoleh dari Z 2 Z 1
kemudian Z t 3

diperoleh dari Z t 2 dan seterusnya. Meskipun demikian


persamaan 2.35 dapat diselesaikan secara eksplisit dengan
beberapa iterasi backward pada l dari persamaan 2.35 sehingga
diperoleh.
Z t l Z t l 1

Z t l 2

l 1 Z t 1

Atau Z t l l Z t
(2.36)
2.4 Artificial Neural Network Ensembel (ANN Ensembel)
Banyak studi yang menyebutkan bahwa peramalan dengan
mengombinasikan beberapa model memiliki tingkat akurasi yang
lebih tinggi daripada pemilihan model untuk peramalan.
Alternatif lain yang sering dipakai untuk peramalan adalah
menguji beberapa model, mengestimasi parameter dan memilih
model memiliki kinerja terbaik dari periode in sample. Meskipun
demikian, beberapa penelitian telah menunjukkan model terbaik
untuk periode in sample tidak selalu yang terbaik untuk
peramalan di masa yang akan datang (Andrawis, Atiya dan ElShishiny, 2011). Time series sering menghadapi kondisi yang
berubah-ubah, hal ini mengakibatkan terjadinya kesalahan dalam

18
mengestimasi parameter dan model misspecification. Untuk
menghindari hal tersebut salah satu stategi yang baik adalah
membangun beberapa model yang sesuai dan menggabungkan
hasil peramalannya.
Penggabungan dari hasil peramalan telah dirintis sejak tahun
1960-an oleh Bates dan Granger (1969) dalam Zaier et al. (2010).
Penggabungan multi-model tersebut sering disebut pendekatan
ensembel. Kemudian metode tersebut berkembang pada banyak
bidang termasuk pada artificial neural network (ANN) yang
kemudian secara formal disebut ANN ensembel (Shu dan Burn,
2004). Pembentukan ANN ensembel terdiri dari dua langkah.
Langkah pertama adalah menciptakan anggota ensembel secara
individu dan langkah kedua adalah menggabungkan output dari
member ensembel dengan kombinasi yang sesuai untuk
menghasilkan output ensembel yang unik (Sharkey, 1999).
Arsitektur ensemble pada ANN dapat dilihat berdasarkan Gambar
2.2.
Gambar 2.2 menunjukkan bahwa output ensembel dari ANN
ensembel didapatkan dari gabungan output dari beberapa single
ANN. Untuk menciptakan beberapa model dari single ANN dapat
menggunakan perubahan arsitektur dan banyaknya hidden unit
dengan data training yang tetap (Sharkey, 1999). Sedangkan
model single ANN secara umum dapat dilihat dari bagian single
ANN.
Input

Single ANN1

Output1

Input

Single ANN2

Output2

Perubahan
input dan
network
geometry
Input

Averaging
atau
Stacking

Single ANNk

Langkah 1
Pembuatan Anggota Ensembel

Output
Ensembe
l

Outputk
Langkah 2
Penggabungan Anggota Ensembel

19

Gambar 2.2 Arsitektur ANN Ensembel

2.5 Single Artificial Neural Network (Single ANN)


Ketika model linier untuk peramalan time series tidak
menunjukkan kinerja yang baik, kemungkinan model peramalan
dengan struktur nonlinier dapat menjadi salah satu pilihan yang
tepat untuk meramalkan time series. Model linier yang baik
seharusnya secara umum dapat menangkap hubungan dari
beberapa fenomena nonlinier pada data dan artificial neural
networks (ANN) merupakan salah satu model yang dapat
menangkap berbagai hubungan nonlinier pada data (Zhang,
2003). ANN merupakan model yang fleksibel yang dibangun
pada wilayah komputasi untuk menghadapi permasalahan
nonlinier. Salah satu keuntungan dari ANN dari model nonlinier
yang lain adalah secara umum pendekatan ini dapat mengestimasi
dengan tingkat akurasi yang tinggi. Kinerja ANN yang baik
didapat dari informasi dari suatu data yang melalui proses
parallel. Dan pada pembentukan model tidak diperlukan asumsi
tertentu. Sehingga, network model ditentukan oleh karakteristik
pada data.
2.5.1 Arsitektur Multilayer Perceptrons (MLPs)
Feedforward multilayer network yang juga diketahui sebagai
multilayer perceptrons (MLPs) merupakan model ANN yang
paling sering digunakan untuk time series dan peramalan. Model
dibangun dari tiga layer dengan proses yang sederhana pada
masing-masing unit yang dihubungankan oleh acyclic link. Pada
aplikasi ANN untuk peramalan, total data yang tersedia dibagi
menjadi dua yaitu training set (in sample) dan test set (out of
sample). Training set digunakan untuk membangun ANN dan test
set digunakan untuk menghitung tingkat akurasi pada prediksi
peramalan (Zhang, Patuwo, dan Hu, 2001). Besarnya sampel pada
training set disarankan suffisien dan untuk menghindari adanya

20
efek overfitting pada ANN. Kang (1991) dalam Zhang et al.
(2001) menemukan bahwa model ANN tidak membutuhkan data
yang besar untuk berkinerja baik. Model ANN dapat bekerja
dengan baik meskipun ukuran sampel kurang dari 50 (Zhang et
al., 2001). Studi yang memberikan sedikit pedoman tentang
besarnya sampel pada training set dan test set, antara lain Granger
(1993) dalam Zhang et al. (2001) menyarankan paling sedikit
20% dari data digunakan untuk evaluasi peramalan. Pemilihan
data untuk training set dan test set berpengaruh pada fitting untuk
in sample maupun out of sample pada hasil peramalan. Contoh
ANN dengan arsitektur MLP dilihat berdasarkan Gambar 2.3
Input Layer

Hidden layer

g1h

ij

Zt

h
2

Zt

g qh

-2

-p

-1

Zt

Output Layer

0 j

g o

Z t

0
1

1
Bias

Bias

Gambar 2.3 Arsitektur MLP ANN

Secara umum hubungan antara output Z t dan input


Z t 1 , Z t 2 , , , Z t p pada ANN mempunyai persamaan
matematis seperti persamaan 2.43 (Zhang, 2003).

21
q
p

Z t g o 0 j g hj 0 j ij Z t i
j 1
i 1

Dimana

(2.43)

ij i 0, 1, 2, , p; j 0,1, 2, , q dan

j j 0,1, 2, , q

adalah parameter model yang sering


disebut sebagai bobot, p adalah banyaknya neuron pada input
dan q adalah banyaknya neuron pada hidden layer. Fungsi
logistik sigmoid sering digunakan sebagai fungsi aktifasi pada
hidden layer seperti pada persamaan 2.38
1
(2.38)
g x
1 exp x
Model ANN pada persamaan 2.37 merupakan pemetaan
fungsi
nonlinier
dari
pengamatan
masa
lalu
Z t 1 , Z t 2 , , , Z t p ke masa depan
Z t yang dapat
diformulasikan seperti pada persamaan 2.39
(2.39)
Z t f Z t 1 , Z t 2 , , Z t p , w t

dimana w merupakan vektor dari semua parameter dan f adalah


fungsi yang ditentukan oleh struktur network dan pembobot.
Dengan demikian, ANN setara dengan model autoregressive
nonlinier.
Secara umum, pemilihan banyaknya neuron pada input layer
memberikan efek yang lebih besar daripada pemilihan banyaknya
neuron pada hidden layer baik pada data in sample maupun out of
sample. Sehingga peneliti seharusnya lebih memperhatikan
pemilihan banyaknya neuron pada input (Zhang et al., 2001). Hal
ini disebabkan paremeter yang diestimasi pada model ANN
memiliki kegunan sebagai penentu (nonlinier) struktur
autocorrelation pada time series. Meskipun demikian tidak ada
satu pun teori yang dapat dijadikan pedoman untuk pemilihan p
dan q . Oleh karena itu percobaan try and error sering dilakukan
untuk memilih p . Sedangkan dari beberapa literatur, jarang
ditemukan banyaknya neuron pada hidden layer lebih dari dua
kali banyaknya neuron pada input (Zhang et al., 2001).

22
Ketika struktur network p, q ditentukan maka network
siap untuk ditraining (suatu proses untuk mengestimasi
parameter). Parameter diestimasi sama seperti pada pembuatan
model ARIMA sehingga mean square error (MSE) diminimalkan
dan hal ini dilakukan dengan optimalisasi dari suatu algoritma
yaitu backpropagation algorithm.

23

2.5.2 Algoritma Backpropogation


Algoritma untuk mendapatkan update bobot-bobot pada tiaptiap layer dapat menggunakan gradient descent. Gradient descent
merupakan salah satu dari kelompok metode optimisasi yang
paling tua. Metode ini berdasarkan dari suatu pendekatan linier
dari fungsi kesalahan (error), yaitu (Suhartono, 2007)
(2.40)
Q w w Q w w T Q w
Bobot-bobot diupdate melalui
w Q w , 0

(2.41)

Jika kembali ke arsitektur umum MLP dengan 1 hidden layer


seperti pada Gambar 2.3 dan Q merupakan suatu jumlahan
kuadrat error dari data training.

1 n
Z t Z t
2 t 1

(2.42)
dimana :
Z t = target (nilai sebenarnya dari variabel output atau respon)
Z t = output dari layer terakhir (output layer)
Backpropagation
adalah
suatu
algoritma
untuk
mendapatkan bobot-bobot pada tiap-tiap layer yang dinotasikan
sebagai ij dan j dengan cara meminimumkan nilai Q seperti
persamaan 2.42 pada keseluruhan himpunan training. Untuk
penyederhanaan notasi, digunakan simbol w untuk vektor
(2.43)
w ij , j : i 1,2, p, j 1,2, , q
Sehingga fungsi pada persamaan 2.42 yang akan diminimalkan
dapat ditulis
q
p

1 n

Q w Z t g o 0 j g hj 0 j ij Z t i
2 t 1
j 1
i 1

(2.44)

24
Penyelesaian masalah optimisasi di atas akan dilakukan dengan
menggunakan suatu algoritma gradient, yaitu
w Q w atau w m1 w m Q w

(2.45)
dw
Dengan dw adalah perubahan besar bobot atau bias, adalah
koefisisen pembelajaran yang ditentukan, 0 1 .
Untuk mengupdate bobot-bobot dapat menggunakan dua
pendekatan yaitu adaptasi off-line dan online. Pada adaptasi offline, bobot-bobot diupdate pada setiap pasang input-output,
sedangkan di adaptasi on-line atau yang dikenal sebagai batch
mode, bobot-bobot hanya diupdate setelah seluruh nilai-nilai
setelah proses penjumlahan input dan bobot-bobot (bias termasuk
di dalamnya). Berikut adalah penjelasan dari langkah maju dari
algoritma backpropagation dengan update bobot pada batch
mode.
Jika jumlahan input pada hidden layer neuron ke-j yaitu
p

v hj 0 j ij Z t i
i 1

(2.46)

Output pada hidden layer yang terproses di neuron ke-j adalah

a hj g hj v hj g hj 0 j ij Z t i
i 1

(2.47)

Dengan cara yang sama, maka beberapa notasi yang


menyatakan jumlahan input dan bobot-bobot pada output layer
adalah
q

v o 0 j a hj

(2.48)

j 1

Output pada output layer

Z t a o g o v o g o 0 j a hjt
j 1

(2.49)

25
Untuk mendapatkan update bobot-bobot seperti
persamaan 2.45 dibutuhkan perhitungan turunan parsial dari Q
terhadap w . Pertama akan dilakukan perhitungan turunan parsial
dari Q terhadap j

1 n
q
p

Z t g to 0 j g hj 0 j ij Z t i
2 t 1
j 1
i 1

Q w

j
j

(2.50)
Dengan aturan berantai maka persamaan 2.50 dapat diuraikan
sebagai
Q w
Q w a o v o

j
a o v o j

(2.51)

dimana a o dan v o seperti pada persamaan 2.49 dan persamaan


2.48 sehingga persamaan 2.51 dapat diuraikan sebagai

Q w

a o
a
v

o
j
o

1 n
Zt ao
2 t 1
a o

2
n

t 1

(2.52)

t 1

j 1

j a hj

0 j a hj
v
j 1
ah

j
j
j
o

Z t a o Z t Z t

g v g

g v
v o
o

(2.53)

(2.54)

Jika pada output layer menggunakan fungsi aktivasi identitas


maka g o v o v o sehingga g o v o 1 , sehingga penyelesaian
persamaan 2.51 dapat ditulis sebagai

26
o
o
q
n
n
Q w Q w a j v j
g o a h a h o a h

t
t
0
j
j
j
t
j

j
a oj v o j
t 1
j 1
t 1

(2.55)

j 1

o
o
h
dimana t Z t Z t g 0 j a j

(2.56)
Melalui cara yang sama, yaitu dengan aturan berantai
perhitungan turunan parsial dari Q terhadap 0 adalah
Q w Q w a o v o

(2.57)
0
a o v o 0
mengacu pada persamaan 2.51, persamaan 2.52 dan persamaan
2.58, dimana persamaan 2.58 yaitu
q

j a hj

o
v
j 1
1

0
j

maka penyelesaian persamaan 2.57 adalah

(2. 58)

q
n
n
Q w Q w a o v o
g o a h a h o

t
t
0
j
j
j
t

0
a o v o 0
t 1
j 1
t 1

(2.59)
dengan menggunakan persamaan 2.56.
Selanjutnya akan dilakukan penurunan perhitungan turunan
parsial dari Q terhadap ij melalui aturan berantai diperoleh
o
t

h
h
Q w Q w a o v o a j v j

ij
a o v o a hj v hj ij

(2.60)

dengan menggunakan persamaan 2.52, persamaan 2.53,


persamaan 2.54, persamaan 2.61 dan persamaan 2.62 dimana
persamaan 2.61 dan persamaan 2.62 adalah

27

a hj
v

h
j

g v
v

g hj v hj

h
j

h
j

h
j

(2.61)

0 j ij Z t i
v
i 1
Z

t i
ij
ij
h
j

(2.62)

Maka penyelesaian dari persamaan 2.60 adalah

h
h
Q w Q w a o v o a j v j

ij
a o v o a hj v hj ij
n

(2.63)

Z t Z t g 0 j a j a hj g j v hj Z t i
t 1
j 1

Untuk menyederhanakan persamaan 2.63 dapat menggunakan


o
notasi t seperti pada persamaan 2.56 dan diperoleh
n
n

Q w
to a hj g hj v hj Z t i hjt Z t i (2.64)
ij
t 1
t 1

dengan hjt to a hj g hj v hj
(2.65)
Dengan cara yang sama, penurunan turunan parsial dari
Q terhadap 0 j melalui aturan berantai diperoleh

h
h
Q w Q w a o v o a j v j

ij
a o v o a hj v hj 0 j

(2.66)

dengan menggunakan persamaan 2.52, persamaan 2.53,


persamaan 2.54, persamaan 2.61 dan persamaan 2.67, dimana
persamaan 2.67 adalah

v hj
0 j

0 j ij Z t i
i 1
1

0 j

maka penyelesaian persamaan 2.66 adalah

(2.67)

28

h
h
Q w Q w a o v o a j v j

0 j
a o v o a hj v hj 0 j

q
n
n

Z t Z t g o 0 j a hj a hj g hj v hj hjt
t 1
j 1
t 1

(2.68)
h

dimana jt menggunakan persamaan 2.65


Pada tahap ini, formula dari algoritma gradient untuk
mengupdate bobot-bobot telah dapat diturunkan. Dua persamaan
update untuk bobot ij , 0 , j dan 0 yaitu (Suhartono,
2007)
a. Untuk updating bobot-bobot dari bias pada output layer:

m1

n
m m
to a hj
t 1

(2.69)
m

0 m1 0 m to
t 1

(2.70)
b. Untuk updating bobot-bobot dan bias pada hidden layer
m
n
ij m1 ij m hjt Z t i
t 1

(2.71)
n

0 j m1 0 j m hjt

t 1

(2.72)

29
2.6 Pendekatan Untuk Menggabungkan Komponen Anggota
Ensembel
Ketika anggota ensembel (baik ANN maupun ARIMA) telah
dibentuk maka langkah kedua yang harus dilakukan adalah
menggabungkan output (hasil ramalan) yang berbeda dari
masing-masing anggota dalam ensembel. Dua pendekatan yang
paling sering digunakan adalah averaging dan stacking.
2.6.1 Averaging
Penggunaan metode averaging pada output dari ensembel
diperoleh dengan menghitung rata-rata dari output anggota
ensembel. Jika k adalah banyaknya anggota individual ANN pada
ensembel, solusi dari pendekatan ensembel adalah

1 k
Z t Zt(i ) , i 1, , k
k i 1

(2.73)

Dimana Z t(i ) adalah nilai yang diprediksi ke-t dari anggota


ensembel ke-i. Implementasi pendekatan dengan averaging
mudah dan dari studi Perron and Cooper (1993) menunjukkan
bahwa pendekatan averaging efektif meningkatkan kinerja dari
single ANN.
2.6.2 Stacking
Stacking atau stacked generalization dikenalkan oleh
Wolpert (1992) dengan ide awal jika ada sekumpulan prediktor
(linier atau nonlinier) akan meningkatkan akurasi dari prediktor
apabila kumpulan dari prediktor tersebut dikombinasikan
sehingga stacking merupakan metode untuk membentuk
kombinasi linier dari prediktor untuk meningkatkan akurasi
prediksi. Stacking didapatkan dari data cross-validation dan
meminimumkan kuadrat terkecil dari fungsi G dengan syarat
non-negatif untuk memperoleh koefisien dari kombinasi
(Breimen, 1996).

30
n
k
n

G Z t ci Z ti , ci 0 , ci 1
t 1
i 1
i 1

(2.74)

Koefisien c1 , c2 , , ck diestimasi untuk mendapatkan final


output dari ensembel, yaitu
k

Z t ci Z t(i )

(2.75)

i 1

2.7 Kriteria Pemilihan Model


Ketika terdapat beberapa model yang cukup (adequate),
kriteria pemilihan model terbaik biasanya menggunakan
ringkasan statistik dari residual yang dihitung berdasarkan fitted
model dan menggunakan kesalahan peramalan pada data out of
sample. Kriteria pemilihan model yang dipakai dalam penelitian
ini adalah RMSE (root mean square error).
Nilai RMSE (root mean square error) dapat dirumuskan
sebagai berikut.

1
RMSE
M

e
i 1

2
l

(2.77)

2.8 Inflasi
Penjelasan mengenai inflasi dalam penelitian ini dibagi
menjadi dua bagian yaitu definisi inflasi dan jenis inflasi.
3.8.1 Definisi Inflasi
Secara sederhana inflasi diartikan sebagai meningkatnya
harga-harga secara umum dan terus menerus (Bank Indonesia_2,
2012). Kenaikan harga dari satu atau dua barang saja tidak dapat
disebut inflasi kecuali bila kenaikan itu meluas atau
mengakibatkan kenaikan harga pada barang lainnya. Kebalikan
dari inflasi disebut deflasi.
Indikator yang sering digunakan untuk mengukur tingkat
inflasi adalah indeks harga konsumen (IHK). Perubahan IHK dari
waktu ke waktu menunjukkan pergerakan harga dari paket barang

31
dan jasa yang dikonsumsi masyarakat. Perumusan inflasi
berdasarkan inflasi dapat dilihat berdasarkan persamaan 2.78.
IHK t IHK t 1
Inflasi
x100%
IHK t 1
(2.78)
Konsep dan metodologi perhitungan indeks harga konsumen
sempat mengalami perubahan beberapa kali, yaitu:
a. Sebelum April 1979 yang digunakan sebagai dasar yaitu
September 1966 (September 1966 =100)
b. Mulai April 1979 digunakan istilah indeks harga konsumen
(sebelumnya menggunakan istilah indeks biaya hidup).
Dasarnya April 1977-Maret 1978. Menggunakan pola
konsumsi hasil SBH (survey biaya hidup) tahun 1977/1978
di 17 ibukota propinsi (April 1977-Maret 1978 = 100)
c. Mulai April 1990-1997, IHK menggunakan tahun dasar
1988/1989. Menggunakan pola konsumsi biaya hidup hasil
SBH 27 ibukota propinsi (1988/1989=100)
d. Mulai Desember 1997, IHK menggunakan pola konsumsi
hasil SBH di 44 kota tahun 1996 (1996=100)
e. Mulai Januari 2004, digunakan tahun dasar 2002. IHK
dihitung berdasarkan pola konsumsi hasil SBH di 45 kota
tahun 2002 (2002 = 100)
f. Sejak Juni 2008, paket barang dan jasa dalam keranjang IHK
telah dilakukan atas dasar Survei Biaya Hidup (SBH) tahun
2007 yang dilaksanakan oleh Badan Pusat Statistik (BPS).
Kemudian, BPS akan memonitor perkembangan harga dari
barang dan jasa tersebut secara bulanan di 66 kota.
Dalam menyusun IHK, data harga konsumen atau retail yang
diperoleh dari 66 kota dan mencakup antara 284-441 barang dan
jasa yang dikelompokkan ke dalam tujuh pengeluaran yaitu:
bahan makanan; makanan jadi; minuman; rokok dan tembakau;
perumahan, air, listrik, gas dan bahan bakar, sandang; kesehatan;
pendidikan; rekreasi dan olahraga; dan transportasi, komunikasi,
dan jasa keuangan.
Dari setiap kota, beberapa pasar tradisional dan pasar
modern dipilih untuk mewakili harga-harga dalam kota tersebut.

32
Data masing-masing komoditi diperoleh dari 3 atau 4 tempat
penjualan yang didatangi oleh petugas pengumpul data dengan
wawancara langsung. Indeks harga konsumen di Indonesia
dihitung dengan mengembangkan rumus Laspeyres, dalam
perhitungan rata-rata barang dan jasa, ukuran yang digunakan
adalah mean (rata-rata). Tetapi untuk beberapa barang dan jasa
yang musiman digunakan geometri.
Frekuensi pengumpulan data harga berbeda dari satu item
dengan item lainnya, tergantung pada karakteristik item-item
tersebut, yaitu:
Pengumpulan data harga beras di Jakarta adalah harian
Beberapa item yang termasuk ke dalam kebutuhan pokok, data
harga dikumpulkan setiap minggu pada hari Senin dan Selasa
Untuk beberapa item makanan, data harga dikumpulkan setiap
dua minggu sekali, hari Rabu dan Kamis pada minggu pertama
dan ketiga.
Untuk item makanan lainnya, makanan yang diproses,
minuman, rokok dan tembakau, data harga dikumpulkan
bulanan pada hari Selasa menjelang pertengahan bulan selama
tiga hari (Selasa, Rabu, dan Kamis).
Untuk barang-barang tahan lama data harganya dikumpulkan
bulanan pada hari ke-5 sampai hari ke-15.
Data harga jasa-jasa dikumpulkan bulanan pada hari ke-1
sampai hari ke-10.
Data harga sewa rumah dikumpulkan bulanan pada hari ke-1
sampai hari ke-10.
Upah baby sitter dan pembantu rumah tangga diamati bulanan
pada hari ke-1 sampai hari ke-10.
Data yang berhubungan dengan biaya pendidikan
dikumpulkan bulanan pada hari ke-1 sampai hari ke-10.
3.8.2 Jenis Inflasi
Inflasi dapat dibedakan menjadi beberapa jenis dalam
pengelompokan tertentu, dan pengelompokan yang akan dipakai
akan sangat bergantung pada tujuan yang hendak dicapai.

33
a.

Menurut Penyebabnya
Menurut Atmaja (1999) inflasi yang dikelompokkan menurut
penyebabnya dapat dibagi menjadi dua yaitu demand pull
inflation dan cost push inflation. Deman pull inflation adalah
inflasi yang disebabkan oleh terlalu kuatnya peningkatan
aggregate demand masyarakat terhadap komoditi-komoditi hasil
produksi di pasar barang. Dan dalam kasus inflasi jenis ini,
kenaikan harga-harga barang biasanya akan selalu diikuti dengan
permintaan output (GNP riil) dengan asumsi bila perekonomian
masih belum mencapai kondisi full-employment. Sedangkan cost
push inflation adalah inflasi yang disebabkan meningkatnya harga
faktor-faktor produksi (baik yang berasal dari dalam negeri
maupun dari luar negeri) di pasar faktor produksi, sehingga
menyebabkan kenaikkan harga komoditi di pasar komoditi.
Dalam kasus cost push inflation kenaikan harga seringkali diikuti
oleh kelesuan usaha.
b. Menurut Asalnya
Inflasi yang dikelompokkan berdasarkan asalnya dapat
dibagi menjadi dua (Atmaja, 1999) yaitu domestic inflation dan
imported inflation. Domestic inflation adalah inflasi yang
sepenuhnya
disebabkan
oleh
kesalahan
pengelolaan
perekonomian baik di sektor riil ataupun di sektor moneter di
dalam negeri oleh para pelaku ekonomi dan masyarakat.
Sedangkan imported inflation merupakan inflasi yang disebabkan
oleh adanya kenaikan harga-harga komoditi di luar negeri (di
negara asing yang memiliki hubungan perdagangan dengan
negara yang bersangkutan). Inflasi ini hanya dapat terjadi pada
negara yang menganut system perekonomian terbuka (open
economy system). Dan, inflasi ini dapat menular baik melalui
harga barang-barang impor maupun harga barang-barang ekspor.