Anda di halaman 1dari 74

ARIMA

(Autoregresif Integrated Moving Average)


1. Data cross-section
Merupakan data yang dikumpulkan untuk jumlah
variable pada suatu titik waktu tertentu.

2. Data runtun waktu (time series)


Jenis Data Statistik Merupakan data yang dikumpulkan menurut
Berdasarkan waktu urutan waktu dalam suatu rentang waktu tertentu.
pengumpulan
1. Runtun waktu deterministik
2. Runtun waktu stokastik

3. Data Panel
Merupakan data yang dikumpulkan menurut
urutan waktu dalam suatu rentang waktu
tertentu pada sejumlah kategori.
Pola time series

1. Pola Horizontal 3. Pola Siklis

Terjadi saat data berfluktuasi di sekitar nilai rata- Terjadi saat suatu deret mengalami
rata yang konstan. Deret seperti ini bersifat kenaikan atau penurunan pada suatu
stasioner ternhadap nilai rata-ratanya. periode waktu yang tidak tetap.

2. Pola Musiman 4. Pola Trend

Terjadi saat suatu deret dipengaruhi oleh Terjadi saat terdapat kenaikan atau penurunan
factor musiman. Faktor musiman terjadi sekuler jangka panjang dalam data.
pada suatu periode tertentu yang bersifat
tetap.
ARIMA
• Arima merupakan suatu model “stochastic” yang dapat digunakan untuk
menghitung kemungkinan kejadian di waktu yang akan datang dari suatu nilai
yang berada diantara dua batas tertentu.

• Model Stochastic sendiri merupakan model yang digunakan untuk menjalankan


suatu proses yang mengandung ketidakpastian (uncertainty) atau keacakan
(randomness).

• Model Autoregresif Integrated Moving Average (ARIMA) adalah model yang


secara penuh mengabaikan independen variabel dalam membuat peramalan.
ARIMA menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk
menghasilkan peramalan jangka pendek yang akurat. ARIMA cocok jika
observasi dari deret waktu (time series) secara statistik berhubungan satu sama
lain (dependent). ARIMA hanya menggunakan satu variable deret waktu
(univariate time series).

• ARIMA yang juga dikenal sebagai Model Box-Jenkins (dikembangkan oleh


George Box dan Gwilym Jenkins), dibagi ke dalam tiga kelompok, yaitu model
autoregressive (AR), moving average (MA), dan model campuran ARIMA
(autoregressive moving average) yang memiliki karakteristik dari dua model
pertama
• Kelebihan: • Kelemahan:
1. Jika digunakan untuk waktu yang lama
1. Cukup baik digunakan untuk maka hasil dari peramalannya akan
peramalan waktu yang bersifat konstan
pendek. 2. Model arima sudah tidak dapat
menampung terjadinya lonjakan atau
2. Fleksibel dan dapat mewakili penurunan harga yang tajam
rentang yang lebar dari 3. Diperlukan data dalam jumlah yang
karakter deret waktu yang banyak
terjadi dalam jangka pendek 4. Tidak ada cara memperbaharui model
apabila terjadi penambahan data
3. Terdapat prosedur yang
5. Tiddak dapat mengetahui pengaruh
formal dalam pengujian variable-variable lain terhadap variable
kesesuaian model dependent yang diamati di masa yang
akan dating selain berdasarkan
4. Interval ramalan dan prediksi informasi variable dependent dari lag
sudah mengikuti modelnya. sebelumnya.
TUJUAN

Menentukan hubungan statistik antara variabel


yang diprediksi dengan nilai historisnya

6
PENGENALAN
⬗ Historis ARIMA Box-Jenkins Model-model⬗ Wold membentuk model ARMA yang
Autoregressive Integrated Moving Average berkembang dalam tiga arah (untuk  proses
(ARIMA) telah dipelajari secara mendalam oleh AR, MA, dan ARMA campuran). Box dan
George Box dan Gwilym Jenkins (1976). ARIMA Jenkins berhasil dalam menentukan informasi
diterapkan untuk proses deret berkala, prediksi relevan yang diperlukan untuk memahami
dan kontrol atau pengendalian. Model dan memakai model-model ARIMA untuk
Autoregresif (AR) pertama kali dikenalkan oleh deret berkala. Dasar dari tiga tahap dari
Yule (1926) dan kemudian dikembangkan oleh pendekatan hasil mereka dapat dilihat pada
Walker (1931), sedangkan model Moving Gambar 1. Skema Pendekatan yaitu
Average (MA) pertama kali digunakan oleh identifikasi, penaksiran dan pengujian, serta
Slutzky (1937). Akan tetapi Wold-lah (1938) penerapan.
yang menghasilkan dasar-dasar teoritis dari
proses kombinasi ARMA.

7
⬗ PENGERTIAN
⬗ Model ARIMA adalah model yang secara penuh
mengabaikan independen variabel dalam pembuatan
peramalan. ARIMA menggunakan nilai masa lalu dan
sekarang dari variabel dependen untuk menghasilkan
peramalan jangka pendek.

⬗ Philosophy: Let the data speak for themselves

8
SKEMA PENDEKATAN

9
Gambar 1. Skema Pendekatan Arima
Stasioneritas Data
Data disebut stasioner jika nilai rata-rata tidak bergeser
sepanjang waktu

10
Stasioner dan Non-Stasioner

Stationer

Nonstationer
Diferensiasi
⬗Diferensiasi
   Orde 1

Diferensiasi Orde 2

12
Nonstationer

Differences

Stationer
1. Autoregressive Model (AR)

Model AR memiliki konsep nilai saat ini AR(p) bergantung pada nilai p-
sebelumnya, dimana p adalah ordo dari AR. Bentuk umum model AR(p) atau
ARIMA (p,0,0) dinyatakan sebagai berikut :

dimana:
µ’ = konstanta
ϕp = parameter autoregresif ke-p
et = nilai kesalahan pada saat t
2. Moving Average Model (MA)

Model MA memliki konsep nilai saat ini MA(q) bergantung pada nilai q
sebelumnya, dimana q adalah orde dari MA Bentuk umum model MA(q) atau
ARIMA (0,0,q) dinyatakan sebagai berikut :
 

dimana:
µ’ = konstanta
θ1 sampai θq = parameter moving average
et-k = nilai kesalahan pada saat t-k

Perbedaan antara model AR dan MA terletak pada variablenya. Variabel pada


model MA adalah nilai residual pada periode sebelumnya (error terms), sedangkan
pada model AR adalah nilai sebelumnya dari variable dependen itu sendiri.
3. Model Campuran
Model AR dan MA digabungkan untuk memperoleh model ARIMA (Sugiarto dan Harijono,
2000: 180). Penggabungan tersebut diharapkan model ARIMA bisa mengakomodasi pola
data yang tidak diidentifikasi secara sendiri-sendiri oleh model MA atau AR.
a. Proses ARMA
• Model umum untuk campuran proses AR(1) murni dan MA(1) murni, misal ARIMA
(1,0,1) dinyatakan sebagai berikut :

Atau

b. Proses ARIMA
• Apabila nonstasioneritas ditambahkan pada campuran proses ARMA, maka model
umum ARIMA (p,d,q) terpenuhi. Persamaan untuk kasus sederhana ARIMA (1,1,1)
adalah sebagai berikut :.
.
Untuk menggunakan model prakiraan ARIMA, kita perlu melakukan analisis deret waktu dan mengidentifikasi nilai
p,d,q. Tahapan analisis deret waktu dan proses prakiraan terdiri dari :

1. Stasioneritas
Data model harus bersifat stasioner. Data stasioner adalah data yang memiliki nilai rata-rata dan varians yang tetap
sepanjang deret waktu. Jika data sudah stasioner tanpa melalui proses differencing maka d bernilai 0. Dimana d
merupakan orde differencing.

2. Identifikasi
Menetukan nilai yang tepat untuk p (ordo AR) dan q (ordo MA) dengan menggunakan ACF, PACF, dan unit root tests.

3. Estimasi
Memperkirakan nilai p,d,q yang sesuai.

4. Diagnostic Checking
Memeriksa hasil perkiraan model ARIMA, apakah terdapat white noise. White Noise sendiri merupakan suatu series
atau deret angka random tidak berkorelasi yang tidak dapat diprakirakan dengan model.

5.  Prakiraan
Berikut adalah skema model ARIMA (Box Jenkins)
ARIMA (Box Jenkins)
Prosedur Identifikasi Box
Jenkins dalam ARIMA
(p,d,q)

19
SKEMA PENDEKATAN

Gambar 1. Skema Pendekatan


Arima

20
Prosedur Box Jenkins untuk
mengidentifikasi model ARIMA
(p,d,q) sebagai berikut:

1. Plotting data time-series.


2. Identifikasi plot data untuk menentukan apakah data time-series bersifat stasioner (nilai
rata-rata tidak bergeser sepanjang waktu) atau mengikuti suatu pola tertentu, misalnya
trend, musiman, varians dan mean yang tidak konstan atau bahkan tidak stasioner.
Apabila data tidak bersifat stasioner, maka konversi data harus dilakukan diferensiasi
(agar menjadi stasioner).
 Jika terdapat pola musiman dan tidak terdapat tren: diferensiasi lag s (kelipatan) Misal,
untuk data bulanan periksa lag 12, 24, 36, dst.
 Jika terdapat tren dan tidak terdapat musiman yang jelas: diferensiasi orde pertama

21
3. Menentukan model yang akan digunakan. Penentuan model dilakukan dengan cara
membandingkan koefisien autokorelasi (ACF) dan autokorelasi parsial (PACF) dari data
dengan model ARIMA untuk menentukan model yang paling sesuai. Penghitungan dan
pengujian sampel ACF dan sampel PACF untuk mengidentifikasi orde dari p (AR) dan q
(MA) menggunakan data asli yang sudah stasioner.
Pemeriksaan ACF dan PACF :
 Non-musiman = periksa lag-lag awal (1, 2, 3, 4)
 Musiman = periksa pola lag s (kelipatan).

22
4. Perlu dilakukan estimasi dalam pendugaan parameter model data time-series. Selanjutnya parameter model yang telah dihasilkan
diuji signifikansinya dalam model.

Ada dua cara yang mendasar untuk mendapatkan parameter-parameter tersebut:


• Dengan cara mencoba-coba (trial and error), menguji beberapa nilai yang berbeda dan memilih satu nilai tersebut (atau
sekumpulan nilai, apabila terdapat lebih dari satu parameter yang akan ditaksir) yang meminimumkan jumlah kuadrat nilai sisa
(sum of squared residual).
• Perbaikan secara iteratif, memilih taksiran awal dan kemudian membiarkan program komputer memperhalus penaksiran
tersebut secara iteratif.
Pengujian Parameter Model
• Pengujian masing-masing parameter model secara parsial (t-test)
• Pengujian model secara keseluruhan (Overall F test)
Model dikatakan baik jika nilai error bersifat random, artinya sudah tidak mempunyai pola tertentu lagi.

Kesimpulan : Tolak H0 jika ,yang berarti parameternya signifikan.

23
5. Pemeriksaan residual (diagnostic check) pada plot data time-series. Jika
tidak memenuhi diagnostic check, maka kembali ke langkah 3.
Untuk menguji apakah residual data berdistribusi normal
digunakan uji Kolmogorov-Smirnov. Hipotesisnya sebagai berikut:
 Jika nilai p-value < 0,05 maka data tidak berasal dari populasi yang
berdistribusi normal.
 Jika nilai p-value > 0,05 maka data berasal dari populasi yang
berdistribusi normal.

24
Koefisien Autokorelasi

Autokorelasi dapat digunakan untuk mengetahui hubungan linier


sebuah deret waktu tunggal dengan dirinya sendiri setelah mengalami
pergeseran waktu tertentu. Tujuannya adalah untuk mengetahui pola yang
berkaitan dengan waktu di dalam sebuah data deret waktu

25
Proses ACF PACF
AR(p) Turun cepat secara Terputus setelah lag p
eksponensial / sinusoidal
Turun cepat secara
MA(q) Terputus setelah lag q eksponensial / sinusoidal

ARMA(p,q) Turun cepat secara Turun cepat secara


eksponensial / sinusoidal eksponensial / sinusoidal
Tidak ada yang signifikan Tidak ada yang signifikan
White noise (tidak ada yang keluar (tidak ada yang keluar
(Acak)
batas) batas)

26
1. STASTIONERITAS

• Stasioneritas berarti bahwa tidak terdapat pertumbuhan atau


penurunan pada data. Data secara kasarnya harus horisontal
sepanjang sumbu waktu. Dengan kata lain, fluktuasi data berada di
sekitar suatu nilai rata-rata yang konstan, tidak tergantung pada
waktu dan varians dari fluktuasi tersebut pada dasarnya tetap
konstan setiap waktu.

• Dalam istilah statistik, proses stasioner diasumsikan berada dalam


keadaan kesetimbangan statistik tertentu, yaitu p (xt) adalah sama
untuk semua t. Secara khusus, jika zt adalah proses stasioner, maka
difference pertama zt = zt - zt-1.
Data Non-Stasioner
Uji Stasioner

Dickey-Fuller Test
• Dinamai setelah ahli statistik David Dickey dan Wayne Fuller, yang
mengembangkan tes pada tahun 1979.
• Dickey Fuller membangun garis regresi antara fraksi dari nilai saat ini
dan fraksi dari nilai sebelumnya.
• Dalam statistik, uji Dickey-Fuller menguji hipotesis nol bahwa unit
root hadir dalam model autoregressive
• Hipotesis:
H0 : ρ = 0.05 (Terdapat unit roots, variabel tidak
stasioner)
H1 : ρ < 0.05 (Tidak terdapat unit roots, variabel
stasioner)
• Kesimpulan hasil root test diperoleh dengan
membandingkan nilai t-hitung dengan t-tabel pada
tabelDickey-Fuller.
Dickey-Fuller Test

• Data Trend Stokastik


Dickey-Fuller Test

•Untuk
  mengetahui adanya akar unit, maka dilakukan pengujian Dickey-
Fuller (DF-test) sebagai berikut:
• Jika variabel Yt sebagai variabel dependen, maka akan diubah
menjadi:
Yt = ρ Yt-1 + t
• Koefisien Yt-1 (ρ) adalah = 0.5 dalam arti hipotesis diterima.
• Koefisien ρ akan bernilai <0,5 dan hipotesis akan ditolak.
• Untuk mengubah trend yang bersifat non-stasioner menjadi stasioner
dilakukan uji orde pertama (first difference).
Differencing

Differencing adalah menghitung perubahan atau selisih


nilai observasi. Nilai selisih yang diperoleh dicek lagi
apakah stasioner atau tidak. Jika belum stasioner maka
dilakukan differencing lagi. Jika varians tidak stasioner,
maka dilakukan transformasi logaritma.
Prosedurnya dapat diterapkan secara berurutan lebih dari
sekali, sehingga menghasilkan 1st order, 2nd order, dst.
Contoh Hasil Differencing

Data asli Data sesudah dilakukan differencing


Metode Lain

1. Lihat Trend Data


• Jika stochastic differencing.
• Jika deterministic regresi.
2. Hapus trend dalam mean
• Differencing pertama atau differencing kedua
• Merapikan dan membedakan (musim)
3. Periksa varians
• Buat konstanta varians dengan logaritma atau transformasi akar kuadrat.
4. Periksa adanya pola musiman
• Moving Average dan Differencing
2. Identifikasi

a. Mencari nilai d pada data yang telah stasioner.


Apabila data sudah stasioner tanpa melalui proses differencing maka d bernilai
0. Apabila data stasioner setelah melalui differencing pertama maka d bernilai
1
b. Menuntukan nilai p dan q dengan plot ACF dan PACF
Jika pada pola PACF yang menurun secara cepat setelah lag p, maka model
yang teridentifikasi adalah model AR (p). Sedangkan jika pada pola ACF yang
menurun secara cepat setelah lag q, maka model yang teridentifikasi adalah
model MA (q). Selanjutnya apabila pada pola ACF menurun secara cepat
setelah lag q maupun pola PACF menurun secara cepat setelah lag p, maka
model teridentifikasi adalah model ARMA (p,q).
Identifikasi Pola Musiman

Untuk data yang stasioner, faktor musiman dapat ditentukan dengan:


• Mengidentifikasi koefisien autokorelasi pada dua atau tiga time-lag
musiman yang signifikan berbeda dari nol.
• Autokorelasi yang secara signifikan berbeda dari nol menyatakan
adanya suatu pola dalam data.
• Notasi umum:
ARIMA (p,d,q) (P,D,Q)S
Autocorrelation Function (ACF)

Menurut Makridakis et.al (1999) koefisien autokorelasi untuk lag 1,2,3,


…,k dengan banyak pengamatan n dapat dicari dengan rumus rxy dan
dinotasikan ρk. Data Xt diasumsikan stasioner, jadi kedua nilai tengah Xt
dan Xt-k dapat diasumsikan bernilai sama dan dua nilai variansi dapat
diukur satu kali saja dengan menggunaknan seluruh data Xt yang
diketahui, sebagai berikut :
PARTIAL AUTOCORELATION
FUNCTION
• Fungsi Autokorelasi parsial (PACF) yakni himpunan autokorelasi
parsial untuk berbagai lag k. Fungsi autokorelasi parsial digunakan
untuk mengukur tingkat keeratan antara Xt dan xt-k, apabila pengaruh
dari selisih waktu 1, 2, 3, …… k-1 dianggap terpisah.
Identifikasi model AR(p)

Untuk model AR(p), ACF akan menyusut secara eksponensial. Sedangkan


untuk model AR(1) PACF akan turun secara cepat pada lag 1. Sedangnkan
untuk AR(3), PACF akan turun secara cepat pada lag 1, 2, &3.
Identifikasi Model MA(q)

• Orde dari nilai MA (yang diberi notasi q) ditentukan oleh jumlah


periode variabel independen yang masuk dalam model.
Identifikasi model campuran

• Identifikasi model ARMA ditunjukkan pada tabel 3. Berikut adalah


contoh plot model AR(p), MA(q), ARMA(p,q).
ARMA (1,1) • ARMA(2,1)
3. Estimasi

Setelah langkah identifikasi menghasilkan suatu model


sementara, maka langkah selanjutnya adalah melakukan
estimasi terhadap parameter-parameter dalam model
tersebut. Estimasi parameter merupakan perhitungan yang
dilakukan untuk mendapat nilai parameter terbaik pada
suatu model.
• Model Autoregressive
• Model Moving Average
• Model Autoregressive Moving Average
• Model Autoregressive
Pada persamaan model umum AR(p) dinyatakan sebagai berikut :

• Model Moving Average


Proses MA(q) dapat dinyatakan dalam koefisien-koefisien MA, sebagai berikut
:

• Model Autoregressive Moving Average


Untuk memperoleh taksiran awal model-model ARMA campuran, maka
persamaan AR dan MA harus dikombinasikan, sebagai berikut:
Untuk memperoleh nilai parameter model juga dapat dilakukan
dengan cara trial and errori, yaitu memasukkan variabel secara
coba-coba untuk kemudian diuji apakah model tersebut
memadai, untuk selanjutnya dapat ditentukan model yang paling
baik.
• Akaike’s Information Checking (AIC)
Metode ini menerapkan salah satu dari metode yan
menerapkan pendekatan penalized maximum likelihood.
Semakin kecil nilai AIC semakin baik modelnya.
• Mean Absolute Percentage Error (MAPE)
MAPE merupakan ukuran kesalahan yang dihitung dengan
mencari nilai tengah dari presentase absolut perbandingan
kesalahan atau error dengan data aktualnya, semakin kecil
MAPE semakin baik modelnya.
4. Pemeriksa Diagnosa

• Setelah melakukan penaksiran nilai parameter terbaik


dari model ARIMA yang ditetapkan sementara,
selanjutnya perlu dilakukan diagnose checking untuk
membuktikan bahwa model tersebut memadai.
Uji terpenuhinya asumsi-asumsi pemodelan antara lain:
• Uji non-autokorelasi residual
• Uji homoskedastisitas residual
• Uji normalitas residual
• Uji Box-pierce Q
• Uji non-autokorelasi residual
Untuk mengetahui apakah residual mempunyai autokorelasi atau tidak, bias dilihat
dari correlgram of residuals. Jika correlgram tersebut menunjukkan adanya plot ACF atau
PACF yang signifikan pada lag-lag awal maka residual mempunyai autokorelasi. Jika
sebaliknya maka residual tidak mempunyai autokorelasi.
• Uji homoskedastisitas residual
Untuk mengetahui apakah variansi dari residual homogeny ataukah tidak, bisa dilihat
dari correlgram of residual squard. Jika correlgram tersebut menunjukkan adanya plot
ACF atau PACF yang signifikan pada lag-lag awal maka variansi residual tidak konstan.
Jika sebaliknya maka variansi residual konstan.
• Uji normalitas residual
Untuk melihat kenormalan dari residual. Model dikatakan baik jika residualnya
berdistribusi normal terjadi jika histogram residual mempunyai kecenderungan membentuk
pola lonceng.
• Uji Box-pierce Q
Uji Box-pierce Q dapat dihitung dengan rumus :
n = banyaknya data asli
r2k = nilai koefisien autokorelasi time lag k

bila nilai pada table Chi-Square lebih besar dari nilai Q dengan derajat kebebasan m-p-q
dimana p dan q menunjukkan orde dari AR dan MA, maka model sudah memadai,
sebaliknya bila nilai pada table Chi-Square lebih kecil dari nilai Q, maka model belum
memadai.
5. Forecasting

• Langkah terahir adalah memprediksi nilai untuk periode


selanjutnya dari model terbaik. Jika data semula sudah
melalui transformasi, peramalan yang kita dapat, harus
dikembalikan ke bentuk semula. Prediksi suatu data baik
dilakukan untuk jangka waktu yang singkat, sedangkan
prediksi untuk jangka waktu yang panjang hanya
diperlukan untuk melihat kecenderungan (trend).
Penggunaan ARIMA dalam Bidang
Meteorologi dan Klimatologi

• Tresnawati, dkk (2010), menggunakan metode ARIMA untuk


memprediksi suhu muka laut (SST) wilayah Nino 3.4 pada
tahun 2006, 2007, 2008, dengan menggunakan sampling
1986-2005, 1987-2006, 1988-2007. Hasil prediksi di
korelasikan dengan data observasi dan menunjukkan korelasi
yang cukup signifikan yaitu 0.6 – 0.9.
• Budiningtyas, dkk (2012), menggunakan metode ARIMA untuk
mempridiksi curah hujan di Kabupaten Boyolali tahun 2013,
dengan menggunakan periode sampling tahun 2001-2010.
• Bari, dkk (2015), menggunakan metode ARIMA untuk
memprediksi curah hujan di Kota Syhlet, Bangladesh dengan
menggunakan periode sampling 1980-2010, dan 2007-2010
sebagai acuan verifikasi.
Skema Arima
Plot Timeseries Data CH
Estimasi Model

• (000)(111)12
• (000)(211)12
• (001)(111)12
• (101)(111)12
• (001)(211)12
• (101)(211)12
Diagnosis Check
Hasil Prediksi
Contoh Script Arima di R
Plot Time Series Data CH
Hasil Uji Dickey Fuller
Plot Grafik ACF dan PACF
Metode Arima yang mungkin
Uji Ljung Box
Hasil Prediksi CH Pontianak 2017
ACF dan PACF model AR(1)
ACF dan PACF model MA(1)
ACF dan PACF model ARMA(1,1)
Penjelasan SARIMA
⬗ Arima dan Sarima adalah 2 hal yang hampir mirip
⬗ Hal yang membedakan SARIMA dari ARIMA adalah
seasonalnya. Untuk itu, kita juga harus tau berapa pola
pengulangan dari seasonal yang kita miliki. Apakah tiap 3
bulan? Tiap tahun? Dan sebagainya. Karena ini akan
menentukan langkah yang kita gunakan nantinya.

70
Contoh Grafik SARIMA DAN ARIMA

71
Perbedaan ACF dan PACF Sarima dan Arima (1)

72
Perbedaan ACF dan PACF Sarima dan Arima (2)

73
Thanks!
Any questions?

74

Anda mungkin juga menyukai