Anda di halaman 1dari 10

Apa itu model ARIMA

Model Autoregresif Integrated Moving Average (ARIMA) adalah model yang secara penuh mengabaikan independen variabel dalam membuat peramalan. ARIMA menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat. ARIMA cocok jika observasi dari deret waktu (time series) secara statistik berhubungan satu sama lain (dependent). ARIMA sangat baik ketepatannya untuk peramalan jangka pendek, yang tidak membentuk suatu model struktural baik itu persamaan tunggal atau simultan yang bebasis kepada teori ekonomi atau logika. Metode peramalan dengan menggunakan ARIMA dapat kita jumpai dalam peramalan ekonomi, analisis anggaran, kontrol terhadap proses dan kualitas, analisis sensus, perubahan struktur harga industri, inflasi, indeks harga saham, perkembangan nilai tukar terhadap mata uang asing dsb. Beberapa keuntungan yang dapat diperoleh dengan menggunakan ARIMA: 1. Merupakan model tanpa teori karena variabel yang digunakan adalah nilainilai lampau dan kesalahan yang mengikutinya. 2. Memiliki tingkat akurasi peramalan yang cukup tinggi karena setelah mengalami pengukuran kesalahan peramalan mean absolute error, nilainya mendekati nol. 3. Cocok digunakan untuk meramal sejumlah variabel dengan cepat, sederhana, akurat dan murah karena hanya membutuhkan data variabel yang akan diramal. Model ARIMA menggunakan pendekatan iteratif dalam indentifikasi terhadap suatu model yang ada. Model yang dipilih diuji lagi dengan data masa lampau untuk melihat apakah model tersebut menggambarkan keadaan data secara akurat atau tidak. Suatu model dikatakan sesuai (tepat) jika residual antara model dengan titik-titik data historis bernilai kecil, terdistribusi secara acak dan bebas satu sama lainnya. Pemilihan model terbaik dapat dilakukan dengan membandingkan distribusi koefisien-koefisien autocorrelation (otokorelasi) dari data time series tersebut dengan distribusi teoritis dari berbagai macam model.

ARIMA

ARIMA (Autoregressive Integrated Moving Average) terdiri atas dua metode yang digabung menjadi satu yaitu AR(Autoregressive) dan MA(Moving Average). kalau anda ketemu dengan ARIMA biasanya dibelakangnya terdapat keterangan mengenai model yang digunakan misal ARIMA(2,1,2) atau ARIMA(1,0,1) dan sebagainya. Angka pertama menunjukkan derajat (wah bingung mau pake istilah apa, dibukunya studenmund ditulis term, di Thesis anak MAKSI UNDIP dia pake kata orde koefisien) AR angka kedua derajat integrasi, angka ketiga derajat MA. biasanya modelnya ditulis ARIMA (p,d,q) ya p,d,q berturut-turut seperti keterangan sebelumnya. Ketika kita punya data time series pertama kali dicek stasionaritasnya, kalau datanya nonstasioner bisa didiferensiasi sampe stasioner, jadi bukan cuma didiferensiasi satu kali atau dua kali. lha kalau sudah stasioner gimana?, nek udah stasioner ya udah to tinggal diolah, gitu aja kok repot. he he he. terus ngecek stasionernya gimana? anda bisa pake Box-Ljung test atau Dickey-Fuller test(sekarang saya belum belajar ini, nanti kalau udah mudheng saya tulis disini, insya ALLAH). Lha misalnya kita melakukan diferensiasi dua kali angka 2 mengganti huruf d pada model ARIMA kita. misalnya : ARIMA (p,2,q), ARIMA (p,1,q) dsb. p sama q nya gimana???, sek to sabar, ini kan baru nyari orde koefisien integrasi. kalau anda pakar matematika atau kalau pelajaran matematika gak tidur atau baca buku cerita kayak saya, pasti tau cara melakukan diferensiasi. yang lupa atau pura-pura lupa padahal gak tau ya gak papa. diferensiasi(diferensiasi ini sama dengan turunan kan?) itu selisih nilai pada saat t dengan nilai sebelumnya (t-1). lha diferensiasi kedua gimana ya sama tapi selisih nilai saat t*(t setelah diferensiasi pertama) dengan t-1* (t-1 setelah diferensiasi pertama). sederhananya gini : Yt*=Y(t)-Y(t-1) Maaf saya kasih tanda dalam kurung biar jelas bahwa itu adalah t dan t-1 untuk diferensiasi kedua : Yt** = Y(t)*- Y(t-1)* Untuk menentukan nilai p dan q kita pake ACF(Autocorrelation Function) dan PACF (Partial AutoCorrelation Function). dari sini nanti kita bisa nggambar correlogram dan dari situ akan kelihatan pada tingkat kepercayaan 95% misalnya sampe data keberapa yang signifikan. Cara ngitung ACF dan PACF nya besok ya belum paham soalnya. nilai ACF akan dipake untuk ngisi bagian q, sementara nilai PACF akan dipake untuk ngisi p. bisa saja data kita signifikan di beberapa titik jadi model yang kita dapat bisa beragam dan dari beberapa model tersebut kita harus cari yang paling bagus untuk dipake melakukan prediksi. kalau hasilnya nanti misalnya ARIMA (1,0,0) artinya dia cuma AutoRegressive(AR), AR(1). kalau ARIMA (0,0,1) artinya dia cuma Moving Average(MA),MA(1). kalau misalnya ARIMA (1,0,1) berarti dia ARMA(1,1). Ok sekian dulu. saatnya baca-baca dan tulis-tulis yang lain. selamat berakhirpekan.

terimakasih atas tanggapan bung Steve di MFI di bawah ini. Jadi betul yan ARIMA maupun ARMA itu berkaitan dengan lingkup pembicaraan persoalan Time Series Forecasting. Misalnya data mengenai cuaca : curah hujan, data ekonomi /moneter : Index harga saham, indeks harga barang konsumen, etc : ARMA = Auto Regressive Moving Average ARIMA = Auto-Regressive Integrated Moving Average Untuk bung Wahyu, sekedar menambah bahan bacaan saja (bisa search di http://www.alltheweb.com > dengan menggunakan kata kunci * ARIMA Time Series * ). Salah satu daftar * diktat * yang keluar ada di : < http://www.gfi.uib.no/~nilsg/kurs/notes/node109.html > Tapi tentu saja lebih enak baca tulisannya bung Steve dulu di bawa ini :-) Steve: ----ARIMA itu pemodelan regresi. misal mau memodelkan/regresi y=f(x)

>>>> model ARMA: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ sum [bi yi(t-i)] = sum [aj xj(t-j)] + e ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ e = random process, biasanya gaussian suku2 di kiri adalah AR model suku2 di kanan adalah MA model (FIR filter bahasa DSP nya) i = 0..orde AR j = 0..orde MA model ARMA ini untuk stationary process (moment orde 1&2 independent over time), untuk non stationary process trick yg digunakan: * transformasi koordinat y (log, ^0.5, whatever...)

* gunakan turunan y, instead of y itself. Ini approach yg paling popular (sebagai rule of thumb, biasanya turunan orde 2 memenuhi most-data, ini anjuran Prof.U.Columbia, lupa namanya entar gua cari papernya tapi mungkin Roby tahu.) jadi model ARMA diatas jadi: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ sum [bi y'i(t-i)] = sum [aj xj(t-j)] + e ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ y' adalah turunan y (orde..), model ini disebut ARIMA (I = Integrated/di-integral) ihsan: ----Saya masih ingat, dulu bung Steve pernah dalam postingnya mengatakan bahwa ANN (artificial Neural Network) dengan konfigurasi Feed-Forward atau Backprogation itu sebetulnya * setara * dengan sebuah * filter ARMA orde N * Steve: ----ya backprop itu ARMA orde tak terhingga (penurunannya di bukunya Bart Kosko), jadi inherit problem seperti banyak sekali local minimas. Karena itu orang gunakan bayesian networks, untuk mencari parameter neuralnets yg optimal (complexity-minimum/occam-factor). model arma ini bahasa dsp nya: IIR-filter. kalo baca buku adaptive-filtersnya Haykin/Widrow, neuralnets itu cuma versi adaptive dari IIR filter.

Model ARIMA merupakan salah satu teknik peramalan time series (deret waktu) yang hanya berdasarkan perilaku data variabel yang diamati. Model ARIMA sama sekali mengabaikan variabel independen karena model ini menggunakan nilai sekarang dan nilai-nilai lampau dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat. Secara harfiah, model ARIMA merupakan gabungan antara model AR (Autoregressive) dan model MA (Moving Average).

Sebelum melakukan peramalan,, kita perlu tau neh istilah-istilah berikut:

Stasioneritas Stasioneritas berarti bahwa tidak terdapat pertumbuhan atau penurunan pada data. Data secara kasarnya harus horisontal sepanjang sumbu waktu. Dengan kata lain, fluktuasi data berada di sekitar suatu nilai rata-rata yang konstan, tidak tergantung pada waktu dan varians dari fluktuasi tersebut pada dasarnya tetap konstan setiap waktu. Kestasineran merupakan kondisi yang diperlukan dalam analisis deret waktu. So, data yang digunakan untuk peramalan harus stasioner.

Differencing (pembedaan)
Apabila data yang digunakan tidak stasioner maka dilakukan differencing (pembedaan) agar data tersebut menjadi stasioner. Secara umum, apabila terdapat pembedaan orde ke-d untuk mencapai stasioneritas, maka ditulis:

sebagai deret yang stasioner, dan model umum ARIMA (0,d,0) akan menjadi ARIMA (0,d,0)

Model Autoregressive orde p atau AR (p) yaitu suatu model yang menjelaskan pergerakan suatu variabel melalui variabel itu sendiri di masa lalu.

Model autoregressive orde ke-p dapat ditulis sebagai berikut: ARIMA (p,0,0)

di mana:

atau

Model Moving Average orde q atau MA (q) yaitu suatu model yang melihat pergerakan variabelnya melalui residualnya di masa lalu. Model Moving Average orde-q dapat ditulis sebagai berikut: ARIMA (0,0,q) atau MA (q)

di mana:

atau

Model Autoregressive Moving Average atau ARMA (p, q) Model ARMA merupakan gabungan antara model AR (p) dan model MA (q). Model Autoregressive Moving Average dapat ditulis sebagai berikut:

Atau

Model Autoregressive Integrated Moving Average atau ARIMA (p, d, q) Dalam praktek, banyak data yang tidak stasioner. Jika data itu melalui proses pembedaan sebanyak d kali menjadi stasioner, maka data itu dikatakan nonstasioner homogen tingkat d. Proses pembedaan disini bertujuan untuk mencapai kestasioneran, karena itu model ARIMA (p, d, q) dapat ditulis sebagai berikut:

di mana

Ada beberapa tahap dalam melakukan peramalan dengan menggunakan model ARIMA yaitu: 1. Identifikasi Model Identifikasi model dilakukan untuk menelaah keberartian autokorelasi dan kestasioneran data, sehingga perlu-tidaknya transformasi atau proses differencing (pembedaan) dilakukan. Langkah-langkah dalam melakukan identifikasi model yaitu: 1. Petakan data atas waktu dan telaah karakter data untuk menentukan perlu-tidaknya trasformasi stabilisasi varians dan/atau proses pembedaan dilakukan. 2. Menghitung dan menelaah ACF dan PACF data sampel asli (data sebelum dilakukan proses transformasi dan/atau pembedaan) untuk mendapatkan informasi mengenai orde dari proses pembedaan. 3. Hitung dan telaah ACF dan PACF data hasil transformasi dan/atau pembedaan (jika ada perlakukan transformasi dan/atau pembedaan), untuk memperkirakan orde autoregresif (AR) dan moving average (MA) yang akan diambil. Pedoman umum untuk menelaah apakah orde dari model deret waktu stasioner sudah cukup baik berdasarkan ACF dan PACF-nya, sebagai berikut:

Model AR (p)

ACF Berpola eksponensial atau seperti gelombang sinus yang melemah Perbedaan nilai antara lag-1 dengan nilai sesudah lag-q cukup besar (cut of after lag-q) Berpola menurun secara cepat sesudah lag-(q-p)

PACF Perbedaan nilai antara lag-1 dengan nilai sesudah lag-p cukup besar (cut off after lag-p) Berpola eksponensial atau seperti gelombang sinus yang melemah Berpola menurun secara cepat sesudah lag-(p-q)

MA (q) ARMA (p,q)

1. Estimasi Parameter Model Setelah diperoleh satu atau beberapa model sementara maka langkah selanjutnya adalah mencari estimasi untuk parameter-parameter dalam model itu. Estimasi dapat dilakukan dengan beberapa cara sebagai beriku: 1. Metode momen 2. Metode maksimum likelihood 3. Metode Ordinary Least Square (OLS)

2. Diagnostic Checking

Diagnostik checking dilalukan untuk memeriksa apakah model yang diestimasi cukup cocok dengan data yang ada. Diagnostic checking didasarkan pada
analisis residual. Asumsi dasar model ARIMA adalah bahwa residual merupakan variabel random independen berdistribusi normal dengan mean nol varians konstan. 1. Uji Independen Untuk memerika apakah residual independen dapat digunakan uji Ljung-Box. Uji ini menggunakan autokorelasi sampel dari residual untuk memeriksa hipotesis null. Adapun hipotesisnya adalah:

Dengan statistik uji:

di mana:

Jika

atau

nilai autokorelasi residual sama dengan nol sehingga residual independen. 2 dan pada derajat bebas masing-masing menyatakan orde dari proses autoregresif dan moving average .

maka H0 diterima dan ini berarti

Selain dengan pengujian hipotesis, independensi antar lag ditunjukkan pula oleh grafik autokorelasi residual. Apabila grafik fungsi autokorelasi menunjukkan tidak ada satu lag pun yang keluar batas selang kepercayaan maka residual independen. 2. Uji Identik Sebuah model dikatakan baik, jika plot residual terhadap waktu sudah tidak membentuk pola tertentu (residual bersifat acak). 3. Uji kenormalan Untuk menguji asumsi residual berdistribusi normal digunakan uji Kolmogorov-Smirnov (K-S). Hipotesis yang digunakan adalah:

dengan statistik uji :

di mana:

Jika statistik uji lebih besar dari nilai kritis K-S, keputusan ditolak atau dengan melihat P-value lebih besar dari residual berdistribusi normal. 3. Peramalan

H0

berarti

Naahh,, setelah di peroleh model yang layak/memadai (memenuhi asumsiasumsi di atas), maka model tersebut dapat digunakan untuk peramalan. **Untuk melakukan proses peramalan tersebut dapat digunakan paket program SPSS atau MINITAB Sumber:

Daniel, W. W. 1989. Statistik Nonparametrik Terapan. Jakarta : PT Gramedia. Makridakis. S, Wheelwright, and McGee. 1995. Metode dan Aplikasi Peramalan. Terjemahan Untung Sus Andriyanto dan Abdul Basith. Jakarta : Erlangga. Mulyana. 2004. Buku Ajar Analisis Data Deret Waktu. Bandung : Jurusan Statistika FMIPA UNPAD.