5724
Abstract
As we know that we have to process and store the data recording well. Data
warehouse is one of data processing method that use to support the decission-
making process. The data warehouse process started from colecting, selecting,
designing and uploading data in to data warehouse. In this research, we use the data
of SUSENAS from year of 1997 until 2012. We took the daily consumption data
(household expendature) to be proceed in data warehouse. The implementation of
web based R studio program can facilitate the users to acces R . R can be accessed
by any kind of devices which have browser and internet acces by any kind of devices
which have browse and internet acces. The connectivity of R studio to data
warehouse can be simplify the users to access and process the data. As the result of
consumption patterns (staple food) forecasting in jember, we conclude that the best
forecasting method for forecasting method for forecasting using AR(1) model. The
limited data collections caused the ensemble wouldn’t become the best method ,
whereas, it should be the best method.
Keywords: Data Warehouse, R program, ARIMA, ARIMA Ensemble.
17
Volume 01, Nomor 01, Februari 2016 ISSN: 2502-5724
di masa lalu dan random error (Khashei et al, Dengan Ẑk,t adalah suatu nilai prediksi
2007). Wei (2009) menguraikan model ARIMA dari metode ke-k pengamatan ke-t
(p,d,q) secara umum dalam yaitu : Implementasi dari pendekatan rata-rata
∅ ( )(1 −) = + ( )
adalah relatif mudah dan ini telah ditunjukan
sebagai pendekatan yang efektif untuk
dengan memperbaiki kinerja dari suatu model
peramalan tunggal (Bishop, 1995).
∅ ( ) = �1 − ∅1 −⋯−∅ �, ( )
= (1 − 1 − ⋯ − 1 )
b. Metode Penggabungan (Stacking) Stacking
adalah suatu metode umum
dan Ø0 adalah intercept pada model untuk yang menggunakan suatu kombinasi dari
difference ke-d. suatu model level lebih tinggi dan model level
Pembuatan model ARIMA dapat dilakukan lebih rendah untuk mencapai suatu akurasi
dengan menggunakan tiga prosedur yaitu predeksi yang lebih tinggi.Secara umum,nilai
identifikasi modal, estimasi modal dan cek peramalan ensemble dengan kombinasi yang
diagnosa (Jenkins 2006). Identifikasi modal digunakan ialah stacking dapat dihitung
merupakan metodologi untuk mengidentifikasi dengan rumus sebagai berikut:
perlunya suatu tranformasi seperti transformasi
̂
=1 =1
k
anggota ensemble dari ARIMA yang terbentuk
Menurut Breiman (1996) meminimalisasi
dengan menggunakan averaging dan
suatu fungsi G dapat memperbaiki
stacking sehingga dipatkan hasil ramalan
ARIMA ensembel. kemampuan generalisasi dari suatu model.
Zaier et al. (2010) menjelaskan bahwa
3. METODE PENELITIAN
ada dua metode yang paling sering
3.1 Sumber Data
digunakan untuk mrngkombinasikan output
Data yang digunakan pada penelitian ini
yang berada dari anggota ensemble, yaitu:
merupakan data yang didata oleh badan
a. Metode Rata-Rata (Averaging) pusat statistic (BPS) yang diambil dari website
Dengan menggunakan metode rata-rata, http://ada.edu. Terdapat beberapa data
output dari ensemble diperoleh dengan sensus, untuk penelitian ini data yang diambil
menghitung rata-rata dari output anggota adalah data SUSENAS mulai tahun 1997-
ensemble. Misalkan N adalah jumlah dari 2012. Data tersebut diambil setiap tahun oleh
anggota-anggota model individual dalam suatu BPS dan mempunyai variabel yang hampir
ensemble, nilai peramalannya dapat ditulis sama setiap tahunnya.
sebagai berikut:
1 3.2 Variabel Penelitian
Variable penelitian yang akan digunakan
̂
= �, +
19
Volume 01, Nomor 01, Februari 2016 ISSN: 2502-5724
masyarakat pada kabupaten Jember, provinsi proses perancangan ini adalah data
Jawa Timur perminggu. Data sensus pertahun SESUNAS Indonesia tahun 1997-2012. Data
dimodelkan dengan rata-rata (everaging), warehouse ini menggunakan database
diambil dari SUSENAS mulai tahun 1997-2012. engine mysql versi 5.5.3x, dan berjalan pada
Data rata-rata belanja kebutuhan pokok sistem operasi linux U-buntu server 12.04
dibagi menjadi dua yaitu data training dan data precise . Pada tahapan ini juga dilakukan
testing. Data training digunakan untuk proses konversi data dalam bentuk .sql, ini
memodelkan yaitu mulai tahun 1997-2010, dilakukan untuk mempermudah konversi ke
sedangkan data testing (dalam 2011-2012) dalam bentuk data warehouse.
digunakan untuk membagi data yang dihasilkan 2. Perancangan R berbasis web dilakukan
dari model ARIMA dan ARIMA ensemble. dengan melakukan instalasi pada server yang
dijadikan uji coba.instalasi ini meliputi
3.3 Langkah Penelitian Langkah-langkah instalasi R server berikut dengan
dalam penelitian ini konfigurasinya serta instalasi web server
sesuai dengan tujuan yang ingin dicapai. sebagai DNS server, kemudian
Tujuan yang pertama diperoleh dengan mengkoneksikan antar R server dan data
mengaplikasikan perancangan arsitektur dan warehouse sehingga aplikasi R berbasis web
pemodelan data dalam membangun sebuah dapat terhubung dengan data warehouse.
data warehouse. Tujuan kedua yaitu 3. Uji coba R berbasis web terhadap ARIMA
merancang aplikasi yang dapat memberikan dan ARIMA Ensemble. Pada tahapan ini
akses ke data warehouse dan R berbasis data dibagi 2 yaitu data training dan testing.
web. Tujuan ke tiga dapat dicapai setelah Data training menggukan data periode
tujuan pertama dan kedua dilakukan. tahun 1997-2010. Sedangkan data testing
menggunakan periode tahun 2011-2012.
Perancangan Peramalan menggunakan metode ARIMA
dan ARIMA ensemble dan hasilnya akan
dibandingkan dengan data testing. Pada
langkah ini diperoleh tujuan ketiga.
Pemodelan Data
4. HASIL DAN PEMBAHASAN
4.1 Perancangan Arsitektur Logical
Perancangan R Proses perancangan arsitektur data
warehouse adalah proses yang rumit, untuk
memulainya kita harus mendefinisikan
kebutuhan dari pengguna.pada tahapan ini
Uji Coba Data Training
terdiri dari perancangan arsitektur logikal dan
perencangan arsitektur fisik. Data yang akan
digunakan sebagai data awal dalam proses
Uji Coba Data Testing perancangan ini adalah data SUSENAS BPS
Indonesia (Data Susenas 1997-2012).
Pada perancangan arsitektur logikal pada
Perbandingan Metode data warehouse, sumber data yang akan
digunakan adalah sumber yang berasal dari
Gambar 1. Tahapan Penelitian kegiatan SUSENAS BPS. Data yang digunakan
atau di peroleh untuk data SUSENAS tahun
Tahapan penelitian dapat dijelaskan
1997-2012 adalah berupa format *.csv, dimana
sebagai berikut ini.
didalam data tersebut terdapat data berupa
1. Perancangan data warehouse ada 2
kode administratif wilayah (mulai dari provinsi
langkah yaitu perangcangan arsitektur dan
sampai dengan desa) yang dijadikan sampel
pemodelan data. Data awal dalam
21
Volume 01, Nomor 01, Februari 2016 ISSN: 2502-5724
4.4 Langkah-langkah Perancangan R Studio 4.5 Koneksi R Studio dan Data Warehouse
Langkah-langkah installasi R RMySQL merupakan sebuah paket
Studio interface yang menghubungkan R dan
adalah sebagai berikut : MySQL database. RMySQL dibuat oleh
a. Installasi OS Linux Server David A. James and Saikat DebRoy pada
b. Ubah pada source list arahkan pada mirror tahun 2012. Download code tgz dari RMySQL
CRAN. Pada uji coba ini CRAN diarahkan pada alamat http://cran.r-project.
pada mirror unej.ac.id org/web/package/RMYSQL/ index.
## r installation package from html atau http://cran-project.org/
mirror.unej.ac.id src/ contrib/RMYSQL 0.9-3.tar.gz
$ debhttp://cran.unej.ac.id/bin/ kemudian install menggunakan perintah $
linux/ ubuntu/precise/ sudo apt-get install libdbd-mysql
$ deb http://cran.unej.ac.id/ libmysqlclient-dev
raring-backports main restricted Pada console linux server .setelah itu
universe jalankan perintah berikut pada console
c. Kemudian install paket R system R CMD INSTALL RMYSQL_0.9-3.tar.gz.
menggunakan perintah berikut: Dbconnect (MYSQL),user=’xxx’, p a s
$ sudo apt-get install r-base-dev s w o r d = ’ x x x ’ ,
d. Instalasi paket R pada Ubuntu dbname=’SUSENAS’,host=’10.10.1xx.
membutuhkan kunci yang dibuat oleh xx’ merupakan perintah yang harus
“micheal rutter” gunakan perintah berikut: dijalankan agar terbentuk koneksi antara R
$ sudo apt-key adv – server dan database. Setelah perintah tersebut
keyserverKeyserver.ubuntu.com – dijalankan, maka berikutnya adalah mencoba
recv-key E084DAB9 dengan membuka data tabel yang dimiliki oleh
e. Langkah berikut adalah instalasi R studio database SUSENAS. Jika berhasil maka akan
server. R studio server ini adalah sebuah tampak tabel-tabel yang dimiliki oleh database
server yang berfungsi menjalankan SUSENAS. Langkah berikutnya adalah
program R lewat browser menggunakan menggali informasi data dengan menggunakan
perintah berikut (os 64 bit): query. Query data R server menggunakan
$ sudo apt-get install gdebi-core dbGETQUERY(nm_koneksi,query).
$sudo apt-get install libappamor1 Berikut ini adalah tampilan R studio yang
$wget http://download2.rstudio. berhasil di koneksikan dengan data warehouse.
org/rstudio-server-0.98.1091-
amd64.deb
$sudo gdebi rstudio-server-
0.98.1091-amd64.deb
f. Langkah berikut adalah pada konfigurasi
server.hal ini diperlukan karena setting
default dari R server menggunakan port
<8787>. agar lebih mudah mengakses
maka kita gunakan port <80> dan address
dari 0.0.0.0. penggunaan alamat (address)
0.0.0.0 ini memungkinkan akses R dari Gambar 5. Aplikasi R Studio
berbagai IP menggunakan perintah berikut:
$/etc/rstudio/rserver/.conf www- 4.6 Uji Coba Program Dengan ARIMA
port=8787 -> ubah menjadi 80 Ada beberapa langkah untuk mendapatkan
www-address=127.0.0.1 -> ubah nilai peramalan menggunakan metode ARIMA
menjadi 0.0.0.0 yang sesuai dengan metodologi BOX-Jenkins.
Langkah-langkah tersebut meliputi identifikasi
Gambar 7a. Plot ACF dan PACF data belanja makanan pokok