244 358 1 PB

Volume 01, Nomor 01, Februari 2016 ISSN: 2502-
5724
Rancang Bangun Data Warehouse dan R Studio Serta

Pemanfaatanya dalam Peramalan Pola Konsumsi Masyarakat di
Kabupaten Jember
1)
Lutfi Ali Muharom
1)
Prodi Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Jember
1)
Email: lutfi.muharom@unmuhjember.ac.id
2) 3)
Alfian Futuhul Hadi , Dian Anggraeni
2,3)
Jurusan Matematika, Fakultas MIPA, Universitas Jember
Abstract
As we know that we have to process and store the data recording well. Data
warehouse is one of data processing method that use to support the decission-
making process. The data warehouse process started from colecting, selecting,
designing and uploading data in to data warehouse. In this research, we use the data
of SUSENAS from year of 1997 until 2012. We took the daily consumption data
(household expendature) to be proceed in data warehouse. The implementation of
web based R studio program can facilitate the users to acces R . R can be accessed
by any kind of devices which have browser and internet acces by any kind of devices
which have browse and internet acces. The connectivity of R studio to data
warehouse can be simplify the users to access and process the data. As the result of
consumption patterns (staple food) forecasting in jember, we conclude that the best
forecasting method for forecasting method for forecasting using AR(1) model. The
limited data collections caused the ensemble wouldn’t become the best method ,
whereas, it should be the best method.
Keywords: Data Warehouse, R program, ARIMA, ARIMA Ensemble.
1. PENDAHULUAN sangat tinggi kemampuan IPTEK-nya,ternyata

BPS melakukan pengumpulan data, menguasai 80% dari pendapatan global
menerbitkan publikasi statistik nasional maupun (Kementan, 2012).
daerah ,serta melakukan analisis data statistik Perguruan tinggi sebagai salah satu pusat
yang digunkan dalam pengambilan keputusan riset yang didalamnya terhimpun sarana dan
.sejak polapembangunan yang diarahkan pada prasarana IPTEK yang cukup mutakhir dan
otonomi daerah,dibutuhkan perhitungan statisik tersedia cukup sumber daya manusia ber
sampai dengan skala kecamatan bahkan desa kualitas tinggi.salah satu hambatan didalam
untuk membantu pemerintah daerah dalam penelitian / riset adalah masalah ketersediaan
upaya mendongkrak pembangunan daerah. data, salah satu contoh adalah data sensus dan
Sejarah telah menunjukkan bahwa ada survei. Salah satu langkah yang perlu diambil
korelasi yang amat kuat antara kemampuan adalah dengan membangun suatu data
IPTEK suatu negara dengan tingkat warehouse tersendiri yang berfungsi untuk
pendapatannya per kapita.makin tinggi menampung data dan angka yang dihasilkan
kemampuan IPTEK suatu negara makin makin oleh sensus dan survei. Kemudahan dalam
tinggi pula tingkat pendapatan perkapitannya. mengakses data ini akan menjadikan penelitian
perlu dicatat bahwa negara-negara kaya hanya terutama dalam bidang statistik akan semakin
memiliki 20% dari penduduk bumi,tetapi berkembang. Diharapkan hasil-hasil penelitian
ini menjadi salah satu acuan pemerintah
JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia
17
Volume 01, Nomor 01, Februari 2016 ISSN: 2502-5724
maupun swasta didalam mengambil kebijakan untuk setiap tahunnya.

sehingga memberikan dampak baik langsung
maupun tidak langsung pada pertumbuhan 2.2 Konsep Data Warehouse
ekonomi. Data warehouse adalah database yang
R adalah salah satu dari program sumber saling bereaksi yang dapat digunakan untuk
terbuka yang dapat diunduh gratis. R query dan analisis, bersifat orientasi subjek,
diluncurkan pertama kali tahun 1997, dan versi terintegrasi, time variant, tidak berubah yang
terakhir ketika tulisan diluncurkan ini dibuat digunakan untuk membuat para pengambil
tahun 1997, dan versi terakhir ketika tulisan ini keputusan. Adapun karakteristik dari
dibuat adalah 3.1.0. R studio adalah salah satu warehouse menurut Inmon yaitu:
GUI untuk R, salah satu keunggulan pada R
1. Berorientasi subjek (subject oriented) Data
studio ini adalah dapat dijalankan pada browser
warehouse berorientasi subjek
sehingga dijalankan diatas browser, maka
artinya data warehouse didesain untuk
pengguna tidak memerlukan lagi installasi R,
analisa data berdasarkan subjek tertentu
kecuali paket (package) pemrograman sesuai
dalam organisasi, bukan pada proses atau
dengan kebutuhan pengguna.
fungsi aplikasi tertentu.
2. TINJAUAN PUSTAKA 2. Terintegrasi (integrated)
2.1 SUSENAS Data warehouse dapat menyimpan data-
BPS melakukan pengumpulan data melalui data yang berasal dari sumber-sumber yang
kegiatan sensus dan survei (sampling). Survei terpisah kedalam suatu format yang konsisten
Sosial Ekonomi Nasional (SUSENAS) adalah dan saling terintegrasi satu dengan yang
survei yang dirancang untuk mengumpulkan lainnya. Dengandemikian data tidak dapat
data sosial kependudukan yang relatif sangat dipecah-pecah karena data yang ada
luas dan dilaksanakan setiap tahun.data yang merupakan suatu kesatuan yang menunjang
dikumpulkan antara lain menyangkut bidang keseluruhan kensep data warehouse itu
bidang pendidikan, kesehatan/gizi, perumahan, sendiri.
sosial ekonomi lainnya, kegiatan sosial budaya, 3. Rentang Waktu (time-variant)
konsumsi/ pengeluaran dan pendapatan rumah Seluruh data pada data warehouse dapat
tangga, perjalanan, dan pendapatan masyarakat dikatakan akurat atau valid pda waktu tertentu.
mengenai kesejahteraan rumah tangganya.
Untuk melihat interval waktu yang digunakan
dalam mengukur keakuratan data warehouse.
SUSENAS sudah dilaksanakan sejak
tahun 1963 dengan kuesioner yang dibagi 4. Non-Volatile
dalam dua bagian besar yaitu Kor dan Modul. Karakteristik keempat dari data warehouse
Kor adalah kumpulan pertanyaan-pertanyaan adalah non-volatile, maksudnya data pada data
yang bersifat umum yang selalu ditanyakan warehouse tidak diupdate secara real time tetapi
setiap tahun, sedangkan Modul adalah di refresh dari sistem operasional secara
pertanyaan-pertanyaan khusus sesuai dengan reguler. Data yang baru selalu ditambahkan
topiknya dan lebih rinci yang dilakukan tiga sebagai sebuah perubahan. Database tersebut
tahun sekali untuk setiap topik. secara kontinyu menyerap data baru ini,
Pelaksanaan lapangan SUSENAS awalnya kemudian secara incremental disatukan dengan
adalah pada bulan Januari Februari untuk setiap data sebelumnya.
tahunnya. Namun sejak bergesernya tahun
anggaran dari April- Maret menjadi Januari- 2.3 Model ARIMA
Desember maka pelaksanaan SUSENAS pada Pada model ARIMA (p,d,q) nilai yang akan
bulan Januari menjadi terkendala, maka sejak datang dari suatu variabel diasumsikan sebagai
2004 pelaksanaan SUSENAS digeser menjadi fungsi linier dari suatu variabel diasumsikan
bulan Juni-Juli sebagai fungsi linier dari beberapa pengamatan
18 JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

5724
di masa lalu dan random error (Khashei et al, Dengan Ẑk,t adalah suatu nilai prediksi
2007). Wei (2009) menguraikan model ARIMA dari metode ke-k pengamatan ke-t
(p,d,q) secara umum dalam yaitu : Implementasi dari pendekatan rata-rata
∅ ( )(1 −) = + ( )
adalah relatif mudah dan ini telah ditunjukan
sebagai pendekatan yang efektif untuk
dengan memperbaiki kinerja dari suatu model
peramalan tunggal (Bishop, 1995).
∅ ( ) = �1 − ∅1 −⋯−∅ �, ( )
= (1 − 1 − ⋯ − 1 )
b. Metode Penggabungan (Stacking) Stacking
adalah suatu metode umum
dan Ø0 adalah intercept pada model untuk yang menggunakan suatu kombinasi dari
difference ke-d. suatu model level lebih tinggi dan model level
Pembuatan model ARIMA dapat dilakukan lebih rendah untuk mencapai suatu akurasi
dengan menggunakan tiga prosedur yaitu predeksi yang lebih tinggi.Secara umum,nilai
identifikasi modal, estimasi modal dan cek peramalan ensemble dengan kombinasi yang
diagnosa (Jenkins 2006). Identifikasi modal digunakan ialah stacking dapat dihitung
merupakan metodologi untuk mengidentifikasi dengan rumus sebagai berikut:
perlunya suatu tranformasi seperti transformasi
̂
untuk stasioner dalam varians transformasi

=�
,
differencing, keputusan untuk memasukan

parameter Ø0 ketika d>0 dan penentuan order p Dengan Ẑk,t adalah suatu nilai predeksi
dan q pada ARIMA (Wei, 2009). dari metode ke-k pengamatan ke-t dan Ck
merupakan konstanta yang diestimasi dengan cara
2.4 Model ARIMA Ensemble meminimumkan fungsi G. Fungsi G tersebut
ARIMA ensemble merupakan model memiliki rumus sebagi berikut:
ARIMA. Pembentukan ARIMA ensemble 2
terdiri dari dua langkah. Pertama menciptakan ̂
anggota enseble dari beberapa modal ARIMA

= � � − �, �
=1 =1
selanjutnya menggabungkan hasil ramalan Dengan syarat ∑ =1 =1 dan 0 ≤ C ≤ 1.
k
anggota ensemble dari ARIMA yang terbentuk
Menurut Breiman (1996) meminimalisasi
dengan menggunakan averaging dan
suatu fungsi G dapat memperbaiki
stacking sehingga dipatkan hasil ramalan
ARIMA ensembel. kemampuan generalisasi dari suatu model.
Zaier et al. (2010) menjelaskan bahwa
3. METODE PENELITIAN
ada dua metode yang paling sering
3.1 Sumber Data
digunakan untuk mrngkombinasikan output
Data yang digunakan pada penelitian ini
yang berada dari anggota ensemble, yaitu:
merupakan data yang didata oleh badan
a. Metode Rata-Rata (Averaging) pusat statistic (BPS) yang diambil dari website
Dengan menggunakan metode rata-rata, http://ada.edu. Terdapat beberapa data
output dari ensemble diperoleh dengan sensus, untuk penelitian ini data yang diambil
menghitung rata-rata dari output anggota adalah data SUSENAS mulai tahun 1997-
ensemble. Misalkan N adalah jumlah dari 2012. Data tersebut diambil setiap tahun oleh
anggota-anggota model individual dalam suatu BPS dan mempunyai variabel yang hampir
ensemble, nilai peramalannya dapat ditulis sama setiap tahunnya.
sebagai berikut:
1 3.2 Variabel Penelitian
Variable penelitian yang akan digunakan
̂
= �, +
pada penelitian ini adalah data belanja/

konsumsi kebutuhan pokok (beras, jagung)
19
masyarakat pada kabupaten Jember, provinsi proses perancangan ini adalah data
Jawa Timur perminggu. Data sensus pertahun SESUNAS Indonesia tahun 1997-2012. Data
dimodelkan dengan rata-rata (everaging), warehouse ini menggunakan database
diambil dari SUSENAS mulai tahun 1997-2012. engine mysql versi 5.5.3x, dan berjalan pada
Data rata-rata belanja kebutuhan pokok sistem operasi linux U-buntu server 12.04
dibagi menjadi dua yaitu data training dan data precise . Pada tahapan ini juga dilakukan
testing. Data training digunakan untuk proses konversi data dalam bentuk .sql, ini
memodelkan yaitu mulai tahun 1997-2010, dilakukan untuk mempermudah konversi ke
sedangkan data testing (dalam 2011-2012) dalam bentuk data warehouse.
digunakan untuk membagi data yang dihasilkan 2. Perancangan R berbasis web dilakukan
dari model ARIMA dan ARIMA ensemble. dengan melakukan instalasi pada server yang
dijadikan uji coba.instalasi ini meliputi
3.3 Langkah Penelitian Langkah-langkah instalasi R server berikut dengan
dalam penelitian ini konfigurasinya serta instalasi web server
sesuai dengan tujuan yang ingin dicapai. sebagai DNS server, kemudian
Tujuan yang pertama diperoleh dengan mengkoneksikan antar R server dan data
mengaplikasikan perancangan arsitektur dan warehouse sehingga aplikasi R berbasis web
pemodelan data dalam membangun sebuah dapat terhubung dengan data warehouse.
data warehouse. Tujuan kedua yaitu 3. Uji coba R berbasis web terhadap ARIMA
merancang aplikasi yang dapat memberikan dan ARIMA Ensemble. Pada tahapan ini
akses ke data warehouse dan R berbasis data dibagi 2 yaitu data training dan testing.
web. Tujuan ke tiga dapat dicapai setelah Data training menggukan data periode
tujuan pertama dan kedua dilakukan. tahun 1997-2010. Sedangkan data testing
menggunakan periode tahun 2011-2012.
Perancangan Peramalan menggunakan metode ARIMA
dan ARIMA ensemble dan hasilnya akan
dibandingkan dengan data testing. Pada
langkah ini diperoleh tujuan ketiga.
Pemodelan Data
4. HASIL DAN PEMBAHASAN
4.1 Perancangan Arsitektur Logical
Perancangan R Proses perancangan arsitektur data
warehouse adalah proses yang rumit, untuk
memulainya kita harus mendefinisikan
kebutuhan dari pengguna.pada tahapan ini
Uji Coba Data Training
terdiri dari perancangan arsitektur logikal dan
perencangan arsitektur fisik. Data yang akan
digunakan sebagai data awal dalam proses
Uji Coba Data Testing perancangan ini adalah data SUSENAS BPS
Indonesia (Data Susenas 1997-2012).
Pada perancangan arsitektur logikal pada
Perbandingan Metode data warehouse, sumber data yang akan
digunakan adalah sumber yang berasal dari
Gambar 1. Tahapan Penelitian kegiatan SUSENAS BPS. Data yang digunakan
atau di peroleh untuk data SUSENAS tahun
Tahapan penelitian dapat dijelaskan
1997-2012 adalah berupa format *.csv, dimana
sebagai berikut ini.
didalam data tersebut terdapat data berupa
1. Perancangan data warehouse ada 2
kode administratif wilayah (mulai dari provinsi
langkah yaitu perangcangan arsitektur dan
sampai dengan desa) yang dijadikan sampel
pemodelan data. Data awal dalam

5724
dan data berupa nilai angka dari survey yang

dilakukan.
Dari sumber tersebut, kemudian dilakukan
proses pemilihan data yang diperlukan proses
seleksi yaitu proses pemilihan data yang
diperlukan dari sumber tersebut, karena bisa
jadi dalam pembuatan data warehouse tidak
semua data akan digunakan. Proses yang akan
dilakukan selanjutnya adalah proses cleansing
yaitu proses pembersihan data dan proses
transfomasi. Proses terakhir yang dilakukan
adalah proses loading yaitu proses memasukan
data hasil dari tahap sebelumnya ke dalam data
warehouse. Gambar 4. Perancangan Arsitektur Fisik
4.3 Pemodelan Data

Skema yang digunakan untuk pemodelan
data adalah dengan menggunakan relationship
schema. Pengguna skema ini memungkinkan
proses query yang lebih ringan dan
memudahkan penjelajahan terhadap data
dimensinya. Tabel tabel yang digunakan
ditunjukkan dalam tabel 1 dibawah ini:
Gambar 2. Perancangan Arsitektur Logikal Tabel 1. Daftar Tabel

No Tabel Keterangan
Untuk mempermudah proses import data 1. Propinsi Tabel ini berisi data
berikutnya,maka dibuat sebuah interface propinsi dan kode propinsi
untuk import data secara otomatis. yang ada di indonesia
Pembuatan interface ini akan mempermudah 2. Kabupaten Tabel ini berisi data
pengguna untuk melakukan proses query kabupaten pada setiap
data. Berikut adalah tampilan interface dalam propinsi
proses query data pada data warehouse: 3. Kecamatan Tabel ini berisi data
kecamatan pada setiap
kabupaten
4. Desa Tabel ini berisi data desa/
kelurahan pada setiap
kecamatan
5. SUSENAS Tabel yang berisi catatan
survey terhadap sampel
yang diambil pada
setiap desa, kecamatan
kabupaten dan propinsi
Gambar 3. Interface pada data Warehouse
yang ada berdasarkan
variabel yang menjadi
4.2 Perancangan Arsitektur Fisik
variabel survey pada
Arsitektur Fisik data warehouse yang
SUSENAS
didapat data SUSENAS BPS akan terlihat
sebagai berikut:
21
4.4 Langkah-langkah Perancangan R Studio 4.5 Koneksi R Studio dan Data Warehouse
Langkah-langkah installasi R RMySQL merupakan sebuah paket
Studio interface yang menghubungkan R dan
adalah sebagai berikut : MySQL database. RMySQL dibuat oleh
a. Installasi OS Linux Server David A. James and Saikat DebRoy pada
b. Ubah pada source list arahkan pada mirror tahun 2012. Download code tgz dari RMySQL
CRAN. Pada uji coba ini CRAN diarahkan pada alamat http://cran.r-project.
pada mirror unej.ac.id org/web/package/RMYSQL/ index.
## r installation package from html atau http://cran-project.org/
mirror.unej.ac.id src/ contrib/RMYSQL 0.9-3.tar.gz
$ debhttp://cran.unej.ac.id/bin/ kemudian install menggunakan perintah $
linux/ ubuntu/precise/ sudo apt-get install libdbd-mysql
$ deb http://cran.unej.ac.id/ libmysqlclient-dev
raring-backports main restricted Pada console linux server .setelah itu
universe jalankan perintah berikut pada console
c. Kemudian install paket R system R CMD INSTALL RMYSQL_0.9-3.tar.gz.
menggunakan perintah berikut: Dbconnect (MYSQL),user=’xxx’, p a s
$ sudo apt-get install r-base-dev s w o r d = ’ x x x ’ ,
d. Instalasi paket R pada Ubuntu dbname=’SUSENAS’,host=’10.10.1xx.
membutuhkan kunci yang dibuat oleh xx’ merupakan perintah yang harus
“micheal rutter” gunakan perintah berikut: dijalankan agar terbentuk koneksi antara R
$ sudo apt-key adv – server dan database. Setelah perintah tersebut
keyserverKeyserver.ubuntu.com – dijalankan, maka berikutnya adalah mencoba
recv-key E084DAB9 dengan membuka data tabel yang dimiliki oleh
e. Langkah berikut adalah instalasi R studio database SUSENAS. Jika berhasil maka akan
server. R studio server ini adalah sebuah tampak tabel-tabel yang dimiliki oleh database
server yang berfungsi menjalankan SUSENAS. Langkah berikutnya adalah
program R lewat browser menggunakan menggali informasi data dengan menggunakan
perintah berikut (os 64 bit): query. Query data R server menggunakan
$ sudo apt-get install gdebi-core dbGETQUERY(nm_koneksi,query).
$sudo apt-get install libappamor1 Berikut ini adalah tampilan R studio yang
$wget http://download2.rstudio. berhasil di koneksikan dengan data warehouse.
org/rstudio-server-0.98.1091-
amd64.deb
$sudo gdebi rstudio-server-
0.98.1091-amd64.deb
f. Langkah berikut adalah pada konfigurasi
server.hal ini diperlukan karena setting
default dari R server menggunakan port
<8787>. agar lebih mudah mengakses
maka kita gunakan port <80> dan address
dari 0.0.0.0. penggunaan alamat (address)
0.0.0.0 ini memungkinkan akses R dari Gambar 5. Aplikasi R Studio
berbagai IP menggunakan perintah berikut:
$/etc/rstudio/rserver/.conf www- 4.6 Uji Coba Program Dengan ARIMA
port=8787 -> ubah menjadi 80 Ada beberapa langkah untuk mendapatkan
www-address=127.0.0.1 -> ubah nilai peramalan menggunakan metode ARIMA
menjadi 0.0.0.0 yang sesuai dengan metodologi BOX-Jenkins.
Langkah-langkah tersebut meliputi identifikasi

5724
estimasi parameter dan peramalan. Berikut ini

merupakan penjelasan model ARIMA untuk
data pola belanja makanan pokok di
Kabupaten Jember.
a. Identifikasi
Identifikasi pertama yaitu mengetahui
perlu atau tidaknya tranformasi atau yang
sering disebut dengan kestasioneran, dapat
Gambar 7b. Plot ACF dan PACF data belanja makanan pokok
menggunakan plot time series atau uji yang
lain. Pengujian untuk melihat kestasioneran
Pada gambar 7 terlihat plot ACF cuts off
dalam varian dapat menggunakan box-cox.
setelah lag 2. Plot ACF merepresentasikan
Akan tetapi pengujian tersebut tidak dilakukan
nilai (MA),dari plot ACF tersebut maka nilai
karena tidak merubah pola dari data.
(MA) yang dapat diujikan adalah (1) dan (2)
Sedangkan identifikasi kedua (uji
sedangkan plot PACF cutsoff setelah lag 1.
kestasioneran dalam rata-rata) dapat
Sehingga model ARMA yang memungkinkan
menggunakan uji Dickey-Fuller. Karena hasil
adalah AR(1), ARMA(1,1), ARMA(1,2), tetapi
uji Dickey-Fuller dipengaruhi oleh adanya
juga akan menguji beberapa model ARMA
outlier (Suprapto, 2000), maka digunakan plot
yang lain yaitu : MA(1), MA(2), ARMA(2,2),
time series untuk melihat kestasioner.
dan ARMA(2,1) dan AR(2).
b. Estimasi Parameter
Berdasarkan hasil dari proses program
terdapat nilai AIC pada masing masing model
ARMA seperti pada tabel 2. Sedangkan uji
diagnosa yang dilakukan meliputi uji white
noise dan uji distribusi normal seperti pada
tabel 3.
Tabel 2. Model Arima dan Nilai AIC yang dihasilkan
Model Nilai AIC
Gambar 6. Plot Time Series Terhadap Belanja Makanan Pokok
AR(1) 253,7
ARMA(1,1) 255,31
Pada uji Dickey-Fuller terlihat bahwa
data uji memiliki nilai stasioner terlihat dari ARMA(1,2) 256,31
hasil hipotesa yang bernilai stasioner. MA(1) 267,12
Sehingga berdasarkan plot time series dan uji MA(0,2) 265,16
Dickey-Fuller data belanja makanan pokok di ARMA(2,2) Error
Kabupaten Jember stasioner. Kestasioneran ARMA(2,1) 254,62
ini berakibat pada nilai (I) pada ARIMA adalah AR(2,0) 253,3
0 (nol), untuk nilai (AR) dan (MA) di lihat Tabel 3. Hasil Pengujian Model ARMA
melalui plot ACF dan plot PACF
Pengujian Asumsi White Pengujian Asum-
Model Noise si Normal
Lag p-value Ket p-value Ket
0 0,5134 Sig*
AR(1) 1 0,5134 Sig* 0,147 Sig*
2 0,7151 Sig*
Gambar 7a. Plot ACF dan PACF data belanja makanan pokok
JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia 23

Pengujian Asumsi White Pengujian Asum- Tabel 4. Hasil Peramalan Model

Model Noise si Normal Model Tahun ke1 Tahun ke2
Lag p-value Ket p-value Ket
Ar(1) 35643,93 35643,89
0 0,1763 Sig*
ARMA(1,0,1) 35367,90 34572,54
AR(1,1) 1 0,1763 Sig* 0,145 Sig*
2 0,1575 Sig*
Dari data tersebut kemudian dibandingkan
0 NA Tidak
Sig* dengan testing (tahun 2011 dan 2012), maka
ARMA 1 <2e-16 Tidak NA Tidak akan diperoleh hasil sebagai berikut:
(1,2) Sig* Sig*
2 0,2514 Tidak Tabel 5. Uji Perbandingan Dengan Data Testing
Sig*
Model Tahun Hasil Testing Selisih
MA(1) 0 NA Tidak
Sig* 1,05e- Tidak AR(1) 2011 35643,93 36027,71 383,78
1 <2e-16 Sig* 2012 35643,89 37885,84 2241,95

12 Sig*
ARMA 2011 35367,90 36027,71 659,81
2 0,01009 Sig* (1,1) 2012 34572,54 37885,84 3313,30
0 NA Tidak
Sig* Tidak
d. Uji Proram Dengan ARIMA Ensemble Pada
MA(2) 1 <2e-16 Tidak <2e-16
Sig*
Sig* pembahasan model ARIMA terdapat
2 0,08781 Sig* dua model ARIMA yang dijadikan sebagai model
0 NA Tidak didalam ensemble, hasil dari semua data
Sig* training yang dilakukan pada model ARMA
AR(2,2) 1 NA Tidak NA Tidak
Sig* Sig* kemudian akan diambil rata-rata (average).
2 NA Tidak
Sig* Tabel 6. Hasil ARIMA Ensemble
0 NA Tidak Model Tahun Hasil Teating Selisih
Sig* Tidak ARMA(1) 2011 35643,93 36027,71 383,78
AR(2,1) 1 2,00e- Tidak 0,695
Sig* 2012 35643,89 37885,84 2241,95
16 Sig*
ARMA (1,1) 2011 35367,90 36027,71 659,81
2 0,9178 Sig*
2012 34572,54 37885,84 3313,30
0 NA Tidak
Sig* ARIMA 2011 35781,87 36027,71 245,84
ensemble 2012 35370,81 37885,84 2515,03
AR(2) 1 <2e-16 Tidak 0,552 Tidak
Sig* Sig*
2 0,1753 Tidak
Sig*
Pengujian terhadap data testing
memperlihatkan bahwa nilai model ARIMA
Keterangan: Sig*=Signifikan
ensemble pada tahun 2011 adalah sebesar
Hasil dari tabel 3 menunjukan bahwa 35505,92 dengan selisih terhadap data testing
terdapat dua model surat yang telah memenuhi
sebesar 521,79 pada tahun 2012, nilai pada
model ensemble adalah sebesar 35108,22
asumsi baik white noise maupun asumsi
dengan selisih terhadap data testing sebesar
berdistribusi normal ,yaitu model AR(1) dan
2777,62. Nilai ini lebih besar dari nilai tahun
model (1,1) selanjutnya akan digunakan model
2012 pada model AR(1) dan ARMA(1,1). Hasil
AR(1) dan model ARMA (1,1) untuk peramalan.
yang diperoleh pada model ensemble pada
c. Peramalan tahun 2011 dan 2012 menjadi tidak lebih baik
Berdasarkan data pada tabel 3 model dari model ARMA(1,1) dan AR (1), karena
ARMA yang memungkinkan AR(1,1) maka uji interval data yang terlalu lebar pada dua
peramalan akan dilakukan dengan model ARMA yaitu AR(1), AR(1,1). Model
meramalkan data 2 tahun kedelapan, hasilnya terbaik terletak pada model AR(1).
sebagai berikut:

5724
5. KESIMPULAN Fakultas., Prosiding Konferensi Nasional

a. Pada rancang bangun data warehouse, Teknologi Informasi Dan Aplikasinya
penggunaan database engine MySQL (KNTIA ).
sudah memadai dalam melakukan aktifitas Prayoto. 2008. Peranan Perguruan Tinggi
query data. Dalam Pengembangan IPTEK. Seminar
b. Pada model interface data warehouse Nasional Dies Natalis 45 UGM
berbasis web memudahkan penggunaan Pusdatin Kementaan. 2012. Statistik Kosumsi
dalam melakukan olah data yang berkaitan Pangan Tahun 2012. Jakarta, Kementan.
dengan insert, update, import dan export. Radityo A,N., Johan T., Tony J, H. 2008. Aplikasi
c. Penggunaan R studio mudah dilakukan Data Warehouse Untuk Analisa Penjual
sangat tepat apabila digunakan sebagai Mobil Berbasis Multidimensional Modeling
alat praktikum dalam perkuliahan. (MDM) Dan Star Schema Design. Jurnal
d. Session pengguna aktif pada R studio Teknologi Informasi-AITI,Vol 5 No 2.
hanya satu kali, jikapengguna mencoba Shu,C., Burn,D.H. 2004. Artificial Neurl
login dari perangkat lain, maka koneksi Network Ensembles And Their Apliction
dari perangkat lain terputus. In Pooled Flood Frequency Anlysis. Water
e. Pada uji coba peramalan pola konsumsi Resource Research, Vol 40,9.
(makanan pokok) di Kabupaten Jember Suryana, A. Penganekaragaman Konsumsi
diperoleh model terbaik peramalan Pangan Dan Gizi: Faktor Pendukung
menggunakan model AR(1). Keterbatasan Peningkatan.
data bisa menjadi menyebabkan ensemble Wei, W.W.S. 2009. Time Series Analysis:
bukan yang terbaik. Seharusnya diharapkan Univariat And Multivariat Methods. Second
ensemble adalah model terbaik. Edition. USA: Person Education,Inc.
Zaeir, I., Shu, C., Ouarda,T.B.M.J, Seidou, O.,
DAFTAR PUSTAKA Chebana, F. 2010. Estimation of Ice
Bishop, C.M. 1995. Neural Network For Pattern Thickness on Lakes using Artificial
Recognition. New York: Oxford University Neural Network Ensembles. Journal Of
Press Inc. Hidrology,383 ,330-340.
Box, G.E.P, Jenkins, G.M. 1976. Time Series
Analysis Forecasting And Control Revised
Edition. Oakland: Holden-Day, Inc.
Breiman, L. 1996. Stacked Regression,
Machine Learning, Vol. 24, pp.59-64.
Data Susenas 1997-2012 ,<www.ada.edu>
Diunduh Pada 25-28 Maret 2012
FAO. 2012. The State Of Food Insecurity In
The Word 2012. Rome.
J. Supranto. 2000. Statistic Teori Dan Aplikasi.
Jakarta: Erlangga.
Kementan. 2012. Laporan Kinerja Kementrian
Pertanian Tahun 2011. Jakarta: Kementan.
Khashei, M., Bijari, M., Ardali,G.A.R. 2007.
Improvement Of Auto-Regressive
Integrated Moving Average Models Using
Fuzzy Logic And Artificial Neural Network.
Neurocomputing Vol.72:46.
Mukhlis F., Bayu Adhi T. 2011. Rancang
Bangunan Data Warehouse Untuk
Menunjang Evaluasi Akademik Di

25

244 358 1 PB

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

244 358 1 PB

Diunggah oleh

Hak Cipta:

Format Tersedia

Volume 01, Nomor 01, Februari 2016 ISSN: 2502-

Rancang Bangun Data Warehouse dan R Studio Serta

1. PENDAHULUAN sangat tinggi kemampuan IPTEK-nya,ternyata

maupun swasta didalam mengambil kebijakan untuk setiap tahunnya.

18 JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

untuk stasioner dalam varians transformasi

differencing, keputusan untuk memasukan

terdiri dari dua langkah. Pertama menciptakan ̂

anggota enseble dari beberapa modal ARIMA

selanjutnya menggabungkan hasil ramalan Dengan syarat ∑ =1 =1 dan 0 ≤ C ≤ 1.

pada penelitian ini adalah data belanja/

JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

20 JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

dan data berupa nilai angka dari survey yang

4.3 Pemodelan Data

Gambar 2. Perancangan Arsitektur Logikal Tabel 1. Daftar Tabel

JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

22 JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

estimasi parameter dan peramalan. Berikut ini

JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia 23

Pengujian Asumsi White Pengujian Asum- Tabel 4. Hasil Peramalan Model

1 <2e-16 Sig* 2012 35643,89 37885,84 2241,95

24 JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

5. KESIMPULAN Fakultas., Prosiding Konferensi Nasional

JUSTINDO, Jurnal Sistem dan Teknologi Informasi Indonesia

Anda mungkin juga menyukai