Anda di halaman 1dari 25

BAB II LANDASAN TEORI

II.1. Kajian Pustaka

II.1.1. Kebakaran Hutan


Dalam lingkup ilmu kehutanan ada perbedaan istilah antara pembakaran
hutan dengan kebakaran hutan. Pembakaran hutan identik dengan kejadian
yang disengaja pada satu lokasi tertentu dan secara terkendali. Biasanya
digunakan untuk membuka lahan, meremajakan hutan, atau membasmi hama.
Sedangkan kebakaran hutan lebih pada kejadian tidak disengaja atau dapat juga
dikatakan terjadi secara alamiah (Risnandar, 2018).

Menurut peraturan Menteri Lingkungan Hidup dan Kehutanan Republik


Indonesia nomor 32 tahun 2016 tentang Pengendalian Kebakaran Hutan Dan
Lahan, pada bab 1 pasal 1 ayat 38 definisi dari kebakaran hutan adalah suatu
peristiwa terbakarnya hutan dan atau lahan, baik secara alami maupun oleh
perbuatan manusia, sehingga mengakibatkan kerusakan lingkungan yang
menimbukan kerugian ekologi, ekonomi, sosial budaya dan politik
(Kementerian Lingkungan Hidup dan Kehutanan, 2016).

Kebakaran hutan di Indonesia tidak hanya terjadi pada lahan kering saja,
pada lahan basah seperti lahan/hutan gambut juga dapat terjadi kebakaran
terutama pada musim kemarau dimana lahan basah tersebut mengalami
kekeringan. kebakaran hutan dan lahan di Indonesia umumnya disebabkan oleh
perbuatan manusia yang dibuat secara sengaja atau karena kelalaian yang
mereka perbuat. Akan tetapi ada juga kebakaran hutan dan lahan yang
diakibatkan oleh faktor alam (Adinugroho, Suryadiputra, Saharjo, & Siboro,
2005).

5
II.1.2. Titik Panas / Hotspot
Dapat diartikan sebagai suatu daerah yang memiliki suhu permukaan
relatif lebih tinggi dibandingkan dengan daerah yang ada disekitarnya
berdasarkan ambang batas suhu tertentu terpantau oleh satelit pengindraan jauh
yang ada.

Gambar II. 1 Ilustrasi Kebakaran Hutan dan Lahan

(Sumber: Informasi Titik Panas (Hotspot) Kebakaran Hutan / Lahan)

Gambar II.1 merupakan ilustrasi bagaimana satelit pengindraan jauh


memantau kebakaran hutan atau lahan. Jika terdapat suhu permukaan yang
lebih tinggi pada suatu daerah maka akan terdeteksi dalam satu titik panas (kiri),
jika terdapat dua daerah yang memiliki suhu permukaan lebih tinggi dalam
radius 500 m dapat dikatakan sebagai satu titik panas (tengah), akan tetapi jika
kebakaran yang terjadi sangat besar dapat dideteksi sebagai 4 atau lebih titik
panas. Ilustrasi tersebut digambarkan untuk memahami bahwa jumlah titik
panas tidak sama dengan jumlah kejadian kebararan lahan dan hutan di
lapangan (Deputi Bidang Penginderaan Jauh, 2016).

II.1.3. Metode Forecasting


Forecasting adalah proses memperkirakan peristiwa di masa mendatang
dengan meneruskan data masa lalu. Data masa lalu digabungkan secara

6
sistematis dengan cara yang telah ditentukan untuk mendapatkan estimasi masa
depan (Gor, 2015). Metode forecasting dibagi menjadi dua, yakni forecasting
secara kualitatif dan forecasting secara kuantitatif (Pangestika, 2019).

II.1.3.1. Metode Forecasting Kuantitatif

Berikut merupakan beberapa metode forecasting yang sering


digunakan. Adapun yang berikut merupakan kelompok metode forecasting
kuantitatif (Pangestika, 2019).

1. Time Series
Metode time series atau deret waktu merupakan metode forecasting
yang menghubungkan keterkaitan antara variabel dependen (variabel
yang dicari) dengan variabel independen atau variabel yang
mempengaruhinya kemudian dihubungkan dengan waktu, mingguan,
bulan atau tahun. Jadi di dalam metode time series, variabel yang dicari
berupa waktu. Untuk menggunakan metode forecasting ini dapat
menghitungnya menggunakan metode smoothing, metode box jenkins,
atau metode proyeksi trend dengan regresi.
2. Metode Kasual (Sebab Akibat)

Metode forecasting kuantitatif yang kedua yaitu metode kasual


(casual methods) atau metode sebab akibat. Metode ini didasarkan pada
keterkaitan antara variabel yang diperkirakan dengan variabel lain yang
mempengaruhinya. Namun, variabelnya bukan dalam bentuk waktu.
Untuk menghitung atau meramalnya, untuk menghitung metode kasual
dapat menggunakan metode regresi dan korelase, metode input output,
atau metode ekonometri.

7
II.1.3.2. Metode Forecasting Kualitatif

Metode forecasting kualitatif ini sifatnya lebih subjektif dibandingkan


dengan kuantitatif. Hal ini karena metode forecasting kualitatif dipengaruhi
oleh emosi, pendidikan, intuisi, pengalaman si forecasting sehingga hasil
setiap orang akan berbeda. Meskipun begitu metode kualitatif mendekati
tingkat akurasi data aktual jika dibandingkan dengan metode lainnya.

II.1.4. Time Series


Time series adalah suatu himpunan pengamatan yang dibangun secara
berurutan dalam waktu. Waktu atau periode yang dibutuhkan untuk melakukan
suatu forecasting itu biasanya disebut sebagai lead time yang bervariasi pada
tiap persoalan. Berdasarkan himpunan pengamatan yang tersedia maka time
series dikatakan kontinu jika himpunan pengamatan tersebut adalah kontinu
dan dikatakan diskrit bila himpunan pengatamatan tersebut juga diskrit
(Kartiasih, 2014).

Pola data yang terdapat pada data time series adalah (Kartiasih, 2014):

1. Trend, yaitu komponen jangka panjang yang mendasari pertumbuhan


(atau penurunan) suatu data runtut waktu. Merupakan pergerakan
meningkat atau menurun.
2. Cyclical, yaitu suatu pola dalam data yang terjadi setiap beberapa tahun.
3. Seasonal, yaitu pola data yang berulang pada kurun waktu tertentu.
4. Irregular, yaitu pola acak yang disebabkan oleh peristiwa yang tidak
bisa diprediksi atau tidak beraturan.

II.1.5. Autoregressive Integreted Moving Average (ARIMA)


ARIMA sering juga disebut metode runtun waktu Box-Jenkins adalah
model yang secara penuh mengabaikan independen variabel dalam membuat
forecasting. ARIMA menggunakan nilai masa lalu dan sekarang dari variabel
dependen untuk menghasilkan forecasting. ARIMA sangat baik ketepatannya

8
untuk forecasting jangka pendek, sedangkan untuk forecasting jangka panjang
ketepatan forecastingnya kurang baik (Syahrir, 2017).
Penerapan model ARIMA terdiri dari tiga langkah dasar seperti pada Gambar
II.2, yaitu tahap identifikasi, tahap penaksiran dan pengujian, dan pemeriksaan
diagnostik. Selanjutnya model ARIMA dapat digunakan untuk melakukan
forecasting jika model yang diperoleh memadai (S. Makridakis, n.d.).

Gambar II. 2 Prosedur model Box-Jenkins

(sumber : ARIMA Models and The Box Jenkins Methodology(S. Makridakis, n.d.))

Penjelasan terbaru dari proses penerapan model ARIMA sering


menambahkan tahap pendahuluan yaitu persiapan data dan tahap terakhir
berupa pengaplikasian model (Hyndman, 2001).

9
1. Persiapan data melibatkan transformasi dan diferensiasi. Transformasi dari
data (seperti akar atau logaritma) dapat membantu menstabilkan varians.
Diferensiasi berarti mengambil perbedaan antara observasi berurutan, atau
antara observasi dengan selang satu tahun.
2. Seleksi model pada kerangka box jenkins menggunakan berbagai grafik
berdasarkan transformasi dan diferensiasi data untuk mencoba dan
mengidentifikasi proses ARIMA yang potensial sehingga akan
menghasilkan model yang cocok dengan data. Penemuan terbaru
menunjukan seleksi model menggunakan fungsi yang lain seperti Akaike
Information Criterion Corrected (AICc).
3. Estimasi parameter yaitu menemukan nilai dari koefisien model yang
memiliki kesesuaian paling baik dengan data.
4. Pengecekan model yaitu pengetesan asumsi dari model untuk
mengidentifikasi apakah model layak atau tidak. Jika model ditemukan
tidak memadai, perlu kembali ke langkah nomer 2 untuk mengidentifikasi
model yg lebih baik.
5. Forecasting adalah tujuan dari seluruh prosedur, setelah model dipilih,
diestimasi, dan ditinjau, langkah terakhir adalah melakukan forecasting
menggunakan model terbaik.
ARIMA terbagi kedalam 3 kelompok, yaitu model Autoregressive (AR),
Moving Average (MA) dan model campuran Autoregressive Moving Average
(ARMA) (Syahrir, 2017).
II.1.5.1. Model Autoregressive (AR)
Model yang menggunakan hubungan dependen antara observasi dan
sejumlah nilai observasi dari lag (selang waktu). Bentuk umum model
Autoregressive dengan ordo p (AR(p)) atau model ARIMA (p,0,0) (Kang,
2017). Bentuk umum dari Autoregressive (AR(p)) adalah sebagai berikut
(Syahrir, 2017).
𝑋𝑡 = ∅1𝑋𝑡−1+. . . +∅𝑝𝑋𝑡−𝑝 + 𝜀𝑡

10
Dimana,
𝑋𝑡 : nilai variable pada waktu ke-t
𝑋𝑡, 𝑋𝑡−1, 𝑋𝑡−2, . . . , 𝑋𝑡−𝑝 : nilai masa lalu dari time series yang
bersangkutan pada waktu t, t-1, t-2, … ,
t-p
∅𝑖 : koefisien regresi, I :1, 2, 3, …, p
𝜀𝑡 : nilai error pada waktu ke-t

II.1.5.2. Model Moving Average (MA)


Menggunakan ketergantungan antara pengamatan dan kesalahan
residual dari model rata-rata bergerak yang diterapkan untuk pengamatan
lag (selang waktu) (Kang, 2017). Bentuk umum model Moving Average
orde q (MA(q)) atau ARIMA (0, 0, q). Bentuk umum dari Moving Average
(MA(q)) adalah sebagai berikut (Syahrir, 2017).
𝑋𝑡 = 𝜀𝑡 + 𝜃1𝜀𝑡−1 + 𝜃2𝜀𝑡−2+. . . +𝜃𝑞𝜀𝑡−𝑞; 𝜀𝑡~𝑁(0𝜎2)𝑡
Dimana,
𝑋𝑡 : nilai variable pada waktu ke-t
𝜀𝑡, 𝜀𝑡−1, 𝜀𝑡−2, 𝜀𝑡−𝑞 : nilai-nilai dari error pada waktu t, t-1, t-2,…, t-
q
𝜃𝑖 : koefisien regresi, i:1,2,3,…,q
q : orde MA

II.1.5.3. Model Autoregressive Moving Average (ARMA)


Autoregressive Moving Average (ARMA) merupakan suatu kombinasi
dari model Autoregresssive (AR) dan Moving Average (MA). Bentuk
umum dari model ARMA (p,q), adalah sebagai berikut (Syahrir, 2017).
𝑋𝑡 = ∅1𝑋𝑡−1 + ∅2𝑋𝑡−2+. . . +∅𝑝𝑋𝑡−𝑝 + 𝜀𝑡 + 𝜃1𝜀𝑡−1
+ 𝜃2𝜀𝑡−2+. . . +𝜃𝑞𝜀𝑡−𝑞

11
Dimana,
𝑋𝑡: nilai variable pada waktu ke-t
∅𝑖 : koefisien regresi, i:1,2,3,…,p
p :orde AR
q :orde MA
𝜃𝑖 :parameter model MA ke-i, i=1,2,3,…,q
𝜀𝑡 :nilai error pada waktu ke-t
𝜀𝑡, 𝜀𝑡−1, 𝜀𝑡−2, . . . , 𝜀𝑡−𝑞 :error pada waktu t-1,t-2,…, t-q dan 𝜀𝑡
diasumsikan white noise dan normal.
II.1.5.4. Model ARIMA
Secara umum model ARIMA (p,d,q) untuk suatu data time series 𝑋𝑡
adalah sebagai berikut (Syahrir, 2017).
∅ 𝐵(1 − 𝐵)𝑑𝑋𝑡 = 𝜃(𝐵)𝜀𝑡; 𝜀𝑡~𝑁(0, 𝜎2)𝑡
Persamaan diatas dapat ditulis menggunakan operator B (backshift),
menjadi :
(1 − 𝐵)𝑑(1 − ∅1𝐵 − ∅2𝐵2−. . . ∅𝑃𝐵𝑃)𝑋𝑡 = (1 + ∅1𝐵 + ∅2𝐵2+. . . ∅𝑞𝐵𝑞)𝜀𝑡
Sehingga diperoleh,
(1 − 𝐵)𝑑(𝑋𝑡 − ∅1𝑋𝑡−1 + ∅2𝑋𝑡−2+. . . +∅𝑝𝑋𝑡−𝑝)
= (𝜀𝑡 + 𝜃1𝜀𝑡−1 + 𝜃2𝜀𝑡−2+. . . +𝜃𝑞𝜀𝑡−𝑞)
Dimana,
𝑋𝑡 : nilai variable pada waktu ke-t
B :operator backshift
(1 − 𝐵)𝑑𝑋𝑡 : time series yang stasioner pada pembedaan ke-
d
𝜀𝑡 : nilai error pada waktu ke-t
p :orde AR
d :orde pembedaan
q :orde MA
𝜀𝑡, 𝜀𝑡−1, 𝜀𝑡−2, . . . , 𝜀𝑡−𝑞 : error pada waktu t-1, t-2,…, t-q dan 𝜀𝑡

12
II.1.5.5. Pengujian Data
Untuk mengetahui apakah data stasioner atau tidak dilakukan uji
stasioneritas. Augmented Dickey–Fuller (ADF) digunakan untuk melihat
apakah data stationer terhadap rata-rata dan uji Bartlette untuk melihat
apakah data stasioner terhadap ragam (Box, Jenkins, Reinsel, & Ljung,
2016).
1. Augmented Dickey–Fuller (ADF)
𝑦𝑡 = 𝑎0 + 𝑎1𝑦𝑡 − 1 + 𝑎2𝑦𝑡 − 2+. . . +𝑎𝑝𝑦𝑡 − 𝑝 + 𝜀𝑡
𝑦𝑡 : waktu ke-t
𝑦𝑡−𝑖: pengamatan pada waktu ke-(t-i),
𝑎𝑝: koefisien regresi
𝜀𝑡 : sisaan dengan asumsi 𝜀𝑡~ N (0, σ2 )
Jika γ = ∑𝑝 𝑖=1
𝑎𝑖 − 1 dan γ berjumlah 0, persamaan tersebut
mempunyai akar unit atau data tidak stasioner.
2. Bartlette
Uji Bartlett digunakan untuk menguji apakah k sampel berasal
dari populasi dengan varians yang sama.
𝑓 𝑙𝑛𝑠2 − ∑𝑘𝑖=1
( 𝑖𝑙𝑛𝑠𝑖2)
𝑄ℎ𝑖𝑡 = 𝑓
1 𝑘 1 1

1 + 3(𝑘 − 1) ⦋ 𝑖=1( 𝑓) − ⦌
𝑖 𝑓
Dengan,
𝑓𝑖 = (𝑛𝑖 − 1)
𝑘
𝑓=∑ 𝑓𝑖
𝑖=1
𝑘 2
∑𝑖=1 𝑠
𝑖 𝑖 ∑ 𝑖 𝑠𝑖 2
𝑠2 = 𝑓 = 𝑓
∑ 𝑓𝑖 𝑓
𝑠𝑖2:ragam kelompok ke-i
𝑠2 : ragam gabungan dari seluruh kelompok
Jika p-value < α maka data dikatakan stasioner.

13
II.1.5.6. Auto ARIMA
Fungsi auto ARIMA dalam R menggunakan variasi algoritma
Hyndman-Khandakar, yang menggabungkan tes unit root, minimalisasi
Akaike Information Criterion corrected (AICc) dan maximum likelihood
estimation (MLE) untuk mendapatkan model ARIMA. Argumen pada auto
ARIMA menyediakan variasi pada algoritma yang dideskripsikan sebagai
aturan standar (Hyndman & Athanasopoulos, 2018).
Algoritma Hyndman-Khandakar untuk pemodelan auto ARIMA
1. Jumlah diferensiasi 0 ≤ d ≤ 2 ditentukan menggunakan tes
Kwiatkowski–Phillips–Schmidt–Shin (KPSS) berulang.
2. Nilai-nilai p dan q kemudian dipilih dengan meminimalkan AICc
setelah membedakan data sebanyak d kali. Alih-alih
mempertimbangkan setiap kemungkinan kombinasi p dan q,
algoritma menggunakan pencarian bertahap untuk melintasi ruang
model.
a) Empat model awal yang dipersiapkan:
ARIMA (0, d, 0),
ARIMA (2, d, 2),
ARIMA (1, d, 0),
ARIMA (0, d, 1.
Konstanta dimasukkan kecuali d = 2. Jika d ≤ 1, model
tambahan juga dipersiapkan:
ARIMA (0, d, 0) tanpa konstanta.
b) Model terbaik (dengan nilai AICc terkecil) yang dipersiapkan
pada langkah (a) ditetapkan sebagai "model saat ini".
c) Variasi pada model saat ini dipertimbangkan:
 bervariasi p dan / atau q dari model saat ini oleh ± 1;
 sertakan / kecualikan c dari model saat ini.

14
Model terbaik yang dipertimbangkan sejauh ini (baik model saat ini
atau salah satu dari variasi ini) menjadi model saat ini yang baru.
d) Ulangi Langkah 2 (c) sampai tidak ada lagi nilai AICc yang
lebih rendah yang dapat ditemukan.

II.1.5.7. Seleksi Model


II.1.5.7.1. Information Criterion
Akaike’s Information Criterion (AIC) yang berguna dalam memilih
prediktor untuk regresi, juga berguna untuk menentukan urutan model
ARIMA. Dapat ditulis sebagai.
𝐴𝐼𝐶 = −2𝑙𝑜𝑔(𝐿) + 2(𝑝 + 𝑞 + 𝑘 + 1)
Dimana L = kemungkinan data, k=1 jika c≠0 dan k=0 jika c=0.
Perhatikan bahwa istilah terakhir dalam tanda kurung adalah jumlah
parameter dalam model (termasuk 𝜎2, varian residual).
Untuk model ARIMA, corrected AIC dapat ditulis sebagai.
2(𝑝 + 𝑞 + 𝑘 + 1)(𝑝 + 𝑞 + 𝑘 + 2)
𝐴𝐼𝐶𝑐 = 𝐴𝐼𝐶 +
𝑇−𝑝−𝑞−𝑘−2
Dan Bayesian Information Criterion dapat ditulis sebagai.
𝐵𝐼𝐶 = 𝐴𝐼𝐶 + [𝑙𝑜𝑔 (𝑇) − 2](𝑝 + 𝑞 + 𝑘 + 1)
Model yang baik diperoleh dengan meminimalkan AIC, AICc atau
BIC. Preferensi kali ini adalah menggunakan AICc.
Penting untuk dicatat bahwa information criterion ini cenderung
bukan panduan yang baik untuk memilih urutan diferensiasi (d) yang
tepat dari suatu model, tetapi hanya untuk memilih nilai p dan q. Ini
karena diferensiasi merupakan perubahan data di mana kemungkinan
dihitung, membuat nilai AIC antara model dengan urutan diferensiasi
yang berbeda tidak dapat dibandingkan. Jadi kita perlu menggunakan
beberapa pendekatan lain untuk memilih d, dan kemudian kita dapat
menggunakan AICc untuk memilih p dan q (Hyndman &
Athanasopoulos, 2018).

15
II.1.5.8. Pengujian Model
1. Uji signifikansi
Menggunakan uji z dengan tingkat signifikansi atau α sebesar 0.05.
𝑝 − 𝑝0
𝑧=
√𝑝0(1 − 𝑝0)
𝑛
2. Uji autokorelasi
Pada tahap ini model harus dicek kelayakannya dengan melihat sifat
sisaan dari sisi kenormalan dan kebebasannya. Secara umum
pengecekan kebebasan sisaan model dapat dilakukan dengan
menggunakan uji Q modifikasi Box-Pierce (Ljung-Box) (Commerce
Department’s, 2012).
𝑚
𝑄 = 𝑛 (𝑛 + 2) ∑ 𝑟̂ 𝑘
2

𝑛−𝑘
𝑘=1

𝑟̂𝑘 : estimasi autokorelasi seri pada lag k


m : jumlah lag yang diuji
3. Uji normalitas
Untuk melihat normalitas pada model digunakan Q-Q plot dan
Shapiro-Wilk. Plot kuantil-kuantil (Q-Q) adalah grafik untuk
menentukan apakah model berasal dari populasi dengan distribusi
normal atau tidak. Shapiro-Wilk adalah tes untuk distribusi normal
dengan hasil yang baik bahkan dengan sejumlah kecil pengamatan.
Berbeda dengan tes perbandingan lainnya, tes Shapiro-Wilk hanya
berlaku untuk memeriksa normalitas (Commerce Department’s, 2012).
(∑𝑛 𝑎𝑡𝑦𝑡)2
𝑡=2
𝑊 = ∑𝑛 (𝑥𝑡 − 𝑦)2
𝑡=1

n : jumlah pengamatan
𝑦𝑡 : nilai sampel yang dipesan
𝑎𝑡 : koefisien ditabulasikan

16
II.1.5.7. Evaluasi Model
Digunakan untuk mengukur ketepatan ramalan dengan merata-rata
kesalahan dugaan (nilai absolute masing-masing kesalahan). Berikut adalah
rumus untuk menghitung MAE (Ardhitama, 2012).
𝑀𝐴𝐸 = 1 ∑ 𝑛 |𝑍𝑡 − 𝑍𝑡
𝑡=1
𝑛

II.1.6. Pentaho Data Integration (PDI)


Pentaho Data Integration (PDI) atau disebut Kettle merupakan software
open source yang bertanggung jawab untuk proses extract, transform, dan load
(ETL). Selain itu PDI juga dapat digunakan sebagai berikut (Roldán, 2005).
a. Migrasi data antar aplikasi atau database
b. Mengekspor data dari database ke flat file
c. Memuat data secara besar-besaran ke dalam database
d. Pembersihan data
e. Mengintegrasikan aplikasi
PDI mudah digunakan, dimana setiap proses dibuat dengan alat grafis
sehingga memugkinkan pengguna menentukan apa yang harus dilakukan tanpa
menulis kode untuk menunjukkan bagaimana melakukannya. Oleh karena itu
dapat dikatakan bahwa PDI berorientasi pada metadata.
PDI dapat digunakan sebagai aplikasi yang standalone, atau dapat
digunakan sebagai bagian dari Pentaho Suite yang lebih besar. Sebagai alat
ETL, PDI menjadi tools open source paling populer yang tersedia. PDI
mendukung beragam format input dan output, termasuk text files, data sheets,
dan database (Roldán, 2005).
Elemen utama dari PDI adalah tansformation dan job. Transformation
adalah sekumpulan instruksi untuk merubah input menjadi output yang
diinginkan (input-proses-output). Sedangkan job adalah kumpulan instruksi
untuk menjalankan transformasi. Ada tiga komponen dalam PDI: Spoon, Pan
dan Kitchen. Spoon adalah user interface untuk membuat job dan

17
transformation. Pan adalah tools yang berfungsi membaca, melakukan
perubah dan menulis data. Sedangkan Kitchen adalah program yang
mengeksekusi job (Wibisono, 2017).
Pada penelitian ini, terdapat beberapa komponen pada PDI yang
digunakan, penjelasan komponen yang digunakan dapat dilihat pada Tabel II.1.

Tabel II. 1 Daftar Komponen PDI

Nama Gambar Deskripsi Kategori


Komponen ini
digunakan untuk
membaca ataupun Input
csv input
memuat data
berupa inputan file
CSV
Komponen ini
tidak melakukan
aksi apapun.
dummy Flow
Kegunaannya
adalah menjadi
tempat pengujian.
Komponen ini
digunakan untuk
memfilter baris
berdasarkan
filter rows Flow
kondisi dan
perbandingan yang
ditentukan
pengguna.

18
Nama Gambar Deskripsi Kategori
Komponen ini
digunakan untuk
mengelompokkan
dan memberikan
nilai diatas
kelompok kolom
group by Statistics
yang ditentukan.
Sebelum
melakukan group
by, data harus
diurutkan terlebih
dahulu.
Komponen ini
digunakan untuk
microsoft excel
menulis data ke Output
output
satu atau lebih file
Excel.
Komponen ini
regex digunakan untuk
evaluationfilter mengolah baris Scripting
rows code menjadi
sebuah data.
Komponen ini
digunakan untuk
replace in
mengganti semua Transform
string
kata menjadi
string. Dapat

19
Nama Gambar Deskripsi Kategori
menggunakan
regex.
Komponen ini
digunakan untuk
memilih atau
menghilangkan
select values field. Pengguna Transform
dapat
menyesuaikan
field apa yang
akan ditampilkan.
Komponen ini
digunakan untuk
mengurutkan baris
berdasarkan kolom
sort rows Transform
yang pengguna
tentukan. Dapat
berupa ascending
atau descending
Komponen ini
digunakan untuk
menggabungkan
beberapa field
sorted merge Transform
dengan jumlah
kolom yang sama
dan nama kolom
yang sama.

20
II.1.7. Bahasa Pemrograman R
R adalah bahasa pemrograman yang telah didesain ulang sebagai
pengembangan bahasa pemrograman "S" di Bell Laboratories untuk
memudahkan analisis statistika. Walaupun awalnya dikembangkan untuk
analisis statistik, namun saat ini telah berkembang pengaplikasinya sehingga
dapat melakukan manipulasi data spasial serta menampilkannya secara dinamis
dalam situs web. Ditambah lagi dengan era data analysis atau akrab disebut big
data, maka perkembangan R menjadi tidak terbendung lagi. Perintah dasar
dalam bahasa R telah menyediakan berbagai tool untuk pemodelan statistik
linear dan nonlinear, analisis time-series, klasifikasi, analisis klaster, dan
analisis grafis. Kemampuan ini terus berkembang dengan adanya ribuan paket
tambahan yang diunggah ke server Comprehensive R Archive Network (CRAN)
tiap tahunnya (Gio & Irawan, 2016).

II.1.6.1. Kelebihan Utama Program R (Gamma Sigma Beta, 2014).


1. Free
User dapat meng-copy dan menginstall program ini secara
bebas tanpa perlu membayar lisensinya.
2. Multiplatform
R bersifat multiplatform operating systems, lebih umum
dibanding program statistika yang pernah ada dengan demikian jika
user ingin berpindah sistem operasi maka penyesuaian akan lebih
mudah dilakukan (contoh Windows ke Linux atau Linux ke
Windows).
3. Programmable
User dapat memprogramkan metode baru atau mengembangkan
modifikasi dari fungsi-fungsi analisa statistika yang sudah ada
dalam R.
4. Bahasa berbasis analisa matriks. Bahasa R sangat baik untuk
melakukan programming berbasis matriks. Sehingga sangat cocok
dan powerful untuk pemrograman di bidang multivariat.

21
5. Mempunyai kemampuan menampilkan grafis yang sangat baik dan
lengkap sehingga sangat memudahkan bagi kita untuk menampilkan
bentuk-bentuk grafik sesuai yang diinginkan dan mudah dibaca.
II.1.6.2. Kelemahan Utama Program R (Gamma Sigma Beta, 2014):
1. R dibangun dalam versi Command Line Interface (CLI) yang
banyak menggunakan syntax-syntax dalam pemrograman sehingga
kurang user friendly bagi para pengguna yang biasa menggunakan
software dengan point click dan graphical user interface (GUI).
2. Walaupun analisa statistika dalam R sudah cukup lengkap, belum
semua metode statistika telah diimplementasikan di dalam R.

II.1.7. RStudio

RStudio merupakan integrated development environment (IDE) khusus


bagi bahasa pemrograman R. Software ini menyediakan R console, code editor
dengan syntax highlighting, code completion dan direct
execution, environment, history, connections, dan fitur-fitur tambahan lainnya
seperti file manager, packages manager, help, plot viewer, hingga project
versioning menggunakan git. RStudio sebenarnya memiliki dua versi,
yaitu open source (gratis) dan commercial edition (berbayar). RStudio juga
tidak hanya terbatas dalam bentuk aplikasi dekstop, melainkan terdapat versi
RStudio server, yaitu RStudio yang dapat diakses melalui browser yang
terhubung dengan suatu jaringan komputer.

II.2. State of The Art


Dalam melakukan penelitian, peneliti membandingkan beberapa penelitian
yang dilakukan peneliti lain pada Tabel II.2 sebagaimana berikut.

22
Tabel II. 2 State Of The Art

Judul Sumber Tahun Peneliti Hasil


Hasil forecasting
dengan
menggunakan
metode Jaringan
Saraf Tiruan
backpropagation
model BPNN
Perbandingan (4,10,5,1) lebih
Metode Arima baik dan lebih
(Box-Jenkins) akurat
Dengan Jaringan dibandingkan
Saraf Tiruan metode ARIMA
(JST) Repository Oksendi Vitra (Box-Jenkins)
2013
Backpropagation UPI Sihombing model ARIMA
Sebagai Metode (3,1,0) karena
Forecasting nilai
Rata-Rata MAPE hasil
Temperatur forecastingnya
Bumi lebih kecil. Di
mana, MAPE
hasil forecasting
rata-rata
temperatur bumi
untuk tahun
2008 sampai
2012 dengan

23
Judul Sumber Tahun Peneliti Hasil
menggunakan
metode
ARIMA (Box-
Jenkins) model
ARIMA (3,1,0)
dan metode
Jaringan Saraf
Tiruan
(JST)
Backpropagation
model BPNN
(4,10,5,1)
masing-masing
adalah
0,00498963 %
dan 0,003988183
%.
Teknik analisis
Hevelyne
data multivarian
Henn da
diterapkan oleh
Gama Viganó,
model MLR dan
Prediction and Revista Celso Correia
ARIMA, di
Modeling of Brasileira de de Souza, José
2018 mana 41% dari
Forest Fires in Meteorologia, Francisco Reis
varian jumlah
the Pantanal v. 33 Neto,
fokus, sehingga
Marcia
menunjukkan
Ferreira
teknik yang tidak
Cristaldo,
efisien untuk

24
Judul Sumber Tahun Peneliti Hasil
Leandro de prediksi.
Jesus. Pemodelan deret
waktu
menggunakan
teknik ARIMA
(4, 0, 10)
menyajikan hasil
yang lebih
memuaskan,
sehingga
memungkinkan
untuk
menjelaskan
varians dari
jumlah fokus di
66,5%, yang
terbukti menjadi
model yang
paling memadai
untuk
forecasting.
Untuk
meningkatkan
kinerja teknik
ini, variabel
antropik harus
dimasukkan,
yang merupakan

25
Judul Sumber Tahun Peneliti Hasil
faktor penentu
terjadinya
kebakaran, tetapi
perlu untuk
membangun
basis data
sedemikian rupa
sehingga kinerja
model prakiraan
baru dapat
ditingkatkan.
Didapatkan
model terbaik
ARIMA (2, 0, 0)
dimana model
Prediksi
tersebut telah
Temporal Untuk
memenuhi tahap
Kemunculan
pendugaan
Titik Panas Di
parameter, uji
Provinsi Riau Repository Isnan Syaiful
2014 kebabasan dan
Menggunakan IPB Robby
kenormalan
Autoregressive
sisaan, AIC
Integrated
(Akaike’s
Moving Average
Information
(ARIMA)
Criterion) dan
mempunyai nilai
MAPE (Mean
Absolute

26
Judul Sumber Tahun Peneliti Hasil
Percentage
Error) yang
paling kecil dari
model-model
yang diperoleh.
nilai MAPE
yang diperoleh
sebesar 40.974,
nilai tersebut
masih cukup
besar, hal ini
disebabkan oleh
data aktual yang
sangat tinggi
pada bulan Juni,
Juli dan Agustus.
sehingga
menghasilkan
selisih error
yang tinggi.
Evluasi akurasi
Pemodelan Box-
menggunakan
Jenkins Prosiding
Mean Absolute
(ARIMA) Untuk Seminar Vincentius
Error (MAE) dan
Peramalan Nasional 2015 Iwan
Root Mean
Indeks Harga Manajemen Primaditya,
Squared Error
Saham Teknologi Nur Iriawan
(RMSE)
Gabungan XXII
menunjukkan

27
Judul Sumber Tahun Peneliti Hasil
bahwa model
ARIMA (4,1,1)
mempunyai
akurasi yang
lebih baik dari
Random Walk
dengan drift.
Berdasarkan
hasil perhitungan
nilai MSE,
metode ARIMA
Perbandingan secara signifikan
Keakuratan selalu lebih
Metode rendah dari pada
Autoregresive nilai MSE
Integrated metode
Jurnal Riza
Moving Average Exponential
Rekursif Rahmadayanti,
(ARIMA) dan 2015 Smoothing
Universitas Boko Susilo,
Exponential Diyah sehingga dapat
Bengkulu
Smoothing Pada Puspitaningrum disimpulkan
Peramalan bahwa metode
Penjualan Semen ARIMA
di PT. Sinar merupakan
Abadi metode yang
lebih baik untuk
digunakan dalam
meramalkan
penjualan semen

28
Judul Sumber Tahun Peneliti Hasil
untuk periode
mendatang.

Tabel II.2 menjelaskan perbandingan penelitian yang sudah ada sebelumnya


sebagai bahan kajian pada penelitian ini. Pada jurnal “Perbandingan Metode
Arima (Box-Jenkins) Dengan Jaringan Saraf Tiruan (JST) Backpropagation
Sebagai Metode Forecasting Rata-Rata Temperatur Bumi” metode JST lebih
menghasilkan model yang baik jika dibandingkan dengan ARIMA, dengan nilai
MAPE pada ARIMA sebesar 0,00498963 % dan jaringan syaraf tiruan) sebesar
0,003988183% (Sihombing, 2013). Sedangkan pada jurnal “Prediction and
Modeling of Forest Fires in the Pantanal” ARIMA menyajikan hasil yang lebih
memuaskan dibandingkan dengan Multivarian, sehingga memungkinkan untuk
menjadi model yang paling memadai untuk forecasting (Henn et al., 2018). Pada
jurnal “Prediksi Temporal Untuk Kemunculan Titik Panas Di Provinsi Riau
Menggunakan Autoregressive Integrated Moving Average (ARIMA)” didapatkan
model terbaik yaitu ARIMA (2, 0, 0) dengan nilai MAPE sebesar 40.974. Pada
jurnal “Pemodelan Box-Jenkins (ARIMA) Untuk Peramalan Indeks Harga Saham
Gabungan” didapatkan hasil bahwa bahwa model mempunyai akurasi yang lebih
baik dari Random Walk dengan drift (Iwan & Iriawan, 2015). Pada jurnal
“Perbandingan Keakuratan Metode Autoregresive Integrated Moving Average
(ARIMA) dan Exponential Smoothing Pada Peramalan Penjualan Semen di PT.
Sinar Abadi” didapatkan hasil bahwa metode ARIMA merupakan metode yang
lebih baik untuk digunakan karena memliki nilai MSE yang lebih rendah
dibandingkan dengan metode Exponential Smoothing.
Berdasarkan Tabel II.2 dapat disimpulkan bahwa ARIMA memiliki ketepatan
metode yang lebih baik jika dibandingkan dengan metode yang lainnya seperti
Multivarian, Random-walk with drift dan Exponential Smoothing. Oleh karena itu
pada penelitian kali ini digunakan ARIMA untuk membuat model forecasting.

29

Anda mungkin juga menyukai