Renda Audi Permaisuri-Fst

1
SKRIPSI
VISUALISASI DASHBOARD TABLEAU DAN PERAMALAN

JUMLAH KASUS DEMAM BERDARAH DENGUE DI DKI
JAKARTA MENGGUNAKAN METODE ARIMA
Disusun oleh:
RENDA AUDI PERMAISURI
11180930000128
PROGRAM STUDI SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2022 M / 1443 H
HALAMAN JUDUL
VISUALISASI DASHBOARD TABLEAU DAN PERAMALAN

JUMLAH KASUS DEMAM BERDARAH DENGUE DI DKI
JAKARTA MENGGUNAKAN METODE ARIMA
SKRIPSI
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer Program
Studi Sistem Informasi Fakultas Sains dan Teknologi Universitas Islam Negeri
Syarif Hidayatullah Jakarta
Disusun oleh:
RENDA AUDI PERMAISURI
11180930000128
PROGRAM STUDI SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2022 M / 1443 H
ii
ABSTRAK
RENDA AUDI PERMAI SURI – 11180930000128, Visualisasi Dashboard

Tableau dan Peramalan Jumlah Kasus Demam Berdarah Dengue di DKI Jakarta
Menggunakan Metode ARIMA. Di bawah bimbingan Ir. Eri Rustamaji, MBA
dan Eva Khudzaeva M.Si.
Metode ARIMA adalah salah satu metode peramalan time series. ARIMA memiliki
hubungan statistik yang baik antara variabel yang akan diprediksi dan nilai yang
digunakan untuk prediksi. Metode Autoregressive Integrated Moving Average
(ARIMA) memiliki ketepatan yang sangat akurat karena dalam metode tersebut
menggunakan peramalan jangka pendek. Metode ARIMA memiliki kelebihan yaitu
dapat digunakan pada data yang tidak stasioner dapat digunakan pada semua pola
data termasuk pola data musiman sehingga metode ini dapat digunakan untuk
meramalkan kasus DBD di Provinsi DKI Jakarta. Penelitian ini dilakukan untuk
menentukan model terbaik dengan model peramalan ARIMA musiman dan juga
menganalisis hasil peramalan kasus DBD di Provinsi DKI Jakarta. Hasil analisis
menunjukkan model terbaik untuk kasus DBD di Provinsi DKI Jakarta adalah
ARIMA(0,2,1)(2,1,1)4 dengan nilai MSE terkecil yaitu 970756. Hasil peramalan
Kasus DBD DKI Jakarta bulan Januari 2021 sampai Desember 2021 berturut-turut
di bulan Januari sebanyak 90 kasus, Februari sebanyak 186 kasus, Maret sebanyak
529 kasus, April sebanyak 394 kasus, Mei sebanyak 311 kasus, Juni sebanyak 229
kasus, Juli sebanyak 308 kasus, Agustus sebanyak 268 kasus, September sebanyak
268 kasus, Oktober sebanyak 286 kasus, November sebanyak 432 kasus, dan
Desember sebanyak 416 kasus.
Kata Kunci: ARIMA, Peramalan, PACF, ACF, DKI Jakarta.
5 Bab + 62 Halaman + xiv Halaman + 25 Gambar + 7 Tabel + Lampiran
vi
KATA PENGANTAR
Puji dan syukur atas kehadirat Allah SWT yang telah memberikan rahmat
serta hidayah-Nya sehingga penulis dapat menyelesaikan penulisan skripsi dengan
judul “Visualisasi Dashboard Tableau dan Peramalan Jumlah Kasus Demam
Berdarah Dengue di DKI Jakarta Menggunakan Metode ARIMA”. Penelitian ini
disusun sebagai salah satusSyarat untuk memperoleh gelar Sarjana Sistem
Informasi Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif
Hidayatullah Jakarta.
Dalam penulisan skripsi ini, penulis menyadari bahwa masih terdapat
banyak kekurangan. Namun demikian penulis berharap penulisan skripsi ini dapat
memenuhi prasyarat dalam memperoleh gelar sarjana (S-1) dalam jurusan Sistem
Informasi di Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta.
Pada kesempatan ini penulis juga hendak mengucapkan terima kasih kepada
pihak-pihak yang telah membantu memberikan dukungan baik berupa materi
maupun imateri, sehingga penulis dapat menyelesaikan Laporan Skripsi ini. Ucapan
terima kasih secara khusus penulis berikan kepada:
1. Bapak Nashrul Hakiem, S.Si., M.T., PhD selaku Dekan Fakultas Sains dan
Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta.
2. Bapak A’ang Subiyakto, PhD selaku Ketua Program Studi Sistem Informasi
dan Bapak Nuryasin, M.Kom selaku Sekretaris Program studi Sistem
Informasi.
vii
3. Bapak Ir. Eri Rustamaji, MBA dan Ibu Eva Khudzaeva M.Si selaku dosen
pembimbing I dan II yang telah memberikan ilmu dan pengetahuannya
dalam membimbing penulis sehingga laporan ini dapat terselesaikan.
4. Dosen-dosen Program Studi Sistem Informasi yang telah memberikan ilmu
selama perkuliahan.
5. Orang tua dan Kakak-kakak saya yang selalu memberikan doa, semangat,
dan dukungan yang terus mengalir kepada peneliti.
6. Senior-senior dan teman-teman saya yang telah bersedia memberikan info
dan ilmu tambahan dalam menyusun laporan ini.
7. Sahabat saya yaitu: Nusif, Ana, Karin yang selalu mendengarkan keluh
kesah saya disaat saya patah hati dan memberikan dukungan sehigga
penyusunan skripsi dapat selesai.
8. Seluruh teman “Kelas E Otak Auto A” Sistem Informasi Angkatan 2018
yang telah memberikan senyuman, tawa, semangat, mengisi hari-hari saya
menjadi berwarna saat menjalani perkuliahaan.
9. Semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu
hingga laporan ini terselesaikan.
Penulis menyadari bahwa dalam penyusunan Skripsi ini masih jauh dari
kata sempurna, serta masih banyak kekurangan baik dalam penulisan materi
viii
maupun dalam susunan bahasanya. Untuk itu kiranya, pembaca dapat memaklumi
atas kekurangan dalam laporan ini. Akhir kata penulis berharap semoga laporan ini
dapat bermanfaat bagi penulis khususnya dan bagi para pembaca pada umumnya.
Bogor, September 2022
Renda Audi Permaisuri
ix
DAFTAR ISI
PENGESAHAN UJIAN ................................................................................................. iii

LEMBAR PENGESAHAN ........................................................................................... iv
LEMBAR PERNYATAAN ............................................................................................ v
ABSTRAK ...................................................................................................................... vi
KATA PENGANTAR ................................................................................................... vii
DAFTAR ISI .................................................................................................................... x
DAFTAR GAMBAR .................................................................................................... xiii
DAFTAR TABEL ......................................................................................................... xv
BAB 1 PENDAHULUAN ............................................................................................... 1
1.1 Latar Belakang ........................................................................................................ 1
1.2 Identifikasi Masalah ................................................................................................ 7
1.3 Rumusan Masalah ................................................................................................... 8
1.3 Batasan Masalah...................................................................................................... 8
1.4 Tujuan Penelitian .................................................................................................... 9
1.5 Manfaat Penelitian .................................................................................................. 9
1.6 Metode Penelitian.................................................................................................. 10
1.7 Sistematika Penulisan............................................................................................ 11
BAB 2 LANDASAN TEORI ........................................................................................ 13
2.1 Visualisasi Dashboard ........................................................................................... 13
2.2 Software Tableau................................................................................................... 14
2.3 Peramalan .............................................................................................................. 18
2.4 Demam Berdarah Dengue (DBD) ......................................................................... 21
2.5 Autoregressive Integrated Moving Average (ARIMA) ......................................... 22
2.5.1 Autoregressive Model (AR)........................................................................... 22
2.5.2 Moving Average Model (MA)........................................................................ 24
2.5.3 Autoregressif Moving Average Model (ARMA) ........................................... 25
2.6 Time Series ........................................................................................................... 25
2.6.1 Kestasioneran Data dalam Time Series ......................................................... 28
2.6.2 Autocorrelation Function (ACF) ................................................................... 29
2.6.3 Partial Autocorrelation Function (PACF) ..................................................... 30
x
2.7 Persentase Kesalahan ............................................................................................ 31
2.7.1 Rata-rata Kesalahan (average/mean error) ................................................ 31
2.7.2 Mean Absolute Deviation (MAD) ............................................................... 32
2.7.3 Mean Squared Error (MSE) ...................................................................... 32
2.7.4 Standard Deviation of Errors (SDE) ......................................................... 32
2.7.5 Percentage Error (PE) ................................................................................ 32
2.7.6 Mean Percentage Error dan Mean Absolute Percentage Error ............. 33
BAB 3 METODOLOGI PENELITIAN ...................................................................... 34
3.1. Tahapan Penelitian ................................................................................................ 34
3.2. Deskripsi Tahapan Peneltian ................................................................................. 35
3.2.1 Identifikasi dan Perumusan Masalah............................................................. 35
3.2.2 Studi Literatur ............................................................................................... 35
3.2.3 Pengumpulan Data ........................................................................................ 36
3.2.4 Pembuatan Excel ........................................................................................... 36
3.2.5 Pemodelan ARIMA ....................................................................................... 37
3.2.1 Peramalan Kasus DBD DKI Jakarta ............................................................. 38
3.2.6 Pembuatan Visualisasi Dashboard ................................................................ 38
3.3 Waktu Penelitian ................................................................................................... 39
BAB 4 HASIL DAN PEMBAHASAN ......................................................................... 40
4.1 Persiapan Data....................................................................................................... 40
4.2 Tahap Identifikasi.................................................................................................. 41
4.2.1 Plot Data ........................................................................................................ 41
4.2.2 Transformasi Data ......................................................................................... 42
4.2.3 Plot ACF dan PACF ...................................................................................... 44
4.2.4 Identifikasi Model ARIMA ........................................................................... 49
4.3 Estimasi Parameter dan Uji Signifikansi............................................................... 52
4.4 Verifikasi Model ................................................................................................... 53
4.4 Peramalan Kasus DBD DKI Jakarta ..................................................................... 54
4.5 Visualisasi Dashboard ........................................................................................... 55
4.5.1 Filter Daerah Jakarta ................................................................................. 56
4.5.2 Filter Bulan dan Tahun .............................................................................. 57
4.5.3 Data Aktual Kasus DBD ............................................................................. 58
4.5.4 Visualisasi Data Prediksi ............................................................................ 60
xi
BAB 5 KESIMPULAN DAN SARAN ......................................................................... 61
5.1 Kesimpulan ........................................................................................................... 61
5.2 Saran...................................................................................................................... 62
DAFTAR PUSTAKA .................................................................................................... 63
xii
DAFTAR GAMBAR
Gambar 1.1 Grafik Jumlah Kasus DBD di DKI Jakarta ..........................................2
Gambar 1.2 Pie Chart Persentase Jumlah Kasus DBD di DKI Jakarta ....................3
Gambar 2.1 Fungsi Autokorelasi suatu data Zt ......................................................31
Gambar 3.1 Flowchart Pelaksanaan Penelitian ......................................................34
Gambar 4.1 Plot Data Kasus DBD DKI Jakarta Periode 2015 - 2020 ...................42
Gambar 4.2 Box-cox plot data sebelum transformasi ............................................43
Gambar 4.3 Box-cox plot data setelah transformasi pertama ................................43
Gambar 4.4 Grafik Autocorrelation Function data hasil transformasi pertama .....44
Gambar 4.5 Grafik Trend Analisis data hasil transformasi pertama ......................45
Gambar 4.6 Grafik ACF Data Hasil Differencing .................................................45
Gambar 4.7 Grafik PACF Data Hasil Differencing ...............................................46
Gambar 4.8 Grafik Trend Analisis data hasil Differencing Pertama .....................46
Gambar 4.9 Grafik Trend Analisis data hasil Differencing 2 ................................47
Gambar 4.10 Grafik ACF Data Hasil Differencing 2 ............................................48
Gambar 4.11 Grafik PACF Data Hasil Differencing 2 ..........................................48
Gambar 4.12 Grafik ACF Data Hasil Differencing Musiman ...............................49
Gambar 4.13 Grafik PACF Hasil Differencing Musiman .....................................50
Gambar 4.14 Output Normal Probability Plot Residual ........................................54
Gambar 4.15 Rancangan Dashboard Kasus DBD DKI Jakarta di Tableau ...........56
Gambar 4.16 Filter Daerah Jakarta ........................................................................57
Gambar 4.17 Filter Tahun ......................................................................................57
Gambar 4.18 Persentase Kasus DBD DKI Jakarta Per Daerah .............................58
xiii
Gambar 4.19 Grafik Perbandingan Jumlah Kasus Antar Daerah Setiap Tahun ....59
Gambar 4.20 Grafik Jumlah Kasus Per Tahun Berdasarkan Bulan .......................59
Gambar 4.21 Visualisasi Hasil Prediksi .................................................................60
xiv
DAFTAR TABEL
Tabel 2.1 Perbedaan Tradisional BI dengan Tableau ............................................15
Tabel 2.2 Kekurangan & Kelebihan dari Tableau dan PowerBID.........................16
Tabel 2.3 Identifikasi Model Berdasarkan Plot ACF dan PACF ...........................25
Tabel 2.4 Nilai λ pada Transformasi Box-Cox ......................................................29
Tabel 3.1 Informasi Pendukung Studi Literatur .....................................................35
Tabel 3.2 Waktu Proses Penelitian.........................................................................39
Tabel 4.1 Data Jumlah Kasus DBD di DKI Jakarta Periode 2015 – 2020 ............40
Tabel 4.2 Estimasi Model ARIMA musiman data Kasus DBD DKI Jakarta ........52
Tabel 4.3 Nilai MSE Model ARIMA musiman data Kasus DBD DKI Jakarta .....53
Tabel 4.4 Data hasil Peramalan Kasus DBD DKI Jakarta Periode 2021 ...............55
xv
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Demam Berdarah Dengue (DBD) merupakan penyakit yang disebabkan
oleh infeksi virus DEN-1, DEN-2, DEN-3, atau DEN-4 dan ditularkan melalui
sengatan nyamuk Aedes aegypti dan Aedes albopictus yang sebelumnya telah
terinfeksi oleh virus dengue dari penderita DBD lainnya (Ginanjar, 2008). Dalam
waktu yang relatif singkat, penyakit ini dapat membunuh orang yang terkena jika
tidak ditangani secepatnya (Satari & Mila, 2004).
Pada Oktober 2020, Kementrian Kesehatan memperoleh data jumlah kasus
Demam berdarah sejumlah 37.646 kasus yang tersebar merata di seluruh provinsi
di Indonesia (Harahap, 2021). Jumlah kematian akibat DBD pada tahun 2021
lebih tinggi dibandingkan tahun 2020, yaitu 168 dari 22.613 kasus DBD
menyebabkan kematian.
Menurut Yudi Koharudin, Kepala Bidang Pencegahan dan Penanggulangan
Penyakit Menular Dinas Kesehatan Jabar, selama tahun 2021, Kota Bandung
unggul sebagai daerah terbanyak kasus DBD yaitu dengan total 3.743 kasus,
disusul Kota Depok dengan 3.155 Kasus, dan Kota Bekasi dengan 1963 kasus.
Daerah dengan kasus kematian terbanyak di Jawa Barat terjadi di Kabupaten
Bogor dengan 22 kasus kematian dari total 1.639 kasus DBD yang ditemukan
(JabarNews, 2022).
Jakarta dinobatkan sebagai salah satu provinsi di Indonesia yang juga
1
2
memiliki kasus penderita penyakit demam berdarah yang cukup banyak.
Berdasarkan data pemetaan wilayah DBD yang dikumpulkan oleh Pemprov DKI
Jakarta melalui Dinas Kesehatan (Dinkes), terdapat 971 kasus DBD yang terjadi
sejak Januari hingga Maret 2020. Gambar 1.1 menunjukkan jumlah kasus DBD,
dengan kasus DBD terbanyak 269 kasus terjadi di Jakarta Barat, dan 265 kasus
di Jakarta Selatan dan Jakarta Timur. Setelah itu, di Jakarta Utara ada 103 kasus,
di Jakarta Pusat 62 kasus, dan di Kepulauan Seribu 7 kasus (Noname, 2020).
Jumlah Kasus DBD

300
269 265 265
250
200
150
103
100
62
50
7
0
Jakarta Pusat Jakarta Barat Jakarta Timur Jakarta Selatan Jakarta Utara Kepulauan
Seribu
Jumlah Kasus
Gambar 1.1 Grafik Jumlah Kasus DBD di DKI Jakarta [5].

3
Persentase Jumlah Kasus DBD

1%
11% 6%
28%
27%
27%
Jakarta Pusat Jakarta Barat Jakarta Timur

Jakarta Selatan Jakarta Utara Kepulauan Seribu
Gambar 1.2 Pie Chart Persentase Jumlah Kasus DBD di DKI Jakarta [5].
Pada Gambar 1.2 menunjukkan jumlah kasus DBD di DKI Jakarta pada
tahun 2020 dalam bentuk persentase. Persentase tertinggi dipimpin oleh daerah
Jakarta Barat sebesar 28%, Jakarta Selatan dan Jakarta Timur sebesar 27%,
Jakarta Utara sebesar 11%, Jakarta Pusat sebesar 6%, dan daerah Kepulauan
Seribu untuk persentase terendah sebesar 1%.
Pada masa sekarang, banyak lembaga melakukan peramalan atau
forecasting. Sebagai contoh peramalan fluktuasi saham, permintaan produksi
kain, peramalan penjualan produk, dan peramalan peramalan pemakaian internet
pada suatu daerah. Hal tersebut berlaku juga pada lembaga pemerintahan, seperti
peramalan peramalan kepadatan arus mudik, penerimaan pajak suatu daerah,
peramalan penyebaran suatu penyakit, peramalan kecelakaan lalu lintas, dan lain
sebagainya. Jumlah penderita demam berdarah ini digunakan untuk meramalkan
satu periode kedepan dengan menggunakan data-data histori yang sudah ada
4
dengan menggunakan metode Autoregressive Integrated Moving Average
(ARIMA).
Metode Autoregressive Integrated Moving Average (ARIMA) memiliki
ketepatan yang sangat akurat karena dalam metode tersebut menggunakan
peramalan jangka pendek. Peramalan jangka pendek dipilih karena hasil akurasi
yang sangat baik dibanding dengan peramalan jangka panjang yang akan
menghasilkan ketepatan yang berkurang dan akan cenderung flat (Ekananda,
2014). ARIMA memiliki hubungan statistik yang baik antara variabel yang akan
diprediksi dan nilai yang digunakan untuk prediksi. Untuk peramalan jangka
panjang, akurasi peramalan kurang baik. Prakiraan jangka panjang cenderung
memiliki nilai prakiraan yang konstan (Salwa et al., 2018). Nilai yang digunakan
ARIMA untuk peramalan adalah dengan menggunakan nilai historis dan saat ini
dari variabel dependen untuk membuat peramalan jangka pendek yang akurat
(Fadhilah, 2009).
Tools yang digunakan untuk melakukan peramalan ini menggunakan tools
MiniTab. Minitab termasuk kelompok software statistik yang dapat digunakan
untuk pengolahan data peramalan, dan penggunaan Minitab sangat popular untuk
melakukan peramalan saat penelitian. Tujuan kajian ini yakni meramalkan inflasi
di kabupaten Demak bulan Maret 2017 sampai dengan Desember 2017
menggunakan model ARIMA terbaik berbantuan software Minitab serta untuk
memilih model yang lebih akurat dalam melakukan analisis ARIMA. (Rahayu et
al., 2018)
Hasil peramalan Indeks Harga Konsumen Semarang dari penelitian

5
Dimashanti and Sugiman (2021) menunjukkan model terbaik ARIMA
(1,1,1)(2,1,0)12 untuk memprediksi IHK Kota Semarang dari Januari 2019 hingga
Desember 2021 dengan prakiraan hasil untuk 36 periode berikutnya dari Januari
2019 hingga Desember 2021.
Hasil peramalan (Budhiman, 2015) juga menunjukkan bahwa model
ARIMA (0,1,1)(1,0,0)12 metode yang paling baik untuk meramalkan jumlah
keberangkatan penumpang pesawat pada penerbangan domestik. Ketika diukur
terhadap nilai RMSE, MAPE, dan MAE, nilai yang dihasilkan kecil, sehingga
model memberikan ukuran terbaik untuk model.
Rezaldi and Sugiman (2021) juga memaparkan temuan mereka, prediksi
harga penutupan PT. Telekomunikasi Indonesia. Prediksi harga penutupan PT.
Telekomunikasi Indonesia pada Juni 2020 adalah 3103 Juli 2020 adalah 3056
Agustus 2020 adalah 300720 September 2020 adalah 2956 Oktober 2020 adalah
2905 November 2020 adalah 2852 Desember 2020 adalah 279920 Januari Januari
27442021 adalah Maret Itu adalah 2.571 pada April 26302021 dan 2.511 pada
Mei 2021.
Mengingat banyaknya kasus DBD, maka perlu dilakukan pemantauan dan
penindakan terhadap kasus DBD di Kota DKI Jakarta. Dasboard memberikan
solusi untuk menampilkan informasi dengan mudah, memberikan solusi untuk
kebutuhan informasi organisasi, dan menyediakan visualisasi dalam berbagai
format seperti bagan, laporan, dan indikator visual yang dikombinasikan dengan
informasi dinamis dan relevan. Alat yang berguna untuk. Ini memungkinkan
Anda untuk memantau kinerja organisasi Anda secara sekilas (Siti Few, 2006).
6
Dashboard tersebut dapat digunakan sebagai alat untuk memantau kasus
DBD di DKI Jakarta setiap tahunnya. Informasi penting yang ditampilkan di
dashboard memudahkan analisis data dan mendukung proses pengambilan
keputusan. Dashboard memungkinkan kita membuat tampilan data lebih
interaktif. Pengguna dapat memeriksa sendiri data yang ditampilkan untuk lebih
memahami data tersebut (Zhu et al., 2017).
Pada penelitian Linda et al. (2014), penelitian tersebut berusaha untuk
memprediksi pendapatan dari produksi teh dalam kemasan di PT. Sinar Sosro
Sumatera Bagian Utara 2014 menggunakan metode Box Jenkins ARIMA yang
merupakan salah satu metode prediksi kuantitatif. Data yang diekstraksi adalah
dari Juni 2007 hingga Mei 2013. Model yang tepat yaitu ARIMA (2,1,2)(1,1,1)3.
Hal ini digunakan untuk memprediksi penjualan teh botol sosro 12 periode ke
depan. Pilihan didasarkan pada nilai MSE minimum 0,036823269 (mean square
error) dan nilai MAPE minimum 1,37120 (mean absolute percentage error). Dari
hasil ramalan Juni 2013 sampai Mei 2014, total penjualan produksi teh botol
Sosro adalah 1.305.140.586 kasus, dan rata-rata penjualan bulanan adalah
108.761.7155 kasus.
Menurut Setyawan (2017), hasil dari penelitiannya informasi mengenai
kasus DBD di Kabupaten Malang 2019 – 2015, lokasi puskesmas, status
puskesmas, prakiraan puskesmas pasien DBD dibuat sedetail mungkin dengan
memanfaatkan visualisasi dashboard.
Berdasarkan penjelasan di atas, ARIMA merupakan cara yang baik untuk
memprediksi berbagai jenis pola data. Metode ini dapat diuji reliabilitasnya dengan
7
menggunakan pendekatan statistik (Nurulita, 2010). Metode ARIMA lebih baik
dalam meramalkan data Nilai Tukar Petani di Jawa Tengah karena nilai MSE dan
MAPE berturut-turut sebesar 1,2487 dan 0,792402 cenderung lebih kecil
dibandingkan nilai MSE dan MAPE pada metode Exponential Smoothing sebesar
1.91312 dan 0.93166 (Istiqomah & Darsyah, 2018).
Pengambilan wilayah ini untuk penelitian karena DKI Jakarta merupakan
salah satu dari tiga provinsi yaitu Kalimantan, Bali dan DKI Jakarta yang
memiliki tingkat penderita DBD tertinggi (A. I. Widyatami & Suryawan, 2021),
dan juga dataset jumlah penderita kasus DBD di Jakarta cukup lengkap mulai
dari tahun 2015 – 2020.
Hasil dari penelitian yang dilakukan menarik keputusan dan langkah terbaik
untuk menanggulangi jumlah pasien demam berdarah, masyarakat yang ingin
mengetahui peramalan jumlah penderita demam berdarah di tahun yang akan
datang, dan juga untuk membantu mahasiswa yang akan melakukan penelitian
dengan judul serupa. Oleh karena itu, penulis tertarik untuk melakukan penelitian
ini yang berjudul “Visualisasi Dashboard Tableau dan Peramalan Jumlah
Kasus Demam berdarah Dengue di DKI Jakarta Menggunakan Metode
ARIMA”.
1.2 Identifikasi Masalah
Berdasarkan latar belakang di atas dan untuk lebih fokus pada penelitian
ini, penulis menyatakan identifikasi masalah sebagai berikut:
1. Jumlah penderita kasus demam berdarah di DKI Jakarta pada tahun 2015 –
2020 adanya pergerakan yang bisa naik dan turun dalam periode yang singkat.
8
2. Belum ada yang memodelkan peramalan menggunakan metode ARIMA pada
jumlah penderita kasus demam berdarah di DKI Jakarta.
3. Dashboard dapat digunakan sebagai alat untuk memantau dan melihat
prakiraan kasus tahunan demam berdarah di DKI Jakarta.
1.3 Rumusan Masalah
Berdasarkan identifikasi masalah yang telah dipaparkan di atas, maka
rumusan masalah yang dipecahkan oleh penelitian ini adalah sebagai berikut:
1. Berapakah hasil nilai MSE menggunakan metode ARIMA dan apakah cocok
metode tersebut digunakan untuk peramalan jumlah penderita kasus demam
berdarah di DKI Jakarta?
2. Berapakah hasil peramalan jumlah penderita kasus demam berdarah di DKI
Jakarta di tahun yang akan datang?
3. Bagaimana hasil informasi persebaran kasus Demam Berdarah di Provinsi
DKI Jakarta kedalam dashboard?
1.3 Batasan Masalah
Ada beberapa batasan masalah dalam penelitian ini, dan batasan masalah
itu sebagai berikut:
1. Data yang digunakan adalah data yang berasal dari Dinas Kesehatan, yang
dapat di download di website data.jakarta.go.id.
2. Data kasus DBD yang digunakan untuk pemodelan prediksi yang dibuat
adalah dari tahun 2015 hingga 2020.
3. Metode yang digunakan pada penelitian adalah ARIMA.
4. Tools yang digunakan adalah Tableau dan MiniTab.

9
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Mengetahui hasil nilai MSE menggunakan metode ARIMA dan apakah
cocok metode tersebut digunakan untuk peramalan jumlah penderita kasus
demam berdarah di DKI Jakarta.
2. Mengetahui hasil peramalan jumlah penderita kasus demam berdarah di DKI
Jakarta di tahun yang akan datang?
3. Menjelaskan hasil informasi persebaran kasus Demam Berdarah di Provinsi
DKI Jakarta kedalam dashboard.
1.5 Manfaat Penelitian
1. Mahasiswa
Sebagai tambahan wawasan dan pengetahuan tentang peramalan dengan
model ARIMA dan sebagai sarana untuk menerapkan metode yang dijelaskan
dalam ilmu yang didapat dari perkuliahan.
2. Lembaga/Masyarakat
Penelitian ini diharapkan dapat bermanfaat dalam memprediksi jumlah
penderita demam berdarah di DKI Jakarta dan menampilkannya pada
dashboard Tableau untuk untuk membantu pihak Dinas Kesehatan dan
memberikan informasi penting dan menganalisa hasil prediksi penderita
demam berdarah. Analisis ini bertujuan untuk mengantisipasi peningkatan
jumlah penderita demam berdarah. Analisis yang dilakukan memberikan
perkiraan jumlah pasien demam berdarah di DKI Jakarta di masa mendatang.
3. Universitas
10
Penelitian ini dimaksudkan untuk melengkapi literatur di bidang Sistem
Informasi dan dapat digunakan sebagai bahan bacaan untuk menambah
wawasan dan pengetahuan, serta sebagai referensi untuk penelitian
selanjutnya.
1.6 Metode Penelitian
Metodologi yang digunakan dalam penelitian ini adalah:
A. Tahapan Pelaksanaan Penelitian
Pada Penelitian ini terdapat langkah-langkah yang akan dilakukan.
B. Metodologi Pengumpulan Data
1) Studi Literatur
Tahap ini dilakukan melalui survei teori sastra dan buku-buku penyedia
layanan dan situs web yang terkait dengan studi prediktif ARIMA ini.
2) Pemilihan Data
Pemilihan data akan digunakan pada tahap ini. Data jumlah penderita
demam berdarah pada setiap wilayah DKI Jakarta yang didapatkan dari
website data.jakarta.go.id yang akan digunakan. Data memiliki format
Excel (xls) yang terdiri dari variabel tahun, bulan, kota administrasi,
kecamatan, jumlah penderita DBD, jumlah penderita DBD yang
meninggal.
3) Pembuatan Template Excel
Setelah pemilihan data dilakukan, selanjutnya data disatukan ke dalam
satu file excel yang berisikan data kasus demam berdarah setiap tahun,
bulan, daerah jakarta, dan jumlah penderita DBD. File excel ini
11
digunakan sebagai acuan sehingga akan dapat digunakan terus
kedepannya tanpa harus membuat ulang kembali.
C. Peramalan ARIMA di MiniTab
Pada tahap ini, data yang telah terkumpul pada template excel yang telah
dibuat selanjutnya disatukan dan dimasukkan kedalam aplikasi MiniTab
untuk dilakukan peramalan dengan metode ARIMA Input atau masukan
untuk peramalan pada MiniTab adalah template excel yang berisi data
aktual penderita Demam berdarah.
D. Perancangan Dashboard
Pada tahapan ini, aplikasi Tableau digunakan untuk memvisualisasikan
dashboard hasil peramalan berupa grafik. Tahapan yang dilakukan sebagai
berikut:
1) Menghubungkan ke File Excel untuk mendapatkan data dari hasil
prediksi, perlu menghubungkan panel ke file Excel yang berisi hasil
prediksi yang sebelumnya dieksekusi menggunakan metode ARIMA.
2) Pemilihan Data dan Visualisasi setelah menyambungkan ke file Excel,
pilih data yang akan ditampilkan berikutnya dan visualisasi yang sesuai
untuk membuat data prediksi lebih mudah dipahami dan dianalisis.
3) Setelah pemilihan data dan visualisasi dilakukan, untuk mempermudah
analisis hasil prediksi langkah selanjutnya adalah mengatur tata letak dari
hasil visualisasi data yang ditampilkan.
1.7 Sistematika Penulisan
Dalam penyusunan laporan penelitian ini, pembahasan dibagi menjadi

12
lima bab, yang pertama meliputi pendahuluan, landasan teori, metodologi
penelitian, hasil dan pembahasan, dan penutup. Penjelasan sederhananya adalah
sebagai berikut:
BAB I PENDAHULUAN
Bab ini berisi penjelasan secara singkat mengenai latar belakang
masalah, rumusan masalah, batasan masalah, tujuan serta manfaat
penelitian, metode penelitian, dan sistematika penelitian.
BAB II LANDASAN TEORI
Bab ini membahas mengenai penelitian-penelitian serupa yang
telah dilakukan serta teori – teori yang menunjang permasalahan
yang dibahas pada penelitian ini.
BAB III METODE PENELITIAN
Dalam bab ini dijelaskan mengenai tahapan – tahapan apa saja
yang harus dilakukan dalam pengerjaan penelitian ini.
BAB IV HASIL DAN PEMBAHASAN
Bab ini berisi hasil dan pembahasan dalam penyelesaian
permasalahan yang dibahas pada penelitian ini.
BAB V KESIMPULAN DAN SARAN
Bab yang berisi kesimpulan dan saran yang ditujukan untuk
kelengkapan penyempurnaan penelitian.

BAB 2
LANDASAN TEORI
2.1 Visualisasi Dashboard
Dasboard informasi memberikan informasi dengan mudah, memberikan solusi
untuk kebutuhan informasi organisasi, dan memiliki berbagai bentuk antarmuka
seperti bagan, laporan, indikator visual, dan mekanisme peringatan yang
dikombinasikan dengan informasi yang dinamis dan relevan. Merupakan alat yang
menyediakan dan meningkatkan kinerja organisasi. Dapat dipantau secara sekilas
(S. Few, 2006). Dengan kata lain, dashboard menampilkan data dalam format yang
berbeda, sehingga lebih mudah untuk memahami data yang ada. Memiliki dasboard
dapat menawarkan beberapa manfaat bagi organisasi. Di bawah ini adalah manfaat
dashboard menurut (Yigitbasioglu & Velcu, 2012):
- Dashboard dapat meningkatkan pengambilan keputusan dengan
memahami dan memanfaatkan kemampuan persepsi manusia.
- Dashboard dapat mengumpulkan, menggabungkan, dan melihat informasi
dari berbagai sumber, memungkinkan pengguna untuk melihat kinerja
secara langsung, seperti keuntungan penjualan berjalan.
Menurut Nurani (2011) dasboard memberikan tampilan visual informasi
penting yang diperlukan untuk mencapai satu atau beberapa tujuan, mengaturnya
di satu layar, dan memberikan informasi yang dibutuhkan secara sekilas.
Representasi visual artinya representasi informasi perlu dirancang semaksimal
mungkin agar mata manusia dapat dengan cepat menangkap informasi tersebut dan
13
14
otak manusia dapat menangkap maknanya dengan benar (Nurani, 2011).
Dashboard adalah tampilan pada monitor komputer lengkap yang berisi
informasi penting dan dapat di lihat langsung sehingga dapat melihat dasboard dan
mengetahui apa yang perlu diketahui. Biasanya kombinasi teks dan grafik, tetapi
penekanannya adalah pada grafik (Siti Few, 2006).
2.2 Software Tableau
Tableau adalah perangkat lunak intelijen bisnis yang mudah digunakan,
terutama untuk visualisasi data, analisis data, dan pelaporan. Sangat mudah
digunakan karena menggunakan sistem drag and drop. Tableau dapat
menggabungkan data dari berbagai sumber data seperti spreadsheet, database, data
cloud, dan data besar ke dalam satu program untuk digunakan dalam analisis
dinamis (Sugiarto, 2022).
Tableau mendukung pemerintah DKI dalam mempercepat pengambilan
keputusan berdasarkan visualisasi data. Tableau adalah alat/platform yang
membuat visualisasi data lebih interaktif, lebih mudah dibaca, dan lebih mudah
dianalisis. Visualisasi yang dilakukan adalah transformasi data tabular yang ketat
menjadi grafik, grafik, geomapping, dll, yang dapat lebih jelas menunjukkan
perubahan dan perbedaan data. Hasilnya, tampilan data analisis statistik reguler
menjadi lebih indah dengan grafik yang menarik menggunakan opsi dasbor
interaktif yang ditawarkan Tableau (Saepuloh, 2020).
Alat visualisasi data ini sangat populer karena relatif mudah digunakan dan
sangat kuat. Tableau terintegrasi dengan ratusan sumber untuk mengimpor data dan
membuat berbagai visualisasi data. Anda juga dapat memvisualisasikan data dari
15
bagan ke peta.
Tableau tersedia dalam versi publik. Ini berarti siapa pun dapat mengakses dan
melihat visualisasi data. Ada juga versi Tableau Desktop yang melindungi
visualisasi data dengan kata sandi. Versi Tableau Desktop ini sangat cocok untuk
bisnis dan perusahaan.
Ada beberapa keuntungan menggunakan Tableau dibandingkan alat BI
tradisional lainnya. Manfaat tersebut ditunjukkan pada Tabel 2.1:
Tabel 2.1 Perbedaan Tradisional BI dengan Tableau
Metode Tradisional Tableau
Perlu keahlian programming Tidak perlu keahlian pemrograman
Dapat menggabungkan berbagai jenis

Fokus pada satu jenis database sumber data seperti spreadsheet,
database, cloud data, dan big data
Memakan Waktu Menghemat waktu
Untuk memperoleh informasi dari Untuk memperoleh informasi, dengan
database, perlu meminta ahli IT untun menggunakan dashboard dapat secara
mengambil keputusan langsung mengambil keputusan
Bergantung pada Bahasa Query Query dijalankan dibalik layar
Mengkombinasi sumber data yang Perbedaan sumberdata dapat di
berbeda sulit untuk dilakukan kombinasikan dengan mudah
Relative mahal Harga terjangkau
Banyak dirancang untuk bisnis yang Solusi BI yang sempurna untuk bisnis
besar yang kecil, medium, dan luas
Selain Tableau, masih banyak software-software yang digunakan untuk
Analisa data salah satunya yaitu Microsoft PowerBI. Microsoft Power BI adalah
16
software intelligence bisnis besutan Microsoft yang memungkinkan untuk
mengolah data lebih detail dan menampilkannya dengan grafis yang lebih interaktif.
Microsoft Power BI dapat memvisualisasikan data yang telah dimasukkan atau data
yang sudah terkoneksi oleh sistem ketiga. Sedangkan, Tableau adalah platform
Business Intelligence untuk membantu dalam melihat dan memahami data. Tableau
juga secara khusus dapat menerjemahkan data ke dalam bentuk visual atau
presentasi dan mengolah metadata. Tableau memungkinkan pengguna untuk
membuat semua visualisasi ini tanpa melakukan pengodean dan juga dapat
mengambil berbagai ukuran data ke dalamnya untuk diolah (SRK, 2022).
Berikut ini merupakan tabel kelebihan dan kekurangan yang ada pada Power
BI dan Tableau (SRK, 2022).
Tabel 2.2 Kekurangan & Kelebihan dari Tableau dan PowerBID
Kekurangan Kelebihan
1. Tableau berguna untuk 1. Pilihan visualnya yang
Tableau visualisasi, tetapi tidak dapat menarik dan interaktif.
melakukan query 2. Tableau adalah tools yang
2. Tableau tidak memiliki amat user friendly, orang
fitur refresh laporan secara yang tidak
otomatis dengan bantuan memahami coding dan
penjadwalan. dunia business
3. Banyak user yang kurang intelligence sekalipun akan
memberikan perhatian memahami cara penggunaan
terhadap pilihan conditional Tableau.
formatting Tableau dan 3. Tableau bisa
limitasi tampilan tabel 16 menggabungkan berbagai
kolom. sumber data, big
17
data, spreadsheet, cloud, dan

berbagai tipe data lainnya.
4. Tableau bisa mengolah data
menggunakan
perangkat mobile, seperti
ponsel dan tablet.
5. Tableau bisa
mengintegrasikan data
pengguna dengan dua
bahasa data science, yakni R
dan Phyton.
1. Power BI tidak memiliki 1. Paket siap pakai untuk data
PowerBI kontrol di tingkat umum yang bermanfaat bagi
perusahaan, jadi software ini bisnis
tidak mendukung 2. Real time dashboard
pengalokasian permission 3. Aman, menghubungkan data
multi-level dan tidak dapat di Cloud dengan data di
mengontrol permission server organisasi tanpa Perlu
granularity tingkat kolom Cemas
yang dilihat pengguna dan 4. Ambil data berdasarkan
tidak ada strategi kontrol bahasa natural dan bukan
yang sesuai untuk grup. bahasa SQL
2. Versi gratis Power BI 5. Terintegrasi dengan
memiliki keterbatasan dalam Microsoft Office
hal jumlah data yang dapat 6. Deployment cepat tersedia
ditangani. Jika jumlah data berbagai macam platform
telah mencapai 2GB, desktop & mobile
pengguna perlu meng-
upgrade ke versi berbayar
untuk mengurangi waktu
proses.
18
2.3 Peramalan
Peramalan merupakan suatu bidang ilmu yang dijadikan alat untuk melakukan
prediksi sesuatu dengan dasar data yang ada sebelumnya, dan diolah dengan cara
tertentu (Badi’ah & Handayani, 2020). Menurut Yamit yang dikutip oleh
Agustinawati (2015) Peramalan atau dikenal juga dengan istilah forecasting atau
prakiraan merupakan alat yang efektif dan efisien terutama dalam bidang ekonomi.
Dalam organisasi modern, mengetahui apa yang terjadi di masa depan penting tidak
hanya untuk mengetahui apakah itu baik atau buruk, tetapi juga untuk membuat
prediksi.
Peramalan adalah prediksi, proyeksi atau estimasi tingkat kejadian yang tidak
pasti di masa yang akan datang (Agustinawati, 2015). Mustahil untuk mencapai
akurasi absolut dalam memprediksi tingkat peristiwa dan kegiatan di masa depan.
Oleh karena itu, jika sebuah perusahaan tidak dapat secara andal memprediksi
kejadian di masa depan, akan membutuhkan banyak waktu dan energi untuk
menarik kesimpulan tentang kejadian di masa depan. Dalam situasi ini, perlu
membuat prediksi untuk menentukan kapan atau kapan suatu peristiwa akan terjadi
sehingga dapat mengambil tindakan yang tepat. Prediksi adalah alat penting untuk
perencanaan yang efektif dan efisien (Hernadewita et al., 2020).
Menurut Render and Heizer (2001), ada beberapa tahap dalam peramalan yaitu:
1) Memastikan tujuan prediksi
2) Menentukan unsur apa yang akan di prediksi
3) Menentukan jenis waktu peramalan (pendek, menengah, atau panjang).
4) Memilih jenis model peramalan.

19
5) Mengumpulkan data yang di perlukan untuk melakukan peramalan.
6) Memvalidasi dan menerapkan hasil peramalan.
Berdasarkan metode ini, peramalan dapat dibagi menjadi dua metode, yakni
metode kuantitatif dan kualitatif (Tindriyani, 2017).
1) Metode prediksi kualitatif yang menggabungkan faktor-faktor seperti intuisi
pengambilan keputusan, emosi, dan pengalaman pribadi
2) Metode peramalan kuantitatif yang menggunakan satu atau lebih model
matematis dengan data historis dan variabel kausal untuk memprediksi
permintaan.
Pada dasarnya, metode prediksi kuantitatif dibagi menjadi dua jenis: model
deret waktu dan model kausal (Sonata, 2021). Metode prediksi membantu untuk
beroperasi secara teratur dan terfokus sehingga hasil yang diperoleh memiliki
tingkat kesalahan yang kecil, sehingga hasil yang diperoleh dapat memberikan
analisis prediksi yang baik.
Peramalan biasanya diklasifikasikan berdasarkan horizon waktu masa depan
yang dicakupnya. Menurut Taylor (2009) dalam hubungannya dengan horizon
waktu peramalan terbagi atas beberapa kategori, yaitu:
1) Peramalan jangka panjang, umumnya peramalan dilakukan untuk
meramalkan 3 tahun yang akan datang atau lebih. Peramalan ini digunakan
untuk perencanaan produk dan perencanaan sumber daya.
2) Peramalan jangka menengah, umumnya peramalan dilakukan untuk
peramalan yang mencakup hitungan bulan hingga 3 tahun yang akan datang.
Peramalan ini lebih khusus dibandingkan peramalan jangka panjang,

20
biasanya digunakan untuk menentukan aliran kas, perencanaan produksi,
dan penentuan anggaran.
3) Peramalan jangka pendek umumnya peramalan dilakukan untuk
meramalkan 1 tahun ke depan. Tetapi umumnya kurang dari 3 bulan
Peramalan ini biasanya digunakan untuk mengambil keputusan dalam hal
perlu tidaknya lembur, penjadwalan kerja, dan lain-lain keputusan kontrol
jangka pendek.
Dalam hal peramalan, keakuratan ramalan itu penting. Semakin tinggi akurasi
peramalan, semakin rendah tingkat kesalahan dari peramalan. Menurut Makridakis,
salah satu cara untuk mengukur keakuratan suatu peramalan dengan nilai Root
Square Mean Error (RMSE) (Makridakis et al., 1982). Root Measn Square Error
(RMSE) merupakan nilai rata-rata dari jumlah kuadrat kesalahan dan juga dapat
menunjukan jumlah kesalahan yang dihasilkan oleh suatu model peramalan.
1
𝑅𝑀𝑆𝐸 = √𝑛 ∑𝑛𝑖=1(𝑓𝑖 − 𝑜𝑖)2 (2.01)
Dimana 𝑓𝑖 = nilai ramalan untuk period eke 𝑖

𝑜𝑖 = nilai aktual untuk periode ke 𝑖
𝑛 = jumlah periode
R dan Minitab adalah kelompok perangkat lunak statistik yang dapat digunakan
untuk analisis statistik, termasuk memproses data peramalan. R dan Minitab adalah
perangkat lunak statistik open source. R menggunakan Bahasa pemograman R
untuk menggunakannya, berbeda dengan Minitab tidak perlu menggunakan Bahasa
pemograman. Dengan memilih R dan Minitab diharapkan dapat diketahui software

21
yang lebih akurat diantara keduanya (Dimashanti & Sugiman, 2021).
2.4 Demam Berdarah Dengue (DBD)
Penyakit demam berdarah dengue (DBD) merupakan penyakit yang
disebabkan oleh infeksi virus DEN-1, DEN-2, DEN-3, atau DEN-4 yang
ditularkan melalui gigitan nyamuk Aedes aegypti dan Aedes albopictus yang
sebelumnya telah terinfeksi oleh virus dengue dari penderita DBD lainnya
(Ginanjar, 2008). Dalam waktu yang relative singkat, penyakit ini dapat
merenggut nyawa penderitanya jika tidak ditangani secepatnya (Satari & Mila,
2004).
Nyamuk ini berasal dari Mesir dan menyebar ke seluruh dunia melalui kapal
dan udara. Nyamuk berkembang biak di belahan dunia dengan iklim tropis dan
subtropis, seperti Asia, Afrika, Australia, dan Amerika Serikat. Nyamuk ini
ditemukan di mana-mana kecuali pada ketinggian di atas 1000 m dpl. Saat ini
nyamuk A. aegypti banyak ditemukan di negara-negara antara 45° LU dan 35° LS.
Penyebaran nyamuk internasional ini erat kaitannya dengan perkembangan sistem
transportasi (Hoedojo, 1993).
Pada Oktober 2020, Kementrian Kesehatan memperoleh jumlah kasus DBD
berjumlah 37.646 kasus yang tersebar merata di seluruh provinsi Indonesia
(Harahap, 2021). Pada tahun 2021 tercatat lebih banyak jumlah kasus DBD yang
menyebabkan kematian dibandingkan pada tahun 2020, yaitu 168 dari total 22.613
kasus DBD menyebabkan kematian.
A. Aegypti tersebar luas di seluruh wilayah Indonesia. Selain di kota-kota
pelabuhan yang padat penduduk, spesies ini juga terdapat di perkotaan dan
22
pedesaan yang jauh dari pelabuhan. Penyebaran dari pelabuhan ke desa-desa
disebabkan larva A. Aegypti diangkut dengan alat angkut bersama dengan benda-
benda yang mengandung genangan air yang mengandung larva spesies ini.
Nyamuk A. Aegypti merupakan pembawa utama virus dengue yang menyebar di
rumah dan tempat umum (TTU). Graham adalah ilmuwan pertama yang secara
positif menunjukkan peran nyamuk A. Aegypti dalam penularan demam berdarah
pada tahun 1903 (Sumarmo, 1988).
2.5 Autoregressive Integrated Moving Average (ARIMA)
Metode Autoregressive Integrated Moving Average (ARIMA), atau biasa
disebut dengan metode Box-Jenkins, merupakan metode yang dikembangkan
secara intensif pada tahun 1970 oleh George Box dan Gwilym Jenkins (Iriawan &
Astuti, 2006). Kelompok model time series yang termasuk dalam metode ini antara
lain autoregressive (AR), moving average (MA), autoregressive moving average
(ARMA), dan autoregressive integrated moving average (ARIMA) (Razak et al.,
2009). Secara umum model ARIMA (p,d,q), memiliki bentuk (Wei, 2006)
∅𝑝 (𝐵)(1 − 𝐵)𝑑 𝑍𝑡 = 𝜃0 + 𝜃𝑞 (𝐵)𝑎𝑡 (2.02)
𝐵 merupakan operator backshift, dan 𝑎𝑡 adalah barisan white noise dengan
mean dan varians konstan (𝑎𝑡 ~ 𝑊𝑁(0, 𝜎 2 )). Jika model ARIMA memiliki efek
musiman, maka akan terlihat seperti ini (Wei, 2006):
∅𝑝 (𝐵)Φ𝑝 (𝐵 𝑆 )(1 − 𝐵)𝑑 (1 − 𝐵 𝑆 )𝐷 𝑍𝑡 = 𝜃𝑞 (𝐵)Θ𝑞 (𝐵 𝑠 )𝑎𝑡 (2.03)
2.5.1 Autoregressive Model (AR)
Bentuk umum model AR dengan ordo p (AR(p)) atau model ARIMA (p,0,0)
23
ditampilkan pada persamaan
𝑋𝑡 = 𝜇 ′ + ∅1 𝑥𝑡−1 + ∅2 𝑥𝑡−2 + ∅3 𝑥𝑡−3 + ⋯ + ∅𝑝 𝑥𝑡−𝑝 + 𝑒𝑡 (2.04)
Dimana:
𝜇 ′ = suatu konstanta′
𝑥𝑡 = variabel dependen,
∅𝑝 = parameter autoregressive ke-𝑝
𝑒𝑡 = nilai kesalahan pada saat 𝑡
𝑥𝑡−1 , 𝑥𝑡−2 , 𝑥𝑡−3 , … 𝑥𝑡−𝑝 = independent variabel.
Variabel bebas adalah himpunan nilai dari variabel yang sejenis selama
waktu t terdekat, di mana et adalah satuan kesalahan atau residual yang
memperhitungkan gangguan acak yang tidak dapat dijelaskan oleh model. . Model
yang dijelaskan dalam Persamaan 2.4 disebut autoregressive karena persamaan
ini mirip dengan persamaan regresi.(𝑥 = 𝑎 + 𝑏1 𝑧1 + 𝑏2 𝑧2 + 𝑏3 𝑧3 + … +
𝑏𝑘 𝑧𝑘 + 𝑒). Perbedaannya terletak pada variabel yang digunakan 𝑧1 = 𝑥𝑡−1 , 𝑧2 =
𝑥𝑡−2 , 𝑧3 = 𝑥𝑡−3 , … , 𝑧𝑘 = 𝑥𝑡−𝑝 dan variabel independent merupakan nilai dari
periode dengan lag 1, 2, 3, dst. periode 𝑝. Dengan demikian, perhitungan
autoregresif dapat dilakukan dalam proses sebagai berikut:
1) Memastikan model persamaan 2.4 yang sesuai dengan deret waktu,
2) Memastikan nilai orde 𝑝 (menentukan panjangnya persamaan yang
terbentuk)
3) Memperkirakan nilai koefisien autoregresif ∅1 , ∅2 , ∅3 , … , ∅𝑘 .
Setelah memiliki model yang sesuai, dapat menggunakan model tersebut untuk
memprediksi nilai masa depan. Misalnya, jika kita mendapatkan 𝑝 = 3 dan ∅1 =
0.7, ∅2 = 0.45, ∅3 = −0.34, maka model autoregresif adalah sebagai berikut.

24
𝑥𝑡 = 0.7𝑥𝑡−1 + 0.45𝑥𝑡−2 − 0.34𝑥𝑡−3 + 𝑒𝑡 (2.05)
Model tersebut digunakan sebagai persamaan matematis untuk menentukan
nilai prediksi yang akan datang 𝑥𝑡 .
2.5.2 Moving Average Model (MA)
Model lain dari model ARIMA adalah moving average, dilambangkan
sebagau MA(𝑞) atau ARIMA (0,0, 𝑞) yang ditulis dengan persamaant:
𝑥𝑡 = 𝜇 ′ + 𝑒𝑡 − 𝜃1 𝑒𝑡−1 + 𝜃2 𝑒𝑡−2 + 𝜃3 𝑒𝑡−3 + ⋯ + 𝜃𝑝 𝑒𝑡−𝑞 (2.06)
Dimana:
𝜇 = suatu konstanta
𝜃𝑘 = parameter autoregressive ke-𝑝
𝑒𝑡 = error atau unit residual
𝑒𝑡−1 , 𝑒𝑡−2 , 𝑒𝑡−3 , … , 𝑒𝑡−𝑞 = selisih nilai aktual dengan nilai peramalan
Persamaan (2.06) menjelaskan bahwa nilai 𝑥𝑡 tergantung nilai error
sebelumnya (𝑒𝑡 , 𝑒𝑡−1 , 𝑒𝑡−2 , 𝑒𝑡−3 , … , 𝑒𝑡−𝑞 ) daripada nilai variabel itu sendiri. untuk
melakukan pendekatan antara proses autoregressive dan moving average
diperlukan pengukuran autokorelasi, perbedaannya adalah model autoregresif
mengukur autokorelasi antara nilai berturut-turut dari 𝑥𝑡 sedangkan model moving
average mengukur autokorelasi antara nilai error atau residual 𝑒𝑡 . Menurut
persamaan (2.06) nilai yang akan datang dapat diprediksi dengan menggunakan
error pada beberapa periode yang lalu. Contoh untuk model moving average
apabila nilai 𝑞 = 2, 𝜃1 = 0.5 𝑑𝑎𝑛 𝜃2 = −0.25, model peramalan 𝑞 = 2 atau MA
(2) untuk 𝑥𝑡 adalah 𝑥𝑡 = 𝑒𝑡 − 0.5𝑒𝑡−1 − 0.25𝑒𝑡−2 dimana 𝑒𝑡 adalah nilai acak

25
yang tidak dapat diprediksi oleh model.
2.5.3 Autoregressif Moving Average Model (ARMA)
Dari model autoregressive (AR) dan moving average (MA) dapat dibentuk
model baru yang merupakan gabungan keduanya, yaitu ARMA (autoregressive
moving average) dengan ARMA (𝑝, 𝑞). Adapun bentuk umum persamaan ARMA
merupakan gabungan dari persamaan AR dan MA yang dinotasikan sebagai
berikut:
𝑥𝑡 = ∅1 𝑥𝑡−1 + ∅2 𝑥𝑡−2 + ⋯ + ∅𝑝 𝑥𝑡−𝑝 + 𝑒𝑡 − 𝜃1 𝑒𝑡−1 + 𝜃2 𝑒𝑡−2 + ⋯ + 𝜃𝑝 𝑒𝑡−𝑞 (2.07)
Secara umum, identifikasi model time series dapat dilakukan dengan
melihat plot ACF dan plot PACF. Menurut Bowerman and O'Connell (1993) sifat-
sifat model deret waktu dapat dilihat berdasarkan bentuk atau pola plot ACF dan
PACF. Identifikasi kriteria model time series berdasarkan plot ACF dan PACF
ditunjukkan pada Tabel 2.1.
Tabel 2.3 Identifikasi Model Berdasarkan Plot ACF dan PACF

Model ACF PACF
AR(𝑝) Turun cepat menuju nol Terputus setelah lag 𝑝
MA(𝑞) Terputus setelah lag 𝑞 Turun cepat menuju nol
AR(𝑝) atau MA(𝑞) Terputus setelah lag 𝑞 Terputus setelah lag 𝑝
ARMA(𝑝, 𝑞) Turun secara eksponensial Turun secara eksponensial
2.6 Time Series
Time series adalah suatu bentuk pengamatan yang dilakukan atas dasar time
series, dan terdapat korelasi antara pengamatan yang berdekatan (Wei, 2006).
Pengambilan data biasanya dilakukan pada interval waktu yang sama dan dari
26
sumber yang sama. Ada korelasi atau ketergantungan statistik antara pengamatan
pada satu titik waktu dan pengamatan pada titik waktu lain. Deret waktu adalah
normal selama prosesnya tidak berubah dengan perubahan dari waktu ke waktu dan
deret rata-rata pengamatan dari waktu ke waktu selalu konstan.
Tehnik Time series merupakan data history yang digunakan untuk meramalkan
data berikutnya. Hampir sama dengan regresi, Y merupakan data history dan X
adalah data periode atau time itu sendiri, bisa bernilai 1 untuk data yang paling
awal, dan bernilai 2 untuk data berikutnya dan seterusnya. Model yang dihasilkan
akan digunakan untuk meramalkan nilai Y berikutnya. Lalu apakah menggunakan
r-squared? Jawabnnya bisa, meskipun time series dalam pengukuran akurasinya
tidak menggunakan R-squared, namun karena time series juga termasuk model
persamaan, seharusnya R-squared juga bisa digunakan untuk menilai apakah
persamaan yang dihasilkan baik atau tidak.
Berikut berbagai macam teknik time series sebagai berikut:
1) Naïve
Tehnik naïve merupakan tehnik time series yang paling sederhana. Deskripsi
singkat tentang tehnik naïve ini adalah kita memprediksi dengan data satu periode
sebelumnya. Misalnya penjualan bulan maret adalah 20 unit, maka kita
memprediksi penjualan april juga sebesar 20 unit. Atau dalam hitungan tahun, jika
penjualan tahun 2010 sebesar 200 unit, maka kita memprediksi penjualan tahun
2011 juga sebanyak 200 unit.
Dalam persamaan dapat ditulis sebagai berikut:
Y prediksi = Y t-1
27
2) Moving Average
Tehnik moving average (MA) merupakan pengembangan dari tehnik naïve. Jika
naïve hanya menggunakan data 1 periode sebelumnya untuk menentukan atau
meramalkan data kedepan, maka MA menggunakan beberapa data periode kedepan
dan kemudian dirata-ratakan untuk menentukan data berikutnya. Jumlah data yang
digunakan biasanya disebut ordo. Dikatakan moving average atau rataan yang
bergerak karena average yang digunakan seolah bergerak tergantung data yang
ingin diprediksi.
Tehnik MA selanjutnya dapat dikembangkan menjadi tehnik double MA. Yakni
hasil MA dari rataan bergerak nilai aktualnya dilakukan MA kembali atau
melakukan rataan bergerak sebanyak dua kali.
3) Teknik Trend
Tehnik trend merupakan tehnik yang umum digunakan pada analisis peramalan
data kuantitatif. Pada dasarnya kita mencari pola trend pada data yang kita miliki;
misalnya linear, kuadratic, S kurve, atau exponential; yang selanjutnya kita gunakan
model tersebut untuk memperkirakan data selanjutnya.
Anda tidak perlu kuatir dengan banyaknya pilihan yang digunakan untuk
melakukan tehnik data peramalan karena dapat menggunakan software untuk
membantu pemrosesan data.
Tehnik yang paling baik atau model yang paling baik jika model tersebut
memiliki kriteria error yang paling kecil. Jadi, model mendapatkan Ypred, yang
kemudian dibandingkan dengan Yact, kemudian dihitung nilai errornya. Beberapa
tehnik perhitungan nilai errornya dapat dilihat di poin 2.7 Persentase Kesalahan.
28
Menurut Wei (2006) Time Series adalah urutan pengamatan yang terjadi secara
berurutan berdasarkan indeks waktu dengan interval waktu yang sama dan interval
waktu tetap yang mengumpulkan data dari sumbernya. Karena setiap pengamatan
adalah urutan pengamatan dan dinyatakan sebagai variabel acak Zt yang diperoleh
dari indeks waktu tertentu (ti) sebagai urutan waktu pengamatan, sehingga
penulisan data time series adalah 𝑍𝑡1 , 𝑍𝑡2 , …, 𝑍𝑡𝑛 . Terdapat langkah-langkah
prosedural yang perlu diperhatikan saat melakukan metode runtun waktu ARIMA
Box-Jenkins. Yaitu, identifikasi model ad hoc, estimasi parameter (estimasi),
pengujian dan prediksi residu model.
2.6.1 Kestasioneran Data dalam Time Series
Stasioneritas time series ialah kondisi bahwa proses generatif yang
mendasari deret waktu didasarkan pada mean konstan dan varians konstan
(Makridakis et al., 1997). Suatu data tersebut kemungkinan tidak stasioner.
Karena mean tidak konstan atau varians tidak konstan, Anda dapat menggunakan
metode diferensial atau perbedaan untuk membawa data lebih dekat ke normal
untuk menghilangkan anomali tentang mean (Makridakis et al., 1997).
∇𝑑 𝑍𝑡 == (1 − 𝐵)𝑑 𝑍𝑡 (2.08)
Jika data tidak normal dalam varians, dapat distabilkan menggunakan
transformasi Box-Cox, yang dapat dirumuskan sebagai berikut (Wei, 2006):
𝑍𝑡𝜆 − 1 (2.09)
𝑇(𝑍𝑡 ) = ,𝜆 ≠ 0
𝜆
𝑍𝑡𝜆 −1
lim 𝑇(𝑍𝑡 ) = lim = ln(𝑍𝑡 ), 𝜆 = 0
𝜆 →0 𝜆 →0 𝜆
29
(2.10)
Bentuk transformasi Box-Cox dengan nilai λ yang sesuai disajiditunjukkan
pada Tabel 2.2.
Tabel 2.4 Nilai 𝜆 pada Transformasi Box-Cox

Nilai Estimasi 𝝀 Transformasi
1
-1,0
𝑍𝑡
1
-0,5
𝑍𝑡
0,0 ln 𝑍𝑡
0,5 √𝑍𝑡
1 𝑍𝑡 (𝑡𝑖𝑑𝑎𝑘 𝑎𝑑𝑎 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑠𝑖)
(Sumber: Wei, 2006)
2.6.2 Autocorrelation Function (ACF)
Autocorrelation function (ACF) adalah fungsi yang disebut autokorelasi
pada lag ke-k yang menunjukkan korelasi antara 𝑍𝑡 dan 𝑍𝑡+𝑘 biasanya
dilambangkan sebagai 𝜌̂𝑘 . Secara khusus, 𝜌̂𝑘 didefinisikan sebagai berikut:
𝛾̂𝑘 ∑𝑛−𝑘 ̅ ̅
𝑡=1 ( 𝑍𝑡 − 𝑍)( 𝑍𝑡+𝑘 − 𝑍)
𝜌̂𝑘 = = , 𝑘 = 0, 1, 2, … (2.11)
𝛾̂0 ∑𝑡=1( 𝑍𝑡 − 𝑍̅)2
𝑛
𝑍
dimana 𝑍̅ = ∑𝑛𝑡=1 𝑛𝑡 yang merupakan nilai rata-rata data time series yang
digunakan (Wei, 2006). Standard error Autocorrelation Function (ACF) dapat
dihitung dengan persamaan (2.12).
(1 + 2 ∑𝑘−1
𝑚=1 𝜌
̂𝑚2
𝑆𝐸(𝜌̂𝑘 ) = √ (2.12)
𝑛
Dimana
𝑘 = lag j; k = 1, 2, 3, …
𝑛 = jumlah pengamatan
30
𝜌̂𝑚 = autocorrelation dari lag 𝑚, 𝑚 < 𝑘
Untuk mencari batas atas dan batas bawah dari autocorrelation function
(ACF) dapat dihitung dengan persamaan (2.13) dan (2.14).
Batas Atas pada Lag 𝑘 = 𝑡𝑛−𝑘−1;0,975 × 𝑆𝐸(𝜌̂𝑘 ) (2.13)
Batas Bawah pada Lag 𝑘 = 𝑡𝑛−𝑘−1;0,025 × 𝑆𝐸(𝜌̂𝑘 ) (2.14)
2.6.3 Partial Autocorrelation Function (PACF)
Partial autocorrelation function (PACF) digunakan untuk mengetahui
korelasi antara 𝑍𝑡 dan 𝑍𝑡+𝑘 setelah pengaruh dari pengaruh linier 𝑍𝑡+1, 𝑍𝑡+2,….,
𝑍𝑡+𝑘−1 dihilangkan. Nilai PACF disimbolkan dengan ∅11 = 𝜌1 dan nilai ∅𝑘𝑘 dapat
dihitung dengan persamaan (2.15).
𝜌̂𝑘 − ∑𝑘−1 ̂
𝑗=1 ∅𝑘−1 𝜌
̂𝑘−𝑗
̂ 𝑘𝑘 =
∅ (2.15)
1 − ∑𝑘−1 ̂
𝑗=1 ∅𝑘−1 𝜌
̂𝑗
Keterangan:
̂ 𝑘𝑘 = fungsi autokorelasi parsial
∅
𝜌̂𝑘 = fungsi autokorelasi
dan standard error partial autocorrelation function (PACF) dapat dihitung
dengan persamaan (2.16).
1
̂ 𝑘𝑘 ) = √
𝑆𝐸(∅ (2.16)
𝑛
Untuk mencari batas signifikan dari partial autocorrelation function (PACF)
dapat dihitung dengan persamaan (2.17).
(2.17)
31
̂ 𝑘𝑘 )
Batas Signifikan = ± 𝑡𝑛−1;0,975 × 𝑆𝐸(∅
Gambar 2.1 Fungsi autokorelasi suatu data 𝑍𝑡
2.7 Persentase Kesalahan
Pengukuran ketepatan peramalan dapat diukur dengan beberapa indikator
kesalahan peramalan, yaitu:
2.7.1 Rata-rata Kesalahan (average/mean error)
Kesalahan atau error mewakili perbedaan besar antara nilai aktual dan
prediksi, 𝑒𝑡 = 𝑋𝑡 − 𝐹𝑡 . Maka nilai kesalahannya bisa positif atau negatif.
Bernilai negatif jika nilai prediksi melebihi nilai sebenarnya, dan positif jika nilai
prediksi lebih kecil dari nilai sebenarnya. Kesalahan rata-rata (ME) dapat
dinyatakan dengan persamaan:

𝑛
𝑀𝐸 = ∑ 𝑒𝑖 (2.18)
𝑖=1
Namun mean error sulit untuk menentukan kesalahan error secara
keseluruhan karena jumlah nilai positif dan negatif saling melemahkan dan
kesalahan menjadi lebih besar.

32
2.7.2 Mean Absolute Deviation (MAD)
Tidak seperti Mean Error, pada Mean Absolute Deviation mengubah nilai
kesalahan prediksi dengan nilai sebenarnya menjadi nilai absolut positif. Ini untuk
menentukan apakah ada nilai positif dan negatif yang saling melemahkan, atau
menambahkan kesalahan komputasi ke penjumlahan untuk menentukan seberapa
besar penyimpangan dari hasil prediksi. Persamaan MAD ditulis sebagai:
∑𝑛𝑖=1 |𝑒𝑖 | (2.19)

𝑀𝐸 =
𝑛
2.7.3 Mean Squared Error (MSE)
Mean Squared Error (MSE) merupakan adalah perhitungan kuadrat dari
setiap perhitungan. Perbedaan dengan Mean Absolute Deviation (MAD) adalah
bahwa MSE mengevaluasi kesalahan untuk penyimpangan yang lebih ekstrim
daripada MAD. Misalnya, perhitungan MAD untuk nilai kesalahan 2 hanya
menghitung dua kali kesalahan nilai 1, sedangkan MSE dihitung sebagai kuadrat
dari nilai 2. Artinya, kesalahan dihitung sebagai 4 kali kesalahan nilai 1.
Menerapkan kriteria nilai MSE berarti jika satu penyimpangan digunakan,
penyimpangan akan lebih besar dari nilai prediksi.
∑𝑛𝑖=1 𝑒𝑖 2 (2.20)
𝑀𝑆𝐸 =
𝑛
2.7.4 Standard Deviation of Errors (SDE)
√∑𝑛𝑖=1 𝑒𝑖 2 (2.21)
𝑆𝐷𝐸 =
𝑛−1
2.7.5 Percentage Error (PE)
Percentage Error adalah persentase kesalahan antara hasil perhitungan nilai

33
prediksi dan nilai sebenarnya.
𝑋𝑡 − 𝐹𝑡
𝑃𝐸 = 100 (2.22)
𝑋𝑡
2.7.6 Mean Percentage Error (MPE) dan Mean Absolute Percentage Error
(MAPE)
MPE adalah rata-rata dari persentase nilai kesalahan (selisih antara nilai
aktual dan prediksi) dari semua pengamatan. Sementara MAPE juga merupakan
nilai kesalahan rata-rata, ia memberikan nilai absolut dari perbedaan antara nilai
aktual dan prediksi. MAPE adalah metrik yang sering digunakan untuk
menunjukkan kinerja atau akurasi dalam hasil dari suatu proses peramalan.
∑𝑛𝑖=1 𝑃𝐸𝑡 (2.23)

𝑀𝑃𝐸 =
𝑛
∑𝑛𝑖=1 |𝑃𝐸𝑡 | (2.24)

𝑀𝐴𝑃𝐸 =
𝑛
Keterangan:
𝑋𝑡 = nilai aktual pada waktu t
𝐹𝑡 = nilai peramalan pada waktu t
𝑒 = error atau kesalahan (selisih dari 𝑋𝑡 − 𝐹𝑡 )
𝑛 = banyaknya jumlah observasi
BAB 3
METODOLOGI PENELITIAN
3.1. Tahapan Penelitian
Penelitian ini terdiri dari beberapa tahapan. Tahapan-tahapan ini dilakukan
secara berurut disusun secara sistematis dengan tujuan memperoleh keterhubungan
antara data dan informasi yang diperoleh dengan hasil yang ingin didapat. Untuk
tahapan pengerjaan penelitian ini dapat dilihat pada diagram alir seperti yang
ditunjukan Gambar 3.1 berikut ini.
Gambar 3.1 Flowchart Pelaksanaan Penelitian
34
35
3.2. Deskripsi Tahapan Peneltian
3.2.1 Identifikasi dan Perumusan Masalah
Pada tahap ini, bagian latar belakang menggambarkan identifikasi dan
perumusan masalah yang menjadi fokus penelitian ini. Identifikasi masalah yang
ada dalam studi kasus dan temuan solusi dari masalah yang ditemukan. Hasil
identifikasi masalah dan usulan solusi akan diangkat sebagai topik penelitian dalam
penelitian ini..
3.2.2 Studi Literatur
Langkah selanjutnya adalah merangkum penggunaan teori dasar, referensi
kerja dan metode prediktif, serta melakukan tinjauan pustaka dengan tujuan
memperoleh informasi tambahan untuk mendukung pengerjaan tugas akhir ini.
Tahap pencarian literatur dimulai dengan mencari data dan informasi metode
prediksi ARIMA Box-Jenkins pada visualisasi dashboard, software Tableau,
prediksi, dan berbagai buku teks, jurnal dan artikel yang berkaitan dengan Demam
Berdarah Dengue, dengan hati-hati dalam penggunaan metode ini. Tinjauan pustaka
ini dapat ditemukan di bagian tinjauan pustaka dari dua bab sebelumnya. Beberapa
informasi tambahan tentang pekerjaan proyek kelulusan ini juga tersedia di artikel,
buku teks, dan situs web.
Tabel 3.1 Informasi Pendukung Studi Literatur
No. Penulis Judul

Bowerman, B. L., &
Forecasting and Time Series: an
1. O'Connell, R. T.
Applied Approach. 3rd.
(1993)
36
A Review of Dashboards In
Yigitbasioglu, O. M., Performance Management:
2.
& Velcu, O. (2012) Implications For Design And
Research.
3. Taylor, J. W. (2009) Sains Manajemen (8 ed.)
Razak, F. A., Shitan,
Load Forecasting Using Time
4. M., Hashim, A. H., &
Series Models
Abidin, I. Z. (2009)
Time series analysis. In The
5. Wei, W. W. (2006) Oxford Handbook of Quantitative
Methods in Psychology: Vol. 2.
Muhammad Bintang Aplikasi Metode ARIMA Box-
6. Pamungkas dan Arief Jenkins untuk Meramalkan Kasus
Wibowo DBD di Provinsi Jawa Timur
3.2.3 Pengumpulan Data
Pada langkah ini, penulis memilih data untuk digunakan dalam penelitian
ini. Data yang digunakan adalah data jumlah penderita DBD di setiap wilayah DKI
Jakarta antara lain Jakarta Pusat, Jakarta Barat, Jakarta Timur, Jakarta Selatan,
Jakarta Utara, dan Pulau Seribu yang diperoleh dari data.jakarta.go.id. Situs web.
Data dalam format Excel (xls) dengan variabel bulan, wilayah Jakarta, jumlah
penderita DBD. Periode data adalah dari Januari 2015 hingga Desember 2020.
3.2.4 Pembuatan Excel
Setelah data dikumpulkan selanjutnya data disatukan kedalam satu file excel
yang berisikan data penderita demam berdarah setiap daerah di DKI Jakarta,
kemudian dibagi menjadi dua yakni data training dan data testing. Data training
digunakan dalam proses pembentukan arsitektur terbaik dalam proses pelatihan,

37
sedangkan data testing digunakan dalam pengujian keakuratan dari arsitektur yang
telah terbentuk. Pemilihan ukuran data training dan testing dilakukan menggunakan
data 75% training dan 25% testing. Data dari Januari 2015 - September 2019 akan
dijadikan sebagai data training sedangkan data dari Oktober 2019 - Desember 2020
akan digunakan sebagai data testing.
3.2.5 Pemodelan ARIMA
ARIMA merupakan suatu model yang cocok digunakan untuk meramal
sejumlah variabel secara cepat, sederhana, dan akurat karena hanya membutuhkan
1 data variabel yang akan diramal. Dan data yang digunakan untuk pemodelan
ARIMA yaitu data yang memiliki satu variabel (univariate) deret waktu. Karna
pada data Kasus DBD DKI Jakarta hanya terdapat 1 variabel saja yaitu Jumlah
Kasusnya maka saya memilih metode ARIMA ini yg cocok untuk dilakukan
peramalan.
Berikut adalah tahapan-tahapan untuk melakukan pemodelan ARIMA:
1) Buat plot deret waktu untuk menentukan normalitas data. Jika data tetap
pada varians dan mean, tidak perlu ditransformasi (varians tidak stationer)
dan dapat didiferensiasikan (mean tidak stasioner).
2) Jika data stasioner dalam hal mean dan varians, langkah selanjutnya adalah
menghasilkan plot ACF dan PACF dari data normal untuk memperkirakan
model ARIMA awal yang sesuai..
3) Pentingnya Uji parameter model. Lanjutkan pengujian asumsi model
lainnya jika itu penting. Jika tidak kritis, fase pengujian dihentikan dan
estimasi model awal dikembalikan.

38
4) Apabila parameter model sudah signifikan, maka langkah selanjutnya yaitu
melakukan pemeriksaan diagnostik (Diagnostic Checking). Untuk
memeriksa apakah residual memenuhi asumsi white noise, uji LjungBox-
Pierce (LBQ) dilakukan, dan asumsi sisanya terdistribusi normal. Jika
residual memenuhi asumsi white noise dan mengikuti distribusi normal,
maka model dapat digunakan.
3.2.1 Peramalan Kasus DBD DKI Jakarta
Peramalan dilakukan untuk mengetahui perkiraan jumlah kasus penderita
Demam Berdarah Dengue di DKI Jakarta pada periode selanjutnya. Peramalan
dengan menggunakan analisis runtun waktu memerlukan data historis minimal 50
data runtun waktu (Soejoet, 1987). Pada pembahasan ini, data yang digunakan
sebanyak 72 data. Data tersebut diramalkan dengan menggunakan analisis runtun
waktu menggunakan model terbaik yang sudah di tentukan pada proses pemodelan
ARIMA.
3.2.6 Pembuatan Visualisasi Dashboard
Pada langkah ini penulis akan menggunakan aplikasi Tableau untuk
memvisualisasikan hasil ramalan dalam bentuk dashboard. Berikut langkah-
langkah yang dilakukan:
1) Koneksi ke file excel
Untuk mengambil data dari hasil ramalan, Anda harus menyambungkan
Tableau ke file Excel yang berisi hasil ramalan yang sebelumnya dijalankan
menggunakan metode ARIMA.
2) Pemilihan data dan visualisasi

39
Setelah menautkan ke file Excel, langkah selanjutnya adalah memilih data
yang akan ditampilkan dan visualisasi yang sesuai agar mudah memahami
dan menganalisis data perkiraan.
3) Pengaturan tata letak
Setelah pemilihan dan visualisasi data selesai, langkah selanjutnya adalah
menata tata letak visualisasi data yang ditampilkan untuk memudahkan
dalam menganalisis hasil prediksi.
3.3 Waktu Penelitian
Penelitian ini dilaksanakan mulai bulan Desember 2021 hingga bulan Juni
2022. Penelitian dilakukan dengan menempuh tahapan penelitian seperti
identifikasi dan perumusan masalah, studi literatur, metodologi penelitian, dan
analisis hasil penelitian. Secara spesifik tahapan penelitian yang dilakukan
digambarkan dalam diagram berikut ini:
Tabel 3.2 Waktu Proses Penelitian
Desember Januari Februari Maret April Mei

2021 2022 2022 2022 2022 2022
Identifikasi dan
Perumusan Masalah
Studi Literatur
Metodologi Penelitian
Analisis Hasil
Penelitian
BAB 4
HASIL DAN PEMBAHASAN
Pada bab ini dilakukan proses dalam meramalkan jumlah kasus pasien demam
berdarah di DKI Jakarta untuk periode tahun 2021 (12 bulan ke depan) dengan
menggunakan metode analisis runtun waktu ARIMA.
4.1 Persiapan Data
Peramalan dengan menggunakan analisis runtun waktu memerlukan data
historis minimal 50 data runtun waktu (Soejoet, 1987). Data yang dianalisis adalah
data jumlah kasus penderita DBD di DKI Jakarta sebanyak 60 data runtun waktu
dari tahun 2015 hingga tahun 2020, disajikan pada tabel 4.1.
Tabel 4.1 Data Jumlah Kasus DBD di DKI Jakarta Periode 2015 – 2020
DKI Jakarta
Jumlah Kasus
Bulan
2015 2016 2017 2018 2019 2020
Januari 883 2020 759 3.162 2.687 275
Februari 1164 4003 410 4.035 3.209 628
Maret 1619 5807 537 5.644 4.048 1.310
April 2152 7295 504 4.652 3.207 1.028
Mei 1849 4303 430 4.034 2.821 717
Juni 1288 3142 210 2.356 1.700 350
Juli 760 2274 178 1.180 794 140
Agustus 432 2461 142 622 370 75
September 442 2052 95 407 244 50
Oktober 443 2100 256 371 225 36
November 392 2272 241 440 275 59
Desember 535 1860 205 578 351 60
Data jumlah kasus di atas sudah memenuhi untuk dilakukukannya peramalan
analisis dengan runtun waktu, karena jumlah data sudah lebih dari 50 data yaitu 7
40
41
data. Analisis tersebut meliputi empat kegiatan pokok yakni:
1) Identifikasi, memilih model yang tepat, yaitu rangkaian pengamatan yang
dapat mewakili identifikasi. Identifikasi model dapat dilakukan dengan
memplot time series dan menganalisis ACF (Autocorrelation Function) dan
PACF (Partial Autocorrelation Function).
2) Estimasi Parameter Model, yaitu melihat model ARIMA pada output program
Minitab dan menentukan nilai parameter yang ada.
3) Verifikasi, yaitu Verifikasi bahwa model yang diestimasi sangat cocok dengan
data yang dimilikinya. Jika ada penyimpangan yang signifikan, perkirakan dan
validasi dengan membuat model baru dan kemudian memeriksa kesalahan
kuadrat rata-rata minimum (MSE).
4) Peramalan, dilakukan untuk mengetahui perkiraan jumlah kasus demam
berdarah dengue di DKI Jakarta. Peramalan dengan menggunakan analisis time
series membutuhkan data historis dari minimal 50 data time series (Soejoet,
1987). Data yang digunakan dalam pembahasan ini adalah 72 data.
4.2 Tahap Identifikasi
Langkah ini melibatkan identifikasi data untuk data stasioner. Syarat untuk
mengatakan data stationer adalah jika data stationer untuk mean dan varians.
Langkah-langkah berikut menjelaskan cara kerja MiniTab.
4.2.1 Plot Data
Tahap identifikasi dimulai dengan memplot data untuk menentukan tren data,
terlepas dari apakah data tersebut musiman atau non-musiman. Plot data tersebut
42
berdasarkan data jumlah penderita DBD di DKI Jakarta dari tahun 2015 hingga
2020, lebih jelasnya dapat dilihat pada data jumlah kasus DBD pada Tabel 4.1
diatas. Berikut hasil plot data dapat dilihat pada Gambar 4.1 di bawah ini.
Time Series Plot of Kasus DBD DKI Jakarta 2015-2020

8000
7000
6000
5000
Kasus
4000
3000
2000
1000
Month Jan Jan Jan Jan Jan Jan

Year 2015 2016 2017 2018 2019 2020
Gambar 4.1 Plot Data Kasus DBD DKI Jakarta Periode 2015 - 2020
Gambar 4.1 menunjukkan bahwa data kasus DBD merupakan karakteristik dari
data musiman. Plot data menunjukkan efek musiman yang direpresentasikan
sebagai pola peningkatan yang sangat berulang selama periode waktu tertentu.
Prediksi data kasus DBD DKI Jakarta menggunakan pemodelan ARIMA musiman.
Berdasarkan grafik pada Gambar 4.1, jumlah kasus meningkat dari tahun 2015 ke
tahun 2016, menurun pada tahun 2017, meningkat lagi pada tahun 2018 dan
menurun menjadi tahun 2019 dan 2020. Metode ARIMA musiman sesuai karena
datanya mengandung pola musiman. Setelah mengidentifikasi pola dalam data, data
harus diuji stasioneritas terhadap varians dan mean.
4.2.2 Transformasi Data
Seperti yang saya sebutkan sebelumnya, kondisi normalitas data adalah normal
untuk varians dan mean. Plot box-cox dimaksudkan untuk menentukan normalitas
43
data dalam varians. Data dikatakan normal untuk varians jika melihat nilai rounded
value atau lambda (λ) sebesar 1. Pada output didapatkan nilai yang dibulatkan
sebesar 0,00 sehingga data kasus DBD tidak statis pada varian. Berikut tampilan
output Box-cox sebelum dikonversi dengan MiniTab pada Gambar 4.2.
Gambar 4.2 Box-cox plot data sebelum transformasi
Karena data kasus tidak statis dengan varians, kita perlu melakukan beberapa
transformasi data. Diberi nama Trans1, keluaran transformasi data satu kasus DBD
pada Gambar 4.3 rounded value 1,00. Hal ini menunjukkan bahwa data kasus DBD
stationer dalam varian.
Gambar 4.3 Box-cox plot data setelah transformasi pertama

44
4.2.3 Plot ACF dan PACF
Telah dinyatakan sebelumnya, syarat stasioneritas data adalah stasioner
terhadap varians dan mean. Syarat stasioner data terhadap mean dilakukan dengan
membuat plot Autocorrelation Function (ACF). Berikut hasil plot ACF pada
Gambar 4.4 berikut ini.
Autocorrelation Function for Trans1

(with 5% significance limits for the autocorrelations)
1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Gambar 4.4 Grafik Autocorrelation Function data hasil transformasi pertama
Frafik ACF dimaksudkan untuk menentukan stationer data dalam mean.
Berdasarkan Gambar 4.4, kami menunjukkan plot yang menurun mendekati nol.
Artinya data tersebut tidak stationer (Cynthia, Sugiman, and Mastur 2015). Dari
plot dapat dilihat bahwa terdapat dua delay berturut-turut yang berada di luar batas
signifikan, maka dapat dikatakan bahwa data kasus DBD tidak stationer pada mean,
sehingga harus dilakukan differencing data.

45
Gambar 4.5 Grafik Trend Analisis data hasil transformasi pertama
Berdasarkan Gambar 4.5 grafik trend analisis data di atas dapat diketahui
bahwa data kasus DBD mengalami kenaikan dan penurunan seiring bertambahnya
waktu dan nilai aktualnya masih jauh dari garis linear, sehingga trend ini termasuk
time series yang tidak stasioner dalam rata-rata.
Proses differencing dilakukan dengan cara mengurangi nilai data pada suatu
periode dengan nilai data pada periode sebelumnya untuk menghitung nilai
selisihnya. Jika dilakukan proses difference 1 kali maka nilai d adalah 1 pada model.
Autocorrelation Function for C5

1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Gambar 4.6 Grafik Autocorrelation Function Data Hasil Differencing

46
Gambar 4.6 menunjukkan plot ACF data kasus DBD setelah dilakukan proses
difference 1 kali. Plot ACF menunjukkan plot masih belum stasioner karena plot
bergerak masih mendekati nol dan juga grafik ACF masih terlihat turun lambat.
Partial Autocorrelation Function for C5

(with 5% significance limits for the partial autocorrelations)
1,0
0,8
0,6
Partial Autocorrelation
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Gambar 4.7 Grafik Partial Autocorrelation Function Data Hasil Differencing
Pada Gambar 4.6 dan Gambar 4.7, juga menunjukkan bahwa grafiknya
mengandung pola musiman dengan melakukan pengulangan pola dalam kurun 4
lag, atau mengalami pengulangan selama 4 bulan sekali sehingga perlu juga
melakukan differencing musiman.
Gambar 4.8 Grafik Trend Analisis data hasil Differencing Pertama

47
Gambar 4.8 memperlihatkan Dari plot dan Trend analisis data differencing
pertama diatas dapat dilihat data belum stasioner, karena rata-rata jumlah produksi
bergerak bebas dalam suatu waktu tertentu. Berdasarkan Gambar 4.6 dan 4.7
terlihat bahwa ACF dan PACF tidak memperlihatkan hasil stasioner terhadap rata-
rata, maka selanjutnya dilakukan proses differencing kedua.
Gambar 4.9 Grafik Trend Analisis data hasil Differencing 2
Gambar 4.9 Grafik Trend Analisis Data hasil differencing dapat dilihat
data sudah stasioner, karena rata-rata tidak bergerak bebas dalam suatu waktu
tertentu dan nilai aktualnya sudah mendekati garis linear.

48
Autocorrelation Function for Diff 2

1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Gambar 4.10 Grafik Autocorrelation Function Data Hasil Differencing 2
Partial Autocorrelation Function for Diff 2

1,0
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Gambar 4.11 Grafik Partial Autocorrelation Function Data Hasil Differencing 2
Berdasarkan Gambar 4.10 dapat dilihat dari plot ACF bahwa nilai
autokorelasi pada Lag 1 berada di luar batas signifikan atau di luar garis putus-
putus, sedangkan Gambar 4.11 menunjukkan bahwa plot PACF nilai autokorelasi
parsial pada Lag 1 memiliki pengaruh yang signifikan batas, menunjukkan
keberangkatan. Keterbatasan. Plot ACF memiliki 1 lag di atas batas signifikan dan
plot PACF memiliki 1 lag di atas batas signifikan, menunjukkan bahwa terdapat
proses autoregressive (AR) orde 1 dan moving average (MA). ) Grade 1. Ketika
49
differencing dilakukan dua kali, ordenya adalah 2.
4.2.4 Identifikasi Model ARIMA
Pada Gambar 4.6 grafik ACF differencing pertama terlihat kenaikkan data
terjadi pada lag ke 5 dan lag 6 yaitu sekitar bulan Maret - April pada setiap tahunnya
akan berulang pada periode selanjutnya. Diperkuat pada Gambar 4.7 grafik PACF
pada differencing pertama juga terlihat lag 4 keluar dari garis batas atau mengalami
pengulangan selama 4 bulan sekali sehingga perlu juga melakukan differencing
musiman. Selanjutnya dilakukan differencing musiman dengan hasil sebagai
berikut.
Autocorrelation Function for Dif Seas(4)

1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16
Lag
Gambar 4.12 Grafik Autocorrelation Function (ACF) Data Hasil Differencing Musiman
50
Partial Autocorrelation Function for Dif Seas(4)

1,0
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16
Lag
Gambar 4.13 Grafik Partial Autocorrelation Function (PACF) Data Hasil Differencing Musiman
Identifikasi temporal model ARIMA musiman disebut ARIMA
(p,d,q)(P,D,Q)s. di mana (s) adalah tanda musiman. Pada langkah sebelumnya,
perlakuan differencing dilakukan dua kali, dan terjadi differencing lain yang
dijelaskan sebagai satu perbedaan musim.
Model ARIMA sementara yang terbentuk setelah selisih dibangkitkan adalah
ARIMA (p,1,q)(P,1,Q)4 . Proses selanjutnya adalah menentukan nilai pesanan
untuk autoregression (p) dan moving average (q) untuk non-musiman dan
autoregression (P) dan moving average (Q) untuk musiman.
Nilai orde dapat dilihat pada plot ACF (Gambar 4.10) dan plot PACF (Gambar
4.11). Plot ACF digunakan untuk membaca nilai moving average (q dan Q)
sedangkan plot PACF digunakan untuk membaca nilai autoregressive (p dan P).
Plot ACF pada Gambar 4.10 menunjukkan bahwa plot ACF terpotong pada lapisan
pertama, sehingga model awal diasumsikan sebagai MA(1). SMA(1) adalah untuk
model musiman, karena jeda musim memiliki batas di mana jeda berada pada 4.
51
Plot PACF pada Gambar 4.11 menunjukkan bahwa plot PACF terpotong pada
lapisan pertama sehingga model temporalnya adalah AR(1), sedangkan lag
musiman menunjukkan model temporal yang dihipotesiskan SAR ketika lapisan 4
dan 8 terpotong. (2). Maka hasil identifikasi menghasilkan dugaan model sementara
yaitu ARIMA (1,1,1)(2,1,1)4. Dari model sementara tersebut dapat menghasilkan
12 model dugaan yang akan di uji signifikansinya, diantaranya:
1) ARIMA(1,2,1)(2,1,1)4
2) ARIMA(1,2,1)(2,1,0)4
3) ARIMA(1,2,1)(1,1,1)4
4) ARIMA(1,2,1)(1,1,0)4
5) ARIMA(1,2,0)(2,1,1)4
6) ARIMA(1,2,0)(2,1,0)4
7) ARIMA(1,2,0)(1,1,1)4
8) ARIMA(1,2,0)(1,1,0)4
9) ARIMA(0,2,1)(2,1,1)4
10) ARIMA(0,2,1)(2,1,0)4
11) ARIMA(0,2,1)(1,1,1)4
12) ARIMA(0,2,1)(1,1,0)4
52
4.3 Estimasi Parameter dan Uji Signifikansi
Tahap estimasi digunakan untuk memperoleh estimasi koefisien-koefisien dan
model yang telah di peroleh, dilakukan uji signifikansi parameter dimana model
dengan P-value < 0,005 akan dipilih sebagai bentuk model terbaik yang nantinya
akan digunakan dalam menggambarkan data Kasus DBD DKI Jakarta.
Tabel 4.2 Estimasi Model ARIMA musiman data Kasus DBD DKI Jakarta
No. Estimasi Model Parameter P-Value

AR 1 0
SAR 4 0,024
1 ARIMA(1,2,1)(2,1,1)4 SAR 8 0,127
MA 1 0,008
SMA 4 0
AR 1 0,006
SAR 4 0
2 ARIMA(1,2,1)(2,1,0) 4
SAR 8 0
MA 1 0,169
AR 1 0
SAR 4 0,13
3 ARIMA(1,2,1)(1,1,1)4
MA 1 0,068
SMA 4 0
AR 1 0,169
4 ARIMA(1,2,1)(1,1,0)4 SAR 4 0
MA 1 0,463
AR 1 0,004
SAR 4 0,002
5 ARIMA(1,2,0)(2,1,1)4
SAR 8 0,016
SMA 4 0,092
AR 1 0,008
6 ARIMA(1,2,0)(2,1,0)4 SAR 4 0
SAR 8 0
AR 1 0,002
7 ARIMA(1,2,0)(1,1,1)4 SAR 4 0,159
SMA 4 0
AR 1 0,068
8 ARIMA(1,2,0)(1,1,0)4
SAR 4 0
52
SAR 4 0,001
SAR 8 0,009
9 ARIMA(0,2,1)(2,1,1)4
MA 1 0
SMA 4 0,015
SAR 4 0
10 ARIMA(0,2,1)(2,1,0)4 SAR 8 0
MA 1 0
SAR 4 0,079
11 ARIMA(0,2,1)(1,1,1)4 MA 1 0
SMA 4 0
SAR 4 0
12 ARIMA(0,2,1)(1,1,0)4
MA 1 0,069
Untuk estimasi model ini, didapat 3 model sementara yaitu model
ARIMA(1,2,0)(2,1,0)4, ARIMA(0,2,1)(2,1,1)4, dan ARIMA(0,2,1)(2,1,0)4 yang
selanjutnya dilakukan pengujian kelayakan model (Diagnosting Cheking) dengan
membandingkan asumsi keberatian koefisien, asumsi white noise, dan nilai MSE.
Model ARIMA musiman yang baik adalah model yang memiliki nilai MSE
terkecil, yang bersifat white noise dan berdistribusi normal.
4.4 Verifikasi Model
Berdasarkan dari hasil estimasi dan uji signifikansi parameter, maka model
yang siginifikan adalah ARIMA(1,2,0)(2,1,0)4, ARIMA(0,2,1)(2,1,1)4, dan
ARIMA(0,2,1)(2,1,0)4 sehingga model tersebut yang dimasukkan ke dalam
kemungkinan model terbaik. Selanjutnya akan dilihat nilai MSE dari model
tersebut. Adapun MSE dari model yang signifikan adalah sebagai berikut.
Tabel 4.3 Nilai MSE Model ARIMA musiman data Kasus DBD DKI Jakarta
No. Estimasi Model MSE

6 ARIMA(1,2,0)(2,1,0)4 992750
9 ARIMA(0,2,1)(2,1,1)4 970756
10 ARIMA(0,2,1)(2,1,0)4 980342
Berdasarkan Tabel 4.3, model terbaik memiliki nilai MSE terkecil. MSE
terkecil dimiliki oleh ARIMA(0,2,1)(2,1,1)4 dengan nilai MSE sebesar 970756.
Kemudian lihat p-value untuk menentukan apakah residual dalam model adalah
white noise atau random. dan Yongvox. Dalam uji Ljung-Box, model
ARIMA(0,2,1)(2,1,1)4 memenuhi asumsi white noise, yaitu sisa-sisanya saling
bebas atau berdistribusi acak. Model fit juga diuji untuk normalitas residual.
Hasil uji Ljung-Box menunjukkan pada Gambar 4.14 bahwa model
ARIMA(0,2,1)(2,1,1)4 memiliki p-value < alpha 5%. ARIMA(0,2,1)(2,1,1)4 dapat
disimpulkan bahwa autokorelasi residual signifikan atau korelasi antara residual
tidak acak. Oleh karena itu, model terbaik untuk kasus DBD DKI Jakarta adalah
model ARIMA (0.2.1)(2,1,1)4.
Gambar 4.14 Output Normal Probability Plot Residual
4.4 Peramalan Kasus DBD DKI Jakarta
Diketahui nilai peramalan data Kasus DBD DKI jakarta periode 2015 - 2020
menggunakan model yang dipilih yaitu ARIMA(0,2,1)(2,1,1)4.
Tabel 4.4 Data hasil Peramalan Kasus DBD DKI Jakarta Periode 2021
95% Limits
Prediksi (Hasil
Periode 2021 Prediksi
Pembulatan)
Januari 90,099 90
Februari 185,881 186
Maret 528,689 529
April 393,735 394
Mei 310,817 311
Juni 229,143 229
Juli 307,815 308
Agustus 267,871 268
September 268,036 268
Oktober 286,386 286
November 432,095 432
Desember 415,709 416
4.5 Visualisasi Dashboard
Berikut adalah rancangan dashboard yang dibuat menggunakan aplikasi
Tableau yang ditunjukkan pada Gambar 4.15.

Gambar 4.15 Rancangan Dashboard Kasus DBD DKI Jakarta di Tableau
Dashboard yang dirancang digunakan untuk memvisualisasikan data
dengan beberapa informasi: pasien demam berdarah (2015-2020), pemilihan tahun
dan bulan, perkiraan pasien demam berdarah untuk tahun depan (2021) dan data
cabang regional DKI Jakarta. Desain dashboard yang dibuat memiliki menu yang
berbeda dan visualisasi yang berbeda untuk membantu menganalisis data yang
digunakan. Berikut adalah menu dan visualisasi yang digunakan dalam desain
dashboard yang dihasilkan.
4.5.1 Filter Daerah Jakarta
Berikut merupakan pilihan daerah yang ada di DKI Jakarta dengan sebanyak 6
daerah bagian yaitu Jakarta Barat, Jakarta Timur, Jakarta Selatan, Jakarta Selatan,
Jakarta Pusat, dan Kepulauan Seribu. Pilihan daerah yang ditampilkan dengan
menggunakan visualisasi filter yang ditunjukkan pada Gambar 4.16.

Gambar 4.16 Filter Daerah Jakarta
Pada filter daerah Jakarta tersebut dapat dipilih salah satu ataupun semua untuk
menampilkan data aktual, data prediksi dan lokasi dari puskesmas yang dipilih
tersebut.
4.5.2 Filter Bulan dan Tahun
Menu Filter Tahun digunakan sebagai filter agar dapat fokus menunjukkan
bulan dan tahun mana yang ingin kita lihat jumlah penderita Demam Berdarahnya.
Visualisasi pemilihan bulan dan tahun dapat dilihat pada Gambar 4.17.
Gambar 4.17 Filter Tahun
Pilihan tahun akan memengaruhi data mana yang ditampilkan untuk data
aktual dan perkiraan. Menu pemilihan bulan dan tahun memungkinkan kita
memilih bulan dan tahun di mana data aktual ditampilkan.
4.5.3 Data Aktual Kasus DBD
Jumlah penderita Demam Berdarah ditampilkan untuk menampilkan jumlah
persebaran demam berdarah di setiap daerah DKI Jakarta. Kita dapat lebih
mempersempit tampilan dengan mengatur bulan dan tahun untuk menampilkan
enam wilayah. Sebuah visualisasi data pasien demam berdarah ditunjukkan pada
gambar berikut.
Gambar 4.18 Persentase Kasus DBD DKI Jakarta Per Daerah
Pada Gambar 4.18 kita dapat membaca hasil persentase jumlah kasus DBD
untuk setiap daerahnya. Persentase tersebut dapat berubah tergantung kita memilih
filter yang akan kita pilih.

Gambar 4.19 Grafik Perbandingan Jumlah Kasus Antar Daerah Setiap Tahun
Pada Gambar 4.19 menunjukkan bahwa kasus yang paling banyak yaitu
daerah Jakarta Barat, sedangkan Kasus yang paling sedikit yaitu daerah Kepulauan
Seribu.
Gambar 4.20 Grafik Jumlah Kasus Per Tahun Berdasarkan Bulan
Pada Gambar 4.20 Grafik menunjukkan jumlah kasus per tahun berdasarkan
bulan, dimana pada grafik tersebut terlihat pada tahun 2016 terjadinya kenaikan
kasus demam berdarah. Dan pada bulan Maret dan April selalu mengalami
peningkatan jumlah kasus demam berdarah.

4.5.4 Visualisasi Data Prediksi
Seperti terlihat pada Gambar 4.21, visualisasi digunakan untuk
menunjukkan jumlah penderita DBD pada tahun mendatang (2021)..
Gambar 4.21 Visualisasi Hasil Prediksi
Tampilan data peramalan dapat dilihat secara detail dengan memilih bulan
yang diinginkan untuk melihat data peramalan. Kita dapat melihat prakiraan pasien
dalam bentuk angka untuk melihat jumlah prakiraan pasien demam berdarah pada
tahun 2021.
BAB 5
KESIMPULAN DAN SARAN
Bab ini menyajikan kesimpulan dari semua proses yang telah dilakukan dan
saran yang dapat diberikan untuk pengembangan yang lebih baik.
5.1 Kesimpulan
Berdasarkan hasil penelitian pada penelitian ini, maka didapatkan kesimpulan
sebagai berikut:
1. Didapatkan model terbaik peramalan kasus DBD DKI Jakarta dengan
menggunakan metode ARIMA musiman untuk periode peramalan dari
Januari 2021 hingga Desember 2021 yaitu model ARIMA(0,2,1)(2,1,1)4
dengan nilai MSE 970756.
2. Dari model terbaik yang sudah didapatkan hasil peramalan Kasus DBD DKI
Jakarta bulan Januari 2021 sampai Desember 2021 berturut-turut di bulan
Januari sebanyak 90 kasus, Februari sebanyak 186 kasus, Maret sebanyak
529 kasus, April sebanyak 394 kasus, Mei sebanyak 311 kasus, Juni
sebanyak 229 kasus, Juli sebanyak 308 kasus, Agustus sebanyak 268 kasus,
September sebanyak 268 kasus, Oktober sebanyak 286 kasus, November
sebanyak 432 kasus, dan Desember sebanyak 416 kasus.
3. Hasil visualisasi dasboard dirancang untuk memvisualisasikan data nyata
dengan beberapa informasi: penderita kasus demam berdarah (2015-2020),
pemilihan tahun dan bulan, prakiraan penderita demam berdarah tahun
depan (2021) untuk wilayah tersebut. Sebuah divisi dari DKI Jakarta.. Dari
61
62
4. rancangan dashboard yang telah dibuat, terdapat beberapa menu dan
visualisasi yang beragam yang berguna untuk membantu dalam
menganalisa dari data yang digunakan.
5.2 Saran
1. Perlu diadakan penelitian lebih lanjut mengenai data kasus DBD DKI
Jakarta ini dengan berbagai model statistik selain ARIMA agar dapat
dibandingkan keakuratannya.
2. Perlu dilakukan penelitian lebih lanjut mengenai faktor-faktor yang
mempengaruhi jumlah kasus DBD di DKI Jakarta khususnya untuk faktor
hujan dan faktor kelembaban.
3. Pemodelan dilakukan dengan data yang lebih banyak yaitu mencakup
jangka waktu yang panjang.

DAFTAR PUSTAKA
A. I. Widyatami, & Suryawan, D. A. (2021). Pengelompokan Daerah Rawan Demam
Berdarah Dengue di Provinsi DKI Jakarta. Indonesian of Health Information
Management Journal, 9, no. 1, 73-82.
Agustinawati, P. (2015). Perancangan Aplikasi Peramalan Jumlah Calon Mahasiswa Baru
Yang Mendaftar Menggunakan Metode Single Exponential Smothing. Jurnal Riset
Komputer (JURIKOM), Vol. 2, No. 6.
Badi’ah, R., & Handayani, W. (2020). Analisis Peramalan Permintaan Produk Garam
Konsumsi Beryodium Pada UD Garam Samudra. Journal of Economics
Development Issues, 3(2), 309-323.
Bowerman, B. L., & O'Connell, R. T. (1993). Forecasting and Time Series: an Applied
Approach. 3rd.
Budhiman, A. (2015). Analisis Time Series Jumlah Keberangkatan Penumpang
Penerbangan Domestik di Bandara Internasional Soekarno Hatta dengan
Menggunakan Metode ARIMA. Institut Teknologi Sepuluh Nopember, Surabaya.
Dimashanti, A. R., & Sugiman, S. (2021). Peramalan indeks harga konsumen kota
semarang menggunakan sarima berbantuan software minitab. Paper presented at
the PRISMA, Prosiding Seminar Nasional Matematika.
Ekananda, D. M. (2014). Analisis Data Time Series. Jakarta: Mitra Wacana Media.
Fadhilah, R. A. (2009). Load Forecasting Using Time Series Models. Jurnal
Kejuruteraan, 21: 53-62.
Few, S. (2006). Information Dashboard Design: The Effective Visual Communication of
Data: O'Reilly.
Few, S. (2006). Information dashboard design: The effective visual communication of data
63
(Vol. Vol. 2). Sebastopol, CA: O'reilly.
Ginanjar, G. (2008). Demam Berdarah: PT Mizan Publika.
Harahap, L. (2021). Data Kemenkes: Per Oktober 2021, Kasus DBD Jauh di Bawah Tahun
2020. Retrieved from https://www.merdeka.com/peristiwa/data-kemenkes-per-
oktober-2021-kasus-dbd-jauh-di-bawah-tahun-2020.html
Hernadewita, H., Hadi, Y. K., Syaputra, M. J., & Setiawan. (2020). Peramalan Penjualan
Obat Generik Melalui Time Series Forecasting Model Pada Perusahaan Farmasi di
Tangerang: Studi Kasus. Journal of Industrial Engineering & Management
Research, 1(2), 35-49.
Hoedojo. (1993). Vektor DBD dan upaya
penanggulangannya. Majalah Parasitologi Indonesia, pp. 31-45.
Iriawan, N., & Astuti, S. P. (2006). Mengolah Data Statistik Dengan Mudah Menggunakan
Minitab 14. Yogyakarta: Andi.
Istiqomah, W., & Darsyah, M. Y. (2018). Efektivitas Metode Arima dan Exponential
Smoothing untuk Meramalkan Nilai Tukar Petani di Jawa Tengah. Paper presented
at the Prosiding Seminar Nasional Mahasiswa Unimus.
JabarNews. (2022). Kasus DBD Selama Tahun 2021 di Jawa Barat, Tercatat Alami
Penurunan. Retrieved from https://www.jabarnews.com/daerah/kasus-dbd-
selama-tahun-2021-di-jawa-barat-tercatat-alami-penurunan/
Linda, P., Situmorang, M., & Tarigan, G. (2014). Peramalan Penjualan Produksi Teh Botol
Sosro pada PT. Sinar Sosro Sumatera Bagian Utara Tahun 2014 dengan Metode
Arima Box-Jenkins. Saintia Matematika, 2(3), 253-266.
Makridakis, S., Andersen, A., Carbone, R., Fildes, R., Hibon, M., Lewandowski, R., &
Winkler, R. (1982). The accuracy of extrapolation (time series) methods: Results
of a forecasting competition. Journal of forecasting, 1(2), 111-153.

Makridakis, S., Wheelwright, S. C., & Hyndman, R. (1997). The Forecasting Perspective.
Noname. (2020). Selain Corona, Dinkes Didorong Waspada pada Sebaran DBD. Retrieved
from https://dprd-dkijakartaprov.go.id/selain-corona-dinkes-didorong-waspada-
pada-sebaran-dbd/
Nurani, R. C. (2011). Rancang Bangun Visualisasi Informasi data-data akademik dengan
menggunakan sistem dashboard di STIKOM Surabaya. STIKOM Surabaya,
Surabaya.
Nurulita. (2010). Penerapan Metode Peramalan ARIMA (Autoregressive Integrated
Moving AverageI) untuk Penentuan Tingkat Safety Stock Pada Industri Elektronik.
Universitas Indonesia, Depok.
Rahayu, S., Sukestiyarno, S., & Hendikawati, P. (2018). Peramalan Inflasi di Demak
Menggunakan Metode ARIMA Berbantuan Software R dan MINITAB. Paper
presented at the PRISMA, Prosiding Seminar Nasional Matematika.
Razak, F. A., Shitan, M., Hashim, A. H., & Abidin, I. Z. (2009). Load Forecasting Using
Time Series Models. Jurnal Kejuruteraan, 21, 53-62.
Render, B., & Heizer, J. (2001). Prinsip-prinsip Manajemen Operasi: Operations
Management. Jakarta: Salemba Empat.
Rezaldi, D. A., & Sugiman, S. (2021). Peramalan Metode ARIMA Data Saham PT.
Telekomunikasi Indonesia. Paper presented at the PRISMA, Prosiding Seminar
Nasional Matematika.
Saepuloh, D. (2020). Visualisasi Data Covid 19 Provinsi DKI Jakarta Menggunakan
Tableau Data Visualization of Covid 19 Province DKI Jakarta Using Tableau
bernama Severe Acute Respiratory Syndrome Perbedaan Tableau Desktop Tableau
Public Open Source Berbayar (bukan open sourc. RIS. Jakarta, 13(2), 55-64.
Salwa, N., Tatsara, N., Amalia, R., & Zohra, A. F. (2018). Peramalan Harga Bitcoin
Menggunakan Metode ARIMA (Autoregressive Integrated Moving Average).
Journal of Data Analysis, 1(1), 21-31.
Satari, H., & Mila, M. (2004). Demam Berdarah: Niaga Swadaya.
Setyawan, B. (2017). Visualisasi Dashboard Power BI dan Peramalan Jumlah Kasus
Demam Berdarah Dengue di Kabupaten Malang Menggunakan Metode Artificial
Neural Network. Institut Teknolgi Sepuluh Nopember, Surabaya.
Soejoet, Z. (1987). Materi Pokok Analisis Runtun Waktu. Jakarta: Karunika, Universitas
Terbuka.
Sonata, M. E. (2021). Peramalan Produksi Padi di Provinsi Jawa Timur Menggunakan
Metode Feedforward Neural Network. Universitas Muhammadiyah Semarang,
Semarang.
SRK, L. (2022, 13 March 2022). Power BI vs Tableau. Retrieved from
https://lab_adrk.ub.ac.id/id/power-bi-vs-tableau/
Sugiarto. (2022). Ekonomi Mikro Sebuah KajianKomprehensif. Jakarta: PT. Gramedia
PustakaUtama.
Sumarmo. (1988). Dengue Hemorrhagic Fever in Indonesia. Southeast Asian J Trop Med
Public Health, 18, no. 2, 69-74.
Taylor, J. W. (2009). Sains Manajemen (8 ed.). Surabaya: Salemba Empat.
Tindriyani, N. A. (2017). Implementasi Neural Network Pada Matlab Untuk Peramalan
Konsumsi Beban Listrik Kabupaten Ponorogo Jawa Timur. Universitas Negeri
Semarang, Semarang.
Wei, W. W. (2006). Time series analysis. In The Oxford Handbook of Quantitative Methods
in Psychology: Vol. 2.
Yigitbasioglu, O. M., & Velcu, O. (2012). A Review of Dashboards In Performance
Management: Implications For Design And Research. International Journal of

Accounting Information Systems, 13(1), 41-59.
Zhu, Z., Heng, B. H., & Teow, K. L. (2017). Decision Management: Concepts,
Methodologies, Tools, and Applications: Concepts, Methodologies, Tools, and
Applications: IGI Global.

Hasil Peramalan Menggunakan MiniTab
Hasil Visualisasi Dashboard Melalui Aplikasi Tableau

Pembuatan File Excel

Renda Audi Permaisuri-Fst

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Renda Audi Permaisuri-Fst

Diunggah oleh

Hak Cipta:

Format Tersedia

1

VISUALISASI DASHBOARD TABLEAU DAN PERAMALAN

PROGRAM STUDI SISTEM INFORMASI

VISUALISASI DASHBOARD TABLEAU DAN PERAMALAN

PROGRAM STUDI SISTEM INFORMASI

RENDA AUDI PERMAI SURI – 11180930000128, Visualisasi Dashboard

Kata Kunci: ARIMA, Peramalan, PACF, ACF, DKI Jakarta.

5 Bab + 62 Halaman + xiv Halaman + 25 Gambar + 7 Tabel + Lampiran

serta hidayah-Nya sehingga penulis dapat menyelesaikan penulisan skripsi dengan

judul “Visualisasi Dashboard Tableau dan Peramalan Jumlah Kasus Demam

Berdarah Dengue di DKI Jakarta Menggunakan Metode ARIMA”. Penelitian ini

disusun sebagai salah satusSyarat untuk memperoleh gelar Sarjana Sistem

Informasi Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif

Dalam penulisan skripsi ini, penulis menyadari bahwa masih terdapat

Informasi di Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta.

pihak-pihak yang telah membantu memberikan dukungan baik berupa materi

terima kasih secara khusus penulis berikan kepada:

Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta.

dan Bapak Nuryasin, M.Kom selaku Sekretaris Program studi Sistem

pembimbing I dan II yang telah memberikan ilmu dan pengetahuannya

dalam membimbing penulis sehingga laporan ini dapat terselesaikan.

4. Dosen-dosen Program Studi Sistem Informasi yang telah memberikan ilmu

dan dukungan yang terus mengalir kepada peneliti.

6. Senior-senior dan teman-teman saya yang telah bersedia memberikan info

dan ilmu tambahan dalam menyusun laporan ini.

penyusunan skripsi dapat selesai.

8. Seluruh teman “Kelas E Otak Auto A” Sistem Informasi Angkatan 2018

yang telah memberikan senyuman, tawa, semangat, mengisi hari-hari saya

menjadi berwarna saat menjalani perkuliahaan.

hingga laporan ini terselesaikan.

Bogor, September 2022

Renda Audi Permaisuri

PENGESAHAN UJIAN ................................................................................................. iii

Gambar 1.1 Grafik Jumlah Kasus DBD di DKI Jakarta ..........................................2

Gambar 2.1 Fungsi Autokorelasi suatu data Zt ......................................................31

Gambar 3.1 Flowchart Pelaksanaan Penelitian ......................................................34

Gambar 4.2 Box-cox plot data sebelum transformasi ............................................43

Gambar 4.3 Box-cox plot data setelah transformasi pertama ................................43

Gambar 4.6 Grafik ACF Data Hasil Differencing .................................................45

Gambar 4.7 Grafik PACF Data Hasil Differencing ...............................................46

Gambar 4.9 Grafik Trend Analisis data hasil Differencing 2 ................................47

Gambar 4.10 Grafik ACF Data Hasil Differencing 2 ............................................48

Gambar 4.11 Grafik PACF Data Hasil Differencing 2 ..........................................48

Gambar 4.12 Grafik ACF Data Hasil Differencing Musiman ...............................49

Gambar 4.13 Grafik PACF Hasil Differencing Musiman .....................................50

Gambar 4.14 Output Normal Probability Plot Residual ........................................54

Gambar 4.16 Filter Daerah Jakarta ........................................................................57

Gambar 4.17 Filter Tahun ......................................................................................57

Gambar 4.21 Visualisasi Hasil Prediksi .................................................................60

Tabel 2.1 Perbedaan Tradisional BI dengan Tableau ............................................15

Tabel 2.2 Kekurangan & Kelebihan dari Tableau dan PowerBID.........................16

Tabel 2.4 Nilai λ pada Transformasi Box-Cox ......................................................29

Tabel 3.1 Informasi Pendukung Studi Literatur .....................................................35

Tabel 3.2 Waktu Proses Penelitian.........................................................................39

1.1 Latar Belakang

Demam Berdarah Dengue (DBD) merupakan penyakit yang disebabkan

tidak ditangani secepatnya (Satari & Mila, 2004).

Pada Oktober 2020, Kementrian Kesehatan memperoleh data jumlah kasus

Menurut Yudi Koharudin, Kepala Bidang Pencegahan dan Penanggulangan

Daerah dengan kasus kematian terbanyak di Jawa Barat terjadi di Kabupaten

Jakarta dinobatkan sebagai salah satu provinsi di Indonesia yang juga

memiliki kasus penderita penyakit demam berdarah yang cukup banyak.

di Jakarta Pusat 62 kasus, dan di Kepulauan Seribu 7 kasus (Noname, 2020).