SKRIPSI
Disusun oleh:
RENDA AUDI PERMAISURI
11180930000128
2022 M / 1443 H
HALAMAN JUDUL
SKRIPSI
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer Program
Studi Sistem Informasi Fakultas Sains dan Teknologi Universitas Islam Negeri
Syarif Hidayatullah Jakarta
Disusun oleh:
RENDA AUDI PERMAISURI
11180930000128
2022 M / 1443 H
ii
ABSTRAK
Metode ARIMA adalah salah satu metode peramalan time series. ARIMA memiliki
hubungan statistik yang baik antara variabel yang akan diprediksi dan nilai yang
digunakan untuk prediksi. Metode Autoregressive Integrated Moving Average
(ARIMA) memiliki ketepatan yang sangat akurat karena dalam metode tersebut
menggunakan peramalan jangka pendek. Metode ARIMA memiliki kelebihan yaitu
dapat digunakan pada data yang tidak stasioner dapat digunakan pada semua pola
data termasuk pola data musiman sehingga metode ini dapat digunakan untuk
meramalkan kasus DBD di Provinsi DKI Jakarta. Penelitian ini dilakukan untuk
menentukan model terbaik dengan model peramalan ARIMA musiman dan juga
menganalisis hasil peramalan kasus DBD di Provinsi DKI Jakarta. Hasil analisis
menunjukkan model terbaik untuk kasus DBD di Provinsi DKI Jakarta adalah
ARIMA(0,2,1)(2,1,1)4 dengan nilai MSE terkecil yaitu 970756. Hasil peramalan
Kasus DBD DKI Jakarta bulan Januari 2021 sampai Desember 2021 berturut-turut
di bulan Januari sebanyak 90 kasus, Februari sebanyak 186 kasus, Maret sebanyak
529 kasus, April sebanyak 394 kasus, Mei sebanyak 311 kasus, Juni sebanyak 229
kasus, Juli sebanyak 308 kasus, Agustus sebanyak 268 kasus, September sebanyak
268 kasus, Oktober sebanyak 286 kasus, November sebanyak 432 kasus, dan
Desember sebanyak 416 kasus.
vi
KATA PENGANTAR
Puji dan syukur atas kehadirat Allah SWT yang telah memberikan rahmat
Hidayatullah Jakarta.
banyak kekurangan. Namun demikian penulis berharap penulisan skripsi ini dapat
memenuhi prasyarat dalam memperoleh gelar sarjana (S-1) dalam jurusan Sistem
Pada kesempatan ini penulis juga hendak mengucapkan terima kasih kepada
maupun imateri, sehingga penulis dapat menyelesaikan Laporan Skripsi ini. Ucapan
1. Bapak Nashrul Hakiem, S.Si., M.T., PhD selaku Dekan Fakultas Sains dan
2. Bapak A’ang Subiyakto, PhD selaku Ketua Program Studi Sistem Informasi
Informasi.
vii
3. Bapak Ir. Eri Rustamaji, MBA dan Ibu Eva Khudzaeva M.Si selaku dosen
selama perkuliahan.
5. Orang tua dan Kakak-kakak saya yang selalu memberikan doa, semangat,
7. Sahabat saya yaitu: Nusif, Ana, Karin yang selalu mendengarkan keluh
kesah saya disaat saya patah hati dan memberikan dukungan sehigga
9. Semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu
Penulis menyadari bahwa dalam penyusunan Skripsi ini masih jauh dari
kata sempurna, serta masih banyak kekurangan baik dalam penulisan materi
viii
maupun dalam susunan bahasanya. Untuk itu kiranya, pembaca dapat memaklumi
atas kekurangan dalam laporan ini. Akhir kata penulis berharap semoga laporan ini
dapat bermanfaat bagi penulis khususnya dan bagi para pembaca pada umumnya.
ix
DAFTAR ISI
x
2.7 Persentase Kesalahan ............................................................................................ 31
2.7.1 Rata-rata Kesalahan (average/mean error) ................................................ 31
2.7.2 Mean Absolute Deviation (MAD) ............................................................... 32
2.7.3 Mean Squared Error (MSE) ...................................................................... 32
2.7.4 Standard Deviation of Errors (SDE) ......................................................... 32
2.7.5 Percentage Error (PE) ................................................................................ 32
2.7.6 Mean Percentage Error dan Mean Absolute Percentage Error ............. 33
BAB 3 METODOLOGI PENELITIAN ...................................................................... 34
3.1. Tahapan Penelitian ................................................................................................ 34
3.2. Deskripsi Tahapan Peneltian ................................................................................. 35
3.2.1 Identifikasi dan Perumusan Masalah............................................................. 35
3.2.2 Studi Literatur ............................................................................................... 35
3.2.3 Pengumpulan Data ........................................................................................ 36
3.2.4 Pembuatan Excel ........................................................................................... 36
3.2.5 Pemodelan ARIMA ....................................................................................... 37
3.2.1 Peramalan Kasus DBD DKI Jakarta ............................................................. 38
3.2.6 Pembuatan Visualisasi Dashboard ................................................................ 38
3.3 Waktu Penelitian ................................................................................................... 39
BAB 4 HASIL DAN PEMBAHASAN ......................................................................... 40
4.1 Persiapan Data....................................................................................................... 40
4.2 Tahap Identifikasi.................................................................................................. 41
4.2.1 Plot Data ........................................................................................................ 41
4.2.2 Transformasi Data ......................................................................................... 42
4.2.3 Plot ACF dan PACF ...................................................................................... 44
4.2.4 Identifikasi Model ARIMA ........................................................................... 49
4.3 Estimasi Parameter dan Uji Signifikansi............................................................... 52
4.4 Verifikasi Model ................................................................................................... 53
4.4 Peramalan Kasus DBD DKI Jakarta ..................................................................... 54
4.5 Visualisasi Dashboard ........................................................................................... 55
4.5.1 Filter Daerah Jakarta ................................................................................. 56
4.5.2 Filter Bulan dan Tahun .............................................................................. 57
4.5.3 Data Aktual Kasus DBD ............................................................................. 58
4.5.4 Visualisasi Data Prediksi ............................................................................ 60
xi
BAB 5 KESIMPULAN DAN SARAN ......................................................................... 61
5.1 Kesimpulan ........................................................................................................... 61
5.2 Saran...................................................................................................................... 62
DAFTAR PUSTAKA .................................................................................................... 63
xii
DAFTAR GAMBAR
Gambar 1.2 Pie Chart Persentase Jumlah Kasus DBD di DKI Jakarta ....................3
Gambar 4.1 Plot Data Kasus DBD DKI Jakarta Periode 2015 - 2020 ...................42
Gambar 4.4 Grafik Autocorrelation Function data hasil transformasi pertama .....44
Gambar 4.5 Grafik Trend Analisis data hasil transformasi pertama ......................45
Gambar 4.8 Grafik Trend Analisis data hasil Differencing Pertama .....................46
Gambar 4.15 Rancangan Dashboard Kasus DBD DKI Jakarta di Tableau ...........56
Gambar 4.18 Persentase Kasus DBD DKI Jakarta Per Daerah .............................58
xiii
Gambar 4.19 Grafik Perbandingan Jumlah Kasus Antar Daerah Setiap Tahun ....59
Gambar 4.20 Grafik Jumlah Kasus Per Tahun Berdasarkan Bulan .......................59
xiv
DAFTAR TABEL
Tabel 2.3 Identifikasi Model Berdasarkan Plot ACF dan PACF ...........................25
Tabel 4.1 Data Jumlah Kasus DBD di DKI Jakarta Periode 2015 – 2020 ............40
Tabel 4.2 Estimasi Model ARIMA musiman data Kasus DBD DKI Jakarta ........52
Tabel 4.3 Nilai MSE Model ARIMA musiman data Kasus DBD DKI Jakarta .....53
Tabel 4.4 Data hasil Peramalan Kasus DBD DKI Jakarta Periode 2021 ...............55
xv
BAB 1
PENDAHULUAN
oleh infeksi virus DEN-1, DEN-2, DEN-3, atau DEN-4 dan ditularkan melalui
sengatan nyamuk Aedes aegypti dan Aedes albopictus yang sebelumnya telah
terinfeksi oleh virus dengue dari penderita DBD lainnya (Ginanjar, 2008). Dalam
waktu yang relatif singkat, penyakit ini dapat membunuh orang yang terkena jika
Demam berdarah sejumlah 37.646 kasus yang tersebar merata di seluruh provinsi
di Indonesia (Harahap, 2021). Jumlah kematian akibat DBD pada tahun 2021
lebih tinggi dibandingkan tahun 2020, yaitu 168 dari 22.613 kasus DBD
menyebabkan kematian.
Penyakit Menular Dinas Kesehatan Jabar, selama tahun 2021, Kota Bandung
unggul sebagai daerah terbanyak kasus DBD yaitu dengan total 3.743 kasus,
disusul Kota Depok dengan 3.155 Kasus, dan Kota Bekasi dengan 1963 kasus.
Bogor dengan 22 kasus kematian dari total 1.639 kasus DBD yang ditemukan
(JabarNews, 2022).
1
2
Berdasarkan data pemetaan wilayah DBD yang dikumpulkan oleh Pemprov DKI
Jakarta melalui Dinas Kesehatan (Dinkes), terdapat 971 kasus DBD yang terjadi
sejak Januari hingga Maret 2020. Gambar 1.1 menunjukkan jumlah kasus DBD,
dengan kasus DBD terbanyak 269 kasus terjadi di Jakarta Barat, dan 265 kasus
di Jakarta Selatan dan Jakarta Timur. Setelah itu, di Jakarta Utara ada 103 kasus,
200
150
103
100
62
50
7
0
Jakarta Pusat Jakarta Barat Jakarta Timur Jakarta Selatan Jakarta Utara Kepulauan
Seribu
Jumlah Kasus
11% 6%
28%
27%
27%
Gambar 1.2 Pie Chart Persentase Jumlah Kasus DBD di DKI Jakarta [5].
Pada Gambar 1.2 menunjukkan jumlah kasus DBD di DKI Jakarta pada
tahun 2020 dalam bentuk persentase. Persentase tertinggi dipimpin oleh daerah
Jakarta Barat sebesar 28%, Jakarta Selatan dan Jakarta Timur sebesar 27%,
Jakarta Utara sebesar 11%, Jakarta Pusat sebesar 6%, dan daerah Kepulauan
pada suatu daerah. Hal tersebut berlaku juga pada lembaga pemerintahan, seperti
peramalan penyebaran suatu penyakit, peramalan kecelakaan lalu lintas, dan lain
satu periode kedepan dengan menggunakan data-data histori yang sudah ada
4
(ARIMA).
peramalan jangka pendek. Peramalan jangka pendek dipilih karena hasil akurasi
yang sangat baik dibanding dengan peramalan jangka panjang yang akan
2014). ARIMA memiliki hubungan statistik yang baik antara variabel yang akan
diprediksi dan nilai yang digunakan untuk prediksi. Untuk peramalan jangka
memiliki nilai prakiraan yang konstan (Salwa et al., 2018). Nilai yang digunakan
ARIMA untuk peramalan adalah dengan menggunakan nilai historis dan saat ini
dari variabel dependen untuk membuat peramalan jangka pendek yang akurat
(Fadhilah, 2009).
untuk pengolahan data peramalan, dan penggunaan Minitab sangat popular untuk
melakukan peramalan saat penelitian. Tujuan kajian ini yakni meramalkan inflasi
memilih model yang lebih akurat dalam melakukan analisis ARIMA. (Rahayu et
al., 2018)
(1,1,1)(2,1,0)12 untuk memprediksi IHK Kota Semarang dari Januari 2019 hingga
Desember 2021 dengan prakiraan hasil untuk 36 periode berikutnya dari Januari
terhadap nilai RMSE, MAPE, dan MAE, nilai yang dihasilkan kecil, sehingga
Telekomunikasi Indonesia pada Juni 2020 adalah 3103 Juli 2020 adalah 3056
Agustus 2020 adalah 300720 September 2020 adalah 2956 Oktober 2020 adalah
2905 November 2020 adalah 2852 Desember 2020 adalah 279920 Januari Januari
27442021 adalah Maret Itu adalah 2.571 pada April 26302021 dan 2.511 pada
Mei 2021.
format seperti bagan, laporan, dan indikator visual yang dikombinasikan dengan
informasi dinamis dan relevan. Alat yang berguna untuk. Ini memungkinkan
Anda untuk memantau kinerja organisasi Anda secara sekilas (Siti Few, 2006).
6
interaktif. Pengguna dapat memeriksa sendiri data yang ditampilkan untuk lebih
memprediksi pendapatan dari produksi teh dalam kemasan di PT. Sinar Sosro
Sumatera Bagian Utara 2014 menggunakan metode Box Jenkins ARIMA yang
merupakan salah satu metode prediksi kuantitatif. Data yang diekstraksi adalah
dari Juni 2007 hingga Mei 2013. Model yang tepat yaitu ARIMA (2,1,2)(1,1,1)3.
Hal ini digunakan untuk memprediksi penjualan teh botol sosro 12 periode ke
depan. Pilihan didasarkan pada nilai MSE minimum 0,036823269 (mean square
error) dan nilai MAPE minimum 1,37120 (mean absolute percentage error). Dari
hasil ramalan Juni 2013 sampai Mei 2014, total penjualan produksi teh botol
108.761.7155 kasus.
memprediksi berbagai jenis pola data. Metode ini dapat diuji reliabilitasnya dengan
7
dalam meramalkan data Nilai Tukar Petani di Jawa Tengah karena nilai MSE dan
dibandingkan nilai MSE dan MAPE pada metode Exponential Smoothing sebesar
salah satu dari tiga provinsi yaitu Kalimantan, Bali dan DKI Jakarta yang
memiliki tingkat penderita DBD tertinggi (A. I. Widyatami & Suryawan, 2021),
dan juga dataset jumlah penderita kasus DBD di Jakarta cukup lengkap mulai
Hasil dari penelitian yang dilakukan menarik keputusan dan langkah terbaik
datang, dan juga untuk membantu mahasiswa yang akan melakukan penelitian
dengan judul serupa. Oleh karena itu, penulis tertarik untuk melakukan penelitian
ARIMA”.
Berdasarkan latar belakang di atas dan untuk lebih fokus pada penelitian
1. Jumlah penderita kasus demam berdarah di DKI Jakarta pada tahun 2015 –
2020 adanya pergerakan yang bisa naik dan turun dalam periode yang singkat.
8
rumusan masalah yang dipecahkan oleh penelitian ini adalah sebagai berikut:
1. Berapakah hasil nilai MSE menggunakan metode ARIMA dan apakah cocok
Ada beberapa batasan masalah dalam penelitian ini, dan batasan masalah
1. Data yang digunakan adalah data yang berasal dari Dinas Kesehatan, yang
2. Data kasus DBD yang digunakan untuk pemodelan prediksi yang dibuat
1. Mahasiswa
model ARIMA dan sebagai sarana untuk menerapkan metode yang dijelaskan
2. Lembaga/Masyarakat
3. Universitas
10
selanjutnya.
1) Studi Literatur
Tahap ini dilakukan melalui survei teori sastra dan buku-buku penyedia
layanan dan situs web yang terkait dengan studi prediktif ARIMA ini.
2) Pemilihan Data
Pemilihan data akan digunakan pada tahap ini. Data jumlah penderita
demam berdarah pada setiap wilayah DKI Jakarta yang didapatkan dari
Excel (xls) yang terdiri dari variabel tahun, bulan, kota administrasi,
meninggal.
satu file excel yang berisikan data kasus demam berdarah setiap tahun,
bulan, daerah jakarta, dan jumlah penderita DBD. File excel ini
11
Pada tahap ini, data yang telah terkumpul pada template excel yang telah
untuk peramalan pada MiniTab adalah template excel yang berisi data
D. Perancangan Dashboard
berikut:
pilih data yang akan ditampilkan berikutnya dan visualisasi yang sesuai
analisis hasil prediksi langkah selanjutnya adalah mengatur tata letak dari
sebagai berikut:
BAB I PENDAHULUAN
LANDASAN TEORI
dikombinasikan dengan informasi yang dinamis dan relevan. Merupakan alat yang
(S. Few, 2006). Dengan kata lain, dashboard menampilkan data dalam format yang
berbeda, sehingga lebih mudah untuk memahami data yang ada. Memiliki dasboard
dapat menawarkan beberapa manfaat bagi organisasi. Di bawah ini adalah manfaat
penting yang diperlukan untuk mencapai satu atau beberapa tujuan, mengaturnya
mungkin agar mata manusia dapat dengan cepat menangkap informasi tersebut dan
13
14
informasi penting dan dapat di lihat langsung sehingga dapat melihat dasboard dan
mengetahui apa yang perlu diketahui. Biasanya kombinasi teks dan grafik, tetapi
terutama untuk visualisasi data, analisis data, dan pelaporan. Sangat mudah
menggabungkan data dari berbagai sumber data seperti spreadsheet, database, data
cloud, dan data besar ke dalam satu program untuk digunakan dalam analisis
membuat visualisasi data lebih interaktif, lebih mudah dibaca, dan lebih mudah
dianalisis. Visualisasi yang dilakukan adalah transformasi data tabular yang ketat
menjadi grafik, grafik, geomapping, dll, yang dapat lebih jelas menunjukkan
perubahan dan perbedaan data. Hasilnya, tampilan data analisis statistik reguler
menjadi lebih indah dengan grafik yang menarik menggunakan opsi dasbor
Alat visualisasi data ini sangat populer karena relatif mudah digunakan dan
sangat kuat. Tableau terintegrasi dengan ratusan sumber untuk mengimpor data dan
membuat berbagai visualisasi data. Anda juga dapat memvisualisasikan data dari
15
bagan ke peta.
Tableau tersedia dalam versi publik. Ini berarti siapa pun dapat mengakses dan
melihat visualisasi data. Ada juga versi Tableau Desktop yang melindungi
visualisasi data dengan kata sandi. Versi Tableau Desktop ini sangat cocok untuk
Analisa data salah satunya yaitu Microsoft PowerBI. Microsoft Power BI adalah
16
mengolah data lebih detail dan menampilkannya dengan grafis yang lebih interaktif.
Microsoft Power BI dapat memvisualisasikan data yang telah dimasukkan atau data
yang sudah terkoneksi oleh sistem ketiga. Sedangkan, Tableau adalah platform
Business Intelligence untuk membantu dalam melihat dan memahami data. Tableau
juga secara khusus dapat menerjemahkan data ke dalam bentuk visual atau
membuat semua visualisasi ini tanpa melakukan pengodean dan juga dapat
Berikut ini merupakan tabel kelebihan dan kekurangan yang ada pada Power
Kekurangan Kelebihan
1. Tableau berguna untuk 1. Pilihan visualnya yang
Tableau visualisasi, tetapi tidak dapat menarik dan interaktif.
melakukan query 2. Tableau adalah tools yang
2. Tableau tidak memiliki amat user friendly, orang
fitur refresh laporan secara yang tidak
otomatis dengan bantuan memahami coding dan
penjadwalan. dunia business
3. Banyak user yang kurang intelligence sekalipun akan
memberikan perhatian memahami cara penggunaan
terhadap pilihan conditional Tableau.
formatting Tableau dan 3. Tableau bisa
limitasi tampilan tabel 16 menggabungkan berbagai
kolom. sumber data, big
17
2.3 Peramalan
Peramalan merupakan suatu bidang ilmu yang dijadikan alat untuk melakukan
prediksi sesuatu dengan dasar data yang ada sebelumnya, dan diolah dengan cara
tertentu (Badi’ah & Handayani, 2020). Menurut Yamit yang dikutip oleh
Agustinawati (2015) Peramalan atau dikenal juga dengan istilah forecasting atau
prakiraan merupakan alat yang efektif dan efisien terutama dalam bidang ekonomi.
Dalam organisasi modern, mengetahui apa yang terjadi di masa depan penting tidak
hanya untuk mengetahui apakah itu baik atau buruk, tetapi juga untuk membuat
prediksi.
Peramalan adalah prediksi, proyeksi atau estimasi tingkat kejadian yang tidak
pasti di masa yang akan datang (Agustinawati, 2015). Mustahil untuk mencapai
akurasi absolut dalam memprediksi tingkat peristiwa dan kegiatan di masa depan.
Oleh karena itu, jika sebuah perusahaan tidak dapat secara andal memprediksi
kejadian di masa depan, akan membutuhkan banyak waktu dan energi untuk
menarik kesimpulan tentang kejadian di masa depan. Dalam situasi ini, perlu
membuat prediksi untuk menentukan kapan atau kapan suatu peristiwa akan terjadi
sehingga dapat mengambil tindakan yang tepat. Prediksi adalah alat penting untuk
Menurut Render and Heizer (2001), ada beberapa tahap dalam peramalan yaitu:
Berdasarkan metode ini, peramalan dapat dibagi menjadi dua metode, yakni
permintaan.
Pada dasarnya, metode prediksi kuantitatif dibagi menjadi dua jenis: model
deret waktu dan model kausal (Sonata, 2021). Metode prediksi membantu untuk
beroperasi secara teratur dan terfokus sehingga hasil yang diperoleh memiliki
tingkat kesalahan yang kecil, sehingga hasil yang diperoleh dapat memberikan
meramalkan 3 tahun yang akan datang atau lebih. Peramalan ini digunakan
peramalan yang mencakup hitungan bulan hingga 3 tahun yang akan datang.
jangka pendek.
Dalam hal peramalan, keakuratan ramalan itu penting. Semakin tinggi akurasi
salah satu cara untuk mengukur keakuratan suatu peramalan dengan nilai Root
Square Mean Error (RMSE) (Makridakis et al., 1982). Root Measn Square Error
(RMSE) merupakan nilai rata-rata dari jumlah kuadrat kesalahan dan juga dapat
1
𝑅𝑀𝑆𝐸 = √𝑛 ∑𝑛𝑖=1(𝑓𝑖 − 𝑜𝑖)2 (2.01)
R dan Minitab adalah kelompok perangkat lunak statistik yang dapat digunakan
untuk analisis statistik, termasuk memproses data peramalan. R dan Minitab adalah
disebabkan oleh infeksi virus DEN-1, DEN-2, DEN-3, atau DEN-4 yang
ditularkan melalui gigitan nyamuk Aedes aegypti dan Aedes albopictus yang
sebelumnya telah terinfeksi oleh virus dengue dari penderita DBD lainnya
(Ginanjar, 2008). Dalam waktu yang relative singkat, penyakit ini dapat
merenggut nyawa penderitanya jika tidak ditangani secepatnya (Satari & Mila,
2004).
Nyamuk ini berasal dari Mesir dan menyebar ke seluruh dunia melalui kapal
dan udara. Nyamuk berkembang biak di belahan dunia dengan iklim tropis dan
subtropis, seperti Asia, Afrika, Australia, dan Amerika Serikat. Nyamuk ini
ditemukan di mana-mana kecuali pada ketinggian di atas 1000 m dpl. Saat ini
nyamuk A. aegypti banyak ditemukan di negara-negara antara 45° LU dan 35° LS.
(Harahap, 2021). Pada tahun 2021 tercatat lebih banyak jumlah kasus DBD yang
menyebabkan kematian dibandingkan pada tahun 2020, yaitu 168 dari total 22.613
pelabuhan yang padat penduduk, spesies ini juga terdapat di perkotaan dan
22
disebabkan larva A. Aegypti diangkut dengan alat angkut bersama dengan benda-
benda yang mengandung genangan air yang mengandung larva spesies ini.
rumah dan tempat umum (TTU). Graham adalah ilmuwan pertama yang secara
secara intensif pada tahun 1970 oleh George Box dan Gwilym Jenkins (Iriawan &
Astuti, 2006). Kelompok model time series yang termasuk dalam metode ini antara
2009). Secara umum model ARIMA (p,d,q), memiliki bentuk (Wei, 2006)
mean dan varians konstan (𝑎𝑡 ~ 𝑊𝑁(0, 𝜎 2 )). Jika model ARIMA memiliki efek
Bentuk umum model AR dengan ordo p (AR(p)) atau model ARIMA (p,0,0)
23
Dimana:
𝜇 ′ = suatu konstanta′
𝑥𝑡 = variabel dependen,
∅𝑝 = parameter autoregressive ke-𝑝
𝑒𝑡 = nilai kesalahan pada saat 𝑡
𝑥𝑡−1 , 𝑥𝑡−2 , 𝑥𝑡−3 , … 𝑥𝑡−𝑝 = independent variabel.
Variabel bebas adalah himpunan nilai dari variabel yang sejenis selama
memperhitungkan gangguan acak yang tidak dapat dijelaskan oleh model. . Model
terbentuk)
Setelah memiliki model yang sesuai, dapat menggunakan model tersebut untuk
Dimana:
𝜇 = suatu konstanta
𝜃𝑘 = parameter autoregressive ke-𝑝
𝑒𝑡 = error atau unit residual
𝑒𝑡−1 , 𝑒𝑡−2 , 𝑒𝑡−3 , … , 𝑒𝑡−𝑞 = selisih nilai aktual dengan nilai peramalan
sebelumnya (𝑒𝑡 , 𝑒𝑡−1 , 𝑒𝑡−2 , 𝑒𝑡−3 , … , 𝑒𝑡−𝑞 ) daripada nilai variabel itu sendiri. untuk
persamaan (2.06) nilai yang akan datang dapat diprediksi dengan menggunakan
error pada beberapa periode yang lalu. Contoh untuk model moving average
Dari model autoregressive (AR) dan moving average (MA) dapat dibentuk
moving average) dengan ARMA (𝑝, 𝑞). Adapun bentuk umum persamaan ARMA
berikut:
melihat plot ACF dan plot PACF. Menurut Bowerman and O'Connell (1993) sifat-
sifat model deret waktu dapat dilihat berdasarkan bentuk atau pola plot ACF dan
PACF. Identifikasi kriteria model time series berdasarkan plot ACF dan PACF
Time series adalah suatu bentuk pengamatan yang dilakukan atas dasar time
series, dan terdapat korelasi antara pengamatan yang berdekatan (Wei, 2006).
Pengambilan data biasanya dilakukan pada interval waktu yang sama dan dari
26
sumber yang sama. Ada korelasi atau ketergantungan statistik antara pengamatan
pada satu titik waktu dan pengamatan pada titik waktu lain. Deret waktu adalah
normal selama prosesnya tidak berubah dengan perubahan dari waktu ke waktu dan
Tehnik Time series merupakan data history yang digunakan untuk meramalkan
data berikutnya. Hampir sama dengan regresi, Y merupakan data history dan X
adalah data periode atau time itu sendiri, bisa bernilai 1 untuk data yang paling
awal, dan bernilai 2 untuk data berikutnya dan seterusnya. Model yang dihasilkan
tidak menggunakan R-squared, namun karena time series juga termasuk model
1) Naïve
Tehnik naïve merupakan tehnik time series yang paling sederhana. Deskripsi
singkat tentang tehnik naïve ini adalah kita memprediksi dengan data satu periode
memprediksi penjualan april juga sebesar 20 unit. Atau dalam hitungan tahun, jika
penjualan tahun 2010 sebesar 200 unit, maka kita memprediksi penjualan tahun
Y prediksi = Y t-1
27
2) Moving Average
Tehnik moving average (MA) merupakan pengembangan dari tehnik naïve. Jika
dan kemudian dirata-ratakan untuk menentukan data berikutnya. Jumlah data yang
digunakan biasanya disebut ordo. Dikatakan moving average atau rataan yang
bergerak karena average yang digunakan seolah bergerak tergantung data yang
ingin diprediksi.
3) Teknik Trend
Tehnik trend merupakan tehnik yang umum digunakan pada analisis peramalan
data kuantitatif. Pada dasarnya kita mencari pola trend pada data yang kita miliki;
misalnya linear, kuadratic, S kurve, atau exponential; yang selanjutnya kita gunakan
Anda tidak perlu kuatir dengan banyaknya pilihan yang digunakan untuk
Tehnik yang paling baik atau model yang paling baik jika model tersebut
memiliki kriteria error yang paling kecil. Jadi, model mendapatkan Ypred, yang
tehnik perhitungan nilai errornya dapat dilihat di poin 2.7 Persentase Kesalahan.
28
Menurut Wei (2006) Time Series adalah urutan pengamatan yang terjadi secara
berurutan berdasarkan indeks waktu dengan interval waktu yang sama dan interval
waktu tetap yang mengumpulkan data dari sumbernya. Karena setiap pengamatan
adalah urutan pengamatan dan dinyatakan sebagai variabel acak Zt yang diperoleh
dari indeks waktu tertentu (ti) sebagai urutan waktu pengamatan, sehingga
penulisan data time series adalah 𝑍𝑡1 , 𝑍𝑡2 , …, 𝑍𝑡𝑛 . Terdapat langkah-langkah
prosedural yang perlu diperhatikan saat melakukan metode runtun waktu ARIMA
mendasari deret waktu didasarkan pada mean konstan dan varians konstan
Karena mean tidak konstan atau varians tidak konstan, Anda dapat menggunakan
metode diferensial atau perbedaan untuk membawa data lebih dekat ke normal
∇𝑑 𝑍𝑡 == (1 − 𝐵)𝑑 𝑍𝑡 (2.08)
𝑍𝑡𝜆 − 1 (2.09)
𝑇(𝑍𝑡 ) = ,𝜆 ≠ 0
𝜆
𝑍𝑡𝜆 −1
lim 𝑇(𝑍𝑡 ) = lim = ln(𝑍𝑡 ), 𝜆 = 0
𝜆 →0 𝜆 →0 𝜆
29
(2.10)
pada lag ke-k yang menunjukkan korelasi antara 𝑍𝑡 dan 𝑍𝑡+𝑘 biasanya
𝛾̂𝑘 ∑𝑛−𝑘 ̅ ̅
𝑡=1 ( 𝑍𝑡 − 𝑍)( 𝑍𝑡+𝑘 − 𝑍)
𝜌̂𝑘 = = , 𝑘 = 0, 1, 2, … (2.11)
𝛾̂0 ∑𝑡=1( 𝑍𝑡 − 𝑍̅)2
𝑛
𝑍
dimana 𝑍̅ = ∑𝑛𝑡=1 𝑛𝑡 yang merupakan nilai rata-rata data time series yang
(1 + 2 ∑𝑘−1
𝑚=1 𝜌
̂𝑚2
𝑆𝐸(𝜌̂𝑘 ) = √ (2.12)
𝑛
Dimana
𝑘 = lag j; k = 1, 2, 3, …
𝑛 = jumlah pengamatan
30
Untuk mencari batas atas dan batas bawah dari autocorrelation function
korelasi antara 𝑍𝑡 dan 𝑍𝑡+𝑘 setelah pengaruh dari pengaruh linier 𝑍𝑡+1, 𝑍𝑡+2,….,
𝑍𝑡+𝑘−1 dihilangkan. Nilai PACF disimbolkan dengan ∅11 = 𝜌1 dan nilai ∅𝑘𝑘 dapat
𝜌̂𝑘 − ∑𝑘−1 ̂
𝑗=1 ∅𝑘−1 𝜌
̂𝑘−𝑗
̂ 𝑘𝑘 =
∅ (2.15)
1 − ∑𝑘−1 ̂
𝑗=1 ∅𝑘−1 𝜌
̂𝑗
Keterangan:
̂ 𝑘𝑘 = fungsi autokorelasi parsial
∅
𝜌̂𝑘 = fungsi autokorelasi
1
̂ 𝑘𝑘 ) = √
𝑆𝐸(∅ (2.16)
𝑛
(2.17)
31
̂ 𝑘𝑘 )
Batas Signifikan = ± 𝑡𝑛−1;0,975 × 𝑆𝐸(∅
Kesalahan atau error mewakili perbedaan besar antara nilai aktual dan
Bernilai negatif jika nilai prediksi melebihi nilai sebenarnya, dan positif jika nilai
prediksi lebih kecil dari nilai sebenarnya. Kesalahan rata-rata (ME) dapat
𝑀𝐸 = ∑ 𝑒𝑖 (2.18)
𝑖=1
keseluruhan karena jumlah nilai positif dan negatif saling melemahkan dan
Tidak seperti Mean Error, pada Mean Absolute Deviation mengubah nilai
kesalahan prediksi dengan nilai sebenarnya menjadi nilai absolut positif. Ini untuk
menentukan apakah ada nilai positif dan negatif yang saling melemahkan, atau
menghitung dua kali kesalahan nilai 1, sedangkan MSE dihitung sebagai kuadrat
∑𝑛𝑖=1 𝑒𝑖 2 (2.20)
𝑀𝑆𝐸 =
𝑛
√∑𝑛𝑖=1 𝑒𝑖 2 (2.21)
𝑆𝐷𝐸 =
𝑛−1
𝑋𝑡 − 𝐹𝑡
𝑃𝐸 = 100 (2.22)
𝑋𝑡
2.7.6 Mean Percentage Error (MPE) dan Mean Absolute Percentage Error
(MAPE)
MPE adalah rata-rata dari persentase nilai kesalahan (selisih antara nilai
aktual dan prediksi) dari semua pengamatan. Sementara MAPE juga merupakan
nilai kesalahan rata-rata, ia memberikan nilai absolut dari perbedaan antara nilai
aktual dan prediksi. MAPE adalah metrik yang sering digunakan untuk
menunjukkan kinerja atau akurasi dalam hasil dari suatu proses peramalan.
Keterangan:
𝑋𝑡 = nilai aktual pada waktu t
𝐹𝑡 = nilai peramalan pada waktu t
𝑒 = error atau kesalahan (selisih dari 𝑋𝑡 − 𝐹𝑡 )
𝑛 = banyaknya jumlah observasi
BAB 3
METODOLOGI PENELITIAN
antara data dan informasi yang diperoleh dengan hasil yang ingin didapat. Untuk
tahapan pengerjaan penelitian ini dapat dilihat pada diagram alir seperti yang
34
35
perumusan masalah yang menjadi fokus penelitian ini. Identifikasi masalah yang
ada dalam studi kasus dan temuan solusi dari masalah yang ditemukan. Hasil
identifikasi masalah dan usulan solusi akan diangkat sebagai topik penelitian dalam
penelitian ini..
kerja dan metode prediktif, serta melakukan tinjauan pustaka dengan tujuan
Tahap pencarian literatur dimulai dengan mencari data dan informasi metode
prediksi, dan berbagai buku teks, jurnal dan artikel yang berkaitan dengan Demam
Berdarah Dengue, dengan hati-hati dalam penggunaan metode ini. Tinjauan pustaka
ini dapat ditemukan di bagian tinjauan pustaka dari dua bab sebelumnya. Beberapa
informasi tambahan tentang pekerjaan proyek kelulusan ini juga tersedia di artikel,
A Review of Dashboards In
Yigitbasioglu, O. M., Performance Management:
2.
& Velcu, O. (2012) Implications For Design And
Research.
3. Taylor, J. W. (2009) Sains Manajemen (8 ed.)
Razak, F. A., Shitan,
Load Forecasting Using Time
4. M., Hashim, A. H., &
Series Models
Abidin, I. Z. (2009)
Time series analysis. In The
5. Wei, W. W. (2006) Oxford Handbook of Quantitative
Methods in Psychology: Vol. 2.
Muhammad Bintang Aplikasi Metode ARIMA Box-
6. Pamungkas dan Arief Jenkins untuk Meramalkan Kasus
Wibowo DBD di Provinsi Jawa Timur
Pada langkah ini, penulis memilih data untuk digunakan dalam penelitian
ini. Data yang digunakan adalah data jumlah penderita DBD di setiap wilayah DKI
Jakarta antara lain Jakarta Pusat, Jakarta Barat, Jakarta Timur, Jakarta Selatan,
Jakarta Utara, dan Pulau Seribu yang diperoleh dari data.jakarta.go.id. Situs web.
Data dalam format Excel (xls) dengan variabel bulan, wilayah Jakarta, jumlah
penderita DBD. Periode data adalah dari Januari 2015 hingga Desember 2020.
Setelah data dikumpulkan selanjutnya data disatukan kedalam satu file excel
yang berisikan data penderita demam berdarah setiap daerah di DKI Jakarta,
kemudian dibagi menjadi dua yakni data training dan data testing. Data training
sedangkan data testing digunakan dalam pengujian keakuratan dari arsitektur yang
telah terbentuk. Pemilihan ukuran data training dan testing dilakukan menggunakan
data 75% training dan 25% testing. Data dari Januari 2015 - September 2019 akan
dijadikan sebagai data training sedangkan data dari Oktober 2019 - Desember 2020
sejumlah variabel secara cepat, sederhana, dan akurat karena hanya membutuhkan
1 data variabel yang akan diramal. Dan data yang digunakan untuk pemodelan
ARIMA yaitu data yang memiliki satu variabel (univariate) deret waktu. Karna
pada data Kasus DBD DKI Jakarta hanya terdapat 1 variabel saja yaitu Jumlah
Kasusnya maka saya memilih metode ARIMA ini yg cocok untuk dilakukan
peramalan.
1) Buat plot deret waktu untuk menentukan normalitas data. Jika data tetap
pada varians dan mean, tidak perlu ditransformasi (varians tidak stationer)
2) Jika data stasioner dalam hal mean dan varians, langkah selanjutnya adalah
menghasilkan plot ACF dan PACF dari data normal untuk memperkirakan
lainnya jika itu penting. Jika tidak kritis, fase pengujian dihentikan dan
data runtun waktu (Soejoet, 1987). Pada pembahasan ini, data yang digunakan
waktu menggunakan model terbaik yang sudah di tentukan pada proses pemodelan
ARIMA.
Tableau ke file Excel yang berisi hasil ramalan yang sebelumnya dijalankan
yang akan ditampilkan dan visualisasi yang sesuai agar mudah memahami
Penelitian ini dilaksanakan mulai bulan Desember 2021 hingga bulan Juni
Identifikasi dan
Perumusan Masalah
Studi Literatur
Metodologi Penelitian
Analisis Hasil
Penelitian
BAB 4
Pada bab ini dilakukan proses dalam meramalkan jumlah kasus pasien demam
berdarah di DKI Jakarta untuk periode tahun 2021 (12 bulan ke depan) dengan
historis minimal 50 data runtun waktu (Soejoet, 1987). Data yang dianalisis adalah
data jumlah kasus penderita DBD di DKI Jakarta sebanyak 60 data runtun waktu
dari tahun 2015 hingga tahun 2020, disajikan pada tabel 4.1.
Tabel 4.1 Data Jumlah Kasus DBD di DKI Jakarta Periode 2015 – 2020
DKI Jakarta
Jumlah Kasus
Bulan
2015 2016 2017 2018 2019 2020
Januari 883 2020 759 3.162 2.687 275
Februari 1164 4003 410 4.035 3.209 628
Maret 1619 5807 537 5.644 4.048 1.310
April 2152 7295 504 4.652 3.207 1.028
Mei 1849 4303 430 4.034 2.821 717
Juni 1288 3142 210 2.356 1.700 350
Juli 760 2274 178 1.180 794 140
Agustus 432 2461 142 622 370 75
September 442 2052 95 407 244 50
Oktober 443 2100 256 371 225 36
November 392 2272 241 440 275 59
Desember 535 1860 205 578 351 60
analisis dengan runtun waktu, karena jumlah data sudah lebih dari 50 data yaitu 7
40
41
2) Estimasi Parameter Model, yaitu melihat model ARIMA pada output program
3) Verifikasi, yaitu Verifikasi bahwa model yang diestimasi sangat cocok dengan
data yang dimilikinya. Jika ada penyimpangan yang signifikan, perkirakan dan
series membutuhkan data historis dari minimal 50 data time series (Soejoet,
Langkah ini melibatkan identifikasi data untuk data stasioner. Syarat untuk
mengatakan data stationer adalah jika data stationer untuk mean dan varians.
Tahap identifikasi dimulai dengan memplot data untuk menentukan tren data,
terlepas dari apakah data tersebut musiman atau non-musiman. Plot data tersebut
42
berdasarkan data jumlah penderita DBD di DKI Jakarta dari tahun 2015 hingga
2020, lebih jelasnya dapat dilihat pada data jumlah kasus DBD pada Tabel 4.1
diatas. Berikut hasil plot data dapat dilihat pada Gambar 4.1 di bawah ini.
7000
6000
5000
Kasus
4000
3000
2000
1000
Gambar 4.1 Plot Data Kasus DBD DKI Jakarta Periode 2015 - 2020
Gambar 4.1 menunjukkan bahwa data kasus DBD merupakan karakteristik dari
sebagai pola peningkatan yang sangat berulang selama periode waktu tertentu.
Prediksi data kasus DBD DKI Jakarta menggunakan pemodelan ARIMA musiman.
Berdasarkan grafik pada Gambar 4.1, jumlah kasus meningkat dari tahun 2015 ke
tahun 2016, menurun pada tahun 2017, meningkat lagi pada tahun 2018 dan
menurun menjadi tahun 2019 dan 2020. Metode ARIMA musiman sesuai karena
datanya mengandung pola musiman. Setelah mengidentifikasi pola dalam data, data
Seperti yang saya sebutkan sebelumnya, kondisi normalitas data adalah normal
untuk varians dan mean. Plot box-cox dimaksudkan untuk menentukan normalitas
43
data dalam varians. Data dikatakan normal untuk varians jika melihat nilai rounded
value atau lambda (λ) sebesar 1. Pada output didapatkan nilai yang dibulatkan
sebesar 0,00 sehingga data kasus DBD tidak statis pada varian. Berikut tampilan
Karena data kasus tidak statis dengan varians, kita perlu melakukan beberapa
transformasi data. Diberi nama Trans1, keluaran transformasi data satu kasus DBD
pada Gambar 4.3 rounded value 1,00. Hal ini menunjukkan bahwa data kasus DBD
terhadap varians dan mean. Syarat stasioner data terhadap mean dilakukan dengan
membuat plot Autocorrelation Function (ACF). Berikut hasil plot ACF pada
1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Berdasarkan Gambar 4.4, kami menunjukkan plot yang menurun mendekati nol.
Artinya data tersebut tidak stationer (Cynthia, Sugiman, and Mastur 2015). Dari
plot dapat dilihat bahwa terdapat dua delay berturut-turut yang berada di luar batas
signifikan, maka dapat dikatakan bahwa data kasus DBD tidak stationer pada mean,
Berdasarkan Gambar 4.5 grafik trend analisis data di atas dapat diketahui
bahwa data kasus DBD mengalami kenaikan dan penurunan seiring bertambahnya
waktu dan nilai aktualnya masih jauh dari garis linear, sehingga trend ini termasuk
Proses differencing dilakukan dengan cara mengurangi nilai data pada suatu
periode dengan nilai data pada periode sebelumnya untuk menghitung nilai
selisihnya. Jika dilakukan proses difference 1 kali maka nilai d adalah 1 pada model.
1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Gambar 4.6 menunjukkan plot ACF data kasus DBD setelah dilakukan proses
difference 1 kali. Plot ACF menunjukkan plot masih belum stasioner karena plot
bergerak masih mendekati nol dan juga grafik ACF masih terlihat turun lambat.
1,0
0,8
0,6
Partial Autocorrelation
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Pada Gambar 4.6 dan Gambar 4.7, juga menunjukkan bahwa grafiknya
lag, atau mengalami pengulangan selama 4 bulan sekali sehingga perlu juga
Gambar 4.8 memperlihatkan Dari plot dan Trend analisis data differencing
pertama diatas dapat dilihat data belum stasioner, karena rata-rata jumlah produksi
bergerak bebas dalam suatu waktu tertentu. Berdasarkan Gambar 4.6 dan 4.7
terlihat bahwa ACF dan PACF tidak memperlihatkan hasil stasioner terhadap rata-
Gambar 4.9 Grafik Trend Analisis Data hasil differencing dapat dilihat
data sudah stasioner, karena rata-rata tidak bergerak bebas dalam suatu waktu
1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
1,0
0,8
0,6
Partial Autocorrelation
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16 18
Lag
Berdasarkan Gambar 4.10 dapat dilihat dari plot ACF bahwa nilai
autokorelasi pada Lag 1 berada di luar batas signifikan atau di luar garis putus-
putus, sedangkan Gambar 4.11 menunjukkan bahwa plot PACF nilai autokorelasi
keberangkatan. Keterbatasan. Plot ACF memiliki 1 lag di atas batas signifikan dan
plot PACF memiliki 1 lag di atas batas signifikan, menunjukkan bahwa terdapat
proses autoregressive (AR) orde 1 dan moving average (MA). ) Grade 1. Ketika
49
Pada Gambar 4.6 grafik ACF differencing pertama terlihat kenaikkan data
terjadi pada lag ke 5 dan lag 6 yaitu sekitar bulan Maret - April pada setiap tahunnya
akan berulang pada periode selanjutnya. Diperkuat pada Gambar 4.7 grafik PACF
pada differencing pertama juga terlihat lag 4 keluar dari garis batas atau mengalami
berikut.
1,0
0,8
0,6
0,4
Autocorrelation
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16
Lag
Gambar 4.12 Grafik Autocorrelation Function (ACF) Data Hasil Differencing Musiman
50
1,0
0,8
0,6
Partial Autocorrelation
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
2 4 6 8 10 12 14 16
Lag
Gambar 4.13 Grafik Partial Autocorrelation Function (PACF) Data Hasil Differencing Musiman
perlakuan differencing dilakukan dua kali, dan terjadi differencing lain yang
untuk autoregression (p) dan moving average (q) untuk non-musiman dan
Nilai orde dapat dilihat pada plot ACF (Gambar 4.10) dan plot PACF (Gambar
4.11). Plot ACF digunakan untuk membaca nilai moving average (q dan Q)
sedangkan plot PACF digunakan untuk membaca nilai autoregressive (p dan P).
Plot ACF pada Gambar 4.10 menunjukkan bahwa plot ACF terpotong pada lapisan
pertama, sehingga model awal diasumsikan sebagai MA(1). SMA(1) adalah untuk
model musiman, karena jeda musim memiliki batas di mana jeda berada pada 4.
51
Plot PACF pada Gambar 4.11 menunjukkan bahwa plot PACF terpotong pada
dan 8 terpotong. (2). Maka hasil identifikasi menghasilkan dugaan model sementara
1) ARIMA(1,2,1)(2,1,1)4
2) ARIMA(1,2,1)(2,1,0)4
3) ARIMA(1,2,1)(1,1,1)4
4) ARIMA(1,2,1)(1,1,0)4
5) ARIMA(1,2,0)(2,1,1)4
6) ARIMA(1,2,0)(2,1,0)4
7) ARIMA(1,2,0)(1,1,1)4
8) ARIMA(1,2,0)(1,1,0)4
9) ARIMA(0,2,1)(2,1,1)4
10) ARIMA(0,2,1)(2,1,0)4
11) ARIMA(0,2,1)(1,1,1)4
12) ARIMA(0,2,1)(1,1,0)4
52
model yang telah di peroleh, dilakukan uji signifikansi parameter dimana model
dengan P-value < 0,005 akan dipilih sebagai bentuk model terbaik yang nantinya
Tabel 4.2 Estimasi Model ARIMA musiman data Kasus DBD DKI Jakarta
52
SAR 4 0,001
SAR 8 0,009
9 ARIMA(0,2,1)(2,1,1)4
MA 1 0
SMA 4 0,015
SAR 4 0
10 ARIMA(0,2,1)(2,1,0)4 SAR 8 0
MA 1 0
SAR 4 0,079
11 ARIMA(0,2,1)(1,1,1)4 MA 1 0
SMA 4 0
SAR 4 0
12 ARIMA(0,2,1)(1,1,0)4
MA 1 0,069
membandingkan asumsi keberatian koefisien, asumsi white noise, dan nilai MSE.
Model ARIMA musiman yang baik adalah model yang memiliki nilai MSE
Berdasarkan dari hasil estimasi dan uji signifikansi parameter, maka model
kemungkinan model terbaik. Selanjutnya akan dilihat nilai MSE dari model
tersebut. Adapun MSE dari model yang signifikan adalah sebagai berikut.
Tabel 4.3 Nilai MSE Model ARIMA musiman data Kasus DBD DKI Jakarta
Berdasarkan Tabel 4.3, model terbaik memiliki nilai MSE terkecil. MSE
Kemudian lihat p-value untuk menentukan apakah residual dalam model adalah
white noise atau random. dan Yongvox. Dalam uji Ljung-Box, model
bebas atau berdistribusi acak. Model fit juga diuji untuk normalitas residual.
tidak acak. Oleh karena itu, model terbaik untuk kasus DBD DKI Jakarta adalah
Diketahui nilai peramalan data Kasus DBD DKI jakarta periode 2015 - 2020
menggunakan model yang dipilih yaitu ARIMA(0,2,1)(2,1,1)4.
Tabel 4.4 Data hasil Peramalan Kasus DBD DKI Jakarta Periode 2021
95% Limits
Prediksi (Hasil
Periode 2021 Prediksi
Pembulatan)
Januari 90,099 90
Februari 185,881 186
Maret 528,689 529
April 393,735 394
Mei 310,817 311
Juni 229,143 229
Juli 307,815 308
Agustus 267,871 268
September 268,036 268
Oktober 286,386 286
November 432,095 432
Desember 415,709 416
dan bulan, perkiraan pasien demam berdarah untuk tahun depan (2021) dan data
cabang regional DKI Jakarta. Desain dashboard yang dibuat memiliki menu yang
berbeda dan visualisasi yang berbeda untuk membantu menganalisis data yang
digunakan. Berikut adalah menu dan visualisasi yang digunakan dalam desain
Berikut merupakan pilihan daerah yang ada di DKI Jakarta dengan sebanyak 6
daerah bagian yaitu Jakarta Barat, Jakarta Timur, Jakarta Selatan, Jakarta Selatan,
Jakarta Pusat, dan Kepulauan Seribu. Pilihan daerah yang ditampilkan dengan
Pada filter daerah Jakarta tersebut dapat dipilih salah satu ataupun semua untuk
menampilkan data aktual, data prediksi dan lokasi dari puskesmas yang dipilih
tersebut.
Menu Filter Tahun digunakan sebagai filter agar dapat fokus menunjukkan
bulan dan tahun mana yang ingin kita lihat jumlah penderita Demam Berdarahnya.
Visualisasi pemilihan bulan dan tahun dapat dilihat pada Gambar 4.17.
Pilihan tahun akan memengaruhi data mana yang ditampilkan untuk data
aktual dan perkiraan. Menu pemilihan bulan dan tahun memungkinkan kita
persebaran demam berdarah di setiap daerah DKI Jakarta. Kita dapat lebih
enam wilayah. Sebuah visualisasi data pasien demam berdarah ditunjukkan pada
gambar berikut.
Pada Gambar 4.18 kita dapat membaca hasil persentase jumlah kasus DBD
untuk setiap daerahnya. Persentase tersebut dapat berubah tergantung kita memilih
Pada Gambar 4.19 menunjukkan bahwa kasus yang paling banyak yaitu
daerah Jakarta Barat, sedangkan Kasus yang paling sedikit yaitu daerah Kepulauan
Seribu.
Pada Gambar 4.20 Grafik menunjukkan jumlah kasus per tahun berdasarkan
bulan, dimana pada grafik tersebut terlihat pada tahun 2016 terjadinya kenaikan
kasus demam berdarah. Dan pada bulan Maret dan April selalu mengalami
Tampilan data peramalan dapat dilihat secara detail dengan memilih bulan
yang diinginkan untuk melihat data peramalan. Kita dapat melihat prakiraan pasien
dalam bentuk angka untuk melihat jumlah prakiraan pasien demam berdarah pada
tahun 2021.
BAB 5
Bab ini menyajikan kesimpulan dari semua proses yang telah dilakukan dan
5.1 Kesimpulan
sebagai berikut:
2. Dari model terbaik yang sudah didapatkan hasil peramalan Kasus DBD DKI
529 kasus, April sebanyak 394 kasus, Mei sebanyak 311 kasus, Juni
sebanyak 229 kasus, Juli sebanyak 308 kasus, Agustus sebanyak 268 kasus,
depan (2021) untuk wilayah tersebut. Sebuah divisi dari DKI Jakarta.. Dari
61
62
5.2 Saran
1. Perlu diadakan penelitian lebih lanjut mengenai data kasus DBD DKI
Jakarta ini dengan berbagai model statistik selain ARIMA agar dapat
dibandingkan keakuratannya.
Badi’ah, R., & Handayani, W. (2020). Analisis Peramalan Permintaan Produk Garam
Bowerman, B. L., & O'Connell, R. T. (1993). Forecasting and Time Series: an Applied
Approach. 3rd.
Dimashanti, A. R., & Sugiman, S. (2021). Peramalan indeks harga konsumen kota
Ekananda, D. M. (2014). Analisis Data Time Series. Jakarta: Mitra Wacana Media.
Data: O'Reilly.
Few, S. (2006). Information dashboard design: The effective visual communication of data
63
(Vol. Vol. 2). Sebastopol, CA: O'reilly.
Harahap, L. (2021). Data Kemenkes: Per Oktober 2021, Kasus DBD Jauh di Bawah Tahun
oktober-2021-kasus-dbd-jauh-di-bawah-tahun-2020.html
Hernadewita, H., Hadi, Y. K., Syaputra, M. J., & Setiawan. (2020). Peramalan Penjualan
Obat Generik Melalui Time Series Forecasting Model Pada Perusahaan Farmasi di
Iriawan, N., & Astuti, S. P. (2006). Mengolah Data Statistik Dengan Mudah Menggunakan
Istiqomah, W., & Darsyah, M. Y. (2018). Efektivitas Metode Arima dan Exponential
Smoothing untuk Meramalkan Nilai Tukar Petani di Jawa Tengah. Paper presented
JabarNews. (2022). Kasus DBD Selama Tahun 2021 di Jawa Barat, Tercatat Alami
selama-tahun-2021-di-jawa-barat-tercatat-alami-penurunan/
Linda, P., Situmorang, M., & Tarigan, G. (2014). Peramalan Penjualan Produksi Teh Botol
Sosro pada PT. Sinar Sosro Sumatera Bagian Utara Tahun 2014 dengan Metode
Makridakis, S., Andersen, A., Carbone, R., Fildes, R., Hibon, M., Lewandowski, R., &
Noname. (2020). Selain Corona, Dinkes Didorong Waspada pada Sebaran DBD. Retrieved
from https://dprd-dkijakartaprov.go.id/selain-corona-dinkes-didorong-waspada-
pada-sebaran-dbd/
Surabaya.
Moving AverageI) untuk Penentuan Tingkat Safety Stock Pada Industri Elektronik.
Rahayu, S., Sukestiyarno, S., & Hendikawati, P. (2018). Peramalan Inflasi di Demak
Razak, F. A., Shitan, M., Hashim, A. H., & Abidin, I. Z. (2009). Load Forecasting Using
Rezaldi, D. A., & Sugiman, S. (2021). Peramalan Metode ARIMA Data Saham PT.
Nasional Matematika.
Public Open Source Berbayar (bukan open sourc. RIS. Jakarta, 13(2), 55-64.
Salwa, N., Tatsara, N., Amalia, R., & Zohra, A. F. (2018). Peramalan Harga Bitcoin
Menggunakan Metode ARIMA (Autoregressive Integrated Moving Average).
Soejoet, Z. (1987). Materi Pokok Analisis Runtun Waktu. Jakarta: Karunika, Universitas
Terbuka.
Semarang.
https://lab_adrk.ub.ac.id/id/power-bi-vs-tableau/
PustakaUtama.
Sumarmo. (1988). Dengue Hemorrhagic Fever in Indonesia. Southeast Asian J Trop Med
Semarang, Semarang.
Wei, W. W. (2006). Time series analysis. In The Oxford Handbook of Quantitative Methods
in Psychology: Vol. 2.
Zhu, Z., Heng, B. H., & Teow, K. L. (2017). Decision Management: Concepts,