Tahapan CRISPDM
a) Business understanding
Tujuan : Melakukan pemodelan untuk memprediksi jumlah kasus dan pola penyebaran
penyakit demam berdarah di Indonesia
Manfaat : Untuk mencegah terjadinya peningkatanpenyakit DHF dalam waktu terdekat.
Agar pemerintah dapat mengeluarkan kebijakan pencegahan yang tepat
b) Data Understanding
Data iklim diperoleh dari dataonline.bmkg.go.id tahun 2010-2015 (data bulanan)
Data tersebut memuat data minimal, maksimal, rata-rata temperature, curah hujan,
kelembapan, waktu penyinaran,
Data kasus DHF
Data kepadatan penduduk dari 17 daerah di Sleman yaitu Minggir, Seyegan, Godean,
Gamping, Mlati, Depok, Berbah, Prambanan, Kalasan, Ngemplak, Ngaglik, Sleman, Tempel,
Turi, Pakem, dan Cangkringan
c) Data preparation
Menggunakan 2 metode linear regresi dan smoothing spline
Input data iklim, jumlah kasus dhf dan kepadatan penduduk.
Mengganti misiing value dengan interpolasi smooting spline dan korelasi antar
ariabel menggunakan Keyser Meyer Olkin
Jumlah kasus DHF di proses dengan data bulanan perdaerah
Kepadatan penduduk dipisahkan dengan data bulanan per daerah
d) Modelling
Menggunakan metode Vector Auto Regresion (VAR)
Figure 1. Depok
Figure 2 Kalasan
Figure 3. Mlati
Berikut merupakan komparasi error peramalan dengan regresi linear dan algoritma arima
Pada table diatas menunjukaan model memiliki error yang relative kecil menggunakan
regresi linear dan algoritma arima
f) Kesimpulan
Peramalan menggunakan VARSA telah membuktikan dapat digunakan untuk
periode pendek atau jangka Panjang dengan error yang relative kecil.
Model tersebut juga dapat menampilkan pola penyebaran penyakit
Spatial Autocorelation Analisis menunjukkan ada 3 daerah di Sleman yang signifikan
tinggi
1. B. Sebutkan cara agar model tersebut dapat di deploy dalam aplikasi berbasis web.
Jawab : Agar model dapat dideploy maka diperlukan sumber informasi yang tersedia secara real
time juga misalnya harian, mingguan, atau bulanan.
Data iklim dari dataonline.bmkg.go.id harus dapat di lihat secara online di website tidak
harus download lebih dulu, kemudian data diambil dengan Teknik scraping
Data kasus DHF harus tersedia secara realtime juga bias dari website pemerintah kota
bagian kesehatan
Data kepadatan penduduk harus dibuatkan sistem agar dapat input secara online
apabila ada pertambahan penduduk
1. Mencari keyword sebagai bahan untuk mencari tweet pada twitter yang relevan
Mulai
Ektaraksi
Tourism Informasi
Information Kuliner
Extraction
Daftar Tweet
Selesei
Mulai
Preprocesing (scaffolding,
tokenezing, stop word removal,
stemming)
Tourism InformationTFExtraction
Perankingan IDF
(perangkingan TF-IDF)
Selesei
3. Scraping tweet
Mulai
Scaffolding
Tokenizing
Stemming
(Nazief dan Andriani)
Selesei
C. Modelling
C. EVALUASI
D. RANCANGAN DEPLOY