Anda di halaman 1dari 25

Prediksi Data Mining Pada Kasus Harian COVID-19

Di Indonesia Dengan Metode Linier Regression


Tahun 2020

LAPORAN

TUGAS AKHIR MATA KULIAH DATA MINING

Disusun guna memenuhi salah satu syarat Ujian Akhir Semester dari
mata kuliah Data mining Program Studi DIII RMIK

Oleh:

Choerul Chafif Asadullah

D22.2018.02290

PROGRAM STUDI DIII REKAM MEDIS DAN INFORMASI KESEHATAN

FAKULTAS KESEHATAN UNIVERSITAS DIAN NUSWANTORO

SEMARANG 2021
BAB I

PENDAHULUAN

A. Latar Belakang

Saat ini beberapa negara di dunia sedang mealaksanakan


pencegahan terhadap penyebaran sebuah virus yang disebut Corona
Viruses (CoV) merupakan virus dari golongan penyebab flu hingga
penyakit yang lebih serius seperti Middle East Respiratory Syndrome
(MERS-CoV) and Severe Acute Respiratory Syndrome (SARS-CoV).
Corona Viruses (Cov) adalah virus jenis baru yang belum pernah
teridentifikasi menyerang manusia sebelumnya dan saat ini biasa disebut
COVID-19 (WHO, 2020).

Sejak tanggal 2 maret 2020 kasus infeksi COVID-19 secara resmi


diakui dan dicatat di Indonesia dimana belom terdapat data dari indikasi
terpapar virus covid-19 pada saat itu, kemudian terdapat data per 18 juni
2020 dari Our Word In Data(Roser et al., 2020). total kasus penduduk
Indonesia persejuta adalah sebesar 151,47 dengan rerata kasus baru
sebesar 3,45 selama 14 hari (Pratikto, 2020).

2
Berdasarkan kondisi tersebut, maka Indonesia dalam status
waspada terhadap ancaman virus corona tersebut dan sampai sekarang
belum ditemukan vaksin COVID-19, Dengan kondisi indikasi terpapar
tersebut masyarakat Indonesia harus bersetatus waspada terhadap
ancaman virus COVID-19 ini karena sampai sekarangpun belum terdapat
vaksin yang dapat menyembuhkan orang yang terdiagnosis COVID-19.

Berdasarkan banyak referensi penelitian, penyebaran utama


COVID-19 diduga melalui metode penyebaran droplet saluran pernafasan
yang terpapar COVID-19 dan melakukan kontak dengan pembawa
COVID-19. Droplet yang terdapat COVID-19 ini dikeluarkan oleh
pembawa virus pada saat bersin, batuk, atau bahkan berbicara. Droplet
dapat menempel pada pakaian atau benda disekitar pembawa COVID-19
dan dapat keluar dengan jarak tertentu (biasanya 1 meter) saat pembawa
COVID-19 bersin atau batuk dan berbicara(Watratan & Moeis, 2020) .

Partikel droplet dapat mengendap di udara karena cukup besar,


jadi COVID-19 tidak akan bertahan lama dan mati saat terkena udara
panas matahari. Namun pemerintah telah mewajibkan masyarakat untuk
menggunakan alat pelindung wajah (seperti masker kain, face shield, dan
lain-lain) yang menutupi hidung dan mulut untuk mencegah penyebaran
droplet tersebut (Wiguna et al., 2020). Dan untuk mencegah dari
peluasan penyebaran virus COVID-19 pemerintah juga membuat
berbagai peraturan seperti melaksanakan pembatasan sosial atau social
distancing. Harapannya dengan melaksanakan pembatasan sosial,
setiap masyarakat tidak akan menjadi penular maupun tertular karena
tidak melakukan kontak dengan siapapun sehingga laju penyebaran
dapat menurun (Watratan & Moeis, 2020).

3
Berdasarkan data yang terdapat di website satgas penanganan
COVID-19 Pertambahan kasus baru relatif masih tinggi mengindikasikan
bahwa Indonesia belum melewati puncak pandemi. Dalam kondisi seperti
ini, pemecahan masalah yang penting untuk diselesaikan oleh pengambil
keputusan kebijakan pemerintah adalah kapan dan pada tingkat total
kasus berapa pandemi COVID-19 akan berakhir. Untuk bisa mengambil
keputusan banyak sekali cara pemecahan masalah yang berdasarkan
pengolahan data.

Berdasarkan jurnal “The Use of Big Data in The Public Policy


Process: Paving The Way of Evidence Based Governance” yang
menunjukkan bahwa data dapat digunakan untuk meningkatkan efisiensi,
efektivitas, transparansi pemerintah, dan penyedia layanan yang lebih
baik berdasarkan pada peningkatan wawasan tentang kebutuhan dan
tuntutan warga, serta pembuatan kebijakan yang lebih informative data
dapat digunakan dalam pengambil kebijakan (data-driven policy)
(Studinka & Guenduez, 2018),

Sesungguhnya peran data yang lebih utama dalam pengambilan


keputusan adalah data prediksi, karena data prediksi dapat dipakai untuk
melihat dan memperkirakan kejadian atau keadaan dimasa yang akan
datang sehingga sangat berguna untuk dasar pengambilan keputusan
kebijakan seperti penetapan kondisi pembatasan berskala besar (PSBB)
(Wiguna et al., 2020). maka penulis tertarik untuk menganalisa dan
memprediksi penyebaran kasus COVID-19 dalam mendukung
Pemerintah untuk melakukan kebijakan publik maupun intervensi untuk
mengurangi penyebaran COVID-19 dindonesia.

4
B. Rumusan Masalah

Berdasarkan latar belakang di atas terdapat banyak macam


metode dalam memprediksi sesuatu untuk pemecahan masalah dan
pengambilan keputusan salah satunya adalah dengan cara
mengimplementasikan prediksi data mining dengan metode linear
regression. Maka penulis akan mencoba menganalisis data dengan
rapidminer dan dengan metode linear regresssion.

C. Tujuan

1. Tujuan Umum
Tujuan umum penelitian ini adalah untuk memprediksi kasus harian
COVID-19 di negara Indonesia

2. Tujuan Khusus
a. Mengimplementasikan data mining dengan software rapidminer
dengan metode Linear Regression
b. Mengidentifikasi data kasus harian COVID-19 di Indonesia
c. Menganalisis dan memprediksi data kasus COVID-19 harian di
Indonesia Dengan menggunakan software rapidminer

5
D. Manfaat

Manfaat penelitian ini adalah :

1. Memberi semangat kepada masyarakat untuk melaksanakan protokol


kesehatan dalam pencegahan COVID-19
2. Sebagai referensi bagi semua pihak yang melaksanakan penelitian
COVID-19 di Indonesia
3. Sebagai bahan referensi pertimbangan dalam pengambilan
keputusan pemerintah
4. Sebagai bahan referensi bagi kalangan akademik
5. Sebagai pengalaman belajar datamining dalam memprediksi kasus
COVID-19 di Indonesia bagi penulis
6. Sebagai tugas akhir mata kuliah datamining di Universitas Dian
Nuswantoro

6
BAB II

REFERENSI

A. Covid-19

COVID–19 merupakan singkatan dari “Coronavirus Disease 2019”


masuk dalam kategori virus menular dengan gejala ringan sampai berat
seperti seperti Middle East Respiratory Syndrome (MERS) dan Severe
Acute Respiratory Syndrome (SARS). Covid-19 ini adalah jenis virus baru
yang belum pernah terdiagnosa sebelumnya terhadap manusia. Dari
beberapa penelitian virus ini dinamakan Sars-CoV-2 yang merupakan
virus hewan kemudian tertular kepada manusia atau bisa disebut
zoonosis, dari banyaknya hewan sampai sekarang masih diteliti dan
belom diketahui sumber penularanya seperti SARS yang ditransmisikan
dari kucing luwak (civet cats) ke manusia dan MERS dari unta ke
manusia (Isbaniah, 2020).

Pada orang yang terpapar COVID-19 pada awalnya terdapat


beberapa gejala ringan seperti demam, bersin, batuk, demam. Ciri khas
dari terpaparnya COVID-19 terdapat gejala pernafasan yang berat
bahkan terdapat sesak nafas atau pernafasan akut. Masa inkubasi
COVID-19 biasanya berlangsung 5-6 hari dan paling lama 14 hari. Pada
kasus COVID-19 yang berat dapat menyebabkan pneumonia, sindrom
pernapasan akut, gagal ginjal, dan bahkan kematian. Tanda-tanda dan
gejala klinis yang dilaporkan pada sebagian besar kasus adalah demam,

7
dengan beberapa kasus mengalami kesulitan bernapas, dan hasil rontgen
menunjukkan infiltrat pneumonia luas di kedua paru (Isbaniah, 2020).

Sebagaimana beberapa laporan yang telah diterima bahwa


penularan COVID-19 bukan melalui penyebaran udara melainkan
ditularkan melalui kontak dekat dan droplet. Mereka adalah orang-orang
yang mempunyai hubungan dekat dengan pasien COVID-19 termasuk
yang merawat pasien. Hal yang paling utama dalam menyelesaikan
kasus COVID-19 adalah melaksanakan pencegahan dan upaya
pengurangan resiko terpaparnya COVID-19 terhadap lingkungan
masyarakat seperti langkah-langkah berikut :

1. Sering melaksanakan penjagaan kebersihan diri dengan diawali


mencuci tangan menggunakan hand sanitizer jika tidak kotor dan
apabila tanganya kotor maka cucui tangan menggunakan sabun
2. Tidak boleh sering –sering menyentuh wajah seperti hidung, mata,
dan mulut
3. Pada saat bersin atau batuk terapkanlah etika yang bagus seperti
menutupnya dengan lengan atas bagian dalam atau bisa
menggunakan tissue dan buang tissu ke tempat sampah
4. Selalu memakai masker saat bepergian dan membawa handsatinizer
untuk mencuci tangan
5. Terapkan menjaga jarak (minimal 1m) dari orang yang mengalami
beberapa gejala COVID-19 (Isbaniah, 2020).

8
B. Data Mining

Berdasarkan buku yang berjudu “Pengantar Data Mining” yang


ditulis oleh Sani Susanto ph.D dan Dedy Suryadi S.T.M.S. Istilah data
mining memiliki beberapa persamaan pengertian dengan knolege
discovery dan pattern recognition yaitu penemuan pengetahuan dan
pengenalan pola terhadap penggalian data. Maka data mining dapat di
artikan menemukan, menambang, menggali bongkahan data dari
informasi yang kita miliki. Demikianlah pekerjaan inti dari istilah data
mining (Susanto & Suryadi, 2010).

Mengutip dari jurnal “Penerapan Data Mining Untuk Mengetahui


Tingkat Kekuatan Beton Yang Dihasilkan Dengan Metode Estimasi
Menggunakan Linear Regression” yang di tulis oleh Fikri, 2013. Data
mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu :

1. Deskripsi
Terkadang peneliti dan analis secara sederhana ingin mencoba
mencari cara untuk menggambarkan pola dan kecenderungan yang
terdapat dalam data. Sebagai contoh, petugas pengumpulan suara
mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa
yang tidak cukup profesional akan sedikit didukung dalam pemilihan
presiden. Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target
estimasi lebih kearah numerik daripada kearah kategori. Model
dibangun menggunakan record lengkap yang menyediakan nilai
variabel dari target sebagai nilai prediksi, selanjutnya pada peninjauan

9
berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai
variabel prediksi.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa
dalam prediksi nilai dari hasil akan ada dimasa mendatang.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori, sebagai contoh
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu
pendapatan tinggi, sedang dan rendah.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan atau
memperhatikan dan membentuk kelas objek-objek yang memiliki
kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan
satu dengan lainya dan memiliki ketidak miripan dengan record-record
dalam kluster lain.
6. Asosiasi
Tugas Asosiasi dalam data mining adalah menemukan atribut yang
muncul dalam satu waktu. Dalam dunia bisnis disebut dengan analisis
keranjang belanja.

Dari macam macam pengelompokan data mining kita dapat


menentukan apa yang akan kita pilih untuk melakukan sebuah penelitian.
Metode Data Mining Ada beberapa klasifikasi metode data mining,
sebagai berikut :

1. Association
Rule learning Analisis asosiasi atau association rule mining adalah
teknik data mining untuk menemukan aturan assosiatif antara suatu
kombinasi item. Contoh aturan assosiatif dari analisa pembelian di
suatu pasar swalayan adalah dapat diketahuinya berapa besar
kemungkinan seorang pelanggan membeli roti bersamaan dengan
susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat

10
mengatur penempatan barangnya atau merancang kampanye
pemasaran dengan memakai kupon diskon untuk kombinasi barang
tertentu. Analisis asosiasi menjadi terkenal karena aplikasinya untuk
menganalisa isi keranjang belanja di pasar swalayan. Analisis
asosiasi juga sering disebut dengan istilah market basket analysis.
Analisis asosiasi dikenal juga sebagai salah satu teknik data mining
yang menjadi dasar dari berbagai teknik data mining lainnya.
Khususnya salah satu tahap dari analisis asosiasi yang disebut
analisis pola frequensi tinggi (frequent pattern mining) menarik
perhatian banyak peneliti untuk menghasilkan algoritma yang efisien.
2. Clustering
Clustering adalah metode penganalisaan data, yang sering
dimasukkan sebagai salah satu metode Data Mining, yang tujuannya
adalah untuk mengelompokkan data dengan karakteristik yang sama
ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang
berbeda ke ‘wilayah’ yang lain.
3. Decision tree
Dalam decision tree tidak menggunakan vector jarak untuk
mengklasifikasikan obyek. Seringkali data observasi mempunyai
atribut-atribut yang bernilai nominal. Seperti yang diilustrasikan pada,
misalkan obyeknya adalah sekumpulan buah-buahan yang bisa
dibedakan berdasarkan atribut bentuk, warna, ukuran dan rasa.
Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu
bersifat kategoris dan tiap nilai tidak bisa dijumlahkan atau
dikurangkan. Dalam atribut warna ada beberapa nilai yang mungkin
yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai besar,
sedang dan kecil. Dengan nilai-nilai atribut ini, kemudian dibuat
decision tree untuk menentukan suatu obyek termasuk jenis buah apa
jika nilai tiap-tiap atribut diberikan.
4. Linear Regression
Linier Regresi ini diasumsikan bahwa terdapat hubungan antara
variable yang ingin diramalkan (variabel tak bebas) dengan variabel
lain (variabel bebas). Selanjutnya peramalan ini didasarkan pada
asumsi bahwa pola pertumbuhan data historis yang bersifat

11
linier,walaupun sebenarnya tidak 100% linier. Pola pertumbuhan ini
didekati dengan suatu model yang menggambarkan hubungan -
hubungan yang terkait dalam suatu keadaan. Metode Linear
Regression itu sendiri merupakan metode yang cukup populer dan
biasanya digunakan untuk menemukan persamaan dari sebuah data
yang dimana data tersebut saling berhubungan antara variabel satu
dengan variabel yang lain dalam satu database yang cukup besar.
Informasi yang dihasilkan dari data mining dengan metode Lineear
Regression ini sendiri juga bisa dijadikan sebagai dasar untuk
pengambilan keputusan. Metode data mining ini biasanya dipakai
dalam data perhitungan sebuah waktu yang dibutuhkan seseorang
untuk mengantar pizza kepada konsumennya, yang nantinya akan
menunjukkan jarak yang akan ditempuh oleh pengantar pizza itu ,
jumlah pesanan yang 4 dipesan oleh konsumen dan juga banyaknya
lampu lalulintas yang akan dilewatinya (Fikri, 2013).

12
BAB III

METODOLOGI PENELITIAN

A. Penjelasan data

Sumber data pada penelitian ini Yaitu dataset harian covid-19 yang dapat
di download dari website BNPB atau dapat di download melalui alamat website
http://sinta.ristekbrin.go.id/covid/datasets. Dalam data tersebut terdapat data
harian mengenai kasus COVID-19 dari awal bulan Maret 2020 hingga akhir bulan
Desember 2020, dan terdapat beberapa atribut data seperti kasus baru setiap
hari, Jumlah specimen yang diperikas setiap hari, sembuh, dan beberapa atribut
lainya, hingga total kasus sepert gambar berikut ini :

Sayangnya didalam data tersebut tidak terdapat atribut data variable


bebas yang dapat mempengaruhi pertambahan kasus baru atau pasien sembuh
COVID-19 sehingga pada penelitian ini hanya menghasilkan data prediksi yang

13
tetap, maksutnya data tersebut bisa terlihat apabila pemerintah dan masyarakat
dalam penceghan COVID-19 masih sama dengan metode dan praktik
sebelumnya.

B. Metode yang digunakan

Dalam penelitian ini penulis melaksanakan prediksi dengan teknik


data mining dengan metode Linear Regression dilaksanakan
menggunakan Software Rapid Miner yang mana Algoritma Linear
Regression termasuk jenis aturan classification and regression pada data
mining yang biasa dipakai untuk melihat pola – pola prediksi data.

Mengutip dari Fikri(2013) “Analisis Linear Regression adalah


teknik data mining untuk menentukan bahwa terdapat hubungan antara
variable yang ingin diramalkan (variabel tak bebas) dengan variabel lain
(variabel bebas). Selanjutnya peramalan ini didasarkan pada asumsi
bahwa pola pertumbuhan data historis yang bersifat linier,walaupun
sebenarnya tidak 100% linier. Pola pertumbuhan ini didekati dengan
suatu model yang menggambarkan hubungan-hubungan yang terkait
dalam suatu keadaan”.

14
Alasan penulis menggunakan metode Linear Regression adalah
agar mendapatkan pola – pola prediksi yang akan terjadi dimasa yang
akan datang seperti yang telah dijelaskan oleh ibu dosen.

C. Alur Penellitian

1. Membuat Project Baru dan Mencari read excel pada jendela


operators

2. Kemudian cari data yang akan di prediksi dengan mengklik


impord configuration Wizard pada jendela para meters

15
3. Pilih data yang akan di masukkan atau sesuailkan saja. Saya
mengambil data dari bulan November agar data tidak terlalu
banyak dan agar tidak ada missing veliu

4. Sesuaikan role dan jenis atribut

16
5. Atau bisa menyesuaikan atribut seperti dibawah ini

6. Cari windowing pada jendela operators dan setting


parameternya

17
7. Cari Linear Regression Pada jendela operators dan
sambungkan

18
8. Kemudian Klik Run dan perhatikan hasilnya

19
20
21
BAB IV

HASIL PENELITIAN

Dari penelitian dengan menggunakan data dari BNPB yang tidak terdapat
data Variabel bebas maka saya menggunakan atribut variable tetap semua yaitu
data spesimen harian baru dan kasus harian baru. Dari data tersebut
mendapatkan hasil prediksi harian selanjutnya seperti terdapat pada gambar
dibawah ini :

Dalam gambar tersebut terlihat jelas bahwa hari pertama sampai hari – hari berikutnya
kasus harian baru akan terus bertambah.

22
BAB V

KESIMPULAN DAN SARAN

A. KESIMPULAN

Dari hasil data yang telah dianalisis menggunakan Rapidminer


dengan metode Linear Regression dan karena tidak menggunakan atribut
variabel bebas artinya apabila pemerintah dan masyarakat mempraktikan hal
yang sama dengan sebelumnya atau bahkan menghiraukan protokol
kesehatan maka Kasus COVID-19 di Indonesia akan meningkat terus dan
trus bertambah stiap harinya, sehingga visi dan misi pemerintah dalam
mensejahterakan kesehatan masyarakat Indonesia.

B. SARAN

Dari hasil penelitian dan kesimpulan maka seluruh kalangan masyarakat


yang ada di Indonesia harus dapat berkerja sama untuk menerunkan kasus
baru COVID-19 karena jika tidak COVID-19 akan terus berkembang dan
negara Indonesia akan menjadi negara yang kasus terbanyak COVID-19
untuk itu Penulis memiliki saran-saran sebagaimana seperti berikut :

1. Selalu mematuhi protocol kesehatan


2. Selalu menjaga jarak atau membatasi social

23
3. Sebaiknya dataset COVID-19 terdapat atribut riwayat penyebab pasien
walaupun dalam bentuk persen atau rata rata
4. Mematuhi peraturan – peraturan yang telah dibuat oleh pemerintah dalam
menaggulangi kasus Covid-19
5. Pemerintah Mengevaluasi Kembali Kiat-kiat Yang telah dilaksanakan
untuk meurunkan kasus COVID-19

24
Daftar Pustaka

1. Fikri, A. (2013). Penerapan Data Mining Untuk Mengetahui Tingkat


Kekuatan Beton Yang Dihasilkan Dengan Metode Estimasi Menggunakan
Linear Regression. Universitas Dian Nuswantoro, Semarang.
2. Isbaniah, F. (2020). Pedoman Pencegahan dan Pengendalian Corona
Virus Disease (Covid-19).
3. Organization, W. H. (2020). Coronavirus disease 2019 (COVID-19):
situation report, 82.
4. Pratikto, F. R. (2020). Prediksi Akhir Pandemi COVID-19 di Indonesia
dengan Simulasi Berbasis Model Pertumbuhan Parametrik. Jurnal
Rekayasa Sistem Industri, 9(2), 63–68.
5. Roser, M., Ritchie, H., Ortiz-Ospina, E., & Hasell, J. (2020). Coronavirus
pandemic (COVID-19). Our World in Data.
6. Studinka, J., & Guenduez, A. A. (2018). The Use of Big Data in the Public
Policy Process-Paving the Way for Evidence-Based Governance.
7. Susanto, S., & Suryadi, D. (2010). Pengantar data mining: mengagali
pengetahuan dari bongkahan data. Penerbit Andi.
8. Watratan, A. F., & Moeis, D. (2020). Implementasi Algoritma Naive Bayes
Untuk Memprediksi Tingkat Penyebaran Covid-19 Di Indonesia. Journal
of Applied Computer Science and Technology, 1(1), 7–14.
9. Wiguna, H., Nugraha, Y., Andika, A., Kanggrawan, J. I., & Suherman, A.
L. (2020). Kebijakan Berbasis Data: Analisis dan Prediksi Penyebaran
COVID-19 di Jakarta dengan Metode Autoregressive Integrated Moving
Average (ARIMA). Jurnal Sistem Cerdas, 3(2), 74–83.

25

Anda mungkin juga menyukai