LAPORAN
Disusun guna memenuhi salah satu syarat Ujian Akhir Semester dari
mata kuliah Data mining Program Studi DIII RMIK
Oleh:
D22.2018.02290
SEMARANG 2021
BAB I
PENDAHULUAN
A. Latar Belakang
2
Berdasarkan kondisi tersebut, maka Indonesia dalam status
waspada terhadap ancaman virus corona tersebut dan sampai sekarang
belum ditemukan vaksin COVID-19, Dengan kondisi indikasi terpapar
tersebut masyarakat Indonesia harus bersetatus waspada terhadap
ancaman virus COVID-19 ini karena sampai sekarangpun belum terdapat
vaksin yang dapat menyembuhkan orang yang terdiagnosis COVID-19.
3
Berdasarkan data yang terdapat di website satgas penanganan
COVID-19 Pertambahan kasus baru relatif masih tinggi mengindikasikan
bahwa Indonesia belum melewati puncak pandemi. Dalam kondisi seperti
ini, pemecahan masalah yang penting untuk diselesaikan oleh pengambil
keputusan kebijakan pemerintah adalah kapan dan pada tingkat total
kasus berapa pandemi COVID-19 akan berakhir. Untuk bisa mengambil
keputusan banyak sekali cara pemecahan masalah yang berdasarkan
pengolahan data.
4
B. Rumusan Masalah
C. Tujuan
1. Tujuan Umum
Tujuan umum penelitian ini adalah untuk memprediksi kasus harian
COVID-19 di negara Indonesia
2. Tujuan Khusus
a. Mengimplementasikan data mining dengan software rapidminer
dengan metode Linear Regression
b. Mengidentifikasi data kasus harian COVID-19 di Indonesia
c. Menganalisis dan memprediksi data kasus COVID-19 harian di
Indonesia Dengan menggunakan software rapidminer
5
D. Manfaat
6
BAB II
REFERENSI
A. Covid-19
7
dengan beberapa kasus mengalami kesulitan bernapas, dan hasil rontgen
menunjukkan infiltrat pneumonia luas di kedua paru (Isbaniah, 2020).
8
B. Data Mining
1. Deskripsi
Terkadang peneliti dan analis secara sederhana ingin mencoba
mencari cara untuk menggambarkan pola dan kecenderungan yang
terdapat dalam data. Sebagai contoh, petugas pengumpulan suara
mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa
yang tidak cukup profesional akan sedikit didukung dalam pemilihan
presiden. Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target
estimasi lebih kearah numerik daripada kearah kategori. Model
dibangun menggunakan record lengkap yang menyediakan nilai
variabel dari target sebagai nilai prediksi, selanjutnya pada peninjauan
9
berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai
variabel prediksi.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa
dalam prediksi nilai dari hasil akan ada dimasa mendatang.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori, sebagai contoh
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu
pendapatan tinggi, sedang dan rendah.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan atau
memperhatikan dan membentuk kelas objek-objek yang memiliki
kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan
satu dengan lainya dan memiliki ketidak miripan dengan record-record
dalam kluster lain.
6. Asosiasi
Tugas Asosiasi dalam data mining adalah menemukan atribut yang
muncul dalam satu waktu. Dalam dunia bisnis disebut dengan analisis
keranjang belanja.
1. Association
Rule learning Analisis asosiasi atau association rule mining adalah
teknik data mining untuk menemukan aturan assosiatif antara suatu
kombinasi item. Contoh aturan assosiatif dari analisa pembelian di
suatu pasar swalayan adalah dapat diketahuinya berapa besar
kemungkinan seorang pelanggan membeli roti bersamaan dengan
susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat
10
mengatur penempatan barangnya atau merancang kampanye
pemasaran dengan memakai kupon diskon untuk kombinasi barang
tertentu. Analisis asosiasi menjadi terkenal karena aplikasinya untuk
menganalisa isi keranjang belanja di pasar swalayan. Analisis
asosiasi juga sering disebut dengan istilah market basket analysis.
Analisis asosiasi dikenal juga sebagai salah satu teknik data mining
yang menjadi dasar dari berbagai teknik data mining lainnya.
Khususnya salah satu tahap dari analisis asosiasi yang disebut
analisis pola frequensi tinggi (frequent pattern mining) menarik
perhatian banyak peneliti untuk menghasilkan algoritma yang efisien.
2. Clustering
Clustering adalah metode penganalisaan data, yang sering
dimasukkan sebagai salah satu metode Data Mining, yang tujuannya
adalah untuk mengelompokkan data dengan karakteristik yang sama
ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang
berbeda ke ‘wilayah’ yang lain.
3. Decision tree
Dalam decision tree tidak menggunakan vector jarak untuk
mengklasifikasikan obyek. Seringkali data observasi mempunyai
atribut-atribut yang bernilai nominal. Seperti yang diilustrasikan pada,
misalkan obyeknya adalah sekumpulan buah-buahan yang bisa
dibedakan berdasarkan atribut bentuk, warna, ukuran dan rasa.
Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu
bersifat kategoris dan tiap nilai tidak bisa dijumlahkan atau
dikurangkan. Dalam atribut warna ada beberapa nilai yang mungkin
yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai besar,
sedang dan kecil. Dengan nilai-nilai atribut ini, kemudian dibuat
decision tree untuk menentukan suatu obyek termasuk jenis buah apa
jika nilai tiap-tiap atribut diberikan.
4. Linear Regression
Linier Regresi ini diasumsikan bahwa terdapat hubungan antara
variable yang ingin diramalkan (variabel tak bebas) dengan variabel
lain (variabel bebas). Selanjutnya peramalan ini didasarkan pada
asumsi bahwa pola pertumbuhan data historis yang bersifat
11
linier,walaupun sebenarnya tidak 100% linier. Pola pertumbuhan ini
didekati dengan suatu model yang menggambarkan hubungan -
hubungan yang terkait dalam suatu keadaan. Metode Linear
Regression itu sendiri merupakan metode yang cukup populer dan
biasanya digunakan untuk menemukan persamaan dari sebuah data
yang dimana data tersebut saling berhubungan antara variabel satu
dengan variabel yang lain dalam satu database yang cukup besar.
Informasi yang dihasilkan dari data mining dengan metode Lineear
Regression ini sendiri juga bisa dijadikan sebagai dasar untuk
pengambilan keputusan. Metode data mining ini biasanya dipakai
dalam data perhitungan sebuah waktu yang dibutuhkan seseorang
untuk mengantar pizza kepada konsumennya, yang nantinya akan
menunjukkan jarak yang akan ditempuh oleh pengantar pizza itu ,
jumlah pesanan yang 4 dipesan oleh konsumen dan juga banyaknya
lampu lalulintas yang akan dilewatinya (Fikri, 2013).
12
BAB III
METODOLOGI PENELITIAN
A. Penjelasan data
Sumber data pada penelitian ini Yaitu dataset harian covid-19 yang dapat
di download dari website BNPB atau dapat di download melalui alamat website
http://sinta.ristekbrin.go.id/covid/datasets. Dalam data tersebut terdapat data
harian mengenai kasus COVID-19 dari awal bulan Maret 2020 hingga akhir bulan
Desember 2020, dan terdapat beberapa atribut data seperti kasus baru setiap
hari, Jumlah specimen yang diperikas setiap hari, sembuh, dan beberapa atribut
lainya, hingga total kasus sepert gambar berikut ini :
13
tetap, maksutnya data tersebut bisa terlihat apabila pemerintah dan masyarakat
dalam penceghan COVID-19 masih sama dengan metode dan praktik
sebelumnya.
14
Alasan penulis menggunakan metode Linear Regression adalah
agar mendapatkan pola – pola prediksi yang akan terjadi dimasa yang
akan datang seperti yang telah dijelaskan oleh ibu dosen.
C. Alur Penellitian
15
3. Pilih data yang akan di masukkan atau sesuailkan saja. Saya
mengambil data dari bulan November agar data tidak terlalu
banyak dan agar tidak ada missing veliu
16
5. Atau bisa menyesuaikan atribut seperti dibawah ini
17
7. Cari Linear Regression Pada jendela operators dan
sambungkan
18
8. Kemudian Klik Run dan perhatikan hasilnya
19
20
21
BAB IV
HASIL PENELITIAN
Dari penelitian dengan menggunakan data dari BNPB yang tidak terdapat
data Variabel bebas maka saya menggunakan atribut variable tetap semua yaitu
data spesimen harian baru dan kasus harian baru. Dari data tersebut
mendapatkan hasil prediksi harian selanjutnya seperti terdapat pada gambar
dibawah ini :
Dalam gambar tersebut terlihat jelas bahwa hari pertama sampai hari – hari berikutnya
kasus harian baru akan terus bertambah.
22
BAB V
A. KESIMPULAN
B. SARAN
23
3. Sebaiknya dataset COVID-19 terdapat atribut riwayat penyebab pasien
walaupun dalam bentuk persen atau rata rata
4. Mematuhi peraturan – peraturan yang telah dibuat oleh pemerintah dalam
menaggulangi kasus Covid-19
5. Pemerintah Mengevaluasi Kembali Kiat-kiat Yang telah dilaksanakan
untuk meurunkan kasus COVID-19
24
Daftar Pustaka
25