Anda di halaman 1dari 10

DATA SCIENCE

(Dataset: Data Covid-19)


NAMA KELOMPOK 3:

1. 5200311063 Suci Wulandari


2. 5200311086 Yosep Kristiawan
3. 5200311100 Nia Ernawati
4. 5200311154 Zahrul Hidayat Tola
5. 5200311136 Ryandi Pandapotan
Pardede
Dosen Pengampu: Adityo Permana Wibowo, S.Kom, M.Cs
PENGUMPULAN DATA
nh

Dataset ini berisi informasi mengenai kasus-kasus Covid-19 di berbagai kota di Indonesia, yang bersumber dari
covid19.go.id, kemendagri.go.id, bps.go.id, dan bnpb-inacovid19.hub.arcgis.com.
PEMBERSIHAN DATA
Pada data ini ada beberapa atribut
yang terdapat missing values diantaranya
Province, Island, Time Zone, Special
Status, Total Rural Villages, Growth
Factor of New Cases, dan Growth Factor
of New Deaths.
Langkah-Langkah membersihkan missing values:

- Menggunakan operator ReadCSV


- Tambahkan operator Select Attributes
- Tambahkan operator Replace Missing Values
- Hasilnya dapat dilihat di result bagian statistics, otomatis
missing values yang terdapat pada atribut-atribut tadi
menjadi hilang seperti gambar disamping
ANALISIS DAN EKSPLORASI
DATA
Pada eksplorasi data kami menggunakan metode
clustering K-Means. Untuk operator yang kami
gunakan dalam metodi ini melanjutkan dari
pembersihan data pada sebelumnya.

- Menggunakan operator Nominal to Numerical


- Menggunakan operator K-Means dengan mengatur
parameter K = 4
- Menggunakan operator Cluster Distance Performance
Untuk hasilnya dari 149 item terbagi menjadi 4 cluster dengan
jumlah tiap clusternya yaitu:
Cluster 0: memiliki 19 item
Cluster 1: memiliki 20 item
Cluster 2: memiliki 72 item
Cluster 3: memiliki 38 item
Jarak per item pada cluster 0 adalah 20664.218, pada cluster 1 jarak
itemnya 158.540, cluster 2 jarak item 300454.476, dan yang terakhir
cluster 3 jarak per itemnya adalah 1499735.296
PEMODELAN DAN
VISUALISASI DATA
Analisis cluster dalam visualisasi menjelaskan
grafik scatter / bubble yang berisikan anggota
masing masing cluster, yang setiap atribut
mencakup kolom Total Kasus dan Data
kematian menggunakan rapid miner, diketahui
bahwa cluster 0 memiliki rata-rata total death
yang sama yang mencapai 4 kasus berturut-
turut, sedangkan cluster 1 mengalami
kelonjakan total death dengan rata-rata 55
kasus, dan cluster 2 mengalami total death yang
sangat tipis dengan cluster 3 yang mengalami
penurunan dikasus berikutnya.
THANK
YOU
Any Question?

Anda mungkin juga menyukai