Anda di halaman 1dari 14

LAPORAN PRAKTIKUM

PENGANTAR KOMPUTASI CERDAS

VISUALISASI DATA DAN PREPROCESSING DATA

AHMAD HANAFI PRASETYO

205090401111057

Asisten :

1. Muhaimin Ilyas - 195090400111006


2. Adli Djul Ikram - 195090400111007
3. Fawaz Adiwidya - 195090400111010

PROGRAM STUDI MATEMATIKA

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS BRAWIJAYA

2023
DAFTAR ISI

DAFTAR ISI ............................................................................................... 1


BAB I DASAR TEORI ............................................................................... 2
1.1 Visualisasi Data..................................................................................... 2
1.2 Statistik .................................................................................................. 2
BAB II SOAL .............................................................................................. 3
2.1 Soal Nomor 1 ......................................................................................... 3
2.2 Soal Nomor 2 ......................................................................................... 3
2.3 Soal Nomor 3 ......................................................................................... 3
2.4 Soal Nomor 4 ......................................................................................... 4
BAB III SOURCE CODE .......................................................................... 4
3.1 Program Nomor 1 ................................................................................. 4
3.2 Program Nomor 2 ................................................................................. 5
3.3 Program Nomor 3 ................................................................................. 5
3.4 Program Nomor 4 ................................................................................. 7
BAB IV PEMBAHASAN ........................................................................... 8
4.1 Pembahasan Nomor 1 .......................................................................... 8
4.2 Pembahasan Nomor 2 .......................................................................... 9
4.3 Pembahasan Nomor 3 ........................................................................ 10
4.4 Pembahasan Nomor 4 ........................................................................ 11
DAFTAR PUSTAKA ............................................................................... 13

1
BAB I

DASAR TEORI

1.1 Visualisasi Data

Visualisasi data adalah proses penyajian data dalam bentuk grafik yang
membuat informasi mudah dimengerti, hal ini membantu menjelaskan
tentang fakta dan menentukan arah tindakan (Rizki, 2020).

Definisi visualisasi data menjelaskan tentang pentingnya data dengan


menempatkan data dalam konteks visual. Hal ini melibatkan penciptaan dan
studi representasi visual dari data yang dikenal sebagai informasi. Visualisasi
data memungkinkan pengguna untuk memperoleh pengetahuan yang lebih
banyak mengenai data mentah yang didapatkan dari berbagai sumber.

Visualisasi data tidak hanya mengubah data menjadi grafik visual, akan
tetapi visualisasi data juga memerlukan perencanaan. Setiap jenis data
memerlukan teknik visualisasi yang sesuai berdasarkan kebutuhannya.
Berdasarkan tingkat kompleksitas data, untuk menghasilkan solusi yang
berharga perlu melibatkan berbagai disiplin ilmu, seperti statistika, data
mining, desain grafis, dan information visualization (Rizki, 2020).

1.2 Statistik

Statistik adalah sebuah ilmu yang digunakan untuk memecahkan suatu


permasalahan dengan menggunakan beberapa tahapan yaitu pengumpulan
data, pengolahan data, Analisis data dan intepretasi data serta kesimpulan
dan keputusan yang diambil berdasarkan Analisis yang telah dilakukan
(Rizki, 2020).

Pada laporan kali ini, digunakan jenis statistika deskriptif yaitu statistika
yang menggunakan metode numerik dan grafik untuk mencari pola dalam
suatu kumpulan data, meringkas informasi yang terkandung dalam kumpulan
data, dan menghadirkan informasi dalam bentuk yang diinginkan.

2
BAB II

SOAL

2.1 Soal Nomor 1

Buatlah visualisasi data dari jumlah orang terkonfirmasi COVID 19 dari data
set yang diberikan dari negara yang ada di asia tenggara

2.2 Soal Nomor 2

Lakukan Normalisasi z-score pada data orang terkonfirmasi COVID 19 dari


data set yang diberikan untuk negara di asia tenggara

2.3 Soal Nomor 3

Lakukan visualisasi data hasil Normalisasi z-score pada data orang


terkonfirmasi COVID 19 untuk negara di asia tenggara

2.4 Soal Nomor 4

Buatlah visualisasi data dari jumlah orang yang meninggal karena COVID
19 dari data set yang diberikan dari negara yang ada di asia tenggara

3
BAB III

SOURCE CODE

3.1 Program Nomor 1

import matplotlib.pyplot as plt


import pandas as pd
data_covid19 = pd.read_csv('confirmed_global.csv')
AsiaTenggara = ['Brunei', 'Burma', 'Cambodia',
'Indonesia', 'Laos', 'Malaysia', 'Philippines',
'Singapore', 'Thailand',
'Timor-Leste', 'Vietnam']
data_AT =
data_covid19.loc[data_covid19['Country/Region'].isin(As
iaTenggara) & data_covid19['Province/State'].isna()]
data_AT.drop(['Province/State', 'Lat', 'Long'], axis=1)
data_AT = data_AT.groupby('Country/Region').min()
p=[]
for i in range(0, 3):
for j in range(2, 13):
if(i == 2):
if(j < 3):
p.append(''+str(j)+'/1/2'+str(i)+'')
else:
p.append(''+str(j)+'/1/2'+str(i)+'')
data_baru = data_AT[p]
fig, ax = plt.subplots()
ax.plot(data_baru.transpose(), label=AsiaTenggara,
lw=3)
ax.set_title('COVID-19 di Asia Tenggara')
ax.set_xlabel('Tanggal')
ax.set_ylabel('Jumlah')
plt.xticks(rotation=90)
plt.yticks([0, 1000000, 2000000, 3000000, 4000000], [
r'${0}$', r'$ {1}000000$', r'${2}000000 $',
r'${3}000000 $', r'${4}000000 $'])
plt.legend()

4
plt.grid(True)
plt.show()

3.2 Program Nomor 2

import pandas as pd
from sklearn.preprocessing import StandardScaler
data_covid19 = pd.read_csv('confirmed_global.csv')
AsiaTenggara = ['Brunei', 'Burma', 'Cambodia',
'Indonesia', 'Laos', 'Malaysia', 'Philippines',
'Singapore', 'Thailand',
'Timor-Leste', 'Vietnam']
data_AT =
data_covid19.loc[data_covid19['Country/Region'].isin(As
iaTenggara)]
data_AT.drop(['Province/State', 'Lat', 'Long'], axis=1)
data_AT = data_AT.groupby('Country/Region').min()
p = []
for i in range(0, 3):
for j in range(2, 13):
if(i == 2):
if(j < 3):
p.append(''+str(j)+'/1/2'+str(i)+'')
else:
p.append(''+str(j)+'/1/2'+str(i)+'')
data_baru = data_AT[p]
ss = StandardScaler()
data_zscore = data_baru.values
data_zscore = ss.fit_transform(data_zscore)
data_zscore = pd.DataFrame(data_zscore, AsiaTenggara,
p)
print(data_zscore)

3.3 Program Nomor 3

import matplotlib.pyplot as plt


import pandas as pd
from sklearn.preprocessing import StandardScaler

5
data_covid19 = pd.read_csv('confirmed_global.csv')
AsiaTenggara = ['Brunei', 'Burma', 'Cambodia',
'Indonesia', 'Laos', 'Malaysia', 'Philippines',
'Singapore', 'Thailand',
'Timor-Leste', 'Vietnam']
data_AT =
data_covid19.loc[data_covid19['Country/Region'].isin(As
iaTenggara)]
data_AT.drop(['Province/State', 'Lat', 'Long'], axis=1)
data_AT = data_AT.groupby('Country/Region').min()
p = []
for i in range(0, 3):
for j in range(2, 13):
if(i == 2):
if(j < 3):
p.append(''+str(j)+'/1/2'+str(i)+'')
else:
p.append(''+str(j)+'/1/2'+str(i)+'')
data_baru = data_AT[p]
ss = StandardScaler()
data_zscore = data_baru.values
data_zscore = ss.fit_transform(data_zscore)
data_zscore = pd.DataFrame(data_zscore, AsiaTenggara,
p)
print(data_zscore)
fig, ax = plt.subplots()
ax.plot(data_zscore.transpose(), label=AsiaTenggara,
lw=5)
ax.set_title('Covid-19 di Asia Tenggara (z-score)')
ax.set_xlabel('Tanggal')
ax.set_ylabel('Jumlah')
ax.set_ylim([-2, 5])
plt.xticks(rotation=90)
plt.legend()
plt.grid(True)
plt.show()

6
3.4 Program Nomor 4

import matplotlib.pyplot as plt


import pandas as pd
data_covid19 = pd.read_csv('deaths_global.csv')
AsiaTenggara = ['Brunei', 'Burma', 'Cambodia',
'Indonesia', 'Laos', 'Malaysia', 'Philippines',
'Singapore', 'Thailand',
'Timor-Leste', 'Vietnam']
data_AT =
data_covid19.loc[data_covid19['Country/Region'].isin(As
iaTenggara) & data_covid19['Province/State'].isna()]
data_AT.drop(['Province/State', 'Lat', 'Long'], axis=1)
data_AT = data_AT.groupby('Country/Region').min()
p = []
for i in range(0, 3):
for j in range(2, 13):
if(i == 2):
if(j < 3):
p.append(''+str(j)+'/1/2'+str(i)+'')
else:
p.append(''+str(j)+'/1/2'+str(i)+'')
data_baru = data_AT[p]
fig, ax = plt.subplots()
ax.plot(data_baru.transpose(), label=AsiaTenggara,
lw=3)
ax.set_title('Angka Kematian COVID-19 di Asia
Tenggara')
ax.set_xlabel('Tanggal')
ax.set_ylabel('Jumlah')
plt.xticks(rotation=90)
plt.yticks([0, 45000, 90000, 135000, 180000], [
r'${0}$', r'$ {4}5000$', r'${9}0000 $', r'${1}35000
$', r'${1}80000 $'])
plt.legend()
plt.grid(True)
plt.show()

7
BAB IV

PEMBAHASAN

4.1 Pembahasan Nomor 1

Perintah Penjelasan
Lines 1-2 Import packages yang akan digunakan
Membaca dataset confirmed_global.csv yang telah
Lines 3-9 diberikan dan memilih country dengan kategori Asia
Tenggara
Lakukan perhitungan dengan perulangan for dan bantuan
Lines 10-17 array 1 dimensi p=[] untuk mendapatkan nilai baru dan
simpan ke dalam variabel bernama data_baru
Menampilkan visualisasi dalam bentuk grafik x dan y.
Lines 18-29 Untuk x adalah perubahan waktu dan y adalah kuantitas
orang yang terkonfirmasi COVID-19

8
Hasil analisa :

Dapat diketahui bahwa orang terkonfirmasi COVID-19 di Asia Tenggara


benar adanya, dibuktikan dengan dataset yang diberikan (confirmed_global
.csv). dari data yang sudah diberikan, Indonesia menduduki posisi pertama
sebagai negara dengan jumlah orang terkonfirmasi COVID-19 terbanyak di
Asia Tenggara hingga update pada awal tahun 2022.

4.2 Pembahasan Nomor 2

Perintah Penjelasan
Lines 1-2 Import packages yang akan digunakan
Membaca dataset confirmed_global.csv yang telah
Lines 3-9 diberikan dan memilih country dengan kategori Asia
Tenggara
Lakukan perhitungan dengan perulangan for dan bantuan
Lines 10-17 array 1 dimensi p=[] untuk mendapatkan nilai baru dan
simpan ke dalam variabel bernama data_baru
Membuat normalisasi dengan syntax StandardScaler()
Lines 18-22
dan akan diprint untuk data_zscore

9
Hasil analisa :

Setelah dilakukan visualisasi pada nomor sebelumnya, kali ini akan


dilakukan normalisasi database dalam skala (-1 sampai 3) guna membentuk
struktur relasi yang baik (tanpa redudansi/pengulangan data) serta sebagian
besar ambiguitas bisa dihilangkan.

4.3 Pembahasan Nomor 3

Perintah Penjelasan
Lines 1-2 Import packages yang akan digunakan
Membaca dataset confirmed_global.csv yang telah
Lines 3-9 diberikan dan memilih country dengan kategori Asia
Tenggara
Lakukan perhitungan dengan perulangan for dan bantuan
Lines 10-17 array 1 dimensi p=[] untuk mendapatkan nilai baru dan
simpan ke dalam variabel bernama data_baru
Membuat normalisasi dengan syntax StandardScaler()
Lines 18-22
dan akan diprint untuk data_zscore
Menampilkan visualisasi dalam bentuk grafik x dan y
setelah dilakukan normalisasi. Untuk x adalah perubahan
Lines 24-33
waktu dan y adalah kuantitas orang yang terkonfirmasi
COVID-19

10
Hasil analisa :

Setelah dilakukan normalisasi, akan dilakukan visualisasi dalam tabel di atas.


Diketahui bahwa pada awal tahun 2020 jumlah terkonfirmasi COVID-19 di
Asia Tenggara didominasi oleh Singapore, namun pada awal tahun 2022,
Indonesia mendominasinya. Terdapat 1 titik perubahan drastis (naik dan
turun) pada bulan April 2020.

4.4 Pembahasan Nomor 4

Perintah Penjelasan
Lines 1-2 Import packages yang akan digunakan
Membaca dataset deaths_global.csv yang telah
Lines 3-9 diberikan dan memilih country dengan kategori Asia
Tenggara
Lakukan perhitungan dengan perulangan for dan
Lines 10-17 bantuan array 1 dimensi p=[] untuk mendapatkan nilai
baru dan simpan ke dalam variabel bernama data_baru
Menampilkan visualisasi dalam bentuk grafik x dan y.
Lines 18-28 Untuk x adalah perubahan waktu dan y adalah kuantitas
orang yang meninggal karena COVID-19
11
Hasil analisa :

Dapat diketahui bahwa orang meninggal karena COVID-19 di Asia


Tenggara benar adanya, dibuktikan dengan dataset yang diberikan
(deaths_global.csv). dari data yang sudah diberikan, Indonesia menduduki
posisi pertama sebagai negara dengan jumlah orang meninggal karena
COVID-19 terbanyak di Asia Tenggara hingga update pada awal tahun 2022.

12
DAFTAR PUSTAKA

Rizki, Danis Alifian Nur. 2020. https://elibrary.unikom.ac.id/id/eprint


/2658/8/12.10115352_DANIS%20ALIFIAN%20NUR%20RIZKI_
BAB% 202.pdf, diakses pada 18 Maret 2023 pukul 18:20.

Anam, Syaiful. 2021. “Visualisasi Data dan Preprocessing Data” dalam


PENGANTAR KOMPUTASI CERDAS. Malang.

13

Anda mungkin juga menyukai