Anda di halaman 1dari 17

TUGAS DATA MINING

“DOKUMENTASI LIBRAR PANDAS, SEABORN, DAN MATPLOTLIB”

Disusun Oleh :

Nama : Exca Wella Monica

NPM : G1A020018

Kelas :B

Dosen Pengampu :

1. Mochammad Yusa, S.KOM., M.KOM


2. Arie Vatresia, S.T., M.TI, Ph.D.

PROGRAM STUDI INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS BENGKULU 2023


Gambar diatas merupakan tampilan apabila python telah terinstall dan telah dapat
digunakan.

Gambar diatas merupakan baris kode ang digunakan dalam bahasa pemrograman python
untuk mengimpor modul atau pustaka bernama “pandas” ke dalam program.

Gambar diatas merupakan baris kode python yang digunakan untuk menghubungkan
google colab dengan google drive.

Gambar diatas merupakan data frame dan dictionary menggunakan library pandas dalam
bahasa pemrograman python.

Gambar diatas merupakan library pandas untuk membaca data dari sebuah file CSV dan
menyimpannya dalam sebuah data frame. Data tersebut tersimpan di google
drive/MyDrive/sample data/ covid-19 symptoms dataset.csv.
Gambar diatas merupakan dua metode data frame pandas yaitu ‘head()’ dan ‘tail()’,
‘df.head()’ digunakan untuk menampilkan 5 baris data pertama dari data frame. Dan ‘df.tail()’
digunakan untuk menampilkan 5 data terakhir.

Gambar diatas digunakan untuk mendapatkan informasi tentang data frame termasuk
kolom-kolom dalam data frame dan tipe data yang digunakan dalam setiap kolom. Ini sangat
digunakan untuk memahami struktur data.
Gambar diatas merupakan 2 cara untuk mengakses data dalam data frame pandas.
‘df[‘fever]’ ini adalah cara untuk memilih satu kolom dari data frame. Karena memilih kolom
dengan nama ‘fever dari data frame ‘df’ maka hasilnya berupa series yang berisi data dan kolom
‘fever. Sedangkan ‘df.iloc[0]’ merupakan cara untuk memilih satu baris dari data frame
berdasarkan indeks baris. Karena memilih baris pertama (indeks 0) dari data frame ‘df’ maka
hasilnya berupa series yang berisi data dari baris pertama.
Gambar diatas merupakan penggunaan library seaborn (sns) dan matplotlip (plt) untuk
membuat dan menampilkan sebuah scatter plot. Disini mendefinisikan dua list yaitu ‘x’ dan ‘y’
yang mewakili data titik-titik akan digunakan dalam scatter plot, kemudian menggunakan
‘sns.scatterplot()’ untuk membuat scatter plot dengan data ‘x’ sebagai sumbu x dan data ‘y’
sebagai data y, terakhir menggunakan ‘plt.show()’ untuk menampilkan plotnya.

Gambar diatas menggunakan library seaborn (sns) dan matplotlib (plt) untuk membuat
dan menampilkan sebuah histogram. List ‘data’ yang berisi data numerik yang digunakan untuk
membuat histogram, kemudian menggunakan ‘sns.histplot()’ untuk menggunakan histogram
berdasarkan data yang terdapat dalam list ‘data’, terakhir menggunakan ‘plt.show()’ untuk
menampilkan plotnya.

Gambar diatas menggunakan library seaborn (sns) dan matplotlib (plt) untuk membuat
dan menampilkan sebuah box plot. List ‘data’ yang berisi data numeric yang akan digunakan
untuk membuat box plot, kemudian menggunakan ‘sns.boxplot()’ untuk membuat box plot
berdasarkan data yang terdapat dalamlist ‘data’. Ini menggunakan ‘x=data’ untuk menunjukkan
bahwa data akan digunakan sebagai data pada sumbu x, dan terakhir menggunakan ‘plt.show()’
untuk menampilkan plotnya.
Gambar diatas menggunakan library seaborn (sns) dan matplotlib (plt) untuk membuat
dan menampilkan sebuah heatmap. Karena menggunakan numpy untuk membuat contoh data
dengan ‘np.random.rand(5,5)’ ini akan menghasilkan matriks 5x5 dengan nilai-nilai acak antara
0 dan 1. ‘sns.heatmap()’ untuk membuat heatmap berdasarkan data matriks ang telah dibuat.
Parameter ‘annot=True’ digunakan untuk menampilkan nilai-nilai sebenarnya di dalam sel
heatmap. Terakhir menggunaan ‘plt.show()’ untuk menampilkan plotnya.
Gambar diatas menggunakan library seaborn (sns) dan matplotlib (plt) untuk membuat
facet grid dengan scatter plot berdasarkan dataset “tips” yang disediakan oleh seaborn.
‘sns.load_dataset(“tips”)’ untuk membuat dataset “tips” dari seaborn. Membuat grid dengan
menggunakan ‘sns.FacetGrid()’ dengan mengatur kolom dengan “time” dan baris dengan “sex”
artinya ini akan memiliki sub-plot untuk masing-masing kombinasi waktu. ‘g.map_dataframe()’
untuk memetakan data dari dataset ke dalam scatter plot. Kemudian mengatur label sumbu x dan
y dengan ‘g.set_axis_labels()’ judul kolom dengan ‘g.set_tittles()’ dan membatasi jangkauan
sumbu x dan y serta menetapkan tanda sumbu dengan ‘g.set()’. Terakhir menggunakan
‘g.tight_layout()’ untuk memastikan tata letak plot yang rapi dan kemudian ‘plt.show()’ untuk
menampilkan facet grid yang telah dibuat.
Gambar diatas menggunakan library seaborn (sns) dan matplotlib (plt) untuk membuat
sebuah pair plot berdasarkan dataset “iris” yang disediakan oleh seaborn.
‘sns.load_dataset(“iris”)’ untuk membuat dataset “iris” dari seaborn, dataset ini berisikan
informasi tentang iris. Argument ‘hue=”species”’ digunakan untuk memberi warna berbeda
kepada titik-titik pada plot sesuai dengan dataset. Terakhir ‘plt.show()’ untuk menampilkan pair
plot yang telah dibuat.
Gambar diatas menggunakan membuat dari ile CSV dan membuat sebuah grafik garis
(line plot) menggunakan library matplotlib. ‘pd.read_csv()’ untuk memuat data dari file CSV ang
terletak di ‘/content/drive/MyDrive/Colab Notebooks/TUGAS DATA
MINING/province_timeline.csv’ data tersebut akan disimpan dalam data frame ‘data’.
‘plt.figure(figsize=(8,6))’ sehingga grafik garis akan memiliki lebar 8 inci dan tinggi 6 inci.
‘plt.plot(data[‘date’], data[‘sulsel’])’ untuk membuat grafik garis dengan data dari kolom ‘date’
sebagai sumbu x dan y dari kolom ‘sulsel’ sebagai sumbu y. ‘plt.title(‘Grafik Garis’)’ untuk
memberikan judul grafik, kemudian ‘’plt.xlabel(‘date’)’ dan ‘plt.ylabel(‘sulsel’)’ untuk
memberikan label sumbu x dan y. Terakhir menggunakan ‘plt.show()’ untuk menampilkan
graifik garis tersebut.
Gambar diatas digunakan untuk membuat sebuah scatter plot menggunakan library
matplotlib. ‘plt.figure(figsize=(8,6))’ untuk mengatur ukuran gambar sehingga scatter plot akan
memiliki lebar 8 inci dan tinggi 6 inci. ‘plt.scatter(data[‘date’], data[‘sulsel’]’ untuk membuat
sebuah scatter plot dengan data dari kolom ‘date’ sebagai sumbu x dan data dari kolom ‘sulsel’
sebagai sumbu y. Kemudian memberikan judul scatter dengan ‘plt.title(‘Scatter Plot’)’.
Kemudian memberikan label sumbu x dan y dengan ‘plt.xlabel(‘date’)’ dan ‘plt.ylabel(‘sulsel’),
terakhir menggunakan ‘plt.show()’ untuk menampilkan scatter plot.
Gambar diatas merupakan source code python menggunakan library matplotlib untuk
membuat histogram dari dua kolom data, ‘date’ dan ‘sulsel’ yang terdapat dalam data frame
‘data’. ‘plt.figure(figsize=(8,6))’ untuk mengatur ukuran figure gambar yang akan digunakan
untuk menampilkan histogram, ukuran unit figure adalah 8 unit lebar dan 6 unit tinggi.
‘plt.hist(data[‘data’], bins=10, alpha=0.7, color=’blue’, label=’X’)’ ini adalah perintah pertama
untuk membuat histogram. Fungsi ‘plt.hist()’ digunakan untuk membuat histogram dari data
yang ada dalam kolom ‘date’, ‘bins=10’ untuk menunjukkan bahwa data akan dibagi menjadi 10
interval, ‘alpha=0.7’ untuk mengatur tingkat transparansi histogram menjadi 0.7 sehingga lebih
terlihat jika ada tumpang tindih. ‘color’ mengatur warna histogram menjadi biru dan ‘label’
mengidentifikasi histogram ini sebagai ‘X’ dalam legenda.

‘plt.his(data[‘sulsel’], bins=10, alpha=0.7, color=’red’, label=’Y’)’ ini adalah perintah


kedua untuk membuat histogram. ‘plt.title(‘Histogram’) ini mengatur judul gambar histogram
menjadi ‘Hostogram’, ‘plt.xlabel(’date’) ini mangatur label sumbu x pada histogram menjadi
‘date’, ‘plt.ylabel(‘sulsel’) ini mengatur label sumbu y pada histogram menjadi ‘sulsel’.
‘plt.legend()’ ini menambahkan legenda ke histogram yang akan menunjukkan informasi bahwa
warna biru (X) dan warna merah (Y) mewakili apa dalam plot. ‘plt.show()’ ini adalah perintah
terakhir yang digunakan untuk menampilkan gambar histogram secara actual di layar.

Gambar diatas merupakan kode python yang menggunakan library matplotlib untuk
membuat box plot dari dua kolom data ‘bengkulu’ dan ‘sulsel’ yang terdapat dalam data frame
‘data’. ‘plt.figure(figsize=(8,6))’ ini mangatur ukuran figure gambar yang akan digunakan
menampikan box plot, ukuran figur 8 unit lebar dan 6 unit tinggi. ‘plt.boxplot([data[‘bengkulu’],
data[‘sulsel’]], labels=[‘bengkulu’,’sulsel’])’ ini perintah utama untuk membuat box plot.
‘plt.title(’Box Plot’)’ ini mengatur judul untuk gambar box plot menjadi ‘Box Plot’.
‘plt.ylabel(‘sulsel’)’ ini mnegatur label sumbu y pada box plot menjadi ‘sulsel’. ‘plt.show()’ ini
adalah perintah terakhir yang digunakan untuk menampilkan gambar box plot secara actual di
layar.
Gambar diatas merupakan kode python yang menggunakan library matplotlib untuk
membuat diagram batang dari dua list ‘categories’ dan ‘values’. ‘plt.figure(figsize=(8,6))’ ini
mengatur ukuran figur gambar yang akan digunakan untuk menampilkan diagram batang, ukuran
figure adalah 8 unit lebar dan 6 unit tinggi. ‘categories=[‘A’,’B’,’C’,’D’,’E’]’ dan
‘values=[10,20,15,25,30]’ ini adalah dua list yang berisi kategori atau label (’categories’) dan
nilai-nilai yang akan digunakan untuk membuat diagram batang (‘values’). ‘plt.bar(categories,
values, color=’red’)’ ini adalah perintah utama untuk membuat diagram batang. Fungsi ‘plt.bar()’
digunakan untuk membuat batang-batang pada plot.
‘plt.title(‘Bar Plot’)’ ini mengatur judul untuk gambar diagram batang menjadi ‘Bar Plot’.
‘’plt.xlabel(‘date’)’ dan ‘plt.ylabel(‘sulsel’)’ ini mengatur label untuk sumbu x dan y pada
diagram batang. ‘plt. show()’ ini adalah perintah terakhir yang digunakan untuk menampilkan
gambar diagram batang secara aktual di layar.

Gambar diatas merupakan kode python yang menggunakan library matplotlib untuk
membuat lingkaran dari empat bagian dengan ukuran yang berbeda. ‘plt.figure(figsize=(8,8))’ ini
mengatur figure gambar yang akan digunakan diagram ligkaran. ‘sizes=[16,30,25,15]’ ini
merupakan list ukuran dari setiap bagian dalam lingkaran. ‘labels=[‘A’, ‘B’, ‘C’, ‘D’]’ ini adalah
list yang berisi label untuk setiap bagian dalam lingkaran. ‘colors=[‘gold’, ‘yellowgreen’,
‘lightcoral’, ‘lightskyblue’]’ ini adalah list yang berisi warna sesuai dengan urutan yang sama.

‘plt.pie(sizes, labels=labels, colors=colors, autopct=’1.1f%%’, startangle=140)’ ini


adalah perintah utama untuk membuat diagram lingkaran. Fungsi ‘plt.pie()’ untuk membuat
lingkaran dengan ukuran, label, warna, dan beberapa paraturan lainnya. ‘autopct=’%1.1f%%’
untuk menampilkan persentase masing-masing bagian di sekitar diagram dan ‘startangle=140 ‘
mengatur sudut awal diagram lingkaran. ‘plt.title(‘Pie Chart’)’ untuk mnegatur judul gambar
diagram lingkaran menjadi ‘Pie Chart’. ‘plt.axis(‘equal’) ini memastikan bahwa diagram
lingkaran akan terlihat tidak terdistorsi. ‘plt.show()’ ini adalah perintah terakhir yang digunakan
untuk menampilkan gambar diagram lingkaran secara aktual di layar.

Anda mungkin juga menyukai