Kalimalang
PTA 2021/2022
Nama : Alief Akbar
NPM : 20119496
Kelas : 3KB04
Mata Kuliah : Praktikum Teknologi & Kecerdasan Artifisial
Assalammualaikum. Pada hari ini saya akan menjelaskan tugas praktikum KNN ini.
KNN, Adalah suatu proses dimana kita akan menampilkan data yang telah buat dalam
bentuk histogram statistik. Pertama, Kita akan mengimport dataset dengan
mengimport library dari panda dan numpy, Lalu kita akan membuat program dapat
membaca data “adult” dari link yang telah kita ambil, Yang kemudian Akan kita
munculkan data tersebut dengan .head
Setelah itu, Kita akan me-review dataset yang kita tampilkan. Pertama kita
menampilkan data dengan .describe(), Sehingga hasilnya akan seperti dibawah ini.
Setelah itu, Kita akan melihat tipe data dari tiap kolom data yang kita telah buat
dengan menggunakan .dtypes. Akan dihasilkan output seperti dibawah ini.
Kedua, Kita akan melihat jumlah atribut dan dimensi data dari dataset yang ada
dengan .shape.
Maka kita akan melihat banyak atribut dan dimensi dari dataset yang ada adalah
48842 & 15.
Setelah itu, Kita akan menghitung dan melihat jumlah data per label dari kelas dengan
menggunakan if.
Ketiga, Kita akan melakukan preparasi untuk dataset yang kita telah buat, Dimana
Kita akan membuat salinan datafram dengan menggunakan .copy dengan syarat deep
= True. Kita lalu mengubah nilai “?” menjadi nilai Na/NaN agar dataset dapat
diproses.
Lalu kita akan melakukan seleksi kolom fitur dan menemukan nilai nul untuk semua
atribut, Yang kemudian nilai null tersebut akan dijumlahkan sebagai total nilai yang
ada.
Lalu kita akan mendrop semua baris yang punya null, Memilih kolom fitur dari
dataest, Kemudian mengecek ulang nilai null yang ada. Outputnya akan seperti ini
Lalu kita menggabungkan semua dataset agar ditampilkan sebagai tabel data final
Selanjutnya kita membuat visualisasi dari setiap data dari dataset final yang ada.
Sintaknya adalah sebagai berikut.
Lalu kita akan membuat scatter matrix plot
Kita akan mengimport scatter matrix dari library panda, Lalu membuat histogramnya.
Maka hasilnya akan seperti berikut.
Selanjutnya kita akan memakai heatmap yang dapat dipakai untuk menampilkan
korelasi setiap data. Caranya adalah sebagai berikut.
Terakhir, Kita akan membuat modelling dengan KNN, Cara melakukannya adalah
seperti dibawah ini.
Lalu kita akan melakukan perintah seperti dibawah ini untuk menampilkan statistik,
Nilai KNN, Serta nilai optimalnya.