Anda di halaman 1dari 10

Universitas Gunadarma

Kalimalang
PTA 2021/2022
Nama : Alief Akbar
NPM : 20119496
Kelas : 3KB04
Mata Kuliah : Praktikum Teknologi & Kecerdasan Artifisial

Assalammualaikum. Pada hari ini saya akan menjelaskan tugas praktikum KNN ini.

KNN, Adalah suatu proses dimana kita akan menampilkan data yang telah buat dalam
bentuk histogram statistik. Pertama, Kita akan mengimport dataset dengan
mengimport library dari panda dan numpy, Lalu kita akan membuat program dapat
membaca data “adult” dari link yang telah kita ambil, Yang kemudian Akan kita
munculkan data tersebut dengan .head

Maka akan tampil output seperti dibawah ini

Setelah itu, Kita akan me-review dataset yang kita tampilkan. Pertama kita
menampilkan data dengan .describe(), Sehingga hasilnya akan seperti dibawah ini.
Setelah itu, Kita akan melihat tipe data dari tiap kolom data yang kita telah buat
dengan menggunakan .dtypes. Akan dihasilkan output seperti dibawah ini.

Kedua, Kita akan melihat jumlah atribut dan dimensi data dari dataset yang ada
dengan .shape.

Maka kita akan melihat banyak atribut dan dimensi dari dataset yang ada adalah
48842 & 15.

Setelah itu, Kita akan menghitung dan melihat jumlah data per label dari kelas dengan
menggunakan if.

Maka akan tampil output seperti dibawah ini.


Selanjutnya, Kita akan menampilkan perbandingan banyak individu yang
berpendapatan rata-rata atau kurang dari 50K dengan individu yang berpendatan lebih
dari 50K dengan mengimport terlebih dahulu library seaborn dan matplotlib agar data
yang kita masukkan dapat diubah menjadi histogram. Kita kemudian menampilkan
histogram dengan figsize, Yang dipakai agar menampilkan histogram sesuai ukuran
yang kita buat. Berikut koding dan outputnya.

Ketiga, Kita akan melakukan preparasi untuk dataset yang kita telah buat, Dimana
Kita akan membuat salinan datafram dengan menggunakan .copy dengan syarat deep
= True. Kita lalu mengubah nilai “?” menjadi nilai Na/NaN agar dataset dapat
diproses.
Lalu kita akan melakukan seleksi kolom fitur dan menemukan nilai nul untuk semua
atribut, Yang kemudian nilai null tersebut akan dijumlahkan sebagai total nilai yang
ada.

Maka output yang muncul akan seperti berikut

Lalu kita akan mendrop semua baris yang punya null, Memilih kolom fitur dari
dataest, Kemudian mengecek ulang nilai null yang ada. Outputnya akan seperti ini

Selanjutnya kita akan membuat standardScaler. Berikut adalah kodingnya


Lalu kita akan mengimport library ordinal encoder untuk mencari .shape dari dataset
yang dibuat. Berikut sintaknya

Lalu kita menggabungkan semua dataset agar ditampilkan sebagai tabel data final

Selanjutnya kita membuat visualisasi dari setiap data dari dataset final yang ada.
Sintaknya adalah sebagai berikut.
Lalu kita akan membuat scatter matrix plot

Kita akan mengimport scatter matrix dari library panda, Lalu membuat histogramnya.
Maka hasilnya akan seperti berikut.
Selanjutnya kita akan memakai heatmap yang dapat dipakai untuk menampilkan
korelasi setiap data. Caranya adalah sebagai berikut.
Terakhir, Kita akan membuat modelling dengan KNN, Cara melakukannya adalah
seperti dibawah ini.
Lalu kita akan melakukan perintah seperti dibawah ini untuk menampilkan statistik,
Nilai KNN, Serta nilai optimalnya.

Maka akan muncul output seperti berikut.

Anda mungkin juga menyukai