Anda di halaman 1dari 6

LAPORAN TUGAS BESAR PENAMBANGAN DATA

DATASET “SEATTLE WEATHER” MENGGUNAKAN KNN

DISUSUN OLEH :
ADRIAN MAULANA RIZQY (10121069)
FALIQ ZUKDAN AKBAR (101210
DERAN MAULANA RIZKI (101210
IF-2

PROGRAM STUDI TEKNIK INFORMATIKA


JURUSAN TEKNIK INFORMATIKA
UNIVERSITAS KOMPUTER INDONESIA
2024

1. PENJELASAN DATASET
Dataset yang kami gunakan adalah “seattle weather.csv” yang berisikan tentang cuaca
kota seattle selama 3 tahun terakhir. Pada dataset ini terdapat fitur-fitur seperti
precipitation (pengendapan), temp_max (temperatur maksimum), temp_min (temperatur
minimum) dan wind (angin) yang akan mempengaruhi outpunya yaitu weather (cuaca)
apakah akan hujan, gerimis, bersalju, berawan atau cerah.

2. INFORMASI YANG AKAN DIGALI PADA DATASET


Informasi yang akan digali pada dataset adalah prediksi tentang cuaca yang akan
didapatkan dengan data test yang diberikan menggunakan metode algoritma KNN

3. PRE -PROCESSING DATA


Label yang ditampilkan masih berupa string dan tidak bisa dihitung menggunakan
program.

4. SAMPLE DATA BESERTA PERHITUNGANNYA


5. LANGKAH – LANGKAH & SCREENSHOT PROGRAM
a. Pemanggilan dataset menggunakan jupyter notebook, meng-import pandas dan
numpy untuk membaca file csv, meng-import library math untuk rumus yang
menggunakan rumus yang akan digunakan.

b. Mengkonversi label pada cuaca menjadi integer


c. Memanggil data test secara random
d. Memasukkan jumlah data yang akan dilatih menggunakan data test, mendefinisikan
data yang akan di tes dan data yang akan dilatih, dan memasukkan rumus euclidean
distance untuk menentukan jarak, menentukan nilai k untuk menentukan neighbor,
dan memasukkan rumus akurasi ketepatan latih data

e. Menampilkan hasil prediksi


f. Menampilkan tingkat akurasi

6. INFORMASI YANG DIDAPATKAN


Informasi yang didapatkan adalah prediksi cuaca kota seattle kedepannya agar para warga
dapat mempersiapkan jika ingin beraktivitas.

Anda mungkin juga menyukai