Anda di halaman 1dari 3

PRAKTIKUM DATA MINING

Nama : Deva Agustina


NIM : 20051214021
Kelas/Angkatan : A/2020
Algoritma : Naive Bayes
Jenis Analisis : Classification (Classifier)
Dataset : Car Evaluation
(https://archive.ics.uci.edu/ml/datasets/car+evaluation)
(https://www.kaggle.com/datasets/elikplim/car-evaluation-data-set)
Keterangan Dataset : Dataset tersebut berisi tentang kumpulan data mobil yang sedang diuji
coba terkait keamanan mobil dan beberapa sifat keamanan rendah, sedang, dan tinggi.
Dalam dataset tersebut terdapat kolom :
buying
maint
doors
persons
lug_boot
safety
Google Colab :
https://colab.research.google.com/drive/1JRfIj5GCIi63azbgpW4NK5AVLYDw5ZQ6#scroll
To=Gpx2_XEHaV6e
Pembahasan :
Dalam analisa data pasti dibutuhkan data yang mudah dipahami dan teratur sehingga untuk
mendapatkan data yang seperti itu harus dilakukan preprocessing data. Berikut adalah tahapan
dalam.
Preprocessing Data :
1. Data Cleaning
Dalam melakukan preprocessing inilah tahap pertama yaitu membersihkan data. Data yang
pertama kali didapatkan harus diseleksi kembali. Kemudian hapus data yang tidak sesuai,
tidak relevan, dan tidak akurat.
2. Data Integration
Data preprocessing adalah beberapa data yang akan menggabungkan beberapa data dalam
suatu dataset, maka harus dicek data-data yang datang dari berbagai sumber tersebut supaya
memiliki format yang sama.
3. Data Transformation
Data yang akan dianalisis diambil dari berbagai sumber yang kemungkinan memiliki
perbedaan format. Pada tahap ini data harus disamakan semuanya yang terkumpul supaya
dapat mempermudah proses analisis data. Contoh seperti mengubah isi data yang bertipe
string menjadi tipe float (numerik), kecuali pada kolom safety.
4. Mengurangi Data
Tahap ini harus mengurangi sampel data yang diambil, tetapi dengan catatan, tidak akan
mengubah hasil analisis data.
Metode Evaluasi Model :

Praktikum kali menggunakan metode cross validation.

Hasil Evaluasi :

Dalam praktikum ini didapatkan hasil score akurasi yang menggunakan metode cross
validation yaitu score train sebesar 0.762 dan score test sebesar 0.756. Kemudian dilakukan
tuning hyperparameter yang menghasilkan score sebesar 0.74
Kesimpulan :

Dari praktikum ini dapat diambil kesimpulan hasil analisis dataset diagnosis Car Evaluation
menggunakan jenis analisis Classification, algoritma Naive Bayes, dan metode Cross
Validation menghasilkan nilai akurasi yaitu score training sebesar 0.762 dan score testing
0.756 Selanjutnya dilakukan tuning hyperparameter model Naive Bayes untuk mendapatkan
hasil akurasi yang lebih optimal dimana hasil scorenya sebesar 0.74 dengan menggunakan
ukuran 0.012 pada parameter ‘var_smoothing’.

Anda mungkin juga menyukai