Analisis Dataset Signal Tubuh Merokok
Analisis Dataset Signal Tubuh Merokok
Judul
“Analisis Dataset Signal Tubuh Merokok”
2. Tujuan
Untuk menganalisis data terhadap perilaku seseorang yang memiliki kebiasaan merokok dan
mengetahui ciri perokok tidaknya melalui bio-signal dengan menggunakan algoritma machine
learning Random Forest Classier.
3. Deskripsi Data
Dataset yang digunakan adalah kumpulan data sinyal biologis kesehatan seseorang dengan
mengetahui seseorang tersebut perokok atau bukan melalui bio-signal. Dataset ini diambil di
Kaggle. Adapun penjelasan featurenya sebagai berikut.
Source : (https://www.kaggle.com/datasets/kukuroo3/body-signal-of-
smoking?resource=download)
Gambar 11. Pengecekan tipe data dan data yang bernilai null
Pada tahap Pre processing, dataset di pisahkan menjadi 2 yakni data training
dan data testing, dari 55692 dataset, data training berjumlah 44553 sedangkan
data testing 11139.
Selanjutnya data training dengan menggunakan tanpa scaler yakni :