Anda di halaman 1dari 7

ELEARNING MINGGU ke-5

Machine Learning Dasar


(Clustering)
Dr Dadang Sudrajat S.Si,M.Kom
Yudistira M.Kom
Gifthera Dwilestari, S.I.Kom M.Kom
Mulyawan M.Kom
Agus Bahtiar M.Kom
PREPROCESSING DATA
• Data preprocessing is a data mining technique that involves
transforming raw data into an understandable format. Real-world
data is often incomplete, inconsistent, lacking in certain behaviors or
trends, and is likely to contain many errors
Mengapa perlu dilakukan preprocessing data?
a. Tidak Lengkap
• Data hilang / Kosong
• Kekurangan atribut tertentu atau atribut yang sesuai
• Hanya berisi data agregat
b. Noise
• Mengandung kesalahan
• Mengandung data yang outlier
c. Tidak Konsisten
• Mengandung perbedaan dalam kode atau nama
Tujuan Preprocessing Data

a. Pembersihan Data
• Isi nilai yang hilang
• Data noise yang halus
• Mengidentifikasi dan menghapus outlier
• Menyelesaikan inkonsistensi
b. Integrasi Data
• Integrasi beberapa database, kubus data, atau file
c. Transformasi Data
• Normalisasi dan agregasi
d. Pengurangan Data
• Memperoleh penurunan representasi dalam volume tetapi menghasilkan
hasil analitis yang sama atau serupa
e. Diskretisasi Data
• Pengurangan data namun sangat penting, terutama untuk data numerik
TERIMA KASIH

Anda mungkin juga menyukai