Pengantar Data Mining 2
Pengantar Data Mining 2
Kom
LATAR BELAKANG
Data dalam dunia nyata kotor
Tidak lengkap
agregasi
Misal, pekerjaan=“”
Contoh, jk=“pria”
LATAR BELAKANG
Tidak konsisten: memuat perbedaan dalam kode atau nama,
Contoh:
Data preprocessing
URGENSI
Kualitas Data berpengaruh terhadap hasil dari kualitas data mining
Mengisi nilai-nilai yang hilang, menghaluskan noisy data, mengenali atau menghilangkan
Mendapatkan representasi yang direduksi dalam volume tetapi menghasilkan hasil analitikal
Bagian dari reduksi data tetapi dengan kepentingan khusus, terutama data numerik
SEKIAN
TERIMA KASIH