Data Preprocessing
Accuracy
Completeness
Consistency
Timeliness
Believability
Value added
Interpretability
Accessibility
warehousing”—DCI survey
Tugas-tugas Data Cleaning
Melengkapi data missing values
Mengidentifikasi outliers dan smoothing data noisy
Mengatasi data yang tidak konsisten
mengatasi redudansi karena integrasi data
Keterbatasan teknologi
frekwensi yg sama)
Lakukan Data smooth dengan menentukan rata-rata,
Clustering
Mendeteksi dan menghilangkan outliers
Aggregation: summarization
Normalization: membuat skala menjadi lebih kecil,
dengan range spesifik.
min-max normalization
z-score normalization
terabytes
Analisis/Mining data kompleks membutuhkan waktu yg terlalu
A4 ?
A1? A6?
Feature Extraction
Feature Mapping using fourier/wavelet transformation
Feature Construction (dg cara menggabungkan fitur-fitur yang
ada)
N=Log2(5)=3