Setelah itu, kita akan mendapatkan hasil dari visualisasi Chernoff Faces secara berturutturut sebagai berikut:
Chernoff Faces
Asep Jalaludin, S.T.,M.M.
a. Euclidean Distance
b. Manhattan distance
d. Supremum distance
Database diatas masih belum sempurna, itulah gunanya Data Preprocessing yaitu untuk
melihat data-data yang tidak lengkap, tidak akurat, hilang dan permasalahn data yang
lainnya. Dari database diatas, saya akan mengidentifikasi tiga yaitu inaccuracy,
incompleteness, dan inconsistency.
inaccuracy (tidak akurat),dari database diatas data yang tidak akurat yaitu pada
atribut pendapatan, di situ digunakan simbol itu menandakan bahwa data
Asep Jalaludin, S.T.,M.M.
=
=
=
=
=
=
=
=
xx
xx
xx
xx
xx
xx
xx
xx
*
*
*
*
*
*
*
*
15
19
18
29
24
32
20
33
;
;
;
;
;
;
;
;
c
f
i
l
o
r
u
x
=
=
=
=
=
=
=
=
xx
xx
xx
xx
xx
xx
xx
xx
*
*
*
*
*
*
*
*
13
16
14
26
25
28
34
50
;
;
;
;
;
;
;
;
Dari data diatas, kita akan melakukan proses Smoothing Data melakukan Median Binning
Technique untuk mengurangi Noisy Data.
Dengan menggunakan xx=53 maka diperoleh data:
Setelah itu, cari median dari setiap bin. Sehingga data tersebut menjadi: