Anda di halaman 1dari 1

Gambar I.

II

Sebuah plot dua dimensi dari data kustomer dengan masing-masing lokasinya di sebuah kota,
menunjukkan tiga klaster data. Masing-masing "pusat" klaster ditandai dengan sebuah "+".

Secara umum, label kelas tidak ditunjukkan pada data latihan karena mereka tidak diketahui pada
awalnya. Pengklasteran dapat digunakan untuk membentuk label sejenis ini. Objek-objek dibuat klaster
atau grup berdasarkan prinsip memaksimalkan kemiripan antar kelas dan meminimalkan kemiripan dalam
kelas. Dengan begitu, klaster-klaster dari objek terbentuk sehingga objek-objek dalam sebuah klaster
memiliki kemiripan yang tinggi dengan objek sesamanya, namun sangat berbeda dengan objek dalam
klaster lain. Setiap klaster yang terbentuk dapat dilihat sebagai sebuah kelas dari beberapa objek, yang
menurut aturan dapat diturunkan. Pengklasteran dapat juga memfasilitasi pembentukan taksonomi, yang
merupakan pengorganisasian dari pengamatan kedalam sebuah kelas-kelas berhirarki yang
menggabungkan kejadian-kejadian yang mirip.

Contoh 1.8

Analisis klaster. Analisis klaster dapat dilakukan pada semua data kustomer elektronik untuk
mengidentifikasi subpopulasi kustomer yang homogen. Klaster-klaster ini dapat mewakili grup tertentu
yang menjadi target marketing. Gambar 1.11 menunjukkan sebuah plot dua dimensi dari kustomer
dengan lokasinya di sebuah kota. Tiga klaster dari titik data terlihat jelas.

Analisis klaster membentuk topik dari Bagian 7.

1.4.5 Analisis outlier

Sebuah database bisa mengandung data objek yang tidak mengikuti perilaku atau model umum data. Data
objek ini adalah outlier. Kebanyakan metode data mining membuang outlier sebagai noise atau
pengecualian.

Anda mungkin juga menyukai