Anda di halaman 1dari 2

kelas target) secara umum, atau (2) data diskriminasi, dengan perbandingan target kelas dengan

satu atau satu set kelas komparatif (kelas kontras), atau (3) karakterisasi dan diskriminasi data.
Karakterisasi data adalah penjumlahan dari krakteristik umum atau ciri umum kelas target
data. Data yang sesuai dengan kelas yang ditentukan pengguna biasanya dikumpulkan dengan
query database Misalnya untuk mempelajari karakteristik dari software produk yang penjualannya
meningkat sebesar 10% pada tahun lalu, data yang terkait dengan produk semacam itu dapat
dilakukan dengan mengeksekusi query SQL.
Ada beberapa metode untuk summarization data dan karakterisasi yang efektif.
Ringkasan data yang sederhana berdasarkan ukuran statistik dan plot dijelaskan pada
Bab 2. Operasi roll-up OLAP berbasis data kubus (Bagian 1.3.2) dapat digunakan
untuk melakukan summarization data yang dikendalikan pengguna sepanjang dimensi yang
ditentukan. Proses selanjutnya dijelaskan lebih rinci dalam Bab 3 dan 4, yang membahas
pergudangan data. Teknik attribute-oriented induction dapat digunakan untuk melakukan
generalisasi data dan karakterisasi tanpa interaksi langkah-langkah dari pengguna. Teknik ini
dijelaskan di Bab 4.
Output karakterisasi data dapat disajikan dalam berbagai bentuk. Contoh
termasuk pie chart, bar chart, curves, data multidimensional cubes, dan multidimensional
tabel, termasuk crosstabs. Uraian yang dihasilkan juga dapat disajikan sebagai
hubungan umum atau dalam bentuk peraturan (disebut aturan karakteristik). Output yang berbeda
ini bentuk dan transformasi mereka dibahas pada Bab 4.
Contoh 1.4
Karakterisasi data. Sistem data mining harus bisa menghasilkan deskripsi
meringkas karakteristik pelanggan yang menghabiskan lebih dari $ 1.000 per tahun di
AllElectronics. Hasilnya bisa dijadikan sebagai profil umum pelanggan, seperti usia 40-50 tahun,
pekerjaan, dan memiliki rating kredit yang bagus. Sistem harus memungkinkan pengguna untuk
menelusuri dimensi apa pun, seperti pada pekerjaan untuk melihat pelanggan ini sesuai dengan
jenis pekerjaan mereka.
Diskriminasi data adalah perbandingan fitur umum objek data kelas target dengan fitur
umum objek dari satu atau sekumpulan kelas kontras. Kelas target dan kontras dapat ditentukan
oleh pengguna, dan objek data yang sesuai diambil melalui query database. Misalnya, pengguna
mungkin suka membandingkan fitur umum produk perangkat lunak yang penjualannya meningkat
sebesar 10% pada tahun lalu dengan penjualan tersebut mengalami penurunan setidaknya 30%
selama periode yang sama. Metode yang digunakan pada diskriminan data serupa dengan yang
digunakan untuk karakterisasi data.
"Bagaimana outuput deskripsi dari diskriminasi?" Bentuk presentasi keluaran serupa
dengan deskripsi karakteristik, walaupun deskripsi diskriminan harus mencakup tindakan
perbandingan yang membantu membedakan antara kelas sasaran dan kelas yang kontras. Deskripsi
diskriminasi yang dinyatakan dalam bentuk aturan disebut sebagai peraturan diskriminan.
Contoh 1.5
Diskriminasi data. Sistem data mining harus dapat membandingkan dua kelompok
AllElectronics pelanggan, seperti mereka yang berbelanja untuk produk komputer secara teratur
(lebih dari dua kali dalam sebulan)

Anda mungkin juga menyukai

  • Stagstsvc PDF
    Stagstsvc PDF
    Dokumen57 halaman
    Stagstsvc PDF
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • Validasi Cluster Opsi 2
    Validasi Cluster Opsi 2
    Dokumen2 halaman
    Validasi Cluster Opsi 2
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • 8503 PDF
    8503 PDF
    Dokumen297 halaman
    8503 PDF
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • Hal 26
    Hal 26
    Dokumen1 halaman
    Hal 26
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • Tugas Damin Halaman 22
    Tugas Damin Halaman 22
    Dokumen2 halaman
    Tugas Damin Halaman 22
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • Tugas Damin Halaman 22
    Tugas Damin Halaman 22
    Dokumen1 halaman
    Tugas Damin Halaman 22
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • 602 1130 1 SM
    602 1130 1 SM
    Dokumen11 halaman
    602 1130 1 SM
    GGalanggJJoeharyy
    Belum ada peringkat
  • 140610140049-Nabila-DISEK II Praktikum 1
    140610140049-Nabila-DISEK II Praktikum 1
    Dokumen8 halaman
    140610140049-Nabila-DISEK II Praktikum 1
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • Self Esteem PDF
    Self Esteem PDF
    Dokumen19 halaman
    Self Esteem PDF
    Annanta Erfrandau
    Belum ada peringkat
  • 96d Full
    96d Full
    Dokumen13 halaman
    96d Full
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat
  • 58 260 1 PB
    58 260 1 PB
    Dokumen9 halaman
    58 260 1 PB
    Annisa Rahmah Nur Salapiah
    Belum ada peringkat