NIM
:110170141
UNIT
: A-3
Soal final data mining
Jawaban:
1. Klasifikasi digunakan untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan kelas
dari suatu objek yang labelnya tidak diketahui, sedangkan Clustering adalah teknik yang
berguna untuk mengeksplorasi data yang digunakan untuk mengelompokkan data yang
homogen/sejenis sehingga data yang berada di cluster yang sama mempunyai banyak kesamaan
dibandingkan dengan data yang ada di cluster yang berbeda.
2. support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan
confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif.
3. Tahapan pada data mining:
a. Pembersihan data
Pembersihan data merupakan proses menghilangkan noise dan data yang tidak
konsisten atau data tidak relevan.
b. Integrasi data
Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu
database baru.
c. Seleksi data
Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu
hanya data yang sesuai untuk dianalisis yang akan diambil dari database.
d.Transformasi data
Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam
data mining. Beberapa metode data mining membutuhkan format data yang
khusus sebelum bisa diaplikasikan.
e. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan
pengetahuan berharga dan tersembunyi dari data.
f. Presentasi pengetahuan