Anda di halaman 1dari 2

NAMA

: TIA RIZKI PHONNA

NIM

:110170141

UNIT

: A-3
Soal final data mining

1.Apa perbedaan antara klasifikasi dan clustering ?


2. Definisikan support dan confidence untuk aturan asosiasi?
3. Jelaskan tahapan pada data mining?

Jawaban:
1. Klasifikasi digunakan untuk menemukan model atau fungsi yang menjelaskan atau

membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan kelas
dari suatu objek yang labelnya tidak diketahui, sedangkan Clustering adalah teknik yang
berguna untuk mengeksplorasi data yang digunakan untuk mengelompokkan data yang
homogen/sejenis sehingga data yang berada di cluster yang sama mempunyai banyak kesamaan
dibandingkan dengan data yang ada di cluster yang berbeda.
2. support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan
confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif.
3. Tahapan pada data mining:

a. Pembersihan data
Pembersihan data merupakan proses menghilangkan noise dan data yang tidak
konsisten atau data tidak relevan.
b. Integrasi data
Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu
database baru.
c. Seleksi data
Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu
hanya data yang sesuai untuk dianalisis yang akan diambil dari database.
d.Transformasi data
Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam
data mining. Beberapa metode data mining membutuhkan format data yang
khusus sebelum bisa diaplikasikan.
e. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan
pengetahuan berharga dan tersembunyi dari data.
f. Presentasi pengetahuan

Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang


ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang
khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada
memang tercapai.

Anda mungkin juga menyukai