Anda di halaman 1dari 1

Nama : Febri Juanda

Nim : 17071003

UTS : Data Mining

1. Jelaskan perbedaan Klasifikasi dengan Klustering dan berikan contohnya.

Clustering
Algoritma clustering merupakan algoritma pengelompokkan sejumlah data ( N )
menjadi kelompok – kelompok data tertentu ( cluster ).

Contohnya : K-means clustering


Algoritmanya :
-          Tandai setiap item kelas pada 1 sampai k (secara acak)
-          Untuk setiap kelas 1 sampai k
Hitung centroid (rata-rata K)
Hitung jarak antara centroid dan setiap item
-          Tandai setiap item yang terdekat dengan centroid
-          Ulangi sampai tidak ada item yang ditandai kembali.

Classification
Classification adalah tindakan untuk memberikan kelompok pada setiap keadaan.
Setiap keadaan berisi sekelompok atribut, salah satunya adalah class attribute

Contoh algoritma classification adalah nearest centroid dan k-nearest neighbor.


Nearest centroid
Algoritmanya :
-          Menghitung centroid untuk setiap kelas
-          Menghitung  jarak antara test sample dan setiap kelas centroid
-          Memprediksi kelas dengan metode centroid terdekat

2. Jelaskan apa yang dimaksud dengan Knowledge Discovery in Database.

Knowledge Discovery in Databases (KDD) merupakan sekumpulan proses untuk


menemukan pengetahuan yang bermanfaat dari data. Kumpulan proses dalam KDD meliputi :
pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data
selection), transformasi data (data transformation), penambangan data (data mining), evaluasi
pola (pattern evaluation), dan presentasi pengetahuan (knowledge presentation). Berdasarkan
definisi ini terlihat bahwa data mining hanya merupakan salah satu proses dari keseluruhan
proses yang ada pada KDD, tetapi merupakan proses yang sangat penting dalam menemukan
pola-pola yang berguna dari sejumlah data yang besar (data tersebut bisa disimpan dalam
basisdata, Data Warehouse, atau media penyimpanan informasi lainnya).

Anda mungkin juga menyukai