Anda di halaman 1dari 12

KNOWLEDGE

DISCOVERY IN
DATABASE (KDD)
Knowledge Discovery in Database (KDD)
adalah proses penemuan pengetahuan
yang tersimpan dalam sejumlah database
berukuran besar, data warehouse, web, atau
tempat penyimpanan informasi besar lainnya
Tahapan KDD
Selection
Pemilihan
data yang
relevan untuk
proses
analisa yang
akan
dilakukan
nantinya.
Preprocessing

Proses ini merupakan operasi dasar yang


mencakup penanganan terhadap noise data
diantaranya data kosong (missing value), data
duplikat, data inkonsisten, data yang berbeda
jauh (outlier) atau noise data yang lain.
Penanganan Missing value
Missing Value adalah informasi yang tidak tersedia terhadap sebuah objek. Dapat
terjadi karena informasi tentang objek tidak diberikan, sulit dicari, atau memang
informasi tersebut tidak ada. Beberapa penanganan missing value
1. Abaikan
2. Isi sembarang nilai
3. Gunakan konstanta umum
4. Regresi linear
5. Rata-rata parameter yang sama
6. Rata-rata berdasarkan kelas yang sama
7. Rata-rata tetangga atas/bawah
8. Hapus
PREPROCESSING
■ Inconsistent data = data yang tidak konsisten yang
memiliki format berbeda dalam satu atribut
■ Duplikat (Redundan) = data ganda atau data yang
diinputkan berulang-ulang
■ Noise lain = Typo atau incomplete data
Penanganan Missing value
■ Outlier (Data
pencilan)
adalah data
yang secara
nyata berbeda
dengan data-
data yang
lain.
Transformasi
Tahap transformasi adalah tahap transformasi atau
perubahan bentuk pada data yang telah dipilih,
sehingga data sesuai untuk proses data mining.
Transformasi merupakan proses yang sangat
tergantung pada jenis atau pola informasi yang akan
dicari dalam data.
Ex. Umur => Kelompok Umur
DATA MINING

Data mining merupakan 1. Estimasi


serangkaian proses untuk
menggali nilai tambah
dari suatu kumpulan data
berupa pengetahuan 5. Asosiasi 2. Prediksi
yang selama ini tidak
diketahui secara manual
dari suatu kumpulan data

4. Klastering 3. Klasifikasi
Interpretasi/Evaluasi
Tahapan intrepretasi adalah tahapan penerjemahan terhadap
output yang dihasilkan dari data mining.
Tahapan evaluasi dilakukan untuk memeriksa apakah pola
atau informasi yang ditemukan bertentangan dengan fakta
atau hipotesa yang ada sebelumnya.
Ex. Penerjemahan pola, visualisasi dengan diagram
Interpretasi/Evaluasi
Ex:
A1 = Laki-laki
A2 = Perempuan
B1 = Ibu rumah tangga
B2 = Mahasiswa
C1 = Roti
C2 = Tepung
C3 = Indomie

Pola yang dihasilkan A1, B2  C3


Interpretasi:
Jika seseorang berjenis kelamin perempuan dengan status mahasiswa maka membeli
Indomie

Anda mungkin juga menyukai