Selection, Proses seleksi atau pemilihan data yang relevan terhadap analisis
untuk diterima dari koleksi data yang ada.
Data Mining, Proses yang paling penting dimana akan dilakukan berbagai
teknik yang diaplikasikan untuk mengekstrak berbagai pola-pola potensial
untuk mendapatkan data yang berguna.
2. Predictive
Fungsi prediksi merupakan sebuah fungsi bagaimana sebuah
proses nantinya akan menemukan pola tertentu dari suatu data.
Pola-pola tersebut dapat diketahui dari berbagai variabel-variabel
yang ada pada data.
Clustering, teknik data mining ini merupakan proses pembagian informasi ke dalam kelompok-kelompok objek yang
terhubung. Teknik clustering dilakukan untuk mengidentifikasi data yang serupa dan mengenali perbedaan atau
persamaan antara data. Dari sudut pandang praktikal, clustering memainkan peran dalam menemukan pola
tersembunyi dan eksplorasi data.
Regression, teknik analisis regresi merupakan teknik data mining yang digunakan untuk mengidentifikasi dan
menganalisis relasi antar variabel karena pengaruh faktor lain. Teknik ini digunakan untuk menentukan probabilitas
variabel tertentu baik dalam perencanaan maupun pemodelan atau proyeksi.
Association rules, teknik data mining ini dijalankan untuk membantu dan menemukan hubungan antara dua atau
lebih item. Association rules juga dapat menemukan pola tersembunyi dalam kumpulan data. Tiga teknik pengukuran
utama dalam teknik data mining ini meliputi Lift, Support, dan Confidence.
Outer detection, teknik data mining jenis ini berkaitan dengan pengamatan item data dalam kumpulan data yang
tidak sesuai dengan pola atau perilaku tertentu. Teknik ini dapat digunakan di berbagai domain seperti intrusi,
deteksi, dan deteksi penipuan (fraud).
Sequential patterns, teknik data mining ini merupakan teknik dengan pola sekuensial untuk mengevaluasi data dan
menemukan pola sekuensial dari setiap subsekuen yang menarik dalam satu set urutan data. Pengambilan data
subsekuen ini dilakukan dengan dasar beberapa kriteria seperti panjang, frekuensi kemunculan, dan sebagainya.
Prediction, prediksi merupakan teknik kombinasi dari beberapa teknik data mining lainnya. Prediksi umumnya
dipakai untuk menganalisis peristiwa atau kejadian di masa lalu dalam urutan tertentu untuk memperkirakan
peristiwa di masa depan.
Decision Tree, Merupakan teknik generasi selanjutnya, dimana teknik ini adalah sebuah model prediktif yang dapat
digambarkan seperti pohon. Setiap node yang terdapat dalam struktur pohon tersebut mewakili sebuah pertanyaan
yang digunakan untuk menggolongkan data.
Tipe Data
Pada Data
Mining
Sumber-Sumber
Data
Online (Daring)
Media Online
Berita Online
Media Sosial
Situs-situs Resmi
Offline (Luring)
RH/CV (Curriculum Vite)
Koran
Majalah
Hasil Eliciting
2. Interaksi pengguna
Permasalahan data mining selanjutnya muncul saat dilakukan presentasi atau interaksi
dengan pengguna (user). Hal ini umumnya terkait dengan penggunaan query
language untuk data mining dan penentuan ekspresi atau visualisasi hasil data mining.
Proses penambangan informasi secara interaktif di berbagai tingkatan data mining juga
dapat menjadi persoalan lain yang mungkin menghambat proses data mining.