A. Data Mining
Kemajuan dalam pengumpulan data dan teknologi penyimpanan yang cepat
memungkinkan organisasi menghimpun jumlah data yang sangat luas. Alat dan teknik
analisis data yang tradisional tidak dapat digunakan untuk mengektrak informasi dari
data yang sangat besar. Untuk itu diperlukan suatu metoda baru yang dapat
menjawab kebutuhan tersebut. Data mining merupakan teknologi yang
menggabungkan metoda analisis tradisional dengan algoritma yang canggih untuk
memproses data dengan volume besar.
Definisi Data mining
Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.
Kata mining berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah
besar material dasar Data mining merupakan proses pencarian pola dan relasi-relasi
yang tersembunyi dalam sejumlah data yang besar dengan tujuan untuk melakukan
klasifikasi, estimasi, prediksi, association rule, clustering, deskripsi dan visualisasi.
Secara garis besar data mining dapat dikelompokkan menjadi 2 kategori utama,
yaitu.
Descriptive mining, yaitu proses untuk menemukan karakteristik penting dari data
dalam suatu basis data. Teknik data mining yang termasuk dalam descriptive
mining adalah clustering, association, dan sequential mining.
Predictive, yaitu proses untuk menemukan pola dari data dengan menggunakan
beberapa variabel lain di masa depan. Salah satu teknik yang terdapat
dalam predictive mining adalah klasifikasi.
Secara sederhana data mining bisa dikatakan sebagai proses menyaring atau
"menambang" pengetahuan dari sejumlah data yang besar. Istilah lain untuk data
mining adalah Knowledge Discovery in Database atau KDD. Walaupun sebenarnya data
mining sendiri adalah bagian dari tahapan proses dalam KDD
A. Definisi
KDD adalah keseluruhan proses untuk mengkonversi data mentah
menjadi suatu pengetahuan yang bermanfaat
Gambar 1. Proses KDD
B. Proses KDD
Proses KDD secara garis besar dapat dijelaskan sebagai berikut:
A. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan
digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis
data operasional.
B. Pre-processing/ Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu
dilakukan proses cleaning pada data yang menjadi fokus KDD.
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data
yang
A. Pengertian Prediksi/Forecasting
Proses pengestimasian nilai prediksi berdasarkan pola-pola di dalam sekumpulan
data. Prediksi menggunakan beberapa variabel atatu field-field basis data untuk
memprediksi nilai-nilai variabel masa mendatang yang diperlukan, yang belum
diketahui saat ini.
KESIMPULAN
Berdasarkan dari percobaan yang telah dilakukan maka dapat diambil beberapa
kesimpulan sebagai berikut :
1. Lama masa studi atau dalam hal ini yaitu ketepatan masa studi setiap mahasiswa
dapat diprediksi berdasarkan faktor-faktor yang berkaitan dengan latar belakang
sekolah sebelumnya dan data akademik serta pribadi saat berada di perguruan tinggi.
3. Tingkat kesalahan dari fungsi klasifikasi yang digunakan untuk prediksi masih berkisar
pada 20% hingga 34% yang hal ini dimungkinkan dapat dipengaruhi oleh jumlah data
training maupun testing yang digunakan serta tingkat konsisten data yang digunakan.