Nim : H1A015054
Banyak perusahaan telah mengumpulkan data berkuantitas besar. Teknik data mining
dapat diimplementasikan ke platform software dan hardware yang sudah ada untuk meningkatkan
nilai dari sumberdaya informasi yang sudah ada. Implementasi data mining pada client/server
berperforma tingi atau komputasi paralel dapat menganalisis database yang besae untuk menjawab
pertanyaan seperti,”Klien mana yang paling mungkin merespon surat promosi kami selanjutnya,
dan kenapa?”
1. Data Mining
Data Mining merupakan proses ekstraksi data menjadi informasi yang sebelumnya belum
tersampaikan, dengan teknik yang tepat proses Data Mining akan memberikan hasil yang optimal.
Alasan utama mengapa Data Mining diperlukan adalah karena adanya sejumlah besar data
yang dapat digunakan untuk menghasilkan informasi dan knowledge yang berguna. Informasi
dan knowledge yang didapat tersebut dapat digunakan pada banyak bidang, mulai manajemen
bisnis, control produksi, kesehatan dan lain-lain.
2. Knowledge Discovery in Databases (KDD)
Data Mining sering disebut sebagai Knowledge Discovery in Database (KDD) yang
bertugas untuk mengekstrak pola atau model dari data dengan menggunakan suatu algoritma yang
spesifik .
Istilah Data Mining dan Knowledge Discovery in Databases (KDD) sering kali digunakan
secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis
data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan
satu sama lain. Dan salah satu tahapan dalam keseluruhan proses Knowledge Discovery in
Databases (KDD) adalah Data Mining. Tahapan dalam proses KDD diantaranya seperti pada
gambar di bawah ini:
Pada proses Knowledge Discovery Database (KDD) di atas terdapat beberapa tahapan yaitu
sebagai berikut:
2
seleksi yang akan digunakan untuk proses Data Mining , disimpan dalam suatu berkas, terpisah
dari basis data operasional.
Proses Preprocessing mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga
dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau
informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.
3. Transformasi (Transformation)
Pada fase ini yang dilakukan adalah mentransformasi bentuk data yang belum memiliki entitas
yang jelas ke dalam bentuk data yang valid atau siap untuk dilakukan proses Data Mining.
4. Data Mining
Pada fase ini yang dilakukan adalah menerapkan algoritma atau metode pencarian pengetahuan.
Ini adalah langkah penting di mana teknik kecerdasan diterapkan untuk mengekstrak pola
informasi yang berpotensi berguna dari data yang dipilih.
5. Interpretasi/Evaluasi (Interpratation/Evaluation)
Pada fase terakhir ini yang dilakukan adalah proses pembentukan keluaran yang bersumber pada
proses Data Mining Pola informasi.
Teknik ini sering disamakan dengan kata metode. Banyak teknik dan metode yang ada untuk
melakukan berbagai jenis tugas data mining. Metode ini dikelompokkan dalam 3 paradigma utama
data mining: Predictive Modeling, Discovery, dan Deviation Detection.
1. Predictive Modeling
Aplikasi Predictive Modeling menghasilkan klasifikasi atau prediksi. Tujuan dari predictive
modeling adalah menemukan pola yang melibatkan variabel untuk memprediksi dan
3
mengklasifikasi perilaku masa depan dari sebuah entitas. Ada dua tipe masalah yang diselesaikan
oleh predictive modeling: klasifikasi dan regresi.
Regresi melibatkan model yang memetakan data contoh ke prediksi real-valued. Teknik regresi
meliputi neural networks dan decision (atau regression) trees.
2. Discovery
Aplikasi discovery adalah pendekatan eksploratoris untuk analisis data. Aplikasi discovery
menggunakan teknik yang menganalisis data set yang besar untuk menemukan association
rules(atau pola), atau menemukan kluster dari sampel yang dapat dikelompokan. Hasil dari
metode discovery umumnya dimaksudkan untuk pengguna. Walau begitu, hasilnya juga dapat
diaplikasikan ke metode data mining yang lain
3. Deviation Detection
4
Gambar 2 Teknik Data Mining
Referensi :
Introduction to Data Mining and Knowledge Discovery Third Edition
Penulis : Herbert A. Edelstein
Publisher : Two Crows Corporation (October 8, 1999)
Data Mining
Publisher : ALG (Automated Learning Group), NCSA (National Center for Supercomputing
Applications)
http://alg.ncsa.uiuc.edu/tools/docs/d2k/manual/datang.htmlMini