Anda di halaman 1dari 3

Fungsi Utama Data Mining

1. Klasifikasi
Fungsi pembelajaran yang memetakan (mengklasifikasi) sebuah unsur (item)
data ke dalam salah satu dari beberapa kelas yang didefinisikan
2. REGRESI
Fungsi pembelajaran yang memetakan sebuah unsur data ke sebuah variable
prediksi bernilai nyata.
Contoh :
Prediksi volume biomasa dihutan dengan didasari pada pengukuran
gelombang mikro penginderaan jarak jauh (remotely-sensed).
Prediksi kebutuhan kustomer terhadap sebuah produk baru sebagai fungsi
dari pembiayaan advertensi.
3. CLUSTERING
Merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi
sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan
data yang ditelaah.

Pengelompokan Metode Data Mining


1. Predictive Modeling
Tujuan metode ini adalah membangun model untuk memprediksi suatu nilai
yang mempunyai ciri-ciri tertentu.
a. Klasifikasi
Digunakan untuk memprediksi nilai dari variable diskrit (seperti
memprediksi on line user yang akan membeli pada sebuah
website)
b. Regresi
Digunakan untuk memprediksi nilai variable yang kontinue
( meramal harga saham dimasa depan)
2. Association Analysis
Tujuan metode ini adalah menghasilkan sejumlah role yang menjelaskan
sejumlah data yang terhubung kuat satu dengan yang lainnya.
Contoh :
Association Analysis digunakan untuk menentukan produk yang
sering dibeli secara bersamaan oleh banyak pelanggan (market
basket analysis)
3. Clustering
Tujuan metode ini adalah mengelompokkan data yang homogen/sejenis sehingga
data yang berada di cluster yang sama mempunyai banyak kesamaan dibanding
dengan data yang ada di cluster yang berbeda.
Contoh :
Pengelompokan dokumen berdasarkan topiknya.
4. Anomaly Detection
Tujuan metode ini adalah untuk menemukan anomali atau outlier yaitu data yang
sangat berbeda dengan data-data yang lainnya.
Contoh :
Menentukan sebuah serangan terhadap jaringan komputer.

PreProcessing Data Mining


Data Preprocessing menerangkan tipe-tipe proses yg melaksanakan data
mentah untuk mempersiapkan proses prosedur yang lainnya.
Tujuan Preprocessing dalam DM adalah mentransformasikan data kesuatu
format yang prosesnya lebih mudah dan efektif utk kebutuhan pemakai,
dengan indikator sbb:
Mendapatkan hasil yg akurat
Pengurangan waktu komputasi untuk large scale problem
Membuat nilai data menjadi lebih kecil tanpa merubah informasi yg
dikandungnya.

Tools dan Metode PreProcessing Data Mining


1. SAMPLING
menyeleksi subset representatif dari populasi data yang besar.
2. TRANSFORMATION
Memanipulasi data mentah untuk mendapatkan input tunggal
3. DENOISING
Menghilangkan noise dari data
4. NORMALIZATION
Mengorganisasikan data untuk pengaksesan yg lebih spesifik
5. FEATURE EXTRACTION
Membuka spesifikasi data yang signifikan

PreProcessing Text Mining


Text Mining merupakan proses menggali, mengolah, mengatur informasi
dengan cara menganalisa hubungannya, aturan-aturan yang ada pada
data tekstual semi terstruktur atau tidak terstruktur.
Proses Preprocessing
1. Document Retrieval (Temu Kembali)
2. Document Clustering (Pengelompokan)
3. Document Categorization (Kategori/Kelas)

Proses Data Mining

CRISP-DM
a. Step
b. Step
c. Step
d. Step
e. Step
f. Step

(Cross-Industry Standard Process for Data Mining)


1: Business Understanding
2: Data Understanding
3: Data Preparation (!)
4: Model Building
5: Testing and Evaluation
6: Deployment

SEMMA (Sample, Explore, Modify, Model, and Assess)

KDD (Knowledge Discovery in Databases)


a. KDD berhubungan dengan teknik integrasi dan penemuan
ilmiah, interprestasian visualisasi dari pola-pola sejumlah
kumpulan data.
b. Knowledge discovery in databases (KDD) adalah keseluruhan
proses non-trivial untuk mencari dan mengidentifikasi pola
(pattern) dalam data, dimana pola yang ditemukan bersifat
sah, baru, dapat bermanfaat dan dapat dimengerti.
c. Datamining terutama digunakan untuk mencari pengetahuan
yang terdapat dalam basis data yang besar sehingga sering
disebut Knowledge Discovery in Databases (KDD).
d. Proses pencarian pengetahuan ini menggunakan berbagai
teknik-teknik pembelajaran komputer (machine learning)
untuk menganalisis dan mengekstraksikannya.
e. Proses pencarian bersifat iteratif dan interaktif untuk
menemukan pola atau model yang sahih, baru, bermanfaat,
dan dimengerti.
f. Dalam penerapannya dataminig memerlukan berbagai
perangkat lunak analisis data untuk menemukan pola dan
relasi data agar dapat digunakan untuk membuat prediksi
dengan akurat

Anda mungkin juga menyukai