Data Mining

DATA MINING
Pengertian Data Mining
Data Mining adalah serangkaian proses pencarian sebuah informasi secara otomatis yang tidak
diketahuin secara manual dari suata basis data. Data mining digunakan untuk mencari pengetahuan
yang ada didalam basis data yang berukuran besar. Istilah lain yang sering digunakan diantaranya
knowledge discovery (mining) in database (KDD), knowledge extraction, data/pattern analysis, data
archeology dan business intelligence. Proses pencarian pengetahuan ini menggunakan beberapa
teknik pembelajaran komputer untuk menganalisisnya. Ada dua sifat proses pencarian tersebut, yaitu
iteratif dan interaktif. Keseluruhan proses KDD untuk konversi raw data ke dalam informasi yang
berguna ditunjukkan dalam gambar berikut.
Input Data Data Data Mining

Preprocessing
Information Postprocessing
Manfaat
Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu :
a. Sudut pandang Komersial

>> Pemanfaatan data mining dapat digunakan dalam menangani meledaknya volume data.
b. Sudut pandang Keilmuan
>> Pemanfaatan data mining dapat digunakan dalam mengcapture, menganalisis, serta
menyimpan data yang bersifat real-time dan sangat besar.
Arsitektur Sistem Data Mining
Arsitektur sistem data mining memiliki kompunen-kompunen utama yaitu :
1. Basis data, data warehouse atau tempat penyimpanan informasi lainnya.

2. Basis data dan data warehouse server, merupakan komponen yang bertanggung jawab dalam
pengambilan relevant data.
3. Basis pengetahuan, merupakan domain knowledge yang berfungsi untuk mengevaluasi pola-
pola yang dihasilkan.
4. Data mining engine, merupakan komponen yang terdiri dari modul-modul fungsional data
mining.
5. Modul evaluasi pola, komponen ini menggunakan ukuran-ukuran kemenarikan dan berinteraksi
dengan modul data mining dalam pencarian pola-pola menarik.
6. Antarmuka pengguna grafis, modul ini berkomunikasi dengan pengguna dan sistem data
mining.
Arsitektur sebuah sistem data mining dapat dilihat dalam gambar berikut.
sebuah
Graphical user interface
Pattern evaluation
Data mining engine
Knowledge-base
Database or data warehouse server
Data cleaning & data integration Filtering
DATA
DATABASES
WAREHOUSE
Fungsi-fungsi Data Mining
Fungsi-fungsi yang umum diterapkan dalam data mining :
1. Association
>> merupakan proses untuk menemukan aturan asisiatif antara suatu kombinasi item dalam
suatu web.
2. Secuence
>> hampir sama dengan association bedanya secuence diterapkan lebih dari satu periode.
3. Clastering
>> merupakan proses pengelompokkan sejumlah data kedalam kelompok data (klaster)
sehingga setiap klaster akan berisi data yang saling mirip.
4. Classification
>> merupakan proses penemuan model atau fungsi yang menjelaskan konsep, dengan tujuan
untuk data memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
5. Regretion
>> merupakan proses pemetaan data dalam suatu nilai prediksi.
6. Forecasting
>> merupakan proses pengestimasian nilai prediksi berdasarkan pola-pola didalam
sekumpulan data.
7. Solution
>> merupakan proses penemuan akar masalah dan problem solving dari persoalan yang
dihadapi.
APLIKASI DARI DATA CLASSIFICATION
1) Definisi Klasifikasi
Klasifikasi merupakan suatu proses untuk menyatakan suatu objek ke salah satu kategori yang
sudah didefinisikan sebelumnya. Tujuannya adalah record-record yang sebelumnya tidak
terlihat dinyatakan kelasnya seakurat mungkin.
Categorical Categorical continuous Class
Tid Atr-1 Atr-2 Atr-3 Class
1 yes single 125k no

2 no married 100k no
3 no single 70k no
4 yes married 120k no
5 no divorced 95k yes
6 no married 60k no
7 yes divorced 220k no
8 no single 85k yes
9 no married 75k no Learn
10 no single 90k yes Training set Classifier
Model
APLIKASI DARI DATA CLUSTERING

1. Definisi clustering
Clustering adalah proses pembentukan kelompok kata (cluster) dari himpunan data yang tidak
diketahui kelompok-kelompok atau kelas-kelasnya. Proses menentukan data-data termasuk ke
dalam cluster yang mana. Berikut diagram data clustering
Mulai
Menentukan
banyaknya cluster (k)
Menentukan centroid
Centroid Tidak
berubah Selesai
ya
Menghitung jarak dari

centroid
Mengelompokan data
berdasarkan jarak
terdekat

Data Mining

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Data Mining

Diunggah oleh

Hak Cipta:

Format Tersedia

DATA MINING

Pengertian Data Mining

Input Data Data Data Mining

a. Sudut pandang Komersial

Arsitektur Sistem Data Mining

Arsitektur sistem data mining memiliki kompunen-kompunen utama yaitu :

1. Basis data, data warehouse atau tempat penyimpanan informasi lainnya.

Data mining engine

Data cleaning & data integration Filtering

Fungsi-fungsi yang umum diterapkan dalam data mining :

Categorical Categorical continuous Class

Tid Atr-1 Atr-2 Atr-3 Class

1 yes single 125k no

APLIKASI DARI DATA CLUSTERING

Menghitung jarak dari

Anda mungkin juga menyukai