Anda di halaman 1dari 5

DATA MINING

Pengertian Data Mining

Data Mining adalah serangkaian proses pencarian sebuah informasi secara otomatis yang tidak
diketahuin secara manual dari suata basis data. Data mining digunakan untuk mencari pengetahuan
yang ada didalam basis data yang berukuran besar. Istilah lain yang sering digunakan diantaranya
knowledge discovery (mining) in database (KDD), knowledge extraction, data/pattern analysis, data
archeology dan business intelligence. Proses pencarian pengetahuan ini menggunakan beberapa
teknik pembelajaran komputer untuk menganalisisnya. Ada dua sifat proses pencarian tersebut, yaitu
iteratif dan interaktif. Keseluruhan proses KDD untuk konversi raw data ke dalam informasi yang
berguna ditunjukkan dalam gambar berikut.

Input Data Data Data Mining


Preprocessing

Information Postprocessing

Manfaat

Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu :

a. Sudut pandang Komersial


>> Pemanfaatan data mining dapat digunakan dalam menangani meledaknya volume data.
b. Sudut pandang Keilmuan
>> Pemanfaatan data mining dapat digunakan dalam mengcapture, menganalisis, serta
menyimpan data yang bersifat real-time dan sangat besar.

Arsitektur Sistem Data Mining

Arsitektur sistem data mining memiliki kompunen-kompunen utama yaitu :

1. Basis data, data warehouse atau tempat penyimpanan informasi lainnya.


2. Basis data dan data warehouse server, merupakan komponen yang bertanggung jawab dalam
pengambilan relevant data.
3. Basis pengetahuan, merupakan domain knowledge yang berfungsi untuk mengevaluasi pola-
pola yang dihasilkan.
4. Data mining engine, merupakan komponen yang terdiri dari modul-modul fungsional data
mining.
5. Modul evaluasi pola, komponen ini menggunakan ukuran-ukuran kemenarikan dan berinteraksi
dengan modul data mining dalam pencarian pola-pola menarik.
6. Antarmuka pengguna grafis, modul ini berkomunikasi dengan pengguna dan sistem data
mining.

Arsitektur sebuah sistem data mining dapat dilihat dalam gambar berikut.

sebuah
Graphical user interface

Pattern evaluation

Data mining engine

Knowledge-base
Database or data warehouse server

Data cleaning & data integration Filtering

DATA
DATABASES
WAREHOUSE
Fungsi-fungsi Data Mining

Fungsi-fungsi yang umum diterapkan dalam data mining :

1. Association
>> merupakan proses untuk menemukan aturan asisiatif antara suatu kombinasi item dalam
suatu web.
2. Secuence
>> hampir sama dengan association bedanya secuence diterapkan lebih dari satu periode.
3. Clastering
>> merupakan proses pengelompokkan sejumlah data kedalam kelompok data (klaster)
sehingga setiap klaster akan berisi data yang saling mirip.
4. Classification
>> merupakan proses penemuan model atau fungsi yang menjelaskan konsep, dengan tujuan
untuk data memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
5. Regretion
>> merupakan proses pemetaan data dalam suatu nilai prediksi.
6. Forecasting
>> merupakan proses pengestimasian nilai prediksi berdasarkan pola-pola didalam
sekumpulan data.
7. Solution
>> merupakan proses penemuan akar masalah dan problem solving dari persoalan yang
dihadapi.
APLIKASI DARI DATA CLASSIFICATION

1) Definisi Klasifikasi
Klasifikasi merupakan suatu proses untuk menyatakan suatu objek ke salah satu kategori yang
sudah didefinisikan sebelumnya. Tujuannya adalah record-record yang sebelumnya tidak
terlihat dinyatakan kelasnya seakurat mungkin.

Categorical Categorical continuous Class

Tid Atr-1 Atr-2 Atr-3 Class

1 yes single 125k no


2 no married 100k no
3 no single 70k no
4 yes married 120k no
5 no divorced 95k yes
6 no married 60k no
7 yes divorced 220k no
8 no single 85k yes
9 no married 75k no Learn
10 no single 90k yes Training set Classifier

Model

APLIKASI DARI DATA CLUSTERING


1. Definisi clustering
Clustering adalah proses pembentukan kelompok kata (cluster) dari himpunan data yang tidak
diketahui kelompok-kelompok atau kelas-kelasnya. Proses menentukan data-data termasuk ke
dalam cluster yang mana. Berikut diagram data clustering
Mulai

Menentukan
banyaknya cluster (k)

Menentukan centroid

Centroid Tidak
berubah Selesai

ya

Menghitung jarak dari


centroid

Mengelompokan data
berdasarkan jarak
terdekat

Anda mungkin juga menyukai