Anda di halaman 1dari 5

Nama : Restu Bayu PH

Nim : H1A015054

Tugas Pengenalan Pola

Data Mining and Knowledge Discovery in Database


Database sekarang dapat memiliki besar sampai hitungan terrabyte. Dalam data yang besar
ini tersembunyi informasi yang bersifat strategik. Tapi dengan banyaknya data, timbul masalah
untuk menggali informasi yang berguna dari data.

Banyak perusahaan telah mengumpulkan data berkuantitas besar. Teknik data mining
dapat diimplementasikan ke platform software dan hardware yang sudah ada untuk meningkatkan
nilai dari sumberdaya informasi yang sudah ada. Implementasi data mining pada client/server
berperforma tingi atau komputasi paralel dapat menganalisis database yang besae untuk menjawab
pertanyaan seperti,”Klien mana yang paling mungkin merespon surat promosi kami selanjutnya,
dan kenapa?”

1. Data Mining

Data Mining merupakan proses ekstraksi data menjadi informasi yang sebelumnya belum
tersampaikan, dengan teknik yang tepat proses Data Mining akan memberikan hasil yang optimal.

Alasan utama mengapa Data Mining diperlukan adalah karena adanya sejumlah besar data
yang dapat digunakan untuk menghasilkan informasi dan knowledge yang berguna. Informasi
dan knowledge yang didapat tersebut dapat digunakan pada banyak bidang, mulai manajemen
bisnis, control produksi, kesehatan dan lain-lain.
2. Knowledge Discovery in Databases (KDD)

Data Mining sering disebut sebagai Knowledge Discovery in Database (KDD) yang
bertugas untuk mengekstrak pola atau model dari data dengan menggunakan suatu algoritma yang
spesifik .

Istilah Data Mining dan Knowledge Discovery in Databases (KDD) sering kali digunakan
secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis
data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan
satu sama lain. Dan salah satu tahapan dalam keseluruhan proses Knowledge Discovery in
Databases (KDD) adalah Data Mining. Tahapan dalam proses KDD diantaranya seperti pada
gambar di bawah ini:

Gambar 1 Proses Knowledge Discovery Database (KDD)

Pada proses Knowledge Discovery Database (KDD) di atas terdapat beberapa tahapan yaitu
sebagai berikut:

1. Seleksi Data (Data Selection)

Selection (seleksi/pemilihan) data merupakan sekumpulan data operasional perlu dilakukan


sebelum tahap penggalian informasi dalam Knowledge Discovery Database (KDD) dimulai. Data

2
seleksi yang akan digunakan untuk proses Data Mining , disimpan dalam suatu berkas, terpisah
dari basis data operasional.

2. Pemilihan Data (Preprocessing / Cleaning)

Proses Preprocessing mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga
dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau
informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.

3. Transformasi (Transformation)

Pada fase ini yang dilakukan adalah mentransformasi bentuk data yang belum memiliki entitas
yang jelas ke dalam bentuk data yang valid atau siap untuk dilakukan proses Data Mining.

4. Data Mining

Pada fase ini yang dilakukan adalah menerapkan algoritma atau metode pencarian pengetahuan.
Ini adalah langkah penting di mana teknik kecerdasan diterapkan untuk mengekstrak pola
informasi yang berpotensi berguna dari data yang dipilih.

5. Interpretasi/Evaluasi (Interpratation/Evaluation)

Pada fase terakhir ini yang dilakukan adalah proses pembentukan keluaran yang bersumber pada
proses Data Mining Pola informasi.

3. Teknik Data Mining

Teknik ini sering disamakan dengan kata metode. Banyak teknik dan metode yang ada untuk
melakukan berbagai jenis tugas data mining. Metode ini dikelompokkan dalam 3 paradigma utama
data mining: Predictive Modeling, Discovery, dan Deviation Detection.

1. Predictive Modeling

Aplikasi Predictive Modeling menghasilkan klasifikasi atau prediksi. Tujuan dari predictive
modeling adalah menemukan pola yang melibatkan variabel untuk memprediksi dan

3
mengklasifikasi perilaku masa depan dari sebuah entitas. Ada dua tipe masalah yang diselesaikan
oleh predictive modeling: klasifikasi dan regresi.

Klasifikasi melibatkan model pembelajaran yang memetakan (atau mengklasifikasi) data


contoh ke dalam satu atau beberapa kelas yang telah didefinisikan. Sebagai contoh, bank dapat
menggunakan skema klasifikasi untuk menentukan pengajuan pinjaman yang akan disetujui.
Teknik klasifikasi meliputi Naive Bayesian, neural networks, dan decision trees.

Regresi melibatkan model yang memetakan data contoh ke prediksi real-valued. Teknik regresi
meliputi neural networks dan decision (atau regression) trees.

2. Discovery

Aplikasi discovery adalah pendekatan eksploratoris untuk analisis data. Aplikasi discovery
menggunakan teknik yang menganalisis data set yang besar untuk menemukan association
rules(atau pola), atau menemukan kluster dari sampel yang dapat dikelompokan. Hasil dari
metode discovery umumnya dimaksudkan untuk pengguna. Walau begitu, hasilnya juga dapat
diaplikasikan ke metode data mining yang lain

3. Deviation Detection

Deviation Detection melakukan deteksi anomali secara otomatis. Tujuannya untuk


mengidentifikasi kebiasaan suatu entitas dan menetapkan sejumlah norm melalui pattern
discovery. Sampel yang berdeviasi dari norm lalu diidentifikasi sebagai tidak
biasa. Teknik Deviation Detection melalui visualisasi melalui parallel coordinates, scatterplots,
dan surface plots.

4
Gambar 2 Teknik Data Mining

Referensi :
Introduction to Data Mining and Knowledge Discovery Third Edition
Penulis : Herbert A. Edelstein
Publisher : Two Crows Corporation (October 8, 1999)

An Introduction to Data Mining, Discovering hidden value in your data warehouse


Penulis : Kurt Thearling
http://www.thearling.com/text/dmwhite/dmwhite.htm

Data Mining
Publisher : ALG (Automated Learning Group), NCSA (National Center for Supercomputing
Applications)
http://alg.ncsa.uiuc.edu/tools/docs/d2k/manual/datang.htmlMini

Belajar Data Mining dan Knowledge Discovery in Databases (KDD)


Publisher : Masyunihts
https://www.ruangkombur.com/2018/08/11/data-mining-dan-kdd/

KDD dan Data Mining


Publisher : dnial
https://dnial.wordpress.com/2007/04/27/kdd-dan-data-mining/

Anda mungkin juga menyukai