Anda di halaman 1dari 9

Siti Lailiyah, S.Kom., M.

Kom
PENGERTIAN DATA MINING
Ekstraksi pola atau pengetahuan dari data yang besar
Menurut Daryl Pregibon data mining adalah campuran dari statistik, kecerdasan
buatan dan riset basis data
Menurut Turban, dkk : Data Mining merupakan proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan, dan mesin learning untuk mengekstraksi
dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait
berbagai database besar.
istilah lainnya Knowledge Discovery in Database (KDD)
Bertujuan untukmemanfaatkan data dalam basis datadengan mengolahnya sehingga
menghasilkan informasi yang baru dan berguna
AKAR ILMU DATA MINING
1. STATISTIK, dengan ilmu statistik data yang diolah dapat
diringkas dalam apa yang dinamakan Exploratory Data
Analysis (EDA). Teknik EDA yang digunakan : Metode
Komputasional dan Visualisasi Data
2. Kecerdasan Buatan (Artificial Intellegence). AI
berkontribusi terhadap teknik pengolahan informasi
berdasarkan pada penalaran manusia.
3. Pengenalan Pola (Pattern Recognition). Data yang
diambil dari basis data bukan dalam bentuk relasi tapi
dalam bentuk normal pertama. Data mining mempunyai
ciri khas yaitu pencarian pola asosiasi dan pola
sekuensial.
4. Sistem Basis Data. Akar ilmu ini sebagai penyedia
informasi berupa data yang akan digali
CONTOH DATA MINING
BUKAN DATA MINING DATA MINING
1. Pencarian informasi tertentu di internet, ex: mencari 1. Pengelompokan informasi yang mirip dalam konteks
info masakan menggunakan google tertentupada hasil pencarian, ex: masakan indonesia,
2. Petugas medis mencari data medis untuk menganalisis eropa, dll
catatan pasien dengan penyakit tertentu 2. Peneliti medis mencari cara pengelompokan data
3. Analisis gambar laporan keuangan perusahaan penyakit pasien berdasarkan data diagnosis, umur,
4. Pembuatan laporan tahunan penjualan perusahaan alamat
dengan merekap semua data selama setahun 3. Menggunakan data transaksi perusahaan dengan
fokuske data sales untuk mengidentifikasi profil utama
pelanggan
4. Pemanfaatan data penjualan perusahaan untuk
mendapatkan pola prediksi stok yang
sebaiknyadisediakan pada tahun berikutnya
FUNGSI DATA MINING
FUNGSI PREDIKSI FUNGSI KLASIFIKASI
Proses untuk menemukan pola dari data dengan Klasifikasi adalah suatu proses untuk menemukan model
menggunakan beberapa variabel untuk memprediksikan atau fungsi untuk menggambarkan class atau konsep dari
variabel lain yang tidak diketahui jenis atau nilainya. suatu data. Proses yang digunakan untuk mendeskripsikan
data yang penting serta dapat meramalkan kecenderungan
data pada masa depan.
FUNGSI DESKRIPSI
Proses untuk menemukan suatu karakteristik penting dari
data dalam suatu basis data. FUNGSI ASOSIASI
Proses ini digunakan untuk menemukan suatu hubungan
yang terdapat pada nilai atribut dari sekumpulan data.
TUGAS-TUGAS DATA MINING
ANALISIS ASOSIASI
Analisis asosiasi merupakan pencarian aturan-aturan asosiasi yang menunjukkan kondisi-kondisi nilai
atribut yang sering terjadi bersama-sama dalam sekumpulan data. Analisis asosiasi sering digunakan
untuk menganalisa market basket dan data transaksi.

MODEL PREDIKSI
Pekerjaan ini berkaitan dengan pembuatan sebuah model yang dapat melakukan pemetaan dari
setipa himpunan variabel ke setiap targetnya, menggunakan model tersebut untuk memberikan nilai
target pada himpunan baru yang didapat. ada 2 jenis model prediksi yaitu klasifikasi dan regresi.
klasifikasi digunakan untuk variabel target diskret sedangkan regresi untuk variabel target kontinu
TUGAS-TUGAS DATA MINING
ANALISIS CLUSTER
Clustering menganalisis objek data dimana label kelas tidak diketahui. Clustering dapat digunakan untuk
menentukan label kelas tidak diketahui dengan cara mengelompokkan data untuk membentuk kelas
baru. Sebabai contoh clustering rumah untuk menemukan pola distribusinya. Prinsip dalam clustering
adalah memaksimumkan kemiripan intra-class dan meminimumkan kemiripan interclass.

DETEKSI ANOMALI
Teknik ini berkaitan dengan pengamatan sebuah data dari sejumlah data yang secara signifikan
mempunyai karakteristik yang berbeda dari sisa data yang lain. Algoritma deteksi anomali yang baik
harus mempunyai laju eror yang rendah. Beberapa contoh masalah yang dapat diselesaikan dengan
anomali: mengetahui pola data yang memasuki jaringan sehingga penyusupan bisa ditemukan jika pola
kerja data yang datang berbeda.
PROSES DATA MINING
EKSPLORASI/PEMROSESAN AWAL DATA
eksplorasi terdiri dari "pembersihan" data, normalisasi data, transformasi data, penanganan data yang salah,
reduksi dimensi, pemilihan subset fitur dsb

MEMBANGUN MODEL DAN MELAKUKAN VALIDASI


Melakukan analisis berbagai model dan memilih model terbaik yang akan digunakan. Dalam langkah ini
digunakan metode-metode seperti klasifikasi, regresi, analisis cluster, deteksi anomali, analisis asosiasi, analisis
pola sekuensial dsb. dalam beberapa referensi deteksi anomali juga dapat digunakan sebagai algoritma utama,
terutama untuk mencari data-data yang spesial

PENERAPAN
Menerapkan model pada data yang baru untuk menghasilkan perkiraan/prediksi masalah yang diinvestigasi
SEKIAN
TERIMA KASIH

Anda mungkin juga menyukai