Proses pencarian pola data yang tidak diketahui atau tidak diperkirakan sebelumnya.
~Adelman~
Merupakan serangkaian proses pencarian nilai, lebih dari suatu kumpulan data yang berisi
pengetahuan dan belum pernah diungkap secara manual.
~Iko Pramudiono~
Contoh Data Mining
KDD SEMMA CRISP-DM
Knowledge Discovery in Sample, Explore Cross Industry Standard
Databases Modify,Model and Assess Process
“Pada saat ini ketiga proses (KDD, SEMMA dan CRISP-DM) tersebut sering digunakan sebagai analisa berfikir
agar data mining dapat digunakan dengan baik dari hulu hingga hilir
Phases
Summary of Correspondences between KDD, SEMMA and CRISP-DM
Selection Sample
Data Understanding
Pre Processing Explore
• Data Preparation
Table, record and attribute selection, Data transformation and cleaning
• Modeling
Modeling techniques selection and application, Parameters calibration
• Evaluation
evaluasi dari hasil agar selaras dengan tujuan bisnis
• Deployment
implementasi (penyebaran) dari data mining
Business Understanding
Business
Understanding
• Statement Tujuan Bisnis
• Statement Tujuan Data Mining
Data Understanding
MODELING
Berfokus pada pemahaman tujuan dan persyaratan
proyek dari perspektif bisnis, maka mengubah Evaluation
pengetahuan ini ke dalam definisi masalah data mining
dan rencana awal yang dirancang untuk mencapai tujuan Deployment
Business Understanding
Business
Understanding
Penentuan tujuan proyek dan kebutuhan secara detail dalam
lingkup bisnis atau unit penelitian secara keseluruhan
Data Understanding
MODELING
Mulai dengan pengumpulan data awal dan hasil dengan kegiatan
untuk mendapatkan data yang terintegrasi , untuk mengidentifikasi Evaluation
masalah kualitas data, untuk menemukan wawasan pertama ke
dalam data atau untuk mendeteksi subset menarik untuk
membentuk hipotesis untuk informasi yang tersembunyi Deployment
Data Understanding
Business
• Mengumpulkan data, jika data berasal dari lebih Understanding
dari satu database maka dilakukan proses integrasi
Data Understanding
MODELING
• Jika diinginkan, pilih sebagian kecil grup data yang
mungkin mengandung pola dari permasalahan.
Evaluation
- Transformasi MODELING
Mencakup semua kegiatan untuk membangun data set akhir dari data
Evaluation
mentah awal. tugas persiapan data kemungkinan akan dilakukan
beberapa kali dan tidak dalam urutan yang ditentukan. Tugas meliputi
tabel, catatan dan seleksi atribut serta transformasi dan pembersihan Deployment
data untuk alat pemodelan.
Data Preparation
Business
• Menyiapkan data awal, kumpulan dan yang akan digunakan Understanding
untuk keseluruhan fase berikutnya atau proses seleksi data
Data Understanding
MODELING
• Lakukan perubahan pada variabel jika diperlukan
Evaluation
Data Understanding
• Kalibrasi aturan model untuk mengoptimalkan hasil.
Data Preparation
MODELING
• Menentukan apakah terdapat permasalahan penting dari bisnis atau
penelitian yang tidak tertangani dengan baik
Evaluation
Dari hasil data yang di peroleh, perlu pengelompokan data dan Evaluation
Data Preparation
MODELING
• Ulasan Proyek
- Menilai apa yang benar dan apa yang salah , apa yang sudah sesuai Evaluation
tujuan , dan apa yang masih harus di tingkatkan
Deployment
Contoh CRISP-DM: Analisa biaya perawatan pasien rawat inap
Business Understanding Phase
Tujuannya adalah menekan biaya perawatan pasien tanpa mengurangi kualitas pelayanan
Data Understanding Phase
Data kunjungan pasien rawat inap RSUP Cipto dengan jaminan Jamkesmas (01-01-2009 s/d 30-09-2010)
-Jumlah Data 8383 pasien
Data Preparation Phase
Peneliti melalukan data cleaning hingga memilih 2022 data pasien
Atribut : Age, Gender, Marital status, Job Class, Organisasi Unit, Mortability, Primary Diagnosa, Procedure, LOS, Cost
Modeling Phase
Peneliti menerapkan Analisa teknik :
-Attibute Importance (AI) untuk mengetahui peringkat atribut terhadap pola biaya dan kunjungan pasien
-Algoritma Naive bayes memprediksi pola biaya kunjungan pasien yang akan datang
Evaluation Phase
Diterapkan model scoring untuk data yang akan di test (sample 25 pasien)
Deployment Phase
Penerapan pola biaya baru
Contoh CRISP-DM: Analisa Kasus Klaim Garansi Mobil
Business Understanding Phase
Tujuannya adalah untuk mengurangi biaya yang berkaitan dengan klaim garansi dan meningkatkan kepuasan pelanggan
Data Understanding Phase
Peneliti menggunakan informasi 7 juta kendaraan
-Informasi bagaimana dan dimana kendaraan dibangun
-Iinformasi jaminan Klaim
Data Preparation Phase
Peneliti memilah kasus dan variabel yang diinginkan
Modeling Phase
Peneliti menerapkan teknik-teknik :
-Bayesian Network (Permodelan ketergantungan pada klaim garansi)
-Associtions Rules (Cara alami menyelidiki ketergantungan pada klaim garansi)
Evaluation Phase
Para peneliti tersebut menyarankan untuk melakukan design ulang dari database demi membuat database
tersebut dapat digunakan untuk knowledge discovery / data mining
Deployment Phase
mendevelop sebuah system intranet yang mempunyai kemampuan data mining untuk semua karyawan perusahaan
SUMMARY