Data Mining
Capaian Belajar
1 2 3 4
Contoh:
Data mining dapat membantu dalam menentukan bahwa laki-laki dengan pendapatan antara
Rp. 4.000.000 - Rp. 10.000.000 dapat membeli produk sesuai hasil yang telah dianalisis.
Informasi tersebut dapat membantu dalam mengembangkan strategi pemasaran. Namun,
tidak semua populasi yang diidentifikasi melalui data mining tersebut akan membeli produk
tersebut dengan mudah hanya karena berada di kategori yang sama.
How Data Mining Works?
Data Mining Processes (I)
Tahap I -> Pendefinisian Masalah: memahami persyaratan
dan tujuan dari proyek tersebut dan diputuskan sebagai
masalah data mining.
Tahap II -> Pemahaman Data: Dalam tahap ini, data
dikumpulkan dari berbagai sumber, data tersebut dianalisis
dengan cermat untuk menentukan apakah data tersebut
akan mengatasi masalah bisnis atau tidak.
Tahap III -> Persiapan Data: tahap ini hampir memakan 90%
dari waktu proyek. Sumber data yang tersedia diidentifikasi,
dipilih, dibersihkan, dibangun dan diformat ke dalam bentuk
yang diinginkan untuk diproses lebih lanjut.
Data Mining Processes (II)
Tahap IV -> Pemodelan: Algoritma data mining yang berbeda
diterapkan untuk membangun model. Algoritma data mining yang
sesuai dipilih dan diterapkan pada data yang diberikan untuk
mencapai tujuan solusi yang diusulkan.
Tahap V -> Evaluasi: Hasil model dievaluasi untuk menentukan
apakah model tersebut menjawab permasalaha atau tidak. Data
yang diberikan dibagi menjadi set data pelatihan dan pengujian.
Model dilatih pada data pelatihan dan diuji pada data pengujian.
Jika akurasi model pada data pengujian tidak memadai maka
seseorang kembali ke tahap sebelumnya untuk menyempurnakan
area yang mungkin menjadi alasan akurasi rendah.
Tahap III -> Penerapan: pengetahuan atau informasiberharga yang
diperoleh dari data disajikan agar pemangku kepentingan dapat
menggunakannya untuk mengambil sebuah keputusan nantinya.
Data Mining Techniques
Classification
Prediction
Clustering
Estimation
Description
Association
Classification (Klasifikasi)
Gambar di atas merupakan pengelompokan data pelanggan pada 3 lokasi dalam kota
yang sama.
Clustering sering dilakukan sebagai langkah awal dalam proses data mining, dengan
cluster yang dihasilkan digunakan sebagai input lebih lanjut ke teknik hilir yang
berbeda.
Do you have any questions?
Alhamdulillah