Digital 126297 T 743 Penggalian Pola Metodologi
Digital 126297 T 743 Penggalian Pola Metodologi
3. METODOLOGI PENELITIAN
Proses data mining digunakan dengan tujuan untuk dapat memilih teknik
data mining apa yang cocok untuk diterapkan, dan digunakan juga sebagai acuan
untuk keseluruhan proses penambangan data dari obyek bisnis. Saat ini terdapat
beberapa metode yang bisa dipakai untuk melakukan data mining, diantaranya
model CRISP, generic model, dan lain sebagainya. Proses data mining yang akan
digunakan pada tesis yang akan dibuat adalah model referensi CRISP-DM, seperti
25
Penggalian pola churn..., Thony Antonius, FASILKOM UI, 2008
26
Model CRISP-DM berisikan daur hidup kegiatan data mining yang terdiri
atas enam fase. Gambar 3-1 diatas menunjukkan keseluruhan tahapan pada model
CRISP-DM. Salah satu keuntungan dari model ini adalah, tahapan fase dari model
bukanlah sebuah tahapan yang kaku. Perpindahan maju dan mundur antara tiap
fase yang berbeda bisa selalu dilakukan. Hal ini sesuai dengan sifat alami dari data
mining itu sendiri, dimana proses data mining tidak selesai saat sebuah hasil di
temukan, sebab proses data mining merupakan sebuah proses pembelajaran terus
menerus. Subbab-subbab berikut ini akan dijelaskan secara singkat apa saja yang
Fase ini merupakan fase awal dari model CRISP-DM. Pada fase ini
dubutuhkan pengertian akan obyektif dari kegiatan data mining yang akan
tersebut ke dalam sebuah definisi problem yang akan dijawab oleh data mining
dan sebuah rencana awal yang didesai untuk mencapai obyektif tersebut.
Fase ini merupakan fase pengumpulan koleksi data awal, dan melakukan
proses pengenalan terhadap data tersebut dengan tujuan untuk lebih mengenal
nature dari data yang akan dipakai. Selain itu fase ini juga mencoba melakukan
dan mencoba mendeteksi subset-subset yang menarik dari data untuk membentuk
yaitu dataset yang akan dijadikan input kedalam perangkat lunak data mining.
Aktifitas-aktifitas yang dilakukan pada fase ini meliputi pemilihan data (table,
record dan serta atribut yang akan dipakai), transformasi data dan pembersihan
Fase ini mengerjakan aktifitas pemilihan teknik data mining yang akan
dengan nilai yang optimal. Teknik data mining yang dipakai seringkali
memerlukan beberapa kebutuhan yang spesifik, sehingga pada fase ini dibutuhkan
Pada tahap ini akan dimulai pembuatan model data mining berkualitas tinggi
dari sudut pandang data analysis. Evaluasi yang dilakukan pada tahap dilakukan
secara mendalam, dengan tujuan untuk menyesuaikan model yang didapat agar
sesuai dengan obyektif bisnis yang dilakukan. Pada akhir tahap ini juga ditentukan
Pada fase ini dilakukan penyusunan dan presentasi dari pengetahuan yang
didapat dari data mining. Presentasi dari hasil data mining ini, dibuat sedemikian
nasional yang cukup besar. Institusi tersebut saat ini sudah memiliki data
warehouse yang cukup memadai. Selain data warehouse, Institusi tersebut juga
memiliki beberapa data mart yang tersebar di beberapa divisi. Gambar 3-2
Data Warehouse
Data
Data Sources Data Mart
Repository
End User
End User
End User
3.3 Dataset
Dataset yang akan digunakan diambil dari sebuah datamart yang digunakan
pada divisi sales nasional sebuah bank ternama. Data yang terdapat pada data mart
tersebut merupakan data harian yang diturunkan dari data repositori pusat. Proses
importing data dilakukan dalam periode harian secara otomatis. Dataset tersebut
merupakan kumpulan data fluktuasi saldo harian dari seluruh nasabah yang
Gambar 3-3 dibawah menggambarkan proses pelaksanaan data mining yang akan