NAMA
: NOOR AZIZAH
NIM
: J1F111006
1. Bussiness Understanding
Merupakan tahap pertama dalam proses CRIPS-DM dan juga sebagai tahap
pemahaman penelitian. Setiap perusahaan tentu memiliki database, namun tidak
semua database tersebut digali lebih lanjut untuk mendapatkan informasi lebih
banyak dan bermanfaat.
Jika database yang dimiliki mencapai ratusan bahkan ribuan data tentu akan
kesulitan dalam meng-clustering data khususnya mengenai penjualan. Diantara
data tersebut akan dipengelompokan event-event yang dilaksanakan oleh event
organizer Eskom Mandiri ini.
1.1 Determine Business Objectives
Tahap ini adalah menentukan tujuan bisnis yang dapat digunakan dalam waktu
jangka panjang. Tujuan bisnis setiap perusahaan tentu menginginkan peningkatan
dalam penjualan produk untuk semua kalangan dan juga mendapatkan
keuntungan.
Berdasarkan data yang ada pada event organizer ini akan diketahui event yang
banyak dilaksanakan kemudian untuk meningkatkan penjualan pada event yang
belum banyak dilaksanakan agar melakukan promosi kembali.
1.2 Assess the Situation
Aturan validasi (validation rules) pada program aplikasi kurang lengkap,
sehingga data tidak konsisten. Dan hasil data mining terhadap database invoice
penjualan belum menggambarkan clustering penjualan yang paling banyak
dilaksanakan pada event organizer ini.
1.3 Determine Data mining Goals
Tujuan dari data mining ini adalah menggali pengetahuan tentang clustering
event sehingga diketahui tingkat produktivitas dan keseimbangan pelaksanaan
antara satu event dengan event lainnya.
2. Data Understanding
Pemahaman data adalah tahapan untuk mengumpulkan data-data yang
berkaitan dengan invoice penjualan pada event organizer ini, sehingga data yang
telah dikumpulkan dapat diolah.
2.1 Collect The Initial Data
Gambar 2.1 Form Invoice Penjualan, Invoice Detail Penjualan dan Payment
Penjualan
Tampilan form dan laporan tersebut dapat memberikan gambaran tentang data
dan informasi apa yang bisa didapatkan dan dimanfaatkan untuk mencapai tujuan
yang telah dirumuskan di tahap business understanding.
2.3 Explore The Data
Explorasi data pada invoice penjualan ini dapat dilihat dari format dari datadata yang membentuk form dan report diatas. Untuk lebih jealsnya dapat dilihat
pada tabel di bawah ini:
Menggabungkan dua tabel data atau lebih yang memiliki informasi yang
berbeda dan memiliki relasi antar tabel ke dalam data set baru yang telah
disiapkan pada tahap awal.
3.5 Clean Data
Tahap ini merupakan tahap untuk pembersihan dan data dari data yang tidak
diperlukan, Namun pada database ini data yang dikelola sudah ternormalisasi
namun hanya kurang validasi saat memasukkan nomor invoice setiap kali
transaksi melakukan event.
3.6 Format Data
Tahap pada format data adalah memproduksi data set akhir yang siap diolah
dalam pemodelan data mining. Format ini berbentuk sebuah tabel / query. Data
yang diolah adalah nama event
4. Modelling
Modelling adalah fase yang melibatkan teknik data maining, yaitu pemilihan
teknik data mining, algoritma dan parameter dengan nilai optimal. Berikut tahap
dalam modelling:
4.1 Sellect Modelling Technique
Tekning data mining yang digunakan adalah clustering dengan menggunakan
algoritma K-Means yang berguna untuk mencapai tujuan tahap business
understanding.
4.2 Generate Test Design
Tahap pembelajaran ini berkaitan dengan algoritma yang dipakai yaitu
clastering yang bersifat unsupervised learning dan melakukan pengelompokkan
berdasarkan kemiripan dari atribut-atribut tabel.
4.3 Built Model
Pembangunan model yang akan dilakukan menggunakan software Microsoft
Access. Selain di Microsoft Access pembangunan model dapat dilakukan pada
beberapa software lainnya seperti Weka, Matlab. Namun, database yang akan
dikelompokkan termuat dalam Microsoft Access. Hal ini bertujuan agar eksplorasi
database menjadi satu paket dengan tools pemodelan clustering nama event
berdasarkan event-event yang telah diselenggarakan oleh event organizer ini.
Field
Nmkel
Kelompok1
Kelompok2
Tipe Data
Text
Text
Text
Keterangan
Nama kelompok
Pusat cluster invoice penjualan
Pusat cluster invoice detail penjualan
Jumlah cluster pada penelitian ini adalah terdiri dari 2 yaitu banyak dan
sedikit. K-Means merupakan cluster yang bersifat unsupvised learning yang
membagi data cluster berdasarkan nilai k yang telah ditetapkan. Pada penelitian
ini nilai k=2 dengan nama cluster kel1 dan kel2.
4.4 Asess Model
Tahap ini dilakukan inisiasi pusat cluster yang berbeda-beda agar didapat
nilai pusat cluster yang paling optimal dan inisiasi dilakukan secara acak.
Penentukan hasil cluster yang paling optimal dilakukan dengan cara mencari pusat
cluster mayoritas dan memeriksa rasio antara besaran B(k)=Between Cluster
Variation (BCV) dengan W(k)=Within Cluster Variation (WCV) seperti pada
Persamaan 3. Rasio dengan nilai terbesar merupakan parameter hasil cluster
terbaik (Budiman, 2012).
5. Evaluation
Tahap evaluasi merupakan tahap untuk menguji hasil data mining, sehingga
mencapai tujuan dari business understanding.