Anda di halaman 1dari 10

TUGAS PENGGATI UTS

DATA CLUSTERING INVOICE PENJUALAN PADA EVENT


ORGINIZER ESKOM MANDIRI PADA METODE CRISP-DM

NAMA

: NOOR AZIZAH

NIM

: J1F111006

KEMENTERIAN PENDIDIKAN DAN KEBUDAYAAN


UNIVERSITAS LAMBUNG MANGKURAT
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PROGRAM STUDI S1 ILMU KOMPUTER
BANJARBARU
2014

1. Bussiness Understanding
Merupakan tahap pertama dalam proses CRIPS-DM dan juga sebagai tahap
pemahaman penelitian. Setiap perusahaan tentu memiliki database, namun tidak
semua database tersebut digali lebih lanjut untuk mendapatkan informasi lebih
banyak dan bermanfaat.
Jika database yang dimiliki mencapai ratusan bahkan ribuan data tentu akan
kesulitan dalam meng-clustering data khususnya mengenai penjualan. Diantara
data tersebut akan dipengelompokan event-event yang dilaksanakan oleh event
organizer Eskom Mandiri ini.
1.1 Determine Business Objectives
Tahap ini adalah menentukan tujuan bisnis yang dapat digunakan dalam waktu
jangka panjang. Tujuan bisnis setiap perusahaan tentu menginginkan peningkatan
dalam penjualan produk untuk semua kalangan dan juga mendapatkan
keuntungan.
Berdasarkan data yang ada pada event organizer ini akan diketahui event yang
banyak dilaksanakan kemudian untuk meningkatkan penjualan pada event yang
belum banyak dilaksanakan agar melakukan promosi kembali.
1.2 Assess the Situation
Aturan validasi (validation rules) pada program aplikasi kurang lengkap,
sehingga data tidak konsisten. Dan hasil data mining terhadap database invoice
penjualan belum menggambarkan clustering penjualan yang paling banyak
dilaksanakan pada event organizer ini.
1.3 Determine Data mining Goals
Tujuan dari data mining ini adalah menggali pengetahuan tentang clustering
event sehingga diketahui tingkat produktivitas dan keseimbangan pelaksanaan
antara satu event dengan event lainnya.
2. Data Understanding
Pemahaman data adalah tahapan untuk mengumpulkan data-data yang
berkaitan dengan invoice penjualan pada event organizer ini, sehingga data yang
telah dikumpulkan dapat diolah.
2.1 Collect The Initial Data

Pengumpulan data diperoleh dari laporan invoice penjualan Event Organizer


Eskom Mandiri Banjarbaru dari tahun awal tahun 2013 hingga tahun 2014.
2.2 Describe The Data
Pemahaman data dapat terlihat langsung dari form, format data, laporan, dan
fitur lainnya. Aplikasi invoice dibuat dengan menggunakan software Microsoft
Access yang bereksistensi (.MDE).
Data yang dimasukkan pada aplikasi invoice ini dapat dipelajari dari form dan
report yang tersedia. Antara lain form yang terdiri dari form invoice penjualan,
invoice detail penjualan dan payment penjualan serta report dari invoice penjualan.

Gambar 2.1 Form Invoice Penjualan, Invoice Detail Penjualan dan Payment
Penjualan

Gambar 2.2 Report Invoice Penjualan

Tampilan form dan laporan tersebut dapat memberikan gambaran tentang data
dan informasi apa yang bisa didapatkan dan dimanfaatkan untuk mencapai tujuan
yang telah dirumuskan di tahap business understanding.
2.3 Explore The Data
Explorasi data pada invoice penjualan ini dapat dilihat dari format dari datadata yang membentuk form dan report diatas. Untuk lebih jealsnya dapat dilihat
pada tabel di bawah ini:

Tabel 2.1 Invoice Penjualan (Table Mater)

Tabel 2.2.Invoice Detail Penjualan

Tabel 2.3 Payment Penjualan

Gambar 2.3 Relasi Antar Tabel


2.4 Verify Data Quality
Tahap ini merupakan tahap untuk memverifikasi format data pada tabel yang
telah disebutkan terutama jika salah menginputkan tanggal transaksi invoice
penjualan maka data akan berdampak pada kesalahan nomor invoice dan
mengakibatkan data akan tidak konsisten atau tidak terurut dengan benar bahkan
rusak.

Gambar 2.4 Nomor Invoice Tidak Terurut


3. Data Preparation
Diantara 23 record invoice penjualan yang memiliki 80 record invoice detail
penjualan dan 41 record payment penjualan yang saling berkaitan. Untuk data
yang dikelola berkualitas maka dilakukan data preparation dengan cara:
3.1 Data Set Description
Tahap merancang set data mentah pada database digunakan sebagai gudang
data yang harus sesuai dengan rumusan pada tahapan business understanding
yaitu mendeskripsikan clustering event-event yang telah dilaksanakan Event
Organizer Eskom Mandiri.
3.2 Select Data
Tahap memilih data digunakan untuk menganalisis beberapa kriteria sehingga
didapatkan tujuan dari data mining serta kualitas data. Data yang dipilih yaitu
tabel invoice penjualan, invoice detail penjualan, dan payment penjualan.
3.3 Construct Data
Pengembangan data set dilakukan dengan mentransformasi data (query) sesuai
dengan kebutuhan pemodelan.
SQL invoice penjualan:
SELECT InvoicePenjualan.InvoiceNo, InvoicePenjualan.Tanggal,
InvoicePenjualan.KodeTanggal, InvoicePenjualan.[Nama Event],
InvoicePenjualan.[Bad Debt], InvoicePenjualan.[Nama Pelanggan],
InvoicePenjualan.[Alamat Pelanggan], InvoicePenjualan.Wilayah,
InvoicePenjualan.[Alamat Event], InvoicePenjualan.TanggalEvent,
InvoicePenjualan.GroupStatus, InvoicePenjualan.TanggalEventAkhir
FROM InvoicePenjualan
WHERE (((InvoicePenjualan.GroupStatus)=False))
ORDER BY InvoicePenjualan.InvoiceNo;

Gambar 3.5 Menampilkan Nama Event


SELECT InvoiceDetailPenjualan.InvoiceNo, InvoiceDetailPenjualan.[Divisi ID],
Products.ProductName, InvoiceDetailPenjualan.ProductID,
InvoiceDetailPenjualan.Quantity, InvoiceDetailPenjualan.Unit,
InvoiceDetailPenjualan.Price, InvoiceDetailPenjualan.[Ekstensi Produk],
InvoiceDetailPenjualan.KodeTanggal
FROM InvoiceDetailPenjualan LEFT JOIN Products ON
InvoiceDetailPenjualan.ProductID = Products.ProductID
ORDER BY InvoiceDetailPenjualan.[Divisi ID], Products.ProductName;

Gambar 3.4 Invoice Detail Penjualan


SELECT PaymentPenjualan.InvoiceNO, PaymentPenjualan.Date,
PaymentPenjualan.Remark, PaymentPenjualan.PaymentAmount,
PaymentPenjualan.KodeTanggal
FROM PaymentPenjualan;

Gambar 3.5 Payment Penjualan


3.4 Integrasi Data

Menggabungkan dua tabel data atau lebih yang memiliki informasi yang
berbeda dan memiliki relasi antar tabel ke dalam data set baru yang telah
disiapkan pada tahap awal.
3.5 Clean Data
Tahap ini merupakan tahap untuk pembersihan dan data dari data yang tidak
diperlukan, Namun pada database ini data yang dikelola sudah ternormalisasi
namun hanya kurang validasi saat memasukkan nomor invoice setiap kali
transaksi melakukan event.
3.6 Format Data
Tahap pada format data adalah memproduksi data set akhir yang siap diolah
dalam pemodelan data mining. Format ini berbentuk sebuah tabel / query. Data
yang diolah adalah nama event
4. Modelling
Modelling adalah fase yang melibatkan teknik data maining, yaitu pemilihan
teknik data mining, algoritma dan parameter dengan nilai optimal. Berikut tahap
dalam modelling:
4.1 Sellect Modelling Technique
Tekning data mining yang digunakan adalah clustering dengan menggunakan
algoritma K-Means yang berguna untuk mencapai tujuan tahap business
understanding.
4.2 Generate Test Design
Tahap pembelajaran ini berkaitan dengan algoritma yang dipakai yaitu
clastering yang bersifat unsupervised learning dan melakukan pengelompokkan
berdasarkan kemiripan dari atribut-atribut tabel.
4.3 Built Model
Pembangunan model yang akan dilakukan menggunakan software Microsoft
Access. Selain di Microsoft Access pembangunan model dapat dilakukan pada
beberapa software lainnya seperti Weka, Matlab. Namun, database yang akan
dikelompokkan termuat dalam Microsoft Access. Hal ini bertujuan agar eksplorasi
database menjadi satu paket dengan tools pemodelan clustering nama event
berdasarkan event-event yang telah diselenggarakan oleh event organizer ini.

Clustering data akhir set menggunakan algoritma K-means dilakukan pada


tahap ini. Selanjutnya menentukan pusat cluster dengan membuat tabel untuk
penyimpanannya. Rancangan tabel tersebut yaitu:
Tabel 4.1 Rancangan penyimpanan pusat cluster
No.
1
2
3

Field
Nmkel
Kelompok1
Kelompok2

Tipe Data
Text
Text
Text

Keterangan
Nama kelompok
Pusat cluster invoice penjualan
Pusat cluster invoice detail penjualan

Jumlah cluster pada penelitian ini adalah terdiri dari 2 yaitu banyak dan
sedikit. K-Means merupakan cluster yang bersifat unsupvised learning yang
membagi data cluster berdasarkan nilai k yang telah ditetapkan. Pada penelitian
ini nilai k=2 dengan nama cluster kel1 dan kel2.
4.4 Asess Model
Tahap ini dilakukan inisiasi pusat cluster yang berbeda-beda agar didapat
nilai pusat cluster yang paling optimal dan inisiasi dilakukan secara acak.
Penentukan hasil cluster yang paling optimal dilakukan dengan cara mencari pusat
cluster mayoritas dan memeriksa rasio antara besaran B(k)=Between Cluster
Variation (BCV) dengan W(k)=Within Cluster Variation (WCV) seperti pada
Persamaan 3. Rasio dengan nilai terbesar merupakan parameter hasil cluster
terbaik (Budiman, 2012).

Between Cluster Variation (BCV) menyatakan jarak Euclides dari mi ke


mj seperti pada Persamaan 4 (Budiman, 2012).

Within Cluster Variation (WCV) menyatakan sum of squared errors seperti


pada Persamaan 5 (Budiman, 2012).

5. Evaluation
Tahap evaluasi merupakan tahap untuk menguji hasil data mining, sehingga
mencapai tujuan dari business understanding.

5.1 Evaluate Result


Tahap ini pengujian terhadap hasil data mining yang sebaiknya melibatkan
user agar dapat menilai hasil data mining berdasarkan tahap business
understanding.
5.2 Review Process
Tahap untuk memeriksa hasil data mining dari tahap awal hingga akhir.
5.3 Determine Next Steps
Tahap untuk menentukan langkah selanjutnya. Hal ini berdasarkan hasil data
mining, jika sudah memenuhi tujuan business understanding maka masuk
pada tahap akhir. Namun jika belum memenuhi tujuan business understanding
langkah yang diambil adalah kembali ke tahap awal.
6. Deployment
Tahap akhir dari metode Crisp-DM yaitu membuat laporan hasil pengolahan
data mining tentang pengetahuan dari eksplorasi data sehingga dapat dipahami
user. Tahap ini dapat juga sebagai maintenance karena bisa saja eksplorasi
data akan mengalami perubahan atau perbaikan

Anda mungkin juga menyukai