Anda di halaman 1dari 12

IMPLEMENTASI MODEL CRISP-DM UNTUK MENENTUKAN SALES

PIPELINE PADA PT X

Dina Feblian1), Dadan Umar Daihani2)


1
Mahasiswa Magister Teknik Industri, Fakultas Teknologi Industri, Universitas Trisakti
2
Dosen Magister Teknik Industri, Fakultas Teknologi Industri, Universitas Trisakti
dina.feblian@gmail.com, dadan@trisakti.ac.id

ABSTRACT
PT X is a joint venture subsidiary of a bank in Indonesia, which is a company, engaged in
general insurance business. PT X is required to increase its share of the parent company by the
shareholders in developing its business potential. In developing the potential of the business, companies
need enough information to be analyzed further. Sources of information that can be used is the business
data of the company, both of PT X as a subsidiary and its holding company. By utilizing business data
in large numbers, the company will find a variety of information needed. For the business data
processing required a technique of data mining. In a study conducted, the implementation of the model
refers to the six stages of Cross-Industry Standard Process for Data Mining or commonly known by the
acronym CRISP-DM. In doing data mining, the six phases of the CRISP-DM is business understanding,
understanding the data, the data preparation, modeling, evaluation, and deployment. At this stage of
deployment, the report will be made by the customer segmentation by region. The expected result is the
information required in the form of a new customer pipeline.

Keywords: Data Mining, CRISP-DM, Customer Segmentation, Customer Pipeline

pelakunya untuk selalu memikirkan strategi


1. PENDAHULUAN
agar dapat terus bertahan dan jika mungkin
1.1 Latar Belakang mengembangkan skala bisnis mereka. Untuk
Data merupakan sebuah aset yang mencapai hal tersebut dapat dilakukan upaya
berharga. Seiring dengan pesatnya seperti peningkatan kapasitas produk, efisiensi
perkembangan teknologi pada pengumpulan biaya operasional perusahaan dan peningkatan
dan penyimpanan data, menghasilkan basis efektivitas pemasaran. Salah satu cara untuk
data yang terlampau besar. Sehingga, data yang memenuhi kebutuhan diatas yaitu dengan
dikumpulkan jarang dilihat karena terlalu melakukan analisis data perusahaan.
panjang, tidak menarik dan memakan waktu Seperti PT X yang didirikan di Jakarta
yang cukup lama untuk mengolah data tersebut. pada tahun 2011 merupakan salah satu anak
Keputusan yang seharusnya dibuat berdasarkan perusahaan joint venture dari sebuah bank di
data seringkali dibuat tidak lagi berdasarkan Indonesia, yaitu perusahaan yang bergerak
data, tetapi berdasar intuisi pembuat keputusan, dalam bidang asuransi kerugian. Tidak hanya
sehingga terciptalah cabang ilmu data mining. PT X yang bergerak dalam bidang usaha
Data mining merupakan suatu proses tersebut, masih cukup banyak perusahaan lain
pencarian data secara otomatis yang bersumber yang bergerak dibidang serupa. Hal ini tentu
dari database dalam skala besar untuk saja menimbulkan persaingan bisnis antar
mendapatkan informasi yang berguna [12]. perusahaan. Persaingan yang terjadi dalam
Perkembangan data mining tidak dapat lepas dunia bisnis asuransi kerugian memaksa para
dari teknologi informasi yang memungkinkan pelakunya untuk selalu memikirkan strategi
data dalam jumlah besar terakumulasi. Dari yang dapat menjamin kelangsungan dari bisnis
keterkaitan tersebut, menjadikan data mining asuransi yang mereka jalankan serta
telah berkembang pada berbagai sektor bisnis. meningkatkan pendapatan perusahaan. Sebagai
Dalam dunia bisnis yang penuh dengan anak perusahaan, PT X juga dituntut untuk
persaingan dan bersifat dinamis, membuat para meningkatkan pangsa pasarnya terhadap

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 1


perusahaan induk oleh para pemegang saham Sales Pipeline menurut Kimla (2013)
dalam mengembangkan potensi bisnisnya. dibuat secara wajib dan digunakan untuk
Untuk dapat melaksanakan hal itu, penjualan serta forecasting dan analisis. Secara
perusahaan memerlukan informasi yang cukup berkala dilakukan evaluasi untuk efektivitas
untuk dapat dianalisa lebih lanjut. Sumber dan perbaikan. Pipeline yang fleksibel
informasi yang dapat digunakan yaitu data merupakan metode yang paling sukses
bisnis perusahaan, baik dari PT X sebagai digunakan oleh beberapa perusahaan. Umpan
perusahaan anak dan perusahaan induknya. balik secara konsisten dari tenaga penjual
Data bisnis dalam jumlah yang besar dibutuhkan untuk akurasi pipeline tersebut dan
merupakan salah satu aset berharga yang sebagai refleksi dari kondisi nyata yang ada.
dimiliki oleh perusahaan, namun apabila data Pipeline disesuaikan setiap kali akan
tersebut tidak terlihat lagi nilainya karena selain kebutuhannya untuk mencerminkan perubahan
berupa tumpukan data, data tersebut adalah data yang dibutuhkan dalam proses penjualan [5].
yang tidak terpakai lagi. Akan tetapi, dengan Model operasi pipeline secara umum
memanfaatkan data bisnis dalam jumlah yang dijelaskan oleh Yan, et al., (2015), yaitu seperti
besar, perusahaan akan menemukan beragam mengidentifikasi prospek penjualan baru,
informasi yang dibutuhkan. Untuk proses kemudian penjual memasukkan peluang
pengolahan data bisnis tersebut diperlukan prospek penjualan pada sistem manajemen
suatu teknik dari data mining. pipeline. Prospek yang telah teridentifikasi ini
selanjutnya dievaluasi dan ditetapkan beberapa
yang berpotensi menjadi peluang penjualan.
1.2 Tujuan Penelitian
Sebuah peluang penjualan terdiri dari satu set
Tujuan dari pelaksanaan penelitian ini dari satu atau lebih produk atau jasa yang
yaitu: penjual berusaha untuk mengkonversi kedalam
1. Mengembangkan pemodelan melalui pembelian klien yang sebenarnya [14].
teknik dari data mining untuk Berdasarkan penjelasan diatas, dapat
mengendalikan data bisnis dengan disimpulkan bahwa sales pipeline
segmentasi pasar. menggambarkan pendekatan untuk penjualan,
2. Menemukan informasi yang dibutuhkan dibuat berdasarkan prinsip yang mendasari
berupa sales pipeline dari pemodelan yang proses penjualan dari pihak yang melakukan
dilakukan pada data bisnis yang bersumber penjualan. Menggambarkan langkah sales dari
dari kedua buah perusahaan yaitu, PT X dan pelanggan potensial atau prospek untuk
perusahaan induknya. mengkualifikasi prospek tersebut menjadi
3. Mengetahui ukuran pangsa pasar pada petunjuk dan memvalidasinya lebih lanjut yang
segmen Commercial yang telah dicapai mengarah kepada peluang penjualan. Sales
oleh PT X sebagai anak perusahaan pipeline digunakan agar angka penjualan dapat
terhadap perusahaan induknya. dikendalikan dan pekerjaan dalam sales
terorganisir dengan baik.

2. TINJAUAN PUSTAKA 2.2 Segmentasi Pasar


2.1 Sales Pipeline Menurut Lamb, Hair, dan McDaniel
Menurut Cefkin (2007), manajemen (2010), segmen pasar adalah subkelompok
sales pipeline digunakan pada perusahaan orang atau organisasi yang berbagi satu atau
komersial sebagai sarana untuk mengarahkan lebih karakteristik yang menyebabkan memiliki
fokus dan perhatian personil serta untuk kebutuhan produk serupa [7]. Dari perspektif
mengantisipasi kinerja pada masa yang akan pemasaran, segmen pasar dapat digambarkan
datang. Sistem akuntansi pada sales pipeline sebagai suatu tempat antara dua ekstrem.
digunakan untuk memantau potensi Segmentasi Pasar atau market segmentation
pendapatan, mengelola keputusan investasi, menurut Kotler dan Keller (2012), adalah pasar
dan untuk menetapkan proyeksi yang akan yang telah dibagi terdiri dari sekelompok
datang. Karena itu, sales pipeline dapat pelanggan yang memiliki sekumpulan
dijadikan sebagai petunjuk oleh pemegang kebutuhan dan keinginan yang serupa [6].
saham dan analis pasar. Proses membagi pasar menjadi segmen-segmen
yang bermakna, relatif sama, dan atau

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 2


kelompok yang dapat diidentifikasi disebut pengetahuan potensial dan berguna yang
sebagai segmentasi pasar. Tujuan dari bermanfaat yang tersimpan didalam database
segmentasi pasar adalah untuk memungkinkan besar [13].
pemasar menyesuaikan bauran pemasaran Data mining menurut David Hand,
untuk memenuhi kebutuhan suatu segmen Heikki Mannila dan Padhraic Smyth dari MIT
secara spesifik [7]. adalah analisa terhadap data yang biasanya
Segmentasi dapat dilakukan berdasar atas berukuran besar untuk menemukan hubungan
variabel utama seperti dibawah ini, yaitu: [6] yang jelas serta menyimpulkan hasil dari
1. Segmentasi geografis, segmentasi yang analisa data yang belum diketahui sebelumnya
membagi pasar menjadi unit geografis dengan cara terkini untuk dipahami dan dapat
yang berbeda-beda seperti negara, daerah berguna bagi pemilik data tersebut [8].
otonomi, kota, iklim, atau kawasan Selain definisi diatas, data mining adalah
pemukiman. analisis data untuk membangun hubungan dan
2. Segmentasi demografis, segmentasi yang mengidentifikasi pola, berfokus pada
membagi pasar menjadi berbagai identifikasi hubungan dalam data. Data mining
kelompok berdasarkan variabel seperti merupakan sebuah kegiatan ekstraksi informasi
seperti usia, ukuran keluarga, siklus yang tujuannya adalah untuk menemukan
kehidupan keluarga, jenis kelamin, fakta-fakta tersembunyi yang terkandung
penghasilan, pekerjaan, agama, ras, dalam database. Menggunakan kombinasi dari
generasi kewarganegaraan, dan kelas pembelajaran mesin, analisis statistik, teknik
sosial. pemodelan dan teknologi database. Data
3. Segmentasi psikografis, segmen pasar ini mining menemukan pola dan hubungan dalam
dilakukan dengan mengelompokkan data dan menyimpulkan aturan yang
konsumen atau pembeli menjadi bagian memungkinkan sebagai prediksi untuk masa
pasar menurut variabel-variabel pola atau yang akan datang [9].
gaya hidup dan kepribadian. Data mining merupakan suatu proses
4. Segmentasi perilaku, pada segmentasi ini pencarian data secara otomatis yang bersumber
pasar diklasifikasi dalam kelompok- dari database dalam skala besar untuk
kelompok yang dibedakan berdasarkan mendapatkan informasi yang berguna [12].
pengetahuan, sikap, penggunaan atau Data mining merupakan analisis dari
respon terhadap suatu produk. peninjauan kumpulan data untuk menemukan
Pada penelitian ini, untuk menentukan hubungan yang tidak diduga dan meringkas
segmentasi dan mengetahui ukuran pangsa data dengan cara yang berbeda dengan
pasar PT X terhadap perusahaan induknya yang sebelumnya, yang dapat dipahami dan
difokuskan pada satu segmen, yaitu segmen bermanfaat bagi pemilik data. Data mining
Commercial dengan menggunakan data bisnis merupakan bidang dari beberapa keilmuan
dari kedua belah pihak perusahaan. Dalam yang menyatukan teknik dari pembelajaran
proses pengolahan data bisnis tersebut mesin, pengenalan pola, statistik, database dan
menggunakan penerapan dari data mining. visualisasi untuk penanganan permasalahan
dalam pengambilan informasi dari database
2.3 Data Mining yang besar [8].
Beberapa faktor pendorong yang
Menurut Gartner Group, data mining mendukung kemajuan yang luar biasa dalam
merupakan suatu proses pengidentifikasian bidang data mining, antara lain: [8]
sekumpulan data dalam jumlah yang besar serta 1. Pertumbuhan yang cepat dalam kumpulan
tersimpan dalam tempat penyimpanan, melalui data.
teknik-teknik pengenalan pola seperti 2. Penyimpanan data dalam data warehouse
matematika dan teknik statistik [8]. Data sehingga seluruh perusahaan memiliki
mining adalah suatu istilah yang digunakan akses yang baik ke dalam database yang
untuk menemukan pengetahuan yang ada.
tersembunyi didalam database. Data mining 3. Adanya peningkatan akses data melalui
merupakan proses semi otomatik yang navigasi web dan intranet.
menggunakan teknik statistik, matematika, 4. Tekanan kompetisi bisnis untuk
kecerdasan buatan dan machine learning untuk meningkatkan penguasaan pasar dalam
mengekstraksi dan mengidentifikasi informasi globalisasi ekonomi.

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 3


5. Perkembangan teknologi perangkat lunak memberikan pemahaman yang salah bahwa
untuk data mining. data mining merupakan produk yang dapat
6. Perkembangan yang pesat dalam kemajuan dibeli dibandingkan keilmuan yang harus
komputasi dan pengembangan kapasitas dikuasai [8].
media penyimpanan. Pernyataan tersebut menegaskan bahwa
Berdasarkan pada definisi yang telah dalam data mining otomatisasi tidak
disampaikan, hal penting yang berhubungan menggantikan campur tangan manusia.
dengan data mining, yaitu: Manusia harus ikut aktif dalam setiap fase
1. Data mining merupakan suatu proses dalam proses data mining. Kehebatan
otomatis terhadap data yang sudah ada kemampuan algoritma data mining yang
sebelumnya. terdapat dalam perangkat lunak analisis yang
2. Data yang akan diproses berupa data dalam terdapat saat ini memungkinkan terjadinya
skala besar. kesalahan penggunaan yang dapat berakibat
3. Tujuan dari data mining adalah fatal. Pengguna mungkin menerapkan analisis
mendapatkan hubungan atau pola yang yang tidak tepat terhadap kumpulan data
dapat berupa suatu informasi yang dengan menggunakan pendekatan yang
mungkin memberikan indikasi yang berbeda. Oleh karenanya, dibutuhkan
bermanfaat. pemahaman tentang statistik dan struktur
Pencarian suatu hubungan atau pola model matematika yang mendasari kinerja dari
didalam data mining dapat berupa hubungan perangkat lunak [8].
antara dua atau lebih dalam satu dimensi. Data Mining bukanlah suatu bidang ilmu yang
Misalnya dalam dimensi produk, dapat dilihat sama sekali baru [1][4] dan teorinya pun sudah
keterkaitan pembelian suatu produk dengan banyak dibahas dalam berbagai literatur. Teori-
produk yang lain. Selain itu, hubungannya juga teori tersebut antara lain yaitu, Naive-Bayes
dapat dilihat antara dua atribut atau lebih dan dan Nearest Neighbour, Pohon Keputusan,
dua objek ataupun lebih [10]. Aturan Asosiasi, K-Means Clustering, dan Text
Sementara itu, penemuan suatu pola Mining [1]. Sedangkan perkembangan terkini
merupakan output lain dari data mining. menghadirkan algoritma-algoritma yang
Misalnya, sebuah perusahaan perbankan yang dikembangkan antara lain, Jaringan Syaraf
akan meningkatkan fasilitas pinjaman untuk Tiruan (JST), Algoritma Genetik, Fuzzy C-
nasabah. Perusahaan tersebut akan mencari Means, Support Vector Machine (SVM), dan
pola dari daftar nasabah yang ada untuk lain-lain [8]. Sejak perkembangannya dari
mengetahui nasabah yang memiliki potensial tahun 1990-an, data mining yang sebelumnya
dan nasabah yang tidak memiliki potensial, dikuasai oleh para pakar statistik, ternyata pada
sehingga perusahaan juga dapat melakukan tahun 2000-an banyak dikembangkan oleh para
analisa perihal nasabah yang dapat dinaikkan pakar ilmu komputer yang berusaha untuk
fasilitas pinjamannya [10]. memperbaiki kinerja dari teori-teori statistik
Beberapa penjelasan mengenai definisi yang ada. Menurut Daryl Pregibon disebutkan
awal dari data mining menyertakan fokus pada bahwa data mining adalah perpaduan dari
proses otomatisasi. Berry dan Linoff, (2004) Statistik, Artificial Intelligence dan Database
dalam buku Data Mining Technique for [3].
Marketing, Sales, and Customer Support
mendefinisikan data mining sebagai suatu 2.4 Cross-Industry Standard Process
proses eksplorasi dan analisis secara otomatis untuk Data Mining
maupun semi otomatis terhadap data dalam Cross-Industry Standard Process untuk
jumlah besar dengan tujuan menemukan pola Data Mining atau CRISP-DM dikembangkan
atau aturan yang berarti. Tiga tahun kemudian tahun 1996 oleh analis dari beberapa industri
dalam buku Mastering Data Mining, mereka seperti Daimler Chrysler, SPSS dan NCR
memberikan definisi ulang terhadap pengertian [8][11]. CRISP-DM merupakan standarisasi
dari data mining dan memberikan pernyataan proses data mining sebagai strategi pemecahan
bahwa “jika ada yang kami sesalkan adalah masalah secara umum dari bisnis atau unit
frasa secara otomatis maupun semi otomatis, penelitian [8].
karena kami merasa hal tersebut memberikan Dalam CRISP-DM sebuah proyek data
fokus berlebih pada teknik otomatis dan kurang mining memiliki siklus hidup yang terbagi
pada eksplorasi dan analisis”. Hal tersebut dalam enam fase [8][11]. Berikut merupakan

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 4


gambar 2.3 yang akan memberikan gambaran d. Jika diinginkan, pilih sebagian kecil
secara umum mengenai siklus hidup dalam kelompok data yang mungkin
CRISP-DM. mengandung pola dari permasalahan.
3. Data Preparation Phase atau Fase
Pengolahan Data
a. Menyiapkan data yang tersedia dari
awal, karena merupakan kumpulan
data yang akan digunakan untuk
keseluruhan fase berikutnya. Fase ini
merupakan pekerjaan berat yang perlu
dilaksanakan secara intensif.
b. Memilih kasus dan variabel yang ingin
dianalisis dan yang sesuai dengan
analisis yang akan dilakukan.
c. Melakukan perubahan pada beberapa
variabel jika dibutuhkan.
d. Menyiapkan data awal sehingga siap
untuk perangkat pemodelan.
Gambar 2.1 Siklus Hidup dalam CRISP-DM 4. Modeling Phase atau Fase Pemodelan
(Larose, 2014) a. Memilih dan mengaplikasikan teknik
pemodelan yang sesuai.
Keseluruhan fase berurutan yang ada b. Kalibrasi aturan model untuk
tersebut bersifat adaptif. Fase berikutnya dalam mengoptimalkan hasil.
urutan bergantung kepada keluaran dari fase c. Yang perlu diperhatikan bahwa
sebelumnya. Hubungan penting antar fase beberapa teknik mungkin untuk
digambarkan dengan panah. Sebagai contoh, digunakan pada permasalahan data
jika proses berada pada fase modeling. Berdasar mining yang sama.
pada perilaku dan karakteristik model, proses d. Jika diperlukan, proses dapat kembali
mungkin kembali kepada fase data preparation kepada fase pengolahan data untuk
untuk perbaikan lebih lanjut terhadap data atau menjadikan data kedalam bentuk yang
berpindah maju kepada fase evaluation [8]. sesuai dengan spesifikasi kebutuhan
Dari gambar 2.3 dapat dilihat bahwa dari teknik data mining tertentu.
siklus hidup dari CRISP-DM terdiri dari enam 5. Evaluation Phase atau Fase Evaluasi
fase, yaitu: [8] a. Mengevaluasi satu atau lebih model
1. Business Understanding Phase atau Fase yang digunakan dalam fase pemodelan
Pemahaman Bisnis untuk mendapatkan kualitas dan
a. Penentuan tujuan proyek dan efektivitas sebelum disebarkan untuk
kebutuhan secara detail dalam lingkup digunakan.
bisnis atau unit penelitian secara b. Menetapkan apakah terdapat model
keseluruhan. yang memenuhi tujuan pada fase awal.
b. Menerjemahkan tujuan dan batasan c. Menentukan apakah terdapat
menjadi formula dan definisi dari permasalahan penting dari bisnis atau
permasalahan data mining. penelitian yang tidak tertangani dengan
c. Menyiapkan strategi awal untuk baik.
mencapai tujuan. d. Mengambil keputusan berkaitan
2. Data Understanding Phase atau Fase dengan penggunaan hasil dari data
Pemahaman Data mining.
a. Mengumpulkan data. 6. Deployment Phase atau Fase Penyebaran
b. Menggunakan analisis penyelidikan a. Menggunakan model yang dihasilkan.
data untuk mengenali lebih lanjut Terbentuknya model tidak
mengenai data dan pencarian awal menandakan telah terselesaikannnya
pengetahuan yang ada didalamnya. proyek.
c. Mengevaluasi kualitas data. b. Contoh sederhana dari penyebaran
yaitu pembuatan laporan.

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 5


c. Contoh kompleks dari penyebaran 3. METODOLOGI PENELITIAN
yaitu penerapan proses data mining
Model referensi khusus metodologi
secara paralel pada departemen lain.
CRISP-DM pada penelitian ini telah
dikembangkan. Gambar 3.1 merupakan model
referensinya secara umum.

Gambar 3.1 Model Referensi Umum CRISP-DM

Berdasar pada model referensi yang telah 3. Data Preparation, pada tahap ini struktur
ditampilkan pada gambar 3.1, berikut basis data akan dipersiapkan sehingga
merupakan penjelasannya: mempermudah proses mining.
1. Business Understanding, adalah 4. Modeling Phase, adalah fase menentukan
pemahaman tentang substansi dari kegiatan teknik data mining yang digunakan,
data mining yang akan dilakukan, menentukan tools data mining, algoritma
kebutuhan dari perspektif bisnis. data mining, menentukan parameter
Kegiatannya antara lain menentukan dengan nilai yang optimal.
sasaran atau tujuan bisnis, memahami 5. Evaluation Phase, adalah fase interpretasi
situasi bisnis, menerjemahkan tujuan bisnis terhadap hasil data mining yang
kedalam tujuan data mining. ditunjukkan dalam proses pemodelan yang
2. Data Understanding, adalah pengumpulan terdapat pada fase sebelumnya. Evaluasi
data, mempelajari data untuk dapat dilakukan secara mendalam dengan tujuan
memahami data yang akan digunakan menyesuaikan model yang didapat agar
dalam penelitian, mengidentifikasi sesuai dengan sasaran yang ingin dicapai
masalah yang berkaitan dengan data. dalam fase pertama.

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 6


6. Deployment Phase atau fase penyebaran presentasi dari pengetahuan yang didapat
adalah fase penyusunan laporan atau dari evaluasi pada proses data mining.

3.1 Phase 1

Gambar 3.2 Fase Pertama Model Referensi CRISP-DM

Pada fase ini terdapat empat proses yaitu: rencana yang akan dilakukan dalam
1. Determine business objectives dilakukan penelitian.
untuk memahami tujuan yang ingin dicapai 3. Determine data mining goals yaitu
oleh PT X dari perspektif bisnis kepada menyatakan tujuan data mining secara
perusahaan induknya secara menyeluruh. teknis terhadap penelitian yang dilakukan.
2. Asses situation dilakukan untuk melibatkan 4. Plan activities yaitu menjelaskan rencana
fakta yang ada pada PT X tentang sumber yang ditujukan untuk mencapai tujuan data
daya, kendala, asumsi dan faktor-faktor mining dan dengan demikian dapat
lain yang harus dipertimbangkan dalam mencapai tujuan bisnis, kemudian
menentukan tujuan analisis data dan menentukan tools yang akan dipergunakan.

3.2 Phase 2

Gambar 3.3 Fase Kedua Model Referensi CRISP-DM

Pada fase ini terdapat tiga proses yaitu: awal ini termasuk loading data jika
1. Collect initial data yaitu memperoleh data diperlukan untuk memahami data tersebut.
atau akses untuk membuka data yang akan 2. Describe data yaitu memeriksa data yang
digunakan dalam penelitian. Pengumpulan diperoleh dan melaporkan hasilnya.

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 7


3. Explore data yaitu melakukan eksplorasi memberikan deskripsi mengenai isi data
terhadap isi data yang diperoleh, kemudian tersebut.

3.3 Phase 3

Gambar 3.4 Fase Ketiga Model Referensi CRISP-DM

Pada fase ini terdapat tiga proses yaitu: noisy data dan missing values. Proses
1. Data selection yaitu memilih data yang pembersihan data atau cleansing dilakukan
akan digunakan dalam proses data mining. untuk menemukan anomali data yang
Dalam proses ini dilakukan juga pemilihan mungkin saja masih terdapat pada data
atribut-atribut yang disesuaikan dengan tersebut.
proses data mining. 3. Transformation yaitu pengelompokkan
2. Data preprocessing yaitu memastikan atribut-atribut atau field yang telah terpilih
kualitas data yang telah dipilih pada tahap kedalam basis data baru untuk bahan data
data selection, pada tahap ini masalah yang mining.
harus dihadapi adalah apabila terdapat
3.4 Phase 4

Gambar 3.5 Fase Keempat Model Referensi CRISP-DM

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 8


Pada fase ini terdapat tiga proses yaitu: 2. Build model yaitu menjalankan alat
1. Select modeling technique merupakan pemodelan sesuai dengan prosedur.
langkah pertama dalam pemodelan, yaitu 3. Generate test design yaitu menguji kualitas
dengan menggunakan teknik pemodelan model dan validitas dengan menggunakan
yang telah ditetapkan pada fase business dataset yang telah dipersiapkan.
understanding.

3.5 Phase 5

Gambar 3.6 Fase Kelima Model Referensi CRISP-DM pada Penelitian

.
Pada fase ini terdapat dua proses yaitu: 2. Determine next step yaitu memberikan
1. Evaluate result yaitu merangkum hasil keputusan apakah teknik pemodelan yang
penilaian dari segi kriteria keberhasilan dipergunakan dapat dijadikan standar
bisnis, termasuk pernyataan akhir dalam menentukan tujuan penelitian
mengenai apakah penelitian sudah
memenuhi tujuan bisnis.
3.

3.6 Phase 6

Gambar 3.7 Fase Keenam Model Referensi CRISP-DM pada Penelitian

Pada fase ini terdapat dua proses yaitu: 1. Deployment plan yaitu menjelaskan
gambaran mengenai rencana terhadap
pembuatan laporan yang akan dibuat.

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 9


2. Produce final report yaitu memberikan dengan urutan nama file yang telah
visualisasi dari laporan yang telah dibuat disesuaikan menurut isi dan penamaan file. Dari
berdasarkan pada deployment plan. hasil proses fuzzy lookup yang dilakukan dalam
tahap modeling, maka terdapat 17 file yang
4. HASIL DAN PEMBAHASAN
telah disimpan. Tabel berikut ini akan
Data yang digunakan dalam proses menampilkan ringkasan yang menerangkan
modeling sebanyak 34 file yang terdiri dari 17 seberapa banyak jumlah customer yang
file data primer dan 17 file data sekunder. termasuk dalam pipeline customer baru yang
Kedua buah data file tersebut kemudian telah dikelompokkan berdasarkan bulan dan
masing-masing digabung menjadi satu sesuai disegmentasi berdasarkan wilayah pembagian
kerja dari segmen Commercial pada PT X.

Tabel 4.1 Jumlah Pipeline Customer Baru

Berdasarkan pada tabel 4.1 yang telah wilayah Surabaya berjumlah 221 customer,
ditampilkan dapat dilihat bahwa jumlah wilayah Denpasar berjumlah 67 customer, dan
pipeline customer baru secara total untuk wilayah Makassar berjumlah 110 customer.
wilayah Medan berjumlah 197 customer, Sehingga jumlah pipeline customer baru secara
wilayah Palembang berjumlah 94 customer, keseluruhan berjumlah 1.435 customer.
wilayah Jakarta 1 berjumlah 166 customer, Gambar berikut ini merupakan grafik yang
wilayah Jakarta 2 berjumlah 138 customer, akan menampilkan jumlah customer dari PT
wilayah Jakarta 3 berjumlah 85 customer, Bank X yang belum dan sudah menjadi
wilayah Bandung berjumlah 116 customer, customer PT X sebagai anak perusahaan PT
wilayah Banjarmasin berjumlah 137 customer, Bank X.
wilayah Semarang berjumlah 104 customer,

Gambar 4.1 Grafik Perbandingan Jumlah Customer Baru dan Existing

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 10


Berdasarkan pada grafik yang telah customer yang belum menjadi customer PT X
ditampilkan, dapat dilihat bahwa pada bulan dari total 107 customer. Pada bulan Oktober
Januari terdapat 8 jumlah customer yang sudah terdapat 12 jumlah customer yang sudah
menjadi customer PT X dan sebanyak 123 menjadi customer PT X dan sebanyak 89
customer yang belum menjadi customer PT X customer yang belum menjadi customer PT X
dari total 131 customer. Pada bulan Februari dari total 101 customer. Pada bulan November
terdapat 24 jumlah customer yang sudah terdapat 14 jumlah customer yang sudah
menjadi customer PT X dan sebanyak 153 menjadi customer PT X dan sebanyak 81
customer yang belum menjadi customer PT X customer yang belum menjadi customer PT X
dari total 177 customer. Pada bulan Maret dari total 95 customer. Pada bulan Desember
terdapat 17 jumlah customer yang sudah terdapat 2 jumlah customer yang sudah menjadi
menjadi customer PT X dan sebanyak 180 customer PT X dan sebanyak 72 customer yang
customer yang belum menjadi customer PT X belum menjadi customer PT X dari total 74
dari total 197 customer. Pada bulan April customer.
terdapat 15 jumlah customer yang sudah
5. KESIMPULAN
menjadi customer PT X dan sebanyak 146
customer yang belum menjadi customer PT X Panduan langkah-langkah CRISP-DM
dari total 161 customer. Pada bulan Mei tidak secara eksplisit menyebutkan dataset
terdapat 22 jumlah customer yang sudah sebagai kiriman untuk tugas persiapan data
menjadi customer PT X dan sebanyak 152 pada setiap fase, tetapi dataset tersebut
customer yang belum menjadi customer PT X sebaiknya diarsipkan dan didokumentasikan.
dari total 174 customer. Pada bulan Juni Dataset tidak akan sesuai tepat satu dengan
terdapat 17 jumlah customer yang sudah tugas yang ada pada setiap fase, tetapi
menjadi customer PT X dan sebanyak 149 informasi tentang data yang digunakan harus
customer yang belum menjadi customer PT X dimasukkan dalam setiap laporan yang harus
dari total 166 customer. Pada bulan Juli disampaikan.
terdapat 14 jumlah customer yang sudah Data mining dapat menciptakan
menjadi customer PT X dan sebanyak 103 lingkungan bisnis yang intelligence, yaitu
customer yang belum menjadi customer PT X efisiensi dalam mendapatkan informasi yang
dari total 117 customer. Pada bulan Agustus diperlukan, menyediakan tool khusus untuk
terdapat 11 jumlah customer yang sudah kemampuan analitis yang jauh lebih baik,
menjadi customer PT X dan sebanyak 87 mengurangi beban berlebih pada sistem
customer yang belum menjadi customer PT X operasional untuk membuat laporan dan
dari total 98 customer. Pada bulan September kegiatan analitik, serta memberikan
terdapat 14 jumlah customer yang sudah kemampuan bagi pengguna dalam ruang
menjadi customer PT X dan sebanyak 93 lingkup bisnis proses.

DAFTAR PUSTAKA Kantardzic, M. (2011). Data Mining :


Concepts, Models, Methods, and
Algorithms. Hoboken, New Jersey: John
Bramer, M. (2007). Principles of Data Mining.
Wiley & Sons, Inc.
London: Springer-Verlag.
Kimla, N. (2013). Pipeline Management:
Cefkin, M. (2007). Ethnographic Praxis in
Success with CRM. Los Angeles:
Industry Conference. Numbers may speak
Pipelinersales Inc.
louder than words, but is anyone
listening? The rhythmscape and sales Kotler, P., & Keller, K. (2012). Marketing
pipeline management , 187–199. Management. Upper Saddle River, New
Jersey: Prentice Hall.
Gorunescu, F. (2011). Data Mining - Concepts,
Models, and Techniques. Berlin: Springer- Lamb, C. W., Hair, J. F., & McDaniel, C.
Verlag Berlin Heidelberg. (2010). Marketing. Boston, MA: South-
Western College.

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 11


Larose, D. T. (2014). Discovering Knowledge Tan, P.-N., Steinbach, M., & Kumar, V. (2005).
in Data : An Introduction to Data Mining. Introduction To Data Mining. New York:
New Jersey: John Wiley & Sons, Inc. Pearson.

Pal, N. R., & Jain, L. C. (2005). Advanced Turban, E., Aronson, J. E., & Liang, T.-P.
Techniques in Knowledge Discovery and (2005). Decision Support Systems and
Data Mining. New York: Springer. Intelligent Systems. New Jersey: Prentice-
Hall, Inc.
Ponniah, P. (2011). Data Warehousing
Fundamentals for IT Professionals. New Yan, J., Zhang, C., Zha, H., Gong, M., Sun, C.,
Jersey: John Wiley & Sons, Inc. Huang, J., et al. (2015). Proceedings of the
Twenty-Ninth AAAI Conference on
Shafique, U., & Qaiser, H. (2014). International Artificial Intelligence. On Machine
Journal of Innovation and Scientific Learning towards Predictive Sales
Research. A Comparative Study of Data Pipeline Analytics , 1945-1951.
Mining Process Models (KDD, CRISP-
DM and SEMMA) , 12 (1), 217-222.

Implementasi model (Dina F, dkk) Jurnal Teknik Industri ISSN: 1411-6340 12

Anda mungkin juga menyukai