PIPELINE PADA PT X
ABSTRACT
PT X is a joint venture subsidiary of a bank in Indonesia, which is a company, engaged in
general insurance business. PT X is required to increase its share of the parent company by the
shareholders in developing its business potential. In developing the potential of the business, companies
need enough information to be analyzed further. Sources of information that can be used is the business
data of the company, both of PT X as a subsidiary and its holding company. By utilizing business data
in large numbers, the company will find a variety of information needed. For the business data
processing required a technique of data mining. In a study conducted, the implementation of the model
refers to the six stages of Cross-Industry Standard Process for Data Mining or commonly known by the
acronym CRISP-DM. In doing data mining, the six phases of the CRISP-DM is business understanding,
understanding the data, the data preparation, modeling, evaluation, and deployment. At this stage of
deployment, the report will be made by the customer segmentation by region. The expected result is the
information required in the form of a new customer pipeline.
Berdasar pada model referensi yang telah 3. Data Preparation, pada tahap ini struktur
ditampilkan pada gambar 3.1, berikut basis data akan dipersiapkan sehingga
merupakan penjelasannya: mempermudah proses mining.
1. Business Understanding, adalah 4. Modeling Phase, adalah fase menentukan
pemahaman tentang substansi dari kegiatan teknik data mining yang digunakan,
data mining yang akan dilakukan, menentukan tools data mining, algoritma
kebutuhan dari perspektif bisnis. data mining, menentukan parameter
Kegiatannya antara lain menentukan dengan nilai yang optimal.
sasaran atau tujuan bisnis, memahami 5. Evaluation Phase, adalah fase interpretasi
situasi bisnis, menerjemahkan tujuan bisnis terhadap hasil data mining yang
kedalam tujuan data mining. ditunjukkan dalam proses pemodelan yang
2. Data Understanding, adalah pengumpulan terdapat pada fase sebelumnya. Evaluasi
data, mempelajari data untuk dapat dilakukan secara mendalam dengan tujuan
memahami data yang akan digunakan menyesuaikan model yang didapat agar
dalam penelitian, mengidentifikasi sesuai dengan sasaran yang ingin dicapai
masalah yang berkaitan dengan data. dalam fase pertama.
3.1 Phase 1
Pada fase ini terdapat empat proses yaitu: rencana yang akan dilakukan dalam
1. Determine business objectives dilakukan penelitian.
untuk memahami tujuan yang ingin dicapai 3. Determine data mining goals yaitu
oleh PT X dari perspektif bisnis kepada menyatakan tujuan data mining secara
perusahaan induknya secara menyeluruh. teknis terhadap penelitian yang dilakukan.
2. Asses situation dilakukan untuk melibatkan 4. Plan activities yaitu menjelaskan rencana
fakta yang ada pada PT X tentang sumber yang ditujukan untuk mencapai tujuan data
daya, kendala, asumsi dan faktor-faktor mining dan dengan demikian dapat
lain yang harus dipertimbangkan dalam mencapai tujuan bisnis, kemudian
menentukan tujuan analisis data dan menentukan tools yang akan dipergunakan.
3.2 Phase 2
Pada fase ini terdapat tiga proses yaitu: awal ini termasuk loading data jika
1. Collect initial data yaitu memperoleh data diperlukan untuk memahami data tersebut.
atau akses untuk membuka data yang akan 2. Describe data yaitu memeriksa data yang
digunakan dalam penelitian. Pengumpulan diperoleh dan melaporkan hasilnya.
3.3 Phase 3
Pada fase ini terdapat tiga proses yaitu: noisy data dan missing values. Proses
1. Data selection yaitu memilih data yang pembersihan data atau cleansing dilakukan
akan digunakan dalam proses data mining. untuk menemukan anomali data yang
Dalam proses ini dilakukan juga pemilihan mungkin saja masih terdapat pada data
atribut-atribut yang disesuaikan dengan tersebut.
proses data mining. 3. Transformation yaitu pengelompokkan
2. Data preprocessing yaitu memastikan atribut-atribut atau field yang telah terpilih
kualitas data yang telah dipilih pada tahap kedalam basis data baru untuk bahan data
data selection, pada tahap ini masalah yang mining.
harus dihadapi adalah apabila terdapat
3.4 Phase 4
3.5 Phase 5
.
Pada fase ini terdapat dua proses yaitu: 2. Determine next step yaitu memberikan
1. Evaluate result yaitu merangkum hasil keputusan apakah teknik pemodelan yang
penilaian dari segi kriteria keberhasilan dipergunakan dapat dijadikan standar
bisnis, termasuk pernyataan akhir dalam menentukan tujuan penelitian
mengenai apakah penelitian sudah
memenuhi tujuan bisnis.
3.
3.6 Phase 6
Pada fase ini terdapat dua proses yaitu: 1. Deployment plan yaitu menjelaskan
gambaran mengenai rencana terhadap
pembuatan laporan yang akan dibuat.
Berdasarkan pada tabel 4.1 yang telah wilayah Surabaya berjumlah 221 customer,
ditampilkan dapat dilihat bahwa jumlah wilayah Denpasar berjumlah 67 customer, dan
pipeline customer baru secara total untuk wilayah Makassar berjumlah 110 customer.
wilayah Medan berjumlah 197 customer, Sehingga jumlah pipeline customer baru secara
wilayah Palembang berjumlah 94 customer, keseluruhan berjumlah 1.435 customer.
wilayah Jakarta 1 berjumlah 166 customer, Gambar berikut ini merupakan grafik yang
wilayah Jakarta 2 berjumlah 138 customer, akan menampilkan jumlah customer dari PT
wilayah Jakarta 3 berjumlah 85 customer, Bank X yang belum dan sudah menjadi
wilayah Bandung berjumlah 116 customer, customer PT X sebagai anak perusahaan PT
wilayah Banjarmasin berjumlah 137 customer, Bank X.
wilayah Semarang berjumlah 104 customer,
Pal, N. R., & Jain, L. C. (2005). Advanced Turban, E., Aronson, J. E., & Liang, T.-P.
Techniques in Knowledge Discovery and (2005). Decision Support Systems and
Data Mining. New York: Springer. Intelligent Systems. New Jersey: Prentice-
Hall, Inc.
Ponniah, P. (2011). Data Warehousing
Fundamentals for IT Professionals. New Yan, J., Zhang, C., Zha, H., Gong, M., Sun, C.,
Jersey: John Wiley & Sons, Inc. Huang, J., et al. (2015). Proceedings of the
Twenty-Ninth AAAI Conference on
Shafique, U., & Qaiser, H. (2014). International Artificial Intelligence. On Machine
Journal of Innovation and Scientific Learning towards Predictive Sales
Research. A Comparative Study of Data Pipeline Analytics , 1945-1951.
Mining Process Models (KDD, CRISP-
DM and SEMMA) , 12 (1), 217-222.