Anda di halaman 1dari 20

MAKALAH

DATA MINING DENGAN METODE CLUSTERING


UNTUK PENGOLAHAN INFORMASI TARGET PENDAPATAN PADA PT
GLOBAL EKOLOGI INDONESIA

Disusun Oleh:
Widiyawati (11220145)
Nadia (11220490)
Asep (11220455)
Handoko (11220335)

FAKULTAS TEKNOLOGI INFORMASI


PROGRAM STUDI SISTEM INFORMASI S1
UNIVERSITAS NUSA MANDIRI TANGERANG
2022
KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas karunia,

rahmat, dan ridho-Nya sehingga penulis dapat menyelesaikan makalah ini. Dalam

makalah ini penulis membahas tentang “DATA MINING DENGAN METODE

CLUSTERING UNTUK PENGOLAHAN INFORMASI TARGET

PENDAPATAN PADA PT GLOBAL EKOLOGI INDONESIA”. Makalah

disusun dengan tujuan untuk memenuhi salah satu syarat untuk dapat

menyelesaikan mata kuliah Data Warehouse & Business Intelligenci juga

diharapakan memberikan pengetahuan lebih kepada pembaca Penulis menyadari

sepenuhnya bahwa penulisan makalah ini masih jauh dari kesempurnaan, karena

pengetahuan dan pengalaman penulis yang masih terbatas. Namun demikian

penulis berusaha semaksimal mungkin untuk menyusun makalah ini dengan

sebaik-baiknya. Oleh karena itu, dengan segala kerendahan hati penulis

mengaharapkan kritik dan saran yang bersifat membangun demi kesempurnaan

makalah ini. Akhir kata penulis berharap semoga makalah ini dapat memberikan

manfaat.

Tangerang, 19 November 2022

Penyusun

ii
DAFTAR ISI

Kata Pengantar ...........................................................................................i

Daftar Isi ....................................................................................................ii

BAB 1 Pendahuluan ...................................................................................1

1.1. Latar Belakang Masalah.................................................................1

1.2. Rumusan Masalah ..........................................................................1

1.3. Tujuan ...........................................................................................1

BAB II Pembahasan ...................................................................................2

2.1 Profil perusahaan ..........................................................................2

2.2 Pengertian Data Mining ..................................................................5

2.3 Metodologi CRISP dm ....................................................................7

2.4 Clustering .......................................................................................11

2.5 Algoritma K-Means.........................................................................12

2.6 Hasil dan Pembahasan ....................................................................13

BAB III Penutup…………………………………….. .................................19

Daftar Pustaka……………………………………………… .......................20

iii
BAB I

PENDAHULUAN

1.1 Latar Belakang

Pendapatan adalah tiap tiap tambahan aktiva atau pengurnagan kewajiban yang timbul

karena usaha perusahaan, baik merupakan penyerahan jasa – jasa maupun penjulan barang

(Sugiri, 1994) . pendapatan sering juga disebut dengan penghasilan atau sebaliknya,

terkadang pendapatan tiap hari bertambah dan kadang berkurang.

Jasa fumigasi pada Gudang arsip, komiditi serta fumigasi pada sarana transportasi baik

darat maupun udara. Keunggulan fumigasi adalah dapat membunuh semua stadia larva, pupa

dan dewasa secara cepat, tepat dan efektik.

1.2 Rumusan Masalah

Teknik pengendalian hama dengan pelayanan standart pada umumnya perusahaan pest

control untuk comersial dan residensial dengan harga ekonomis

1.3 Tujuan

Tujuannya adalah menjadwalkan setiap tugas pada suatu penugasan sehingga

dihasilkan kerugian mimimal misalnya berupa biaya dan waktu serta keuntungan maksimal

misalnya berupa pendapatan, laba, nilai kemenangan. Salah satu metode yang digunakan

untuk menyelesaikan masalah penugasan dalam metode k-Means

4
BAB II

PEMBAHASAN

2.1 Profil perusahaan

PT. GLOBAL EKOLOGI INDONESIA berdiri sejak tahun 2009 dengan badan usaha CV.

GLOBAL CHEMINDO UTAMA dengan brand GLOBAL, seiring perjalan waktu global

mentransformasi menjadi G-PEST dengan nama badan usaha PT. GLOBAL EKOLOGI

INDONESIA berdasarkan akte notaris NOVIANTI S.H., MM tanggal 14 Juni 2013 Nomor:

50.

PT. GLOBAL EKOLOGI INDONESIA untuk saat ini telah memiliki kantor cabang di

beberapa kota yaitu, Jakarta, Cikarang, Tangerang dan Cirebon. Selain itu GPEST telah

memiliki perijinan secara lengkap sehingga tidak lagi diragukan legalitasnya antara lain :

 Akte Notaris, Noviati, S.H, MM Nomor: 50

 Surat Ketrangan Domisili (SKD)

 Tanda Daftar Perusahaan (TDP)

 Surat Ijin Usaha Perdagangan (SIUP)

 Nomor Pokok Wajib Pajak (NPWP)

 Ijin undang-undang gangguan

 Ijin operasional pest control/ Dinkes

 Kartu tanda anggota ASPPHAMI

 Kerjasama BPJS kesehatan

 Sertifikat-sertifikat pendukung

5
PT. GLOBAL EKOLOGI INDONESIA untuk saat ini memiliki produk pelaanan jasa

diantaranya :

1. PEST & RODENT CONTROL, Tehnik pengendalian hama dengan pelayanan

standart pada umumnya perusahaan pest control untuk sarana Comersian dan Residensial

dengan harga ekonomis.

2. TERMITE CONTROL, Kami memiliki pengalaman puluhan tahun dalam penanganan


rayap baik pra-kontruksi maupun pasca-kontruksi. Memiliki jaminan kualitas masa garansi
tidak perlu diragukan lagi.

3. FUM IGATION, Jasa fumigasi pada gudang arsip, komoditi serta fumigasi pada sarana
trasportasi baik darat, laut maupun udara. Keunggulan fumigasi adalah dapat membunuh
semua stadia larva, pupa dan dewasa secara cepat, tepat dan efektif.

4. DISINFECTAN, Desinfektan adalah bahan kimia yang digunakan untuk mencegah


terjadinya infeksi atau pencemaran jasad renik seperti bakteri dan virus, juga untuk
membunuh atau menurunkan jumlah mikro organisme atau kuman penyakit lainnya.

2.2 Pengertian Data Mining

Pengertian data mining ialah suatu proses pengumpulan informasi penting dari

suatu data besar, yang seringkali menggunakan metode statistika, matematika, serta

memanfaatkan teknologi artificial intelligence.

Sehingga cara kerja dari data mining sebenarnya ialah untuk memeriksa

database yang berukuran besar guna menemukan pola atau bentuk yang baru dan

berguna. Tetapi, tidak semua pekerjaan pencarian informasi dinyatakan sebagai data

mining.

Sedangkan fungsi dari data mining ialah sebagai fungsi prediksi (prediction),

fungsi klasifikasi (classification), fungsi deskripsi (description) dan fungsi asosiasi

(assosiation).

6
Dari penjelasan tersebut, adapula pengertian data mining menurut para ahli agar

wawasanmu semakin luas, diantaranya:

1. Larose

Pengertian data mining merupakan proses menemukan sesuatu yang bermakna


oleh suatu pola dengan cara memilah-milah data yang berukuran besar, dimana data
tersebut disimpan dalam repository, sehingga menggunakan statistik dan teknik
matematika.

2. Pramudiono

Menurut Pramudiono, pengertian data mining adalah analisa yang dilakukan


secara otomatis pada data besar dan kompleks dengan tujuan untuk mendapatkan pola
penting yang keberadaannya biasanya tidak disadari.

3. Hoffer dan McFadden

Pengertian data Mining ialah penemuan pengetahuan yang menggunakan


teknik-teknik dari statistik, tradisional, serta grafik komputer.

4. Berry

Sedangkan menurut Berry, pengertian data mining merupakan aktivitas


menganalisis data dalam jumlah yang besar untuk menemukan pattern (pola) dan rule
(aturan) yang berguna.

2.3 Metodologi CRISP-DM

CRISP-DM (Cross Industry Standart Process for Data Mining) adalahstandarisasi data

mining yang disusun oleh tiga penggagas data mining market. Yaitu Daimler Chrysler

(Daimler-Benz), SPSS (ISL), NCR. Kemudian dikembangkan pada berbagai workshops

(antara 1997 – 1999). Lebih dari 300 organisasi yang berkontribusi dalam proses modeling ini

7
dan akhirnya CRISP-DM 1.0 dipublikasikan pada 1999. Proses data mining berdasarkan

CRISP-DM terdiri dari 6 fase, yaitu : [4]

1. Fase Pemahaman Bisnis (BusinessUnderstanding Phase)

a. Penentuan tujuan proyek dan kebutuhan secara detail dalam lingkup bisnis atau unit

penelitiansecara keseluruhan

b. Menerjemahkan tujuan dan batasan menjadi formula dari permasalahan data mining.

c. Menyiapkan strategi awal untuk mencapai tujuan.

2. Fase Pemahaman Data (Data Understanding Phase)

a. Mengumpulkan data

b. Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut data dan

pencarian pengetahuan awal.

c. Mengevaluasi kualitas data

3. Fase Pengolahan Data (Data Preparation Phase)

a. Siapkan dari data awal, kumpulandata yang akan digunakan untuk keseluruhan fase

berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksanakan secara

intensif.

b. Pilih kasus dan variabel yang ingin di analisis dan yang sesuai analisa yang akan

dilakukan.

c. Siapkan data awal sehingga siap untuk perangkat pemodelan.

4. Fase Pemodelan (Modeling Phase)

a. Pilih dan aplikasikan teknik pemodelan yang sesuai

b. Kalibrasi aturan model untuk mengoptimalkan hasil

c. Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada

permasalahan data mining yang sama

d. Jika diperlukan proses dapat kembali ke fase pengolahan data untuk menjadikan data

8
ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining

tertentu.

5. Fase Evaluasi (Evaluation Phase)

a. Mengevaluasi satu atau lebih model yang digunakan dalam fasepemodelan untuk

mendapatkankualitas dan efektivitas sebelum disebarkan untuk digunakan.

b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal.

c. Menentukan apakah terdapatpermasalahan penting dari bisnisatau penelitian yang

tidak tertanganidengan baik.

d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining.

6. Fase Penyebaran (Deployment Phase)

Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah

terselesaikannya proyek

2.4 Clustering

Garcia‐Molina et al. [5] menyatakan Clustering adalah mengelompokkan item data

ke dalam sejumlah kecil grup sedemikian sehingga masing‐masing grup mempunyai

sesuatu persamaanyang esensial.

Pengklusteran merupakanpengelompokan record, pengamatan, atau memperhatikan

dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan

record yang memiliki kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan

dengan record dalam kluster lain.

2.5. Algoritma K-Means

Pada algoritma ini, pusat cluster atau centroid dipilih pada tahap awal secara acak dari

sekumpulan kolesi (populasi) data. Kemudian K-Means menguji masing-masing komponen

didalam populasi data dan menandai komponen tersebut ke salah satu centroid yang telah
9
didefinisikan sebelumnya berdasarkan jarak minimum antarakomponen (data) dengan masing-

masing centroid. Posisi centroid akan dihitung kembali sampai semua komponen data

dikelompokkan kesetiap centroid dan terakhir akanterbentuk posisi centroid baru. Iterasi ini

akan terus dilakukan sampai tercipta kondisi konvergen. Secara lebih detail, algoritma K-

Means Clustering adalah sebagai berikut :

Gambar 1. Flowchart K-Means Clusterinn

2.6 HASIL DAN PEMBAHASAN

2.6.1 Fase Pemahaman Bisnis

Pemahaman bisnis dilakukan dengan mempelajari objek penelitian yaitu dari

pendapatan dari PT. Global Ekologi Indonesia . Dalam fase ini dilakukan penentuan

tujuan bisnis yaitu untuk mengetahui pedapatan jasa PT. Global Ekologi Indonesia .

pedapatan tertinggi setiap bulannya selama 3 tahun, Setelah itu dilakukan penerapan

tujuan, penerapan tujuan sama dengan menentukan tujuan data mining yaitu dengan

menggali pengetahuan tentang jenis obat yang pemakaiannya cepat dan lama yang

didapatkan dari proses clustering.

10
2.6.2 Fase Pemahaman Bisnis

Data yang dikumpulkan merupakan data Laporan Laba/Rugi dari tahun 2019 -

2021 . Data Laporan Laba/Rugi didapatkan dari bagian yang mengurusi Laporan

Keuangan dan data Laporan Laba/Rugi disimpan dalam bentuk excel. Setelah data

didapatkan, proses selanjutnya adalah memahami data tersebut. Selanjutnya dilakukan

pengevaluasian kualitas data dan kelengkapan data. Nilai-nilai yang hilang sering

terjadi, terutama jika data yang dikumpulkan di jangka waktu yang lama. Memeriksa

atribut yang hilang atau kosong, ejaan nilai-nilai, dan apakah atribut dengan nilai yang

berbeda memiliki arti yang sama.

2.6.3 Fase Pemahaman Data

Persiapan data dilakukan dengan memilih atribut yang nantinya akan

digunakan untuk proses modeling yang diambil dari Laporan Laba/Rugi . Atribut

yang telah dipilih nantinya akan disimpan kembali kedalam dataset yang baru yang

siap untuk diproses kedalam proses modeling. Kemudian dilakukan transformasi data

dengan memindahkan atribut yang telah dipilih pada proses pemilihan data untuk

dipindahkan pada dataset yang baru yang nantinya siap diproses pada fase pemodelan.

2.6.4 Fase Pemodelan

Pada tahap pemodelan akan menggunakan metode clustering dengan algoritma

k-means. Dalam penerapan metode clustering, akan dibagi menjadi 3 cluster yang

nantinya akan meng- cluster produk jasa. Alat pemodelan yang digunakan adalah

Rapidminer 5.3. Rapidminer dapat digunakan untuk memudahkan dalam


11
perhitungan dengan algoritma k- means. Hasil yang didapatkan dari proses

clustering bulan Januari 2019 telah membagi 3 cluster yaitu cluster 0 dan cluster1

dan Cluster 2 . Setelah didapatkan hasilnya, data dianalisa berdasarkan atribut yang

dipakai. Kemudian masing-masing cluster yang telah dibagi diberi penamaan

sebagai label, yaitu label tinggi , s e d a n g dan Rendah.

12
2.6.5 Fase Evaluasi

Pada tahap evaluasi model akan dinilai apakah hasil yang didapatkan dari

proses clustering telah memenuhi tujuanyang telah ditentukan dalam tahap business

understanding. Setelah hasil yang didapatkan sama dengan tujuan pada business

understanding, maka akan dilakukan proses pengecekkan yang berfungsi untuk

memastikan bahwa semua tahap telah dilakukan dalam prosespengolahan data atau

tidak ada factor penting yang terleweatkan. Kemudian dipastikan bahwa semua tahapan

/ faktor penting yang telah dilakukan dengan pengolahan data tidak ada yang

terlewatkan. Dengan demikian dapat dilakukan proses selanjutnya pada proses

pengolahan data karena telah memenuhi tujuan dari data mining. Selanjutnya pada

tahap ini mempunyai 2 pilihan, yaitu kembali pada tahap awalatau melanjutkan ke

tahap akhir. Karenapada tahap sebelumnya telah memenuhitujuan dan tidak ada tahap

yang terlewatkan, maka tahap selanjutnya adalah menuju tahapan akhir dengan

menentukan persebaran dari hasil yang telah diperoleh dengan cara meakukan analisis.

2.6.6 Fase Penyebaran

Merupakan fase penerapan teknik klastering sesuai dengan tujuan / sasaran

yang ingin dicapai pada fase pertama.

2.6.7 Hasil

Diketahui angka pendapatn PT. Global Ekologi Indonesia dalam 3 tahun Dimana
proses pengelompokkan menggunakan metode K-Means.

Bulan Pest Control Termite Control Fumigation

1 590 110 90
2 629 145 105
3 670 170 150
4 703 196 166

13
5 738 223 203
6 776 629 240
7 817 145 198
8 597 105 266
9 927 347 327
10 978 398 348
11 1032 440 380
12 712 473 349

1. Misalkan kita akan pengelompokkan data tersebut menjadi 3 cluster, K = 3.


Misalkan pusat cluster kita tetapkan sembarang, C1 = (703, 196,166); C2 =
(776,629,240); dan C3 = (712, 473, 349).

Termite
Cluster Bulan Pest Control Fumigation
Control
1 4 703 196 166
2 6 776 629 240
3 12 712 473 349

2. Hitung jarak setiap data terhadap setiap pusat cluster. Misalkan untuk
menghi-tung jarak data pertama (No.1) dengan pusat cluster pertama

Pest Termite 
Cluster Bulan
Control Control
Fumigation Kesimpulan Iterasi 1: Cluster
Anggota
1 4 703 196 166 1 7
2 6 776 629 240 2 1
3 12 712 473 349 3 4

Data Set PerhItungan Jarak ke Centroid Clust


Bul
Pest Termi Fumigati
Terdekat er
an 1 2 3
Control te on yang

14
Contr diiku
ol ti
161.0620 571.3641 462.3137 161.0620
1 590 110 90 1
998 571 463 998
108.6185 523.5360 417.1438 108.6185
2 629 145 105 1
988 542 601 988
44.95553 479.6008 364.9301 44.95553
3 670 170 150 1
359 757 303 359
445.3021 332.1129
4 703 196 166 0 0 1
446 326
57.64546 409.4496 290.6750 57.64546
5 738 223 203 1
817 306 763 817
445.3021 200.7809
6 776 629 240 0 0 2
446 752
128.9224 487.5458 376.0452 128.9224
7 817 145 198 1
573 953 1 573
171.8051 554.3401 394.3830 171.8051
8 597 105 266 1
222 483 625 222
314.4805 331.5026 250.1699 250.1699
9 927 347 327 3
24 395 422 422
386.7208 325.3136 276.3729 276.3729
10 978 398 348 3
295 948 364 364
462.1395 347.6449 323.1872 323.1872
11 1032 440 380 3
893 338 522 522
332.1129 200.7809
12 712 473 349 0 0 3
326 752

Berdasarkan hasil penggolongan tersebut, diperoleh anggota cluster


pertama ada 7, cluster kedua ada 1, dan cluster ketiga ada 4.

3. Menghi-tung jarak cluster kedua dengan pusat cluster baru


Clust Bula Pest Termite Fumigati Kesimpulan Clust
er n Control Control on
Anggo
Iterasi 2: er
ta
677.7142 156.2857 168.2857
1 7
857 143 143
1 7
2 1 776 629 240 2 2
3 4 912.25 414.5 351 3 3

Data Set Perhirungan Jarak ke Centroid Clus


Bul Terdeka
Pest Term Fumiga ter
an 1 2 3 t
Control ite tion yan
15
Cont g
rol diik
uti
126.351954 571.364 514.476 126.351
1 590 110 90 1
2 1571 7366 9542
80.6568695 523.536 461.927 80.6568
2 629 145 105 1
9 0542 2805 6959
710.118084 1021.52 1055.98 710.118
3 4.7 3.2 1.3 1
2 1914 5219 0842
47.1361467 445.302 354.616 47.1361
4 703 196 166 1
1 1446 4301 4671
96.3859164 409.449 298.226 96.3859
5 738 223 203 1
9 6306 948 1649
488.120698 277.300
6 776 629 240 0 0 2
5 0406
710.118084 1021.52 1055.98 710.118
7 4.7 3.2 1.3 1
2 1914 5219 0842
136.722719 554.340 449.886 136.722
8 597 105 266 1
5 1483 444 7195
351.717970 331.502 73.1424 73.1424
9 927 347 327 3
3 6395 1246 1246
425.316976 325.313 67.8550 67.8550
10 978 398 348 3
6 6948 8456 8456
500.834405 347.644 125.822 125.822
11 1032 440 380 3
8 9338 5437 5437
366.252784 200.780 208.629 200.780
12 712 473 349 2
3 9752 606 9752

16
Berdasarkan hasil penggolongan tersebut, diperoleh anggota cluster
pertama ada 7, cluster kedua ada 2, dan cluster
Termi

Clust Bula Pest te Fumigatio Kesimpulan Clust
er n Control Contr n
Anggo
Iterasi 3: er
ol ta
466.6285 118.9428 Jumlah Kelompok
1 7
714
112.2
571
1 7
Data Iterasi 2
2 2 744 551 294.5 Sama Dengan 2 2
351.6666 Jumlah Kelompok
3 3 979 395
667
3 3
Data Iterasi 3

Data Set Perhitungan Jarak ke Centroid Clus


Term ter
Bul Terdeka
Pest ite Fumiga yang
an 1 2 3 t
Control Cont tion diik
rol uti
126.74004 509.918 548.648 126.740
1 590 110 90 1
25 8661 7441 0425
166.23695 462.570 495.827 166.236
2 629 145 105 1
16 2649 0308 9516
488.97734 965.720 1107.03 488.977
3 4.7 3.2 1.3 1
81 2338 4115 3481
255.16321 379.760 387.619 255.163
4 703 196 166 1
63 78 8023 2163
304.93391 340.576 331.310 304.933
5 738 223 203 1
99 3497 6967 9199
614.36776 100.390 329.293 100.390
6 776 629 240 2
66 4876 8573 4876
488.97734 965.720 1107.03 488.977
7 4.7 3.2 1.3 1
81 2338 4115 3481
196.65795 470.464 487.198 196.657
8 597 105 266 1
85 9296 9099 9585
557.10023 275.973 74.9429 74.9429
9 927 347 327 3
06 2777 4126 4126
629.00679 284.652 4.84194 4.84194
10 978 398 348 3
86 8588 6349 6349
703.73896 320.273 75.0784 75.0784
11 1032 440 380 3
02 7111 7746 7746
493.26470 100.390 278.172 100.390
12 712 473 349 2
27 4876 808 4876

17
BAB III
PENUTUP

A. KESIMPULAN

Dari hasil penelitian dapat ditarik kesimpulan bahwa produk jasa yang terdapatan di

PT Global Ekologi Indonesia yanga terdiri dari Pest dan Rodents Control, Termite Control,

Fumigationdan Disinfektasn mengalami peningkatan pendapatan dari tahun 2019 yang hanya

2,890.000.000 juta untuk produk pest dan Rodent control, pendapatan 1,130.000.000 untuk

produk termite control dan pendapatan sebesar 870.000.000 untuk produk fumigation

meningkat berkisar 6% yaitu 3,389.000.000 dan 1.067.000 serta 972.000.000

18
DAFTAR PUSTAKA
Firdausi, N. (2008). Analisis Financial Distress Dengan Pendekatan Data Mining Pada Industri
Manufaktur Go-Public Di Indonesia, 1–12.

Hamimi, H. (2014). Analisis Data Anggaran Pendapatan Belanja Daerah Menggunakan


Clustering K-Means Dan Forecasting ( Studi Kasus pada DPKA Kota Padang ). Teknik
Informatika, Universitas Negeri Padang.

Mayang Sari, R. (2015). Prediksi Data Anggaran Pendapatan Belanja Daerah Menggunakan
Algoritma K-Means.

Prasetyo, F. I., & Sutopo, J. (2017). Penerapan Algoritma K-Means Untuk Cluster Data
Anggaran Pendapatan Dan Belanja Desa ( Apbdes ), 1–9.

Wahyuni, F. (2009). Penggunaan Cluster-Based Sampling Untuk. New York, 5(1), 59–

19
20

Anda mungkin juga menyukai