1 Maret 2021
ISSN:2338-8161 E-ISSN: 2657-0793
Abstrak : Metode K-Means merupakan salah satu metode Data Mining yang banyak
digunakan dalam penelitian pengelompokan. Namun metode K-Means memiliki beberapa
kekurangan, salah satunya yaitu dalam penentuan jumlah cluster. Penelitian kali ini akan
mengaplikasikan Indeks Davies Bouldin (DBI) sebagai salah satu cara optimasi jumlah cluster
untuk mengelompokkan propinsi berdasar potensi desa dengan banyaknya jenis industri yang
dimiliki wilayahnya. Data yang digunakan adalah data banyaknya desa atau kelurahan
menurut keberadaan dan jenis industri kecil dan mikro (desa). Pengolahan data menggunakan
aplikasi RapidMiner. Pengujian dilakukan dengan mencari nilai terkecil dari DBI dimana
setelah data di olah diketahui nilai terkecil adalah 0,175 di jumlah cluster 3.
Abstract: The K-Means method is one of the most widely used data mining methods in
clustering research. However, the K-Means method has several shortcomings, one of which is
in determining the number of clusters. This research will apply the Davies Bouldin Index
(DBI) as a way of optimizing the number of clusters to classify provinces based on village
potential and the number of types of industry the region has. The data used is data on the
number of villages or sub-districts according to the existence and type of small and micro
industries (villages). Data processing uses the Rapid Miner application. Testing is done by
finding the smallest value from the DBI where after the data is processed it is known that the
smallest value is 0.175 in the number of clusters 3.
95
Evolusi: Jurnal Sains dan Manajemen Vol 9 No. 1 Maret 2021 ISSN:2338-
8161 E-ISSN: 2657-0793
atau tidak, serta tanpa memperhatikan Abdul Mukid, 2017). Clustering atau
besarnya modal perusahaan itu. pengelompokan merupakan salah satu dari
Klasifikasi industri yang digunakan metode Data Mining yang membagi data
dalam survei industri pengolahan adalah ke dalam beberapa kelompok dimana
klasifikasi yang berdasar kepada objek dengan kemiripan atau karakteristik
International Standard Industrial samaakan menjadi satu kelompok (Irhamni,
Classification of all Economic Activities Damayanti, Khusnul K, & A, 2014).
(ISIC) revisi 4, yang telah disesuaikan Clustering data digunakan untuk membagi
dengan kondisi di Indonesia dengan nama data menjadi beberapa kelompok berdasar
Klasifikasi Baku Lapangan Usaha kemiripan pola yang sama (Irhamni et al.,
Indonesia (KBLI) tahun 2009. Klasifikasi 2014). Metode clustering adalah suatu
industri yang dimaksud antara lain adalah metodeyang digunakan dalam
makanan, minuman, pengolahan tembakau, pengelompokan suatu himpunan data
tekstil, pakaian jadi, kulit, kayu, kertas, menjadi beberapa beberapa kelompok atau
pencetakan dan reproduksi media rekaman, klaster sehingga data dalam satu klaster
Produk dari batu bara dan pengilangan memiliki karakteristik dan kemiripan yang
minyak bumi, bahan kimia dan barang dari sama, sedangkan data dalam klaster yang
bahan kimia, farmasi, produk obat kimia berbeda memiliki karakteristik yang
dan obat tradisional, karet, barang dari berbeda pula(Nanda, Mahanty, & Tiwari,
karet dan plastik, barang galian bukan 2010).
logam, logam dasar, barang logam, bukan Salah satu metode clustering yang
mesin dan peralatannya, komputer, barang digunakan dalam penelitian
elektronik dan dan optic, peralatan listrik, pengelompokan data adalah metode K-
mesin dan perlengkapan, kendaraan Means (Muningsih, 2018. Metode K-
bermotor, trailer dan semi trailer, alat Means adalah metode sederhana untuk
angkutan lainnya, furniture, pengolahan membagi suatu kumpulan atau himpunan
lainnya, jasa reparasi dan pemasangan data dalam suatu angka spesifik dari
mesin dan peralatan. sebuah cluster, yaitu nilai (Larose &
Penelitian ini akan mengelompokkan Larose, 2014). K-Means merupakan suatu
propinsi di Indonesia berdasarkan jumlah metode data clustering non hirarki yang
desa atau kelurahan yang memiliki industri mempartisi data ke dalam bentuk satu atau
sebagai bagian dari Podes dari wilayah lebih cluster atau kelompok, sehingga data
yang bersangkutan. Metode yang yang memiliki karakteristik yang sama
digunakan adalah metode clustering K- dikelompokkan dalam satu cluster yang
Means yang merupakan metode sama dan data yang memiliki karakteristik
pengelompokan yang sering digunakan berbeda dikelompokkan ke dalam
dalam penelitian. Metode K-Means kelompok yang lain (Yudi Agusta, 2007).
merupakan salah satu metode clustering Algoritma metode K-Means untuk
yang ada di Data Mining. Jumlah clustering dapat dilakukan dengan cara
kelompok ditentukan dari evaluasi (Yudi Agusta, 2007), (Muningsih &
dilakukan dengan mencari nilai terkecil Kiswati, 2015) :
dari nilai Indeks Davies Bouldin sebagai 1. Tentukan banyaknya atau jumlah
cara untuk optimasi jumlah cluster. cluster yang akan dibentuk
Analisis cluster merupakan suatu 2. Inisialisasi nilai k sebagai pusat dari
proses pemisahan objek menjadi beberapa cluster (beri nilai random)
kelopok sehingga objek yang masuk dalam 3. Alokasikan data yang diolah sesuai
kelompok yang sama memiliki karkteristik dengan jumlah cluster yang sudah
atau kemiripan yang sama dan akan ditentukan. Kedekatan dari dua obyek
berbeda dengan objek lain pada kelompok ditentukan oleh jarak antar kedua
lainnya (Dewi Kusumah, Warsito, & obyek tersebut. Jarak yang paling
96
Evolusi: Jurnal Sains dan Manajemen Vol 9 No. 1 Maret 2021 ISSN:2338-
8161 E-ISSN: 2657-0793
97
Evolusi: Jurnal Sains dan Manajemen Vol 9 No. 1 Maret 2021 ISSN:2338-
8161 E-ISSN: 2657-0793
98
Evolusi: Jurnal Sains dan Manajemen Vol 9 No. 1 Maret 2021 ISSN:2338-
8161 E-ISSN: 2657-0793
99
Evolusi: Jurnal Sains dan Manajemen Vol 9 No. 1 Maret 2021 ISSN:2338-
8161 E-ISSN: 2657-0793
100