Sahat Sonang S.1, Arifin Tua Purba2, Ferri Ojak Imanuel Pardede3
1,2,3
Teknik Komputer, Politeknik Bisnis Indonesia
Email : sahatsonangstg@gmail.com1, arifintuaprb20@gmail.com2, ferri_pardede@yahoo.com3
Abstract
Control of population is one of the tasks of the government in Indonesia. The increase and
movement of population in each region makes a certain area to defeat changes in population surging,
and this can affect the economic level of the area. This study aims to process the population of
Pematangsiantar City in 2018 which is divided into age groups, namely: Toddlers, Young Children,
Early Adolescents, Late Adolescents, Early Adolescents, Late Adulthood, Early Adulthood, Elderly,
Late Elderly, and Upper Seniors. Data processing is done by using K-Means method clustering in
accordance with the population of Pematangsiantar City per district. With this grouping, we can see
that the number of population in each sub-district is based on each age group so that we can implement
programs that are more appropriate in improving human resources.
166
Jurnal TEKINKOM, Volume 2, Nomor 2 Desember 2019 E-ISSN: 2621-3079
DOI 10.37600/tekinkom.v2i2.115 ISSN: 2621-1556
ditemukan. Syarat sebuah criterion telah 3. Tahap ketiga: untuk setiap catatan,
ditemukan adalah ketika tidak ada lagi tentukan pusat kelompok terdekatnya
pemindahan sampel (reassignment) dari satu dan tetapkan catatan tersebut sebagai
kluster ke kluster yang lain yang akan anggota dari kelompok yang terdekat
menyebabkan berkurangnya total error yang pusat kelompoknya. Hitung rasio antara
dikuadratkan (errorsquare). Algoritma ini besaran Beetween Cluster Variation
populer digunakan karena kemudahan dengan Within Cluster Variation, lalu
implementasinya, dan memiliki kecepatan yang bandingkan rasio tersebut dengan rasio
cukup baik. sebelumnya(bila sudah ada). Jika rasio
Tahapan-Tahapan dasar yang diambil oleh tersebut membesar, maka lankutkan ke
algoritma K-means adalah: langkah keempat. Jika tidak hentikan
1. Tahap pertama: Tanyakan kepada prosesnya.
pemakai algoritma K-means, catatan- 4. Tahap keempat: perbaharui pusat-pusat
catatan yang ada akan dibuat menjadi kelompok (berdasarkan kelompok yang
beberapa kelompok, sebutlah sebanyak didapat dari langkah ketiga) dan
k kelompok. kembali ke langkah ketiga.
2. Tahap kedua: secara sembarang, pilih k
buah catatan (dari sekian catatan yang Flowchart mengenai Tahapan-Tahapan
ada) sebagai pusat-pusat kelompok penerapan metode K-Means ditampilkan pada
awal. Gambar 1
167
Jurnal TEKINKOM, Volume 2, Nomor 2 Desember 2019 E-ISSN: 2621-3079
DOI 10.37600/tekinkom.v2i2.115 ISSN: 2621-1556
Tabel 1. Data Jumlah Penduduk per Kecamatan Kota Pematangsiantar tahun 2018
Kanak- Remaja Remaja Dewasa Dewasa Lansia Lansia Manula
Balita Kanak Awal Akhir Awal Akhir Awal Akhir Atas
NO Kecamatan
(0-5 (5 - 11 (12 - 16 (17 - 25 (26 - 35 (36 - 45 (46 - 55 (55 - 65 ( 65 >=
Thn) Thn) Thn) Thn) Thn) Thn) Thn) Thn) Thn)
1 Siantar 1,334 1,574 1,637 3,196 2,205 2,535 2,346 1,805 1,378
Selatan
2 Siantar 3,244 3,209 3,114 6,593 5,600 5,228 4,736 3,555 2,160
Barat
3 Siantar 1,468 1,583 1,611 2,820 1,861 2,061 2,057 1,388 890
Marimbun
4 Siantar 1,741 1,930 1,969 3,559 2,396 2,466 2,328 1,743 1,125
Marihat
5 Siantar 4,378 4,347 4,021 7,364 6,221 5,788 4,545 2,664 1,481
Martoba
6 Siantar 2,717 2,826 2,625 5,229 4,106 4,161 3,594 2,255 1,246
Sitalasari
7 Siantar 3,240 3,613 3,550 9,527 5,347 5,305 4,448 3,193 2,319
Timur
8 Siantar 4,599 4,648 4,485 9,387 7,094 6,552 5,776 3,907 2,502
Utara
168
Jurnal TEKINKOM, Volume 2, Nomor 2 Desember 2019 E-ISSN: 2621-3079
DOI 10.37600/tekinkom.v2i2.115 ISSN: 2621-1556
Setiap record akan menjadi anggota dari suatu C1. Demikian juga untuk data kedua. jarak
cluster yang memiliki jarak terkecil dari pusat terkecil ada pada cluster C3. maka data tersebut
clusternya. Misalnya untuk record pertama. akan masuk pada cluster C3. Posisi cluster
jarak terkecil diperoleh pada cluster C1. maka selengkapnya dapat dilihat pada Tabel 3.
data pertama akan menjadi anggota dari cluster
169
Jurnal TEKINKOM, Volume 2, Nomor 2 Desember 2019 E-ISSN: 2621-3079
DOI 10.37600/tekinkom.v2i2.115 ISSN: 2621-1556
4 Siantar 1.741 1.930 1.969 3.559 2.396 2.466 2.328 1.743 1.125 802,37 1.254,66 7.939,82 C1
Marihat
5 Siantar 4.378 4.347 4.021 7.364 6.221 5.788 4.545 2.664 1.481 8.503,26 9.145,03 0,00 C3
Martoba
6 Siantar 2.717 2.826 2.625 5.229 4.106 4.161 3.594 2.255 1.246 4.077,32 4.756,82 4.452,71 C1
Sitalasari
7 Siantar 3.240 3.613 3.550 9.527 5.347 5.305 4.448 3.193 2.319 8.735,39 9.470,86 2.953,45 C3
Timur
8 Siantar 4.599 4.648 4.485 9.387 7.094 6.552 5.776 3.907 2.502 11.137,08 11.870,59 3.145,78 C3
Utara
Keterangan
JTK : Jarak Terdekat ke Kelompok
Dari Tabel 3 didapat keanggotaan Cluster C17 = (2.346 + 2.328 + 3.594)/3 = 8.268
sebagai berikut: C18 = (1.805 + 1.743 + 2.255)/3 = 5.803
1. Kelompok 1 (atau C1) = { 1, 4, 6 } C19 = (1.378 + 1.125 + 1.246)/3 = 3.749
2. Kelompok 2 (atau C2) = { 3 } Sehingga C1 = {5.792, 6.330, 6.231,
3. Kelompok 3 (atau C3) = { 2, 5, 7, 8} 11.984, 8.707, 9.162, 8.268, 5.803,
3.749}
Pada tahap ini akan mengitung rasio antara
besaran Between Cluster Variation (BCV) b. Untuk Cluster 2, ada 1 record, yaitu
dengan Within Cluster Variation (WCV). record ke-3, sehingga:
sebagai berikut: Sehingga C2 = {1.468, 1.583, 1.611,
2.820, 1.861, 2.061, 2.057, 1.388, 890}
BCV = D(C1.C2)+D(C1.C3)+D(C2.C3)
BCV = (999,33-0,00)+( 8.503,26-0,00)+( c. Untuk Cluster 3, ada 4 record, yaitu
9.145,03-0,00) record ke- 2, 5, 7, dan 8. sehingga:
BCV = 18.647,62 C31 = (3.244 + 4.378 + 3.240 + 4.599)/4
= 15.461
WCV = ∑𝑘𝑖=1 ∑𝑝∈𝐶𝑖 𝑑(𝑝. 𝑚𝑖 )2 C32 = (3.209 + 4.347 + 3.613 + 4.648)/4
WCV = 0,002 + 2.447,192 + 0,002 + 802,372 + = 15.817
0,002 + 4.077,322 + 2.953,452 + 3.145,782 C33 = (3.114 + 4.021 + 3.550 + 4.485)/4
WCV = 41.875.874,00 = 15.170
C34 = (6.593 + 7.364 + 9.527 +
BCV/WCV = 18.647,62/41.875.874,00= 9.387)/4= 32.871
0.00044 C35 = (5.600 + 6.221 + 5.347 + 7.094)/4
= 24.262
Berhubung pada tahapan sebelumnya belum C36 = (5.228 + 5.788 + 5.305 + 6.552)/4
mendapat rasio ini, maka perbandingan rasio = 22.873
belum dapat dilakukan dan proses K-Means C37 = (4.736 + 4.545 + 4.448 + 5.776)/4
clustering. Maka selanjutanya tahap keempat. = 19.505
C38 = (3.555 + 2.664 + 3.193 + 3.907)/4
4. Tahap keempat (Iterasi-2) = 13.319
Pada tahap ini. perubahan pusat-pusat C39 = (2.160 + 1.481 + 2.319 + 2.502)/4
kelompok akan dilakukan seperti berikut: = 8.462
a. Untuk Cluster 1, ada 3 data yaitu Sehingga C3 = {15.461, 15.817,
record ke-1, 4, dan 6. sehingga: 15.170, 32.871, 24.262, 22.873, 19.505,
C11 = (1.334 + 1.741 + 2.717)/3 = 5.792 13.319, 8.462}
C12 = (1.574 + 1.930 + 2.826)/3 = 6.330
C13 = (1.637 + 1.969 + 2.625)/3 =6.231 5. Ulangi tahap ke-3 hingga nilai rasio antara
C14 = (3.196 + 3.559 + 5.229)/3 = besaran Between Cluster Variation (BCV)
11.984 dengan Within Cluster Variation (WCV)
C15 = (2.205 + 2.396 + 4.106)/3 = 8.707 tidak mengalami penaikan dari nilai rasio
C16 = (2.535 + 2.466 + 5.305)/3 = 9.162 sebelumnya.
170
Jurnal TEKINKOM, Volume 2, Nomor 2 Desember 2019 E-ISSN: 2621-3079
DOI 10.37600/tekinkom.v2i2.115 ISSN: 2621-1556
171
Jurnal TEKINKOM, Volume 2, Nomor 2 Desember 2019 E-ISSN: 2621-3079
DOI 10.37600/tekinkom.v2i2.115 ISSN: 2621-1556
172