Seminar Proposal Eko

FAKULTAS
TEKNIK
PRODI TEKNIK INFORMARTIKA
Seminar Proposal
Dipresentasikan oleh :
Eko Saputra
15 1065 1148
PENENTUAN CLUSTER OPTIMUM

UNTUK MENGELOMPOKKAN PROVINSI DI INDONESIA
BERDASARKAN STATUS GIZI DAN PEMBERIAN ASI EKSKLUSIF
SERTA CAKUPAN IMUNISASI DASAR LENGKAP PADA BALITA
GUNA MENGETAHUI WILAYAH YANG RENTAN KEJADIAN STUNTING
MENGGUNAKAN METODE K-MEANS
BAB 1
PENDAHULUAN
FAKULTAS
TEKNIK
LATAR BELAKANG
 Saat ini, Indonesia merupakan salah satu negara dengan prevalensi Stunting yang cukup tinggi dibandingkan
dengan negara-negara berpendapatan menegah lainnya. Situasi ini jika tidak datasi dapat mempengaruhi kinerja
pembangunan Indonesia baik yang menyangkut pertumbuhan ekonomi, kemiskinan dan ketimpangan (Tim
Nasional Percepatan Penanggulangan Kemiskinan, Sekretariat Wakil Presiden, 2017).
 Menurut data prevalensi balita Stunting yang dikumpulkan Word Health Organization (2018)
Gambar 2.1 Rata-rata prevalensi balita Stunting di Regional Asia Tenggara tahun 2005-
2017
Sumber: Child Stunting Data Visualizaztons Dashboard,WHO,2018
LATAR BELAKANG
 Penelitian di Nepal menunjukan bahwa bayi dengan berat lahir rendah mempunyai risiko yang lebih
tinggi untuk menjadi Stunting (Paudel, et al., 2012).
 Penelitian di Kendal menunjukan bahwa bayi dengan Panjang lahir yang pendek berisiko tinggi terhadap
kejadian Stunting pada balita (Meilyasari dan Isnawati, 2014).
 Penelitian di Kendari menyimpulkan bahwa riwayat imunisai dasar yang tidak lengkap pada bayi
mempunyai risiko Stunting lebih besar dibandingkan dengan bayi yang memiliki riwayat imunisasi
lengkap (swathma, et al., 2016).
 Penelitian di Ethiopia Selatan membuktikan bahwa balita yang tidak mendapatkan ASI Eksklusif selama
6 bulan berisiko tinggi mengalami Stunting (Fikadu, et al., 2014).
LATAR BELAKANG
 Pengelompokan wilayah provinsi di Indonesia berdasarkan persentase status gizi dan

pemberian ASI Ekslusif serta cakupan imunisasi dasar lengkap pada balita guna
mengetahui wilayah yang rentan kejadian Stunting diperlukan suatu teknik
pengolahan data yaitu Data Mining.
 Penelitian ini menggunakan metode K-Means sehingga dapat menghasilkan

informasi kelompok wilayah provinsi yang terdapat didalamnya dengan cluster
optimum.
RUMUSAN
MASALAH
 Bagaimana hasil penggunaan algoritma K-Means pada persentase status
gizi dan pemberian ASI Ekslusif serta cakupan imunisasi dasar lengkap
pada balita.
 Berapa jumlah cluster optimum ditinjau dari persentase status gizi dan
pemberian ASI Ekslusif serta cakupan imunisasi dasar lengkap pada balita
menggunakan metode algoritma K-Means.
 Bagaimana kelompok wilayah provinsi di Indonesia yang terdapat dalam
satu cluster yang optimum.
BATASAN
MASALAH
 Data yang digunakan yaitu data persentse status gizi balita (gizi buruk = indeks BB/U, sangat pendek = indeks
TB/U dan sangat kurus = indeks BB/TB), persentase cakupan dasar imunisasi lengkap diatas 80% dan persentase
pemberian ASI Eksklusif pada balita
 Jumlah data yang di klastering yaitu 34 wilayah provinsi di Indonesia pada tahun 2016 sampai 2018
sebanyak 510 data record.
 Pengukuran cluster optimum menggunakan teknik

Elbow.
 Perhitungan menggunakan tools RapidMiner dan Microsoft Excel.
 Penentuan cluster optimum berdasarkan 3 kebijakan yaitu 2

cluster, 3 cluster dan 4 cluster.
TUJUAN
PENELITIAN
 Untuk mengetahui keberhasilan penggunaan algoritma K-Means pada pengelompokan

wilayah provinsi di Indonesia berdasarkan persentase status gizi dan pemberian ASI
Ekslusif serta cakupan imunisasi dasar lengkap pada balita.
 Mencari jumlah cluster optimum ditinjau dari persentase status gizi dan pemberian ASI
Ekslusif serta cakupan imunisasi dasar lengkap pada balita menggunakan metode
algoritma K-Means.
 Mengetahui kelompok wilayah provinsi di Indonesia yang rentan terjadi Stunting yang
terdapat dalam satu cluster.
MANFAAT
PENELITIAN
Mengetahui cluster optimum dan kelompok wilayah provinsi yang rentan terjadi
Stunting berdasarkan persentase status gizi dan pemberian ASI Ekslusif serta cakupan
imunisasi dasar lengkap pada balita.
BAB 2
TINJAUAN PUSTAKA
FAKULTAS
TEKNIK
STUNTING
Stunting merupakan kondisi kronis yang menggambarkan terhambatnya pertumbuhan

karena malnutrisi jangka panjang. Stunting menurut WHO Child Growth Standard
didasarkan pada indeks panjang badan menurut umur (PB/U) atau tinggi badan
menurut umur (TB/U) dengan batas (z-score) < -2 SD (WHO, 2010).
DATA MINING
 Data Mining mampu mengolah data yang berukuran besar, sehingga memiliki peranan yang
penting dalam bidang ilmu dan teknologi, industri, cuaca dan keuangan. Data Mining
mempunyai beberapa metode yaitu clustering, regresi, klasifikasi, seleksi variabel, dan market
basket analisis (Santosa, 2007).
 Beberapa kelompok Data Mining berdasarkan tugasnya, yaitu : (Paulanda, 2012)

 Deskripsi  Klasifikasi
 Estimasi  Pengklasteran / pengelompokan
 Prediksi  Asosiasi (Market basket analisis)
CLUSTERING
 Suatu teknik Data Mining yang digunakan untuk mengelompokkan data ke dalam beberapa kelompok
sehingga data dalam satu kelompok atau cluster memiliki tingkat kemiripan maksimum, dan data antara
cluster memiliki kemiripan yang minimum (Tan, et.al., 2006).
 Terdapat dua metode dalam pengelompokannya yaitu hierarchical clustering dan non-hierarchical clustering
 Hierarchical clustering metode pengelompokan data yang cara kerjanya dengan mengelompokkan dua data
atau lebih yang memiliki kesamaan atau kemiripan, kemudian proses dilanjutkan ke objek lain yang
mimiliki kedekatan kedua, proses ini terus berlangsung hingga cluster membentuk semacam tree. Namun
secara logika semua objek pada akhirnya hanya akan membentuk sebuah cluster
 Non-hierarchical clustering dimulai dengan menentukan jumlah cluster yang di inginkan (dua, tiga,
atau lebih cluster), setelah jumlah yang cluster ditentukan maka proses cluster dimulai tanpa mengikuti
proses hirarki. (Santoso,2010)
K-MEANS
K-Means merupakan algoritma clustering yang berulang-ulang, di mana dimulai

dengan pemilihan banyaknya cluster yang ingin dibentuk (K), dan menetapkan nilai
K secara random atau acak sebagai titik pusat awal cluster atau disebut dengan
centroid. Kemudian menghitung jarak setiap data yang ada terhadap masing-masing
centroid yang sudah ditentukan dengan rumus Euclidean sehingga akan ditemukan
jarak terdekat dari setiap data dengan centroid. Klasifikasikan setiap data
berdasarkan kedekatan dengan centroid. Langkah tersebut dilakukan berulang
sampai nilai centroid tidak berubah/stabil (Rismawan, 2008).
F L O W C H A RT
ALGORITMA
K-MEANS
METODE
ELBOW
 Metode Elbow merupakan suatu metode yang digunakan untuk menghasilkan informasi dalam
menentukan jumlah cluster terbaik dengan cara melihat persentase hasil perbandingan antara
jumlah cluster yang akan membentuk siku pada suatu titik (Madhulatha, 2012).
 Untuk mendapatkan perbandingannya adalah dengan menghitung SSE (Sum of Square Error)
dari masing-masing nilai cluster. Karena semakin besar jumlah cluster K maka nilai SSE
akan semakin kecil. Rumus SSE pada K-Means (Irwanto, et al .,2012).
Dimana:
K = jumlah cluster
xi = data ke – i
Ck = centroid cluster

¿
RAPIDMINER
RapidMiner merupakan sebuah solusi untuk melakukan analisis terhadap

Data Mining, text mining dan analisis prediksi. RapidMiner adalah perangkat
lunak atau software yang bersifat terbuka (open source) yang berdiri sendiri
untuk analisis data sebagai mesin Data Mining yang dapat diintegrasikan pada
produknya sendiri. Dengan menggunakan berbagai teknik deskriptif dan
prediksi RapidMiner memberikan wawasan kepada pengguna sehingga dapat
membuat keputusan yang paling baik (Aprilia, dkk., 2013).
BAB 3
METODELOGI PENELITIAN
FAKULTAS
TEKNIK
Mulai
Studi Awal
Metode Analisis Data
Pengumpulan Data
Analisis yang digunakan adalah analisis deskriptif,
Diagram Blog
Implementasi
dalam penelitian ini menggunakan pendekatan Tahapan-Tahapan
Algoritma K-Means
kuantitatif, yang analisanya pada data-data numeric Penelitian
(angka), metode clustering yang digunakan adalah Pengujian Metode

algoritma K- Means. Penelitian ini menggunakan Elbow
software microsoft excel dan tools RapidMiner.

Klaster Optimum
Selesai
15 DATA SET
ASI IDL GB SP SK ASI IDL GB SP SK ASI IDL GB SP SK
2016 2016 2016 2016 2016 2017 2017 2017 2017 2017 2018 2018 2018 2018 2018
23.50 69.57 2.55 7.56 3.51 22.99 52.17 5.90 12.20 3.70 60.84 21.74 6.70 16.00 5.00
12.40 72.73 3.07 9.34 4.33 10.73 75.76 5.30 12.50 5.70 50.07 60.61 5.40 13.20 4.60
45.30 94.12 1.93 4.66 1.60 48.08 100.00 2.10 7.90 2.00 60.43 94.12 4.90 14.40 4.70
Keterangan :
32.20 80.00 1.30 6.61 1.30 25.55 100.00 2.30 8.60 2.70 76.38 100.00 2.80 9.80 3.50
41.00 100.00 2.99 6.28 3.50 46.60 100.00 3.00 7.20 2.60 71.88 100.00 2.30 6.10 3.90
ASI = Pemberian Air Susu Ibu Eksklusif
39.60 100.00 2.35 6.13 1.64 38.23 100.00 2.90 8.40 1.60 57.97 96.30 2.60 11.70 3.20 IDL = Capaian Imunisasi Dasar Lengkap ≥80%
55.40 100.00 2.10 4.74 1.68 61.45 100.00 2.40 5.10 2.00 76.17 100.00 2.50 6.30 1.20 GB = Gizi Buruk
38.30 100.00 3.02 8.31 2.05 41.18 100.00 4.30 11.20 2.20 78.63 100.00 5.90 9.20 4.40 SP = Sangat Pendek
12.50 66.67 4.52 11.54 4.27 12.70 100.00 6.00 11.20 4.40 46.91 66.67 6.80 12.70 3.80 SK = Sangat Kurus
31.20 40.00 4.07 10.29 2.54 37.78 80.00 4.50 11.30 3.30 54.29 60.00 2.40 6.80 1.10
22.90 71.43 6.67 11.94 4.33 39.55 92.86 6.50 13.00 4.70 62.83 42.86 5.20 11.40 4.00
19.70 60.00 1.32 6.79 2.24 23.43 86.67 3.30 14.10 4.70 38.69 60.00 4.20 9.80 2.90
16.70 36.36 6.00 12.33 9.03 27.19 63.64 5.80 10.30 5.90 41.51 54.55 7.40 12.50 4.00
22.90 69.23 5.62 11.45 4.94 21.40 69.23 6.60 13.40 6.00 20.43 76.92 5.10 11.70 3.90
20.10 34.48 3.18 11.64 5.70 30.42 24.14 6.80 15.90 5.80 48.32 34.48 5.10 15.30 4.80
IMPLEMENTASI
ALGORITMA K-MEANS
 Iterasi Ke-1 Pusat awal centroid
C1 C2 C3
1. Menentukan jumlah cluster
12.4
ASI 2016 28.91 55.40
Jumlah cluster yang digunakan sebanyak 3 cluster 0
34.4
IDL 2016 72.97 100.00
8
2. Menentukan nilai pusat centroid GB 2016 1.30 3.38 6.67
SP 2016 4.66 8.64 12.33
Penentuan pusat awal centroid ditentukan secara
SK 2016 1.30 3.51 9.03
random/acak diambil dari data yang ada. 10.7
ASI 2017 32.49 61.45
3
3. Menghitung jarak dari centroid IDL 2017

24.1
82.96 100.00
4
Menghitung jarak antara titik centroid dengan titik tiap objek GB 2017 2.10 4.51 6.80
SP 2017 5.10 10.82 15.90
dengan menggunakan persamaan Euclidean Distace Di mana:
De : Euclidean Distance SK 2017 1.60 3.82 6.00
𝑒 = ( 𝑥 𝑖 − 𝑠 𝑖)2 + ( 𝑦 𝑖 − 𝑡 𝑖 )2 … … … … … … …(4 ))
𝐷 √ i : banyaknya objek,
ASI 2018
20.4
56.36 78.63
(x,y) merupakan koordinat objek dan
3
(s,t) merupakan koordinat centroid
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS

110.6438647
Dan seterusnya dilanjutkan menghitung untuk data ke-2….N terhadap pusat awal cluster hingga didapatkan nilai
matrik jarak.
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS
Data
Provinsi C1 C2 C3 C1 C2 C3
ke
1 Aceh 64.34416291 59.85772152 110.6438647 ok
2 Sumatera Utara 81.88644332 31.04809654 90.49798175 ok
3 Sumatera Selatan 136.839552 42.91158669 30.47371162 ok

4. Pengelompokan objek
4 Bengkulu 133.15598 40.71139061 49.99700691 ok
jarak hasil perhitungan pada point ke-3 akan dilakukan perbandingan 5 DKI Jakarta 144.7354051 49.88743782 27.94800172 ok
dan dipilih jarak yang terdekat antara data dengan pusat cluster, yang 6 Jawa Barat 136.245786 42.76141632 38.42705427 ok
7 DI Yogyakarta 153.9540009 62.26394606 20.56956733 ok

akan menentukan bahwa data yang memiliki jarak terdekat akan 8 Nusa Tenggara Barat 145.7744954 50.20002256 29.54853973 ok
berada dalam satu kelompok dengan pusat cluster terdekat, 9 Gorontalo 98.55255248 33.48007137 86.66483081 ok
10 Kalimantan Utara 83.27530907 35.97512713 86.89059903 ok

pengelompokan objek/data tersebut dapat dilihat pada tabel
11 Kalimantan Barat 97.46642448 32.63055294 77.31194086 ok
disamping: 12 Sulawesi Utara 81.79925061 28.48926965 88.70507934 ok
13 Maluku 60.40976991 49.56064405 107.3927493 ok
14 Papua Barat 82.11673398 41.42800106 92.32361399 ok
15 Papua 41.48855987 80.65887456 132.2789949 Ok
1 9 5
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS
5. Penetuan pusat cluster baru
Setelah didapatkan anggota dari setiap cluster kemudian pusat cluster baru dihitung berdasarkan data anggota tiap cluster yang sudah didapatkan
menggunakan rumus yang sesuai dengan pusat anggota cluster sebagai berikut :

C
H asilC 1=( 20.10 ) ; ( 34.43 ) ; (3.18 ) ; ( 11.64 ) ; (5.70 ) ; ( 30.42 ) ; ( 24.14 ) ; ( 6.80 ) ; ( 15.90 ) ; ( 5.80 ) ; ( 48.32 ) ; ( 34.48 ) ; ( 5.10 ) ; ( 15.30 ) ; ( 4.80 )
( 23.50+12.40+32.20+12.50+31.20+22.90+19.70+16.70+22.90 ) ( 69.57+72.73+80.00+ 66.67+40.00+71.43+60.00+5.62 )
2=
𝐶
9
;
9
( 2.55+3.07+1.30+4.52+4.07+6.67+1.32+6.00+5.62) ( 7.56+9.34+6.61+11.54+10.29+11.94+6.79+12.33+11.45) (3.51+4.33+1.30+4.27+2.54+4.33+2.24+9.03+4.94 ) (22.99+10.73+25.55+12.70+37.78+39.55+23.43+27.19+21.40 )
¿ ; = ;
9 9 9 9
( 52.17+75.76 +100.00+100.00+80.00+92.86+86.67 +63.64+69.23 ) ( 5.90+5.30+2.30+6.00+ 4.50+6.50+3.30+5.80+6.60 )
¿ ;
9 9
( 12.20+12.50+ 8.60+ 11.20+11.30+13.00+14.10+10.30+13.40 ) ( 3.70+5.70+2.70+ 4.40+3.30+4.70+ 4.70+5.90+6.00 )
¿ ;
9 9
( 60.84 +50.07+76.38+46.91+54.29+62.83+38.69+ 41.51+20.43 ) ( 21.74+60.61+100.00+66.67 +60.00+42.86+ 60.00+54.55+76.92 )
¿ ;
9 9
( 6.70+5.40+ 2.80+6.80+2.40+5.20+4.20+7.40+5.10 ) ( 16.00+13.20+ 9.80+12.70+6.80+11.40+ 9.80+ 12.50+ 11.70 )
¿ ;
9 9
( 5.00+ 4.60+3.50+3.80+1.10+4.00+2.90+ 4.00+3.90 )
¿
9
H asil𝑐 2= ( 21.56 ) ; ( 62.89 ) ; ( 3.90 ) ; ( 9.76 ) ; ( 4.05 ) ; ( 24.59 ) ; ( 80.04 ) ; ( 5.13 ) ; ( 11.84 ) ; ( 4.57 ) ; (50.22 ) ; ( 60.37 ) ; ( 5.11 ) ; ( 11.54 ) ; ( 3.64 )
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS
(45.30+41.0+39.60+5.40+38.0) (94.12+0. +10. +10. +10. ) (1.93+2.9+2.35+2.10+3.2) (4.6+.28+6.13+4.7+8.31) (60+3.50+1.64+1.68+2.05) (48.0+46.0+38.2+61.45+1.8) (10. +10. +10. +10. +10. ) (2.10+3.0+2.90+2.40+.30) (7.90+7.20+8.40+5.10+ .20) (2.0+2.60+1.60+2.0+2.0) (60.43+71.8+57.9+76.1+78.63) (94.12+0. +96.30+1 .0+10. ) (4.90+2.30+2.60+2.50+.90) (14.0+6.10+ .70+6.30+9.20) (4.70+3.90+3.20+1.20+4.0)

𝐶 3 = ; ; ; = ; ; ;= ; ; ;= ; ; ; = ; ;
5 5 5 5 5 5 5 5 5 5 5 5 5 5 5
H asil𝑐 3= ( 43.92 ) ; ( 98.82 ) ; ( 2.48 ) ; ( 6.02 ) ; ( 2.09 ) ; ( 47.11 ) ; ( 100.00 ) ; ( 2.94 ) ; ( 7.96 ) ; ( 2.08 ) ; ( 69.02 ) ; ( 98.08 ) ; ( 3.64 ) ; ( 9.54 ) ; ( 3.48 ) ASI 2016
C1
20.10
C2
21.56
C3
43.92
IDL 2016 34.48 62.89 98.82
GB 2016 3.18 3.90 2.48
Dari perhitungan di atas maka didapatkan pusat cluster baru SP 2016 11.64 9.76 6.02
dalam matrik table disamping : SK 2016 5.70 4.05 2.09

ASI 2017 30.42 24.59 47.11
IDL 2017 24.14 80.04 100.00
6. Iterasi selanjutnya melakukan perhitungan lagi pada poin ke-3 sampai poin ke-5
GB 2017 6.80 5.13 2.94
dengan menggunakan titik centroid yang baru yaitu hasil dari iterasi iterasi sebelumnya. SP 2017 15.90 11.84 7.96
SK 2017 5.80 4.57 2.08
ASI 2018 48.32 50.22 69.02
7. Lakukan perulangan hinggal nilai centroid yang dihasilkan tidak berubah dan anggota
IDL 2018 34.48 60.37 98.08
cluster tidak berpindah ke cluster lain. Jika hasil nilai centroid dan anggota cluster tidak GB 2018 5.10 5.11 3.64
SP 2018 15.30 11.54 9.54
berubah maka proses selesai SK 2018 4.80 3.64 3.48
PENGUJIAN METODE ELBOW
( 2 CLUSTER )
Metode Elbow untuk menentukan jumlah cluster yang Centroid cluster pada 2 cluster
Pusat ASI IDL GB SP SK ASI IDL GB SP SK ASI IDL GB SP SK
paling optimum atau yang terbaik. Langkah-langkah Cluster 2016 2016 2016 2016 2016 2017 2017 2017 2017 2017 2018 2018 2018 2018 2018
C1 20.21 57.83 4.11 10.32 4.54 25.13 71.61 5.63 12.66 4.91 47.10 53.09 5.37 12.16 3.79
metode Elbow: C2 41.97 95.69 2.28 6.12 1.96 43.52
100.0
2.83 8.07 2.18 70.24 98.40 3.50 9.58 3.48
0
1. Inisialisasi awal nilai cluster (2 cluster).

Menghitung M1 dan M2 dari atribut pusat cluster ke-i dengan atribut data ke-i
2. Menaikkan nilai cluster sampai jumlah cluster
menggunakan rumus SSE (Sum of Squares Error).
yang ditentukan (4 cluster).
M1.1 = (23.50 - 20.21)2 + (69.59 – 57.83)2 + (2.55 – 4.11)2 + (7.56 – 10.23)2 +
3. Menghitung nilai SSE (Sum of Squares Error)
(3.51 – 4.54)2 + (22.99 – 25.13)2 + (52.17 – 71.61)2 + (5.90 – 5.63)2 +
dari setiap cluster. (12.20 – 12.66)2 + (3.70 – 4.91)2 + (60.84 – 47.10)2 + (21.74 – 53.09)2 +
Dimana:
¿ (6.70 – 5.37)2 + (16.00 – 12.16)2 + (5.00 – 3.79)2
M1.1 = 1733.3402
... dihitung sampai atribut data terakhir
K = jumlah cluster Pusat
Cluster 20.21 57.83 4.11 10.32 4.54 25.13 71.61 5.63 12.66 4.91 47.10 53.09 5.37 12.16 3.79
xi = data ke – I (C1)
ASI IDL GB SP SK ASI IDL GB SP SK ASI IDL GB SP SK

Ck = centroid cluster Data 2016 2016 2016 2016 2016 2017 2017 2017 2017 2017 2018 2018 2018 2018 2018
1 23.50 69.57 2.55 7.56 3.51 22.99 52.17 5.90 12.20 3.70 60.84 21.74 6.70 16.00 5.00
… … … … … … … … … … … … … … … …
LANJUT PENGUJIAN METODE
ELBOW ( 2 CLUSTER )
Tabel SSE
M2.2 = (23.50 – 41.97)2 + (69.59 – 95.69)2 + (2.55 – 2.28)2 + (7.56 – 6.12)2 + (3.51 –
Data M1 M2 MIN
1.96)2 + (22.99 – 43.52)2 + (52.17 –100.00)2 + (5.90 – 2.83)2 + (12.20 –8.07)2 + 1 1733.3402 9784.0183 1733.3402
(3.70 –2.18)2 + (60.84 – 70.24)2 + (21.74 – 98.40)2 + (6.70 – 3.50)2 + (16.00 – 2 577.6971 4971.7812 577.6971
3 5235.4833 178.2922 178.2922
9.58)2 + (5.00 – 3.48)2
4 4575.8029 707.8362 707.8362
M2.2 = 9784.0183 5 6399.0632 52.0869 52.0869
... ... ... ...
... dihitung sampai atribut data terakhir
SSE 13142.4783
Pusat
Cluster 41.97 95.69 2.28 6.12 1.96 43.52 100.00 2.83 8.07 2.18 70.24 98.40 3.50 9.58 3.48
(C2)
GB
ASI IDL GB SP SK ASI IDL SP SK ASI IDL GB SP SK
Data 2016 2016 2016 2016 2016 2017 2017
201
2017 2017 2018 2018 2018 2018 2018
7
4. Melakukan perhitungan SSE (Sum of Squares Error)
1 23.50 69.57 2.55 7.56 3.51 22.99 52.17 5.90 12.20 3.70 60.84 21.74 6.70 16.00 5.00
… … … … … … … … … … … … … … … … sampai cluster yang ditentukan.
5. Melihat hasil SSE (Sum of Squares Error) dari nilai cluster
Ambil nilai terkecil (MIN) dari M1 dan M2 masing-masing data, kemudian nilai terkecil di yang turun secara drastis atau nilai yang berubah
jumlah (SUM) dan hasil penjumlahan adalah nilai SSE (Sum of Squares Error). signifikan.
6. Menetapkan nilai cluster yang berbentuk siku sebagai
cluster optimum.
Te r i m a K a s i h
FAKULTAS
TEKNIK

Seminar Proposal Eko

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Seminar Proposal Eko

Diunggah oleh

Hak Cipta:

Format Tersedia

FAKULTAS

PENENTUAN CLUSTER OPTIMUM

 Pengelompokan wilayah provinsi di Indonesia berdasarkan persentase status gizi dan

 Penelitian ini menggunakan metode K-Means sehingga dapat menghasilkan

 Pengukuran cluster optimum menggunakan teknik

 Penentuan cluster optimum berdasarkan 3 kebijakan yaitu 2

 Untuk mengetahui keberhasilan penggunaan algoritma K-Means pada pengelompokan

Stunting merupakan kondisi kronis yang menggambarkan terhambatnya pertumbuhan

 Beberapa kelompok Data Mining berdasarkan tugasnya, yaitu : (Paulanda, 2012)

K-Means merupakan algoritma clustering yang berulang-ulang, di mana dimulai

RapidMiner merupakan sebuah solusi untuk melakukan analisis terhadap

(angka), metode clustering yang digunakan adalah Pengujian Metode

software microsoft excel dan tools RapidMiner.

3. Menghitung jarak dari centroid IDL 2017

1 Aceh 64.34416291 59.85772152 110.6438647 ok

2 Sumatera Utara 81.88644332 31.04809654 90.49798175 ok

3 Sumatera Selatan 136.839552 42.91158669 30.47371162 ok

7 DI Yogyakarta 153.9540009 62.26394606 20.56956733 ok

10 Kalimantan Utara 83.27530907 35.97512713 86.89059903 ok

disamping: 12 Sulawesi Utara 81.79925061 28.48926965 88.70507934 ok

13 Maluku 60.40976991 49.56064405 107.3927493 ok

14 Papua Barat 82.11673398 41.42800106 92.32361399 ok

15 Papua 41.48855987 80.65887456 132.2789949 Ok

dalam matrik table disamping : SK 2016 5.70 4.05 2.09

1. Inisialisasi awal nilai cluster (2 cluster).

ASI IDL GB SP SK ASI IDL GB SP SK ASI IDL GB SP SK

Anda mungkin juga menyukai