TEKNIK
PRODI TEKNIK INFORMARTIKA
Seminar Proposal
Dipresentasikan oleh :
Eko Saputra
15 1065 1148
FAKULTAS
TEKNIK
PRODI TEKNIK INFORMARTIKA
LATAR BELAKANG
Saat ini, Indonesia merupakan salah satu negara dengan prevalensi Stunting yang cukup tinggi dibandingkan
dengan negara-negara berpendapatan menegah lainnya. Situasi ini jika tidak datasi dapat mempengaruhi kinerja
pembangunan Indonesia baik yang menyangkut pertumbuhan ekonomi, kemiskinan dan ketimpangan (Tim
Nasional Percepatan Penanggulangan Kemiskinan, Sekretariat Wakil Presiden, 2017).
Menurut data prevalensi balita Stunting yang dikumpulkan Word Health Organization (2018)
Gambar 2.1 Rata-rata prevalensi balita Stunting di Regional Asia Tenggara tahun 2005-
2017
Sumber: Child Stunting Data Visualizaztons Dashboard,WHO,2018
LATAR BELAKANG
Penelitian di Nepal menunjukan bahwa bayi dengan berat lahir rendah mempunyai risiko yang lebih
tinggi untuk menjadi Stunting (Paudel, et al., 2012).
Penelitian di Kendal menunjukan bahwa bayi dengan Panjang lahir yang pendek berisiko tinggi terhadap
kejadian Stunting pada balita (Meilyasari dan Isnawati, 2014).
Penelitian di Kendari menyimpulkan bahwa riwayat imunisai dasar yang tidak lengkap pada bayi
mempunyai risiko Stunting lebih besar dibandingkan dengan bayi yang memiliki riwayat imunisasi
lengkap (swathma, et al., 2016).
Penelitian di Ethiopia Selatan membuktikan bahwa balita yang tidak mendapatkan ASI Eksklusif selama
6 bulan berisiko tinggi mengalami Stunting (Fikadu, et al., 2014).
LATAR BELAKANG
Berapa jumlah cluster optimum ditinjau dari persentase status gizi dan
pemberian ASI Ekslusif serta cakupan imunisasi dasar lengkap pada balita
menggunakan metode algoritma K-Means.
Bagaimana kelompok wilayah provinsi di Indonesia yang terdapat dalam
satu cluster yang optimum.
BATASAN
MASALAH
Data yang digunakan yaitu data persentse status gizi balita (gizi buruk = indeks BB/U, sangat pendek = indeks
TB/U dan sangat kurus = indeks BB/TB), persentase cakupan dasar imunisasi lengkap diatas 80% dan persentase
pemberian ASI Eksklusif pada balita
Jumlah data yang di klastering yaitu 34 wilayah provinsi di Indonesia pada tahun 2016 sampai 2018
sebanyak 510 data record.
Mencari jumlah cluster optimum ditinjau dari persentase status gizi dan pemberian ASI
Ekslusif serta cakupan imunisasi dasar lengkap pada balita menggunakan metode
algoritma K-Means.
Mengetahui kelompok wilayah provinsi di Indonesia yang rentan terjadi Stunting yang
terdapat dalam satu cluster.
MANFAAT
PENELITIAN
Mengetahui cluster optimum dan kelompok wilayah provinsi yang rentan terjadi
Stunting berdasarkan persentase status gizi dan pemberian ASI Ekslusif serta cakupan
imunisasi dasar lengkap pada balita.
BAB 2
TINJAUAN PUSTAKA
FAKULTAS
TEKNIK
PRODI TEKNIK INFORMARTIKA
STUNTING
Data Mining mampu mengolah data yang berukuran besar, sehingga memiliki peranan yang
penting dalam bidang ilmu dan teknologi, industri, cuaca dan keuangan. Data Mining
mempunyai beberapa metode yaitu clustering, regresi, klasifikasi, seleksi variabel, dan market
basket analisis (Santosa, 2007).
Hierarchical clustering metode pengelompokan data yang cara kerjanya dengan mengelompokkan dua data
atau lebih yang memiliki kesamaan atau kemiripan, kemudian proses dilanjutkan ke objek lain yang
mimiliki kedekatan kedua, proses ini terus berlangsung hingga cluster membentuk semacam tree. Namun
secara logika semua objek pada akhirnya hanya akan membentuk sebuah cluster
Non-hierarchical clustering dimulai dengan menentukan jumlah cluster yang di inginkan (dua, tiga,
atau lebih cluster), setelah jumlah yang cluster ditentukan maka proses cluster dimulai tanpa mengikuti
proses hirarki. (Santoso,2010)
K-MEANS
Untuk mendapatkan perbandingannya adalah dengan menghitung SSE (Sum of Square Error)
dari masing-masing nilai cluster. Karena semakin besar jumlah cluster K maka nilai SSE
akan semakin kecil. Rumus SSE pada K-Means (Irwanto, et al .,2012).
Dimana:
K = jumlah cluster
xi = data ke – i
Ck = centroid cluster
¿
RAPIDMINER
FAKULTAS
TEKNIK
PRODI TEKNIK INFORMARTIKA
Mulai
Studi Awal
Metode Analisis Data
Pengumpulan Data
Analisis yang digunakan adalah analisis deskriptif,
Diagram Blog
Implementasi
dalam penelitian ini menggunakan pendekatan Tahapan-Tahapan
Algoritma K-Means
kuantitatif, yang analisanya pada data-data numeric Penelitian
Selesai
15 DATA SET
ASI IDL GB SP SK ASI IDL GB SP SK ASI IDL GB SP SK
2016 2016 2016 2016 2016 2017 2017 2017 2017 2017 2018 2018 2018 2018 2018
23.50 69.57 2.55 7.56 3.51 22.99 52.17 5.90 12.20 3.70 60.84 21.74 6.70 16.00 5.00
12.40 72.73 3.07 9.34 4.33 10.73 75.76 5.30 12.50 5.70 50.07 60.61 5.40 13.20 4.60
45.30 94.12 1.93 4.66 1.60 48.08 100.00 2.10 7.90 2.00 60.43 94.12 4.90 14.40 4.70
Keterangan :
32.20 80.00 1.30 6.61 1.30 25.55 100.00 2.30 8.60 2.70 76.38 100.00 2.80 9.80 3.50
41.00 100.00 2.99 6.28 3.50 46.60 100.00 3.00 7.20 2.60 71.88 100.00 2.30 6.10 3.90
ASI = Pemberian Air Susu Ibu Eksklusif
39.60 100.00 2.35 6.13 1.64 38.23 100.00 2.90 8.40 1.60 57.97 96.30 2.60 11.70 3.20 IDL = Capaian Imunisasi Dasar Lengkap ≥80%
55.40 100.00 2.10 4.74 1.68 61.45 100.00 2.40 5.10 2.00 76.17 100.00 2.50 6.30 1.20 GB = Gizi Buruk
38.30 100.00 3.02 8.31 2.05 41.18 100.00 4.30 11.20 2.20 78.63 100.00 5.90 9.20 4.40 SP = Sangat Pendek
12.50 66.67 4.52 11.54 4.27 12.70 100.00 6.00 11.20 4.40 46.91 66.67 6.80 12.70 3.80 SK = Sangat Kurus
31.20 40.00 4.07 10.29 2.54 37.78 80.00 4.50 11.30 3.30 54.29 60.00 2.40 6.80 1.10
22.90 71.43 6.67 11.94 4.33 39.55 92.86 6.50 13.00 4.70 62.83 42.86 5.20 11.40 4.00
19.70 60.00 1.32 6.79 2.24 23.43 86.67 3.30 14.10 4.70 38.69 60.00 4.20 9.80 2.90
16.70 36.36 6.00 12.33 9.03 27.19 63.64 5.80 10.30 5.90 41.51 54.55 7.40 12.50 4.00
22.90 69.23 5.62 11.45 4.94 21.40 69.23 6.60 13.40 6.00 20.43 76.92 5.10 11.70 3.90
20.10 34.48 3.18 11.64 5.70 30.42 24.14 6.80 15.90 5.80 48.32 34.48 5.10 15.30 4.80
IMPLEMENTASI
ALGORITMA K-MEANS
Iterasi Ke-1 Pusat awal centroid
C1 C2 C3
1. Menentukan jumlah cluster
12.4
ASI 2016 28.91 55.40
Jumlah cluster yang digunakan sebanyak 3 cluster 0
34.4
IDL 2016 72.97 100.00
8
2. Menentukan nilai pusat centroid GB 2016 1.30 3.38 6.67
SP 2016 4.66 8.64 12.33
Penentuan pusat awal centroid ditentukan secara
SK 2016 1.30 3.51 9.03
random/acak diambil dari data yang ada. 10.7
ASI 2017 32.49 61.45
3
𝑒 = ( 𝑥 𝑖 − 𝑠 𝑖)2 + ( 𝑦 𝑖 − 𝑡 𝑖 )2 … … … … … … …(4 ))
𝐷 √ i : banyaknya objek,
ASI 2018
20.4
56.36 78.63
(x,y) merupakan koordinat objek dan
3
(s,t) merupakan koordinat centroid
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS
110.6438647
Dan seterusnya dilanjutkan menghitung untuk data ke-2….N terhadap pusat awal cluster hingga didapatkan nilai
matrik jarak.
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS
Data
Provinsi C1 C2 C3 C1 C2 C3
ke
jarak hasil perhitungan pada point ke-3 akan dilakukan perbandingan 5 DKI Jakarta 144.7354051 49.88743782 27.94800172 ok
dan dipilih jarak yang terdekat antara data dengan pusat cluster, yang 6 Jawa Barat 136.245786 42.76141632 38.42705427 ok
berada dalam satu kelompok dengan pusat cluster terdekat, 9 Gorontalo 98.55255248 33.48007137 86.66483081 ok
1 9 5
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS
5. Penetuan pusat cluster baru
Setelah didapatkan anggota dari setiap cluster kemudian pusat cluster baru dihitung berdasarkan data anggota tiap cluster yang sudah didapatkan
menggunakan rumus yang sesuai dengan pusat anggota cluster sebagai berikut :
C
H asilC 1=( 20.10 ) ; ( 34.43 ) ; (3.18 ) ; ( 11.64 ) ; (5.70 ) ; ( 30.42 ) ; ( 24.14 ) ; ( 6.80 ) ; ( 15.90 ) ; ( 5.80 ) ; ( 48.32 ) ; ( 34.48 ) ; ( 5.10 ) ; ( 15.30 ) ; ( 4.80 )
( 23.50+12.40+32.20+12.50+31.20+22.90+19.70+16.70+22.90 ) ( 69.57+72.73+80.00+ 66.67+40.00+71.43+60.00+5.62 )
2=
𝐶
9
;
9
( 2.55+3.07+1.30+4.52+4.07+6.67+1.32+6.00+5.62) ( 7.56+9.34+6.61+11.54+10.29+11.94+6.79+12.33+11.45) (3.51+4.33+1.30+4.27+2.54+4.33+2.24+9.03+4.94 ) (22.99+10.73+25.55+12.70+37.78+39.55+23.43+27.19+21.40 )
¿ ; = ;
9 9 9 9
( 52.17+75.76 +100.00+100.00+80.00+92.86+86.67 +63.64+69.23 ) ( 5.90+5.30+2.30+6.00+ 4.50+6.50+3.30+5.80+6.60 )
¿ ;
9 9
( 12.20+12.50+ 8.60+ 11.20+11.30+13.00+14.10+10.30+13.40 ) ( 3.70+5.70+2.70+ 4.40+3.30+4.70+ 4.70+5.90+6.00 )
¿ ;
9 9
( 60.84 +50.07+76.38+46.91+54.29+62.83+38.69+ 41.51+20.43 ) ( 21.74+60.61+100.00+66.67 +60.00+42.86+ 60.00+54.55+76.92 )
¿ ;
9 9
( 6.70+5.40+ 2.80+6.80+2.40+5.20+4.20+7.40+5.10 ) ( 16.00+13.20+ 9.80+12.70+6.80+11.40+ 9.80+ 12.50+ 11.70 )
¿ ;
9 9
( 5.00+ 4.60+3.50+3.80+1.10+4.00+2.90+ 4.00+3.90 )
¿
9
H asil𝑐 2= ( 21.56 ) ; ( 62.89 ) ; ( 3.90 ) ; ( 9.76 ) ; ( 4.05 ) ; ( 24.59 ) ; ( 80.04 ) ; ( 5.13 ) ; ( 11.84 ) ; ( 4.57 ) ; (50.22 ) ; ( 60.37 ) ; ( 5.11 ) ; ( 11.54 ) ; ( 3.64 )
LANJUT IMPLEMENTASI
ALGORITMA K-MEANS
(45.30+41.0+39.60+5.40+38.0) (94.12+0. +10. +10. +10. ) (1.93+2.9+2.35+2.10+3.2) (4.6+.28+6.13+4.7+8.31) (60+3.50+1.64+1.68+2.05) (48.0+46.0+38.2+61.45+1.8) (10. +10. +10. +10. +10. ) (2.10+3.0+2.90+2.40+.30) (7.90+7.20+8.40+5.10+ .20) (2.0+2.60+1.60+2.0+2.0) (60.43+71.8+57.9+76.1+78.63) (94.12+0. +96.30+1 .0+10. ) (4.90+2.30+2.60+2.50+.90) (14.0+6.10+ .70+6.30+9.20) (4.70+3.90+3.20+1.20+4.0)
𝐶 3 = ; ; ; = ; ; ;= ; ; ;= ; ; ; = ; ;
5 5 5 5 5 5 5 5 5 5 5 5 5 5 5
H asil𝑐 3= ( 43.92 ) ; ( 98.82 ) ; ( 2.48 ) ; ( 6.02 ) ; ( 2.09 ) ; ( 47.11 ) ; ( 100.00 ) ; ( 2.94 ) ; ( 7.96 ) ; ( 2.08 ) ; ( 69.02 ) ; ( 98.08 ) ; ( 3.64 ) ; ( 9.54 ) ; ( 3.48 ) ASI 2016
C1
20.10
C2
21.56
C3
43.92
IDL 2016 34.48 62.89 98.82
GB 2016 3.18 3.90 2.48
Dari perhitungan di atas maka didapatkan pusat cluster baru SP 2016 11.64 9.76 6.02
dengan menggunakan titik centroid yang baru yaitu hasil dari iterasi iterasi sebelumnya. SP 2017 15.90 11.84 7.96
SK 2017 5.80 4.57 2.08
ASI 2018 48.32 50.22 69.02
7. Lakukan perulangan hinggal nilai centroid yang dihasilkan tidak berubah dan anggota
IDL 2018 34.48 60.37 98.08
cluster tidak berpindah ke cluster lain. Jika hasil nilai centroid dan anggota cluster tidak GB 2018 5.10 5.11 3.64
SP 2018 15.30 11.54 9.54
berubah maka proses selesai SK 2018 4.80 3.64 3.48
PENGUJIAN METODE ELBOW
( 2 CLUSTER )
Metode Elbow untuk menentukan jumlah cluster yang Centroid cluster pada 2 cluster
Pusat ASI IDL GB SP SK ASI IDL GB SP SK ASI IDL GB SP SK
paling optimum atau yang terbaik. Langkah-langkah Cluster 2016 2016 2016 2016 2016 2017 2017 2017 2017 2017 2018 2018 2018 2018 2018
C1 20.21 57.83 4.11 10.32 4.54 25.13 71.61 5.63 12.66 4.91 47.10 53.09 5.37 12.16 3.79
metode Elbow: C2 41.97 95.69 2.28 6.12 1.96 43.52
100.0
2.83 8.07 2.18 70.24 98.40 3.50 9.58 3.48
0
Dimana:
¿ (6.70 – 5.37)2 + (16.00 – 12.16)2 + (5.00 – 3.79)2
M1.1 = 1733.3402
... dihitung sampai atribut data terakhir
K = jumlah cluster Pusat
Cluster 20.21 57.83 4.11 10.32 4.54 25.13 71.61 5.63 12.66 4.91 47.10 53.09 5.37 12.16 3.79
xi = data ke – I (C1)
Pusat
Cluster 41.97 95.69 2.28 6.12 1.96 43.52 100.00 2.83 8.07 2.18 70.24 98.40 3.50 9.58 3.48
(C2)
GB
ASI IDL GB SP SK ASI IDL SP SK ASI IDL GB SP SK
Data 2016 2016 2016 2016 2016 2017 2017
201
2017 2017 2018 2018 2018 2018 2018
7
4. Melakukan perhitungan SSE (Sum of Squares Error)
1 23.50 69.57 2.55 7.56 3.51 22.99 52.17 5.90 12.20 3.70 60.84 21.74 6.70 16.00 5.00
… … … … … … … … … … … … … … … … sampai cluster yang ditentukan.
5. Melihat hasil SSE (Sum of Squares Error) dari nilai cluster
Ambil nilai terkecil (MIN) dari M1 dan M2 masing-masing data, kemudian nilai terkecil di yang turun secara drastis atau nilai yang berubah
jumlah (SUM) dan hasil penjumlahan adalah nilai SSE (Sum of Squares Error). signifikan.
6. Menetapkan nilai cluster yang berbentuk siku sebagai
cluster optimum.
Te r i m a K a s i h
FAKULTAS
TEKNIK
PRODI TEKNIK INFORMARTIKA