Anda di halaman 1dari 52

SISTEM KLASIFIKASI STATUS GIZI BERAT BADAN PADA BALITA

MENGGUNAKAN METODE NAIVE BAYES BERDASARKAN DATA


PEMERIKSAAN ANTROPOMETRI

PROPOSAL SKRIPSI

Diajukan untuk Memenuhi Bagian dari


Syarat Memperoleh Gelar Sarjana Komputer
Pada Departemen Pendidikan Ilmu Komputer
Program Studi Ilmu Komputer

oleh:
Nida Nurhasanah
1300749

PROGRAM STUDI ILMU KOMPUTER


DEPARTEMEN PENDIDIKAN ILMU KOMPUTER
FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PENDIDIKAN INDONESIA
2017
DAFTAR ISI

BAB I PENDAHULUAN ........................................................................................2


1.1 Latar Belakang...........................................................................................2
1.2 Rumusan Masalah .....................................................................................7
1.3 Tujuan Penelitian .......................................................................................7
1.4. Batasan Penelitian .....................................................................................8
1.5. Sistematika Penulisan ................................................................................8
BAB II KAJIAN PUSTAKA .................................................................................10
2.1 Status Gizi ...............................................................................................10
2.1.1 Definisi Status Gizi ..........................................................................10
2.1.2 Penilaian Status Gizi Balita..............................................................10
2.2 Sistem ......................................................................................................16
2.3 Klasifikasi ................................................................................................17
2.4 Naïve Bayes .............................................................................................18
2.5 Diskritisasi ...............................................................................................37
2.6 Evaluasi dan Validasi ..............................................................................37
2.6.1 Cross Validation...............................................................................37
2.6.2 Confusion Matrix..............................................................................38
2.7 WEKA .....................................................................................................39
BAB III METODOLOGI PENELITIAN ...............................................................42
3.1 Desain Penelitian .....................................................................................42
3.2 Alat dan Bahan Penelitian .......................................................................46
3.2.1 Alat Penelitian ..................................................................................46
3.2.2 Bahan Penelitian...............................................................................46
DAFTAR PUSTAKA ............................................................................................47

1
BAB I
PENDAHULUAN

Dalam bab ini akan membahas latar belakang, rumusan masalah, tujuan sistem,
batasan sistem dan sistematika penulisan yang dilaksanakan didalm penelitian ini.
1.1 Latar Belakang
Perkembangan teknologi informasi dan komunikasi sangat berkembang
pesat baik dari sisi kemudahan dalam mengakses sebuah informasi maupun
kecepatan dalam mengakses informasi tersebut. Saat ini banyak sekali lembaga -
lembaga negara yang sudah memanfaatkan teknologi informasi dalam membantu
meminimalisir sumber daya yang minimum salah satunya dalam lembaga bidang
kesehatan.
Salah satu bidang yang sangat penting dalam kehidupan manusia adalah
bidang kesehatan. Telah banyak kajian dan telaah yang dilakukan dalam bidang
kesehatan, salah satunya adalah masalah gizi. Gizi adalah komponen kimia yang
terdapat dalam zat makanan yang sangat dibutuhkan oleh tubuh untuk
perkembangan dan pertumbuhan.
Status gizi adalah ukuran keberhasilan dalam pemenuhan nutrisi untuk anak
yang diindikasikan oleh berat badan dan tinggi badan anak. Status gizi juga
didefinisikan sebagai status kesehatan. Status gizi balita adalah suatu indikator yang
mencerminkan tingkat kesejahteraan suatu masyarakat (Irsyadi & Fatah, 2015).
Status gizi anak balita salah satunya dipengaruhi oleh faktor kondisi sosial
ekonomi, antara lain pendidikan ibu, pekerjaan ibu, jumlah anak, pengetahuan dan
pola asuh ibu serta kondisi ekonomi orang tua secara keseluruhan (Putri, Sulastri,
& Lestari, 2015)
Di dunia, gangguan gizi pada balita yang memiliki prevalensi tertinggi
terdapat di kawasan Asia Tenggara, Asia Selatan, Asia Timur dan Afrika. Di ketiga
kawasan tersebut gangguan gizi balita menjadi perhatian karena berada pada status
underweight, stunting dan wasting (WHS, 2007).
Menurut (Kementerian Kesehatan RI, 2016) Pada tahun 2014 pemantauan
status gizi (PSG) masih terbatas yakni 150 Kabupaten dan Kota di Indonesia dengan
jumlah sample 13.168 balita. Pada tahun 2015 PSG telah berhasil dilakukan di
seluruh Kabupaten dan Kota di Indonesia yakni 496.

2
3

Kabupaten atau Kotamadya dengan melibatkan data sample kurang lebih


165.000 balita. Berikut merupakan hasil PSG 2015, antara lain:
1. Status Gizi Balita menurut Indeks BB/U didapatkan hasil : 79,7% gizi baik,
14,9% gizi kurang, 3,8% gizi buruk, dan 1,5% gizi lebih.
2. Status Gizi Balita Menurut Indeks TB/U didapatkan hasil : 71% normal dan
29,9% Balita pendek dan sangat pendek.
3. Status Gizi Balita Menurut Indeks BB/TB didapatkan hasil : 82,7% Normal,
8,2% kurus, 5,3% gemuk, dan 3,7% sangat kurus.
Dari 496 Kab/kota yang dianalisis, sebanyak 404 Kabupaten atau Kota
mempunyai permasalahan gizi yang bersifat Akut Kronis, 20 Kabupaten atau Kota
mempunyai permasalahan gizi yang bersifat Kronis, 63 Kabupaten atau Kota
mempunyai permasalahan gizi yang bersifat Akut dan 9 Kabupaten atau Kota yang
tidak ditemukan masalah gizi. Kesembilan Kabupaten atau Kota tersebut, antara
lain:
1. Kabupaten Ogan Komering Ulu, Sumatera Selatan
2. Kota Pagar Alam, Sumatera Selatan
3. Kab. Mukomuko, Bengkulu
4. Kota Bengkulu, Bengkulu
5. Kab. Belitung Timur, Bangka Belitung
6. Kota Semarang, Jawa Tengah
7. Kota Tabanan, Bali
8. Kota Tomohon, Sulawesi Utara
9. Kota Depok, Jawa Barat (Kementerian Kesehatan RI, 2016)
Terdapat beberapa penelitian yang membahas tentang cara menentuka n
status gizi balita yaitu pada penelitian (Monica, Sudrajat, & Suarna, 2016) dimana
penelitian ini dilakukan di RS. Bersalin Muhammadiyah Cirebon dengan
menggunakan metode Weight Product dimana metode ini menentukan sebuah
keputusan dengan cara perkalian untuk menghubungkan rating atribut, dimana
rating masing- masing atribut tersebut harus dipangkatkan dulu dengan bobot yang
bersangkutan. Pengukuran bayi baru lahir ini dilakukan sesuai dengan pengukuran
Antropometri seperti berat badan, panjang badan, pengukuran lingkar kepala,
lingkar dada, lingkar lengan atas. Tetapi di dalam penelitian ini tidak hanya
4

menggunakan pemeriksaan berdasarkan Antropometri saja sehingga menurut


penulis kurang mendapatkan hasil yang maksimal dan hanya terdapat 3 status
kesehatan neonatus yaitu Bayi Baru Lahir Normal (BBLN), Bayi tidak normal
meliputi: Bayi Berat Lahir Rendah (BBLR) dan Bayi Berat Lahir Besar (BBLB).
Penelitian lainnya oleh (Rasepta, 2016) dimana penelitian ini memilik i
permasalahan yaitu bagaimana merancang dan membangun suatu sistem
klasifikasian status gizi balita dengan menerapkan metode Modified K-Nearest
Neighbor, batasan umur balita 0-5 tahun dan variabel yang digunakan yaitu umur,
jenis kelamin, tinggi badan, berat badan dan lingkar kepala, dimana kelas yang
digunakan dalam klasifikasi gizi balita yaitu kurus, normal dan obesitas, dimna
sistem yang dirancang memiliki rata-rata nilai akurasi tinggi sebesar 90%.
Selanjutnya terdapat penelitian yang dilakukan oleh (Irsyadi & Fatah, 2015)
melakukan pengklasifikasian menentukan status gizi balita yang difokuskan untuk
balita yang berjenis kelamin laki-laki menggunakan Jaringan Syaraf Tiruan, dimana
variabel yang menjadi penilaian status gizinya yaitu BB/U, TB/U dan BB/TB, hasil
penelitian membuktikan bahwa 70% responden menilai bahwa aplikasi klasifikas i
status gizi sangat baik untuk digunakan dan 30% menilai baik digunakan untuk
penilaian status gizi balita. Pada penelitian status gizi lainnya yaitu oleh (Ayma,
Ayma, & Torre, 2016) melakukan penelitian menentukan status gizi balita dengan
menggunakan teknik pengolahan citra berdasarkan pengukuran antropometri
dengan nilai akurasi keseluruhan lebih dari 85% sampai 100%.
Pada penelitian lainnya yaitu dilakukan oleh (Alabi, Ijadunola, Alabi,
Onayade, & Aluko, 2016) prevalensi gizi buruk sebagian besar terdapat di negara
berkembang seperti Negara Bagian Zamfara, Nigeria Barat Laut, dimana data
sample yang digunakan sebanyak 397 anak balita yang dinilai dari 6 kabupaten
dibawah area pengawasan demografis dengan menggunakan indeks antropometri,
pengukuran antropometri (Z-score) dihitung untuk mengetahui high-for-age,
weight-for-height dan weight-for-age dengan hasil menunjukan bahwa 70% (n-
397) pendek, 15% (n-292) kurus dan 37% (n=397) gizi kurang.
Sebelumnya penulis menemukan beberapa penelitian yang menerapkan
metode yang sama yaitu klasifikasi Naïve Bayes tetapi dengan beberapa kasus yang
berbeda pada penelitian (Kusumadewi, 2009) yaitu pengklasifikasian status gizi
5

menggunakan Naïve Bayesian Classification yang mendapatkan nilai akurasi


sistem sebesar 93,2%, tetapi di dalam penelitian ini hanya menggunakan variable
jenis kelamin, status gizi, tinggi badan (cm), berat badan (kg), lingkar tangan (cm),
lingkar perut (cm) tanpa menggunakan variable usia.
Penelitian lainnya dilakukan oleh (Karlik, 2011) tentang pengklasifikas ia n
mendiagnosis penyakit hepatitis, tetapi di dalam penelitiannya membandingka n
backpropagation dan naïve bayes classifiers dengan masing- masing mendapatkan
nilai keakuratan 98% dan 97%.
Pada penelitian (Medhekar, Bote, & Deshmukh, 2013) yaitu mendeteksi
penyakit jantung dengan menerapkan Naïve Bayes dengan dibagi kedalam lima
kategori yaitu tidak, rendah, rata-rata, tinggi dan sangat tinggi. Akurasi sistem
tergantung dari algoritma dan database yang digunakan.
Pada penelitian lainnya (Pramitarini, Ketut E P, & Hery Purnomo, 2013)
mencari pola status gizi yang sering dialami oleh pasien balita yang bisa dideteksi
dimana informasi tersebut terkumpul dalam data rekam medis. Dimana infor mas i
rekam medis tersebut berdasarkan standar WHO. Di dalam pelitiannya ini
menerapkan algoritma Naïve Bayes dengan menggunakan jumlah data 198. Atribut
yang digunakan yaitu jenis kelamin, umur, tinggi badan, berat badan dan tiga buah
komorbid (diare, edema dan pneumonia). Hasil penelitian menunjuka n
menggunakan data sampel 70:30 memiliki nilai akurasi 88%, jika presentasenya
50:50 nilai akurasinya 55% dan jika presentase 30:70 maka nilai akurasinya 28%.
Selain itu terdapat penelitian yang dilakukan oleh (Tantra D, 2014)
menerapkan Naïve Bayes dalam penentuan klasifikasi status gizi orang dewasa
dengan menggunakan beberapa variable seperti jenis kelamin, status gizi, tinggi
badan (cm), berat badan (kg), lingkar tangan (cm), lingkar perut (cm) dan usia
dengan memiliki nilai akurasi sistem klasifikasi ini sebesar 87.91%.
Selanjutnya pada penelitian (Borkar & Deshmukh, 2015) yaitu mendeteksi
penyakit yang paling banyak menyebar di dunia yatu penyakit flu babi. Di dalam
penelitiannya ini untuk mendekteksi penyakit flu babi mengimplementasikan Naïve
Bayes Classifier dengan menggunakan beberpa atribut seperti caugh, fever, sore
throat, runny nose, headache, chill, fatigue dan nausea.
6

Pada penelitian (Adebayo, Olutola, & Aladekomo, 2016) yaitu mendeteksi


kelangsungan hidup pasien HIV/AIDS berdasarkan varabel seperti CD4 count,
viral load, opportunistic infection dan nutritional status. Hasilnya menunjuka n
bahwa klasifikasi Naïve Bayes dapat memprediksi kelangsungan hidup pasien
HIV/AIDS dengan akurasi 60% sampai 100% berdasarkan dependen terpilih.
Selanjutnya yaitu penelitian lainnya oleh (Gayathri & Sumathi, 2016) tentang
klasifikasi kanker payudara, dataset diambil dari UCI Repository dan dengan hanya
menggunakan 4 variabel memberikan akurasi 96%. Selanjutnya pada penelitia n
(Ting, Ip, & Tsang, 2011) membuktikan dalam mengklasifikasi suatu dokumen
dalam kategori tertentu dengan jumlah dataset yang besar bahwa klasifikasi Naïve
Bayes merupakan penklasifikasian terbaik dibandingkan dengan beberapa
klasifikasi lainnya seperti decision tree, jaringan syaraf tiruan, dan SVM dalam hal
akurasi dan efesiensi.
Di Kabupaten Tasikmalaya terdapat beberapa lembaga kesehatan, salah
satunya yaitu Pusat Kesehatan Masyarakat (Puskesmas) Sariwangi. Puskesmas
Sariwangi ini merupakan lembaga kesehatan yang melayani masyarakat di wilayah
kerjanya yaitu di daerah Kecamatan Sariwangi. Banyak sekali program kerja yang
diselenggarakan di Puskesmas tersebut contohnya seperti posyandu (pos pelayanan
terpadu). Posyandu ini merupakan wadah pemeliharan kesehatan masyarakat yang
bertujuan untuk melayani program KIA, gizi, imunisasi dan lain-lainnya.
Dilihat dari penelitian sebelumnya penulis mendapatkan sebuah ide untuk
membuat sistem klasifikasi status gizi balita seperti penelitian (Irsyadi & Fatah,
2015) dan (Rasepta, 2016) dengan menggunakan pemeriksaan antropometri
berdasarkan penelitian (Alabi et al., 2016), (Ayma et al., 2016) dan (Monica et al.,
2016). Selain itu, sistem klasifikasi status gizi balita yang akan diteliti berdasarkan
penilaian antropometri, penulis mengimplementasikan algortitma Naïve Bayes
yang digunakan di dalam penelitian (Kusumadewi, 2009), (Karlik, 2011) ,(Tantra
D, 2014) (Ting et al., 2011) dan (Gayathri & Sumathi, 2016). Dimana yang menjadi
variabel status gizi balitanya yaitu jenis kelamin (genre), umur, tinggi badan atau
panjang badan, berat badan dan hasil gizi (menurut Antropometri). Dalam
nenentukan status gizi berat badan pada balita dibagi menjadi 2 yaitu Berat Badan
berdasarkan Umur (BB/U) dan Berat Badan berdasarkan Tinggi Badan (BB/TB) .
7

Kelas atau status gizi yang dihasilkan berdasarkan standar Antropometri Keputusan
Menteri Kesehatan Republik Indonesia (Nomor:1995/MENKES/SK/XII/ 2010)
yaitu:
1. BB/U = Gizi Buruk, Gizi Kurang, Gizi Baik
2. BB/TB = Sangat Kurus, Kurus, Normal dan Gemuk.
Tingkat kesehatan bayi dan balita mencerminkan status kesehatan bayi
disuatu daerah. Penulis menerapkan algoritma Naïve Bayes ini karena algoritma
tersebut mudah dipahami dan dapat menerima masukan atau input-an dalam bentuk
apapun seperti numerik maupun nominal, dimana hasil perhitungan Naïve Bayes ini
merupakan angka numerik dan akan dicari nilai tertinggi dari keseluruhan kelas.
Oleh karena itu di dalam penelitian ini penulis mengharapkan dengan
adanya sistem klasifikasi ini dapat menentukan status gizi balita menggunaka n
Algoritma Naïve Bayes.
Sistem ini akan mengambil data posyandu di UPTD Puskemas Sariwangi
Kecamatan Sariwangi Kabupaten Tasikmalaya pada tahun 2016 yang terdiri dari 6
Desa dimana dari 6 desa tersebut terdapat 60 posko posyandu.

1.2 Rumusan Masalah


Berdasarkan latar belakang masalah yang telah diuraikan maka rumusan
masalah dalam penelitian ini adalah sebagai berikut:
1. Apa saja variabel dan jenis-jenis status gizi balita yang dibutuhka n
untuk membangun sistem klasifikasi?
2. Bagaimana variabel dan status gizi balita itu dapat dijadikan dasar
untuk membangun sebuah sistem klasifikasi berbasis komputer
berdasarkan metode Naïve Bayes?
3. Bagaimana mengukur tingkat akurasi sistem yang dibangun dengan
menerapkan Naïve Bayes?

1.3 Tujuan Penelitian


Ada beberapa yang harus dicapai dalam penelitian ini, yaitu:
1. Untuk mengetahui varibel apa saja yang dipakai untuk menentuka n
status gizi balita dan untuk mengetahui jenis-jenis status gizi balita.
8

2. Untuk mengetahui tahapan yang digunakan dalam membangun sebuah


sistem klasifikasi dengan metode Naïve Bayes dalam menentukan status
gizi balita.
3. Untuk mengetahui nilai akurasi sistem yang dibangun yang didapatkan
dengan menggunakan metode Naïve Bayes.

1.4. Batasan Penelitian


Di dalam penelitian skripsi ini penulis membatasi permasalahan dalam
penelitian yang akan dilakukan, seperti:
1. Penilaian kesesuaian sistem aplikasi menggunakan model penilaia n
Antropometri.
2. Status gizi di dalam sistem ini tidak bisa menentukan status gizi TB/U
dan IMT.
3. Data yang diolah yaitu data posyandu di UPTD Puskemas Sariwangi
Kecamatan Sariwangi Kabupaten Tasikmalaya pada tahun 2016

1.5. Sistematika Penulisan


Di dalam penulisan skripsi ini, sistematika penulisan dibagi menjadi
beberapa sebagai berikut :
BAB I PENDAHULUAN
Pada bab 1 memaparkan tentang latar belakang, rumusan masalah, tujuan
penelitian, batasan penelitian dan sistematika penelitian

BAB II KAJIAN PUSTAKA


Pada bab 2 membahas teori-teori yang menjadi penunjang dalam
penyusunan laporan penelitian yang akan dilakukan.

BAB III METODE PENELITIAN


Pada bab 3 menjelaskan tahapan-tahapan penelitian yang akan dilakukan.

BAB IV HASIL PENELITIAN DAN PEMBAHASAN


Pada bab 4 ini menjelaskan hasil dari penelitian yang dilakukan.
9

BAB V KESIMPULAN DAN SARAN


Pada bab 5 ini berisikan tentang kesimpulan dan saran yang dihasilkan dari
awal sampai akhir penelitian.
BAB II
KAJIAN PUSTAKA

Dalam bab ini akan membahas tentang kajian pustaka yang digunakan di dalam
penelitian ini, seperti tentang sistem, klasifikasi, naïve bayes, status gizi balita,
cross validation dan confusion matrix.
2.1 Status Gizi
2.1.1 Definisi Status Gizi
Masa balita merupakan tahap pertumbuhan yang sangat pesat, dimana
sangat membutuhkan kasih sayang dan perhatian dari orang tua. Selain itu balita
juga sangat membutuhkan zat gizi yang seimbang agar tumbuh kembang anak
tersebut tidak terhambat karena anak balita rentang dalam menderita kekurangan
gizi (Santoso & Ranti, 2004) .
Status gizi adalah kondisi tubuh yang berakibat dari konsumsi makanan dan
penggunaan zat-zat gizi yang dibedakan kedalam 4 kategori diantaranya status gizi
buruk, status gizi kurang, status gizi baik, status gizi lebih (Supariasa, Bakri, &
Fajar, 2002) .
2.1.2 Penilaian Status Gizi Balita
Di Indonesia cara yang paling umum dan sering digunakan untuk penilaia n
status gizi adalah dengan menggunakan antropometri, karena lebih praktis dan
mudah dilakukan. Untuk mengetahui status gizi seseorang dapat digunakan
berbagai cara, salah satunya yaitu dengan cara Z-Skor terhadap nilai median.
Z-Skor merupakan index antropometri yang di gunakan secara internasional untuk
penentuan status gizi dan pertumbuhan, yang diekspresikan sebagai satuan
standar deviasi (SD) populasi. Z-Skor digunakan untuk menghitung status gizi
secara antropometri pada berat badan terhadap umur (BB/U), tinggi badan
terhadap umur (TB/U), dan berat badan terhadap tinggi badan (BB/TB) (Fitri,
Setyawati, & Rahadi S, 2014) .
Menurut Supariasa, Bakri, & Fajar (2002) beberapa indeks antropometri
yang sering digunakan yaitu Berat Badan menurut Umur (BB/U), Tinggi Badan
menurut Umur (TB/U) dan Tinggi Badan menurut Berat Badan (TB/BB). Berikut
merupakan pengertian, kelebihan dan kekurangan dari indeks antropometri yang
sering digunakan yaitu menurut (Supariasa et al., 2002):

10
Tabel 2.1. Pengertian, Kelebihan dan Kekurangan dari Indeks Antropometri (Supariasa et al.,
2002)

Jenis Pengertian Kelebihan Kelemahan


BB/U Berat badan 1. Lebih mudah dan 1. Dapat
adalah salah satu cepat dimengerti oleh mengakibatkan
parameter yang masyarakat umum interprestasi status
memberikan 2. Baik untuk menguk ur gizi yang keliru
gambaran massa status gizi akut atau bila terdapat
tubuh. Berat kronis edema maupun
badan adalah 3. Berat badan dapat asites
parameter berfluktuasi 2. Di daerah
antropometri 4. Sangat sensitive pedesaan yang
yang sangat labil. terhadap perubahan- masih terpencil
perubahan kecil dan tradisiona l,
5. Dapat mendeteksi umur sering sulit
kegemukan ditaksir secara
tepat karena
pencatatan umur
yang belum baik
3. Memerlukan data
umur yang akurat,
terutama untuk
anak dibawah usia
lima tahun
4. Sering terjadi
kesalahan dalam
pengukuran,
seperti pengaruh
pakaian atau
gerakan anak pada
saat penimbangan
Jenis Pengertian Kelebihan Kelemahan
5. Secara operasional
sering mengala mi
hambatan karena
masalah sosial
budaya setempat.
Dalam hal ini
orang tua tidak
mau menimba ng
anaknya, karena
dianggap barang
dagangan dan
sebagainya
TB/U Tinggi badan 1. Baik untuk menila i 1. Tinggi badan tidak
merupakan status gizi masa cepat naik, bahkan
antropometri lampau tidak mungk in
yang 2. Ukuran panjang dapat turun
menggambarkan dibuat sendiri, murah 2. Pengukuran
keadaan dan mudah dibawa relative sulit
pertumbuhan dilakukan karena
skeletal anak harus berdiri
tegak, sehingga
diperlukan 2 orang
untuk
melakukannya
3. Ketepatan umur
sulit didapat
BB/TB Indeks BB/TB 1. Tidak memerluka n 1. Tidak dapat
meruapakan data umur memberikan
indikator yang 2. Dapat membedakan gambaran, apakah
baik untuk proporsi badan anak tersebut
menilai status pendek, cukup
Jenis Pengertian Kelebihan Kelemahan
gizi saat kini (gemuk, normal dan tinggi badan dan
(sekarang). kurus) kelebihan tinggi
badan menurut
umurnya, karena
factor umur tidak
dipertimbangkan
2. Dalam praktek
sering mengala mi
kesulitan dalam
melakukan
pengukuran
panjang/tinggi
badan pada
kelompok balita
3. Membutuhkan dua
macam alat ukur
4. Pengukuran
relative lebih lama
5. Membutuhkan dua
orang untuk
melakukannya
6. Sering terjadi
kesalahan dalam
pembacaan hasil
pengukuran,
terutama bila
dilakukan oleh
kelompok non-
profesional
14

Penimbangan balita sebagai faktor dominan terhadap kejadian balita gagal


tumbuh setelah dikontrol pendidikan ibu. Balita yang tidak ditimbang secara teratur
berisiko 1,5 kali mengalami gagal tumbuh dibandingkan yang ditimbang secara
teratur (Rahmadini, Sudiarti, & Utari, 2013).
Di Indonesia yang menjadi standar baku ukuran untuk menentukan status
gizi balita yaitu dengan menggunakan baku World Health Organization National
Center for Health Statistics (WHO-NCHS). WHO-NCHS dalam penilaian status
gizi balita berdasarkan Indeks BB/U , TB/U , BB/TB. Dimana penilaian status gizi
balita dibedakan antara anak laki-laki dan anak perempuan.
Beberapa indeks antropometri yang sering digunakan berdasarkan
Keputusan Menteri Kesehatan Republik Indonesia
(Nomor:1995/MENKES/SK/XII/2010) yang dapat diunduh pada situs
(http://gizi.depkes.go.id/) tentang Standar Antropometri Penilaian Status Gizi
Anak.
Terdapat pengklasifikasian atau penilaian status gizi balita dengan
menggunakan standar antropometri berdasarkan Keputusan Menteri Kesehatan
Republik Indonesia (Nomor : 1995/MENKES/SK/XII/ 2010) yaitu :
Tabel 2.2. Standar Baku Antropometri WHO-NCHS (Departemen Kesehatan, 2011)

Kategori Ambang Batas


Indeks
Status Gizi (Z-Score)
Gizi Buruk < -3 SD
Berat Badan menurut
Gizi Kurang -3 SD sampai dengan <-2 SD
Umur (BB/U) Anak
Umur 0-60 Bulan Gizi Baik -2 SD sampai dengan 2 SD
Gizi Lebih >2 SD
Panjang Badan menurut Sangat Pendek < -3 SD
Umur (PB/U) atau Pendek -3 SD sampai dengan <-2 SD
Tinggi Badan menurut Normal -2 SD sampai dengan 2 SD
Umur (TB/U) Anak
Umur 0-60 Bulan Tinggi >2 SD

Berat Badan menurut Sangat kurus < -3 SD


Panjang Badan (BB/PB) Kurus -3 SD sampai dengan <-2 SD
atau Berat Badan
Normal -2 SD sampai dengan 2 SD
menurut Tinggi Badan
(BB/TB) Anak Umur 0- Gemuk >2 SD
60 Bulan
Sangat kurus < -3 SD
Kurus -3 SD sampai dengan <-2 SD
15

Kategori Ambang Batas


Indeks
Status Gizi (Z-Score)
Indeks Massa Tubuh Normal -2 SD sampai dengan 2 SD
menurut Umur (IMT/U)
Anak Umur 0-60 Bulan Gemuk >2 SD

Dimana SD merupakan Skor Simpangan Baku (Standar Deviation Score =


Z ). Untuk menghitung status gizi yaitu dengan menggunakan rumus Z-score.
Rumus perhitungan Z-Score:

𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘 −𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛


𝑍 − 𝑠𝑐𝑜𝑟𝑒 = (Supariasa et al.,
𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛

2002)

Menurut (Febrealti, 2011) dari rumus diatas terdapat 2 kategori dalam


menghitung status gizi balita yaitu:
1. Apabila “Nilai Riel Perorangan” hasil pengukuran >= “Nilai Median
Acuan” BB/U, TB/U, BB/TB, maka rumusnya :
𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘−𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
𝑍 − 𝑠𝑐𝑜𝑟𝑒 = (1)
𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛 𝑈𝑝𝑝𝑒𝑟

Atau
𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘−𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
𝑍 − 𝑠𝑐𝑜𝑟𝑒 = (2)
(+1 𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛)−𝑀𝑒𝑑𝑖𝑎𝑛

2. Apabila “Nilai Riel Perorangan” hasil pengukuran <= “Nilai Median


Acuan” BB/U, TB/U, BB/TB, maka rumusnya :
𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘−𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
𝑍 − 𝑠𝑐𝑜𝑟𝑒 = (3)
𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛 𝐿𝑜𝑤𝑒𝑟

Atau
𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘−𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
𝑍 − 𝑠𝑐𝑜𝑟𝑒 = (4)
𝑀𝑒𝑑𝑖𝑎𝑛−(−1 𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛)

Contoh perhitungan status gizi pada balita:


Seorang bayi berjenis kelamin laki-laki berumur 3 bulan dengan berat badan
6 kg dan tinggi badan atau panjang badan 63 cm. Bagaimana status gizi BB/U, PB/U
dan BB/PB bayi tersebut ?
Jawab:
a. Indeks BB/U
𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘 − 𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
𝑍 − 𝑠𝑐𝑜𝑟𝑒 =
+1 𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛 − 𝑀𝑒𝑑𝑖𝑎𝑛
16

6 − 6.4 0.4
𝑍 − 𝑠𝑐𝑜𝑟𝑒 = = = 𝟎, 𝟓𝟕
6.4 − 5.7 0,7

Jadi, Status gizi berdasarkan BB/U yaitu Gizi Baik karena berada pada
batas pengelompokan -2 s/d +2SD

b. Indeks TB/U
𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘 − 𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
𝑍 − 𝑠𝑐𝑜𝑟𝑒 =
𝑀𝑒𝑑𝑖𝑎𝑛 − −1 𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
63 − 61.4 1.4
𝑍 − 𝑠𝑐𝑜𝑟𝑒 = = = 𝟎. 𝟔𝟕
63.5 − 61.4 2.1

Jadi, Status gizi berdasarkan TB/U yaitu Pendek karena berada pada
batas pengelompokan -2 s/d +2SD

c. Indeks BB/TB
𝑁𝑖𝑙𝑎𝑖 𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑆𝑢𝑏𝑦𝑒𝑘 − 𝑁𝑖𝑙𝑎𝑖 𝑀𝑒𝑑𝑖𝑎𝑛 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛
𝑍 − 𝑠𝑐𝑜𝑟𝑒 =
𝑀𝑒𝑑𝑖𝑎𝑛 − (−1 𝑁𝑖𝑙𝑎𝑖 𝑆𝑖𝑚𝑝𝑎𝑛𝑔 𝐵𝑎𝑘𝑢 𝑅𝑢𝑗𝑢𝑘𝑎𝑛)

6 − 6.8 0.8
𝑍 − 𝑠𝑐𝑜𝑟𝑒 = = = 1.3
6.8 − 6.2 0.6

Jadi, status gizi berdasarkan BB/TB yaitu Normal karena berada pada batas
pengelompokan -2 s/d +2SD
Menurut (Direktorat Bina Gizi, 2011) penting untuk mengkoreksi hasil
pengukuran apabila terdapat balita yang diukur tidak sesuai dengan kelompok
umur:
1. Jika seorang anak berumur kurang dari 2 tahun diukur tingginya
(berdiri) maka ditambah 0.7 cm untuk mengkoncersi menjadi panjang
badan.
2. Jika seorang anak berumur 2 tahun atau lebih dan diukur panjangnya
(terlentang) maka dikurangi 0.7 cm untuk mengkorvensi menjadi tinggi
badan.

2.2 Sistem
Sistem merupakan suatu kumpulan dari beberapa sub sistem yang saling
berhubungan satu dengan lainnya atau bekerja sama untuk mencapai tujuan
17

bersama dengan menerima input dan output dengan melalui proses yang terartur
(Miranti, 2016) .
Menurut (Setiawan, 2009) Klasifikasi sistem dari berbagai sudut pandang
diklasifikasi ke dalam beberapa bagian, diantaranya:
1. Sistem Abstrak dan Sistem Fisik
Sistem abstrak yaitu sistem yang berupa ide yang secara fisik tidak
tampak, sedangkan sistem fisik yaitu sistem yang ada tampak secara fisik
2. Sistem Alamiah dan Sistem Buatan Manusia
Sistem alamiah adalah sistem yang secara alami di proses oleh alam,
sedangkan sistem buatan adalah sistem yang dirancang oleh manusia.
3. Sistem Tertentu dan Sistem Tak Tentu
Sistem tertentu adalah sistem yang kondisi masa depannya dapat
diprediksi, sedangkan sistem tak tentu adalah sistem yang kondisi masa
depannya tidak dapat diprediksi karena ada unsur probabilitas.
4. Sistem Tertutup dan Sistem Terbuka
Sistem tertutup adalah sistem yang tidak ada hubungannya atau tidak
dipengaruhi oleh lingkungan luar, sedangkan sistem terbuka adalah yang
ada hubungannya atau dipengaruhi oleh lingkungan luar.

2.3 Klasifikasi
Klasifikasi adalah suatu fungsionalitas data mining yang akan
menghasilkan model untuk memprediksi kelas atau kategori dari objek-objek di
dalam basis data. Klasifikasi merupakan proses yang terdiri dari dua tahap, yaitu
tahap pembelajaran dan tahap pengklasifikasian (Amri, 2013).
Pada klasifikasi biasanya diberikan sekumpulan kategori atau label dan
beberapa data yang dijadikan sebagai data latih yang akan digunakan untuk
membangun sebuah model. Kemudian model tersebut akan diuji dengan data set
yang akan ditebak katagori atau label pada setiap datanya (Rahmawati, 2016).
Menurut (Darmawan, 2012) menyatakan bahwa pendekatan umum yang
digunakan dalam masalah klasifikasi adalah pertama, training data berisi
record yang mempunyai label class yang telah diketahui. Training data
digunakan untuk membangun model klasifikasi yang kemudian diaplikas ika n
18

ke testing data yang berisi record-record dengan label class yang tidak
diketahui.
Definisi lain memaparkan bahwa klasifikasi merupakan metode
pembelajaran yang dijadikan acuan untuk mengekstak model untuk
menggambarkan atau memprediksi kelas dimasa depan (Soni, Ansari, Sharma, &
Soni, 2011).

Gambar 2.1 Model Klasifikasi

Terdapat model beberapa model klasifikasi menurut (Gorunescu, 2011)


diantaranya:
a. Decision/classification trees
b. Bayesian classifiers/Naive Bayes classifiers
c. Neural networks
d. Statistical analysis
e. Genetic algorithms
f. Rough sets
g. K-nearest neighbor classifier
h. Rule-based methods
i. Memory based reasoning
j. Support vector machines.

2.4 Naïve Bayes


Algoritma Naive Bayes merupakan algoritma yang terdapat pada klasifikas i
dengan metode probabilitas dan statistic yang dikemukakan oleh ilmuan Inggris
Thomas Bayes, yaitu memprediksi peluang masa depan berdasarkan pengalama n
dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes, teorema tersebut
dikombinasikan dengan Naïve dimana diasumsikan kondisi antar atribut saling
bebas (Bustami, 2013).
19

Naïve Bayes merupakan sebuah pengklasifikasian probabilistik sederhana


yang menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan
kombinasi nilai dari dataset yang diberikan (Dimitoglou, Adams, & Jim, 2012).
Definisi lain mengatakan bahwa Naïve Bayes merupakan sebuah
pengklasifikasian probabilistik sederhana yang menghitung sekumpula n
probabilitas dengan menjumlahkan frekuensi dan kombinasi nilai dari dataset yang
diberikan (Rahmawati, 2016).
Persamaan Teorema Bayes :
𝑃 ( 𝐴 ∩ 𝐵)
𝑃(𝐴|𝐵 ) = (5)
𝑃 ( 𝐵)

Keterangan :
𝐵 : Data dengan kelas yang belum diketahui
𝐴 : Hipotesis data merupakan suatu kelas sfesifik
𝑃(𝐴|𝐵 ) : Probabilitas hipotesis A berdasarkan kondisi B
𝑃(𝐴 ∩ 𝐵) : Probabilitas hipotesis A dengan syarat kondisi B
𝑃(𝐵) : Probabilitas B
Adapun alur dari metode Naïve Bayes sebagai berikut:

Gambar 2.2 Alur Metode atau Flowchart Naïve Bayes


20

Dari gambar diatas, menjelaskan bagaimana cara menghitung dengan


menggunakan Naïve Bayes:
1. Baca data training
2. Hitung jumlah dan probabilitas, tetapi jika data tersebut merupakan data
numerik maka :
a. Jika data training bersifat data numerik atau data kontinu maka harus
mencari nilai rata-rata (mean) dari setiap parameter. Kemudian setelah
mencari nilai mean selanjutnya mencari nilai Standar Deviasi dari
setiap parameter tersebut. Setelah hasil Standar Deviasi didapatkan
maka nilai Standar Deviasi yang paling tinggi yang akan dijadikan
sebagai solusi.
Rumus mencari nilai Mean:
∑𝑛
𝑖=1 𝑥𝑖
𝜇= (6)
𝑛
Dimana:

𝜇 = rata-rata hitung (mean)

𝑥𝑖 = nilai sample ke-i

𝑛 = jumlah sample

Rumus mencari nilai Standar Deviasi:


∑𝑛
𝑖=1 (𝑥 𝑖−𝜇)
2
𝜎=√ (7)
𝑛−1

Dimana:

𝜎 = standar deviasi

𝑥𝑖 = nilai sample ke-i

𝜇 = rata-rata hitung (mean)

𝑛 = jumlah sample

Jika data training bukan data numerik maka dilakukan


perhitungan jumlah dan probabilitas dari setiap parameter yang di-
input-kan. Selanjutnya apabila nilai probabilitas sudah ditentukan
21

maka probabilitas yang paling tinggi yang akan dijadikan sebagai


solusi.
3. Mendapatkan nilai mean, standar deviasi dan probabilitas
4. Solusi kemudian dihasilkan

Untuk klasifikasi dengan data kontinu digunakan rumus Densitas Gaus


sebagai berikut:

(𝑥−𝜇)2
1 −
𝑓(𝑥) = 𝑒 2𝜎2 (8)
√2𝜋 .𝜎

Dimana:

𝑓 = peluang

𝑥 = nilai sample

𝜋 = 3,14

𝑒 = 2,718282

𝜇 = rata-rata hitung (mean)

𝜎 = standar deviasi
Selanjutnya setelah diketahui nilai likelihood semua kelas yaitu
menormalisasi nilai probabilitas setiap kelas dengan cara mengalikan semua
hasil variable. Setelah dilakukan pengaliankemudian dicari nilai tertinggi
sebagai keputusan atau nilai akhir.

Contoh kasus data training nominal penyelesaian dengan menggunaka n


Naïve Bayes :
Tabel 2.3. Kondisi Lapangan (Mahindra, 2016)

No Outlook Temperature Humidity Windy Play


1 Sunny Hot High FALSE No
2 Sunny Hot High TRUE No
3 Cloudy Hot High FALSE Yes
4 Rainy Mild High FALSE Yes
5 Rainy Cool Normal FALSE Yes
6 Rainy Cool Normal TRUE Yes
7 Cloudy Cool Normal TRUE Yes
8 Sunny Mild High FALSE No
9 Sunny Cool Normal FALSE Yes
10 Rainy Mild Normal FALSE Yes
22

No Outlook Temperature Humidity Windy Play


11 Sunny Mild Normal TRUE Yes
12 Cloudy Mild High TRUE Yes
13 Cloudy Hot Normal FALSE Yes
14 Rainy Mild High TRUE No

Apabila kita akan memprediksi apakah hari selanjutnya


diperbolehkan bermain apa tidak dengan menggunakan dataset sebagai
berikut :
Tabel 2.4. Data Testing Prediksi Bermain

Outlook Temperatute Humidity Windy Play


Sunny Mild High FALSE ?

1. Tahap pertama yaitu menghitung jumlah dan probabilitas class/label


Tabel 2.5. Probabilitas Setiap Outlook untuk Setiap Kategori pada Play

Jumlah Kelas Play Probabilitas Kelas Play


No Yes No Yes
4 10 4/14 10/14

2. Tahap kedua menghitung jumlah kasus yang sama dengan kelas yang
sama
Tabel 2.6. Probabilitas Setiap Outlook untuk Setiap Kategori pada Play

Jumlah Kelas Play Probabilitas Kelas Play


Outlook
No Yes No Yes
Sunny 3 2 3/4 2/10
Cloudy 0 4 0/4 4/10
Rainy 1 4 1/4 4/10

Tabel 2.7. Probabilitas Setiap Temperature untuk Setiap Kategori pada


Play

Jumlah Kelas Play Probabilitas Kelas Play


Temperature
No Yes No Yes
Hot 2 2 2/4 2/10
Mild 2 4 2/4 4/10
Cool 0 4 0/4 4/10
23

Tabel 2.8 Probabilitas Setiap Humidity untuk Setiap Kategori pada Play

Jumlah Kelas Play Probabilitas Kelas Play


Humidity
No Yes No Yes
High 4 3 4/4 3/10
Normal 0 7 0/4 7/10

Tabel 2.9. Probabilitas Setiap Windy untuk Setiap Kategori pada Play

Jumlah Kelas Play Probabilitas Kelas Play


Windy
No Yes No Yes
FALSE 2 6 2/4 6/10
TRUE 2 4 2/4 4/10

3. Tahap ketiga kalikan semua variable Yes dan No


a. Probabilitas Yes :
2 4 3 6 10
= 𝑥 𝑥 𝑥 𝑥
10 10 10 10 14
= 0.010286
b. Probabilitas No:
3 2 4 2 4
= 𝑥 𝑥 𝑥 𝑥
4 4 4 4 14
= 0.05357
Setelah sudah diketahui nilai probabilitas Yes dan No, karena nilai
hasil No lebih besar dibandingkan dengan Yes maka keputusannya adalah
No.
Contoh kasus data training nominal dan numerik penyelesaian dengan
menggunakan Naïve Bayes :
Tabel 2.10. Sampel Data (Yudistira, 2014)

Data Usia TB BB LPT LP


JK Status Gizi
ke (thn) (cm) (Kg) (cm) (cm)
1 19 169 51 L 15 63 KTR
2 18 172 50 L 14.5 60 KTB
3 18 161 50 L 12 72 N
4 21 165 57 L 15 71 N
5 24 170 74 L 16 85 OTR
24

Data Usia TB BB LPT LP


JK Status Gizi
ke (thn) (cm) (Kg) (cm) (cm)
6 20 171 126 L 20 113 OTB
7 18 168 47 L 13 59 KTB
8 20 170 75 L 20 79 OTR
9 18 173 76 L 17 80 OTR
10 19 168 51 L 14 68 KTR
11 24 160 59 L 15 71 N
12 19 167 75 L 16 91 OTR
13 25 166 74 L 19 84 OTR
14 22 170 72 L 16 79 N
15 18 167 50 L 14 67 KTR
16 24 169 55 L 14 76 N
17 20 162 56 L 17 75 N
18 26 173 56 L 14 72 N
19 18 163 55 L 16 71 N
20 19 169 80 L 18 84 OTB
21 20 164 53 L 15 71 N
22 21 151 58 P 15.5 79 OTR
23 23 151 51 P 14.5 70 N
24 19 156 64 P 16 77 OTR
25 20 159 49 P 14 65 N
26 22 158 48 P 13 71 N
27 21 155 53 P 13 73 N
28 25 153 51 P 13 72 N
29 20 152 52 P 12 64 N
30 23 150 49 P 14 66.5 N
31 25 159 69 P 15 77 OTB
32 21 155 47.5 P 14 66 N
33 20 148 46 P 14 67 N
34 18 148 48 P 14 65.5 N
25

Data Usia TB BB LPT LP


JK Status Gizi
ke (thn) (cm) (Kg) (cm) (cm)
35 20 151 58 P 15.5 77 OTR
36 22 152 43 P 13 60 N
37 23 161 50 P 15 62.5 N
38 22 153 60 P 17 78 OTR
39 21 162 48 P 13.5 63 KTR
40 24 154 46 P 13 64 N

Keterangan :
KTB = Kurus Tingkat Berat
KTR = Kurus Tingkar Ringan
N = Normal
OTR = Obesitas Tingkat Ringan
OTB = Obesitas Tingkat Berat
LPT = Lingkar Pergelangan Tangan
LP = Lingkar Perut

A. Pengelompokkan Variabel
Data Numerik :
1. Usia (tahun)
2. Tinggi Badan (cm)
3. Berat Badan (kg)
4. Lingkar Pergelangan Tangan (cm)
5. Lingkar Perut (cm)
Data Nominal :
1. Status Gizi
2. Jenis Kelamin
B. Menghitung nilai Mean dan Standar Deviasi
Tabel 2.11. Mean dan Standar Deviasi Variabel Usia pada Setiap Kategori

KTB KTR N OBR OTB


Data ke-
𝑥𝑖 μ ( 𝑥𝑖 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥𝑖 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥𝑖 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2
1 18 18 0 0 19 19.25 -0.25 0.0625 18 21.591 -3.591 12.895 24 20.889 3.111 9.679 20 21.333 -1.333 1.778
2 18 18 0 0 19 19.25 -0.25 0.0625 21 21.591 -0.591 0.349 20 20.889 -0.889 0.790 19 21.333 -2.333 5.444
3 18 19.25 -1.25 1.5625 24 21.591 2.409 5.804 18 20.889 -2.889 8.346 25 21.333 3.667 13.444
4 21 19.25 1.75 3.0625 22 21.591 0.409 0.167 19 20.889 -1.889 3.568
5 24 21.591 2.409 5.804 25 20.889 4.111 16.901
6 20 21.591 -1.591 2.531 21 20.889 0.111 0.012
7 26 21.591 4.409 19.440 19 20.889 -1.889 3.568
8 18 21.591 -3.591 12.895 20 20.889 -0.889 0.790
9 20 21.591 -1.591 2.531 22 20.889 1.111 1.235
10 23 21.591 1.409 1.986
11 20 21.591 -1.591 2.531
12 22 21.591 0.409 0.167
13 21 21.591 -0.591 0.349
14 25 21.591 3.409 11.622
15 20 21.591 -1.591 2.531
16 23 21.591 1.409 1.986
17 21 21.591 -0.591 0.349
18 20 21.591 -1.591 2.531
19 18 21.591 -3.591 12.895
20 22 21.591 0.409 0.167
21 23 21.591 1.409 1.986
22 24 21.591 2.409 5.804
𝑛

(𝑥𝑖 − ) 2 0.000 4.750 107.318 44.889 20.667


𝑖 1

n 2 4 22 9 3
Varian 0.000 1.583 5.110 5.611 10.333
SD 0.000 1.258 2.261 2.369 3.215

26
Tabel 2.12. Mean dan Standar Deviasi Variabel TB pada Setiap Kategori

KTB KTR N OBR OTB


Data ke-
𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2
1 172 170 2 4 169 166.5 2.5 6.25 161 158.3182 2.681818 7.192149 170 161.8889 8.111111 65.79012 171 166.3333 4.666667 21.77778
2 168 170 -2 4 168 166.5 1.5 2.25 165 158.3182 6.681818 44.64669 170 161.8889 8.111111 65.79012 169 166.3333 2.666667 7.111111
3 167 166.5 0.5 0.25 160 158.3182 1.681818 2.828512 173 161.8889 11.11111 123.4568 159 166.3333 -7.33333 53.77778
4 162 166.5 -4.5 20.25 170 158.3182 11.68182 136.4649 167 161.8889 5.111111 26.12346
5 169 158.3182 10.68182 114.1012 166 161.8889 4.111111 16.90123
6 162 158.3182 3.681818 13.55579 151 161.8889 -10.8889 118.5679
7 173 158.3182 14.68182 215.5558 156 161.8889 -5.88889 34.67901
8 163 158.3182 4.681818 21.91942 151 161.8889 -10.8889 118.5679
9 164 158.3182 5.681818 32.28306 153 161.8889 -8.88889 79.01235
10 151 158.3182 -7.31818 53.55579
11 159 158.3182 0.681818 0.464876
12 158 158.3182 -0.31818 0.10124
13 155 158.3182 -3.31818 11.01033
14 153 158.3182 -5.31818 28.28306
15 152 158.3182 -6.31818 39.91942
16 150 158.3182 -8.31818 69.19215
17 155 158.3182 -3.31818 11.01033
18 148 158.3182 -10.3182 106.4649
19 148 158.3182 -10.3182 106.4649
20 152 158.3182 -6.31818 39.91942
21 161 158.3182 2.681818 7.192149
22 154 158.3182 -4.31818 18.64669
𝑛

(𝑥𝑖 − ) 2 8.000 29.000 1080.773 648.889 82.667


𝑖 1

n 2 4 22 9 3
Varian 8.000 9.667 51.465 81.111 41.333
SD 2.828 3.109 7.174 9.006 6.429

27
Tabel 2.13. Mean dan Standar Deviasi Variabel BB pada Setiap Kategori

KTB KTR N OTR OTB


Data ke-
𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2
1 50 48.5 1.5 2.25 51 50 1 1 50 52.11364 -2.11364 4.467459 74 68.22222 5.777778 33.38272 126 91.66667 34.33333 1178.778
2 47 48.5 -1.5 2.25 51 50 1 1 57 52.11364 4.886364 23.87655 75 68.22222 6.777778 45.93827 80 91.66667 -11.6667 136.1111
3 50 50 0 0 59 52.11364 6.886364 47.422 76 68.22222 7.777778 60.49383 69 91.66667 -22.6667 513.7778
4 48 50 -2 4 72 52.11364 19.88636 395.4675 75 68.22222 6.777778 45.93827
5 55 52.11364 2.886364 8.331095 74 68.22222 5.777778 33.38272
6 56 52.11364 3.886364 15.10382 58 68.22222 -10.2222 104.4938
7 56 52.11364 3.886364 15.10382 64 68.22222 -4.22222 17.82716
8 55 52.11364 2.886364 8.331095 58 68.22222 -10.2222 104.4938
9 53 52.11364 0.886364 0.78564 60 68.22222 -8.22222 67.60494
10 51 52.11364 -1.11364 1.240186
11 49 52.11364 -3.11364 9.694731
12 48 52.11364 -4.11364 16.922
13 53 52.11364 0.886364 0.78564
14 51 52.11364 -1.11364 1.240186
15 52 52.11364 -0.11364 0.012913
16 49 52.11364 -3.11364 9.694731
17 47.5 52.11364 -4.61364 21.28564
18 46 52.11364 -6.11364 37.37655
19 48 52.11364 -4.11364 16.922
20 43 52.11364 -9.11364 83.05837
21 50 52.11364 -2.11364 4.467459
22 46 52.11364 -6.11364 37.37655
𝑛

(𝑥𝑖 − ) 2 4.500 6.000 758.966 513.556 1828.667


𝑖 1

n 2 4 22 9 3
Varian 4.500 2.000 36.141 64.194 914.333
SD 2.121 1.414 6.012 8.012 30.238

28
Tabel 2.14. Mean dan Standar Deviasi Variabel LPT pada Setiap Kategori

KTB KTR N OTR OTB


Data ke-
𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2
1 14.5 13.75 0.75 0.5625 15 14.125 0.875 0.765625 12 14.11364 -2.11364 4.467459 16 16.88889 -0.88889 0.790123 20 17.66667 2.333333 5.444444
2 13 13.75 -0.75 0.5625 14 14.125 -0.125 0.015625 15 14.11364 0.886364 0.78564 20 16.88889 3.111111 9.679012 18 17.66667 0.333333 0.111111
3 14 14.125 -0.125 0.015625 16 14.11364 1.886364 3.558368 17 16.88889 0.111111 0.012346 15 17.66667 -2.66667 7.111111
4 13.5 14.125 -0.625 0.390625 15 14.11364 0.886364 0.78564 16 16.88889 -0.88889 0.790123
5 14 14.11364 -0.11364 0.012913 19 16.88889 2.111111 4.45679
6 17 14.11364 2.886364 8.331095 15.5 16.88889 -1.38889 1.929012
7 14 14.11364 -0.11364 0.012913 16 16.88889 -0.88889 0.790123
8 16 14.11364 1.886364 3.558368 15.5 16.88889 -1.38889 1.929012
9 15 14.11364 0.886364 0.78564 17 16.88889 0.111111 0.012346
10 14.5 14.11364 0.386364 0.149277
11 14 14.11364 -0.11364 0.012913
12 13 14.11364 -1.11364 1.240186
13 13 14.11364 -1.11364 1.240186
14 13 14.11364 -1.11364 1.240186
15 12 14.11364 -2.11364 4.467459
16 14 14.11364 -0.11364 0.012913
17 14 14.11364 -0.11364 0.012913
18 14 14.11364 -0.11364 0.012913
19 14 14.11364 -0.11364 0.012913
20 13 14.11364 -1.11364 1.240186
21 15 14.11364 0.886364 0.78564
22 13 14.11364 -1.11364 1.240186
𝑛

(𝑥𝑖 − ) 2 1.125 1.188 33.966 20.389 12.667


𝑖 1

n 2 4 22 9 3
Varian 1.125 0.396 1.617 2.549 6.333
SD 1.061 0.629 1.272 1.596 2.517

29
Tabel 2.15. Mean dan Standar Deviasi Variabel LP pada Setiap Kategori

KTB KTR N OTR OTB


Data ke-
𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2 𝑥𝑖 μ ( 𝑥 -μ) (𝑥 𝑖 − ) 2
1 60 59.5 0.5 0.25 63 65.25 -2.25 5.0625 72 69.29545 2.704545 7.314566 85 81.11111 3.888889 15.12346 113 91.33333 21.66667 469.4444
2 59 59.5 -0.5 0.25 68 65.25 2.75 7.5625 71 69.29545 1.704545 2.905475 79 81.11111 -2.11111 4.45679 84 91.33333 -7.33333 53.77778
3 67 65.25 1.75 3.0625 71 69.29545 1.704545 2.905475 80 81.11111 -1.11111 1.234568 77 91.33333 -14.3333 205.4444
4 63 65.25 -2.25 5.0625 79 69.29545 9.704545 94.1782 91 81.11111 9.888889 97.79012
5 76 69.29545 6.704545 44.95093 84 81.11111 2.888889 8.345679
6 75 69.29545 5.704545 32.54184 79 81.11111 -2.11111 4.45679
7 72 69.29545 2.704545 7.314566 77 81.11111 -4.11111 16.90123
8 71 69.29545 1.704545 2.905475 77 81.11111 -4.11111 16.90123
9 71 69.29545 1.704545 2.905475 78 81.11111 -3.11111 9.679012
10 70 69.29545 0.704545 0.496384
11 65 69.29545 -4.29545 18.45093
12 71 69.29545 1.704545 2.905475
13 73 69.29545 3.704545 13.72366
14 72 69.29545 2.704545 7.314566
15 64 69.29545 -5.29545 28.04184
16 66.5 69.29545 -2.79545 7.814566
17 66 69.29545 -3.29545 10.86002
18 67 69.29545 -2.29545 5.269112
19 65.5 69.29545 -3.79545 14.40548
20 60 69.29545 -9.29545 86.40548
21 62.5 69.29545 -6.79545 46.1782
22 64 69.29545 -5.29545 28.04184
𝑛

(𝑥𝑖 − ) 2 0.500 20.750 467.830 174.889 728.667


𝑖 1

n 2 4 22 9 3
Varian 0.500 6.917 22.278 21.861 364.333
SD 0.707 2.630 4.720 4.676 19.088

30
31

C. Perhitungan Probabilitas pada data Nominal


Probabilitas kemunculan setiap nilai untuk atribut Status Gizi :
Tabel 2.16. Probabilitas Setiap Kategori pada Status Gizi

Jumlah Kategori Status Gizi Probabilitas Status Gizi


KTB KTR N OTR OTB KTB KTR N OTR OTB
Jumlah 2 4 22 9 3 0.05 0.1 0.55 0.225 0.075

Probabilitas kemunculan setiap nilai untuk atribut Jenis Kelamin pada setiap
kategori Status Gizi:
Tabel 2.17. Probabilitas Setiap JK untuk Setiap Kategori pada Status Gizi

Jumlah Kategori Status Gizi Probabilitas Status Gizi


JK
KTB KTR N OTR OTB KTB KTR N OTR OTB
L 2 3 9 5 2 2/2 3/4 9/22 5/9 2/3
P 0 1 13 4 1 0/2 1/4 13/22 4/9 1/3
Jumlah 2 4 22 9 3 1 1 1 1 1

Selanjutnya untuk mengklasifikasi penentu status gizi orang dewasa,


sebagai contoh jika diketahui jenis kelamin laki-laki, tinggi badan 170 cm, berat
badan 82 cm, usia 22 tahun, lingkar pergelangan tangan 17 dan lingkar perut 100,
maka status gizinya ?

D. Perhitungan prediksi dengan Naïve Bayes dengan Fungsi Densitas Gaus


Setelah dilakukan perhitungan nilai mean dan standar deviasi dari setiap
variable yang termasuk kedalam data kontinu maka selanjutnya akan dihitung
menggunakan metode Naïve Bayes dengan menerapkan rumus Densitas Gaus :
1. Usia
a. Usia = 22 | Status Gizi = KTB
1 (22−18) 2

= 2.718282 2 𝑥 02
√2 𝑥 3.14 𝑥 0
1
= 𝑥 2.718282 −0
7.087
1
= 𝑥0
0
=0
b. Usia = 22 | Status Gizi = KTR
1 (22−19.25) 2

= 2.718282 2 𝑥 1.2582
√2 𝑥 3.14 𝑥 1.258
1
= 𝑥 2.718282 −2.389
3.152548
32

1
= 𝑥 0.0917
3.152548
= 2.9 𝑥 10−2
c. Usia = 22 | Status Gizi = N
1 (22−21.591) 2

= 2.718282 2 𝑥 2.2612
√2 𝑥 3.14 𝑥 2.261
= 1.7 𝑥 10−1
d. Usia = 22 | Status Gizi = OTR
1 (22−20.889) 2

= 2.718282 2 𝑥 2.3692
√2 𝑥 3.14 𝑥 2.369
= 1.5 𝑥 10 −1
e. Usia = 22 | Status Gizi = OTB
1 (22−21.333) 2

= 2.718282 2 𝑥 3.2152
√2 𝑥 3.14 𝑥 3.215
= 1.2 𝑥 10−1

2. Tinggi Badan
a. Tinggi Badan = 170 | Status Gizi = KTB
1 (170−170) 2

= 2.718282 2 𝑥 2.8282
√2 𝑥 3.14 𝑥 2.828
1
= 𝑥 2.718282 −0
2.506 𝑥 2.828
1
= 𝑥1
7.087
= 0.141
b. Tinggi Badan = 170 | Status Gizi = KTR
1 (170−166.5) 2

= 2.718282 2 𝑥 3.1092
√2 𝑥 3.14 𝑥 3.109
1
= 2.718282−0,634
2.506 𝑥 3.109
1
= 𝑥 0.530
7.791
= 0.068
c. Tinggi Badan = 170 | Status Gizi = N
1 (170−158.318) 2

= 2.718282 2 𝑥 7.1742
√2 𝑥 3.14 𝑥 7.174
= 0.015
33

d. Tinggi Badan = 170 | Status Gizi = OTR


1 (170−161.889) 2

= 2.718282 2 𝑥 9.0062
√2 𝑥 3.14 𝑥 9.006
= 0.030
e. Tinggi Badan = 170 | Status Gizi = OTB
1 (170−166.333) 2

= 2.718282 2 𝑥 6.4292
√2 𝑥 3.14 𝑥 6.429
= 0.053
3. Berat Badan
a. Berat Badan = 82 | Status Gizi = KTB
1 (82−48.5) 2

= 2.718282 2 𝑥 2.1212
√2 𝑥 3.14 𝑥 2.121
1
= 2.718282 −124.732
2.506 𝑥 2.121
1
= 𝑥 6.727289 𝑒 − 55
5.315
= 1.3 𝑥 10−55
b. Berat Badan = 82 | Status Gizi = KTR
1 (82−50) 2

= 2.718282 2 𝑥 1.4142
√2 𝑥 3.14 𝑥 1.414
1
= 2.718282−256.077
2.506 𝑥 1.414
1
= 𝑥 6.12583 𝑒 − 112
3.543
= 1.7 𝑥 10−112
c. Berat Badan = 82 | Status Gizi = N
1 (82−52.113) 2

= 2.718282 2 𝑥 6.0122
√2 𝑥 3.14 𝑥 6.012
= 2.8 𝑥 10−7
d. Berat Badan = 82 | Status Gizi = OTR
1 (82−68.222) 2

= 2.718282 2 𝑥 8.0122
√2 𝑥 3.14 𝑥 8.012
= 1.1 𝑥 10−2
e. Berat Badan = 82 | Status Gizi = OTB
1 (82−91.667) 2

= 2.718282 2 𝑥 30.2382
√2 𝑥 3.14 𝑥 30.238
= 1.2 𝑥 10−2
34

4. Lingkar Pergelangan Tangan


a. Lingkar Pergelangan Tangan = 17 | Status Gizi = KTB
1 (17 −13.75) 2

= 2.718282 2 𝑥 1.0612
√2 𝑥 3.14 𝑥 1.061
1
= 2.718282 −4.6914
2.506 𝑥 1.061
1
= 𝑥 0.0092
2.659
= 3.4 𝑥 10−3
b. Lingkar Pergelangan Tangan = 17 | Status Gizi = KTR
1 (17 −14.125) 2

= 2.718282 2 𝑥 0.6292
√2 𝑥 3.14 𝑥 0.629
1
= 2.718282 −10.446
2.506 𝑥 0.629
1
= 𝑥 (2.9 𝑥 10−5 )
1.576274
= 1.8 𝑥 10−5
c. Lingkar Pergelangan Tangan = 17 | Status Gizi = N
1 (17 −14.114) 2

= 2.718282 2 𝑥 1.2722
√2 𝑥 3.14 𝑥 1.272
= 2.4 𝑥 10−2
d. Lingkar Pergelangan Tangan = 17 | Status Gizi = OTR
1 (17 −16.889) 2

= 2.718282 2 𝑥 1.5962
√2 𝑥 3.14 𝑥 1.596
= 2.5 𝑥 10−1
e. Lingkar Pergelangan Tangan = 17 | Status Gizi = OTB
1 (17 −17.667) 2

= 2.718282 2 𝑥 2.5172
√2 𝑥 3.14 𝑥 2.517
= 1.5 𝑥 10−1
5. Lingkar Perut
a. Lingkar Perut = 100 | Status Gizi = KTB
1 (100−59.5) 2

= 2.718282 2 𝑥 0.7072
√2 𝑥 3.14 𝑥 0.707
1
= 2.718282 −1640.25
2.506 𝑥 0.707
1
= 𝑥0
1.772
35

=0
b. Lingkar Perut = 100 | Status Gizi = KTR
1 (100−65.25) 2

= 2.718282 2 𝑥 2.6302
√2 𝑥 3.14 𝑥 2.630
1
= 2.718282−87.291
2.506 𝑥 2.630
1
= 𝑥 1.23026 𝑒 − 38
6.590
= 1.9 𝑥 10−39
c. Lingkar Perut = 100 | Status Gizi = N
1 (100−69.295) 2

= 2.718282 2 𝑥 4.7202
√2 𝑥 3.14 𝑥 4.720
= 5.5 𝑥 10−11
d. Lingkar Perut = 100 | Status Gizi = OTR
1 (100−81.11) 2

= 2.718282 2 𝑥 4.6762
√2 𝑥 3.14 𝑥 4.676
= 2.4 𝑥 10−5
e. Lingkar Perut = 100 | Status Gizi = OTB
1 (100−91.333) 2

= 2.718282 2 𝑥 19.0882
√2 𝑥 3.14 𝑥 19.088
= 1.9 𝑥 10−2
E. Mengitung Nilai Likelihood
Selanjutnya yaitu melakukan perhitungan rumus likelihood dengan
berdasarkan metode Naïve Bayes:
Likelihood KTB = 0 ∗ 0.141 ∗ 1.3 𝑥 10−55 ∗ 3.4 𝑥 10−3 ∗ 0 ∗ 0.05
∗1

=0
Likelihood KTR = 0.1 ∗ 0.75 ∗ 2.9 𝑥 10−2 ∗ 0.068 ∗ 1.7 𝑥 10−112
∗ 1.8 𝑥 10−5 ∗ 1.9 𝑥 10−39

= 8.6 𝑥 10−160
Likelihood N = 0.55 ∗ 0.409 ∗ 1.7 𝑥 10−1 ∗ 0.015 ∗ 2.8 𝑥 10−7
∗ 2.4 𝑥 10−2 ∗ 5.5 𝑥 10−11

= 2.1 𝑥 10−22
Likelihood OTR = 0.556 ∗ 0.225 ∗ 1.5 𝑥 10−1 ∗ 0.030 ∗ 1.1 𝑥 10−2
∗ 2.4 𝑥 10−5 ∗ 2.5 𝑥 10−1
36

= 3.7 𝑥 10−11
Likelihood OTB = 0.075 ∗ 0.667 ∗ 1.3 𝑥 10−1 ∗ 0.053 ∗ 1.2 𝑥10−2
∗ 1.5 𝑥 10−1 ∗ 1.9 𝑥 10−2

= 1.2 𝑥 10−8

F. Normalisasi Nilai Probabilitas


Selanjunya yaitu mencari nilai probabilitas dapat dihitung dengan melakukan
normalisasi pada setiap kelas KTB, KTR, N,OTR dan OTB.
Probabilitas KTB 0
=
(0 + (8.6 𝑥 10−160 ) + (2.1 𝑥 10−22 ) + 3.7 𝑥 10−11
+ (1.2 𝑥 10−8 )
=0
Probabilitas KTR 8.6 𝑥 10−160
=
(0 + (8.6 𝑥 10−160 ) + (2.1 𝑥 10−22 ) + 3.7 𝑥 10−11
+ (1.2 𝑥 10−8 )
= 7.14 𝑥 10−152
Probabilitas N 2.1 𝑥 10−22
=
(0 + (8.6 𝑥 10−160 ) + (2.1 𝑥 10−22 ) + 3.7 𝑥 10−11
+ (1.2 𝑥 10−8 )
= 1.7 𝑥 10−14
Probabilitas OTR 3.7 𝑥 10−11
=
(0 + (8.6 𝑥 10−160 ) + (2.1 𝑥 10−22 ) + 3.7 𝑥 10−11
+ (1.2 𝑥 10−8 )
= 3.07 𝑥 10−3
Probabilitas OTB 1.2 𝑥 10−8
=
(0 + (8.6 𝑥 10−160 ) + (2.1 𝑥 10−22 ) + 3.7 𝑥 10−11
+ (1.2 𝑥 10−8 )
=1

Untuk mengetahui apakah orang tersebut termasuk dalam kategori KTB,


KTR, N, OTR atau OTB dengan cara melihat hasil nilai akhir probabilitas
tertinggi. Dari hasil perhitungan normalisasi nilai probabilitas KTB = 0, KTR
= 7.14 𝑥 10−152 , N = 1.7 𝑥 10−14 , OTR = 3.07 𝑥 10−3 dan OTB = 1 , maka
orang dewas tersebut memiliki status gizi Obesitas Tingkat Berat (OTB).
37

2.5 Diskritisasi
Diskritisasi merupakan perubahan data kontinu menjadi data kategori
(Gorunescu, 2011). Pendiskritan atribut merupakan teknik untuk mengubah sebuah
fungsi atau nilai kontinu kedalam bentuk diskrit (Wirawan & Eksistyanto, 2015).
Diskritisasi atribut kontinyu merupakan salah satu langkah pengolahan data penting
dari ekstraksi pengetahuan (Mirqotussa’adah, Muslim, Sugiharti, Prasetiyo, &
Alimah, 2017).
Menurut (Rahmawati, 2016) terdapat dua cara untuk melakukan diskritisas i
atribut yaitu :
1. Scanning
Penelusuran (scanning) seluruh dataset untuk semua nilai kontinu yang
muncul, kemudian menggunakan nilai tersebut sebagai dominan dari atribut
nominal. Teknik ini membuat domain nilai menjadi himpunan tertutup dari nilai
yang mungkin muncul, sehingga dataset menjadi ‘sparse’.
2. Binning
Mendefinisikan kumpulan kelas nominal untuk setiap atribut, kemudian
menetapkan setiap nilai atribut ke dalam salah satu kelas. Misalnya, jika domain
atribut numerik mempunyai nilai dari 0 sampai dengan 100, domain tersebut
dapat dibagi menjadi empat bin (0…24, 25…49, 50,,,74, 75…100).

2.6 Evaluasi dan Validasi


2.6.1 Cross Validation
Evaluasi dilakukan setelah pembuatan model. Evaluasi merupakan langkah
untuk menguji presentase keakuratan model yang telah dibuat. Salah satu metode
yang paling populer adalah cross validation. Metode ini membagi data menjadi 2
bagian, yaitu data pelatihan dan data pengujian. Selanjutnya, setelah data diuji
dilakukan proses silang dimana data pengujian lantas dijadikan data pelatihan
ataupun sebaliknya, data pelatihan sebelumnya dijadikan kini menjadi data
pengujian. Metode tersebut juga lebih dikenal dengan k-fold cross validation.
Berikut adalah visualisasi dari sebanyak 10 fold (Poetra, 2016):
38

Gambar 2.2. Visualisasi dari k-fold cross validation sebanyak 10 fold

Menurut (Rahmi, 2016) pada dasarnya terdapat dua tujuan menggunaka n


cross validation yaitu sebagai berikut:
1. Untuk mengukur kinerja model hasil learning. Kendala pada model
yang dapat ditemukan dengan cross validation diantaranya:
a. Overfitting, kondisi dimana akurasi untuk data training baik namun
untuk data testing akurasi buruk. Penyebabnya dapat diakibatkan
karena model terlalu kompleks, terlalu banyak atribut atau variable,
data outlier.
b. Underfitting, kondisi dimana akurasi untuk data training buruk
namun data testing memberi akurasi yang baik. Penyebabnya karena
banyak data training yang tidak terpetakan dengan baik atau terlalu
sedikitnya atribut atau variable
2. Untuk membandingkan kinerja model hasil learning dari dua atau lebih
algoritma dan menemukan algoritma terbaik berdasarkan data yang
tersedia.

2.6.2 Confusion Matrix


Confusion matrix merupakan tabel yang terdiri atas banyaknya baris data
yang diuji yang diprediksi benar dan tidak benar oleh model klasifikasi (Poetra,
2016).
Menurut (Rahmawati, 2016) model dari confusion matrix sebagai berikut:
Tabel 2.18. Confusion Matrix

Classified Positive Classified Negative

Actual Positive TP FN

Actual Negative FP TN
39

Menurut (Goyal & Mehta, 2012) confusion matrix merupakan infor mas i
tentang klasifikasi actual dan hasil klasifikasi prediksi yang dilakukan oleh sistem.
Akurasi, presentasi jumlah benar dari seluruh data. Untuk menghitung
akurasi adalah sebagai berikut:
𝑇𝑃+𝑇𝑁
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = (5)
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁

2.7 WEKA

Gambar 2.3. Aplikasi WEKA 3.8.1

Waikato Environment for Knowledge Analysis (WEKA) merupakan tool


mesin pembelajaran yang diperkenalkan oleh Universitas Waikato, New Zaeland
yang bersifat open source yang dibuat menggunak dengan Java (GNU Public
License) dan bisa digunakan untuk penelitian, pendidikan dan proyek. Weka ini
bisa dijalankan di Windows, Linux dan Mac yang terdiri dari beberapa kumpula n
algoritma pembelajaran (T. C. Sharma & Jain, 2013).
WEKA diimplemtasikan pertama kali pata tahun 1997 dan mulai menjadi
open source pada tahun 1999 (Mardiana & Nyoto, 2015). Menurut (N. Sharma,
Bajpai, & Litoriya, 2012) WEKA merupakan tools data mining yang paling
sederhana untuk pengklasifikasian berbagai jenis data dan merupakan model
pertama yang menyediakan graphical user interface.
40

Weka telah membuktikan bahwa aplikasi tersebut merupakan alat yang


berguna bahkan penting dalam menganalisis suatu dataset (Garner, 1995).
Perangkat lunak ini memiliki fasilitas untuk melakukan preprocessing data,
classification, regression, clustering, association rules, dan visualization.
(Kristiawan, 2016).
Menurut (Kristiawan, 2016) WEKA memiliki 4 jenis test option yang dapat
digunakan untuk melakukan proses klasifikasi. Proses yang ditangani adalah
proses pelatihan dan pengujian. Keempat jenis test option tersebut yaitu :
a. Use training set
Klasifikasi ini menggunakan satu data untuk melakukan pelatihan.
Lalu dari seluruh data yang telah dilatih sebelumnya juga digunakan
untuk proses pengujian.
b. Supplied test set
Klasifikasi ini dilakukan evaluasi dengan cara memprediks i
seberapa baik satu dataset yang diambil dari sebuah data tertentu yang
memang sudah disediakan untuk pengujian. Proses pelatihan akan
dilakukan terlebih dahulu dengan data latih kemudian proses pengujia n
akan dilakukan dengan data uji yang berbeda dengan data yang dilatih
pada klasifikasi.
c. Cross-validation
Klasifikasi ini dilakukan evaluasi dengan cross validation dan
menggunakan jumlah fold yang tertentu yang dapat diinputkan manual.
Pada cross validation akan ada pilihan beberapa fold yang akan
digunakan. Nilai fold default aplikasi yang diberikan adalah 10. Proses
pengujian akan dilakukan sebanyak nilai fold yang diberikan serta akan
dibentuk subset sebanyak nilai fold. Kemudian proses pengujian akan
dilakukan menggunakan sebuah subset yang terbentuk dan sisanya akan
digunakan untuk proses pelatihanya.
d. Percentage split
Klasifikasi ini dilakukan evaluasi dengan melakukan pembagian data
antara data uji dan data latih pada satu dataset dengan menggunaka n
prosentase. Persentase yang diinputkan akan digunakan untuk proses
41

pelatihan dan sisanya akan digunakan untuk proses pengujian. Proses


ini biasanya dilakukan untuk dengan perbandingan 2/3 data untuk
pelatihan dan 1/3 data untuk proses pengujian atau nilai k = 66%.
BAB III
METODOLOGI PENELITIAN

Untuk menunjang kegiatan penelitian, di dalam bab ini penulis akan menjelaska n
desain penelitian, serta alat dan bahan penelitian.

3.1 Desain Penelitian


Desain penelitian merupakan tahapan atau langkah- langkah yang dilakukan
di dalam penelitian pada proses pembuatan sistem klasifikasi status gizi balita.
Langkah-langkah yang dilakukan di dalam penelitian ini disajikan pada Gambar
3.1:

Gambar 3.1. Desain penelitian

42
43

Pada penelitian ini terdapat desain penelitian atau beberapa tahapan yang penulis
lakukan dalam menyelesaikan penelitiannya:
1. Mengidentifikasi masalah
Tindakan yang dilakukan untuk mencari inti permasalahan yang ada.
2. Rumusan solusi
Mencari beberapa penelitian sebelumnya untuk dijadikan sebagai acuan
dalam menyelesaikan permasalah yang sudah diidentifikasi.
3. Penetapan tujuan
Menetapkan tujuan yang ingin dicapai dalam penelitian.
4. Analisa Kebutuhan
Di dalam penelitian dalam proses pengumpulan datanya dengan:
1. Studi literatur
Mencari referensi teori-teori yang dibutuhkan sesuai dengan
permasalahan yang ditemukan. Referensi-referensi yang dibutuhka n
berisikan tentang:
a. Data Mining
b. Klasifikasi
c. Algoritma Naïve Bayes
d. Metode Antropometri
e. Status Gizi Balita
Referensi tersebut bisa didapatkan dari beberapa artikel, jurnal,
laporan penelitian dan buku.
2. Observasi data
Melakukan pengamatan dan permintaan data posyandu yang
dibutuhkan ke Puskesmas Sariwangi Kabupaten Tasikmalaya.
5. Data Penelitian
Proses seleksi data merupakan proses pemilihan data yang akan dipakai dan
dibutuhkan di dalam penelitian. Data yang digunakan di dalam penelitian ini
diambil secara acak.
6. Pengembangan Perangkat Lunak
1. Mengimplementasikan metode perangkat lunak Waterfall
44

Pada penelitian ini proses pengembangan perangkat lunaknnya


dengan menggunakan metode waterfall:
1. Analysis
Pada tahap ini melakukan pengumpulan data dan pengump ula n
kebutuhan perangkat lunak yang dibutuhkan untuk mendapatkan solusi
akhir, dimana di tahap ini terdapat tujuan, hasil produk akhir yang
diharapkan dan mendapatkan gambaran aplikasi yang tepat.
2. Design
Pada tahap desain ini mengubah kebutuhan-kebutuhan yang ada di
tahap analisis ke dalam bentuk blueprint, sehingga dapat memberika n
gambaran apa yang harus dikerjakan sebelum mengimplemetasikan ke
dalam kode program.
3. Coding
a. Mengimplementasikan tahapan analisis dan desain yang
sebelumnya sudah ditentukan dan dirancang yang akan diubah
bentuknya menjadi sebuah program yang akan dimengerti oleh
mesin.
b. Mengimplementasikan Model Naïve Bayes
a. Data Penelitian
Hasil dari proses seleksi data akan menghasilkan data training
dan data testing. Data training digunakan untuk proses algoritma
klasifikasi Naïve Bayes yang akan menghasilkan model klasifikas i
sedangkan data testing digunakan untuk mengukur atau menguji
model klasifikasi yang dihasilkan.
Proses seleksi data dilakukan secara manual di Microsoft Excel,
dengan melakukan pemilihan variable yang dibutuhkan di proses
klasifikasi dan membersihkan data yang tidak muncul status gizinya
yang diakibatkan beberapa hal.
Pada penelitian ini menerapkan use training set dan 5-fold cross
validation untuk mengukur kualitas ari implementasi metode Naïve
Bayes.
45

b. Penerapan Algoritma Naïve Bayes


Pada penelitian ini menerapkan Algoritma Naïve Bayes. Dalam
algoritma Naïve Bayes membutuhkan data training sebagai inputan
untuk melakukan proses algoritma Naïve Bayes, dimana data
training tersebut harus melewati tahap proses seleksi data terlebih
dahulu. Atribut yang dipakai dalam penelitian ini yaitu jenis
kelamin, umur, berat badan, tinggi badan, status gizi BB/U, status
gizi TB/U dan status gizi BB/TB sesuai dengan data yang didapatkan
sebelumnya.
c. Model Klasifikasi
Model klasifikasi ini merupakan model yang dihasilkan dari
algoritma Naïve Bayes sesuai dengan input dari data training.
Kemudian model klasifikasi ini akan diuji dengan data testing.
d. Hasil atau Prediksi
Prediksi ini merupakan nilai akhir atau keputusan data kelas
status gizi yang dihasilkan dari proses klasifikasi algoritma Naïve
Bayes.
e. Evaluasi dan Validasi
Pada penelitian ini menerapkan hasil tingkat akurasi klasifika s i
yang diterapkan oleh use training set dan 5-fold cross validation,
dimana hasil status gizi Naïve Bayes akan dibandingkan dengan data
asli status gizi balita tersebut. Penulis memilih cross validation
sebanyak 5-fold agar perbandingan antara data training dan data
testing yaitu sebesar 80:20. Data training lebih besar dibandingka n
dengan data testing agar banyak data latih sehingga menghasilka n
probabilitas yang dihasilkan beragam tidak ada yang kosong dan
menghasilkan model klasifikasi yang baik.
Selain itu model yang akan di ambil di dalam penelitian ini yaitu
model yang akurasinya paling tinggi dari metode 5-fold cross
validation. Model tersebut akan diuji oleh data sample yang baru.
4. Testing
46

Selanjutnya dilakukan proses testing dengan melakukan uji coba


terhadap semua fungsi-fungsi yang telah dibuat di dalam perangkat lunak.
Sehingga dapat diketahui apakah fungsi- fungsi yang telah dibuat sesuai
dengan kebutuhan atau fungsi tersebut masih terdapat kesalahan-kesala ha n.
7. Pembuatan Laporan
Melakukan pembuatan laporan sistem yang telah dibuat untuk laporan akhir
penelitian sesuai dengan pedoman penulisan karya ilmiah Univers itas
Pendidikan Indonesia.

3.2 Alat dan Bahan Penelitian


Mempersiapkan alat perangkat lunak, perangkat keras dan bahan yang
diperlukan dalam penelitian ini. Di dalam penelitian ini menggunakan beberapa alat
dan bahan:
3.2.1 Alat Penelitian
Di dalam penelitian ini terdapat beberapa alat atau komponen-kompone n
yang dibutuhkan, diantaranya:
1. Windows 8.1 64 bit
2. XAMPP Control Panel
3. Database server : MySQL
4. PHP
5. Script editor : Sublime Text 3
6. Web browser : Mozilla Firefox
3.2.2 Bahan Penelitian
Bahan yang digunakan dalam penelitian ini yaitu menggunakan data
hasil posyandu di UPTD Puskemas Sariwangi Kecamatan Sariwangi
Kabupaten Tasikmalaya pada tahun 2016.
DAFTAR PUSTAKA

Adebayo, I. P., Olutola, A., & Aladekomo, T. A. (2016). The Prediction of


Paediatric HIV / AIDS Patient Survival : A Data Mining Approach. Asian
Journal of Computer and Information Systems, 04(03), 87–94.

Alabi, A., Ijadunola, M. Y., Alabi, O., Onayade, A., & Aluko, O. (2016).
Assessment of Childhood Nutritional Status: Findings from a Health and
Demographic Surveillance System. International Journal of Clinical
Nutrition, 4(1), 7–11.

Amri, M. K. (2013). Penerapan Data Mining Untuk Menentukan Kriteria Calon


Nasabah Potensial. Univeritas Bina Darma.

Ayma, V. A., Ayma, V. H., & Torre, L. G. A. (2016). Nutritional Assessment of


Children Under Five Based on Anthropometric Measurements with Image
Processing Techniques. In ANDESCON, 2016 IEEE (pp. 19–21).

Borkar, M. A. R., & Deshmukh, P. R. (2015). Naïve Bayes Classifier for Prediction
of Swine Flu Disease. International Journal of Advance Research in Computer
Science and Software Engineering, 5(4), 120–123.

Bustami, B. (2013). Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data


Nasabah Asuransi. TECHSI-Jurnal Teknik Informatika, 3(2).

Darmawan, A. (2012). Pembuatan Aplikasi Data Mining Untuk Memprediksi Masa


Studi Mahasiswa Menggunakan Algoritma K-Nearest Neighborhood.
Universitas Komputer Indonesia.

Departemen Kesehatan. (2011). Standar Antropometri Penilaian Status Gizi Anak.


Kementerian Kesehatan RI.

Dimitoglou, G., Adams, J. A., & Jim, C. M. (2012). Comparison of the C4. 5 and
A Naive Bayes Classifier for the Prediction of Lung Cancer Survivability.
Journal of Computing, 4(8), 1–9.

47
48

Direktorat Bina Gizi. (2011). Modul B Pelatihan Penilaian Pertumbuhan Anak.


Kementerian Kesehatan RI.

Febrealti, E. R. (2011). Sistem Penentuan Status Gizi Balita Menggunakan Metode


K-NN (K-Nearest Neighbor). Universitas Islam Negeri Sultan Syarif Kasim
Riau.

Fitri, F., Setyawati, O., & Rahadi S, D. (2014). Aplikasi Jaringan Syaraf Tiruan
Untuk Penentuan Status Gizi Balita Dan Rekomendasi Menu Makanan Yang
Dibutuhkan. Jurnal EECCIS, 7(2), 119–124.

Garner, S. R. (1995). Weka: The Waikato Environment For Knowledge Analys is.
In Proceedings of the New Zealand computer science research students
conference (pp. 57–64).

Gayathri, B. M., & Sumathi, C. P. (2016). An Automated Technique using Gaussian


Naive Bayes Classifier to Classify Breast Cancer. International Journal of
Computer Applications, 148(6), 16–21.

Gorunescu, F. (2011). Data Mining: Concepts, Models and Techniques (Vol. 12).
Berlin: Springer Science & Business Media.

Goyal, A., & Mehta, R. (2012). Performance Comparison of Naïve Bayes and J48
Classification Algorithms. International Jurnal of Applied Engineering
Research, 7(11).

Irsyadi, A., & Fatah, Y. (2015). Klasifikasi Status Gizi Balita Jenis Kelamin Laki-
laki Menggunakan Jaringan Syaraf Tiruan. Khazanah Informatika: Jurnal
Ilmu Komputer Dan Informatika, 1(1), 16–22.

Karlik, B. (2011). Hepatitis Disease Diagnosis Using Backpropagation and The


Naive Bayes Classifiers. Journal of Science and Technology, 1(1), 49–62.

Kementerian Kesehatan RI. (2016). Tahun 2015, Pemantauan Status Gizi


Dilakukan di Seluruh kabupaten/Kota di Indonesia. Retrieved from
http://www.depkes.go.id/article/view/16032200005/tahun-2015-pemantauan-
status-gizi-dilakukan-di-seluruh-kabupaten-kota-di- indonesia.html
49

Kementrian Kesehatan RI. (2011). Standar Antropometri Penilaian Status Gizi


Anak. Jakarta: Departemen Kesehatan.

Kristiawan, F. A. (2016). Preprocessing Dengan Iterative Partitioning Filter


Algorithm Untuk Klasifikasi. Universitas Atma Jaya Yogyakarta.

Kusumadewi, S. (2009). Klasifikasi Status Gizi Menggunakan Naive Bayesian


Classification. CommIT (Communication and Information Technology)
Journal, 3(1), 6–11.

Mahindra, P. S. (2016). Penerapan Data Mining untuk Rekomendasi Beasiswa


pada SMA N 1 MALONGGO Menggunakan Algoritma C4. 5. Universitas Dian
Nuswantoro.

Mardiana, T., & Nyoto, R. D. (2015). Kluster Bag of Word Menggunakan Weka.
Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 1(1), 1–5.

Medhekar, D. S., Bote, M. P., & Deshmukh, S. D. (2013). Heart Disease Prediction
System Using Naive Bayes. International Journal Of Enhanced Research In
Science Technology And Engineering, 2(3), 1–5.

Miranti, R. F. (2016). Pengaruh Penggunaan Sistem Informasi Akuntansi Terhadap


Kualitas Informasi Pelaporan Realisasi Anggaran Pendapatan. Univers itas
Widyatama.

Mirqotussa’adah, Muslim, M. A., Sugiharti, E., Prasetiyo, B., & Alimah, S. (2017).
Penerapan Dizcretization dan Teknik Bagging Untuk Meningkatkan Akurasi
Klasifikasi Berbasis Ensemble pada Algoritma C4. 5 dalam Mendiagnosa
Diabetes. Lontar Komputer: Jurnal Ilmiah Teknologi Informasi, 08(02), 135–
143.

Monica, E., Sudrajat, D., & Suarna, N. (2016). Sistem Pendukung Keputusan
Penentuan Status Kesehatan Bayi Baru Lahir Berdasarkan Pemeriksaan
Antropometri Dengan Metode Weighted Product. Jurnal Online ICT STMIK
IKMI ICT, 14(2), 61–73.

Poetra, D. A. (2016). Sistem Prediksi Spam Account pada Media Sosial Twitter
50

dengan menggunakan Algoritma C4. 5. Universitas Pendidikan Indonesia.

Pramitarini, Y., Ketut E P, I., & Hery Purnomo, M. (2013). Analisa Rekam Medis
Untuk Menentukan Status Gizi Anak Balita Menggunakan Naive Bayes
Classifier. In Prosiding Seminar Nasional Manajemen Teknologi XVII (Vol.
2).

Putri, R. F., Sulastri, D., & Lestari, Y. (2015). Faktor-Faktor yang Berhubunga n
dengan Status Gizi Anak Balita di Wilayah Kerja Puskesmas Nanggalo
Padang. Jurnal Kesehatan Andalas, 4(1).

Rahmadini, N., Sudiarti, T., & Utari, D. M. (2013). Status Gizi Balita berdasarkan
Composite Index of Anthropometric Failure. Kesmas: National Public Health
Journal, 7(12), 538–544.

Rahmawati, A. (2016). Implementasi Metode Naive Bayes dalam Analisis


Kelayakan Pemberian Kredit. Universitas Pendidikan Indonesia.

Rahmi, F. (2016). Aplikasi SMS SPAM Filtering Pada Android Menggunakan


Algoritma Naive Bayes. Universitas Pendidikan Indonesia.

Rasepta, K. M. (2016). Klasifikasi Status Gizi Balita Menggunakan Metode


Modified K-Nearest Neighbor. Universitas Islam Negeri Sultan Syarif Kasim
Riau.

Santoso, S., & Ranti, A. L. (2004). Kesehatan dan gizi. Jakarta: Rineka Cipta.

Setiawan, I. (2009). Pemesanan dan Penjualan Online Komputer di Toko


Primatech. Universitas Komputer Indonesia.

Sharma, N., Bajpai, A., & Litoriya, R. (2012). Comparison The Various Clustering
Algorithms Of WEKA Tools Comparison. International Journal of Emerging
Technology and Advanced Engineering, 2(5), 73–80.

Sharma, T. C., & Jain, M. (2013). WEKA Approach For Comparative Study Of
Classification Algorithm. International Journal of Advanced Research in
Computer and Communication Engineering, 2(4), 1925–1931.
51

Soni, J., Ansari, U., Sharma, D., & Soni, S. (2011). Predictive Data Mining for
Medical Diagnosis : An Overview of Heart Disease Prediction. International
Journal of Computer Applications, 17(8), 43–48.

Supariasa, I. D. N., Bakri, B., & Fajar, I. (2002). Penilaian status gizi. EGC. Jakarta.

Tantra D, Y. (2014). Penentu Klasifikasi Status Gizi Orang Dewasa Dengan


Algoritma Naive Bayes Classification. UDINUS Repository. Universitas Dian
Nuswantoro.

Ting, S. L., Ip, W. H., & Tsang, A. H. C. (2011). Is Naive Bayes A Good Classifier
For Document Classification. International Journal of Software Engineering
and Its Applications, 5(3), 37–46.

WHS. (2007). Part 1 Ten Statistical Highlights in Global Public Health (pp. 9–20).

Wirawan, I. N. T., & Eksistyanto, I. (2015). Penerapan Naive Bayes Pada Intrusion
Detection System Dengan Diskritisasi Variabel. Jurnal Ilmiah Teknologi
Informasi, 13(2), 182–189.

Anda mungkin juga menyukai